データサイエンス
相関
読み方:そうかん
相関とは
相関(Correlation)は、2つのデータ項目が互いに関連して変動する関係性のことです。一方が増えると他方も増える正の相関(気温とアイスの売上)、一方が増えると他方が減る負の相関(気温と温かい飲み物の売上)があります。相関の強さは相関係数(-1〜1)で数値化します。
因果関係との違い
「相関がある」ことと「一方がもう一方の原因である(因果関係)」ことは全く別です。たまたま似た動きをしているだけの場合(疑似相関)もあるため、データ分析では注意が必要です。機械学習 では 特徴量 間の相関を確認し、強すぎる相関を持つ変数の一方を除外する(多重共線性の回避)といった前処理が行われます。
データ駆動経営における真のROI抽出
企業内に蓄積された膨大な顧客データから「どのマーケティング施策が最も売上に直結(相関)しているか」をAIで高速に洗い出すことで、勘や経験に頼らないデータ駆動型の経営が可能になります。しかし、相関関係(単に連動しているだけ)と因果関係(真の原因である)を混同し「実は意味のないキャンペーンに予算を投下し続ける」リスクも潜んでいます。AIシステムを活用して「見せかけの相関(疑似相関)」を自動で除外し、真に売上を牽引するKPI(因果推論)だけを抽出して広告予算等のリソースを集中投下させることが、2026年におけるマーケティングROI最大化の絶対的な基本原則となっています。