2023.06.05

因果推論とは

因果推論とは、データをもとにして原因と結果の関係性を分析して明確にすることです。ある要因に対して何らかの介入をした場合、介入をしたことで特定の変数が変化した具合を想定します。

因果推論によって分析することで、2つの変数が相関関係であるのか因果関係であるのかを見分けられます。的確に因果推論を進めるためには、相関関係と因果関係を取り違えないようにすることが重要です。

因果推論とは

因果推論(Causal inference)とは、物事における因果関係の大きさや有無を推定して分析することです。ビジネスにおいて、因果推論は施策やキャンペーンなどの効果を測定する場合をはじめさまざまなケースで利用されます。売り上げだけを比較した場合、販売した季節や天気、場所など複数の要因があることから純粋にキャンペーンの効果であるかどうかがわかりません。そこで、キャンペーンが売り上げにつながっているかどうか推定する場合に因果推論を活用します。

統計学では回帰や検定など複数のデータをもとに相関関係を分析する手法が一般的でした。しかし、従来の方法では2つの要因に相関があるかどうかを分析できますが、因果があるのかを判断することはできませんでした。そこで、因果関係を推計できる因果推論の需要が高まりました。

統計学因果推論とは

統計学因果推論とは、統計学を使って因果推論を進めることです。例えば、広告を出した店舗と出していない店舗で売り上げを比較して広告の効果について統計学因果推論を使って分析します。しかし、実際には立地条件や店舗規模が異なるなど広告を出したこと以外に条件が異なることが少なくありません。そこで、複数のデータを集めることによって平均的に差異があるかどうかを検証します。

ビジネスにおける因果推論

ビジネスでは企業がマーケティング戦略や事業戦略を立案するときに、原因と結果の間に因果関係があるかどうかを把握することで効果検証をすることが少なくありません。効果検証をもとに意思決定をする場合があるため、ビジネスにおいて因果推論は重要な分析方法です。

例えば、ある施策を実行した結果、売り上げや顧客満足度が向上したのかといった効果を因果関係の観点から評価して効果を測定することが一般的です。

因果推論と交絡

交絡とは、本来の因果関係と異なる要因が影響を与えることをいいます。例えば、疾患に対して新しい治療法が効果的であるかどうかを測定する場合、年齢や重症度、そのほか生活習慣などさまざまな要因が治療法の効果に影響を与える可能性があります。因果推論を正しく分析するためには、交絡に対する対処を適切にすることが重要です。

相関関係と因果関係

適切に因果推論を進めるうえで、相関関係と因果関係をとり違えないように原因と結果を推論することが重要です。相関関係と因果関係は混合しがちですが、両社の違いを正しく理解しないとビジネスを進めるうえで影響の出る場合があります。

相関関係

相関関係とは、2つの変数のうちいずれか一方が変動すれば片方も変動するといった関係です。相関関係には正の相関と負の相関があります。例えば、身長と体重の関係は身長が高くなれば体重が増えることが多いため正の相関のあることが一般的です。逆に、運動量が増えると体重が減る傾向にあることから運動量と体重は負の相関があるといえます。

しかし、これらの例は相関関係があっても必ずしも因果関係があるとはいえません。相関関係は同時に2つの変数が変化しているだけで、1方の変化によって他方が変化する要因となるわけではありません。

因果関係

因果関係とは、複数の要件における間に原因と結果の関係があることです。因果推論とは原因や結果といった2種類の変数があることで原因に対して介入を加えることで影響があるものです。

例えば天候と来客数は因果関係のあることが少なくありません。統計をとると雨の日は来客数が減ることが一般的です。雨や天候と来客数が減ることは因果関係があるといえます。

因果推論の手法

因果推論には次の手法が挙げられます。

  1. 層別解析
  2. 共分散分析
  3. 差分の差分法
  4. ランダム化比較試験
  5. 傾向スコア

層別解析

層別解析とは、比較対象となっている集まりをサンプルの変数ごとに分け、グループ(層)ごとに分析をおこなう解析方法です。比較だけでは把握できなかったグループとの差や変数がどのように影響するかを確認できます。

共分散分析

共分散分析は、群間の差を比較することによって解析する手法です。比較した内容をもとにして、差が発生している要因の影響を調べられます。例えば、ある薬が病気を治す効果があるのかどうかを調べる場合、人々にその薬を与えたグループと与えなかったグループを比較して、その薬が病気を治す原因であるかどうかを判断できます。共分散分析は、調べたい要因以外の影響を省いて分析できるため検出力を高められる点も大きな特徴です。

差分の差分法

差分の差分法(DID、Difference In Difference)とは、目的変数における時系列推移が似ている集まりを対象として介入する前と後で変数の変化を比較することで影響度を測定する解析方法です。差分の差分法を活用することによって、年齢や天候などの影響を排除したうえで要因による影響を調べられます。

ランダム化比較試験

ランダム化比較試験(RCT、randomized controlled trial)とは、調べたい条件以外はすべて条件を揃えて分析をおこなうことです。そのため、対象となるグループごとに施策以外に影響を受けにくく、属性の偏りを少なくすることが重要です。さらに、できるだけ効果測定を詳しくするためには偶然性ができるだけ発生しないような環境が求められます。

例えば、業務改善を目的としたツールを導入する場合、業務のミス率や業務あたりの削減時間などを定量的に評価し、効果がわかりやすい項目を選ぶことが一般的です。偏りがでないように、メンバー構成をする場合に性別や所属部署、年齢などを揃えて割り振りをします。ツール導入後にそれぞれのグループで効果測定をおこないますが、グループのメンバーを選びなおしたり分母を増やしたりするなど複数回実施して指標の変化を確認します。

傾向スコア

傾向スコアとは、ある政策の効果を測定する場合にグループ間の交絡を取り除くために活用されている手法です。交絡とは本来の因果関係以外の要因が影響を与えている可能性があることです。傾向スコアは、要因に対して傾向を反映したスコアです。要因を決定づける多様な因子を1つのスコアにまとめることで複数の情報を1つの要件として測定しやすくなります。

まとめ

因果推論とは、ある要因に対して介入をした場合において介入をする前後の関連性を分析することです。因果推論を適切に進めるうえで、2つの変数が相関関係か因果関係のどちらであるかを明確に判断することが求められます。

因果推論には、層別解析や共分散分析、差分の差分法などの手法があり、状況や因果関係を把握したい要件に応じて適切なものを選ぶことが重要です。ビジネスにおいて因果推論を使って意思決定や効果検証をすることが多く、適切に進めることが大切です。

一覧に戻る

関連コラム