TOP / 科学的思考

相関関係と因果関係の違い
「○○だから△△だ」——感情論者が必ず犯す致命的な論理ミスを、統計学・疫学・因果推論の最前線が完全解剖する

「アイスが売れると溺死者が増える」——これが示す恐ろしい真実

統計学に入門する学生が必ず最初に学ぶ有名な事例がある。夏になると「アイスクリームの売上」と「溺死者数」がともに増加する——両者の間には高い正の相関関係が存在する。では「アイスを食べるから溺れる」のか?もちろん違う。夏という気温という第三の変数(交絡因子)が両者を同時に増加させているに過ぎない。

これは笑い話に見える。しかし日々のSNSを眺めると、まったく同様の論理ミスが政治・経済・医療・社会問題のあらゆる場面で「確信を持って」語られていることに気づく。「○○が増えた時期に△△が増えた、だから○○のせいだ」——この感情的な因果断定が、いかに危険で社会的に有害かを本記事は徹底的に解剖する。

85%
一般市民が相関関係を因果関係と混同するケースの割合(複数の認知科学研究の推計値)
0.99
米国の「有機食品の売上増加」と「自閉症診断数増加」の相関係数——明らかに因果ではない疑似相関
3,000件
Tyler VigenがspuriousCorrelations.comで集めた「完全に無意味な高相関」の事例数
RCT
因果関係を証明できる唯一の方法:無作為化比較試験(Randomized Controlled Trial)

相関関係と因果関係の定義:科学的に正確に理解する

まず用語を正確に定義しよう。感情論的思考の最大の問題の一つは、言葉を曖昧に使うことで論理を滑らせることだ。

相関と因果:4つのパターンを理解する
Pattern A — Genuine Causation
本当の因果関係
A → B
AがBを直接引き起こす。喫煙(A)→肺がんリスク増加(B)。この場合は相関も因果も存在する。
Pattern B — Reverse Causation
逆の因果関係
B → A(AがBを生むと思ったら逆だった)
「経済成長している国は教育水準が高い」→「教育が経済を生む」か「経済が教育を生む」か?相関は存在するが因果の方向が逆の場合がある。
Pattern C — Confounding
交絡因子(第三の変数)
C → A かつ C → B
アイスの売上(A)と溺死者(B)は「夏(C)」という共通の原因を持つ。AとBは相関するがお互いは無関係。最も多い誤謬。
Pattern D — Pure Coincidence
純粋な偶然の一致
A と B に実質的な関係なし
「ニコラス・ケイジの出演映画数」と「プール溺死者数」の相関(r=0.67)。データが多ければ必ず偶然の高相関が見つかる。多重検定問題。

因果推論の革命:ジュディア・パールの「因果のはしご」

コンピュータ科学者・統計学者のジュディア・パール(Judea Pearl)は、因果推論の理論を根本から再構築した(2009, 2018)。パールの「因果のはしご(Ladder of Causation)」は3段階で構成される:①観察(何が起きているか)——②介入(何かを変えたら何が起きるか)——③反事実(もし違っていたらどうなったか)。相関関係は①の段階にとどまる。本当の因果推論は②と③の問いに答えることを求める。感情論は常に①の観察だけで③の反事実的結論(「○○のせいだ」)を出してしまう。

SNSで溢れる「相関→因果」感情論:実例解剖

理論だけでなく、実際のSNSでよく見られる「相関を因果と混同した感情論的投稿」のパターンを解剖する。

😤
X
子どもにワクチンを打ってから発達障害の診断が増えたのは絶対に関係あります。私の周りでも接種後に変化があった子が何人もいます。これがデータとして出てこないのは隠蔽しているからです。お母さんたちは声を上げて!
感情論的構造の解剖: 相関→因果の混同選択バイアス確証バイアス陰謀論的隠蔽

「接種後に変化があった」は時系列上の先後関係(Post hoc ergo propter hoc)だ。接種後に起きたことが接種によって起きたことにはならない。発達障害診断数の増加は①診断基準の変更(DSM-IV→DSM-5)②専門医・診断機会の増加という既知の要因で説明される。自閉症とワクチンの関連性は、数万人規模の複数の独立研究で繰り返し否定されている(Taylor et al. 1999, Madsen et al. 2002, Honda et al. 2005等)。「隠蔽」というラベルで反証不可能化する構造は感情論陰謀論の典型だ。
📊
Yahoo!
移民が増えると失業率も上がる。これはデータが証明しています。外国人労働者が日本人の仕事を奪っているのは明白です。統計を見ればわかることなのに、なぜメディアは報道しないのでしょうか。自分の目で確かめてください。
感情論的構造の解剖: 疑似相関の誤用交絡因子の無視「データが証明」という虚偽主張

「移民増加と失業率上昇の相関」があるとしても、因果関係は即座には導けない。①経済停滞期に移民も失業者も増える(共通の交絡因子)②移民は既存労働者と競合する一方、消費者としても需要を生む(収支計算が必要)という複数の説明が存在する。主要な経済研究(Card 1990のマリエル難民研究など)は、大規模な移民流入が現地労働者の賃金・雇用に与える影響は限定的であることを示している。「データが証明」という表現で相関データを因果関係として提示する手法は感情論的統計操作の典型だ。
🔬
X
砂糖を摂取すると子どもが興奮するのは親なら誰でも知ってる常識。パーティーの後に子どもがハイになるのがその証拠。科学者は机上の空論ばかりで現場を知らない。お母さんたちの経験の方が信頼できます
感情論的構造の解剖: 確証バイアス期待効果(プラセボ)反知性主義個人体験の過大評価

「砂糖が子どもを興奮させる」という信念は、二重盲検RCT(Hoover et al. 1994, Wolraich et al. 1994等)で繰り返し否定されている。糖分を摂取した子どもと摂取していない子どもの行動差はなく、「砂糖を与えた」と信じさせられた親の評価のみが変化する(これがプラセボ効果・確証バイアスの証明)。「パーティー後の興奮」は砂糖ではなく社会的興奮・睡眠不足・祝祭的状況(交絡因子)によって説明される。「お母さんの体験の方が信頼できる」は確証バイアスと反知性主義の融合だ。

感情論が陥る「相関→因果」の5パターン

SNSでの感情論的な相関→因果ミスには、繰り返し登場するパターンがある。これらを知ることで識別力が劇的に向上する。

PATTERN 01 — Post Hoc Ergo Propter Hoc
「○○した後に△△が起きた。だから○○が原因だ」
先後関係(時系列)を因果関係と混同する最も古典的な誤謬。「政権交代後に景気が悪化した、だから政権交代のせいだ」——景気悪化の原因は政権交代前から始まっていた構造的問題かもしれない。しかし感情論は先後関係を確認するだけで「犯人」を特定する。
科学的対応: 先後関係の確認は因果推論の最低条件に過ぎない。他の説明仮説を列挙し、交絡因子を統計的にコントロールした分析が必要だ。
PATTERN 02 — Omitted Variable Bias
「○○が多い地域は△△も多い。だから○○が△△を生む」
共通の第三変数(交絡因子)の存在を無視する。「警察官が多い地域は犯罪が多い」——警察官の多さが犯罪を生むのではなく、犯罪の多い地域に警察官が配置されるという逆の因果、またはどちらも人口密度・都市化という第三変数の産物だ。
科学的対応: 「交絡因子」を想定し、その変数を統計モデルに組み込んだ多変量解析が必要。観察研究では完全な制御は困難であることも認識する。
PATTERN 03 — Reverse Causality
「○○が△△を引き起こした」(実は逆)
因果の方向を間違える。「うつ病の人は運動しない、だから運動不足がうつ病を生む」——実際はうつ病が運動意欲を奪う逆の因果も存在する(双方向の因果関係がある)。感情論は「感情的に納得できる」方向の因果を選ぶ。
科学的対応: 時系列分析(Granger因果性テスト)や実験的介入(運動プログラムの導入)による因果の方向確認が必要だ。
PATTERN 04 — Selection Bias
「私の周りでは□□ばかり。絶対に○○が原因だ」
自分が観察しやすいサンプルだけを根拠にする。個人的な観察は必ず選択バイアスがある——似た価値観・生活環境の人々で形成されたネットワーク、感情的に印象に残った事例の過大評価(利用可能性ヒューリスティック)。「ワクチンを打った後に副反応が出た人の話をよく聞く」のは、副反応がないと話題にならず、あると話題になるからだ。
科学的対応: 代表性のあるランダムサンプルによる集団研究が必要。個人体験は仮説の出発点にはなりうるが、証拠にはならない。
PATTERN 05 — Multiple Testing Problem
「これだけ多くのデータが一致しているんだから絶対正しい」
データを多数見ていれば偶然の高相関は必ず出現する。20の仮説をp<0.05で検定すれば、1つは純粋に偶然で有意になる(5%の確率×20=期待値1件の偽陽性)。感情論者は確証バイアスにより、自説を支持するデータだけを集め「これだけの証拠がある」と主張する。
科学的対応: Bonferroni補正等の多重検定補正、事前登録(preregistration)による仮説固定、複数の独立研究による再現性確認が必要だ。

驚愕の疑似相関コレクション:データがいかに嘘をつくか

これほど「納得感のある高相関」が因果でないことを示す事例群がある。感情論者は「データがある」という事実だけで飛びつくが、以下の事例はデータの解釈がいかに慎重を要するかを示す。

r = 0.95
有機食品の売上 × 自閉症診断数
A: 米国有機食品市場規模(十億ドル)
B: 米国自閉症スペクトラム障害診断数
ともに2000年代以降急増しているが、有機食品が自閉症を引き起こすのか?共通の交絡因子は「健康・環境への関心の高まり」「診断基準の変化と診断機会の増加」だ。感情論はこれを「有機食品に何か問題がある」と解釈しかねない。
r = 0.87
スマホ普及率 × うつ病診断率
A: 全世界スマートフォン普及率(%)
B: OECD諸国のうつ病診断率
スマホがうつを生む可能性はある(SNS比較・睡眠障害等)が、この相関だけでは証明できない。共通の交絡因子として「デジタル化・都市化・孤立化」「うつ病への認識向上による受診率増加」が存在する。感情論はこれを「スマホが人をうつにする」と即断する。
r = 0.79
日本の少子化 × 外国人在留者数
A: 日本の合計特殊出生率(低下)
B: 在日外国人登録者数(増加)
少子化と外国人増加はともに進行しているが、因果関係は逆(少子化による労働力不足が外国人受け入れを促している)か、共通の要因(グローバル化・産業構造変化)の産物だ。感情論はこれを「外国人が増えたから少子化が進んだ」と解釈する恐れがある。
r = 0.67
N. ケイジ映画出演数 × プール溺死者数
A: ニコラス・ケイジの年間出演映画本数
B: 米国プールでの溺死者数
Tyler Vigenが有名にした純粋な偶然の一致。これを笑えるのは感情論的に「つながり」を感じないからだ。しかし感情的に「つながり」を感じる疑似相関は同様の統計的根拠でも「証拠」に見える。感情がフィルターになっている。

因果関係を証明する唯一の方法:RCTとその限界

科学的に因果関係を証明できる最も強力な方法が、無作為化比較試験(RCT: Randomized Controlled Trial)だ。感情論が「体験談」「相関データ」を根拠とするのに対し、科学はRCTを因果推論の「ゴールドスタンダード」としている。

RCT(無作為化比較試験)の構造
STEP 01
無作為割り付け
参加者をコインフリップのようなランダム手続きで「実験群」と「対照群」に分ける。これで既知・未知の交絡因子を両群に均等分散させる。
STEP 02
介入の実施
実験群にのみ介入(薬・政策・教育プログラム等)を実施する。対照群には偽薬(プラセボ)や標準的処置を与える。
STEP 03
盲検化
参加者も研究者も誰がどちらの群か知らない「二重盲検」が理想。期待効果(プラセボ)を排除するための必須手順だ。
STEP 04
結果の比較
介入後の両群の結果を統計的に比較する。有意差があれば介入の効果(因果関係)が示唆される。サンプルサイズが重要。
STEP 05
再現性の確認
1つのRCTでは不十分。複数の独立研究・異なる集団での再現が「科学的コンセンサス」形成の条件だ。メタ分析で統合評価する。

重要注意:RCTにも限界がある——マクロ経済学・気象学の「科学性」問題

すべての問いにRCTを適用できるわけではない。倫理的制約(人に害のある介入はできない)、実施コスト、外的妥当性の問題(RCTの結果が他の文脈にも適用できるか)がある。特にマクロ経済学・気象学・社会科学の多くの命題は、実験的検証が困難なため「観察データ」「数理モデル」「自然実験」に依存する。これらは厳密な意味でのRCTより証拠の強度が低い。感情論は「専門家が言っているからRCTと同等だ」と混同するが、マクロ経済学の予測精度の低さ(リーマンショック・金融危機のほぼ全員未予測)はエビデンスの強度差を示している。「科学的」という言葉の中にも証拠強度のグラデーションがある。

仮説演繹法:相関から因果へ——科学的に追う方法

「相関が見つかった」ことは仮説の出発点であり、ゴールではない。仮説演繹法がどのように相関データを因果推論へと昇華させるかを示す。

仮説演繹法5ステップ——相関発見から因果関係の検証へ

🔍
Step 1 — Observation(観察)
「相関がある」という観察を正確に記述する——「○○と△△の間に相関関係がある」という観察を、感情的解釈なしに記述する。相関係数・サンプルサイズ・研究の信頼性を確認する。「身近な体験」ではなく、代表性のあるデータかどうかを最初に問う。感情論はここで「なんとなく関連がある」という感覚的観察から始める。
💡
Step 2 — Hypothesis(仮説)
複数の因果仮説を並列で立てる——H1:AがBを引き起こす。H2:BがAを引き起こす(逆の因果)。H3:共通の第三変数CがAもBも引き起こす(交絡)。H4:偶然の一致(無関係)。感情論は感情的に「納得できる」H1だけを採用し他を排除する。科学はこの4仮説を同等に扱い証拠で評価する。
⚗️
Step 3 — Prediction(予測)
各仮説が予測する検証可能な帰結を導く——H1が正しければ:Aを操作(増減)するとBも変化するはず。H3が正しければ:Cを統計的にコントロールするとAとBの相関が消えるはず。H4が正しければ:サンプルを変えると相関が再現されないはず。これらの予測はデータや実験で確認できる。
📊
Step 4 — Testing(検証)
証拠の強度を評価する——RCT、自然実験、操作変数法、差の差分析、回帰不連続デザイン——これらは観察データからできるだけ因果関係に近づくための統計的手法だ。これらのどれかを使った研究が存在するか、複数の独立研究が同じ結論に達しているかを確認する。「体験談」「相関データ」はいずれも証拠強度が低いことを明記する。
🎯
Step 5 — Conclusion(結論)
「証拠強度」とともに暫定的結論を出す——「強い証拠がある」「限定的な証拠がある」「証拠が不十分」「否定される」という4段階で評価する。そして「現時点の証拠に基づく最善推定」として結論を示し、新しい証拠で更新する柔軟性を持つ。確実性の過大表現も過小表現も避ける——これが感情論との最大の違いだ。

相関→因果ミスが社会に与える具体的被害

「相関と因果を混同する」ことは単なる学術的な間違いではない。社会的・個人的な実害を生む。

感情論的相関→因果主張 実際の被害 科学的事実
「ワクチンが自閉症を引き起こす」 ワクチン忌避→麻疹・風疹アウトブレイクの再発→実際の死者・障害者の増加 複数の大規模研究で関連性は否定されている(Wakefield論文はデータ捏造で撤回済み)
「電磁波が健康を害する」 5Gタワーへの放火・妨害工作、不必要な不安による精神的苦痛 非電離放射線の健康影響に関する科学的コンセンサスは存在しない(WHOの評価)
「移民増加が犯罪を増やす」 差別・ヘイトクライムの正当化、移民政策の歪曲、社会的分断の深化 移民比率と犯罪率に有意な正の相関を見出した大規模研究はほぼ存在しない
「砂糖が子どもを興奮させる」 食事制限による子どもの栄養バランス問題、親の不必要な不安 RCTで繰り返し否定されている(確証バイアスとプラセボ効果が原因)
「代替医療(ホメオパシー等)が病気を治す」 証拠に基づく医療への拒否による症状悪化・死亡事例 ホメオパシーはプラセボを超える効果を示したRCTが存在しない

「だから〜だ」という感情論の罠を超えて

「○○だから△△だ」という因果断定は、人間の脳が世界を理解しようとする基本的な認知パターンだ。これ自体は人間として正常な機能だ。問題は、感情的に「納得できる」相関を証拠なく因果関係として断定し、社会に流通させることだ。