因果与相关 Causation vs Correlation

年级:7年级起 分类:批判性思维 年级入口:七至九年级 关联:科学假设与证伪 Hypothesis and Falsification | 确认偏误 Confirmation Bias


30 秒版本

  • 一句话:一起出现 ≠ 一个导致另一个——相关不等于因果
  • 举个例子:冰淇淋销量↑的月份溺水人数也↑——不是冰淇淋导致溺水,是夏天同时影响了两者
  • 判断方法:问”有没有第三个因素同时影响了两者?“

核心概念

相关(Correlation):两件事同时出现或同步变化,但不代表一个导致另一个。

因果(Causation):一件事直接导致另一件事发生,且能通过实验或机制验证。

核心判断:相关 ≠ 因果。看到两件事一起变化,必须追问”为什么”。

信号词速查

信号词示例陷阱
”研究发现……所以……""研究发现喝咖啡的人更长寿,所以咖啡延寿”跳过了混淆变量
”数据显示……""数据显示 X 和 Y 正相关”相关不等于因果
”用了……之后就……""用了这个护肤品,皮肤变好了”时间先后 ≠ 因果
”越多……越多……""手机用得越多,成绩越差”可能有第三因素

👉 听到这些词,立刻问自己:“有没有第三个因素同时影响了两者?”


🔍 思维透镜

图C-1 A和B相关?四种可能

A 和 B 同时出现?四种可能

当你观察到 A 和 B 相关时,不要急着下结论,先排查四种可能:

可能性结构例子
① A 导致 BA → B下雨 → 地面湿
② B 导致 AB → A经常运动的人更开心(也可能是开心的人更爱运动)
③ 第三因素 C 同时导致两者C → A + B夏天 → 冰淇淋销量↑ + 溺水人数↑
④ 纯属巧合(伪相关)A ≈ B尼古拉斯·凯奇年出演电影数 ≈ 游泳池溺亡数

混淆变量(Confounding Variable):第③种情况中隐藏的 C,是最常见的陷阱。

相关 vs 因果

相关因果
含义两件事同步变化一件事直接导致另一件事
证明难度容易(统计数据即可)困难(需要实验+排除替代解释)
能做决策依据吗⚠️ 仅供参考✅ 可以
建立方法观察即可需要随机对照实验(RCT)

🎭 成语解剖

张冠李戴

把张三的帽子戴到李四头上——张冠错放,归因错误。

拆解
原意把属于这个人的东西错误地归给另一个人
逻辑映射错误归因——看到 A 和 B 一起出现,就把原因强行从 A 套到 B,忽略了真正的原因 C
现实对照”吃了偏方之后病好了”——真正原因可能是休息、免疫力、或同时在吃正规药

风马牛不相及

齐桓公攻楚,楚使者说:“你在北方,我在南方,即便跑散的马和牛也到不了对方那里,怎么会打到这来?“

拆解
原意两件事毫无关联
逻辑映射伪相关——两件事在数据上”碰巧”一起出现,实际没有任何因果机制
现实对照”冰淇淋销量和鲨鱼袭击数都在夏天增加”——冰淇淋和鲨鱼之间,真的是风马牛不相及

💡 思想史光点

人物年代关键词
休谟(David Hume)1739因果关系的哲学质疑,“我们看到的只是先后,不是因果”
塞麦尔维斯(Semmelweis)1847用数据证明洗手降低产褥热——从相关走向因果的先驱
皮尔逊(Karl Pearson)1896相关系数,用数学测量”两件事是否一起变”
费歇尔(R. A. Fisher)1935随机对照实验,建立因果关系的黄金标准

→ 延伸阅读:思想史光点 Logic Origins


📰 案例精讲

📘 日常:冰淇淋和溺水

统计数据显示:冰淇淋销量越高的月份,溺水人数也越多。

难道冰淇淋会导致溺水?当然不是。

分析

  • 冰淇淋销量↑ 和 溺水人数↑ 都是夏天高温造成的
  • 天气热 → 人们买更多冰淇淋,同时也更多去游泳
  • 混淆变量 = 夏天/高温
  • 冰淇淋和溺水之间没有任何因果关系

这是全世界统计学入门课最经典的例子:相关 ≠ 因果

📙 经济:麦当劳越多的国家,犯罪率越低?

有人发现:一个国家麦当劳门店越多,犯罪率往往越低。所以麦当劳降低了犯罪?

分析

  • 混淆变量 = 国家经济发展水平
  • 经济发达 → 麦当劳愿意开店(有消费力)
  • 经济发达 → 更好的教育、就业、社会福利 → 犯罪率更低
  • 麦当劳本身不减少犯罪,是经济水平同时影响了两者

这类错误在商业和政策讨论中极为常见:把”伴随现象”当成”原因”。

📕 历史:塞麦尔维斯与洗手实验

1847 年,维也纳总医院的产科有两个病房。第一病房由医学生负责,产妇死亡率约 13-18%;第二病房由助产士负责,死亡率约 2%。

匈牙利医生塞麦尔维斯发现:医学生经常从解剖室直接来接生,而助产士不接触尸体。他怀疑是”尸体上的某种物质”导致了感染。

他要求医学生接生前用含氯石灰水洗手——第一病房死亡率从约 13-18% 降到 1-2%

从相关到因果的过程

  1. 观察到相关:哪个病房死亡率高?→ 医学生的病房
  2. 排查变量:两个病房有什么不同?→ 医学生接触尸体
  3. 实验干预:强制洗手 → 死亡率暴降
  4. 建立因果:不洁的手 → 感染 → 死亡

这就是科学方法的力量:不停留在相关,用实验追出因果


📖 真实阅读

📰 “学钢琴的孩子数学更好”

某教育机构发表报告称:“调查了 2000 名中小学生,学钢琴的孩子平均数学成绩比不学钢琴的孩子高 15 分。结论:学钢琴能提高数学能力。”

一位家长看到报告后,立刻给孩子报了钢琴班,期待数学成绩提升。

逻辑分析

  • 这个报告证明了什么?(相关还是因果?)
  • 有哪些可能的混淆变量?
  • 家长的决策合理吗?
  • 要真正证明”钢琴提高数学”,需要怎样的实验设计?

🧪 练习

📘 识别题(2 题)

判断以下推理是否犯了”把相关当因果”的错误:

  1. “城市路灯越多的地方,犯罪率越低。所以多装路灯就能降低犯罪率。”
  2. “每次下雨前,气压都会下降。所以气压下降是下雨的前兆。”

📙 分析题(2 题)

  1. “每天喝咖啡的人平均寿命更长。“列出至少两个可能的混淆变量,并解释它们如何同时影响”喝咖啡”和”长寿”。

  2. 尼古拉斯·凯奇每年出演的电影数量,与美国游泳池溺亡人数高度相关。用四种可能性框架分析,这属于哪一种?为什么?

📕 构建题(2 题)

  1. 找一条新闻或广告中的”因果声称”,用以下框架分析:
声称的因果关系:A → B
可能的混淆变量 C:______
反向因果的可能性(B → A):______
纯巧合的可能性:______
要验证真正因果,需要什么实验:______
  1. 以下论证把相关当因果,请重写为考虑其他可能性的分析:

“自从新校长上任后,学校的考试平均分提高了 15 分。说明新校长的管理方法非常有效。”

重写这段分析,用四种可能性框架(A→B / B→A / C→两者 / 巧合)展开讨论。



🔗 节点关系

         批判性思维
    ┌────────┼────────┐
 确认偏误  因果与相关  沉没成本
              │
     ┌────────┴────────┐
  混淆变量           伪相关
 (隐藏的第三因素)  (纯属巧合)
              │
     科学假设与证伪
  (用实验建立真正因果)

双链跳转科学假设与证伪 Hypothesis and Falsification | 确认偏误 Confirmation Bias | 沉没成本 Sunk Cost Fallacy


R. S. Ang · K12 Notes · 7年级起, 2026