統計謬論完整清單:55 種思維除錯地圖

這是 55 種統計謬論的完整索引,按 8 大類排列。每個謬論附上一句話定義和對應文章連結。


第一類:抽樣偏差 (Sampling Bias) — 6 種

你的樣本代表不了你的目標群體。

相關文章: 抽樣偏差篇

1. 倖存者偏差 (Survivorship Bias)

只看到「活下來」的案例,看不到消失的失敗者(沒飛回來的飛機、倒閉的公司、流失的用戶)。

2. 樣本選擇偏差 (Sample Selection Bias)

數據採集過程本身帶有篩選機制,導致樣本系統性偏向特定群體(1936 年《文學文摘》只調查有電話的富人)。

3. 覆蓋偏差 (Coverage Bias)

抽樣框架根本沒有覆蓋到特定族群(線上問卷排除了沒有網路的老年人)。

4. 自選偏差 (Self-Selection Bias)

只有特定意願的人才參與,這群人和沉默大多數本質上不同(App Store 評分以極端好評和差評為主)。

5. 便利抽樣偏差 (Convenience Sampling Bias)

只找身邊容易接觸的人(找同事做 Dogfooding 測試),忽略了他們和真實用戶的差距。

6. 時間窗口偏差 (Time Window Bias)

只在特定時段採樣,選到的是「那個時間點會出現的人」,而不是全體用戶(只測週一上午的 A/B 測試)。


第二類:測量偏差 (Measurement Bias) — 6 種

你測量到的不是你以為測量到的。

相關文章: 測量偏差篇

7. 社會期望偏差 (Social Desirability Bias)

受訪者傾向給出「符合社會期待」的答案,而不是真實想法(隱私問卷說很在意,實際授權所有權限)。

8. 觀察者偏差 (Observer Bias)

測量者本身的預期污染了測量結果,不是被測者在演戲,而是測量者看錯了(工程師測試自己的 code)。

9. 回憶偏差 (Recall Bias)

依賴不可靠的記憶而非記錄,人類的記憶是重建的,不是錄像機。

10. 工具與測量誤差 (Instrument & Measurement Error)

測量工具本身引入了系統性誤差,或不同工具/版本的測量結果不可比較。

11. 確認偏差(蒐集階段)(Confirmation Bias in Collection)

在數據蒐集階段就只記錄符合預期的觀察,讓數據庫從源頭就帶有選擇性。

12. 時間與季節偏差 (Temporal & Seasonal Bias)

在錯誤的時間點進行測量,或把季節性波動當作自己努力的成果(一月份健身 App 數據)。


第三類:數字直覺陷阱 (Math Intuition Traps) — 6 種

數學結果違反直覺。

相關文章: 數字直覺陷阱篇

13. 基準率謬誤 (Base Rate Fallacy)

過度關注特定資訊(99% 準確率),完全忽略了基準率(患病率 1%),讓條件機率的計算完全錯誤。

14. 賭徒謬誤 (Gambler’s Fallacy)

以為獨立隨機事件會「記得」過去並自我修正(連開 10 次正面,下次反面機率更高)。

15. 小數定律 (Law of Small Numbers)

相信小樣本能精確代表整體,過度解讀隨機波動(5 人訪談的結論不能等於 80% 用戶想要某功能)。

16. 辛普森悖論 (Simpson’s Paradox)

整體趨勢和每個子群體的趨勢方向相反,因為各子群體的比重不同(每個平台新版都更好,整體反而更差)。

17. 生態學謬誤 (Ecological Fallacy)

用群體的平均特徵推論個體的性質(富裕地區壽命長,不代表搬去住你就會長壽)。

18. 原子論謬誤 (Atomistic Fallacy)

用少數個體的極端經驗推論群體的規律(一所學校的教學法成功,不代表全縣都適用)。


第四類:因果推論 (Causal Inference) — 5 種

相關性不等於因果性,從觀察到行動之間有具體的陷阱。

相關文章: 因果推論篇

19. 混雜因素 (Confounding Factor)

第三個變數同時導致了 X 和 Y,製造了 X 和 Y 之間的假相關(抽菸同時導致帶打火機和肺癌)。

20. 反向因果 (Reverse Causality)

因果方向弄反了,以為 A 導致 B,實際上是 B 導致了 A(犯罪率高所以警察多,不是警察多所以犯罪率高)。

21. 對撞結構 (Collider Bias)

樣本因兩個條件共同篩選,在已篩選的樣本中製造了原本不存在的假相關(「帥哥通常是渣男」)。

22. 偽相關 (Spurious Correlation)

毫無因果關係的變數呈現強相關,可能是巧合或有共同的幕後混雜因素(冰淇淋銷量 vs. 溺水人數)。

23. 中介變量謬誤 (Mediation Fallacy)

在回歸中控制了中介變量(因果路徑上的中間節點),切斷了你正在研究的因果路徑,結論失去意義。


第五類:認知偏差 (Cognitive Bias) — 7 種

大腦在分析和決策時有系統性的捷徑,讓你走偏。

相關文章: 認知偏差篇

24. 確認偏差(分析階段)(Confirmation Bias)

只搜尋、解讀和記憶那些支持預設觀點的資訊,主動迴避反面證據(Wason 選擇任務)。

25. 錨定效應 (Anchoring Bias)

被第一眼看到的數字(錨點)限制了後續的所有判斷,即使那個數字是任意給出的。

26. 可用性啟發法 (Availability Heuristic)

誤以為容易想起來的事情發生機率更高,因為生動的記憶更易提取(飛機 vs. 開車的危險性)。

27. 代表性啟發法 (Representativeness Heuristic)

用「描述像不像」來判斷機率,忽略了真實的統計基準率(琳達問題)。

28. 麥納馬拉謬誤 (McNamara Fallacy)

只量可以量的,忽略量不到的重要因素;把指標當作目標本身,而不是目標的代理(越戰計算敵軍死亡人數)。

29. 古德哈特定律 (Goodhart’s Law)

一個指標一旦成為目標,它就不再是好的指標。系統開始優化指標本身,而不是指標代表的真實目標。

30. 路徑依賴 (Path Dependence)

初期的決策限制了後續選項,即使新數據顯示方向是錯的,沉沒成本的心理讓人繼續沿著錯誤路徑前進。


第六類:統計方法 (Statistical Methods) — 11 種

你以為工具是對的,但工具的假設被違反了,或你誤解了它的輸出。

相關文章: 統計方法篇

31. 回歸謬誤 (Regression to the Mean)

把均值迴歸(極端值自然回歸平均)誤認為是你的干預措施有效(運動畫刊詛咒、飛行教官的懲罰論)。

32. 多重共線性 (Multicollinearity)

預測變數之間高度相關,導致回歸模型的係數估計不穩定,無法解釋每個變數的獨立影響。

33. 潛在變數偏差 (Omitted Variable Bias)

遺漏了一個同時影響 X 和 Y 的重要變數,模型把它的影響錯誤地分配給了放進模型的其他變數。

34. 過度擬合 (Overfitting)

模型死記硬背了訓練數據的雜訊,在訓練集完美,在新數據上一塌糊塗。

35. 數據洩漏 (Data Leakage)

訓練時用到了在真實預測情境中不可得的資訊,讓模型準確率高達 99% 卻上線即失靈。

36. 前瞻性偏差 (Look-ahead Bias)

在回測或歷史分析中,使用了當時根本不可得的未來數據,讓歷史策略看起來無懈可擊。

37. 外推謬誤 (Extrapolation Bias)

把模型的預測延伸到訓練數據範圍以外,在沒見過的情境或人群上使用,結論不可信。

38. P 值誤解 (P-value Misinterpretation)

把 p 值錯誤地解讀為「虛無假設為假的機率」或「新版本更好的確信度」,而不是「假設虛無假設為真時,這麼極端的數據出現的機率」。

39. 效果量忽視 (Effect Size Neglect)

只看統計顯著性(p < 0.05),忽略效果的實際大小,把微小但「顯著」的差異當作有意義的發現。

40. 檢定力不足 (Underpowered Study)

樣本量太小,無法檢測到真實存在的效應,導致偽陰性(A/B 測試跑幾百人就說「沒效果」)。

41. 多重比較謬誤 (Multiple Comparisons Problem)

同時進行大量統計檢定,純粹基於機率就會出現假陽性;P-Hacking 是主動版本:一直跑到出現顯著結果為止。


第七類:實驗設計 (Experiment Design) — 9 種

你以為實驗是公正的,但它從一開始就不是。

相關文章: 實驗設計篇

42. 霍桑效應 (Hawthorne Effect)

被測者因知道自己被觀察而改變行為,你測到的是「被觀察的人的行為」,不是「真實情境下的行為」。

43. 安慰劑效應 (Placebo Effect)

被測者因相信干預有效而產生了真實的主觀改善,即使干預本身毫無作用。

44. 實驗者期望效應 (Experimenter Expectancy Effect)

研究者的細微行為和措辭暗示了「正確答案」,不知不覺地引導了受試者的回應方向。

45. 干預偏差 (Intervention Bias)

實驗組和對照組在實驗設計的變因以外,還受到了其他不同的對待,無法分離真正的效果。

46. 無回應偏差 (Non-Response Bias)

沒有回應的人,和有回應的人,本質上是不同群體;沉默的大多數可能是你最需要了解的人。

47. 問卷偏差 (Questionnaire Bias)

問題的措辭、順序、選項設計,系統性地引導了答案的方向(「你喜歡這功能嗎?」vs. 「你對這功能有什麼看法?」)。

48. 資訊偏差 (Information Bias)

數據標籤本身就是錯的,標註者的偏見、疲勞、理解差異污染了模型的訓練基礎。

49. 檢測偏差 (Detection Bias)

尋找某現象的努力程度不同,讓發現率的差異被誤認為是現象本身的差異(癌症篩查密度 vs. 癌症發生率)。

50. 排除偏差 (Exclusion Bias)

不當地排除數據點(例如「異常值」),可能把最重要的信號當作雜訊刪掉。


第八類:呈現與報告 (Presentation & Reporting) — 5 種

數據本身沒問題,選擇展示什麼才是問題。

相關文章: 呈現與報告篇

51. 截斷 Y 軸 (Truncated Y-Axis)

讓 Y 軸不從 0 開始,把微小的絕對變化用視覺比例感放大,讓一條平緩的線看起來像火箭升空。

52. 雙軸圖表誤導 (Dual-Axis Manipulation)

用兩個不同刻度的 Y 軸,讓兩個量級完全不同的變數看起來「完美同步」,暗示它們之間有未論證的關聯。

53. 櫻桃挑選 / 德州神槍手 (Cherry-Picking / Texas Sharpshooter)

只展示成功的結果,隱藏失敗的嘗試,讓偶然的成功看起來像必然的規律。

54. 文件抽屜問題 (File Drawer Problem)

負面或無顯著結果的研究被鎖進抽屜不公開,讓公開的結論系統性地偏向正向結果。

55. 發表偏差 (Publication Bias)

整個期刊出版系統偏向接受有顯著正向結果的研究,讓已發表的文獻不代表所有已完成的研究。


使用方式:

  • 設計抽樣計畫時:檢查 #1–6
  • 設計測量工具時:檢查 #7–12
  • 解讀比率和聚合數字時:檢查 #13–18
  • 從相關性推因果時:檢查 #19–23
  • 做決策或分析數據時:檢查 #24–30
  • 使用統計模型或 ML 時:檢查 #31–41
  • 設計實驗或問卷時:檢查 #42–50
  • 準備報告或讀別人的報告時:檢查 #51–55

系列總覽 · 版本 4.0 · 2026-02-21