這是 55 種統計謬論的完整索引,按 8 大類排列。每個謬論附上一句話定義和對應文章連結。
第一類:抽樣偏差 (Sampling Bias) — 6 種
你的樣本代表不了你的目標群體。
相關文章: 抽樣偏差篇
1. 倖存者偏差 (Survivorship Bias)
只看到「活下來」的案例,看不到消失的失敗者(沒飛回來的飛機、倒閉的公司、流失的用戶)。
2. 樣本選擇偏差 (Sample Selection Bias)
數據採集過程本身帶有篩選機制,導致樣本系統性偏向特定群體(1936 年《文學文摘》只調查有電話的富人)。
3. 覆蓋偏差 (Coverage Bias)
抽樣框架根本沒有覆蓋到特定族群(線上問卷排除了沒有網路的老年人)。
4. 自選偏差 (Self-Selection Bias)
只有特定意願的人才參與,這群人和沉默大多數本質上不同(App Store 評分以極端好評和差評為主)。
5. 便利抽樣偏差 (Convenience Sampling Bias)
只找身邊容易接觸的人(找同事做 Dogfooding 測試),忽略了他們和真實用戶的差距。
6. 時間窗口偏差 (Time Window Bias)
只在特定時段採樣,選到的是「那個時間點會出現的人」,而不是全體用戶(只測週一上午的 A/B 測試)。
第二類:測量偏差 (Measurement Bias) — 6 種
你測量到的不是你以為測量到的。
相關文章: 測量偏差篇
7. 社會期望偏差 (Social Desirability Bias)
受訪者傾向給出「符合社會期待」的答案,而不是真實想法(隱私問卷說很在意,實際授權所有權限)。
8. 觀察者偏差 (Observer Bias)
測量者本身的預期污染了測量結果,不是被測者在演戲,而是測量者看錯了(工程師測試自己的 code)。
9. 回憶偏差 (Recall Bias)
依賴不可靠的記憶而非記錄,人類的記憶是重建的,不是錄像機。
10. 工具與測量誤差 (Instrument & Measurement Error)
測量工具本身引入了系統性誤差,或不同工具/版本的測量結果不可比較。
11. 確認偏差(蒐集階段)(Confirmation Bias in Collection)
在數據蒐集階段就只記錄符合預期的觀察,讓數據庫從源頭就帶有選擇性。
12. 時間與季節偏差 (Temporal & Seasonal Bias)
在錯誤的時間點進行測量,或把季節性波動當作自己努力的成果(一月份健身 App 數據)。
第三類:數字直覺陷阱 (Math Intuition Traps) — 6 種
數學結果違反直覺。
相關文章: 數字直覺陷阱篇
13. 基準率謬誤 (Base Rate Fallacy)
過度關注特定資訊(99% 準確率),完全忽略了基準率(患病率 1%),讓條件機率的計算完全錯誤。
14. 賭徒謬誤 (Gambler’s Fallacy)
以為獨立隨機事件會「記得」過去並自我修正(連開 10 次正面,下次反面機率更高)。
15. 小數定律 (Law of Small Numbers)
相信小樣本能精確代表整體,過度解讀隨機波動(5 人訪談的結論不能等於 80% 用戶想要某功能)。
16. 辛普森悖論 (Simpson’s Paradox)
整體趨勢和每個子群體的趨勢方向相反,因為各子群體的比重不同(每個平台新版都更好,整體反而更差)。
17. 生態學謬誤 (Ecological Fallacy)
用群體的平均特徵推論個體的性質(富裕地區壽命長,不代表搬去住你就會長壽)。
18. 原子論謬誤 (Atomistic Fallacy)
用少數個體的極端經驗推論群體的規律(一所學校的教學法成功,不代表全縣都適用)。
第四類:因果推論 (Causal Inference) — 5 種
相關性不等於因果性,從觀察到行動之間有具體的陷阱。
相關文章: 因果推論篇
19. 混雜因素 (Confounding Factor)
第三個變數同時導致了 X 和 Y,製造了 X 和 Y 之間的假相關(抽菸同時導致帶打火機和肺癌)。
20. 反向因果 (Reverse Causality)
因果方向弄反了,以為 A 導致 B,實際上是 B 導致了 A(犯罪率高所以警察多,不是警察多所以犯罪率高)。
21. 對撞結構 (Collider Bias)
樣本因兩個條件共同篩選,在已篩選的樣本中製造了原本不存在的假相關(「帥哥通常是渣男」)。
22. 偽相關 (Spurious Correlation)
毫無因果關係的變數呈現強相關,可能是巧合或有共同的幕後混雜因素(冰淇淋銷量 vs. 溺水人數)。
23. 中介變量謬誤 (Mediation Fallacy)
在回歸中控制了中介變量(因果路徑上的中間節點),切斷了你正在研究的因果路徑,結論失去意義。
第五類:認知偏差 (Cognitive Bias) — 7 種
大腦在分析和決策時有系統性的捷徑,讓你走偏。
相關文章: 認知偏差篇
24. 確認偏差(分析階段)(Confirmation Bias)
只搜尋、解讀和記憶那些支持預設觀點的資訊,主動迴避反面證據(Wason 選擇任務)。
25. 錨定效應 (Anchoring Bias)
被第一眼看到的數字(錨點)限制了後續的所有判斷,即使那個數字是任意給出的。
26. 可用性啟發法 (Availability Heuristic)
誤以為容易想起來的事情發生機率更高,因為生動的記憶更易提取(飛機 vs. 開車的危險性)。
27. 代表性啟發法 (Representativeness Heuristic)
用「描述像不像」來判斷機率,忽略了真實的統計基準率(琳達問題)。
28. 麥納馬拉謬誤 (McNamara Fallacy)
只量可以量的,忽略量不到的重要因素;把指標當作目標本身,而不是目標的代理(越戰計算敵軍死亡人數)。
29. 古德哈特定律 (Goodhart’s Law)
一個指標一旦成為目標,它就不再是好的指標。系統開始優化指標本身,而不是指標代表的真實目標。
30. 路徑依賴 (Path Dependence)
初期的決策限制了後續選項,即使新數據顯示方向是錯的,沉沒成本的心理讓人繼續沿著錯誤路徑前進。
第六類:統計方法 (Statistical Methods) — 11 種
你以為工具是對的,但工具的假設被違反了,或你誤解了它的輸出。
相關文章: 統計方法篇
31. 回歸謬誤 (Regression to the Mean)
把均值迴歸(極端值自然回歸平均)誤認為是你的干預措施有效(運動畫刊詛咒、飛行教官的懲罰論)。
32. 多重共線性 (Multicollinearity)
預測變數之間高度相關,導致回歸模型的係數估計不穩定,無法解釋每個變數的獨立影響。
33. 潛在變數偏差 (Omitted Variable Bias)
遺漏了一個同時影響 X 和 Y 的重要變數,模型把它的影響錯誤地分配給了放進模型的其他變數。
34. 過度擬合 (Overfitting)
模型死記硬背了訓練數據的雜訊,在訓練集完美,在新數據上一塌糊塗。
35. 數據洩漏 (Data Leakage)
訓練時用到了在真實預測情境中不可得的資訊,讓模型準確率高達 99% 卻上線即失靈。
36. 前瞻性偏差 (Look-ahead Bias)
在回測或歷史分析中,使用了當時根本不可得的未來數據,讓歷史策略看起來無懈可擊。
37. 外推謬誤 (Extrapolation Bias)
把模型的預測延伸到訓練數據範圍以外,在沒見過的情境或人群上使用,結論不可信。
38. P 值誤解 (P-value Misinterpretation)
把 p 值錯誤地解讀為「虛無假設為假的機率」或「新版本更好的確信度」,而不是「假設虛無假設為真時,這麼極端的數據出現的機率」。
39. 效果量忽視 (Effect Size Neglect)
只看統計顯著性(p < 0.05),忽略效果的實際大小,把微小但「顯著」的差異當作有意義的發現。
40. 檢定力不足 (Underpowered Study)
樣本量太小,無法檢測到真實存在的效應,導致偽陰性(A/B 測試跑幾百人就說「沒效果」)。
41. 多重比較謬誤 (Multiple Comparisons Problem)
同時進行大量統計檢定,純粹基於機率就會出現假陽性;P-Hacking 是主動版本:一直跑到出現顯著結果為止。
第七類:實驗設計 (Experiment Design) — 9 種
你以為實驗是公正的,但它從一開始就不是。
相關文章: 實驗設計篇
42. 霍桑效應 (Hawthorne Effect)
被測者因知道自己被觀察而改變行為,你測到的是「被觀察的人的行為」,不是「真實情境下的行為」。
43. 安慰劑效應 (Placebo Effect)
被測者因相信干預有效而產生了真實的主觀改善,即使干預本身毫無作用。
44. 實驗者期望效應 (Experimenter Expectancy Effect)
研究者的細微行為和措辭暗示了「正確答案」,不知不覺地引導了受試者的回應方向。
45. 干預偏差 (Intervention Bias)
實驗組和對照組在實驗設計的變因以外,還受到了其他不同的對待,無法分離真正的效果。
46. 無回應偏差 (Non-Response Bias)
沒有回應的人,和有回應的人,本質上是不同群體;沉默的大多數可能是你最需要了解的人。
47. 問卷偏差 (Questionnaire Bias)
問題的措辭、順序、選項設計,系統性地引導了答案的方向(「你喜歡這功能嗎?」vs. 「你對這功能有什麼看法?」)。
48. 資訊偏差 (Information Bias)
數據標籤本身就是錯的,標註者的偏見、疲勞、理解差異污染了模型的訓練基礎。
49. 檢測偏差 (Detection Bias)
尋找某現象的努力程度不同,讓發現率的差異被誤認為是現象本身的差異(癌症篩查密度 vs. 癌症發生率)。
50. 排除偏差 (Exclusion Bias)
不當地排除數據點(例如「異常值」),可能把最重要的信號當作雜訊刪掉。
第八類:呈現與報告 (Presentation & Reporting) — 5 種
數據本身沒問題,選擇展示什麼才是問題。
相關文章: 呈現與報告篇
51. 截斷 Y 軸 (Truncated Y-Axis)
讓 Y 軸不從 0 開始,把微小的絕對變化用視覺比例感放大,讓一條平緩的線看起來像火箭升空。
52. 雙軸圖表誤導 (Dual-Axis Manipulation)
用兩個不同刻度的 Y 軸,讓兩個量級完全不同的變數看起來「完美同步」,暗示它們之間有未論證的關聯。
53. 櫻桃挑選 / 德州神槍手 (Cherry-Picking / Texas Sharpshooter)
只展示成功的結果,隱藏失敗的嘗試,讓偶然的成功看起來像必然的規律。
54. 文件抽屜問題 (File Drawer Problem)
負面或無顯著結果的研究被鎖進抽屜不公開,讓公開的結論系統性地偏向正向結果。
55. 發表偏差 (Publication Bias)
整個期刊出版系統偏向接受有顯著正向結果的研究,讓已發表的文獻不代表所有已完成的研究。
使用方式:
- 設計抽樣計畫時:檢查 #1–6
- 設計測量工具時:檢查 #7–12
- 解讀比率和聚合數字時:檢查 #13–18
- 從相關性推因果時:檢查 #19–23
- 做決策或分析數據時:檢查 #24–30
- 使用統計模型或 ML 時:檢查 #31–41
- 設計實驗或問卷時:檢查 #42–50
- 準備報告或讀別人的報告時:檢查 #51–55
系列總覽 · 版本 4.0 · 2026-02-21