統計謬論完整清單：55 種思維除錯地圖

statistics cognitive-bias data-analysis critical-thinking 2026-02-21

這是 55 種統計謬論的完整索引，按 8 大類排列。每個謬論附上一句話定義和對應文章連結。

第一類：抽樣偏差 (Sampling Bias) — 6 種

你的樣本代表不了你的目標群體。

相關文章： 抽樣偏差篇

1. 倖存者偏差 (Survivorship Bias)

只看到「活下來」的案例，看不到消失的失敗者（沒飛回來的飛機、倒閉的公司、流失的用戶）。

2. 樣本選擇偏差 (Sample Selection Bias)

數據採集過程本身帶有篩選機制，導致樣本系統性偏向特定群體（1936 年《文學文摘》只調查有電話的富人）。

3. 覆蓋偏差 (Coverage Bias)

抽樣框架根本沒有覆蓋到特定族群（線上問卷排除了沒有網路的老年人）。

4. 自選偏差 (Self-Selection Bias)

只有特定意願的人才參與，這群人和沉默大多數本質上不同（App Store 評分以極端好評和差評為主）。

5. 便利抽樣偏差 (Convenience Sampling Bias)

只找身邊容易接觸的人（找同事做 Dogfooding 測試），忽略了他們和真實用戶的差距。

6. 時間窗口偏差 (Time Window Bias)

只在特定時段採樣，選到的是「那個時間點會出現的人」，而不是全體用戶（只測週一上午的 A/B 測試）。

第二類：測量偏差 (Measurement Bias) — 6 種

你測量到的不是你以為測量到的。

相關文章： 測量偏差篇

受訪者傾向給出「符合社會期待」的答案，而不是真實想法（隱私問卷說很在意，實際授權所有權限）。

8. 觀察者偏差 (Observer Bias)

測量者本身的預期污染了測量結果，不是被測者在演戲，而是測量者看錯了（工程師測試自己的 code）。

9. 回憶偏差 (Recall Bias)

依賴不可靠的記憶而非記錄，人類的記憶是重建的，不是錄像機。

10. 工具與測量誤差 (Instrument & Measurement Error)

測量工具本身引入了系統性誤差，或不同工具/版本的測量結果不可比較。

11. 確認偏差（蒐集階段）(Confirmation Bias in Collection)

在數據蒐集階段就只記錄符合預期的觀察，讓數據庫從源頭就帶有選擇性。

12. 時間與季節偏差 (Temporal & Seasonal Bias)

在錯誤的時間點進行測量，或把季節性波動當作自己努力的成果（一月份健身 App 數據）。

第三類：數字直覺陷阱 (Math Intuition Traps) — 6 種

數學結果違反直覺。

相關文章： 數字直覺陷阱篇

13. 基準率謬誤 (Base Rate Fallacy)

過度關注特定資訊（99% 準確率），完全忽略了基準率（患病率 1%），讓條件機率的計算完全錯誤。

14. 賭徒謬誤 (Gambler’s Fallacy)

以為獨立隨機事件會「記得」過去並自我修正（連開 10 次正面，下次反面機率更高）。

15. 小數定律 (Law of Small Numbers)

相信小樣本能精確代表整體，過度解讀隨機波動（5 人訪談的結論不能等於 80% 用戶想要某功能）。

16. 辛普森悖論 (Simpson’s Paradox)

整體趨勢和每個子群體的趨勢方向相反，因為各子群體的比重不同（每個平台新版都更好，整體反而更差）。

17. 生態學謬誤 (Ecological Fallacy)

用群體的平均特徵推論個體的性質（富裕地區壽命長，不代表搬去住你就會長壽）。

18. 原子論謬誤 (Atomistic Fallacy)

用少數個體的極端經驗推論群體的規律（一所學校的教學法成功，不代表全縣都適用）。

第四類：因果推論 (Causal Inference) — 5 種

相關性不等於因果性，從觀察到行動之間有具體的陷阱。

相關文章： 因果推論篇

19. 混雜因素 (Confounding Factor)

第三個變數同時導致了 X 和 Y，製造了 X 和 Y 之間的假相關（抽菸同時導致帶打火機和肺癌）。

20. 反向因果 (Reverse Causality)

因果方向弄反了，以為 A 導致 B，實際上是 B 導致了 A（犯罪率高所以警察多，不是警察多所以犯罪率高）。

21. 對撞結構 (Collider Bias)

樣本因兩個條件共同篩選，在已篩選的樣本中製造了原本不存在的假相關（「帥哥通常是渣男」）。

22. 偽相關 (Spurious Correlation)

毫無因果關係的變數呈現強相關，可能是巧合或有共同的幕後混雜因素（冰淇淋銷量 vs. 溺水人數）。

23. 中介變量謬誤 (Mediation Fallacy)

在回歸中控制了中介變量（因果路徑上的中間節點），切斷了你正在研究的因果路徑，結論失去意義。

第五類：認知偏差 (Cognitive Bias) — 7 種

大腦在分析和決策時有系統性的捷徑，讓你走偏。

相關文章： 認知偏差篇

24. 確認偏差（分析階段）(Confirmation Bias)

只搜尋、解讀和記憶那些支持預設觀點的資訊，主動迴避反面證據（Wason 選擇任務）。

25. 錨定效應 (Anchoring Bias)

被第一眼看到的數字（錨點）限制了後續的所有判斷，即使那個數字是任意給出的。

26. 可用性啟發法 (Availability Heuristic)

誤以為容易想起來的事情發生機率更高，因為生動的記憶更易提取（飛機 vs. 開車的危險性）。

27. 代表性啟發法 (Representativeness Heuristic)

用「描述像不像」來判斷機率，忽略了真實的統計基準率（琳達問題）。

28. 麥納馬拉謬誤 (McNamara Fallacy)

只量可以量的，忽略量不到的重要因素；把指標當作目標本身，而不是目標的代理（越戰計算敵軍死亡人數）。

29. 古德哈特定律 (Goodhart’s Law)

一個指標一旦成為目標，它就不再是好的指標。系統開始優化指標本身，而不是指標代表的真實目標。

30. 路徑依賴 (Path Dependence)

初期的決策限制了後續選項，即使新數據顯示方向是錯的，沉沒成本的心理讓人繼續沿著錯誤路徑前進。

第六類：統計方法 (Statistical Methods) — 11 種

你以為工具是對的，但工具的假設被違反了，或你誤解了它的輸出。

相關文章： 統計方法篇

31. 回歸謬誤 (Regression to the Mean)

把均值迴歸（極端值自然回歸平均）誤認為是你的干預措施有效（運動畫刊詛咒、飛行教官的懲罰論）。

32. 多重共線性 (Multicollinearity)

預測變數之間高度相關，導致回歸模型的係數估計不穩定，無法解釋每個變數的獨立影響。

33. 潛在變數偏差 (Omitted Variable Bias)

遺漏了一個同時影響 X 和 Y 的重要變數，模型把它的影響錯誤地分配給了放進模型的其他變數。

34. 過度擬合 (Overfitting)

模型死記硬背了訓練數據的雜訊，在訓練集完美，在新數據上一塌糊塗。

35. 數據洩漏 (Data Leakage)

訓練時用到了在真實預測情境中不可得的資訊，讓模型準確率高達 99% 卻上線即失靈。

36. 前瞻性偏差 (Look-ahead Bias)

在回測或歷史分析中，使用了當時根本不可得的未來數據，讓歷史策略看起來無懈可擊。

37. 外推謬誤 (Extrapolation Bias)

把模型的預測延伸到訓練數據範圍以外，在沒見過的情境或人群上使用，結論不可信。

38. P 值誤解 (P-value Misinterpretation)

把 p 值錯誤地解讀為「虛無假設為假的機率」或「新版本更好的確信度」，而不是「假設虛無假設為真時，這麼極端的數據出現的機率」。

39. 效果量忽視 (Effect Size Neglect)

只看統計顯著性（p < 0.05），忽略效果的實際大小，把微小但「顯著」的差異當作有意義的發現。

40. 檢定力不足 (Underpowered Study)

樣本量太小，無法檢測到真實存在的效應，導致偽陰性（A/B 測試跑幾百人就說「沒效果」）。

41. 多重比較謬誤 (Multiple Comparisons Problem)

同時進行大量統計檢定，純粹基於機率就會出現假陽性；P-Hacking 是主動版本：一直跑到出現顯著結果為止。

第七類：實驗設計 (Experiment Design) — 9 種

你以為實驗是公正的，但它從一開始就不是。

相關文章： 實驗設計篇

42. 霍桑效應 (Hawthorne Effect)

被測者因知道自己被觀察而改變行為，你測到的是「被觀察的人的行為」，不是「真實情境下的行為」。

43. 安慰劑效應 (Placebo Effect)

被測者因相信干預有效而產生了真實的主觀改善，即使干預本身毫無作用。

44. 實驗者期望效應 (Experimenter Expectancy Effect)

研究者的細微行為和措辭暗示了「正確答案」，不知不覺地引導了受試者的回應方向。

45. 干預偏差 (Intervention Bias)

實驗組和對照組在實驗設計的變因以外，還受到了其他不同的對待，無法分離真正的效果。

46. 無回應偏差 (Non-Response Bias)

沒有回應的人，和有回應的人，本質上是不同群體；沉默的大多數可能是你最需要了解的人。

47. 問卷偏差 (Questionnaire Bias)

問題的措辭、順序、選項設計，系統性地引導了答案的方向（「你喜歡這功能嗎？」vs. 「你對這功能有什麼看法？」）。

48. 資訊偏差 (Information Bias)

數據標籤本身就是錯的，標註者的偏見、疲勞、理解差異污染了模型的訓練基礎。

49. 檢測偏差 (Detection Bias)

尋找某現象的努力程度不同，讓發現率的差異被誤認為是現象本身的差異（癌症篩查密度 vs. 癌症發生率）。

50. 排除偏差 (Exclusion Bias)

不當地排除數據點（例如「異常值」），可能把最重要的信號當作雜訊刪掉。

第八類：呈現與報告 (Presentation & Reporting) — 5 種

數據本身沒問題，選擇展示什麼才是問題。

相關文章： 呈現與報告篇

51. 截斷 Y 軸 (Truncated Y-Axis)

讓 Y 軸不從 0 開始，把微小的絕對變化用視覺比例感放大，讓一條平緩的線看起來像火箭升空。

52. 雙軸圖表誤導 (Dual-Axis Manipulation)

用兩個不同刻度的 Y 軸，讓兩個量級完全不同的變數看起來「完美同步」，暗示它們之間有未論證的關聯。

53. 櫻桃挑選 / 德州神槍手 (Cherry-Picking / Texas Sharpshooter)

只展示成功的結果，隱藏失敗的嘗試，讓偶然的成功看起來像必然的規律。

54. 文件抽屜問題 (File Drawer Problem)

負面或無顯著結果的研究被鎖進抽屜不公開，讓公開的結論系統性地偏向正向結果。

55. 發表偏差 (Publication Bias)

整個期刊出版系統偏向接受有顯著正向結果的研究，讓已發表的文獻不代表所有已完成的研究。

使用方式：

設計抽樣計畫時：檢查 #1–6
設計測量工具時：檢查 #7–12
解讀比率和聚合數字時：檢查 #13–18
從相關性推因果時：檢查 #19–23
做決策或分析數據時：檢查 #24–30
使用統計模型或 ML 時：檢查 #31–41
設計實驗或問卷時：檢查 #42–50
準備報告或讀別人的報告時：檢查 #51–55

系列總覽 · 版本 4.0 · 2026-02-21