盛夏不等式: 讀後感｜因果經濟學

這本書似乎是科普版的計量經濟學，為瞭解因果推論的細節，我也翻了 Mostly Harmless Econometrics 。儘管看不懂，我還是挺喜歡的。人類明明那麼複雜，這些學者居然還能巧妙地利用自然實驗和工具變數等方式，間接推論關注對象間的因果關係。

想要解決科學問題不能局限於領域內的知識，凡是有機會的方法都該試試。既然微生物分析的設計碰到狀況，那麼便觀摩一下社會科學家怎麼從紊亂的世界中找到規律，看看能不能激發新想法。（但是我也得記住，科普書只是入門而已，不能期待從中得到複雜問題的解答。）

一、相關不等同因果

若一事物隨另一事物的變化而變動，則兩者相關。然而相關不等同因果，為了從相關性推論因果關係，需要排除三種狀況：巧合、混淆因子與倒果為因。

1. 巧合

Tyler Vigen, Spurious Correlations

即兩者的關聯純屬偶然。以「美國小姐的年齡與暖氣設備造成的死亡人數」之間的相關性為例（上圖），由於此案例牴觸常識，而且樣本數只有十一個，所以我們能判斷兩者的相關性純屬巧合。

2. 混淆因子

除了巧合，也可能因為存在同時影響兩件事物的混淆因素，導致兩者看似呈現因果關係。好比說，火災的死傷人數與現場的消防員人數成正比，但因為火勢乃同時影響兩者的混淆因素，所以我們無法透過減少出勤的消防員降低傷亡。

混淆因子 C 導致變數 A 和變數 B 呈虛假的關聯

3. 倒果為因

假如觀察到健身房裡體重過重的人較多，我們無法據此主張「去健身房反而導致體重過重」，因為有可能是「體重過重才去報名健身房」。是以，即便兩件事物具因果關係，也需要判斷何者為因、何者為果。

二、反事實與因果推論的核心思維

綜上所述，兩件事物具有相關性不代表它們有因果關係。儘管有時我們能依據常識與直覺辨識巧合、混淆因子和倒果為因的狀況，但是，如果相關性有合理的解釋，便沒那麼容易判斷因果關係了。

xkcd, Correlation

在科學研究裡，我們面對的往往是陌生或未解的議題。此時，直覺不僅無法發揮作用，甚至會誤導我們的判斷。以腸道微生物研究為例，過往研究已經發現許多和疾病相關的菌群。由於微生物不僅影響營養代謝，也能與宿主免疫系統互動，所以我們或許會把疾病歸咎於失調的腸道生態。

然而，微生物本身也受到宿主的調控，所以我們得留意疾病影響免疫系統，從而改變微生物相的可能性。此外，當混淆因子存在時（例如抗生素，抗生素既能干擾腸道菌，也會引發身體不適等副作用），我們也無法斷言微生物與疾病的因果關係。

因此，要確認因果關係不能仰賴直覺和常識，要透過比較。假如一件事物是另一件事物的成因，那麼可以預期在缺乏前者的情況下，後者將有所不同。反事實 (counterfactual) 即是我們認為的原因沒發生時所產生的結果。

例如，我把自己的低薪歸咎於沒考上台灣大學，那麼在我考上台灣大學的宇宙裡，我的薪水就是與事實相反的反事實。由於事實與反事實之間唯一的差異就是所關注的事物，只要比較事實與假想的反事實，便能評估某件事物的影響，進而判斷兩者的因果關係。

如果如圖右所示，無論我有沒有考到台大都一樣悲劇，表示大學聯考不是我現在境況的原因

然而，事物一旦改變就沒辦法回到原來的狀態了，所以我們只能觀測到事實，沒有辦法觀測反事實。為了克服這問題，必須以近似值逼近反事實，同時認知到個體的因果關係不可知。

比較事實（事物 A + 原因）與反事實（事物 A）能反映因果效應的理由是事實與反事實只差在「原因」。在無法觀測反事實的情況下，只能比較相似的群體（事物 A 和事物 A’），即比較（事物 A + 原因）和（事物 A’ + 誤差）的結果差異。如果誤差夠小，我們仍能從中推論影響的程度。
也因為我們透過比較相似群體在不同情況下的差異來推論因果關係，我們只能推論發生在群體的事情，無法得知前後發生在同一個體身上的事件之間的因果關係。

綜上所述，因果推論的核心思維是比較事實與反事實。在無法觀測反事實的情況下，只能比較相似群體在不同事件影響下的結果。群體間的差異可能會掩蓋事件的影響，誤導因果推論。所以隨機對照、準實驗、世代研究等釐清因果關係的方法，皆旨在創造可以比較的群體。

三、隨機對照試驗

1. 選擇偏誤

比較群體間的差異會混淆因果關係。假如想要探討「男性勇敢告白能否增加追求心上人的機率」，於是招募了勇敢告白組和默默努力組，結果告白組只有條件較好者參加，條件較差且沒自信者多半選了默默組。即使最終發現告白組多數追到心上人，因為兩組沒有比較性，仍無法斷言告白與成功交往的因果關係。

克里斯．伊凡の愛情秘訣

2. 隨機對照試驗與條件不足時的權衡

為了消除選擇差異，得隨機分配研究對象至對照組於實驗組。由於每個研究對象分配到各組的機率一致，能排除混淆因子的干擾。

如果對照組與實驗組有明顯的差異，兩者便無可比較性

3. 自然實驗

儘管隨機對照試驗既有力且直觀，但是礙於倫理、成本和對象數量等理由，有時候沒辦法執行可控的實驗。此時只能觀察既成的事實，從中尋找類似隨機對照實驗的條件以評估兩件事的因果關係。

以「當過兵才算男人」這個假說為例，越戰期間美國的抽籤徵兵制度以近乎隨機的方式把美國男性區分為當過兵和沒當過兵，比較兩群人的差異便能評估服役對性格的影響

不過在採取全民義務兵制的台灣，免役者與役男已有身心狀況與家庭狀況差異。即使嘗試隨機對照試驗，也可能招募不到願意待在實驗組（服役）的人（何況願意服役也是一項混淆因子）。

4. 配對法

如果知道可能的混淆因子，則可以從對照組與實驗組選出混淆因子數值相似的研究對象彼此配對，形成可比性較健全的對照組和實驗組。性別是常見的混淆因子，如果對照組與實驗組的性別比不一可能會誤導因果推論，透過抽選研究對象，可以使兩組性別比一致，確保它們的可比性。

使用配對法須注意，如果要配對的因素是欲探討因果的中間因素，那麼配對會抹去兩者可能存在的因果關係。此外，如果要配對的因素跟結果無關，也可能引進新的干擾。所以要記住配對的目的是增進可比性，如果不划算就該避免使用配對法。

5. 工具變數 (instrumental variables)

除了配對法，還能利用工具變數排除混淆因子的干擾。工具變數是指「不會直接對結果造成影響，但能透過影響原因，間接導致結果」的第三變數。

在下圖中，變數A 和變數 B 的關係受到混淆因子 C 干擾，所以無法直接從變數 A 的比較中得出因果關係。此時可以利用 (1) 不受混淆因子干擾、(2) 只會影響變數 A 的變數 D，來推論變數 A 和變數 B 的因果關係。

能影響變數 A 但不受混淆因子 C 干擾的變數 D，可作為推論變數 A 和變數 B 因果關係的工具變數

假如變數 A 和變數 B 有因果關係，那麼變數 D 即能透過這層關係影響變數 B；反之，變數 B 不受變數 D 影響，變數 A 和變數 B 沒有因果關係。
使用工具變數要留意不能存在同時影響原因、結果和工具變數三者的第四變數。其次工具變數要能影響原因，但不能影響結果（如果會影響結果，那工具變數就是混淆因子了）。
四、差異中的差異

「差異中的差異」是為了評估干預的影響。假設我們想要知道雞精的保健效果，僅比較服用前後的身體狀況是沒辦法得知的，因為我們無法排除身體狀況隨時間的變化（趨勢）以及身體狀況的起伏（均值回歸）。

此時，可以比較喝雞精組的身體狀況變化和沒喝雞精組的身體狀況變化，從差異（干預前後的差異）的差異（干預與未干預的差異）判斷雞精的功效。

差異（干預前後的差異）的差異（干預與否的差異）

然而使用差異中的差異法要確保比較的對象在干預前的變化趨勢一致，不然無法排除趨勢的影響。其次，干預的時間點也不能有其他影響研究對象的因素，否則無法辨識差異的成因。

五、迴歸分析

斷點回歸設計和複回歸分析，前者比較欲探討的事物在臨界值前後是否有顯著差異，後者則是要在控制混淆因子的情況下評估趨勢。作者其實只講了用途，也建議讀者找專書閱讀，所以此處便不多談。

六、結論

由於巧合、混淆因子、倒果為因的狀況，事物相關不等於具有因果關係。因果推論的核心是辨識欲探討的因和果，利用實驗、準實驗、回歸等方式創造出可比較的組別，逼近「比較事實與反事實」得出的結論。

七、延伸閱讀

淘寶網橙迷橙橙於經管之家的回覆

「建模思想非常關鍵，變量間首先必須有經得起推敲的理論與邏輯關係，然後用數據才能驗證。而我們很多的研究往往思想性不足，而技術性有餘。」這則回覆讓我想起進度報告委員給我的建議：「回頭思考問題，不要陷入技術細節而忘記自己追求的答案是什麼。」

因為當初預期會有差異的指標都觀察不到明確的結果，我擔心進度報告什麼東西都沒有會很丟人，所以用暴力法測試了想得到的分組方式和分析方法。然而這麼做現在想想實在很蠢，沒有理論支持分析的話，暴力法只得到大量無法詮釋的數據而已。

既然下定決心做研究，便想清楚要回答什麼問題，謀定而後動。目前，衡量研究成果的指標是我能否對得起我的良心和專業，而不是老師還是其他同學的掌聲或嘲笑，不要因為他人的想法影響自己做研究的步調 (What do I care what other people think?)。

盛夏不等式

讀後感｜因果經濟學