平均處理效應

平均處理效應（英語：Average Treatment Effect, ATE）通常用於比較不同處理（干預）手段在隨機實驗，政策干預措施或醫學試驗中的效果。換句話說，ATE用於測量處理組（實驗組）與對照組之間平均結果的差異。在一項隨機試驗（即實驗研究）中，可以通過比較處理組與對照組的平均結果，進而從樣本中估算出平均處理效應。但是，研究人員通常用ATE測量他們希望了解的因果參數，這使得ATE無需參考研究設計或估計程序即可定義。在使用隨機分配方法的觀察性研究和實驗性研究設計中，人們都可以用多種方式估算ATE。

一般定義

「處理（treatment）」一詞起源於農業和醫學領域的早期統計分析。該詞現在已被更廣泛地用於自然和社會科學的其他領域，尤其是心理學，政治學和經濟學，比如用於評估公共政策的影響。實驗本身或其引發結果的性質在ATE的估計中相對不重要，也就是說在估算ATE時，通常要求將處理（實驗）應用於部分單位而不是全部單位，但是該實驗的性質（例如藥物、獎勵金、政治廣告）與ATE的定義和估算過程無關。

「處理效應」是指給定的處理或干預措施（例如藥物的施用）與目標結果變量（例如患者的健康狀況）之間的因果關係。因果關係的內曼-魯賓「潛在結果框架」根據兩個「潛在結果」為每個個體定義了處理效應。處理組和對照組的單位會顯示不同結果，「處理效應」則是這兩個潛在結果之間的差異。然而，這種個體水平的處理效應是難以被觀察到的，因為個體單位只能位於處理組和對照組之一，而不能同時位於兩者之內。對處理的隨機分配可確保在大量的實驗迭代中，分配給處理組的單位與分配給對照組的單位保持一致。實際上，兩組中的單位都存在相同的協變量分佈和潛在結果。因此，處理組的平均結果可作為控制組平均結果的反事實條件。這兩個平均值之間的差異就是ATE，它是對無法觀察到的個體水平處理效果分佈的集中趨勢的估計。^[1] 如果樣本是從總體中隨機構成的，則樣本ATE（縮寫為SATE）也是群體ATE（縮寫為PATE）的估計值。 ^[2]

雖然實驗可以確保預期的結果（和所有協變量）在處理組和對照組中均等分佈，但在觀察性研究中情況並非如此。在一項觀察性研究中，處理組和控制組的單位並非隨機分配，因此其單位分配可能取決於未觀察到的，或無法被觀察到的因素。已觀察到的因素可以被統計控制（例如，通過回歸或匹配），但是未觀察到的因素可能被干預措施影響，任何ATE估計都可能會被這些未觀察到的因素混淆。

正式定義

為了正式定義平均處理效應（ATE），我們需要定義兩個潛在結果： $y_{0}(i)$ 為單位 $i$ 未被處理時的結果變量值， $y_{1}(i)$ 為單位 $i$ 接受處理時的結果變量值。例如， $y_{0}(i)$ 代表實驗中未接受藥物的受試者的健康狀況， $y_{1}(i)$ 代表實驗中接受藥物的受試者的健康狀況。

此時，受試者 $i$ 的處理效應可以被表示為 $y_{1}(i)-y_{0}(i)=\beta (i)$ 。通常情況下，不同受試者的處理效應不必保持一致。平均處理效應可以表示如下：

{\text{ATE}}={\frac {1}{N}}\sum _{i}(y_{1}(i)-y_{0}(i))

即「平均處理效應」為所有受試者「處理效應」的平均值。

如果在一個有代表性的大型樣本中，我們可以觀察到每個受試者的 $y_{1}(i)$ 和 $y_{0}(i)$ ，那我們便可通過求出樣本中 $y_{1}(i)-y_{0}(i)$ 的平均值來估計ATE。然而因為每個受試者無法同時位於處理組和對照組，我們無法在同一受試者身上同時觀察到 $y_{1}(i)$ 和 $y_{0}(i)$ 。例如，在之前的藥物實驗中，我們只能在接受藥物的受試者身上觀察到 $y_{1}(i)$ ，在未接受藥物的受試者身上觀察到 $y_{0}(i)$ 。這是測量處理效應過程中的最大問題，對該問題的研究也促進了許多估計方法的誕生。

估計方法

根據數據與數據的具體情況，許多統計方法可以被用於估計ATE。以下是最為常用的幾種：

自然實驗
雙重差分法
回歸不連續設計
傾向評分匹配
工具變量估計法

案例

某群體中所有個體均為失業狀態，研究者希望對該群體中一部分人施加政策影響（處理組），另一部分人則維持原狀（對照組）。研究者希望通過該實驗觀察到一項就業追蹤計劃對失業期長度的影響。接受政策干預的人群，他們的失業期可以縮短多少？在該案例中，平均處理效應（ATE）即為處理組與對照組人群平均失業期長度之差。

在該案例中，如果ATE為正值，則說明該政策會延長失業期。如果ATE為負值，則說明該政策會縮短失業期。如ATE為零，則表示該政策沒有產生正面或負面影響。我們需要通過推論統計來判斷ATE是否顯著不為零。

因為ATE是一個表示平均影響的參數，所以無論ATE為正或負，都不足以判斷一項處理（干預）對單個受試者的影響。例如，即便ATE在一個群體中表現為正，在該群體中仍可能有部分單位會受到負面影響。

處理效應的異質性

如果一項處理（干預）對不同個體的影響不同，則該情況被稱為「異質性」。例如，在之前的就業實驗中，就業追蹤計劃對男性和女性，或不同地區居民的影響有差異。針對這種情況，我們可以將數據分組，進而觀察各組ATE的差異。但該方法存在一定問題，其中之一是分組後各組的數據會少於整體數據，如果研究者在收集數據時沒有考慮分組研究，分組後各組的數據量可能無法支持異質性研究。

使用隨機森林算法可以檢測處理結果的異質性。 ^[3] ^[4]

參考文獻

^ Holland, Paul W. Statistics and Causal Inference. J. Amer. Statist. Assoc. 1986, 81 (396): 945–960. JSTOR 2289064. doi:10.1080/01621459.1986.10478354.
^ Imai, Kosuke; King, Gary; Stuart, Elizabeth A. Misunderstandings Between Experimentalists and Observationalists About Causal Inference. J. R. Stat. Soc. Ser. A. 2008, 171 (2): 481–502. doi:10.1111/j.1467-985X.2007.00527.x.
^ 存档副本. [2020-09-10]. （原始內容存檔於2020-08-06）.
^ 存档副本. [2020-09-10]. （原始內容存檔於2020-09-18）.

拓展閱讀

Wooldridge, Jeffrey M. Introductory Econometrics: A Modern Approach. Mason, OH: Thomson South-Western. 2013: 438–443. ISBN 978-1-111-53104-1.

[1] Holland, Paul W. Statistics and Causal Inference. J. Amer. Statist. Assoc. 1986, 81 (396): 945–960. JSTOR 2289064. doi:10.1080/01621459.1986.10478354.

[2] Imai, Kosuke; King, Gary; Stuart, Elizabeth A. Misunderstandings Between Experimentalists and Observationalists About Causal Inference. J. R. Stat. Soc. Ser. A. 2008, 171 (2): 481–502. doi:10.1111/j.1467-985X.2007.00527.x.

[het-paper-3] 存档副本. [2020-09-10]. （原始內容存檔於2020-08-06）.

[het-blog-post-4] 存档副本. [2020-09-10]. （原始內容存檔於2020-09-18）.

[1]

[2]

[3]

[4]