最近在準備大專生論文計畫,其中文獻回顧是重要的一環,本文將總結 R. David McLean 與 Jeffrey Pontiff 2012 的經典論文 Does Academic Research Destroy Stock Return Predictability?【本篇文章截至今日被引用超過 1100 次】。
論文總結
如果比較 in-sample、out-of-sample,與 post-publication 這三個時間點,證券市場因子報酬的預測性會逐漸降低 (decay),注意到是逐漸降低,而非消失。
使用同樣的因子,在 In-sample (也就是論文寫作時作者用的回測區間)與 post-publication (文章公布後)時交易,兩者報酬相差 58%。
進一步拆解,在 In-sample 與 out-of-sample 時交易,其報酬會相差 26% ( 即回測時間外交易,報酬降低了 26%); 同時,在 out-of-sample 與 post-publication 時交易,報酬相差 32% (即文章正式發表後交易,報酬比發表前降低了 32%)。
可能的解釋
統計偏誤 (Statistical bias):
26% 就是這個原因的 upper bound。因為 in-sample 與 out-of-sample 報酬的差距就是統計偏誤可以解釋的最大範圍。理性預期 (Rational Expectations):
如果報酬的可預測性 (可被某些因子預測)是因為投資者承擔更多風險,則這個因子在論文公開後預測報酬的能力就不會降低。因為會想承擔風險的人就會去做,不願承擔的人即使知道有這個因子存在,也會因為本身的風險趨避而不使用這個因子。錯誤定價 (Mispricing): 相對的,如果會出現這個因子的原因是因為沒有投資者意識到這個因子的存在,則在論文被公布後,努力做功課的投資者會在讀完論文後使用這個因子操作,則只要聰明的投資者夠來越多,這個因子預測報酬的能力自然會降低。
同樣的,32% 為這個理由的 lower bound (因為 26% 是統計偏誤的 upper bound)。
其他發現
- In-sample 報酬越高與更大的 t 統計量的投資組合,預測報酬的能力下降的越多。
- 如果某因子僅需價格或交易資料,則預測能力下降越快。
例如,投組 A 是用股票流動性 (可以用交易量觀察)、與低異質性的股票 (不需要取得公司財報資料、該公司大戶資料等)組成,則投組 A 未來賺取報酬的能力會下降較快。
主要結果
計量模型
\(R_{it}=\alpha_{i,}+\beta_{1}Post\ Sample\ Dummy_{it}+\beta_{2}Post\ Publication\ Dummy_{it}+e_{it}\)
可以看到這個模型主要有兩個 dummy,下標 t 表示不同時間的資料,如果 t:
- 是在 out-of-sample,則 $Post\ Sample\ Dummy_{it}$ 為 1,反之則為 0。
- 是在 post-publication,則 $Post\ Publication\ Dummy_{it}$ 為 1,反之則為 0。
$\beta_{1}$ 與 $\beta_{2}$ 代表甚麼意思?
表一 (Source: Does Academic Research Destroy Stock Return Predictability?)
如果統計偏誤是因子失效的原因,則 $\beta_{1}$ 會等於 -0.582 (%),$\beta_{2}$ 也會等於 -0.582%。
因為由上圖可以看到 in-sample 的因子平均報酬是 0.582%,因此,$\beta_{1}$ 的 -0.582% 代表統計偏誤完全抵消了因子的報酬預測能力,而 $\beta_{2}$ 也是 -0.582%,代表文章發布後抵銷因子報酬預測能力的值跟 out-of-sample 一樣 (意思就是是否發布文章不影響因子預測報酬的能力)。同理,若公布文章是因子失效的原因,則 $\beta_{1}$ 等於 0,$\beta_{2}$ 等於 -0.582%。
如果統計偏誤與發佈文章都不會造成因子失效,則 $\beta_{1}$ 與 $\beta_{2}$ 均等於 0。
實證結果
此篇文章作者共探討了 6 個不同的迴歸議題,本文介紹最主要的那一個 (文章中 III. Main Results 的 B 部分)
表二 (Source: Does Academic Research Destroy Stock Return Predictability?)
表二有 4 個 columns 【(1)~(4)】:
(1) 與 (2)
作者使用的 97 與 85 個 predictors 【(2) 只有 85 個是因為剔除了 12 個 t 統計量不顯著的 predictors】。可以看到 post-sample 與 post-publication 兩個 dummy 均顯著。
post-sample 係數為 -0.150% (15 b.p.)代表在 out-of-sample 的時間段操作,報酬會減少 15 b.p.,也就是減少約 26% (15 b.p. / 58.2 b.p.,58.2 b.p. 是表一因子的平均報酬)。
同理,post-publication 係數為 -0.337% (33.7 b.p.),代表在 post-publication 的時間段操作,報酬會減少 33.7 b.p.,也就是減少約 58% (33.7 b.p. / 58.2 b.p.)。
表二下方 Null Hypothesis: S=P:
- 這裡用 joint hypothesis 測試 post-sample 與 post-publication 係數是否相同,結果為顯著 (意即拒絕虛無假設 S=P,也就是兩者係數不相同),代表因子失去預測報酬的能力並非全然為統計偏誤的修正。
(3)
第三個 column 增加兩個解釋變數,目的是測量更多 predictor 的 fixed effects。
新增的 S x Mean 變數代表 post-sample 與報酬平均的 interaction,係數值 -0.532% 代表在 in-sample 時間段內報酬平均每增加 1%,在 post-sample 時間段操作的報酬會因而減少 -0.532%,呼應在上文「更多發現」的第一點。
同理,另一解釋變數 P x Mean 變數代表 post-publication 與報酬平均的 interaction,係數值 -0.532% 代表在 in-sample 時間段內報酬平均每增加 1%,在 post-sample 時間段操作的報酬會因而減少 -0.532%,呼應在上文「更多發現」的第一點。
交叉確認: 由 column 3 可以知道,post-sample (S) 係數為 0.157%,S x Mean interaction 項係數為 -0.532%,代表整個 post-sample 的係數其實是: $0.157\%+(-0.5323\%\times0.582\%)=-0.153%$,與 column 1 post-sample 係數值 -0.150% 相近。 也就是說,in-sample 報酬越高,post-publication 越低 (如圖一所示。
圖一 (Source: Does Academic Research Destroy Stock Return Predictability?)
(4)
- 與 (3)相同,一樣在探討 interaction,只是把 in-sample mean 改為 in-sample 的 t 統計量,示意圖如圖二。
圖二 (Source: Does Academic Research Destroy Stock Return Predictability?)