閱讀原文請點擊鏈接:https://www.ricequant.com/community/topic/3791/?utm_source=jianshu
作者:戴宇、小湖
上一篇介紹了單因子檢驗是因子分析前重要的一個步驟,是構(gòu)建因子庫、建立因子模型的基礎,這篇報告首先對常見估值因子進行初步的檢驗。
第一篇.估值因子的分析
估值因子是一類具有特色的風格因子,本報告選取了PE,PB,PCF,PS,PEG五個常見的估值因子進行因子分析,測試區(qū)間是2014年1月1日~2017年8月1日,測試數(shù)據(jù)是全市場股票的月數(shù)據(jù),主要從有效性和穩(wěn)定性兩個角度分析因子。
通過此次報告可以初步得出以下結(jié)論:
[if !supportLists]1、[endif]此次選擇的五個估值類因子的行業(yè)分布存在一定相似性,在銀行、鋼鐵行業(yè)的暴露度普遍偏低,在通信行業(yè)、醫(yī)藥生物行業(yè)的估值因子的暴露度較高。
[if !supportLists]2、[endif]通過觀察因子暴露度在不同市值區(qū)間的分布差異,估值類因子與市值有輕微的遞減關(guān)系,說明因子暴露度與市值存在一定關(guān)聯(lián)。
[if !supportLists]3、[endif]IC和RANK-IC兩種計算因子暴露度與收益率相關(guān)系數(shù)的方式有差異,RANK-IC的顯著性水平較低(p值較低),RANK-IC的絕對值較大,在時間序列上波動性較大。
[if !supportLists]4、[endif]PE因子暴露度與收益率的負相關(guān)性的關(guān)系較明顯,并且這種趨勢持續(xù)時間較長,peg因子顯著的狀態(tài)切換比例和同向比例均較大,說明大部分情況下peg因子的相關(guān)系數(shù)較顯著,但是難以判斷peg因子與收益率關(guān)系的方向。
[if !supportLists]5、[endif]所選估值因子中PE、PCF、PEG的同向顯著比例普遍比狀態(tài)切換顯著比例大,說明在這三個因子最近一年存在趨勢性。
[if !supportLists]6、[endif]所選估值因子的負相關(guān)顯著比例比正相關(guān)顯著比例高,在最近一年的IC和RANK-IC的6月移動平均值都小于零,并且在負半軸上的絕對值有增大的趨勢,說明在最近一年估值因子暴露度與因子收益率的大部分時間可能存在負相關(guān)關(guān)系。
[if !supportLists]7、[endif]PB、PEG因子的IC分布直方圖處于小于零的部分大于大于零的部分。
常見估值因子及其描述
表1

一、因子暴露度在不同行業(yè)的分布差異:
因子在行業(yè)之間的平均暴露度存在差距,以2017年8月1日為例。
圖1到5展示了因子暴露度在不同行業(yè)的分布差異
通過對比各個因子暴露度的行業(yè)分布差異,銀行行業(yè)平均暴露度最小的因子有PCF,PE,PB。各個因子在鋼鐵行業(yè)的平均暴露度均較小,在通信行業(yè)的平均暴露度都比較大。
圖1展示了PB因子在食品飲料行業(yè)的平均暴露度最大,在鋼鐵、銀行行業(yè)的平均暴露度最小。
圖2展示了PE因子在通信行業(yè)的平均暴露度最大,在銀行行業(yè)的平均暴露度最小
圖3展示了PEG因子在一些綜合性的股票中平均暴露度較大,在電氣設備行業(yè)的平均暴露度最大,在鋼鐵行業(yè)的平均暴露度最小。
圖4展示了PS因子在休閑服務行業(yè)的平均暴露度最大,在鋼鐵行業(yè)的平均暴露度最小。
圖5展示了PCF因子在通信行業(yè)的平均暴露度最大,在銀行行業(yè)的平均暴露度最小。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖1PB行業(yè)分布差異

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖2PE行業(yè)分布差異

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖3PEG行業(yè)分布差異

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖4PS行業(yè)分布差異

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖5PCF行業(yè)分布差異
二、因子暴露度在不同市值區(qū)間的分布差異
圖6到圖10展示了因子暴露度在不同市值區(qū)間的分布差異
因子暴露度在橫截面和時間序列上均存在差異,即不同時間的同一個因子的暴露度存在差異,不同市值區(qū)間的因子暴露度也存在不同,此次報告中的5個因子都在某一時間段與市值有遞減關(guān)系。
圖6展示了PB因子在2015年的普遍暴露度較高,并且可以看出一般低市值股票具有較高的PB暴露度。
圖7展示了PCF因子在2015年和2016年的暴露度較高,在2014年和2017年,一般低市值股票具有較高的PCF暴露度。
圖8展示了PE因子在2015年和2016年的暴露度較高,在2014年和2017年的有明顯的市值區(qū)分,與市值有遞減的關(guān)系
圖9展示了PEG因子在2015年和2016年的暴露度較高,在2017年與市值有遞減的關(guān)系。
圖10展示了PS因子在2014年暴露度較低,在2014年和2015年市值區(qū)間之間沒有顯著的差異,在2016年和2017年與市值有稍微的遞減關(guān)系

圖6PB市值分布差異

圖7PCF市值分布差異

圖8PE市值分布差異

圖9PEG市值分布差異

圖10PS市值分布差異
三、因子暴露度的相關(guān)關(guān)系和自相關(guān)性
因子暴露度的相互關(guān)系
圖11和圖12展示了因子暴露度的平均相關(guān)性
基于2014年1月1日到2017年8月1日PB、PE、PCF、PS、PEG的暴露度數(shù)據(jù),計算得到各因子之間的平均相關(guān)性如圖11、圖12所示。可以看出估值大類因子下的細分因子之間相關(guān)性都沒有預期的高,其中相關(guān)性比較明顯的是PCF和PE,PCF和PS,PCF和PB因子。
[if !vml]
[endif]

圖11估值因子暴露度的pearson相關(guān)性

圖12估值因子暴露度的spearman相關(guān)性
因子暴露度的自相關(guān)關(guān)系
圖13到圖17展示了因子暴露度的自相關(guān)系數(shù)
同時,我們通過計算各子類因子的自相關(guān)性發(fā)現(xiàn):各因子的自相關(guān)性絕大多數(shù)都是穩(wěn)定衰減的;圖15展示了PEG因子的自相關(guān)性的衰減速率較快,在第一期到第七期自相關(guān)性急速下降;圖17展示了PS因子的自相關(guān)性下降最緩慢,而且通過spearman計算出的自相關(guān)數(shù)值普遍高于pearson。

圖13PB因子的暴露度自相關(guān)性

圖14PCF因子的暴露度自相關(guān)性

圖15PEG因子的暴露度自相關(guān)性

圖16PE因子的暴露度自相關(guān)性

圖17PS因子的暴露度自相關(guān)性
四、因子有效性和穩(wěn)定性的初步分析
IC:股票的因子暴露度與下期股票收益率之間的pearson相關(guān)系數(shù)
RANK-IC:股票的因子暴露度與下期股票收益率之間的spearman相關(guān)系數(shù)
IR:對應相關(guān)系數(shù)(IC/RANK-IC)的均值與標準差的比值
其中IC和RANK-IC兩種指標的計算邏輯存在以下不同:
IC主要衡量因子和收益率之間的線性關(guān)系,因子暴露度需要是正態(tài)的。
RANK-IC主要衡量分級定序之后因子和收益率之間的相關(guān)程度的統(tǒng)計量,因子暴露度不要求是正態(tài)分布的,即不對變量的分布做假設,當數(shù)據(jù)存在異常值的時候較適用,但是由于計算邏輯較復雜,耗費時間較長。
通過對比兩類相關(guān)系數(shù),一般來說,相關(guān)系數(shù)的絕對值越大,意味著因子預測預期收益率的能力越強,由于樣本點的實際分布和正態(tài)分布相差較大,所以也計算了spearman秩相關(guān)系數(shù),IC衡量線性相關(guān)程度,RANK-IC衡量順序相關(guān)程度。
這篇報告的因子檢驗主要從穩(wěn)定性和有效性兩個角度進行詮釋。
4.1因子相關(guān)系數(shù)分析
4.1.1因子的IC/RANK-IC統(tǒng)計量和分布
表2展示了因子IC和RANK-IC的統(tǒng)計量,包括因子IC均值,IC標準差,NORMAL-IR,RANK-IC均值,RANK-IC標準差,RANK-IR。
使用RANK-IC或者IC計算因子暴露度和收益率的相關(guān)系數(shù),只在數(shù)值上存在細微區(qū)別,RANK-IC的平均值絕對值比IC的平均值絕對值大,RANK-IC的標準差也比IC的標準差大。
PE因子IC和RANK-IC均值的絕對值最大,但是其標準差也較大;PEG因子IC和RANK-IC的標準差最小,但其RANK-IC的均值較小;說明沒有一個因子在有效性和穩(wěn)定性兩個方面都可以占據(jù)優(yōu)勢。
表2

圖18到27展示了因子IC/RANK-IC的分布直方圖
PB、PEG這兩個因子看出相關(guān)系數(shù)的分布大部分處于負半軸上。而對于PE、PS、PCF這三個因子,RANKIC和IC的分布在正負區(qū)域上分布并不存在很大的區(qū)別,說明這三個因子穩(wěn)定性較弱。

圖18PB因子的IC分布直方圖

圖19PB因子的RANK-IC分布直方圖

圖20PCF因子的IC分布直方圖

圖21PCF因子的RANK-IC分布直方圖

圖22PE因子的IC分布直方圖

圖23PE因子的RANK-IC分布直方圖

圖24PEG因子的IC分布直方圖

圖25PEG因子的RANK-IC分布直方圖

圖26PS因子的IC分布直方圖

圖27PS因子的RANK-IC分布直方圖
4.1.2因子的IC/RANK-IC時間序列
圖28到圖42展示了因子IC/RANK-IC時間序列圖,其中移動平均是窗口大小為6
圖28和圖29展示了PB因子在2015年到2016年之間的IC波動頻繁,PB因子的暴露度在市場不穩(wěn)定的時候波動較大,圖29展示了PB因子的RANK-IC在2017年大部分都小于0,說明PB因子暴露度和收益率存在較明顯的負相關(guān)趨勢性。
圖31和圖32展示了PCF因子的移動平均在負半軸上的絕對值增大,PCF因子近期暴露度和收益率存在負相關(guān)趨勢性。
圖34和圖35展示了PE因子的IC和RANK-IC的數(shù)值上較大。
圖37和圖38展示了PEG因子的移動平均值在負半軸上的絕對值增大,近期PEG因子相關(guān)性存在較強的負向趨勢。
圖40和圖41展示了PS因子的IC和RANK-IC的波動頻繁,可能存在噪音。
綜合圖30/33/36/39/42,在PB、PE、PCF、PS、PEG五個因子的大部分時間段,IC和RANKIC沒有明顯的差異,當相關(guān)系數(shù)在數(shù)量上增大的時候,RANKIC和IC的差異會擴大。

圖28PB因子的IC時間序列和IC的移動平均

圖29PB因子的RANK-IC時間序列和RANK-IC的移動平均

圖30PB因子的IC和RANK-IC對比

圖31PCF因子的IC時間序列和IC的移動平均

圖32PCF因子的RANK-IC時間序列和RANK-IC的移動平均

圖33PCF因子的IC和RANK-IC對比

圖34PE因子的IC時間序列和IC的移動平均

圖35PE因子的RANK-IC時間序列和RANK-IC的移動平均

圖36PE因子的IC和RANK-IC對比

圖37PEG因子的IC時間序列和IC的移動平均

圖38PEG因子的RANK-IC時間序列和RANK-IC的移動平均

圖39PEG因子的IC和RANK-IC對比

圖40PS因子的IC時間序列和IC的移動平均

圖41PS因子的RANK-IC時間序列和RANK-IC的移動平均

圖42PS因子的IC和RANK-IC對比
4.1.3IC/RANK-IC相關(guān)的自定義比例指標
一般而言,市場風格不是一層不變的,而是輪動的,所以所求的IC或者RANK_IC的相關(guān)系數(shù)會存在符號上的切換,所以在選擇因子的時候,一般是計算相關(guān)系數(shù)正負的比例,選擇相關(guān)比例較高的一個方向作為因子在未來的預測方向。這里選擇了正相關(guān)顯著比例、負相關(guān)顯著比例、同向顯著比例和狀態(tài)切換比例作為衡量因子方向的指標。
指標的相關(guān)定義如下:
顯著:是指相關(guān)系數(shù)的顯著性水平小于一定閾值的樣本。
正相關(guān)顯著比例:顯著的正相關(guān)系數(shù)占樣本的比例
負相關(guān)顯著比例:顯著的負相關(guān)系數(shù)占樣本的比例
狀態(tài)切換顯著比例:前后兩期中相關(guān)系數(shù)符號相反占樣本的比例。
同向顯著比例:前后兩期中相關(guān)系數(shù)符號相同占樣本的比例。
所以:假如同向顯著比例占上風,則意味著該段時間內(nèi)因子的風格延續(xù)性較強,可以使用動態(tài)權(quán)重來調(diào)整因子的權(quán)重;同理,如果狀態(tài)切換比例占上風,對于因子的賦權(quán)應該使用靜態(tài)權(quán)重。
以最近一年時間即2016年8月1日到2017年8月1日的因子數(shù)據(jù)為研究對象
圖43、44展示了PE,PEG,PCF,PB,PS五個因子的IC顯著的狀態(tài)切換比例,同向顯著比例,負相關(guān)比例,正相關(guān)比例。
可以看出PE因子的IC同向顯著比例較高,并且IC負相關(guān)顯著比例高,說明PE因子暴露度與收益率可能存在負相關(guān)關(guān)系,并且這種關(guān)系可能持續(xù)下去。

圖43IC自定義比例指標

圖44RANK-IC自定義比例指標
4.1.4IC/RANK-IC相關(guān)的自定義趨勢指標和顯著指標
此次報告衡量因子是否顯著的標準有兩個條件
1、相關(guān)系數(shù)的正負顯著比例至少有一項大于閾值A,
2、相關(guān)系數(shù)的正負顯著比例之和大于閾值B,
此次報告中閾值A = 0.35,閾值B= 0.6
因子是否具有趨勢性:
因子具有趨勢性:同向顯著比例大于顯著狀態(tài)切換比例
表3IC/RANK-IC相關(guān)的趨勢/顯著指標

4.2收益率分析
圖45展示了PB因子第四組分組收益累計最高,其他幾組之間沒有顯著差異,并且這種差異是從2016年開始顯現(xiàn)出來的,說明最近一年的暴露度和收益的相關(guān)關(guān)系可能出現(xiàn)反轉(zhuǎn)。觀察PB因子的IC時間序列圖也可以看出IC在2016年開始轉(zhuǎn)為正值。
圖46展示了PCF可以看出在牛市第一組和第四組因子組合可以獲得快速上漲的收益,而第三組表現(xiàn)最差。通過對比IC和RANK-IC的時間序列在2015年移動均值的絕對值有減小的趨勢,說明暴露度和收益率的相關(guān)系數(shù)出現(xiàn)波動,也說明了PCF的穩(wěn)定性減弱。
圖47展示了PE因子的第一組和第三組累計收益較高,兩者之間沒有顯著差異,這種差異從2015年開始顯現(xiàn)出來,RANK-IC時間序列的移動平均值從2015年之后大部分處于小于零的部分,說明第一、三組和其他幾組的累計收益的差異有可能擴大。
圖48展示了PEG的因子累計收益其他幾組沒有顯著差異,第4組表現(xiàn)較差。
圖49展示了PS因子第三組累計收益最低,并且這種差異從2015年開始;IC和RANK-IC的移動平均值在2015年位于零值附近波動,說明因子暴露度和收益率之間沒有固定的相關(guān)方向,PS因子在牛市和股災期間的穩(wěn)定性較差。
綜上所述PB、PS、PE、PEG、PCF因子暴露度與收益沒有線性關(guān)系。

圖45PB因子的分組累計收益

圖46PCF因子的分組累計收益

圖47PE因子的分組累計收益

圖48PEG因子的分組累計收益

圖49PS因子的分組累計收益
五、小結(jié)
通過上面的分析可以得出以下結(jié)論:
1、此次所選的五個因子與收益率在長期上都存在負相關(guān)關(guān)系
/2、在時間序列上,PEG因子的暴露度相對其他因子較為穩(wěn)定,在近一年表現(xiàn)出較強的趨勢性/
3、PE因子的負相關(guān)性比較顯著,并且有一定的趨勢性,通過觀察RANK-IC的同向顯著比例和負相關(guān)顯著比例,PE因子可能比其他因子更加有負向的趨勢性,穩(wěn)定性更好/
4、PB因子的分布有明顯的左偏,并且分布比較規(guī)范,但是穩(wěn)定性表現(xiàn)一般。
5、PCF、PS因子近期的穩(wěn)定性和有效性表現(xiàn)一般