關(guān)于AQF小編今天來給大家分享一些新手們在量化投資中應(yīng)該要注意的幾個錯誤區(qū),可能有些新手在操作的時(shí)候就算犯了這些錯誤都不知道,所以小編今天就來跟大家說一下。
1、幸存者偏差(Survivorship bias)
幸存者偏差是投資者面對的很普遍問題之一,而且很多人都知道幸存者偏差的存在,但很少人重視它所產(chǎn)生的效果。我們在回測的時(shí)候傾向于只使用當(dāng)前尚存在的公司,這就意味我們剔除了那些因?yàn)槠飘a(chǎn)、重組而退市的公司的所產(chǎn)生的影響。
在對歷史數(shù)據(jù)進(jìn)行調(diào)整時(shí),一些破產(chǎn)、退市、表現(xiàn)不佳的股票定期都會被剔除。而這些被剔除的股票沒有出現(xiàn)在你策略的股票池里,也就是說對過去做了回測時(shí)只利用了現(xiàn)在成分股的信息,剔除了那些在未來因?yàn)闃I(yè)績或者股價(jià)表現(xiàn)不好而被剔除出成分股中股票的影響。
也就是說當(dāng)我們使用過去30年中表現(xiàn)很好的那些公司進(jìn)行回測時(shí),即便一些公司當(dāng)時(shí)的信用風(fēng)險(xiǎn)高,當(dāng)你知道誰會幸存下來時(shí),于是在信用風(fēng)險(xiǎn)高或者陷入困境時(shí)買入,收益非常高。若考慮進(jìn)那些破產(chǎn)、退市、表現(xiàn)不佳的股票后,結(jié)論則會完全相反,投資高信用風(fēng)險(xiǎn)企業(yè)的收益率長期遠(yuǎn)低于信用穩(wěn)健的企業(yè)。
2、前視偏差(Look-ahead bias)
作為“七宗罪”之一的幸存者偏差是我們站在過去的時(shí)點(diǎn)上無法預(yù)知哪些公司能幸存下來并依舊是今天的指數(shù)成分股,而幸存者偏差僅僅是前視偏差的一種特例。前視偏差是指在回測時(shí),使用了回測當(dāng)時(shí)還不可用或者還沒有公開的數(shù)據(jù),這也是回測中很常見的錯誤。
前視偏差的一個很明顯的例子就體現(xiàn)在財(cái)務(wù)數(shù)據(jù)上,而對財(cái)務(wù)數(shù)據(jù)的修正則更容易造成難以發(fā)現(xiàn)的錯誤。一般來說,每個公司財(cái)務(wù)數(shù)據(jù)發(fā)布的時(shí)間點(diǎn)不同,往往存在滯后。而在回測時(shí)我們往往根據(jù)每個公司數(shù)據(jù)發(fā)布的時(shí)間點(diǎn)去評估公司財(cái)務(wù)狀況。
但是,當(dāng)時(shí)點(diǎn)數(shù)據(jù)(Point-in-time data,簡稱PIT data)不可獲得時(shí),財(cái)務(wù)報(bào)告的滯后假設(shè)往往是錯誤的。
在我們進(jìn)行回測的時(shí)間點(diǎn),終值往往尚無可知,只能使用初始值進(jìn)行分析??赡苡行┤苏J(rèn)為微小的修正并不會影響結(jié)論,但實(shí)際情況顯示:很多宏觀數(shù)據(jù)根據(jù)初值進(jìn)行回歸結(jié)果并不顯著,公司財(cái)務(wù)數(shù)據(jù)的調(diào)整將對選股結(jié)果產(chǎn)生直接影響。
(15).jpg)
3、講故事(The sin of storytelling)
一些人喜歡沒有任何數(shù)據(jù)就開始講故事,做量化的人喜歡拿著數(shù)據(jù)和結(jié)果講故事。兩種情況有很多類似之處,擅長講故事的人或者說擅長解釋數(shù)據(jù)結(jié)果的人往往在得到數(shù)據(jù)之前,內(nèi)心已經(jīng)存在既定的腳本,只需要找到數(shù)據(jù)支撐即可。
回顧1997年-2000年和2000年-2002年兩段時(shí)間的美國科技成分股和Russell 3000指數(shù),我們會發(fā)現(xiàn)一個截然相反的結(jié)論。從1997-2000年間的美國科技成分股來看,利潤率是一個很好的因子,且回測結(jié)果也十分可信,然而如果拉長時(shí)間區(qū)間到2002年,我們會發(fā)現(xiàn)利潤率指標(biāo)不再是一個好的因子。
但從Russell 3000指數(shù)的市場表現(xiàn)來看,我們卻得到了相反的結(jié)論,利潤率指標(biāo)仍然是一個有效的因子,可見,股票池的選取和回測的時(shí)間長短對因子的有效性判斷影響非常大。所以講故事的人并不能得到正確的結(jié)論。
市場中每天都在發(fā)現(xiàn)新的“好因子”,尋找永動機(jī)。能夠發(fā)布出來的策略都是回測表現(xiàn)良好的。雖然講故事的人對歷史的解釋非常動聽,但其對未來的預(yù)測幾乎沒用。
金融經(jīng)濟(jì)中的相關(guān)性和因果性往往很難弄得清楚明白,所以,當(dāng)我們做出和常識相悖或是和原來判斷相符的結(jié)果時(shí),盡可能不要去做一名講故事的人。
所以一些量化金融分析師新手們在操作量化投資的時(shí)候一定要有數(shù)據(jù)支撐。
4、數(shù)據(jù)挖掘(Data mining and data snooping)
數(shù)據(jù)挖掘可以說是目前備受關(guān)注的領(lǐng)域,基于海量的數(shù)據(jù)與計(jì)算機(jī)的算力支持,人們往往希望能夠得到難以察覺的“好因子”。但是原有的金融數(shù)據(jù)還未及海量,且交易數(shù)據(jù)并不滿足“低噪音”的數(shù)據(jù)前提。
》》點(diǎn)擊進(jìn)入學(xué)習(xí)量化投資入門特惠班
有時(shí)數(shù)據(jù)挖掘幾乎是無效的。因此,在構(gòu)建策略或者尋找“好因子”時(shí),我們都應(yīng)該有清晰的邏輯和動機(jī),量化分析只是驗(yàn)證自己的邏輯或動機(jī)的一種工具,而不是尋找邏輯的捷徑。一般而言,我們構(gòu)建策略或?qū)ふ乙蜃拥膭訖C(jī)多源于金融學(xué)基礎(chǔ)理論知識、市場的有效性、行為金融學(xué)等領(lǐng)域。當(dāng)然,我們也并不否認(rèn)數(shù)據(jù)挖掘在量化領(lǐng)域的應(yīng)用價(jià)值。
5、信號衰減、換手率、交易成本
信號衰減指的是一個因子產(chǎn)生后對未來多長時(shí)間的股票回報(bào)有預(yù)測能力。一般來說,高換手率和信號衰減有關(guān)。不同的股票選擇因子往往具有不同的信息衰減特征。越快的信號衰減往往需要更高的換手率去攫取收益。
然而,更高的換手率往往也意味著更高的交易成本。在組合構(gòu)建中添加換手率約束是一個相對簡單的方法,但并不是理想的方法,因?yàn)閾Q手率限制有時(shí)會幫助我們鎖定收益,有時(shí)也會損害既定的組合表現(xiàn)。因此,權(quán)衡信號衰減、交易成本以及模型預(yù)測能力是構(gòu)建投資組合的關(guān)鍵。
那么,如何確定好的調(diào)整頻率呢?我們需要注意的是,收緊換手率約束并不意味著降低調(diào)整頻率。例如,我們常常聽到類似“我們是長期價(jià)值投資者,我們預(yù)期持有股票3-5年。
因此,我們一年調(diào)整一次即可”。但是,信息往往來的很快,我們需要及時(shí)調(diào)整我們的模型和預(yù)期。即使我們的換手率約束很緊,我們?nèi)匀恍枰谶m當(dāng)時(shí)機(jī)加快調(diào)倉頻率。下圖以一個衰減速度很快的因子的極端案例為例進(jìn)行說明。
當(dāng)每天收盤時(shí)買入當(dāng)天表現(xiàn)很差的100個股票,賣出過去的持倉,持續(xù)每日交易,回報(bào)率非常高。這里的錯誤也是前視偏差,還沒收盤我們并不知道當(dāng)天哪些股票表現(xiàn)是很差的,即使用程序化交易,這種策略也是不可行。我們只能以每天開盤價(jià)買入昨天表現(xiàn)很差的100個股票。通過對比,以開盤價(jià)買入的策略幾乎一條直線。
6、異常值(Outliers)
傳統(tǒng)的異常值控制技術(shù)主要包括winsorization和truncation兩種,數(shù)據(jù)的標(biāo)準(zhǔn)化也可近似看做異常值控制的方法之一,標(biāo)準(zhǔn)化技術(shù)有可能對模型的表現(xiàn)產(chǎn)生顯著的影響。比如下圖中的標(biāo)普BMI韓國指數(shù)成分股的利潤率,采用平均值、剔除1%、2%極值等方法的結(jié)果差異很大。宏觀數(shù)據(jù)中經(jīng)常出現(xiàn)此類問題,少數(shù)極值若不做預(yù)處理,會嚴(yán)重影響回歸結(jié)果。
雖然異常值有可能包含著有用的信息,但是大部分情況來看,他們并不包含有用信息。當(dāng)然,對于價(jià)格動量因子來說是例外。
7、非對稱性
一般來說,做多因子策略時(shí)較常用的策略是多空策略,即做多好的股票同時(shí)做空差的股票??上У氖?,并不是所有的因子都是平等的,多數(shù)因子的多空收益特征存在不對稱性,加之做空可能存在的成本和現(xiàn)實(shí)可行性,也給量化投資造成了不小的困擾。
.jpg)




