《Advances in Financial Machine Learning》讀書札記 (一)

此書源于一位朋友的推薦,看過標題后,覺得是又一本介紹行業(yè)發(fā)展的綜述,遂定義為某周末咖啡廳的伴讀。真正開卷之時,是在清明出行的高鐵,隨手翻看百頁后, 竟覺得是學術、實踐雙優(yōu)同行的深思之言,稱得上近幾年同類書中排前三的精華,書中大有可咀嚼、印證、深思之處,于是就有了這個系列的讀書筆記。原書是英文寫成,我的讀書筆記,盡量用中文,一來上讓自己用母語將自覺可深思一遍可以自動降速閱讀,達到印證推敲的精讀定位,二來也為一些不了解此書的國內同道省下些閱讀時間,并方便與同道討論。
前言 第一章 Financial Machine Learning as a Distinct Subject--作為一個獨特學科的金融機器學習

  1. 與投資有關的書可分為兩類,第一類出自教學經(jīng)驗豐富卻從未在市場中實踐自己教授內容的教書先生之手,此類書中有用優(yōu)雅和數(shù)學公式描述從未存在過的世界,一個定理在邏輯上合理并不能保證其在現(xiàn)實中合用;另一類作者的詮釋缺乏嚴格的理論基礎,這些人用不適用的數(shù)學工具描述自己觀察到的市場,造成模型的過似和不適用。本書的一大動因就是填充學術與實踐之間的割裂。
    旁注:拿走江湖賣藝而言,前一類人是“能說不能練嘴把式”;后一類人,有些是由于思維不足夠完善,錯把特定時期的市場走勢當一般規(guī)律,此之謂“假把式”,有些像一些傳統(tǒng)的主觀交易員,其交易依據(jù)更多是盤感和直覺,而沒辦法把自己的交易經(jīng)驗用公式和模型描述出來,此之謂,“光練不說傻把式”,當然也有很多傳統(tǒng)交易員秉承“知者不言”的華爾街古訓,是不愿意說的。說到學術界與實踐的脫節(jié),近日看到某大學還在教諸如:int a=1,b=2,c=3;
    printf(''%d,%d,%d,%d'',++a||++b&&++c,a,b,c)輸出的結果是啥之類的問題,也可一嘆吧(也許是筆者才疏學淺,不理解此類問題的妙用,有不同意見者歡迎留言)。作者既然拋出此類問題,其隱語當然他是能夠跨越空上鴻溝的人,隨手搜一下作者,copy如下:
    Dr. Marcos López de Prado is the chief executive officer of True Positive Technologies. He founded Guggenheim Partners’ Quantitative Investment Strategies (QIS) business, where he applied cutting-edge machine learning (ML) to the development of high-capacity strategies that delivered superior risk-adjusted returns. After managing up to $13 billion in assets, Marcos acquired QIS and successfully spun-out from Guggenheim in 2018.

Since 2010, Marcos has been a research fellow at Lawrence Berkeley National Laboratory (U.S. Department of Energy, Office of Science). One of the top-10 most read authors in finance (SSRN's rankings), he has published dozens of scientific articles on ML and supercomputing in the leading academic journals, and he holds multiple international patent applications on algorithmic trading.

Marcos earned a Ph.D. in financial economics (2003), a second Ph.D. in mathematical finance (2011) from Universidad Complutense de Madrid, and is a recipient of Spain's National Award for Academic Excellence (1999). He completed his post-doctoral research at Harvard University and Cornell University, where he teaches a Financial ML course for the School of Operations Research and Information Engineering. Marcos has an Erd?s #2 and an Einstein #4 according to the American Mathematical Society.

2.金融機器學習項目失敗的幾個原因:

  1. The Sisyphus paradigm (西西弗里神話,團隊協(xié)作勞而無功問題)
    1.1 主觀交易者憑主觀判斷及直覺而非特定的理論和邏輯工作(如果不是這樣,那他們就變成系統(tǒng)型交易者),主觀交易者的決策通常都是基于某個“故事”,且沒有人能真正完全明白他們投資背后的邏輯。這并不意味著主觀交易者不能成功,但他們必須獨立工作,從而達到分散分的效果,如果你雇傭50個主觀組合經(jīng)理并讓他們作為團隊 作,在相互影響下,這些人的意見趨同,其結果是你用50個人的工資相當于得到一個雇員的效果;
    1.2. 將這種獨立工作的思路用于量化或機器學習項目時,同樣有問題,如果雇傭50個博士,讓他們獨立工作并在6個月內提交工作成果,其結果通常是每個人都瘋狂的尋找交易機會,其產(chǎn)出通常是:(1)擁有亮麗回測結果的過度擬合;(2) 標準的因子投資,策略已經(jīng)被太多投資人使用不能產(chǎn)生高sharpo,但至少有學術支持。這兩個結果都會讓投委會在失望中取消項目。即使這50人中有5人發(fā)現(xiàn)了真正的機會,5個人的收益也無法覆蓋50人的支出,從而這5個人也要另謀高就。
    旁注:按我的理解,除了克服人性的弱點,在技術上,量化的一大功用就是可以將不同的投資和交易維度應用于多個不同的市場和時間周期,從而達到更優(yōu)的結果。量化交易應該是從基本面、技術機、消息面等不同維度尋找擁有概率優(yōu)勢或波動性平抑的機會,因此,在我看來,對于量化交易而言,團隊協(xié)作尤為重要。

  2. 資本市場發(fā)展到今天,已經(jīng)幾乎不存在macroscopic(肉眼可見)的alpha,alpha的尋找越來越向細粒度微觀化發(fā)展。
    旁注:這一點不完全同意,我認識一些傳統(tǒng)交易員只用一兩套簡單的策略就可以交易為生,據(jù)說海龜交易法則在期貨市場上還在被廣泛應用并盈利,最經(jīng)典的“多因子模型”在國內市場,還在最經(jīng)典的因子庫和最簡的線性回歸為基礎應用,不過作為量化研究人員,挖掘新的因子肯定是必須的,保持這種挖掘能力也能幫助我們降低被市場淘汰的風險。
    策略生產(chǎn)線(策略的生命周期)包括以下環(huán)節(jié):
    3.1)Data Curator(數(shù)據(jù)準備):
    這個環(huán)節(jié)負責數(shù)據(jù)的收集、清理、指數(shù)化、存儲、調整以及向生產(chǎn)環(huán)節(jié)發(fā)布。數(shù)據(jù)提供者應該熟知所處理金融數(shù)據(jù)的背景知識,以及各交易品種間的細微差別,如股票的并股、拆分、投票權等。
    3.2)Feature Analysts (特征分析):
    此環(huán)節(jié)負責在源數(shù)據(jù)中提取有一定預測能力的信息,團隊成員應該是信息論、信息提取處理、可視化、標注、加權、分類及其它與特征分析相關技術的專家。比如通過交易簿記中提取市場多空信息(國內的盤口分析好像和這個比較相似?),這種特征通常不能獨立構成交易策略,但有益于交易執(zhí)行、流動性風險監(jiān)控、作市、頭寸建立,一個誤區(qū)是認為特征可以直接作為策略,其更多是對信息的收集和歸類。
    3.3)Strategists (策略):
    這個環(huán)節(jié)將特征加工成實際的交易算法,策略分析師通過分析特征開發(fā)投資策略。策略分析師的任務是通過觀察特征形成交易想法并解釋這些想法。策略僅是驗證想法的工具。這個環(huán)節(jié)的團隊成員是對資本市場和經(jīng)濟有深刻理解的數(shù)據(jù)科學家。需要注意的是,形成的想法應該能解釋大量上述特征。想法的背后是行為金融偏差?信息不對稱?管理限制?特征可以用黑盒手法提取,但策略必須構建在白盒上( 即可解釋)。簡單的將特征組合在一起并不能構成交易想法。當交易策略完全成后,策略分析師將實現(xiàn)整個交易想法的算法和原型代碼提交給回測團隊。
    3.4) Backtesters(回測):
    這個環(huán)節(jié)負責評估交易策略在不同交易場景下的盈利能力。其中一個場景是用歷史數(shù)據(jù)回測,即假設歷史會重演,但歷史行情僅是隨機過程中的一個可能結果,其并不能在很大程度上代表未來。回測還應該針對策略的優(yōu)缺點進行測試和評估。這個環(huán)節(jié)的團隊成員應該是對經(jīng)驗和實驗技術有深刻理解的數(shù)據(jù)科學家。一個優(yōu)秀的回測人員應該通過對源數(shù)據(jù)的分析理解交易想法的由來并注意預防過擬合。
    3.5 Deployment Team(策略部署團隊):
    部署團隊負責將策略代碼與生產(chǎn)線對接。有些部件可以為多個策略共享,尤其是具有共性的策略。部署團隊的成員是算法專家和數(shù)學編程高手。部署團隊的任務有兩個:1)保證部署的代碼邏輯與策略原型代碼完全一致;2)優(yōu)化原型代碼的實現(xiàn),以保證交易延時最小。出于對實時性的要求,這個團隊非常依賴于處理高度、自動化服務器(Jenkins)、向量化、多線程、多進程、圖像處理芯片(GPU-NVIDIA),分布式計算(Hadoop),高性能計算(Slum)以及并行計算等技術。
    3.6 Portfolio Oversight (組合監(jiān)督):
    策略布置完成后,即進入監(jiān)督執(zhí)行環(huán)節(jié),包括:
    1). Embargo(準入):策略在測試集外的數(shù)據(jù)進行測試,這個環(huán)節(jié)不需要實時數(shù)據(jù),如果這個階段的結果與回測結果一致,策略進入下一階段;
    2). Paper trading(模擬交易): 在這一階段,策略在實時數(shù)據(jù)上模擬執(zhí)行,這個階段要考慮數(shù)據(jù)處理延遲、計算延遲、執(zhí)行延遲以及其它在數(shù)據(jù)到達和建倉之間的時間延遲。模擬交易可以持續(xù)很久,直到有足夠的證據(jù)表明策略表現(xiàn)與預期一致。

3).Graduation(實盤):策略進入實盤階段,策略可以獨立執(zhí)行,也可以作為交易系統(tǒng)的一部分(如用于交易信號產(chǎn)生、信號過濾或資金管理),在這個階段策略評估更加精細,包括風險、收益和成本歸因。
4). Re-allocation(資金再分配): 基于策略表現(xiàn),策略在分散組合中經(jīng)常自動重新評估。一般而言,策略的資金分配遵循凹函數(shù),初始倉位小,隨著策略按預期運行時間的增加,倉位逐漸增加。再過一段時間,隨著策略衰退,他們再逐漸縮小。

5). Decommission(策略終止): 所有策略都最終都會終止。當策略的表現(xiàn)在足夠長的時間不符合預期時說明策略背后的理論已經(jīng)被實證否定,此時應終止策略。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容