第3篇:氣象學(xué)家的苦惱
表哥來訪
顧北的表哥叫小軍,在氣象局做數(shù)值天氣預(yù)報(bào),那種每天早上刷新的“明天降水概率65%”就是他們組負(fù)責(zé)的。
那個周末,小軍到學(xué)校找顧北吃飯,飯桌上兩個人聊起各自的工作,越聊越覺得奇怪。
“你們預(yù)測股價,我們預(yù)測天氣,感覺是同一件事,”小軍說,“都是用歷史數(shù)據(jù)建模,然后預(yù)測未來。”
“但你們準(zhǔn)確率高多了,”顧北說,“你們說明天70%概率下雨,還挺準(zhǔn)的。我們說明天股票70%概率漲,基本上就是胡說?!?/p>
小軍想了想,“為什么?”
顧北把課程里的一段對比念給他聽:
氣象學(xué)家有實(shí)驗(yàn)室:可以在受控環(huán)境中反復(fù)驗(yàn)證氣流模型,相同的初始條件會產(chǎn)生相同的結(jié)果。
金融建模者沒有實(shí)驗(yàn)室:2008年的金融危機(jī)只發(fā)生過一次,沒法“重跑”一遍。歷史數(shù)據(jù)是唯一的原材料,但這段歷史里摻雜了太多無法控制的因素。
“這倒是,”小軍說,“但你們不是也有模型嗎?”
“有,但麻煩得多。天氣背后的物理規(guī)律是固定的——大氣的運(yùn)動遵循熱力學(xué)定律,幾億年沒變過。但金融市場背后是人,人會學(xué)習(xí)、會適應(yīng)、會改變行為。一個好用的量化策略,發(fā)現(xiàn)的人多了,套利機(jī)會就消失了?!?/p>
小軍皺了皺眉。“那你們怎么建模?”
“先接受一個事實(shí)——模型永遠(yuǎn)是近似的,不是真理?!鳖櫛闭f,“然后從歷史數(shù)據(jù)里找規(guī)律,能用就用,不能用就換。”
金融數(shù)據(jù)的兩個怪脾氣
顧北回到宿舍,繼續(xù)翻課程,看到了金融數(shù)據(jù)最重要的兩個特征——他覺得這兩個特征本身就像兩個小故事,值得細(xì)說。
第一個怪脾氣:厚尾。
正常情況下,我們學(xué)過正態(tài)分布——鐘形曲線,大部分結(jié)果集中在中間,極端結(jié)果越來越少,“萬年一遇”的事件幾乎不存在。
但金融市場不是這樣。
顧北看到了一段數(shù)據(jù):
如果股市的日收益率是正態(tài)分布,那么單日跌幅超過5%,理論上應(yīng)該是幾千年才發(fā)生一次。
但實(shí)際上,過去100年的美股歷史里,這種“幾千年一遇”的事件發(fā)生了幾十次。
每一次市場動蕩——1987年黑色星期一、2000年科技股泡沫、2008年金融危機(jī)、2020年新冠恐慌——都是“按正態(tài)分布根本不該發(fā)生”的事。
這就是厚尾:真實(shí)的金融數(shù)據(jù),極端事件發(fā)生的頻率遠(yuǎn)遠(yuǎn)高于正態(tài)分布的預(yù)測。
“為什么會厚尾?”顧北問霍遠(yuǎn)。
“因?yàn)槭袌隼锏娜藭嗷ビ绊懀被暨h(yuǎn)說,“一個人開始賣出股票,別人看到價格下跌,也開始賣,然后觸發(fā)更多人賣——恐慌會自我放大。物理現(xiàn)象不會因?yàn)椤畡e的粒子也在動’就加速崩潰,但人會??謶质怯袀魅拘缘?。”
這讓顧北想起了2020年疫情剛爆發(fā)時,網(wǎng)上那些搶購衛(wèi)生紙的視頻——沒有任何邏輯能解釋為什么衛(wèi)生紙會短缺,但所有人一看別人在搶,就也開始搶,直到貨架真的空了。
厚尾,是群體行為的產(chǎn)物。不是自然界的意外,是人性的必然。
第二個怪脾氣:波動率聚集。
顧北看到了課程里的一個描述:
打開任何一只股票的歷史走勢圖,你會發(fā)現(xiàn)一個規(guī)律:平靜時期的波動很小,而動蕩時期的波動很大,而且動蕩往往一段一段地出現(xiàn),不是隨機(jī)散落的。
用更直白的話說:大波動的后面,往往跟著大波動;小波動的后面,往往跟著小波動。
就像臺風(fēng)——臺風(fēng)天接著臺風(fēng)天,晴天接著晴天,不是今天臺風(fēng)、明天晴、后天臺風(fēng)這樣隨機(jī)切換的。
這意味著什么?
意味著“今天市場很平靜”這個信息,確實(shí)對明天有預(yù)測價值——不是預(yù)測漲跌的方向,而是預(yù)測波動的大小。平靜期之后還是相對平靜,動蕩期之后還是相對動蕩。
“所以哪怕漲跌方向是隨機(jī)的,波動率本身是有規(guī)律的?”顧北問。
“對,”霍遠(yuǎn)說,“這就是為什么有一整套叫做GARCH的模型,專門用來建?!▌勇首约旱牟▌印T谄跈?quán)交易里,這非常有用——因?yàn)槠跈?quán)的定價核心就是波動率,能預(yù)測波動率,就能在期權(quán)市場上找到機(jī)會?!?/p>
為什么用“對數(shù)收益率”
課程里還解釋了一個技術(shù)性的問題,顧北覺得解釋得很清楚,就認(rèn)真抄了下來。
問題:衡量股價漲跌,為什么不直接用百分比(+5%、-3%),而要用“對數(shù)收益率”(log(今日價格/昨日價格))?
顧北一開始覺得這是在繞彎子,直到他看到了一個反例:
假設(shè)一只股票: - 第一天漲了50%,從100元漲到150元 - 第二天跌了50%,從150元跌到75元
兩天的百分比加起來:+50% + (-50%) = 0%,感覺兩天打平了。
但實(shí)際上,股價從100跌到了75,你虧了25%!
問題就在這里:百分比不能直接相加,因?yàn)榛鶖?shù)變了。漲了50%再跌50%,是在不同的基數(shù)上做的運(yùn)算,并不對稱。
但對數(shù)收益率沒有這個問題。對數(shù)有一個性質(zhì):加法等于乘法。把每天的對數(shù)收益率加起來,就等于總的對數(shù)收益率。無論中間經(jīng)歷了多少漲跌,最終結(jié)果是數(shù)學(xué)上一致的。
顧北把這段解釋發(fā)給了小軍,讓他給評價一下。
小軍回了一條消息:“就像海拔——你從100米爬到150米,再從150米下降到75米,總的海拔變化是-25米。不管你中間走了多少路,最終就是少了25米。這個比喻我懂,所以你那個對數(shù)收益率,就是把百分比變化換成了一個可以直接相加的量,不會因?yàn)榛鶖?shù)變了而算錯?!?/p>
顧北把這個比喻記了下來。
建模是妥協(xié)的藝術(shù)
到這里,顧北開始理解金融建模的本質(zhì)了。
不是“找到真理”,而是“找到足夠有用的近似”。
金融數(shù)據(jù)有厚尾——大多數(shù)模型還是用正態(tài)分布,因?yàn)樗銐蚝唵危以诖蠖鄶?shù)情況下誤差可以接受。
金融數(shù)據(jù)有波動率聚集——更精細(xì)的模型(GARCH)可以捕捉這個特征,但代價是模型更復(fù)雜。
沒有一個模型能捕捉所有特征,而一個試圖捕捉所有特征的模型,復(fù)雜到?jīng)]法用。
模型是妥協(xié)。 你決定對哪些特征保真,對哪些特征忽略,取決于你要解決的問題。
顧北在筆記本上寫下一句話:
所有模型都是錯的,但有些模型是有用的。
這句話是統(tǒng)計(jì)學(xué)家喬治·博克斯說的,顧北覺得它適用于一切——不只是金融。
然后他翻到了下一篇的開頭,看到了1827年的花粉,看到了愛因斯坦,看到了布朗運(yùn)動——那個最重要的連續(xù)時間隨機(jī)模型。
花粉為什么在水里跳舞?
這個問題,一個英國植物學(xué)家困惑了一輩子,卻被一個瑞士專利局的小職員解答了。而這個答案,在快100年后,成了華爾街最值錢的數(shù)學(xué)工具。
這就是下一篇的故事。