為什么能??佳的經(jīng)理?中,仍然有少數(shù)?的績效記錄很好?
說買賣證券?煎蛋容易,確實(shí)有點(diǎn)打臉。塔勒布說
如果把無限多的猴子放在打字機(jī)前面,讓它們?nèi)y敲,那么其中一只肯定會打出一字不差的《伊利亞特》敘事詩。
假設(shè)一群能力欠佳的基金經(jīng)理人,以投擲硬幣的方式?jīng)Q定買賣股票,那么每個(gè)人的賺賠概率恰好各為一半:到年底時(shí)每個(gè)人都有50%概率賺錢,50%的概率賠錢。賠錢的下一年就被剔除,那么幾年之后一定會有產(chǎn)生一個(gè)股神巴菲特出來,我們一定會認(rèn)為他是表現(xiàn)強(qiáng)于出局的經(jīng)理人,而事實(shí)上,這純粹是靠運(yùn)氣得來的。不論怎樣都總有少數(shù)人的績效記錄很好,依據(jù)績效記錄來判斷優(yōu)秀經(jīng)理人顯然是不理智的。
原始樣本量在其中發(fā)揮什么作??
上面的例子中,最重要的是兩項(xiàng)因素:從事工作的隨機(jī)成分多寡,以及有多少數(shù)目的人參與。因?yàn)槿绻麉⑴c的人數(shù)少,可能都會被“炸毀”或者都盈利,如果樣板足夠多,那么在波動性和隨機(jī)性變化的過程中就一定會出現(xiàn)分支,就像自然界的繁殖進(jìn)化過程,有的淘汰了,有的活了下來,但活下來的不一定是最優(yōu)秀的。
所以,原始樣本量越大,連續(xù)靠運(yùn)氣取得很好績效記錄的人就越多。
存活者偏差取決于母群體的原始大小。一個(gè)人過去賺到錢這個(gè)信息,本身既無意義且不重要。我們必須知道他所屬群體的大小。
想想為什么?們沉迷于數(shù)據(jù)挖掘技術(shù)?
數(shù)據(jù)挖掘也稱之為“數(shù)據(jù)捕魚”和“數(shù)據(jù)探測”。
在大數(shù)據(jù)的時(shí)代,人們沉迷于用數(shù)據(jù)挖掘技術(shù)來獲取更多信息,得到更多的有價(jià)值的關(guān)聯(lián),指導(dǎo)未來,掌握未來。
最常見的一個(gè)例子,我們在購物網(wǎng)站上曾經(jīng)瀏覽過一種商品,那么網(wǎng)站就會立刻為我們推送相關(guān)產(chǎn)品,而且在一定時(shí)期會重復(fù)的推送。這時(shí)數(shù)據(jù)挖掘系統(tǒng)就在客戶和商品之間創(chuàng)建關(guān)系,運(yùn)用了數(shù)據(jù)關(guān)聯(lián)規(guī)則,收集顧客購買習(xí)慣數(shù)據(jù),并利用這些信息幫助營銷。同樣數(shù)據(jù)挖掘技術(shù)也常運(yùn)用于新聞瀏覽、內(nèi)容搜索、醫(yī)療保險(xiǎn)等等領(lǐng)域。
投資領(lǐng)域,人們當(dāng)然希望通過以往數(shù)據(jù)的挖掘獲得與未來市場走勢的緊密聯(lián)系,盡管我們本能的希望從無序中尋找有序,從復(fù)雜中尋找簡單,從結(jié)果中尋找原因。然而隨機(jī)性和不確定性始終存在,預(yù)測未來不可能。
我拿法則去套用數(shù)據(jù),這件事稱做數(shù)據(jù)探索。只要靠運(yùn)氣,我嘗試的次數(shù)越多,越有可能找到一個(gè)非常適合過去數(shù)據(jù)的法則。一個(gè)隨機(jī)系列總會呈現(xiàn)某種可察覺的形態(tài)。
數(shù)據(jù)挖掘意味著掃描可能存在任何關(guān)系的資料,然后篩選出符合的模式。大量的數(shù)據(jù)集中總會有碰巧或特定的資料,有著“令人振奮的關(guān)系”。因此,一些結(jié)論看上去十分令人懷疑。
《顧客的游艇在哪里?》的書中寫道:“總是有相當(dāng)數(shù)量的可憐人,忙于從上千次的賭輪盤的輪子上查找可能的重復(fù)模式。十分不幸的是,他們通常會找到?!?/p>
印象深刻的?句話是哪句話?
務(wù)必牢記,每個(gè)人都認(rèn)為自己的成功全憑實(shí)力,毫無僥幸,只有失敗時(shí)才會認(rèn)為是運(yùn)氣使然。
《隨機(jī)漫步的傻瓜》第9章:買賣證券?煎蛋容易