「品味」的數(shù)學(xué)原理

之前寫了「網(wǎng)絡(luò)攻防的核心邏輯」,但感覺還是沒講透,這次把原理補(bǔ)上。

兩類錯(cuò)誤??

網(wǎng)絡(luò)攻防的核心場景是什么?我覺得是「大海撈針????」[1]。如果這個(gè)假設(shè)正確,那么接下來問題就簡單了。海里的針??分為兩種:一種確實(shí)是針??,另一種看起來像卻不是??。

大海撈針

真實(shí)的情況應(yīng)該是「萬一挑一 \frac{1}{1,0000} 」,但是太難畫了,就算它「十里挑一 \frac{1}{10} 」(也就是「百里挑十 \frac{10}{100} 」)吧。

但是,人總會(huì)出錯(cuò)。這時(shí)候會(huì)分化出兩種錯(cuò)誤??:

錯(cuò)誤類型 記憶 說明
I 型錯(cuò)誤? 漏網(wǎng)之魚?? 把真的錯(cuò)看成假的
II 型錯(cuò)誤? 張冠李戴?? 把假的錯(cuò)看成真的

我們先隨便估一個(gè) I 型錯(cuò)誤率:10% 。即,在 10 個(gè)真的里面,認(rèn)對了 9 個(gè),錯(cuò)把 1 個(gè)當(dāng)成假的了。

漏網(wǎng)之魚??

我們也隨便估一個(gè) II 型錯(cuò)誤率:10% 。即,在 90 個(gè)假的里面,認(rèn)對了 90 \times 90\% = 81 個(gè),錯(cuò)把 90 \times 10\% = 9 個(gè)當(dāng)成假的了。

張冠李戴

算一下當(dāng)前這種假設(shè)下的準(zhǔn)確率:\frac{9}{9 + 9} = 50\% 。

準(zhǔn)確率 = 真陽性 / (真陽性 + 假陰性)

解釋一下,分子是我們挑對?的 9 個(gè),分母是這 9 個(gè)加上我們「錯(cuò)把假的看出真的」9 個(gè)。這個(gè)結(jié)論實(shí)在太反常識了,明明我們已經(jīng)把兩類錯(cuò)誤率都降到 10% 了,為什么最后準(zhǔn)確率才 50% ?![2]

后頭看看準(zhǔn)確率是怎么來的就不難發(fā)現(xiàn),壞就壞在分母里「錯(cuò)把假的看成真的」那部分「看走眼」的錯(cuò)誤(也就是 II 型錯(cuò)誤?)極大地拉低了準(zhǔn)確率。那為什么 II 型錯(cuò)誤?會(huì)這么多呢?∵假的基數(shù)大(90 個(gè))。

這個(gè)現(xiàn)象其實(shí)是世間常態(tài):稀缺的信號總是淹沒在海量噪聲之中;別人家的孩子鳳毛麟角;市場上優(yōu)質(zhì)的公司極少;攻擊面中真正可以利用的漏洞點(diǎn)也不多;……知乎上有個(gè)問題「怎么甄別我家娃有沒有數(shù)學(xué)天賦?」,高贊回答是「99% 直接判定為普娃」。

∴這個(gè)結(jié)論值得反復(fù)玩味,也很反常識:在大浪淘金時(shí),人們總是害怕錯(cuò)過,但真正讓人陷入平庸的是「品味差」,也就是錯(cuò)把廢物當(dāng)成寶;反而往往大家在意的「不識貨」(煮熟的鴨子??都讓飛了)雖然可惜,但其實(shí)并不重要。寧缺毋濫!寧缺毋濫!寧缺毋濫!說它反常識,但其實(shí)也在「情理之中」,錦上添花其實(shí)可有可無,真正重要的是雪中送炭、點(diǎn)石成金。

不信?我們繼續(xù)推演。要想提高準(zhǔn)確率,我們有兩個(gè)方向:一是減少「漏報(bào)」,二是降低「誤報(bào)」。

我們先來看看減少「漏報(bào)」(「棄真」)能帶來多少提升?比如把漏報(bào)率從 10% 降到 5%,則準(zhǔn)確率提到到 \frac{ 10 \times (100\% - 5\% ) }{ 10 \times (100\% - 5\% ) + (100 - 10) \times 10\%} = \frac{9.5}{9.5 + 9} \approx 51.3\% 。這也是大家對「精益求精」的普遍理解。但不能說毫無提升,也只是可有可無??????。

我們再來看看降低「誤報(bào)」(「取偽」)能帶來多少提升?比如把誤報(bào)率降到 5%,則準(zhǔn)確率提到到 \frac{ 10 \times (100\% - 10\% ) }{ 10 \times (100\% - 10\% ) + (100 - 10) \times 5\%} = \frac{9}{9 + 4.5} \approx 66.6\% 。不說是顯著提升吧,至少有所提升??。

∴我們真正需要修煉的是「嗅出壞味道」,「嗅出壞味道」比「淘到好東西」重要得多——品味!品味!品味!品味怎么提升呢?我能想到的還是那個(gè)老梗:說王國維跟溥儀顯擺自己淘來的古董,溥儀看了一眼,委婉地說「和我家里的看著不太一樣」??????。不要指望在垃圾堆里「撿漏」!遠(yuǎn)離垃圾堆,遠(yuǎn)離噪音!更別把垃圾當(dāng)成寶!

品味,就是手頭資源只夠押注一頭,選出重要的那頭。這也是被說爛了的雞湯:

  • 「先保證不輸,再去爭取贏」;
  • 「拒絕大多數(shù),聚焦極少數(shù)」;
  • 「先為不可勝,以待敵之可勝」;

回到網(wǎng)絡(luò)攻防,分清兩類錯(cuò)誤?是在搜索空間上的選擇,剩下的就接上了,我們還需要在時(shí)間維度上把握。(跳回原文


  1. 或者叫「大浪淘金??」。 ?

  2. 其實(shí)之前看 @劉雪峰 的《生活不是擲骰子??》,里面用圖形講解 Bayes 公式,大受震撼,但體會(huì)還沒這么深。直到看 @Prasad 的《我從達(dá)爾文那里學(xué)到的投資知識》里解釋「為什么市面上的優(yōu)質(zhì)投資寥寥無幾」才真正明白 Bayes 公式的深刻??。 ?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容