丑小鴨定理

對于丑小鴨定理,你可能有點印象,但是你可能沒想到它是一個數(shù)學定理,而且是一個1969年才出現(xiàn)的定理。了解這個思想,有助于我們變成一個更開朗的人。

丑小鴨定理問的是這樣一個問題:一只丑小鴨跟一只天鵝之間的區(qū)別大,還是兩只天鵝之間的區(qū)別大?

直觀的答案肯定是前者區(qū)別大。兩只天鵝畢竟都是天鵝,長得肯定像,而丑小鴨跟天鵝是很不一樣的。

但這只是考慮了它們的外形,我們還可以從別的方面比較,比如DNA。假設丑小鴨是這兩只天鵝生的女兒,兩只天鵝作為夫妻,它們的DNA并不相似。而丑小鴨的DNA一半來自她的父親,一半來自她的母親。所以要比較DNA的話,丑小鴨跟其中任何一只天鵝的相似度,都遠遠高于這兩只天鵝之間的相似度。

這個道理是,如果要比較相似度,首先得看看比的標準是什么。但是我們能想象的標準可能有無窮多個,這沒有辦法計數(shù)?。克晕覀冃枰粋€數(shù)學的洞見。(如果你對數(shù)學不感興趣,可以直接跳到第一小節(jié)的結論。)

這個洞見就是,所謂兩個東西“相似”,就是在給所有東西分類時,這兩個東西能被分在同一個類里面。在各種不同的分類之中,它們兩個被分到一起的次數(shù),就決定了相似度的大小。

舉個例子。我們把這三只鳥排成一排,分別是天鵝A、天鵝B和丑小鴨C,來看看對這三只鳥有多少種分類方法。

具體做法是我們選擇一個屬性,符合這個屬性的就算是一類,不符合的就不算。

比如,我們選擇的屬性是“白色”,兩只天鵝是白色的,丑小鴨是灰色的,所以根據(jù)這個屬性,兩只天鵝就被選中,而丑小鴨不在這一類。這個分類結果可以用(110)表示——對應三只鳥的位置,1代表你在這個分類里,0代表你不在這個分類里。

如果選擇的屬性是“排第一名”,那就只有天鵝A在這個分類里,分類結果就是(100)。

如果選擇的屬性是“不是白色”,那就兩只天鵝都不算,只有丑小鴨在這個分類里,結果就是(001)。

如果選擇的屬性是“白色,但是不排第一名”,結果就是(010)。

以此類推。我們會發(fā)現(xiàn),下面圖中表示的8種分類方法,你其實都能找到一個對應的“屬性”。

左邊是分類結果,最右邊是分類標準,也就是事先選擇的“屬性”。

而且對于三個物體,一共也就只有這8種分類方式。那怎么定義相似度呢?就是看這8種分類之中,這兩個物體被分到同一類的有多少種。

比如說天鵝A和丑小鴨C,就在(101)、(111)、(000)、(010)這4個分類中屬于同一類,那么我們就可以說天鵝A和丑小鴨C的相似度是4。同樣的道理,天鵝B和丑小鴨C的相似度也是4。而天鵝A和天鵝B的相似度呢?它們?yōu)橥惖姆纸M是(110)、(111)、(000)、(001),也是4。

也就是說,丑小鴨和天鵝之間的相似度,和兩只天鵝之間的相似度,是一樣的。這就是“丑小鴨定理”。

一般來說,如果有N個物體,那么就一共有2的N次方種不同的分類方法,而結果還是這樣,各個物體之間的相似度是一樣的。

換一個說法,丑小鴨定理也可以表述成:“丑小鴨跟天鵝之間的差異,和兩只天鵝之間的差異一樣大。”

2 沒有“客觀”的分類

丑小鴨定理是1969年由美籍日本人渡邊慧證明的。當初提出這個定理是計算機模式識別的要求。

比如,現(xiàn)在有一大堆東西,能不能給計算機一個任務,讓它自動、客觀地把這些東西分個類。丑小鴨定理說,這是不可能的,因為沒有給出分類標準。

比如,把一群人進行分類,是按身高分、按膚色分、按學歷分,還是按DNA的相似程度分?在此之前,必須先主觀地給計算機一個標準,它才能進行分類。

如果沒有主觀標準,那根據(jù)丑小鴨定理,這些人中任意兩個人的相似程度都是一樣的,不管怎么分都可以。這就是“種族不存在”這個說法的最深刻含義。

如果非得把人按照種族分,這就是一種主觀的、有偏見的分法。每個人都有各種屬性,憑什么非得看種族呢?從這個意義上說,種族是不存在的。

但是這個批評也適用于所有的分類標準。按種族分不合理,難道按學歷、按性別把人分類就合理嗎?如果一定要說“種族不存在”,那么也應該說性別和學歷不存在。

所以根本不存在完全客觀的分類,每一種分類都是主觀的——換句話說,每一種分類都是有偏見的。先有“偏見”這個屬性,我們才會根據(jù)這個屬性去分類。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容