我所說(shuō)的一切都可能是錯(cuò)的!
即使你贊同我的觀點(diǎn),你的生活也不會(huì)因此有任何改變!
除非——你采取了相應(yīng)的行動(dòng)。
(這是書先生在簡(jiǎn)書的第33篇文章。本文約3300字,請(qǐng)花8分鐘來(lái)閱讀。)
引子
今天大家期待已久的微信小程序上線了。作為一個(gè)應(yīng)用工具控,書先生自然也是要把玩一番。
關(guān)于張小龍為什么要做小程序,從這個(gè)消息放出之日起,各種版本的解讀不斷。不過,在書先生看來(lái),已有的所有解讀都沒有說(shuō)到事情的本質(zhì),因?yàn)楝F(xiàn)有的各種解讀都是在商言商,沒有上升到哲學(xué)的高度。
但是,幾乎所有的解讀都認(rèn)為,小程序最適用的是低頻的應(yīng)用場(chǎng)景,也符合張小龍關(guān)于小程序用完即走的設(shè)計(jì)理念。這一點(diǎn),書先生是認(rèn)同的。而且,揭開張小龍推出小程序秘密的關(guān)鍵就在“低頻”兩個(gè)字上。
雖然幾乎所有的解讀都認(rèn)同小程序適用于低頻的應(yīng)用場(chǎng)景,但卻沒有一種解讀認(rèn)為這是優(yōu)點(diǎn)。然而,在書先生看來(lái),“低頻”應(yīng)用場(chǎng)景才是小程序真正的殺手锏——小程序的整個(gè)設(shè)計(jì)理念都是為了“低頻”服務(wù)的。張小龍要的就是低頻,這一點(diǎn)所有人都看出來(lái)了。
可是為什么?為什么當(dāng)所有應(yīng)用都巴不得用戶每天打開自己100次時(shí),張小龍要瞄準(zhǔn)“低頻”的應(yīng)用場(chǎng)景?這一點(diǎn),看出來(lái)的人就少了。
書先生看出來(lái)了,因?yàn)闀壬菍W(xué)語(yǔ)言學(xué)的,專長(zhǎng)是文本分析。你沒有看錯(cuò),微信做小程序背后的秘密和語(yǔ)言學(xué)有關(guān)。有點(diǎn)懷疑?那且聽我慢慢道來(lái)。
先來(lái)談?wù)勎鋫b小說(shuō)
書先生從小學(xué)三年級(jí)開始看武俠小說(shuō),到初中畢業(yè),金庸、古龍、溫潤(rùn)安等的幾乎所有小說(shuō)都已看過。每個(gè)作家都有自己的特色,無(wú)論是情節(jié)上還是用詞上。
在情節(jié)上,金庸的小說(shuō)像一棵大樹,先從一個(gè)小苗開始,越散越開、越散越開,最終枝繁葉茂,不過都來(lái)自于同一個(gè)大樹樁;古龍的小說(shuō)像一個(gè)迷宮,你以為你看到了出口,卻總難免在里面打轉(zhuǎn),直到小說(shuō)結(jié)束;溫潤(rùn)安則是以詳細(xì)的描述打斗情節(jié)見長(zhǎng),估計(jì)這和溫先生本身是個(gè)武術(shù)家有關(guān)。
小說(shuō)人物的命運(yùn)也有很鮮明的特色:金庸小說(shuō)里的人物往往會(huì)有一連串的奇遇,不用怎么費(fèi)勁就可以練成絕世武功(典型的例子就是段譽(yù));古龍小說(shuō)里的主角功夫都是苦練出來(lái)的,不過古龍一般不會(huì)寫練功的部分,相反,主角一出場(chǎng)就幾乎是天下無(wú)敵(典型的例子就是李尋歡);溫潤(rùn)安小說(shuō)里的人物形象類似于古龍小說(shuō)里的人物形象,不過與古龍小說(shuō)里英雄的落寞孤寂不同,溫瑞安小說(shuō)的英雄往往是拉幫結(jié)派的(典型的例子就是四大名捕)。
然而,讓書先生最感興趣的還是他們的用詞。如果你把古龍的全集看過好幾遍,你一定會(huì)對(duì)這個(gè)詞深有感觸——“豈非”。這個(gè)詞的意思是“難道不”,很少人用,但是古龍用得很多。我隨意從古龍的《風(fēng)鈴中的刀聲》中復(fù)制幾句,大家感受一下:
——在人類的生命歷史中說(shuō)來(lái),死亡豈非通常都是一種沒有人能夠猜測(cè)得到的詭秘游
戲。
—痛痛快快的活,痛痛快快的死,這豈非正是多數(shù)人的希望?
一個(gè)人在臨死之前還要被人隱瞞欺騙,豈非是件很不公平的事。
這個(gè)世界上豈非也有很多人像老馬一樣,總是不懂得那些聰明人的原則,總是不會(huì)吃
人,只會(huì)吃草。
一個(gè)以“刀”為命的人,身邊如果沒有帶刀,豈非就好像一個(gè)大姑娘沒穿衣服一樣。
這當(dāng)然不是真的,這是謊話,可是謊話豈非總是能讓人愉快的,這個(gè)世界上又有幾個(gè)女
孩子不喜歡聽謊話的?
有意思的是,一般古龍用豈非就意味著他要發(fā)點(diǎn)議論了。然而,如果你只讀古龍的小說(shuō),你不會(huì)對(duì)“豈非”有特別的感受。只有當(dāng)你同時(shí)讀過很多不同作者的小說(shuō),你才能感受出“豈非”在古龍小說(shuō)中的特殊之處——它是一個(gè)通常低頻但在古龍小說(shuō)里高頻的詞。
古龍用“豈非”是如此的頻繁,以至于有段時(shí)間當(dāng)書先生沉迷于古龍小說(shuō)時(shí),張口都離不開“豈非”兩個(gè)字:“如果能活在古龍的小說(shuō)里,豈非人生快事?!惫琵埖男≌f(shuō)很多都不是他親做,而是由他徒弟丁情代筆。不過據(jù)說(shuō)小李飛刀系列是古龍親自寫的,而這個(gè)系列使用“豈非”非常頻繁。所以,當(dāng)年書先生讀到一本古龍小說(shuō)“豈非”用得很少的時(shí)候,基本上就可以判定那本小說(shuō)是他人代筆的。
特色的統(tǒng)計(jì)學(xué)定義
凡同時(shí)看過金庸、古龍、溫瑞安小說(shuō)的人都會(huì)承認(rèn),他們的小說(shuō)各有特色。特色的意思就是有獨(dú)特的地方,可是獨(dú)特是個(gè)很模糊的概念,似乎只是一種感覺。今天書先生就要為“特色”下個(gè)精確的統(tǒng)計(jì)學(xué)定義。
如果一個(gè)樣本集(sample set)存在元素X,其在樣本集中的出現(xiàn)概率顯著高于其在全集(universal set)中出現(xiàn)的概率,則稱該元素X為樣本集的特色(special feature)。
如果把古龍小說(shuō)里的所有詞組成一個(gè)集合A,以世界上所有武俠小說(shuō)(包括古龍小說(shuō)在內(nèi))里的詞組成的集合為全集U,則“豈非”就是A的一個(gè)特色。
ESP(English for Specific Purposes,專門用途英語(yǔ))的研究中用這個(gè)方法來(lái)自動(dòng)找出專有名詞。所謂專有名詞,就是一個(gè)專業(yè)特有的名詞,也即特色。按照上面的定義,我們只需找出在給定專業(yè)文本中出現(xiàn)頻率顯著高于在通用大型語(yǔ)料庫(kù)中出現(xiàn)頻率的詞,這些詞大概率就是專有名詞。
舉個(gè)例子?,F(xiàn)在有100篇建筑工程的論文,大約100萬(wàn)字。我們的任務(wù)是找出里面的所有專有名詞。當(dāng)然,我們都是懶人,不想人工去找,想讓計(jì)算機(jī)自動(dòng)去做。這時(shí)候,我們就需要一個(gè)大型的通用語(yǔ)料庫(kù),越大越好,比如像COCA那樣5億詞左右的就不錯(cuò)?,F(xiàn)在我們只需要計(jì)算哪些詞在那100篇論文中出現(xiàn)的概率顯著高于其在通用語(yǔ)料庫(kù)出現(xiàn)的概率。一般采用卡方檢驗(yàn)或者計(jì)算對(duì)數(shù)似然率兩種統(tǒng)計(jì)方法來(lái)實(shí)現(xiàn)這個(gè)目的。
“特色”的語(yǔ)言學(xué)應(yīng)用
這個(gè)很簡(jiǎn)單的原理在語(yǔ)言學(xué)上有非常廣泛的應(yīng)用。如果我們已知某些文本屬于同一類,那么我們就可以找出這些文本的“特色”。如果下次我們?cè)诹硗庖粋€(gè)觀察文本中發(fā)現(xiàn)了這些特色,就可以判斷這個(gè)文本屬于那個(gè)類型。
比如,我們搜集到了很多人說(shuō)謊的文本,然后計(jì)算出了說(shuō)謊的文本特征。下次,我們就可以通過一個(gè)人說(shuō)的話是否符合這些特征來(lái)判斷這個(gè)人是否在說(shuō)謊。研究發(fā)現(xiàn),說(shuō)謊者會(huì)更多的使用人稱代詞來(lái)拉開自己和所指之人的距離,比如比爾·克林頓的經(jīng)典謊言:
I did not have sex with that woman.
that woman當(dāng)然是指萊溫斯基??肆诸D避免直呼其名,以拉開自己和她的距離。
研究還發(fā)現(xiàn),說(shuō)謊者更傾向于用完整形式來(lái)回答一般疑問句。
Question: Were you alone then?
一般回答:Yes.
說(shuō)謊者回答:Yes, I was alone then.
上述兩個(gè)例子就是謊言文本的特色,也即謊言文本區(qū)別于非謊言文本的特征。
這和微信小程序有什么關(guān)系?
看到這里,有的朋友已經(jīng)明白了,有的朋友可能還有疑問:“特色”的統(tǒng)計(jì)學(xué)定義的確在語(yǔ)言學(xué)上有廣泛的應(yīng)用,可這和微信小程序有什么關(guān)系?
要回答這個(gè)問題,首先我們必須明白小程序所謂的低頻應(yīng)用場(chǎng)景是個(gè)相對(duì)概念。這里的低頻,是指通常來(lái)說(shuō),大家用的頻率都不高。然而,當(dāng)大家用得都不多,而你用得特別多的時(shí)候,這就是你的“特色”了。
騰訊通過微信已經(jīng)把人分好了類,各種分類都可能有,按年齡的,按職業(yè)的,按性別的,這就相當(dāng)于我們已知某些文本屬于同一類了。但是,每一類人到底在行為上有什么不同的特征呢?這是騰訊想知道的,這是精準(zhǔn)投放廣告的前提。然而,騰訊缺乏這些人群的行為數(shù)據(jù),而這是微信本身接觸不到的,因?yàn)檫@些數(shù)據(jù)分散在各個(gè)應(yīng)用當(dāng)中。
微信想要這些行為數(shù)據(jù),就必須讓這些數(shù)據(jù)流經(jīng)自己的通道。然而,微信不需要那些高頻的行為,因?yàn)楦哳l行為都是趨同的,不具備區(qū)別意義。于是,微信推出小程序,讓其他應(yīng)用的數(shù)據(jù)進(jìn)入自己的通道。同時(shí)通過設(shè)計(jì),使得小程序更適用于低頻應(yīng)用場(chǎng)景,以搜集到具有區(qū)別性特征的行為數(shù)據(jù)。
今天的文章提到了武俠小說(shuō)。雖然現(xiàn)在看武俠小說(shuō)的人已經(jīng)很少了,不過書先生還是想推薦一個(gè)武俠小說(shuō)作者和他的作品。這個(gè)人的作品無(wú)論是文采、立意、謀篇布局都甩金庸幾條街??上淖髌凡欢啵也恢罏槭裁?,名氣不大。我只知道這個(gè)人筆名叫凌霄子,他出版過兩部小說(shuō),一名《龍鳳英雄》,另一名《雪山英雄》,是姊妹篇。書先生只看過《龍鳳英雄》,震撼至今?!堆┥接⑿邸飞袩o(wú)緣拜讀,因?yàn)閷?shí)在是找不到,乃書先生平生憾事。
書先生第一次讀《龍鳳英雄》,驚為天書。情節(jié)構(gòu)思極其宏大,人物關(guān)系異常復(fù)雜,引經(jīng)據(jù)典,信手拈來(lái)。全書幾十章,章節(jié)名皆有出處,不是出自古詩(shī)詞,就是出自名著名言,偏偏又與章節(jié)內(nèi)容貼切至極,作者功底可見一斑。
書先生看金庸的時(shí)候,希望自己也能成為一名武俠小說(shuō)作家,寫出金庸那樣的小說(shuō)。然而,當(dāng)書先生讀過《龍鳳英雄》后,立馬打消了當(dāng)小說(shuō)家的念頭——因?yàn)橛X得無(wú)論如何寫不出這樣的作品來(lái)。這種絕望感,相信每一個(gè)認(rèn)真讀過喬姆斯基和韓禮德著作的語(yǔ)言學(xué)學(xué)生都曾經(jīng)體會(huì)過。
讓你感到絕望的才是真正的高手。