第018封信丨期望值最大化原則和它在生活上的應用

我們聊了幾次信息時代管理的原則。世界上很多原理是相通的,科學上很多理論后來被用于了管理,而管理學的很多原理,也可以找到科學根據(jù)。今天我們來聊最優(yōu)化理論和信息論中一個重要的方法——期望值最大化(Expectation Maximization)。它一方面是今天各種機器學習算法重要的理論基礎,另一方面在管理學又有非常廣泛的應用,并能指導現(xiàn)實生活。

只要給出一個收益函數(shù)(也稱為利潤函數(shù)或者成本函數(shù),因為利潤的反面可以理解為成本)

在每一時刻,算出能夠最大化收益(期望值)的方向,沿著這個方向走一小步,然后再從新的起點重復這個過程,不論從何處起始,最后一定能夠達到收益最大的那個終點。

當然,上面這段描述或許還有一點抽象,我舉兩個現(xiàn)實生活中的例子你就好理解了。比如,前一陣中國足球隊在主場輸給小組最弱的對手敘利亞后,又客場輸給了烏茲別克斯坦隊,提前告別了俄羅斯世界杯。經(jīng)過近四十年快兩代人的努力,中國足球終于從亞洲強隊變?yōu)榱藖喼捃浭磷?,雖然各級領導著急,但是無論是砸錢還是換帥都沒有用。其實有一個很簡單的方法,不僅讓中國足球能夠沖出亞洲,而且有望奪得世界冠軍。只要教育部宣布,從今往后高考一半分數(shù)看文化課成績,另一半看足球成績,馬上中國所有的廣場都會被踢球的孩子占領,大媽奶奶們?yōu)榱藘鹤訉O子,也不跳廣場舞了,所有的家長給孩子安排的課外活動都會是足球,各省市都會往足球上砸錢。類似地,如果宣布百米跑成績占高考成績的一半,滿大街都是沖刺的人,中國不知道能出多少個奧運冠軍呢。

高考中足球或者百米成績,就是前面說的收益函數(shù),只要這個函數(shù)一確定,整個社會就變成了一個機器學習的系統(tǒng),期望值最大化方法會自動優(yōu)化全社會,讓足球成績達到最大值。

期望值最大化方法也被看成是宇宙演變和物種進化背后的動力。在宇宙的演化中,物理學的基本原理,比如各物質之間的四種基本作用力,其實就是收益函數(shù),質子和中子通過強核力形成原子核,弱核力保證原子核不要太大,電磁力保證原子核和電子能夠形成原子,以及原子可以結合形成各種分子乃至萬物,萬有引力保證物質能夠形成星球,等等。宇宙的演變其實就是在這很少的幾條規(guī)則限制下不斷優(yōu)化的過程,最后孕育出生命。而物種的進化也是如此,其實是我們的DNA不斷優(yōu)化適應環(huán)境過程。

在人和人的關系上,在一個組織內(nèi)部,也是不自覺地按照期望值最大化方法在不斷完善。一個人交朋友,開始可能有比較大的隨意性,但是他內(nèi)心有一個衡量標準(收益函數(shù)),就是最大化自己的收益,久而久之,對他好的人,能彼此產(chǎn)生“化學反應”的人,以及距離比較近(方便于幫助他)的人,就成了他的朋友,其它人就漸漸淡出了他的生活圈。當然,每個人內(nèi)心里的收益函數(shù)是不同的。在一個組織內(nèi),尤其是一個公司里,更是如此,創(chuàng)始人定下一個什么樣的價值觀(收益函數(shù)),員工就會不自覺地會去朝著收益最大化的方向努力。有一家大公司在制定年終獎標準時,把每個員工一半的獎金和他對公司價值觀的認可掛鉤,久而久之你就發(fā)現(xiàn)他們的員工出去說話都怪怪的,有意無意在宣傳他們的價值觀。外人是否相信不知道,但是天天說至少把自己都說得相信了。

在美國IBM公司把申請專利和員工績效掛鉤,于是它就成了歷年來獲得美國專利的絕對冠軍。Google對員工發(fā)專利最初有不錯的激勵機制(收益函數(shù)),但是一度因為為了省那點小錢,大幅降低了對員工申請專利的獎勵。我當時就和全公司主管科研的尤斯塔斯講,雖然我不在乎那點錢,依然會申請專利,但是絕大部分員工一定懶得申請專利,吃虧的一定是公司。尤斯塔斯對我講,我們現(xiàn)在不斷教育員工專利的重要性,也相信員工不會因為少了一千塊獎金就不申請專利,但結果卻是Google人均申請專利數(shù)量銳減,以至于后來在和微軟、蘋果的專利之爭上非常被動。于是Google一改政策,申請一個專利可以獲得1萬美元的獎金,很快在專利榜上默默無聞的Google一下子擠進了前十名。從這些例子可以看出,公司設置什么樣的收益函數(shù),員工就會最大化它。這也是我為什么在商學院講課時反復強調,創(chuàng)始人的基因會決定公司的基因,以及創(chuàng)始人一開始最重要的事情就是定規(guī)矩。Google從小公司開始,給單元測試寫得好的員工發(fā)獎,給代碼經(jīng)常出錯的員工小的懲戒,于是它自然而然地發(fā)展成一個重視工程質量的公司。Facebook從一開始就強調產(chǎn)品的迭代速度,因此它就成為一個以產(chǎn)品(而非技術)驅動的公司。有的公司一開始就給部門訂銷售指標,那些公司就成為只盯著下個季度KPI的短視的公司。

我有時看到一些公司,大會小會教育員工,而下面的人都在玩手機,不禁搖頭。其實在一個現(xiàn)代的組織中,但凡有點獨立思考能力的人都會發(fā)現(xiàn)那些領導有意無意設定的收益函數(shù),然后不自覺地調整自己的行為去最大化自己的利益。與其教育員工,不如設置一個好的收益函數(shù)。既然宇宙的演變都遵循這樣的規(guī)律,又怎么可能要求員工降低自己的期望值同時又保證公司的收益呢?

如果你是老板,不妨給大家設置一個好的收益函數(shù),如果你是員工,按照公司的章程,最大化自己的利益是合情合理的事情。科學原理不僅適用于科學本身,也適用于生活。

自己的觀點:經(jīng)過驗證過的普遍真理除了踏踏實實去應用別無二法。給員工設定的收益函數(shù),核心還是跟個人切身利益相關的,金錢回報,發(fā)展機會等。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容