《程序員的吶喊》讀書筆記(下)

接著《程序員的吶喊》讀書筆記(上),繼續(xù)分享下篇,這次干貨比較多哦,有靜動態(tài)類型的優(yōu)缺點、強弱類型系統(tǒng)的對抗、設計模式、程序員的數(shù)學、編譯器的重要性以及保守派自由派的較量,一時消化不了的建議保存以便read it later。


靜態(tài)類型和動態(tài)類型的優(yōu)缺點

  1. 靜態(tài)類型的優(yōu)點
    下面列出了靜態(tài)類型的主要優(yōu)點:
    (1)靜態(tài)類型可以在程序運行之前,依賴其與生俱來的限制來及早發(fā)現(xiàn)一些類型錯誤。(或是在插入/更新記錄,解析XML文檔等情況下進行檢測。)
    (2)靜態(tài)類型有更多機會(或者說更容易)優(yōu)化性能。例如只要數(shù)據(jù)模型完整豐富,那么實現(xiàn)智能化的數(shù)據(jù)庫索引就會更容易一些。編譯器在擁有更精確的變量和表達式類型信息的情況下可以做出更優(yōu)的決策。
    (3)在C++和Java這樣擁有復雜類型系統(tǒng)的語言里,你可以直接通過查看代碼來確定變量、表達式、操作符和函數(shù)的靜態(tài)類型。
    這種優(yōu)勢或許在ML和Haskell這樣的類型推導語言里并不明顯,他們顯然認為到哪里都要帶著類型標簽是缺點。不過你還是可以在有助閱讀理解的情況下標明類型一而這些在絕大多數(shù)動態(tài)語言里是根本做不到的。
    (4)靜態(tài)類型標注可以簡化特定類型的代碼自動化處理。比如說自動化文檔生成、語法高亮和對齊、依賴分析、風格檢查等各種“讓代碼去解讀代碼”的工作。換句話說,靜態(tài)類型標簽讓那些類似編譯器的工具更容易施展拳腳:詞法工具會有更多明確的語法元素,語義分析時也比較少要用猜的。
    (5)只要看到API或是數(shù)據(jù)庫結構(而不用去看代碼實現(xiàn)或數(shù)據(jù)庫表)就能大致把握到它的結構和用法。
    還有其他要補充的嗎?

  2. 靜態(tài)類型的缺點如下:
    (1)它們人為地限制了你的表達能力。
    比如,Java的類型系統(tǒng)里沒有操作符重載、多重繼承、mix-in、引用參數(shù)、函數(shù)也不是一等公民。原本利用這些技術可以做出很自然的設計,現(xiàn)在卻不得不去遷就java的類型系統(tǒng)。無論是Ada還是C++,或是OCaml等任何一種靜態(tài)類型系統(tǒng)都有這樣的問題。差不多半數(shù)的設計模式(不光是Gof的那些)都是扭曲原本自然直觀的設計,好將它們塞進某種靜態(tài)類型系統(tǒng):這根本就是方枘圓鑿嘛。
    (2)它們會拖慢開發(fā)進度。
    事先要創(chuàng)建很多靜態(tài)模型(自頂向下的設計),然后還要依據(jù)需求變化不斷修改。這些類型標注還會讓源代碼規(guī)模膨脹導致代碼難以理解,維護成本上升。(這個問題只在Java里比較嚴重,因為它不支持給類型取別名。)還有就是我上面已經(jīng)提到過的,你得花更多的時間來調整設計,以適應靜態(tài)類型系統(tǒng)。
    (3)學習曲線比較陡。
    動態(tài)類型語言比較好學。靜態(tài)類型系統(tǒng)則相對挑剔,你必須花很多時間去學它們建模的方式,外加靜態(tài)類型的語法規(guī)則。另外,靜態(tài)類型錯誤(也可以叫編譯器錯誤)對于初學者來說很難懂,因為那時程序根本還沒跑起來呢。你連用printf來調試的機會都沒有,只能撞大運似的調整代碼,祈求能讓編譯器滿意。因此學習C++比C和Smalltalk難,OCaml比Lisp難,Nice語言比Java難。而Perl所具備的一系列靜態(tài)復雜性—各種詭異的規(guī)則,怎么用,什么時候用等—讓它的難度比Ruby和Python都要高。我從來沒見過有哪門靜態(tài)類型語是很好學的。
    (4)它們會帶來虛幻的安全感。
    靜態(tài)類型系統(tǒng)確實能減少運行時的錯誤,提升數(shù)據(jù)的完整性,所以很容易誤導人們覺得只要能通過編譯讓程序跑起來,那它基本上就沒什么bug了。人們在用強靜態(tài)類型系統(tǒng)的語言寫程序時似乎很少依賴單元測試,當然這也可能只是我的想像罷了。
    (5)它們會導致文檔質量下滑。
    很多人覺得自動生成的javadoc就足夠了,哪怕不注釋代碼也沒關系, Sourceforge 上充斥著這樣的項目,甚至連Sun JDK也常常有這個問題。(比如,Sun很多時候都沒有給static final常量添加javadoc注釋。)
    (6)很難用它們寫出兼具高度動態(tài)和反射特點的系統(tǒng)。
    絕大多數(shù)靜態(tài)類型語言(大概)都出于追求性能的目的,在運行時丟棄了幾乎所有編譯器生成的元數(shù)據(jù)。可是這樣一來這些系統(tǒng)通常也就很難在運行時作出修改(甚至連內省都做不到)比如,若要想給模塊加一個新函數(shù),或是在類里加個方法,除了重新編譯,關閉程序然后重啟之外別無他法。受此影響的不單是開發(fā)流程整個設計理念也難逃波及。你可能需要搭建個復雜的架構來支持動態(tài)功能而這些東西會無可避免地和你的業(yè)務代碼混在一起。

  3. 動態(tài)類型的優(yōu)缺點:
    只要把上面的列表對調一下,你基本上就可以列出動態(tài)類型語言的優(yōu)缺點了。動態(tài)語言的表達能力更強,設計靈活度也更大;易學易用,開發(fā)速度快;通常運行時的靈活性也更高。相對地,動態(tài)語言無法及時給出類型錯誤(至少編譯器做不到),性能調優(yōu)的難度也比較高,很難做自動化靜態(tài)分析,另外,變量和表達式的類型在代碼里很不直觀,沒辦法一眼看出來。
    靜態(tài)語言最終會向用戶屈服開始添加一些動態(tài)特性,而動態(tài)語言常常也會嘗試引入一下可選的靜態(tài)類型系統(tǒng)(或是靜態(tài)分析工具),此外它們還會設法改善性能增加錯誤檢測,以便及早發(fā)現(xiàn)問題。很遺憾,除非一開始設計語言的時候就考慮到可選的靜態(tài)類型,否則強扭的瓜怎么也不會甜的。

強類型與弱類型系統(tǒng)的較量

  1. 下面我會以稍微有點戲謔的方式解釋這兩種理念(指的是強類型和弱類型)的工作流程,盡可能將它們本質區(qū)別展現(xiàn)出來。
    強類型陣營基本是這樣工作的:首先是按照當前的需求進行設計;制定出文檔哪怕只是初稿也沒關系;然后定義接口和數(shù)據(jù)模型。假設系統(tǒng)要承受巨大流量,因此每個地方都要考慮性能。避免采用垃圾收集和正則表達式這類抽象。(注意:即便是Java程序員,通常也會努力避免觸發(fā)垃圾收集,他們總是在開始寫程序之討論對象池的問題。)
    他們只有在無計可施的情況下才會考慮動態(tài)類型。例如,一支采用Corba的團隊只有在極端情況下才會在每個接口調用上添加一個XML字符串參數(shù),這樣他們就能繞開當初選擇的死板的類型系統(tǒng)了。

第二個陣營基本是這樣工作的:先搭建原型。只要你寫代碼的速度比寫同等詳細程度的文檔快,你就可以更早地從用戶那里獲得反饋。按照當下的需求定義合理的接口和數(shù)據(jù)模型,但是別在上面浪費太多時間。一切以能跑起來為準,怎么方便怎么來。假設自己肯定要面對大量的需求變化,所以每個地方首先考慮的是盡快讓系統(tǒng)運行起來。能用抽象的地方就盡量用(比如如每次都去收集數(shù)據(jù)而先不考慮緩沖,能用正則的地方就先不用字符串比較)就算明明知是牛刀也沒關系,因為你換回的是更大的靈活性。代碼量比較少,通常bug的數(shù)量也會更少。
他們只有在被逼無奈的情況下才會進行性能調優(yōu)以及禁止修改接口和數(shù)據(jù)定義。例如,一支Perl團隊可能會將一些關鍵的核心模塊用C重寫,然后創(chuàng)建XS綁定。時間—長,這些抽象就漸漸變成了既定標準,它們被包裹在數(shù)據(jù)定義和細致的OO接口里,再也無法修改。(就算是Perl程序員也常常會忍不住祭出銀彈,為常用的抽象編寫OO接口)
那你覺得最終采用這些策略的結果會怎么樣?

設計模式

  1. 不過現(xiàn)在大家都清醒過來了,不是嗎?設計模式不是特性。工廠不是特性,委托、代理、橋接也都不是。它們只是提供了漂亮的盒子,以松散的方式來裝載特性。但是別忘了,盒子、袋子和隔板自己也是要占用空間的。設計模式也不例外(至少在“四人幫”的書里所介紹的大多數(shù)模式都是這樣)。更悲劇的是“四人幫”模式里唯一能精簡代碼的解釋器(Interpreter)模式卻被那些恨不得把設計模式紋在身上的程序員忽略了。
    依賴注入是另一個新型的Java設計模式,Ruby、Python、Perl還有Javascript,程序員大概聽都沒聽過吧。就算他們聽過,他們也能正確地得出他們根本不需要這種玩意兒的結論。依賴注入是一種驚人的描述式架構,讓Java能在某些方面和更高級的語言一樣,變得更動態(tài)一點。你猜得沒錯,依賴注入會讓Java代碼變得更大。變大是Java中無法回避的東西。成長是生活的一部分。Java就像是俄羅斯方塊,不過積木和積木之間的空隙都填不滿,結果只能越堆越高。

me:現(xiàn)在Java程序員相信都知道依賴注入了,因為它太重要了,用在各大框架里,比如spring,依賴注入使得能夠在文件里配置類及其各種關系,當然使得Java更靈活更強大了。

程序員需要了解的是哪些數(shù)學分支?

  1. 實際生活中,計算機科學家常用的數(shù)學和上面那個列表幾乎沒有重疊。其一,小學和中學里教的絕大部分數(shù)學都是連續(xù)的,也就是實數(shù)上的數(shù)學。而對計算機科學家來說,95%有趣的數(shù)學都是離散的,也就是整數(shù)上的數(shù)學。

me:程序員所要解決的數(shù)學問題一般都是離散數(shù)學,其中最有用的課程應該就是組合數(shù)學和概率論統(tǒng)計。

  1. 除了概率論和離散數(shù)學,其他數(shù)學分支也是有助于程序員的??上С悄闳ポo修數(shù)學,否則學校是不會教你的。它們包含了:
    (1) 統(tǒng)計。我的離散數(shù)學書里講到了一點。但是統(tǒng)計是一門完整的學科,而且是非常重要的學科,重要到根本不需要額外介紹。
    (2)代數(shù)和線性代數(shù)(比如矩陣)。線性代數(shù)應該緊跟在代數(shù)后面教。它不是很難,而且在很多領域都非常非常有用,比如機器學習。
    (3)數(shù)理邏輯。
    (4)信息論和柯氏復雜度。信息論(粗略地講)主要是關于數(shù)據(jù)壓縮的,而柯氏復雜度(同樣粗略地講)則是關于算法的復雜度(比如最小空間是多少,需要多長時間,程序或者數(shù)據(jù)結構有多優(yōu)雅等)的。它們都是好玩,有趣,實用的學科。
    當然還有其他的分支,而且有些學科互有重疊。但重點在于:對你有用的數(shù)學和學校覺得有用的數(shù)學是非常不同的。
  2. 微積分的本質就是連續(xù)一變化的速度,曲線下的面積,固體的體積。很有用,記憶和很多煩瑣的步驟程序員通常不需要這些東西。知道大致概但是需要大量的概念和技巧就可以了,細節(jié)方面等到需要的時候再查也來得及。

編譯器,你懂嗎?

  1. 我在招人的時候有一個訣竅。就是在尋找優(yōu)秀的軟件工程師“通才”的時候,通常在簡歷上你可以看到到各種讓你覺得不行的關鍵字和詞,但“編譯器”是我唯一感興趣的詞。

me:作者強烈要求程序員學編譯器原理,你還記得嗎?

  1. 編譯器會接收一串符號流,根據(jù)預先定義好的規(guī)則,分析出這串符號的結構,然后把它轉換成另一串符號流。是不是很籠統(tǒng)?的確是。一幅圖片能不能被當成是符號流?當然可以。它可以是每一行像素所組成的流。每個像素就是一個數(shù)字。每個數(shù)字就是一個符號。編譯器當然可以轉換圖片。英語可以被當做符號流叫嗎?當然可以。規(guī)則或許會很復雜,但是自然語言處理的確可以被看成是某種很炫的編譯。
  2. 編譯過程中第一個大階段就是解析,即把輸入的內容變成一棵樹。中間要經(jīng)過預處理,詞法分析(也叫單詞化)然后是語法分析和中間代碼生成這幾個步驟。詞法分析通常是由正則表達式來完成的。語法分析則是根據(jù)語法完成。你可以采遞歸向下(最常見)或是解析器生成器(在小語言中比較常見)或是更炫的算來實現(xiàn),只不過相應的執(zhí)行速度也會慢一點。無論如何,最后的結果通常都是某解析樹。
    第二個大階段是類型檢查。這是一群狂熱的學術分子(包括他們的組織以及或者手下的研究生)他們自信可以寫出非常聰明的程序,能分析出你的程序想干什么,并且在你出錯的時候幫你指出。不過奇怪的是,他們并不覺得自己是在研究人工智能畢竟人工智能界已經(jīng)(明智地)放棄確定性的方法了。
    第三個陣營是代碼生成,他們通常都被邊緣化了。只要你對遞歸有足夠的了解,知道自己的祖先不是亞當和夏娃,那么代碼生成還是挺直觀的。這里要講的其實是優(yōu)化就是那種生成足夠正確的代碼,讓絕大多數(shù)用戶都意識不到有問題的藝術。等等不好意思,這是亞馬遜化。優(yōu)化是指根據(jù)你那些昂貴的菜鳥程序員寫出來的垃圾代碼生成“正確”代碼的藝術。

保守派和自由派,你屬于哪派?

  1. 軟件工程有自己的政治軸心,—端是保守派,另—端是自由派。
    畢竟“保守的”這個形容詞基本上和謹慎、厭惡風險就是同義詞。金融上的保守主義常常(也是顯而易見的)和年齡以及財富聯(lián)系在一起。公司會隨著時間逐漸變得保守起來,因為它們熬過過了各種法律訴訟、技術失敗、公共危機、金融風暴等危機。連螞蟻和蚱蜢的寓言故事都告訴我們寒冬將至,要儲存食物。
    本質上,保守主義就是風險管理。
    同樣自由派的觀點常常和年輕、理想主義、天真無邪聯(lián)系在一起。在企業(yè)里,創(chuàng)業(yè)公司往往是典型的自由派,一部分原因是他們本來就是為了(在一定程度上)改變世界而存在的(而自由主義原本就意味著變化),另一部分則是他們必須全力以赴完成投資人設定的目標,所以放棄一點軟件安全也就變得合理(不得已)了。

me:保守派,盡量修復所有bug,回避錯誤,學不會新語法,通過編譯器安全檢查,數(shù)據(jù)必須遵循事先定義好的格式,公共接口必須嚴格建模,生產(chǎn)系統(tǒng)里絕不允許存在危險過有風險的后門,安全性有疑慮就不能上線,快比慢好,注重性能。自由派則相反。

  1. 各大語言的分派:(作者自己使用語言的經(jīng)驗,僅供參考)
    難以言喻的自由:匯編語言
    極端自由:Perl、Ruby、PHP、腳本
    非常自由:Javascript、VB、Lua
    自由:Python、Common Lisp、Smalltalk/Sqeak
    溫和自由:C、Object-C、Schema
    溫和保守:C++、Java、C#、D、Go
    保守:Clojure、Erlang、Pascal
    非常保守:Scala、Ada、Ocaml、Eiffel
    極端保守:Haskell、SML

  2. (1)Facebook是極端自由的。他們主要用的是C++和PHP,他們的數(shù)據(jù)都放在memcached里:只有鍵值對,沒有數(shù)據(jù)庫結構。他們把數(shù)據(jù)導出來放到一個后臺Hⅳe數(shù)據(jù)倉庫里,然后用Hadoop來進行離線數(shù)據(jù)分析。每兩個星期左右他們仍然會舉辦通宵黑客馬拉松,反正他們的程序員大多都是單身男青年(至少我上次去參觀的時候還是如此),股票的估值也還很高(我上次查價格的時候好像已經(jīng)沒那么好了)。作為一家公司,F(xiàn)acebook是非常緊密的,具有很強的執(zhí)行力,十分注重程序員在網(wǎng)站上發(fā)布新功能的單兵能力,沒有什么官僚主義。這對一家規(guī)模這么大、用戶那么多多的公司來講是難能可貴的。保守派毫無疑問會厭惡蔑視他們。但是Facebook證明了不管具有什么世界觀的程序員,只要聯(lián)合起來,就能解決很多問題。
    (2)Amazon是自由的。
    (3)Google是保守的。開始是有點自由的 ,然后就變得越來越保守了。只有在剛剛開始的時候才是軟件自由的,那時候的搜索引擎是用Python寫的。隨著公司不斷壯大,他們很快就轉向了軟件保守主義,而這完全是由工程師自己主導的。他們寫了很多宣言警告太多語言所帶來的危險,而僅有的幾門語言里,也里,也有嚴格的風格指南,限制使用那些端保守,險”或者“難以閱讀”的語言特性。
    (4)微軟是難以言喻的保守。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容