【蒸汽教育求職干貨】LLM時(shí)代,傳統(tǒng)ML崗位還有前途嗎?——一位機(jī)器學(xué)習(xí)工程師的深度思考

你有沒(méi)有看過(guò)電影《星際穿越》?我最近老是想起里面主角庫(kù)珀掉進(jìn)黑洞的那個(gè)場(chǎng)景。五維空間里,時(shí)間被拉伸成實(shí)體,過(guò)去、現(xiàn)在、未來(lái)在你面前同時(shí)展開(kāi)。那種感覺(jué),混雜著恐懼、未知,但又隱隱約約透著一種進(jìn)入全新維度的興奮。我覺(jué)得,這跟現(xiàn)在我們這些搞機(jī)器學(xué)習(xí)(ML)的人看大語(yǔ)言模型(LLM)的心情,簡(jiǎn)直一模一樣。

前兩周,我輔導(dǎo)過(guò)的一個(gè)學(xué)生,是個(gè)非常優(yōu)秀的男生,拿到了一個(gè)傳統(tǒng)機(jī)器學(xué)習(xí)工程師(MLE)的offer,薪資和頭銜都相當(dāng)不錯(cuò)。但他半夜三點(diǎn)給我發(fā)微信,字里行間全是焦慮。他說(shuō):“老師,我感覺(jué)我還沒(méi)畢業(yè)就要‘過(guò)時(shí)’了?,F(xiàn)在網(wǎng)上鋪天蓋地都是生成式人工智能(GenAI)和LLM,我學(xué)的這些XGBoost、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、推薦系統(tǒng),是不是馬上就要被扔進(jìn)歷史的垃圾堆了?”

我太理解他的感受了。這種恐慌是實(shí)實(shí)在在的,就像你坐在電影院里,看著庫(kù)珀的飛船被黑洞的引力無(wú)情地撕扯。但我想跟大家說(shuō),別害怕,主動(dòng)權(quán)其實(shí)還在我們自己手中。這根本不是一個(gè)時(shí)代的終結(jié),恰恰相反,這是機(jī)器學(xué)習(xí)領(lǐng)域“第二曲線”的開(kāi)啟。

所謂的“時(shí)代終結(jié)”,不過(guò)是個(gè)偽命題

我們先來(lái)剖析一下這種恐慌究竟從何而來(lái)。原因很簡(jiǎn)單,LLM的能力太過(guò)強(qiáng)大。它能幫你編寫(xiě)代碼,能自動(dòng)分析數(shù)據(jù),甚至連模型調(diào)參這種以前被認(rèn)為是“煉丹師”核心手藝的活兒,它都能參與其中。這就使得很多人感覺(jué),自己賴以為生的“手藝”,在一夜之間被徹底顛覆了,這種感覺(jué)實(shí)在是離譜。

但是,咱們先把這事兒弄清楚。工具的進(jìn)化,從來(lái)都不等同于從業(yè)者的消亡。計(jì)算器被發(fā)明出來(lái)的時(shí)候,數(shù)學(xué)家失業(yè)了嗎?并沒(méi)有,他們反而能夠從繁瑣的計(jì)算中解脫出來(lái),去探索更深層次的數(shù)學(xué)領(lǐng)域。Windows圖形界面出現(xiàn)的時(shí)候,程序員失業(yè)了嗎?同樣沒(méi)有,他們不用再死磕匯編語(yǔ)言,可以去構(gòu)建更宏大、更復(fù)雜的軟件系統(tǒng)。

LLM,就是我們這個(gè)時(shí)代的“計(jì)算器”和“圖形界面”。它所替代的是那些重復(fù)性的、有固定范式的勞動(dòng),但它替代不了人的創(chuàng)造力、系統(tǒng)思維以及對(duì)商業(yè)問(wèn)題的深刻理解。

我跟一位在谷歌做推薦系統(tǒng)架構(gòu)師的朋友交流過(guò),他給我舉了一個(gè)特別生動(dòng)的例子。他們組的核心廣告推薦引擎,直到今天,發(fā)揮主要作用的依然是經(jīng)典的XGBoost和LightGBM模型。這是為什么呢?因?yàn)樵趶V告這種對(duì)每一分錢都要精打細(xì)算的商業(yè)場(chǎng)景中,模型的可解釋性、訓(xùn)練成本和推理速度,是決定成敗的關(guān)鍵因素。你得清楚地知道,為什么這個(gè)廣告會(huì)推送給這個(gè)用戶,每一次推薦的成本是多少,延遲高了0.1毫秒會(huì)對(duì)收入產(chǎn)生多大的影響。而這些,目前的LLM還無(wú)法提供如此精確的信息,它的輸出太模糊了。

那么,LLM在他們系統(tǒng)中扮演著什么角色呢?我朋友說(shuō),LLM是一個(gè)非常強(qiáng)大的“特征提取器”和“召回工具”。他們會(huì)利用LLM去理解用戶的搜索意圖、分析商品評(píng)論的情感,把這些非結(jié)構(gòu)化的信息,轉(zhuǎn)化為高質(zhì)量的嵌入表示(embedding),然后輸送給下游的傳統(tǒng)模型,從而實(shí)現(xiàn)更精準(zhǔn)的排序。由此可見(jiàn),LLM并非取代了傳統(tǒng)模型,而是作為其一部分,讓整個(gè)系統(tǒng)變得更加強(qiáng)大。它們是并肩作戰(zhàn)的戰(zhàn)友,而非相互敵對(duì)的對(duì)手。

版本更新了,你的技能點(diǎn)加對(duì)了嗎?

所以,問(wèn)題并非是“要不要轉(zhuǎn)行”,而是“技能樹(shù)要如何重新規(guī)劃”。這就好比打游戲,游戲版本更新了,你不能直接刪號(hào)重練,而是要深入研究新的天賦系統(tǒng),把技能點(diǎn)加在最關(guān)鍵的地方。

有些“內(nèi)功心法”是永遠(yuǎn)不會(huì)過(guò)時(shí)的,它們是你安身立命的根基,無(wú)論技術(shù)版本如何變化,這些東西都能讓你在行業(yè)中立于不敗之地。

首先是數(shù)學(xué)基礎(chǔ),比如統(tǒng)計(jì)學(xué)、概率論、線性代數(shù)。說(shuō)真的,現(xiàn)在居然還有人覺(jué)得這些東西沒(méi)什么用。這些知識(shí)是理解所有模型的“第一性原理”。沒(méi)有扎實(shí)的數(shù)學(xué)基礎(chǔ),你看模型就永遠(yuǎn)如同面對(duì)一個(gè)黑箱,一旦模型出現(xiàn)問(wèn)題,你連調(diào)試的方向都找不到。你可能只會(huì)無(wú)奈地說(shuō)“我靠,又出問(wèn)題了”,而一個(gè)數(shù)學(xué)基礎(chǔ)扎實(shí)的人則會(huì)冷靜地分析“看起來(lái)是梯度消失了,我檢查一下激活函數(shù)”。這兩者之間的差距顯而易見(jiàn)。

其次是經(jīng)典算法的運(yùn)用智慧。你得清楚,在什么情況下該使用邏輯回歸,什么時(shí)候適合采用深度學(xué)習(xí),什么時(shí)候一個(gè)簡(jiǎn)單的規(guī)則系統(tǒng)就足以解決問(wèn)題。對(duì)問(wèn)題邊界的準(zhǔn)確判斷能力,是區(qū)分高級(jí)工程師和初級(jí)工程師的核心標(biāo)準(zhǔn)。并不是所有問(wèn)題都需要?jiǎng)佑谩皻炐桥灐奔?jí)別的技術(shù),有時(shí)候一把“瑞士軍刀”就能更高效地解決問(wèn)題。

當(dāng)然,最重要的還是數(shù)據(jù)處理和特征工程。“垃圾進(jìn),垃圾出”,這個(gè)真理永遠(yuǎn)不會(huì)過(guò)時(shí)。無(wú)論模型本身多么強(qiáng)大,如果你給它提供的是一堆質(zhì)量不佳的數(shù)據(jù),那么它產(chǎn)出的結(jié)果也只能是更糟糕的。對(duì)業(yè)務(wù)數(shù)據(jù)有深刻的理解,能夠從原始日志中清洗、構(gòu)建出高質(zhì)量特征的能力,永遠(yuǎn)是機(jī)器學(xué)習(xí)工程師的核心競(jìng)爭(zhēng)力。

接下來(lái),是你必須立刻擁抱的“新式武器”。這些是當(dāng)前技術(shù)版本更新的重點(diǎn)內(nèi)容,如果你不學(xué)習(xí),就很可能會(huì)被行業(yè)淘汰。

第一個(gè)就是機(jī)器學(xué)習(xí)運(yùn)維(MLOps)與面向大語(yǔ)言模型的運(yùn)維(LLMOps)。說(shuō)到這兒,我想起一件事——我見(jiàn)過(guò)太多學(xué)生,他們簡(jiǎn)歷上寫(xiě)的項(xiàng)目,全都是在Jupyter Notebook里運(yùn)行出來(lái)的。模型精度可能刷得很高,但你要是問(wèn)他,這個(gè)模型如何部署上線?怎樣進(jìn)行版本控制?如何監(jiān)控它的線上表現(xiàn)?他往往一問(wèn)三不知。這就是現(xiàn)在企業(yè)極為頭疼的“筆記本工程師”現(xiàn)象。從在Notebook中進(jìn)行實(shí)驗(yàn)到將模型投入實(shí)際生產(chǎn)環(huán)境,這中間的巨大鴻溝,正是現(xiàn)在面試時(shí)最為看重的地方。你需要學(xué)會(huì)使用Docker來(lái)打包你的模型,用Kubernetes進(jìn)行服務(wù)編排,用Prometheus進(jìn)行監(jiān)控,用持續(xù)集成/持續(xù)交付(CI/CD)工具鏈實(shí)現(xiàn)自動(dòng)化部署。這才是真正的“工程”能力。

第二個(gè)是機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)(ML System Design)。系統(tǒng)設(shè)計(jì)面試正在經(jīng)歷一場(chǎng)“復(fù)興”。面試官不再滿足于讓你“設(shè)計(jì)一個(gè)推特(Twitter)的信息流”,他們會(huì)提出更具體、更貼近實(shí)際的問(wèn)題,例如:“如果讓你用LLM來(lái)優(yōu)化YouTube的視頻推薦系統(tǒng),你會(huì)如何設(shè)計(jì)?怎樣處理實(shí)時(shí)推薦的延遲問(wèn)題?如何評(píng)估LLM帶來(lái)的真實(shí)業(yè)務(wù)提升?如何控制高昂的API調(diào)用成本?”這類問(wèn)題沒(méi)有標(biāo)準(zhǔn)答案,考察的是你對(duì)整個(gè)系統(tǒng)的權(quán)衡和取舍能力。

第三個(gè)是LLM的集成與微調(diào)。要記住,要把LLM當(dāng)作一個(gè)“組件”,而不是“萬(wàn)能的上帝”。你得學(xué)會(huì)如何利用公司自己的業(yè)務(wù)數(shù)據(jù),對(duì)像Llama 3這樣的開(kāi)源大模型進(jìn)行微調(diào),使其更貼合你的業(yè)務(wù)需求。你還需要學(xué)會(huì)如何將LLM的輸出,作為下游傳統(tǒng)分類模型的輸入,從而進(jìn)行更精細(xì)化的判斷。這種將不同技術(shù)“粘合”在一起的“膠水”能力和“整合”思維,在當(dāng)今的行業(yè)中極為稀缺。

當(dāng)然,有些技能的重要性正在相對(duì)“降低”。這并不是說(shuō)這些技能完全沒(méi)用了,而是它們的性價(jià)比越來(lái)越低了。比如,在Jupyter Notebook里無(wú)休止地手動(dòng)調(diào)參。如今有太多自動(dòng)化的AutoML工具可供使用,你花三天三夜調(diào)出來(lái)的參數(shù),可能還不如機(jī)器運(yùn)行半個(gè)小時(shí)的效果好。你的時(shí)間,應(yīng)該投入到更有價(jià)值的事情上。再比如,從零開(kāi)始復(fù)現(xiàn)一個(gè)已有的最優(yōu)模型(SOTA模型)。除非你的目標(biāo)是從事純粹的研究工作,否則在工業(yè)界,這種工作的價(jià)值正在迅速下降。有那么多現(xiàn)成的、經(jīng)過(guò)優(yōu)化的開(kāi)源模型可供使用,何必非要自己從頭開(kāi)始造輪子呢?老板很可能會(huì)覺(jué)得你的做法不太明智。

行業(yè)在“用腳投票”,你跟上了嗎?

你或許會(huì)說(shuō),這些只是你個(gè)人的觀點(diǎn)。那么,我們來(lái)看看行業(yè)自身的看法以及企業(yè)的實(shí)際做法。畢竟,企業(yè)是用真金白銀在招聘人才,他們的行為最具說(shuō)服力。

面試趨勢(shì)的變化是最直接的信號(hào)。我一位在谷歌做面試官的朋友告訴我,他們現(xiàn)在面試機(jī)器學(xué)習(xí)工程師崗位時(shí),花在機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)上的時(shí)間,已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)的算法題。他分享了一個(gè)他最近經(jīng)常問(wèn)到的問(wèn)題:“假設(shè)你是谷歌廣告(Google Ads)團(tuán)隊(duì)的工程師,現(xiàn)在我們想利用Gemini來(lái)自動(dòng)生成廣告文案,你會(huì)如何設(shè)計(jì)這個(gè)系統(tǒng)?需要考慮哪些模塊?如何建立A/B測(cè)試的框架來(lái)驗(yàn)證新系統(tǒng)的有效性?如果發(fā)現(xiàn)生成的文案存在冒犯性內(nèi)容,你的應(yīng)急預(yù)案是什么?”

從這個(gè)問(wèn)題的設(shè)置可以看出,其中純粹的LLM知識(shí)只占一小部分,更多的內(nèi)容是在考察系統(tǒng)設(shè)計(jì)、評(píng)估框架、風(fēng)險(xiǎn)控制意識(shí)等綜合能力。如果你僅僅只會(huì)調(diào)用一個(gè)API,是絕對(duì)無(wú)法回答好這個(gè)問(wèn)題的。

企業(yè)的真實(shí)需求也很快從初期的狂熱狀態(tài)中冷靜下來(lái)。去年上半年,確實(shí)有不少企業(yè)一窩蜂地涌入這個(gè)領(lǐng)域,招聘了一堆所謂的“提示詞工程師”或者“人工智能應(yīng)用工程師”,實(shí)際上這些人主要的工作就是進(jìn)行API調(diào)用。但企業(yè)很快發(fā)現(xiàn),這種方式根本無(wú)法建立起任何技術(shù)壁壘。你使用GPT - 4,其他企業(yè)也可以使用,那么企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)在哪里呢?

真正的競(jìng)爭(zhēng)優(yōu)勢(shì),是圍繞著LLM構(gòu)建起來(lái)的、獨(dú)一無(wú)二的、與自身業(yè)務(wù)深度綁定的復(fù)雜系統(tǒng)。而在這個(gè)系統(tǒng)中,恰恰充滿了傳統(tǒng)機(jī)器學(xué)習(xí)的智慧。例如,利用復(fù)雜的規(guī)則系統(tǒng)和傳統(tǒng)分類模型,對(duì)喂給LLM的數(shù)據(jù)進(jìn)行過(guò)濾和清洗;運(yùn)用經(jīng)典的統(tǒng)計(jì)學(xué)原理,設(shè)計(jì)嚴(yán)謹(jǐn)?shù)腁/B測(cè)試,以此來(lái)判斷LLM到底為企業(yè)帶來(lái)了多大的業(yè)務(wù)價(jià)值;借助成熟的推薦系統(tǒng)框架,對(duì)LLM生成的內(nèi)容進(jìn)行承接,并實(shí)現(xiàn)精準(zhǔn)分發(fā)。我們蒸汽教育這邊就一直強(qiáng)調(diào),學(xué)生在做項(xiàng)目時(shí)不能僅僅停留在調(diào)用API的層面,必須構(gòu)建一個(gè)完整的、具有商業(yè)邏輯的系統(tǒng),這才是面試官希望看到的成果。

給焦慮的你的“求生指南”

說(shuō)了這么多,我們來(lái)點(diǎn)實(shí)際的內(nèi)容。如果你現(xiàn)在正感到焦慮,不知道該如何是好,這里有幾條具體的行動(dòng)建議,希望能成為你應(yīng)對(duì)當(dāng)前情況的“求生指南”。

第一,不要把你手中的機(jī)器學(xué)習(xí)教科書(shū)扔掉,恰恰相反,你要重新深入研讀它,尤其是關(guān)于概率圖模型、優(yōu)化理論、因果推斷這些章節(jié)。這些知識(shí)就像是“屠龍之術(shù)”,在LLM時(shí)代,它們會(huì)讓你擁有更長(zhǎng)遠(yuǎn)的眼光和更深入的見(jiàn)解。

第二,立刻、馬上動(dòng)手做一個(gè)端到端的項(xiàng)目。不要僅僅滿足于在代碼中調(diào)用model.fit()函數(shù)。你要把你的模型用Flask或者FastAPI打包成一個(gè)API服務(wù),使用Docker將其容器化,然后部署到亞馬遜云服務(wù)(AWS)或者谷歌云平臺(tái)(GCP)上。讓你的朋友、同學(xué),甚至是網(wǎng)友,都能夠真實(shí)地使用你的產(chǎn)品。這個(gè)過(guò)程,會(huì)迫使你學(xué)會(huì)機(jī)器學(xué)習(xí)運(yùn)維(MLOps)的全套流程。

第三,在你的下一個(gè)項(xiàng)目中,強(qiáng)制自己使用至少一個(gè)傳統(tǒng)機(jī)器學(xué)習(xí)模型和一個(gè)LLM,并讓它們協(xié)同工作。例如,你可以使用LLM進(jìn)行文本摘要,然后將摘要結(jié)果提供給一個(gè)XGBoost模型,用于情感分類。通過(guò)這個(gè)過(guò)程,你會(huì)真正理解不同技術(shù)“整合”所帶來(lái)的價(jià)值。

第四,多去瀏覽Blind和一畝三分地等專業(yè)社區(qū),查看真實(shí)的面試經(jīng)驗(yàn)分享,尤其是那些失敗的“面經(jīng)”。你會(huì)發(fā)現(xiàn),現(xiàn)在面試失敗的人,很少是因?yàn)樗惴}沒(méi)有做出來(lái),更多的是在系統(tǒng)設(shè)計(jì)和對(duì)業(yè)務(wù)的理解方面出現(xiàn)了問(wèn)題。這些真實(shí)的經(jīng)驗(yàn)分享,比你閱讀一百篇營(yíng)銷號(hào)販賣的焦慮文章要有用得多。

寫(xiě)給你和你身邊的人

最后,我想說(shuō),LLM并非是一場(chǎng)要將所有人都拍死在沙灘上的海嘯。它更像是一股強(qiáng)大且不可逆轉(zhuǎn)的洋流。它不會(huì)摧毀一切,但會(huì)徹底改變行業(yè)發(fā)展的航道。那些只盯著自己一畝三分地、不愿做出改變的從業(yè)者,可能會(huì)被這股洋流帶到不知名的角落;而聰明的從業(yè)者,會(huì)及時(shí)調(diào)整自己的方向,利用這股洋流,更快地到達(dá)別人未曾涉足的新大陸。

寫(xiě)給你:別再僅僅盯著模型的精度了,那只是你職業(yè)價(jià)值的10%。抬起頭,看看整個(gè)系統(tǒng),關(guān)注產(chǎn)品的整體情況,了解商業(yè)的真實(shí)需求。你未來(lái)90%的價(jià)值,都蘊(yùn)含在模型之外的領(lǐng)域。

如果你身邊也有正在學(xué)習(xí)計(jì)算機(jī)科學(xué)(CS)和數(shù)據(jù)科學(xué)(DS)的朋友,或者你的父母還在為你“要不要轉(zhuǎn)碼”、“AI會(huì)不會(huì)讓程序員失業(yè)”而擔(dān)憂,我建議你把這篇文章轉(zhuǎn)給他們看看。這不僅僅是一個(gè)技術(shù)路線的選擇問(wèn)題,更是一場(chǎng)認(rèn)知層面的全面升級(jí)。

很多家長(zhǎng)可能還停留在“學(xué)好數(shù)理化,走遍天下都不怕”的傳統(tǒng)認(rèn)知里,他們很難理解這場(chǎng)技術(shù)變革的深度和速度。讓他們知道,今天孩子面臨的挑戰(zhàn),已經(jīng)不是“要不要學(xué)編程”這么簡(jiǎn)單了,而是“如何在一個(gè)被AI重新定義的時(shí)代里,找到自己不可替代的獨(dú)特價(jià)值”。

這場(chǎng)求職的硬仗,從來(lái)不是你一個(gè)人在戰(zhàn)斗。它需要你和你的家人并肩作戰(zhàn),互相理解,彼此支持,這樣才能做出最適合你的、不會(huì)讓你后悔的決策。

? 蒸汽教育 2026 全球留學(xué)生求職標(biāo)桿企業(yè)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容