前言
自2022年AI爆火之后,我以體驗(yàn)者的身份,一路見(jiàn)證其發(fā)展并深度參與其中,不知不覺(jué)間已成了AI的重度用戶。從最初的通過(guò)Web Chat與AI進(jìn)行交互,到現(xiàn)在通過(guò)圖形化界面、CLI工具與AI交互,AI以不同的方式為我扮演著一名合格的協(xié)作者的角色,可以說(shuō),AI工具不僅改變了我的工作方式,還極大地提高了我的工作效率。
最近幾個(gè)月,我的工作重心聚焦于針對(duì)特定業(yè)務(wù)場(chǎng)景的算法調(diào)優(yōu),而AI在這一過(guò)程中發(fā)揮了舉足輕重的作用,讓我愈發(fā)覺(jué)得自己已經(jīng)離不開(kāi)這些AI工具了;不過(guò),使用AI的過(guò)程也并非一帆風(fēng)順,我確實(shí)踩過(guò)不少“坑”。
在AI發(fā)展的不同階段我對(duì)AI有著不一樣的感受和認(rèn)識(shí),這些感受里有悲觀、有樂(lè)觀、有認(rèn)可,也有對(duì)自己職業(yè)生涯的深切懷疑,但無(wú)論是哪種感受都是清晰且深刻的,我經(jīng)常在等待AI給出答案時(shí)思緒萬(wàn)千。早在創(chuàng)建公眾號(hào)之前,我就萌生了寫(xiě)一篇AI相關(guān)文章的想法,這個(gè)念頭在我腦海里醞釀已久,今天,我打算付諸實(shí)踐了。
與其他文章有所不同,我并不打算在開(kāi)頭就展開(kāi)對(duì)AI相關(guān)內(nèi)容的討論,而是打算換個(gè)角度,先從使用AI的人入手。
通過(guò)觀察身邊的人,我發(fā)現(xiàn),若從對(duì)AI的接受程度和使用程度來(lái)劃分,大致可以將人群分為四類:
第一類是“充耳不聞型”。這類人要么從未使用過(guò)AI,要么短暫體驗(yàn)后因未達(dá)預(yù)期便拒絕繼續(xù)使用。無(wú)論AI如何發(fā)展或提升,他們都始終選擇忽略。
第二類是“淺嘗輒止型”。這類人更多是以一種嘗試的心態(tài)去體驗(yàn)AI,或僅將其視為快捷的搜索工具。他們有可能進(jìn)一步發(fā)展,成為“初窺門(mén)徑型”用戶;也有可能退步,變成“充耳不聞型”。形成這種差異的關(guān)鍵在于,他們是否能清晰、明確地向AI表達(dá)自己的意圖和要求。
第三類是“初窺門(mén)徑型”。這類人具備使用AI的基本技巧和意愿,能夠清晰、明確地表達(dá)自己的需求,但對(duì)AI的認(rèn)識(shí)還相對(duì)基礎(chǔ),尚無(wú)法利用AI完成較為復(fù)雜的任務(wù)。
第四類是“得心應(yīng)手型”。這類人對(duì)AI有深刻的認(rèn)識(shí),了解其能力邊界,能夠最大限度地發(fā)揮AI的潛力,并規(guī)避其不足,從而深度利用AI解決工作和生活中的問(wèn)題。
就我周圍的人而言,總體來(lái)看,“淺嘗輒止型”和“初窺門(mén)徑型”的用戶居多。
AI有哪些特點(diǎn)?
在進(jìn)入對(duì)AI的具體討論前我們有必要了解下現(xiàn)有的AI是如何實(shí)現(xiàn)的。
現(xiàn)階段的AI底層技術(shù)的核心是LLM(大語(yǔ)言模型),LLM本質(zhì)是概率預(yù)測(cè)器,其工作原理是:輸入被切成 Token,它根據(jù)已有序列預(yù)測(cè)下一個(gè) Token 的概率分布,這基于訓(xùn)練時(shí)海量數(shù)據(jù)學(xué)到的規(guī)律和模式;生成內(nèi)容時(shí),它不斷算概率分布、選 Token、更新序列。要提高生成準(zhǔn)確性,需給它更多有效信息,而“有效”的標(biāo)準(zhǔn)較為復(fù)雜。
現(xiàn)階段AI的特點(diǎn)及局限:
概率&不可靠性
LLM的實(shí)現(xiàn)本質(zhì)就決定了AI是按照概率生成內(nèi)容的,這種概率本身就會(huì)帶來(lái)不可靠性,它不可能百分百準(zhǔn)確,這不是工程問(wèn)題,是數(shù)學(xué)問(wèn)題。只要基于概率,就必然有誤差。拿同一個(gè)問(wèn)題多次詢問(wèn)AI,我們不能期待獲取完全一樣的答案,我們可以用“感冒了應(yīng)該怎么辦?”測(cè)試AI,每一次得到的答案并不完全相同。
我們可以將AI看做是一本包含世間所有已知知識(shí)的百科全書(shū),這本書(shū)實(shí)在太厚以至于就算僅按照目錄索引也無(wú)法完全枚舉,甚至是對(duì)同一個(gè)知識(shí)點(diǎn)的闡述都無(wú)法完全枚舉,因此我們每次提問(wèn)都能得到一個(gè)答案。

記憶力&注意力
LLM的記憶力與注意力機(jī)制是開(kāi)發(fā)者們模擬人類大腦進(jìn)行的設(shè)計(jì),用來(lái)突破傳統(tǒng)模型的局限,提升語(yǔ)言處理能力,實(shí)現(xiàn)更智能、靈活的人機(jī)交互,專注于提升記憶力和注意力的上下文工程已經(jīng)成為AI工程領(lǐng)域的核心范式。但是現(xiàn)階段的記憶力與注意力機(jī)制讓然存在很多問(wèn)題,主要表現(xiàn)為:
- 受上下文窗口限制,“記憶力”有限
-
在長(zhǎng)會(huì)話中無(wú)法準(zhǔn)確理解當(dāng)前對(duì)話內(nèi)容的意圖
馬什么梅.jpg
例如,有這樣的一個(gè)對(duì)話內(nèi)容:
我非常喜歡孫悟空,他勇敢、無(wú)所畏懼的形象給我留下了深刻印象。
...
最近流感季節(jié)得流感的人很多,我也得了流感。
...
我也非常喜歡孫悟空
...
這是一個(gè)跳躍性的對(duì)話內(nèi)容,里面涉及到了孫悟空和流感,如果是與人對(duì)話,在每個(gè)階段都能準(zhǔn)確識(shí)別當(dāng)前對(duì)話的意圖,這是因?yàn)槿四軌蚍治?、推理和?lián)想。但如果是與AI完成上述對(duì)話,AI可能會(huì)在你談?wù)搶O悟空時(shí)回復(fù)流感相關(guān)內(nèi)容,在你談了流感時(shí)又回復(fù)孫悟空相關(guān)內(nèi)容,還有可能會(huì)給出孫悟空得流感這種讓人啼笑皆非的答案。
這不是一個(gè)真實(shí)的案例,我只是想通過(guò)這個(gè)案例來(lái)說(shuō)明AI本身的局限性,AI大模型這種本質(zhì)的局限性就要求我們不能指望它在處理長(zhǎng)會(huì)話、復(fù)雜性任務(wù)時(shí)仍能夠表現(xiàn)良好。
可知&不可知
人類學(xué)習(xí)知識(shí)大都遵循由簡(jiǎn)單到復(fù)雜、由淺入深的規(guī)律,比如我們是先學(xué)會(huì)加減乘除,再學(xué)二元一次方程組,再學(xué)微積分,對(duì)復(fù)雜知識(shí)的掌握是建立在對(duì)簡(jiǎn)單知識(shí)掌握的基礎(chǔ)上的,也就是說(shuō),人類的知識(shí)體系是層次性、累進(jìn)性的,基于這個(gè)前提,我們可以說(shuō)不可能有一個(gè)人擅長(zhǎng)解決微積分相關(guān)問(wèn)題但是對(duì)加減乘除和二元一次方程卻一竅不通,只可能出現(xiàn)因?yàn)榇中拇笠鈱?dǎo)致的錯(cuò)誤;也就是說(shuō)人的可知和不可知是有跡可循的,我們能夠明確在什么場(chǎng)景下人可能會(huì)犯什么樣的錯(cuò)誤,所以我們得以引入各種規(guī)范、流程和自動(dòng)化降低人為的錯(cuò)誤,這點(diǎn)在軟件工程領(lǐng)域表現(xiàn)的尤為明顯。
但是當(dāng)我們以同樣的視角看待AI時(shí),我們過(guò)往的經(jīng)驗(yàn)就不能直接復(fù)用了,理論上AI具備客觀世界的所有知識(shí),但這也只是人使用無(wú)數(shù)知識(shí)庫(kù)訓(xùn)練后的結(jié)果,AI并不能真正理解什么是二元一次方程組、什么是微積分,更不可能理解兩者之間的關(guān)系,于是我們能夠驚奇的看到一個(gè)現(xiàn)象:AI為我們解決了十分復(fù)雜的微積分,但是簡(jiǎn)單的雞兔同籠問(wèn)題卻犯了難。AI只是根據(jù)概率從無(wú)窮的知識(shí)庫(kù)中選取一個(gè)答案,所以我們無(wú)法對(duì)于AI什么時(shí)候會(huì)犯錯(cuò)給出一個(gè)明確的預(yù)期,我們不知道AI什么時(shí)候能夠給出正確答案,什么時(shí)候是在一本正經(jīng)的胡說(shuō)八道。
AI的這種不可知特性就決定了現(xiàn)階段其只能作為一個(gè)輔助工具,人仍然在其中占據(jù)確定性的主導(dǎo)地位。我們不可能將飛機(jī)調(diào)度、地鐵調(diào)度這種生命財(cái)產(chǎn)攸關(guān)的場(chǎng)景完全交給AI來(lái)決策,同樣的,我們也不會(huì)允許將AI生成的代碼不加審查、測(cè)試直接發(fā)布到生產(chǎn)環(huán)境。

責(zé)任感、責(zé)任心
AI本身的概率性和不可知性決定了其是不可能具備責(zé)任感和責(zé)任心的,AI不關(guān)心什么是責(zé)任感、什么是責(zé)任心,AI也不會(huì)對(duì)結(jié)果負(fù)責(zé)。線上瘋狂報(bào)錯(cuò)系統(tǒng)瀕臨崩潰時(shí)我們能指望AI來(lái)修復(fù)bug嗎?項(xiàng)目群里客戶瘋狂吐槽甚至要罵娘的時(shí)候我們能指望AI來(lái)安撫客戶情緒嗎?我詳細(xì)答案是顯而易見(jiàn)的。那么人為什么會(huì)具有責(zé)任心和責(zé)任感呢?從主觀上來(lái)說(shuō),有自動(dòng)要求和自我驅(qū)動(dòng)的因素,客觀上來(lái)說(shuō),我們扮演的每個(gè)角色都會(huì)被其他人進(jìn)行評(píng)價(jià),這些評(píng)價(jià)會(huì)帶來(lái)道德上和利益上的約束,是人不得不為結(jié)果進(jìn)行負(fù)責(zé)。從這一點(diǎn)來(lái)說(shuō),我覺(jué)得人是不可能完全被AI替代的,因?yàn)槿似鸫a還能承擔(dān)起背鍋的角色,這個(gè)結(jié)論真讓我有點(diǎn)哭笑不得,真不知道應(yīng)該是高興還是悲哀。

創(chuàng)新性&創(chuàng)造性
借用專利領(lǐng)域中對(duì)于新穎性和創(chuàng)造性的評(píng)判標(biāo)準(zhǔn),對(duì)AI的創(chuàng)新性和創(chuàng)造性定義如下:
創(chuàng)新性:不屬于現(xiàn)有技術(shù)
創(chuàng)造性:與現(xiàn)有技術(shù)相比,該發(fā)明具有突出的實(shí)質(zhì)性特點(diǎn)和顯著的進(jìn)步
也可以使用兩個(gè)過(guò)程來(lái)描述,創(chuàng)造性是從0到1的過(guò)程,創(chuàng)新性是從1到1.1的過(guò)程。
我們可以看到,在數(shù)學(xué)領(lǐng)域和生物醫(yī)藥領(lǐng)域已經(jīng)有成功使用AI的案例:陶哲軒使用AI解決數(shù)學(xué)問(wèn)題、醫(yī)藥公司使用AI探索新的藥物分子結(jié)構(gòu)。這些勇敢的嘗試確實(shí)是展現(xiàn)了AI的創(chuàng)新性,但是這種創(chuàng)新還停留在現(xiàn)有知識(shí)的破碎和重組,AI在突破算力的限制嘗試一些不可枚舉的組合為我們帶來(lái)了不一樣的知識(shí)。
但是AI能夠帶來(lái)創(chuàng)造性嗎?AI在藝術(shù)領(lǐng)域的表現(xiàn)更適合回答這個(gè)問(wèn)題,當(dāng)我們不設(shè)置預(yù)期、不設(shè)置標(biāo)準(zhǔn)要求AI生成一幅畫(huà)或者是一首音樂(lè)時(shí),我們首先會(huì)驚嘆AI如此之快的完成“創(chuàng)作”,而且這些畫(huà)或者音樂(lè)乍一聽(tīng)乍一看居然還不錯(cuò);但是當(dāng)我們?cè)O(shè)置一些標(biāo)準(zhǔn)和要求時(shí),我們又會(huì)發(fā)現(xiàn)AI的創(chuàng)作是如此的幼稚、平庸,有些甚至只是簡(jiǎn)單的拼接重組遠(yuǎn)遠(yuǎn)達(dá)不到我們的目的,我們更不能期待AI能夠生成《星空》和《命運(yùn)交響曲》這樣蘊(yùn)含豐富情感給人以心靈震撼的曠世奇作。
未來(lái)的AI會(huì)具有創(chuàng)造性嗎?現(xiàn)在一眼望去仍然是一片迷霧。
什么情況下適合用AI
如果讓我挑選兩個(gè)關(guān)鍵詞描述人與AI的關(guān)系,我會(huì)挑選“擁抱AI”和“協(xié)作”,這兩個(gè)關(guān)鍵詞本身就反映了AI在人類世界的參與趨勢(shì),從最初的“擁抱AI”到現(xiàn)在的“協(xié)作”,AI已經(jīng)不可避免的改變了人們的生活和工作。得益于短視頻和自媒體的蓬勃發(fā)展,無(wú)論你是否真正的使用過(guò)AI,相信你都刷到過(guò)“AI不會(huì)替代人,但會(huì)使用AI的人會(huì)替代不會(huì)使用AI的人”這類視頻或文章,在這里我無(wú)意再次強(qiáng)調(diào)這個(gè)觀點(diǎn)傳播焦慮,我想和大家分析下我們工作的實(shí)質(zhì)是什么。
就大多數(shù)人的工作內(nèi)容而言(當(dāng)然這里我們討論的是需要使用電腦完成的工作,體力勞動(dòng)型工作不在我們的討論范圍內(nèi)),我認(rèn)為工作的實(shí)質(zhì)其實(shí)是重復(fù),現(xiàn)有的計(jì)算機(jī)軟件已經(jīng)嘗試使用可視化、流程化、自動(dòng)化提高人工處理的效率,但是其并不能改變工作重復(fù)的本質(zhì),而且軟件的開(kāi)發(fā)、實(shí)現(xiàn)方式(對(duì)業(yè)務(wù)場(chǎng)景的枚舉)也決定了其只能接受有限的輸入解決有限的場(chǎng)景,從這一點(diǎn)說(shuō),從事工作中的每個(gè)人都天然具備了成為“初窺門(mén)徑型”的可能性。
因此,學(xué)會(huì)使用AI的第一步就是發(fā)現(xiàn)自己工作中的重復(fù)部分,嘗試將這些重復(fù)部分交給AI,然后再對(duì)AI處理結(jié)果進(jìn)行審查,這樣我們會(huì)有更多的時(shí)間提升自我和思考人生(摸魚(yú))。

如何使用好AI呢?
先學(xué)會(huì)和AI說(shuō)話
與AI溝通的基本前提就是清晰的表達(dá)自己的意圖、明確自己的要求,把AI想象成你的下屬,只有意圖和要求明確清晰的情況下你的下屬才能完成工作且符合你的要求。
比如你有記錄每日工作內(nèi)容的習(xí)慣,每周周末時(shí)你需要將每日工作內(nèi)容整理成周報(bào)并且想讓它不那么難看沒(méi)有條理,你想要使用AI來(lái)完成寫(xiě)周報(bào)的任務(wù)。
方式一:
根據(jù)日?qǐng)?bào)內(nèi)容給我寫(xiě)周報(bào)
方式二:
在這個(gè)對(duì)話中,你將扮演一個(gè)周報(bào)助手的角色,當(dāng)用戶給出提供一周內(nèi)的工作內(nèi)容時(shí),你需要對(duì)周報(bào)內(nèi)容進(jìn)行潤(rùn)色、格式調(diào)整,滿足以下要求:
1、如果原工作內(nèi)容描述不清楚或者有歧義,你需要重新梳理表達(dá)并且不超出原始表達(dá)的意義
2、格式化工作內(nèi)容格式,使其看起來(lái)更加清晰更有條理性
3、原工作內(nèi)容如果冗長(zhǎng)則需要你采用更簡(jiǎn)潔的方式表達(dá)出來(lái)
4、注意,你修改潤(rùn)色后的語(yǔ)句含義一定不要超出原始表達(dá)內(nèi)容,務(wù)必要精準(zhǔn)
顯然,方案二會(huì)比方案一達(dá)到的更好的效果,因?yàn)槠涿鞔_的表達(dá)了意愿和要求。對(duì)于其中重要的部分,你可以多次強(qiáng)調(diào)以提高生成結(jié)果符合預(yù)期的概率。
以準(zhǔn)備背鍋的心態(tài)接受AI的生成結(jié)果并審查
AI的實(shí)現(xiàn)原理就決定了其不可能是完全可靠的,AI也沒(méi)有責(zé)任心和責(zé)任感不會(huì)對(duì)結(jié)果負(fù)責(zé),這必須成為默認(rèn)的使用規(guī)則,我們必須懷疑并仔細(xì)審核AI給出的每一個(gè)答案,依次來(lái)彌補(bǔ)AI可靠性、責(zé)任心、責(zé)任感的缺失。
將復(fù)雜任務(wù)拆解成多個(gè)簡(jiǎn)單任務(wù)
大多數(shù)工作內(nèi)容的重復(fù)性是多個(gè)階段、步驟的重復(fù)性,實(shí)際上每個(gè)階段和步驟都適合拆分成一個(gè)獨(dú)立的任務(wù)交由AI完成,假設(shè)一個(gè)復(fù)雜任務(wù)由三個(gè)子任務(wù)組成,每個(gè)子任務(wù)單獨(dú)執(zhí)行的成功率p=0.9,將復(fù)雜任務(wù)拆成成簡(jiǎn)單任務(wù)至少有三個(gè)好處:
更容易檢查錯(cuò)誤,及時(shí)修復(fù)
在每個(gè)子任務(wù)完成后即審查結(jié)果及時(shí)修復(fù)問(wèn)題,問(wèn)題僅作用在當(dāng)前子任務(wù)內(nèi),影響面更小更利于處理整體的成功概率更高
在一次對(duì)話中同時(shí)完成三個(gè)子任務(wù)且結(jié)果符合預(yù)期的概率是:
成功率=0.9 * 0.9 * 0.9=0.729
復(fù)雜任務(wù)中各部分常有邏輯依賴,因此錯(cuò)誤相關(guān)性增強(qiáng),導(dǎo)致實(shí)際成功率低于 0.729。
分三次對(duì)話完成三個(gè)任務(wù)的步驟是:
完成子任務(wù)1,成功率0.9,檢查和糾正錯(cuò)誤直至符合要求。
完成子任務(wù)2,成功率0.9,檢查和糾正錯(cuò)誤直至符合要求。
完成子任務(wù)2,成功率0.9,檢查和糾正錯(cuò)誤直至符合要求。
每次都是全新推理,避免誤差傳播,用戶可以在每次之間檢驗(yàn)、調(diào)整輸入。實(shí)際有效成功率遠(yuǎn)高于 0.729,常能達(dá)到 >0.9 甚至接近 1.0。更省錢(qián)
如果是使用cursor、codex、claudecode等付費(fèi)工具,將復(fù)雜任務(wù)拆解成簡(jiǎn)單任務(wù)能夠避免消耗了大量token一頓輸出結(jié)果卻給出了錯(cuò)誤答案,大量的token消耗就意味著money的消耗。
未來(lái)是什么樣?
我無(wú)法描繪AI的未來(lái)是什么樣,但是我相信的是AI一定會(huì)越來(lái)越強(qiáng)大,這是技術(shù)發(fā)展的規(guī)律。人的未來(lái)是什么樣呢?我覺(jué)得人一定是要會(huì)使用AI的,以一種懷疑但是樂(lè)觀的態(tài)度,對(duì)AI生成的結(jié)果懷疑,對(duì)AI生成的過(guò)程樂(lè)觀。為什么一定要會(huì)使用AI呢,因?yàn)檫@一過(guò)程是不可逆的,一旦使用了AI去解決問(wèn)題就能夠意識(shí)到其巨大的價(jià)值,這種價(jià)值是我們不可能忽略的。
