GPT生成的文章總會有股很濃的AI味,如何去除AI味變成了一項(xiàng)非常有意思的研究,這里分享一下前段時間的一些研究結(jié)果。
什么是AI味?
想要更好的去AI味,那首先必須明白,什么是AI味。很多時候這都是一種只可意會不可言傳的東西,但是我們要去AI味那就必須搞清楚AI味的來源。
常用詞差異
首先最明顯的就是常用詞差異。
知名論壇 Reddit 上有網(wǎng)友發(fā)出了一個常用詞差異文章,其中臭名昭著的 Delved 以超過人類使用頻率 300 倍而記錄在案。差距最高的 reimagined 以 1000 倍人類使用頻率榮登榜首。

毫無疑問,因?yàn)楣潭ㄓ?xùn)練語料的問題,導(dǎo)致某些詞被 GPT 偏愛而大面積使用是目前AI味的重要來源。雖然我們大部分人不是英語母語人士,但是看多了 GPT 輸出的內(nèi)容后,也能一眼就能看出來濃濃的AI味。
而目前主流的去AI味的網(wǎng)站也把常用詞替換作為去AI味的重要手段。隨便搜一些網(wǎng)站,使用后就能看到幾乎百分百會把 Delved 這個詞給替換成其他同義詞。
所以去除AI味的第一步,就是找到AI高頻使用的詞匯,并加以替換成其他同義詞。
當(dāng)然了,高頻詞匯并不是那么好搜集,并且很多時候你還要對比著人類的輸出內(nèi)容來進(jìn)行頻率上的判斷,并不是你拿著GPT輸出的內(nèi)容一頓統(tǒng)計后就能完美解決。當(dāng)然,很多時候我們并非追求100%,只要你開始去統(tǒng)計這些內(nèi)容并針對性的進(jìn)行替換后,就會有立竿見影的效果。
常用句式結(jié)構(gòu)
The early morning air was crisp as I walked into the sleek, glass-walled office of KPMG for the first time.
I had been chosen to participate in a comprehensive financial analysis project, an opportunity that promised to sharpen my skills and broaden my understanding of the auditing world.
That moment, standing in the brightly lit conference room, the cityscape visible through the floor-to-ceiling windows behind me, filled me with a sense of accomplishment and purpose. It was a testament to the power of diligence and analytical thinking, qualities that are crucial in the field of auditing.
先來看看一些AI輸出的經(jīng)典句式。
說實(shí)話,當(dāng)我拿著上面這些內(nèi)容給老板審閱時,我的十個腳指頭已經(jīng)緊張的蜷縮在了一起。真的太尷尬了,尤其是最后一段那種積極向上的總結(jié)和外向拓展,我真的幾乎在每一篇AI生成的內(nèi)容中見到過。
(當(dāng)然,不同領(lǐng)域和目的的文章,常見內(nèi)容會不太一樣。)
這里總結(jié)一下。
- AI特別喜歡使用“這一刻” “那是一個特別的日子” “我記得那天天氣明媚” 作為起手式,銜接一個場景描述作為過渡內(nèi)容,然后打出一招場景與心境互相配合的掌法,最后上升價值作為終結(jié)技結(jié)束連招。
- AI特別喜歡使用倒裝?!胺块g里只有沙沙的聲音,那是人們翻動書本的力量” “我來到了一個游樂園,這里充滿孩童的歡笑,是治愈我內(nèi)心的良方”。
當(dāng)然,我總結(jié)的內(nèi)容只是某一方面,更多的還需要大家來進(jìn)行補(bǔ)充。
針對這些常見的句式結(jié)構(gòu),我觀察了很多 Humanizer 網(wǎng)站,都沒有經(jīng)過特別的處理,并且同樣的句式經(jīng)過了網(wǎng)站的優(yōu)化后,居然神奇的能在檢測網(wǎng)站上通過。這些是我覺得目前檢測網(wǎng)站并沒有做好的地方,合理猜測,目前的檢測應(yīng)該還是基于第一部分,即常用詞上,進(jìn)行的檢測,并沒有深入到句式理解上。
就我自己來說
- 首先我禁用了起手式,嚴(yán)格規(guī)定AI必須以細(xì)節(jié)場景為開頭,然后讓AI不要動不動就進(jìn)行總結(jié),算是禁用了終結(jié)技。不過誠實(shí)的講,依然存在比較濃的AI味。
- 這里我嘗試過讓AI不用倒裝句,但是效果不好,所以最后給了例子進(jìn)去,發(fā)現(xiàn)這樣的輸出變少了,但是依舊不能消滅,只能說就閱讀感受來說好很多了。
總結(jié)
以上就是目前我自己去除AI味的辦法。
其中替換常用詞的方法,最好結(jié)合不同的模型進(jìn)行輸出,比如我自己,初始文章是使用 GPT4o 輸出的,優(yōu)化文章是使用的 Claude3.5 輸出的。目前來說主流的檢測網(wǎng)站,如zerogpt.com,測試下來,基本上AI率都下降到了10%以下。
想要常見 AI 詞表的同學(xué),點(diǎn)個關(guān)注,并進(jìn)行評論。