Benchmark for AI search engine

如何評價一個"AI 搜索引擎"是好是壞?
如何判斷一個 AI 搜索引擎比傳統(tǒng)搜索引擎 “更好”?

我能想到的指標有:

  • 正確性。返回給用戶的內(nèi)容是對的,不能胡編
  • 人類理解速度。如果 AI 搜索引擎返回的內(nèi)容比傳統(tǒng)搜索引擎能讓人更快理解,那我們可以說“AI 搜索引擎比傳統(tǒng)搜索引擎更好”

至于“請求響應(yīng)速度”之類的指標?不重要。

所以,我們可以設(shè)計一些“基準測試”:選一些我不懂的概念/知識,看看哪種工具能更快教會我,而且教的是對的。

Q: 那“相關(guān)性”指標呢?
A: 個人覺得, “相關(guān)性”指標不適合拿來測評 AI 搜索引擎

測試1. How to implement a state machine in C++?

讓工具教教我怎么在c++里寫狀態(tài)機

phind.com

phind.com 是一個 AI 搜索引擎,我詢問 phind.com ,它幫我列出了4種寫法,很清晰。粘貼到記事本里,一共102行字(包括代碼占用的行數(shù))


image.png

google

搜到的文章廢話太多。

image.png

比如第一篇,前面一大段都是廢話。正文字數(shù)特別多,我粘貼到記事本里發(fā)現(xiàn)一共801行字(是 phind.com 返回結(jié)果的8倍
image.png

評價測試1

phind.com 起到了 summary的作用,而google到的文章信息密度低,要閱讀的文字行數(shù)是 phind.com結(jié)果的8倍。
phind.com 獲勝。

測試2. C++中,拷貝std::optional<std::vector> 時,會把 vector 完整的“深拷貝”一份么?

即: 拷貝 optional 變量時,會把肚子里的東西深拷貝么?

phind.com

這次直接問 phind.com ,看懂了。寫代碼驗證了一下,答對了。


image.png

(其實上面的答案是重新生成的,原始答案是下面這個,截圖時候有彈窗,不小心擋住了)


image.png

google

  1. 搜索 "deep copy std::optional<std::vector>",沒命中


    image.png
  2. 搜索 "does std::optional deep copy"。第一條答案意義不明,閱讀第一個答案浪費了我的時間。
    第二條答案可以解答問題??偟膩碚f,相比于 phind.com 的回答,我需要閱讀更多的文字,包括一些無關(guān)文字。


    image.png

評價測試2

phind.com 獲勝

測試3. What is "Value categories" in C++

我不懂 C++ 里的 Value categories 是什么意思,讓工具們來教教我

google

搜索結(jié)果如下:


image.png

看不懂。以搜到的 cppreference 內(nèi)容為例,看懵了:


image.png

chatgpt 翻譯

翻譯成中文,還是看不懂


image.png

讓 chatgpt 幫我解釋

感覺解釋的更好,但是說實話,看不懂


image.png

phind.com 搜索+chatgpt翻譯

phind.com 是一個 AI 搜索引擎,搜到的內(nèi)容是英文的。我把搜到的內(nèi)容使用 chatgpt 翻譯成中文。
看不懂。


image.png

google 搜視頻

到此我還是不明白,決定搜視頻。
搜到一個視頻 https://www.youtube.com/watch?v=XS2JddPq7GQ
聽了一會兒,講得不錯,能讓我聽懂,但是時間太長了,先扔進收藏夾、以后再看。

google 搜視頻+視頻提效工具

TODO
輔助使用summary生成器、字幕翻譯,看看能不能提效

測試4. what is perfect forwarding in c++

搜書: google talk-to-books

https://books.google.com/talktobooks/

看起來不錯


image.png

但是沒法查看書籍詳情,點擊會跳到這里來:


image.png

phind.com

解釋的還行?我好像知道這概念是啥了,但看完還是困惑"為什么要設(shè)計這東西?這和 std::move 有啥區(qū)別?"

image.png

繼續(xù)看phind.com給的鏈接列表,看第二個鏈接的文章終于看懂了,明白了這東西是啥、解決啥問題


image.png

google

第一篇文章太長。也許能讓我看懂吧,但我沒耐心看完


image.png

手動搜書

作為對比,我打開了本地的 C++ Primer Plus,搜 "perfect forward" 啥也搜不到:


image.png

TODO

  • 多測試一些案例,做統(tǒng)計
  • 統(tǒng)計一下 phind.com 正確率
  • 搜書,排查下 google books 看不了的問題
  • 搜視頻時,能實現(xiàn)"搜索視頻內(nèi)說過的話"么?
  • 總結(jié)下工具使用的最佳實踐:什么場景該用什么工具?
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容