白嫩美女在线日韩专区,性激情啪啪一二区,午夜 av 国产精品

--- ![](https://upload-images.jianshu.io/upload_images/19662681-e3d3d13d0930b2ce.png) --- 上個月跟一個創(chuàng)業(yè)的朋友聊天，他興奮地跟我說："我們公司準備全面切換到 Long Context 了，RAG 那套太麻煩，直接把所有文檔喂給大模型，省事！" 我當時沒反駁，但心里咯噔了一下。結果前兩天再聊，他苦著臉說："不行，問它Q3哪個項目利潤最高，它把Q1的數(shù)據(jù)給我安了個名頭。" 你看，這就是 Long Context 最容易讓人掉進去的甜蜜陷阱。 ## 你真的理解 Long Context 嗎？先說說什么是 Long Context。就是你跟大模型說話的時候，它現(xiàn)在能"記住"的東西越來越多了。以前你喂它一篇論文，它只能看前幾頁；現(xiàn)在某些模型能一次吃進去上百萬個 Token，相當于一本《戰(zhàn)爭與和平》扔進去，它全都能讀完。聽起來很厲害對不對？但問題來了——**能讀完 ≠ 能用好**。我給你打個比方。你花了一整年跟一個項目團隊，開了大大小小幾十次會議，記了幾百頁的會議紀要?，F(xiàn)在我問你："去年7月15日那個項目啟動會，老王提到的第三個風險點是什么？" 你翻了半天筆記，找到了，但回答得很猶豫："好像是……資金流那個？" 但如果我換種問法："去年所有會議里，關于資金流風險的討論，最后結論是什么？" 你可能就得把全年記錄全翻一遍，腦子一團漿糊。大模型面對長文本，某種程度上就是這樣。**它看到了每一個字，但你問它一個精確問題的時候，它的回答質量取決于那個信息在文本里"藏得有多深"。** 這就是為什么有個著名的測試叫"大海撈針"（needle-in-a-haystack）——把一根"針"混進一噸"稻草"里，讓模型去找。測試結果很有意思：模型對不同位置的信息，召回率差異巨大。開頭和結尾的信息它記得最清楚，中間的嘛……經常對不上。 ![](https://upload-images.jianshu.io/upload_images/19662681-46902f771627fcbc.png) 所以當有人說"Long Context 讓 RAG 過時了"，我只能說：說這話的人，可能自己還沒被這個"大海撈針"坑過。 ## RAG 解決的是什么問題？好，說完 Long Context 的軟肋，再來看 RAG。 RAG 的全稱是 Retrieval-Augmented Generation，檢索增強生成。翻譯成人話就是：**先幫你找到答案在哪，再讓 AI 回答你。** 它不是讓模型自己從長文本里撈信息，而是有一個專門的"圖書館管理員"——先幫你定位到最相關的幾頁內容，再讓模型來讀這幾頁。這個分工有什么好處？ **第一，找得快。** 你問"去年Q3哪個項目利潤最高"，RAG 直接把Q3項目報告翻出來，答案就在里面。Long Context 得把去年50份報告全讀一遍，還可能給你安個別的季度的數(shù)。 **第二，答得準。** 圖書館管理員找的是精準的書頁，不是整層樓的書架。模型只看最相關的材料，幻覺（hallucination）的概率自然低很多。 **第三，管得住。** 在金融、醫(yī)療、法律這些行業(yè)，你得知道 AI 的答案來自哪份文件。RAG 方案里，檢索來源是可審計的。Long Context 呢？模型"覺得"是這么回事，但它自己也不知道為啥這么答。我看到過一句話形容兩者的區(qū)別，覺得特別到位：**RAG 是圖書館管理員幫你精準找書，Long Context 是讓你自己讀完整層樓。** 都能找到答案，但效率完全不一樣。 ![](https://upload-images.jianshu.io/upload_images/19662681-8e0a2ea845ad7dba.png) ## 它們不是競爭對手，是各干各的所以你發(fā)現(xiàn)了嗎？Long Context 和 RAG 根本不是同一個賽道的對手。 Long Context 解決的是"我需要理解整篇文檔的內在邏輯"——比如讓 AI 幫你總結一份200頁的戰(zhàn)略規(guī)劃文件，找出其中的核心論點和矛盾點；或者讀完整本產品手冊，寫一篇評測。 RAG 解決的是"我需要精準回答一個具體問題"——比如從1000份合同里找出所有包含"違約金超過5%"的條款；從公司知識庫里查到"今年的年假政策是怎么規(guī)定的"。 **一個是整體理解，一個是精確召回。解決的問題根本不同。** 那什么時候該用哪個？我給你幾個判斷標準： **優(yōu)先選 Long Context**：你需要理解一整篇文檔的邏輯關系、寫作風格、論證脈絡。比如總結報告、續(xù)寫文章、分析小說的敘事結構。 **優(yōu)先選 RAG**：你需要回答一個具體問題，答案應該來自明確的、實時的、可審計的知識來源。比如查數(shù)據(jù)、問政策、找條款。 **兩個都要**：復雜任務。比如你先讓 RAG 從100份研報里找出最相關的10份，再讓 Long Context 幫你分析這10份的共同趨勢。這就是現(xiàn)在最流行的"混合架構"——RAG 負責找，Long Context 負責讀。各取所長。 ![](https://upload-images.jianshu.io/upload_images/19662681-fdc62558401c73cc.png) ## 別被技術詞匯帶跑了說到底，Long Context 和 RAG 都是手段，不是目的。你真正要解決的是你的問題：**是理解，還是查詢？是整體把握，還是精確回答？** 不要因為某個技術名詞聽起來更酷就去追，也不要因為某個詞聽起來"老土"就覺得它不行。我見過太多技術團隊，因為"Long Context 是趨勢"就全盤切換，結果生產環(huán)境的問答質量反而下降了。問的問題沒變，工具換了，效果反而差了——因為他們選錯了工具。技術選型這件事，永遠是問題導向，而不是方案導向。下次再有人跟你說"RAG 馬上要被淘汰了"，你只需要問他一個問題：**你說的這個場景，是需要"理解"還是需要"查找"？** 問完這個，答案你自己就有了。 --- *覺得有收獲，點個贊、在看、轉發(fā)支持一下；想不錯過更新，記得星標?。下次見。* ![](https://upload-images.jianshu.io/upload_images/19662681-b049b07ddc299fb5.png) 本文由[mdnice](https://mdnice.com/?platform=6)多平臺發(fā)布

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

長文本（Long Context）會終結 RAG？先把這兩個概念搞清楚

長文本（Long Context）會終結 RAG？先把這兩個概念搞清楚

相關閱讀更多精彩內容

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

長文本（Long Context）會終結 RAG？先把這兩個概念搞清楚

相關閱讀更多精彩內容

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av