QA論文泛讀筆記

@[toc]

使用WebQSP結(jié)果較好:ChatKBQA、GoG
使用多跳推理數(shù)據(jù)集HotpotQA等:KGP-T5,LongRAG,GNN-Ret,為長(zhǎng)文本/多跳類任務(wù)

1 KnowPAT(ACL2024Findings)

<a name="標(biāo)題名稱"></a>

1.1 解決的問題

將大模型應(yīng)用于特定知識(shí)領(lǐng)域的問答任務(wù),并新增一種對(duì)齊目標(biāo)——人類偏好對(duì)齊。

1.2 方法

  • 知識(shí)檢索:通過無監(jiān)督的問題-知識(shí)相似度計(jì)算得到Top K個(gè)相關(guān)知識(shí),無需人工標(biāo)注的數(shù)據(jù)。
  • 生成兩個(gè)偏好集合:風(fēng)格偏好(SPS)和知識(shí)偏好(KPS)。風(fēng)格偏好集合通過不同的LLM生成,知識(shí)偏好集合通過將相似度不同的知識(shí)分成三組生成。
  • 微調(diào)和偏好對(duì)齊


    pipeline

1.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:私有數(shù)據(jù)集和公開數(shù)據(jù)集,公開數(shù)據(jù)集是RJUA-QA(專業(yè)知識(shí)數(shù)據(jù)集)


實(shí)驗(yàn)結(jié)果


有無代碼:有
算力:未知

2 ChatKBQA(Findings of ACL 2024)

2.1 解決的問題

三大挑戰(zhàn):KBQA領(lǐng)域檢索效率低,檢索錯(cuò)誤影響語義解析,KBQA方法的復(fù)雜性。
ChatKBQA是一種基于微調(diào)LLM的“先生成后檢索”KBQA框架。

2.2 方法

pipeline

2.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:KBQA數(shù)據(jù)集WebQSP和CWQ
代碼:https://github.com/LHRLAB/ChatKBQA

實(shí)驗(yàn)結(jié)果

算力:a single NVIDIA A40 GPU (48GB)

3 KGP-T5(AAAI2024)

3.1 解決的問題

需要深入理解文檔內(nèi)容和結(jié)構(gòu)之間邏輯關(guān)聯(lián)的多文檔問答任務(wù)。KGP知識(shí)圖譜提示方法能夠提示LLM進(jìn)行MD-QA時(shí)構(gòu)建正確的上下文,利用圖譜增強(qiáng)了LLM。KGP包括一個(gè)圖譜構(gòu)建模塊和一個(gè)圖譜遍歷模塊。

3.2 方法


3.3實(shí)驗(yàn)及數(shù)據(jù)集

數(shù)據(jù)集:HotpotQA,IIRC,2WikiMQA,MuSiQue

MD-QA實(shí)驗(yàn)結(jié)果

代碼:https://github.com/YuWVandy/KG-LLM-MDQA
算力:未知,但文中有寫IRCoT requires running on A100-80G GPU, which is not affordable on our side,推測(cè)比這個(gè)需要的?。?..)

4 Code-Style In-Context Learning for Knowledge-Based Question Answering

4.1 解決的問題

LLM在預(yù)訓(xùn)練期間對(duì)邏輯形式的接觸很少,導(dǎo)致在生成邏輯形式時(shí)具有很高的格式錯(cuò)誤率。

4.2 方法


4.3 實(shí)驗(yàn)及數(shù)據(jù)集

這篇有點(diǎn)特殊參考意義好像不大,不貼實(shí)驗(yàn)結(jié)果了。
數(shù)據(jù)集: GrailQA, WebQSP, GraphQ
代碼:https://github.com/Arthurizijar/KB-Coder

5 GoG(EMNLP2024)

5.1 解決的問題

知識(shí)圖譜往往無法覆蓋回答問題所需的所有知識(shí),GoG是一種針對(duì)不完整知識(shí)圖譜問答(IKGQA)新任務(wù)的一種無需訓(xùn)練的方法,通過結(jié)合LLMs的推理能力和知識(shí)圖譜的結(jié)構(gòu)信息,來生成新的事實(shí)三元組并回答問題。

5.2 方法

5.3 實(shí)驗(yàn)和數(shù)據(jù)集


數(shù)據(jù)集:CWQ,WebQSP
代碼:https://github.com/YaooXu/GoG
算力:未知

6 Interactive-KBQA(ACL2024)

6.1 解決的問題

在低資源場(chǎng)景下充分利用LLMs將問題轉(zhuǎn)化為邏輯形式仍然是一個(gè)重大挑戰(zhàn),InteractiveKBQA通過直接與知識(shí)庫(kù)(KBs)交互來生成邏輯形式。

6.2 方法

6.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:WebQSP、CWQ、KQA Pro和MetaQA



代碼:https://github.com/JimXiongGM/Interactive-KBQA
算力: four NVIDIA A100 80GB GPUs

7 LongRAG: A Dual-Perspective Retrieval-Augmented Generation Paradigm for Long-Context Question Answering(EMNLP 2024 Main)

7.1 解決的問題

長(zhǎng)文本問答的“中間迷失”問題,增強(qiáng)RAG對(duì)復(fù)雜長(zhǎng)文本知識(shí)(即全局信息和事實(shí)細(xì)節(jié))的理解。

7.2 方法

7.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:HotpotQA,2WikiMQA,MusiQue



有無代碼:有
算力:8xA100 GPUs (80G each)

8 GNN-Ret

9.1 解決的問題

現(xiàn)有的檢索方法通常將參考文檔分割成段落,并將它們作為獨(dú)立單元進(jìn)行處理,識(shí)別這種關(guān)聯(lián)性是一個(gè)挑戰(zhàn)。本文通過圖神經(jīng)網(wǎng)絡(luò)來挖掘這種關(guān)聯(lián)性,并用循環(huán)圖神經(jīng)網(wǎng)絡(luò)來處理多跳推理。

8.2 方法

8.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:MuSiQue,IIRC,2WikiMQA



有無代碼:有
算力:未知

9 Q-KGR(findings of EMNLP2024)

9.1 解決的問題

檢索到的子圖往往有噪聲,Q-KGR消除輸入的噪聲路徑,還引入了Knowformer,用于將重評(píng)分后的知識(shí)圖譜注入到大型語言模型中,以增強(qiáng)大模型事實(shí)推理的能力。

9.2 方法

9.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:OBQA,Riddle,ARC,PIQA
有無代碼:有
算力:A100-80G GPUs.(沒具體寫幾張)

10 KS-LLM

10.1 解決的問題

知識(shí)密集型任務(wù)中的幻覺問題,本文首先根據(jù)輸入問題生成三元組,然后從證據(jù)文檔中選擇與這些三元組最相似的證據(jù)句子,從證據(jù)文檔中識(shí)別出有價(jià)值的信息。

10.2 方法

10.3實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集: TriviaQA, WebQ, and NQ(知識(shí)密集型數(shù)據(jù)集,問題+證據(jù)文檔)
有無代碼:無
算力:未知

11 EFSum

11.1 解決的問題

面向證據(jù),通過蒸餾和偏好對(duì)齊優(yōu)化LLM作為事實(shí)摘要器,提高了LLM在零樣本問答任務(wù)上的性能。

11.2 方法

11.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:WebQSP,Mintaka



有無代碼:有
算力:未知

12 G-Retriever

12.1 解決的問題

創(chuàng)新出一種圖問答方法,而不是整合LLM與GNN,并允許處理遠(yuǎn)超LLM上下文窗口大小的文本圖。

12.2 方法

12.3 實(shí)驗(yàn)與數(shù)據(jù)集

數(shù)據(jù)集:ExplaGraphs,SceneGraphs,WebQSP


算力: 2 NVIDIA A100-80G GPUs
有無代碼:有

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容