@[toc]
使用WebQSP結(jié)果較好:ChatKBQA、GoG
使用多跳推理數(shù)據(jù)集HotpotQA等:KGP-T5,LongRAG,GNN-Ret,為長(zhǎng)文本/多跳類任務(wù)
1 KnowPAT(ACL2024Findings)
<a name="標(biāo)題名稱"></a>
1.1 解決的問題
將大模型應(yīng)用于特定知識(shí)領(lǐng)域的問答任務(wù),并新增一種對(duì)齊目標(biāo)——人類偏好對(duì)齊。
1.2 方法
- 知識(shí)檢索:通過無監(jiān)督的問題-知識(shí)相似度計(jì)算得到Top K個(gè)相關(guān)知識(shí),無需人工標(biāo)注的數(shù)據(jù)。
- 生成兩個(gè)偏好集合:風(fēng)格偏好(SPS)和知識(shí)偏好(KPS)。風(fēng)格偏好集合通過不同的LLM生成,知識(shí)偏好集合通過將相似度不同的知識(shí)分成三組生成。
-
微調(diào)和偏好對(duì)齊
pipeline
1.3 實(shí)驗(yàn)和數(shù)據(jù)集
數(shù)據(jù)集:私有數(shù)據(jù)集和公開數(shù)據(jù)集,公開數(shù)據(jù)集是RJUA-QA(專業(yè)知識(shí)數(shù)據(jù)集)


有無代碼:有
算力:未知
2 ChatKBQA(Findings of ACL 2024)
2.1 解決的問題
三大挑戰(zhàn):KBQA領(lǐng)域檢索效率低,檢索錯(cuò)誤影響語義解析,KBQA方法的復(fù)雜性。
ChatKBQA是一種基于微調(diào)LLM的“先生成后檢索”KBQA框架。
2.2 方法

2.3 實(shí)驗(yàn)和數(shù)據(jù)集
數(shù)據(jù)集:KBQA數(shù)據(jù)集WebQSP和CWQ
代碼:https://github.com/LHRLAB/ChatKBQA

算力:a single NVIDIA A40 GPU (48GB)
3 KGP-T5(AAAI2024)
3.1 解決的問題
需要深入理解文檔內(nèi)容和結(jié)構(gòu)之間邏輯關(guān)聯(lián)的多文檔問答任務(wù)。KGP知識(shí)圖譜提示方法能夠提示LLM進(jìn)行MD-QA時(shí)構(gòu)建正確的上下文,利用圖譜增強(qiáng)了LLM。KGP包括一個(gè)圖譜構(gòu)建模塊和一個(gè)圖譜遍歷模塊。
3.2 方法


3.3實(shí)驗(yàn)及數(shù)據(jù)集
數(shù)據(jù)集:HotpotQA,IIRC,2WikiMQA,MuSiQue

代碼:https://github.com/YuWVandy/KG-LLM-MDQA
算力:未知,但文中有寫IRCoT requires running on A100-80G GPU, which is not affordable on our side,推測(cè)比這個(gè)需要的?。?..)
4 Code-Style In-Context Learning for Knowledge-Based Question Answering
4.1 解決的問題
LLM在預(yù)訓(xùn)練期間對(duì)邏輯形式的接觸很少,導(dǎo)致在生成邏輯形式時(shí)具有很高的格式錯(cuò)誤率。
4.2 方法


4.3 實(shí)驗(yàn)及數(shù)據(jù)集
這篇有點(diǎn)特殊參考意義好像不大,不貼實(shí)驗(yàn)結(jié)果了。
數(shù)據(jù)集: GrailQA, WebQSP, GraphQ
代碼:https://github.com/Arthurizijar/KB-Coder
5 GoG(EMNLP2024)
5.1 解決的問題
知識(shí)圖譜往往無法覆蓋回答問題所需的所有知識(shí),GoG是一種針對(duì)不完整知識(shí)圖譜問答(IKGQA)新任務(wù)的一種無需訓(xùn)練的方法,通過結(jié)合LLMs的推理能力和知識(shí)圖譜的結(jié)構(gòu)信息,來生成新的事實(shí)三元組并回答問題。
5.2 方法

5.3 實(shí)驗(yàn)和數(shù)據(jù)集



數(shù)據(jù)集:CWQ,WebQSP
代碼:https://github.com/YaooXu/GoG
算力:未知
6 Interactive-KBQA(ACL2024)
6.1 解決的問題
在低資源場(chǎng)景下充分利用LLMs將問題轉(zhuǎn)化為邏輯形式仍然是一個(gè)重大挑戰(zhàn),InteractiveKBQA通過直接與知識(shí)庫(kù)(KBs)交互來生成邏輯形式。
6.2 方法

6.3 實(shí)驗(yàn)和數(shù)據(jù)集
數(shù)據(jù)集:WebQSP、CWQ、KQA Pro和MetaQA


代碼:https://github.com/JimXiongGM/Interactive-KBQA
算力: four NVIDIA A100 80GB GPUs
7 LongRAG: A Dual-Perspective Retrieval-Augmented Generation Paradigm for Long-Context Question Answering(EMNLP 2024 Main)
7.1 解決的問題
長(zhǎng)文本問答的“中間迷失”問題,增強(qiáng)RAG對(duì)復(fù)雜長(zhǎng)文本知識(shí)(即全局信息和事實(shí)細(xì)節(jié))的理解。
7.2 方法

7.3 實(shí)驗(yàn)和數(shù)據(jù)集
數(shù)據(jù)集:HotpotQA,2WikiMQA,MusiQue

有無代碼:有
算力:8xA100 GPUs (80G each)
8 GNN-Ret
9.1 解決的問題
現(xiàn)有的檢索方法通常將參考文檔分割成段落,并將它們作為獨(dú)立單元進(jìn)行處理,識(shí)別這種關(guān)聯(lián)性是一個(gè)挑戰(zhàn)。本文通過圖神經(jīng)網(wǎng)絡(luò)來挖掘這種關(guān)聯(lián)性,并用循環(huán)圖神經(jīng)網(wǎng)絡(luò)來處理多跳推理。
8.2 方法

8.3 實(shí)驗(yàn)和數(shù)據(jù)集
數(shù)據(jù)集:MuSiQue,IIRC,2WikiMQA

有無代碼:有
算力:未知
9 Q-KGR(findings of EMNLP2024)
9.1 解決的問題
檢索到的子圖往往有噪聲,Q-KGR消除輸入的噪聲路徑,還引入了Knowformer,用于將重評(píng)分后的知識(shí)圖譜注入到大型語言模型中,以增強(qiáng)大模型事實(shí)推理的能力。
9.2 方法

9.3 實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集:OBQA,Riddle,ARC,PIQA
有無代碼:有
算力:A100-80G GPUs.(沒具體寫幾張)
10 KS-LLM
10.1 解決的問題
知識(shí)密集型任務(wù)中的幻覺問題,本文首先根據(jù)輸入問題生成三元組,然后從證據(jù)文檔中選擇與這些三元組最相似的證據(jù)句子,從證據(jù)文檔中識(shí)別出有價(jià)值的信息。
10.2 方法

10.3實(shí)驗(yàn)和數(shù)據(jù)集

數(shù)據(jù)集: TriviaQA, WebQ, and NQ(知識(shí)密集型數(shù)據(jù)集,問題+證據(jù)文檔)
有無代碼:無
算力:未知
11 EFSum
11.1 解決的問題
面向證據(jù),通過蒸餾和偏好對(duì)齊優(yōu)化LLM作為事實(shí)摘要器,提高了LLM在零樣本問答任務(wù)上的性能。
11.2 方法

11.3 實(shí)驗(yàn)和數(shù)據(jù)集
數(shù)據(jù)集:WebQSP,Mintaka


有無代碼:有
算力:未知
12 G-Retriever
12.1 解決的問題
創(chuàng)新出一種圖問答方法,而不是整合LLM與GNN,并允許處理遠(yuǎn)超LLM上下文窗口大小的文本圖。
12.2 方法

12.3 實(shí)驗(yàn)與數(shù)據(jù)集
數(shù)據(jù)集:ExplaGraphs,SceneGraphs,WebQSP

算力: 2 NVIDIA A100-80G GPUs
有無代碼:有
