預(yù)訓(xùn)練語言模型
(1) ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators
任務(wù)型對話
(1) A User Simulator for Task-Completion Dialogues
閱讀理解
(1) 機器閱讀建模多輪對話:
BERT with History Answer Embedding for Conversational Question Answering
Query理解
(1) 搜索-Query理解(全)
(2) 全面理解搜索Query:當(dāng)你在搜索引擎中敲下回車后,發(fā)生了什么?
分詞
新詞發(fā)現(xiàn)
(1) "新詞發(fā)現(xiàn)"算法探討與優(yōu)化-SmoothNLP
NDCG
中文文本糾錯
(1) 平安壽險 AI 團隊 | 文本糾錯技術(shù)探索和實踐
關(guān)鍵詞提取
(1) textrank 關(guān)鍵詞提取-python實現(xiàn)
(2) TextRank算法提取關(guān)鍵詞的Java實現(xiàn)
其他
(1) Joint Embedding of Words and Labels for Text Classification
(2) https://blog.csdn.net/lime_1002/article/details/88741510
(3) ACL2020 | 香儂科技提出使用Dice Loss緩解數(shù)據(jù)集數(shù)據(jù)不平衡問題
(4) ansj分詞方式詳細解析
(5) ansj --詞性說明
(6) 葡萄牙語語法1