【NLP論文】文本匹配/文本語(yǔ)義相似度任務(wù)、句向量生成相關(guān)論文

【Sentence-bert】

Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks

論文: https://arxiv.org/abs/1908.10084

代碼: https://github.com/UKPLab/sentence-transformers

【Bert-flow】

On the Sentence Embeddings from Pre-trained Language Models

論文: https://arxiv.org/abs/2011.05864

代碼: https://github.com/bohanli/BERT-flow

動(dòng)機(jī): 論文作者認(rèn)為BERT生成的句向量具有的語(yǔ)義相似度信息無(wú)法通過(guò)簡(jiǎn)單的余弦相似度體現(xiàn)出來(lái),論文通過(guò)一個(gè)基于流(flow)的生成模型訓(xùn)練一個(gè)標(biāo)準(zhǔn)的高斯分布,對(duì) BERT句向量空間中的點(diǎn)進(jìn)行一一映射,再在標(biāo)準(zhǔn)高斯空間中進(jìn)行相似度計(jì)算

【Bert-whitening】

Whitening Sentence Representations for Better Semantics and Faster Retrieval

論文: https://arxiv.org/abs/2103.15316

代碼: https://github.com/bojone/BERT-whitening

作者認(rèn)為Bert-flow模型的關(guān)鍵不在于flow模型,基于Bert模型輸出的[CLS]向量在文本語(yǔ)義計(jì)算任務(wù)中無(wú)法取得好的效果的原因可能是句向量所屬的坐標(biāo)系并非標(biāo)準(zhǔn)正交基的推論,通過(guò)一個(gè)簡(jiǎn)單的線性變換實(shí)現(xiàn)了和Bert-flow相近的效果。

參考:

細(xì)說(shuō)Bert-whitening的原理

https://zhuanlan.zhihu.com/p/380874824

你可能不需要BERT-flow:一個(gè)線性變換媲美BERT-flow

https://kexue.fm/archives/8069

【ConSERT】

ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer

論文: https://arxiv.org/pdf/2105.11741.pdf

代碼: https://github.com/yym6472/ConSERT

參考:

論文閱讀“ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer”

http://www.itdecent.cn/p/de79f4e166da

【SimCSE】

SimCSE: Simple Contrastive Learning of Sentence Embeddings

論文: https://arxiv.org/pdf/2104.08821.pdf

代碼: https://github.com/princeton-nlp/SimCSE

參考:

【論文復(fù)現(xiàn)】SimCSE對(duì)比學(xué)習(xí): 文本增廣是什么牛馬,我只需要簡(jiǎn)單Dropout兩下

https://blog.csdn.net/weixin_45839693/article/details/116302914

【Trans-Encoder】

TRANS-ENCODER: UNSUPERVISED SENTENCE-PAIR MODELLING THROUGH SELF- AND MUTUAL-DISTILLATIONS

論文://arxiv.org/pdf/2109.13059v3.pdf

代碼 :https://github.com/amzn/trans-encoder

參考:

文本匹配——【ICLR 2022】Trans-Encoder

https://cloud.tencent.com/developer/article/2041362

TRANS-ENCODER:自蒸餾和互蒸餾的無(wú)監(jiān)督句對(duì)模型

https://zhuanlan.zhihu.com/p/437729611

【Poly-encoders】

Poly-encoders: Transformer Architectures and Pre-training Strategies for Fast and Accurate Multi-sentence Scoring

論文: https://arxiv.org/pdf/1905.01969.pdf

參考:

論文筆記 | Poly-encoders

https://zhuanlan.zhihu.com/p/380867813

【PairSupCon】

Pairwise Supervised Contrastive Learning of Sentence Representations

論文: https://arxiv.org/abs/2109.05424

代碼: https://github.com/amazon-research/sentence-representations/PairSupCon

參考:

Pairwise Supervised Contrastive Learning of Sentence Representations

https://zhuanlan.zhihu.com/p/421196130

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容