由于不知名原因,現(xiàn)在下載huggingface的模型和數(shù)據(jù)集非常慢,甚至無(wú)法下載。https://hf-mirror.com是一個(gè)非常好用的hu...
熵是信息論中的重要概念,它是對(duì)不確定性的度量,熵越大,不確定性越大。由此衍生出了條件熵、相對(duì)熵、交叉熵、互信息等概念,理解這些概念對(duì)于理解機(jī)器學(xué)...
本文整理了日常學(xué)習(xí)和科研中常用的一些提示詞,方便查找和使用。 中文 需求:科研論文初稿潤(rùn)色 我正在撰寫一篇關(guān)于【插入主題】的論文,這是論文的【插...
前情提要:需要將服務(wù)器上可以運(yùn)行的整套前后端數(shù)據(jù)代碼打包到docker中,交給乙方,乙方可以在自己機(jī)器上實(shí)現(xiàn)一鍵部署。 本項(xiàng)目用到的技術(shù)棧:前端...
前言 Spacy是一款非常流行的自然語(yǔ)言處理工具包,可以完成分詞,詞性標(biāo)注,句法分析,情感分析等很多自然語(yǔ)言處理需求。本文將介紹Spacy的基本...
抽離 學(xué)會(huì)站在站在第三者的視角來(lái)看待發(fā)生在自己身上的事務(wù),以樂(lè)觀的心態(tài)面對(duì)所謂的不幸。 辦公室里有人說(shuō)話聲音很大,那么我可以想:“如果他聲音再大...
背景 在使用Bert進(jìn)行文本分析的過(guò)程中,我們需要用BERT自帶的分詞器(Tokenizer)來(lái)對(duì)文本序列進(jìn)行分詞(Tokenize),其基本原...
日常用NLP腳本備份 機(jī)器翻譯 使用Huggingface提供的接口,和Helsinki-NLP提供的腳本,實(shí)現(xiàn)快速的機(jī)器翻譯; 為了便于批量處...
本文將介紹如何將微信聊天記錄導(dǎo)出為結(jié)構(gòu)化數(shù)據(jù) 所需材料 一部已經(jīng)root的安卓手機(jī) 帶GPU的Linux電腦整體流程如下: 數(shù)據(jù)庫(kù)文件提取 使用...