N元語(yǔ)法 最大似然估計(jì) 缺陷: 參數(shù)空間過大條件概率P(wn|w1,w2,…wn-1)無法估算 數(shù)據(jù)稀疏嚴(yán)重很多語(yǔ)料庫(kù)中未出現(xiàn)的詞組組合,得到的...
什么是Slot Filling? Slot Filling是自然語(yǔ)言理解中的一個(gè)基本問題,是對(duì)語(yǔ)言含義的簡(jiǎn)單化處理,它的思想類似于語(yǔ)言學(xué)中框架主...
原文鏈接:在這里 最近在對(duì)照著nltk.book學(xué)習(xí)NLTK庫(kù),雖然網(wǎng)絡(luò)上有中文翻譯版,但是似乎并沒有搭配Python3的譯本,所以還是想按照自...
引 應(yīng)用語(yǔ)言學(xué)的期末Pre花了差不多一個(gè)月零零碎碎的時(shí)間完成了。最初的打算爬取網(wǎng)易、新浪、騰訊的國(guó)內(nèi)新聞,再通過提取關(guān)鍵詞,比較這三個(gè)網(wǎng)站社會(huì)新...
新聞爬蟲1.1 抓取新聞內(nèi)頁(yè) 材料:Pycharm,Chrome開發(fā)人員工具,infoLite插件,bs4,request 在前面我們已經(jīng)將新聞...
2017年第四周是 2017.1.30-2017.2.5本周的關(guān)鍵詞是自薦信、家庭長(zhǎng)談、Tower輕量化學(xué)生工作指南、一個(gè)拖延以及兩個(gè)種草。 自...
2017年第四周是 2017.1.23-2017.1.29本周的關(guān)鍵詞是 爬蟲、聚會(huì)和春節(jié) 爬蟲 1月23日還未返鄉(xiāng),所以在家里學(xué)習(xí)了爬蟲,跟著...
2017年第二周是2017.1.16-2017.1.22本周的關(guān)鍵詞 爬蟲、科目三和電影 爬蟲 本來打算接著上次的看下去,但是還是決定先踏實(shí)地回...
新聞爬蟲1.0 在列表頁(yè)獲取列表和時(shí)間 材料:Pycharm,Chrome開發(fā)人員工具,infoLite插件,bs4,request 安裝包 使...