IP屬地:內(nèi)蒙古
當(dāng)我們千辛萬苦完成了前面的數(shù)據(jù)獲取、數(shù)據(jù)清洗、模型訓(xùn)練、模型評(píng)估等等步驟之后,終于等到老大說“上線”啦。想到辛苦訓(xùn)練出來的模型要被調(diào)用還有點(diǎn)小激...
論文 Entropy-based Term Weighting Schemes for Text Categorization in VSM 提...
在構(gòu)建了基于n-gram的糾錯(cuò)檢錯(cuò)模型之后,我們自然不能放過如今大紅大紫的神經(jīng)網(wǎng)絡(luò),鑒于神經(jīng)網(wǎng)絡(luò)的靈活性和訓(xùn)練的耗時(shí)性,我們?cè)诜椒▏L試和模型訓(xùn)練...
最近,筆者一直在研究語音識(shí)別后的文本糾錯(cuò),而就在八月26-30日,CCF的自然語言處理和中文計(jì)算會(huì)議召開了,筆者也從師兄那里拿到了新鮮出爐的會(huì)議...
在自然語言處理領(lǐng)域中,語料是非常關(guān)鍵的一個(gè)部分。然而,中文的自然語言處理領(lǐng)域在大的通用型語料上雖然不少,但在特定方向上的語料仍然匱乏。在要進(jìn)行拼...