意圖識(shí)別預(yù)處理一

在上一章里面,我講的是一個(gè)意圖識(shí)別的思路或者說流程,但是并沒有給出具體實(shí)現(xiàn)方案。

在本章,我們給出一些細(xì)節(jié)信息。

考慮一種情況:

1.數(shù)學(xué)輔導(dǎo)班主要講什么?

2.語文輔導(dǎo)班主要講什么?

3.英語輔導(dǎo)班主要講什么?

通過人為分析,我們可以把它界定為一類,也就是問答類。我們可以把它歸結(jié)為

C主要講的什么?C可以理解為課程。


來看另外一類問題:

1.語文課上一個(gè)月多少錢?

2.語文課上半年多少錢?

3.語文課上一年多少錢?

對于這類類問題,我們可以把它歸為:語文課上T多少錢? T代表時(shí)間。

同時(shí)我們根據(jù)一開始的分析,可以把語文課替換為C。

也就是說,我們可以把它理解為:C上T多少錢?


如此,我們就可以歸類用戶輸入的一些問題。

于是我們可以用,C主要講的什么?C上T多少錢?

來代替一系列同類問題,它的優(yōu)點(diǎn)就是可以更加抽象用戶輸入。降低認(rèn)為構(gòu)造訓(xùn)練集的時(shí)間。

具體實(shí)現(xiàn),源碼地址如下:https://drive.google.com/folderview?id=0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0&usp=drive_web#list

CRF++安裝還是比較簡單的

1../configure

2. make

3. su

4. make install

同時(shí)如果有需要,還可以安裝py包。在源碼目錄的python文件夾中。

CRF的具體使用方式,后面將會(huì)詳細(xì)介紹。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容