在上一章里面,我講的是一個(gè)意圖識(shí)別的思路或者說流程,但是并沒有給出具體實(shí)現(xiàn)方案。
在本章,我們給出一些細(xì)節(jié)信息。
考慮一種情況:
1.數(shù)學(xué)輔導(dǎo)班主要講什么?
2.語文輔導(dǎo)班主要講什么?
3.英語輔導(dǎo)班主要講什么?
通過人為分析,我們可以把它界定為一類,也就是問答類。我們可以把它歸結(jié)為
C主要講的什么?C可以理解為課程。

來看另外一類問題:
1.語文課上一個(gè)月多少錢?
2.語文課上半年多少錢?
3.語文課上一年多少錢?
對于這類類問題,我們可以把它歸為:語文課上T多少錢? T代表時(shí)間。
同時(shí)我們根據(jù)一開始的分析,可以把語文課替換為C。
也就是說,我們可以把它理解為:C上T多少錢?

如此,我們就可以歸類用戶輸入的一些問題。
于是我們可以用,C主要講的什么?C上T多少錢?
來代替一系列同類問題,它的優(yōu)點(diǎn)就是可以更加抽象用戶輸入。降低認(rèn)為構(gòu)造訓(xùn)練集的時(shí)間。
具體實(shí)現(xiàn),源碼地址如下:https://drive.google.com/folderview?id=0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0&usp=drive_web#list
CRF++安裝還是比較簡單的
1../configure
2. make
3. su
4. make install
同時(shí)如果有需要,還可以安裝py包。在源碼目錄的python文件夾中。
CRF的具體使用方式,后面將會(huì)詳細(xì)介紹。