在Win10上搭建Rasa_NLU_Chi中文語(yǔ)義識(shí)別

1. 安裝Visual Studio 2015

VS2015并不是非裝不可,也不一定要這個(gè)版本。不過(guò),在Python開(kāi)發(fā)中還是比較重要的,有很多Python庫(kù)在安裝時(shí)f都會(huì)出現(xiàn)文件或者是命令,又或者是庫(kù)找不到等等,這樣那樣的問(wèn)題。比如:Twisted、Scrapy、MITIE等等。安裝VS2015可以減少很多問(wèn)題。

下載地址

VS2015 專(zhuān)業(yè)版下載鏈接
http://download.microsoft.com/download/B/8/9/B898E46E-CBAE-4045-A8E2-2D33DD36F3C4/vs2015.pro_chs.isoVS2015

企業(yè)版下載鏈
http://download.microsoft.com/download/B/8/F/B8F1470D-2396-4E7A-83F5-AC09154EB925/vs2015.ent_chs.isoVS2015

社區(qū)版下載鏈接
http://download.microsoft.com/download/B/4/8/B4870509-05CB-447C-878F-2F80E4CB464C/vs2015.com_chs.iso

注意: 安裝時(shí)要選擇安裝Visual C++語(yǔ)言及工具,默認(rèn)是不安裝的。

2. 安裝cmake

官網(wǎng)下載:https://cmake.org/download/

選擇下載安裝包,這個(gè)最簡(jiǎn)單,運(yùn)行時(shí)直接選擇寫(xiě)入環(huán)境變量就好了,不用自己手動(dòng)寫(xiě)環(huán)境變量了。

3. 安裝boost

官網(wǎng)下載:https://www.boost.org/

boost沒(méi)有編譯好的安裝程序之類(lèi)的東西,需要將下載回來(lái)的壓縮包解壓后,再編譯。編譯過(guò)程對(duì)VS2015有依賴(lài),之前裝了,可以放心運(yùn)行。

我本機(jī)boost的解壓目錄為:D:\boost\boost_1_69_0

安裝步驟

先打開(kāi)命令行工具,并切換工作目錄。執(zhí)行bootstrap.bat命令后,會(huì)生b2.exe bjam.exe。最后再執(zhí)b2, --prefix指定安裝的目錄

cd D:\boost\boost_1_69_0\tools\build

bootstrap.bat

b2 --prefix=D:\boost\bin install

4. 安裝MITIE

不安裝MITIE并不影響Rasa_NLU_Chi的安裝,但是在運(yùn)行過(guò)程中會(huì)報(bào)錯(cuò),所以還是先安裝吧。事實(shí)上,也是因?yàn)榘惭bMITIE出問(wèn)題,才去安裝cmake以及boost庫(kù)的,因?yàn)镸ITIE的安裝也是要在本地編譯的,編譯過(guò)程中Visual Studio、cmake、boost庫(kù)三者缺一不可

MITIE可以通過(guò)在線(xiàn)安裝

pip install git+https://github.com/mit-nlp/MITIE.git

如果沒(méi)有安裝git也可以用svn代替。不過(guò)最好還是離線(xiàn)安裝,先下載代碼,解壓后切換到目錄下,然后運(yùn)行

python setup.py install

離線(xiàn)安裝的好處是如果安裝出現(xiàn)問(wèn)題,可以更好的發(fā)現(xiàn)及重試。

5. 安裝中文分詞工具jieba

jieba的安裝非常簡(jiǎn)單。

pip install jieba

在安裝Rasa_NLU_Chi中,可能還會(huì)出現(xiàn)一些依賴(lài)庫(kù)沒(méi)有安裝導(dǎo)致安裝失敗的問(wèn)題,一個(gè)個(gè)安裝就可以了。

6. 安裝Rasa_NLU_Chi

經(jīng)過(guò)漫長(zhǎng)的準(zhǔn)備工作,終于進(jìn)入正題了。

  • 首先下載代碼并解壓,然后打開(kāi)命令提示符并切換工作目錄,執(zhí)行安裝。

    python setup.py install

  • 接下來(lái)準(zhǔn)備模型數(shù)據(jù)。先不用自己訓(xùn)練模型,直接下載一份訓(xùn)練好的模型數(shù)據(jù)。

    鏈接:http://pan.baidu.com/s/1micEF0G 密碼:opli

    下載完成后將文件放到data目錄下。

  • 訓(xùn)練Rasa NLU的模型。所有的配置以及訓(xùn)練數(shù)據(jù)都先不改,直接使用已有的。先跑起來(lái)看到效果再說(shuō)。

    python -m rasa_nlu.train -c sample_configs/config_jieba_mitie_sklearn.yml --data data/examples/rasa/demo-rasa_zh.json --path models
    

    注意: 這個(gè)步驟不能少,雖然代碼中test_models目錄下已經(jīng)有訓(xùn)練好的模型了,但是當(dāng)前版本的模型與代碼不匹配,運(yùn)行會(huì)報(bào)錯(cuò)。

  • 啟動(dòng)Rasa_nlu服務(wù)。

    python -m rasa_nlu.server -c sample_configs/config_jieba_mitie_sklearn.yml --path models
    
  • 測(cè)試。終于完成了,來(lái)看看效果吧。

    使用瀏覽器打開(kāi)

    localhost:5000/parse?q=你好

    稍等片刻后會(huì)看到返回結(jié)果

    {
    "intent": {
      "name": "greet",
      "confidence": 0.6863286690180176
    },
    "entities": [],
    "intent_ranking": [
      {
        "name": "greet",
        "confidence": 0.6863286690180176
      },
      {
        "name": "goodbye",
        "confidence": 0.22795754042984873
      },
      {
        "name": "affirm",
        "confidence": 0.058162658792195523
      },
      {
        "name": "search",
        "confidence": 0.01325906726417518
      },
      {
        "name": "restaurant_search",
        "confidence": 0.008356444773033047
      },
      {
        "name": "medical",
        "confidence": 0.005935619722729551
      }
    ],
    "text": "你好"
    }
    
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容