最近因?yàn)閷?duì)文本情感分析有一些需要,所以去學(xué)習(xí)使用了一下百度的NLP處理模塊,特此記錄一下,來和大家一起分享。
一:注冊(cè)使用
1:如何使用百度AI
首先打開http://ai.baidu.com/,注冊(cè)賬戶就可以

注冊(cè)之后,在控制臺(tái)創(chuàng)建應(yīng)用即可

注冊(cè)完成之后,進(jìn)入管理應(yīng)用界面:

記錄好你的APPID API KEY和Secret Key,到現(xiàn)在,我們就可以根據(jù)文檔進(jìn)行搭建了
二:搭建使用環(huán)境
在這里我最初的構(gòu)想是通過圖片識(shí)別文字然后進(jìn)行翻譯再去進(jìn)行句法的情感分析(中英文)
圖片識(shí)別也是用的百度AI平臺(tái)的OCR識(shí)別,操作與上述類似,而翻譯因?yàn)槲覀冎皇亲鲆粋€(gè)demo,并不需要做大批量調(diào)用,因此就用爬蟲寫了一個(gè)小程序,爬取一下結(jié)果。
1:圖片OCR識(shí)別部分:
主要的調(diào)用大家可以參考文檔,這里我們就簡(jiǎn)單用正則化匹配了一下OCR識(shí)別的結(jié)果,因?yàn)镺CR識(shí)別后是Unicode編碼,因此我們需要將其編碼轉(zhuǎn)換為漢字,就進(jìn)行了一點(diǎn)簡(jiǎn)單的工作:
代碼如下:
2:情感分析部分
這一部分只是百度NLP開放的一部分,比如分詞,DNN語句分析,調(diào)用都比較容易,對(duì)于一句話的情感分析,改天寫一篇文章細(xì)說,這方面我認(rèn)為百度這個(gè)api做的還是不夠好,準(zhǔn)確程度有一些問題,并且英語漢語的感情分析會(huì)差別特別多,有些話漢語就是正向的,翻譯成英語大概率就是消極的,并且可信度也比較低。
代碼如下:
3:翻譯部分
這一部分大體結(jié)構(gòu)和我之前的百度翻譯爬蟲基本類似,有興趣的可以翻閱下之前的文章:
代碼如下:
三:結(jié)果
1:測(cè)試1

2:測(cè)試2

四:一些想法
最近出去實(shí)驗(yàn)室去實(shí)習(xí)了,才發(fā)現(xiàn)自己在學(xué)校里學(xué)的知識(shí)和實(shí)際應(yīng)用的差太多,發(fā)現(xiàn)自己也有些空紙上談兵,以后自己也需要多多改正這一點(diǎn)。最后還是希望大家多多去公司實(shí)習(xí),讓自己變得更厲害^_^