伙伴們注意了!
小編在這里給大家送上關(guān)注福利:
搜索微信公眾號“速學(xué)Java”關(guān)注即可領(lǐng)取小編精心準(zhǔn)備的資料一份!

英語文本幾乎無處不在。
如果我們的系統(tǒng)能夠理解并自動生成它,那將是最好的。
然而,理解自然語言是一項(xiàng)復(fù)雜的任務(wù)。
它是如此復(fù)雜,以至于許多研究人員花了一生的時間來做它。
現(xiàn)在,已經(jīng)發(fā)布了很多工具來完成自然語言處理工作。
以下是我收集的8個工具。
我還驗(yàn)證了它們都被某些應(yīng)用程序至少使用一次,因此它們都是可運(yùn)行的。
有些來自工業(yè)公司,有些來自研究機(jī)構(gòu)。
它提供了解析、自動查找主題等功能。
1.OpenNLP:一個Java包,用于進(jìn)行文本標(biāo)記、詞性標(biāo)記、分塊等(教程)
2.斯坦福解析器:概率自然語言解析器的Java實(shí)現(xiàn),包括高度優(yōu)化的PCFG*和詞法化的依賴性解析器,以及詞法化的PCFG解析器
3.自然語言處理和機(jī)器學(xué)習(xí)。
4.雪球:一個stemmer,支持C和Java。
5.MALLET:一個基于java的包,用于統(tǒng)計(jì)自然語言處理、文檔分類、集群、主題建模、信息提取和其他機(jī)器學(xué)習(xí)應(yīng)用程序到文本。
6.JGibbLDA: Java中的LDA
7.Apache Lucene Core:一個用于刪除和詞干的Java庫
8.斯坦福主題建模工具箱:CVB0算法等。