色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

登錄注冊寫文章

利用auomator從文章中提取單詞列表

鴨梨山大哎

利用auomator從文章中提取單詞列表

前提是你安裝好了python3 以及nltk這個庫。（自行百度）
打開automator，新建app，

Paste_Image.png

Py文件內(nèi)容，把corpus_root='/Users/noneback/protoncorpus'改成你存放txt文本的位置。把要分析的txt文本存在這里即可。

#!/usr/bin/env python
# -*- coding:utf-8 -*-

from nltk.corpus import PlaintextCorpusReader
corpus_root='/Users/noneback/protoncorpus'
wordlists=PlaintextCorpusReader(corpus_root,'.*')

def getcb():
#從文本中提取單詞列表
       cb=[]
       for x in wordlists.fileids():
              if x.endswith('.txt'):
                     print (x)
                     cb.extend(wordlists.words(x))
       return cb

def nocfcb():
#去掉單詞列表中重復的單詞
       s=getcb()
       print (len(s))
       s1=set(s)
       s2=sorted([w for w in s1 if w.isalpha() and w.islower()])
       for x in s2:
              print (x)

if __name__=='__main__':
       nocfcb()

效果如圖

Paste_Image.png

ps：安裝nltk庫非常麻煩，要有耐心。

沒耐心的去這個網(wǎng)站、http://tools.eflclub.me/VocabularyAnalyzer

最后編輯于：2017.12.05 19:06:25

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容

1贊2贊

贊賞

手機看全文

准格尔旗| 随州市| 轮台县| 江安县| 法库县| 旺苍县| 罗山县| 平安县| 芦溪县| 澎湖县| 怀宁县| 丰都县| 张掖市| 德格县| 昭苏县| 靖边县| 五指山市| 雅安市| 泰安市| 琼结县| 石首市| 台南市| 偏关县| 济阳县| 金门县| 五河县| 宜良县| 阳泉市| 青铜峡市| 泽州县| 新密市| 三都| 汾西县| 安乡县| 峨眉山市| 左权县| 呈贡县| 轮台县| 桐城市| 徐州市| 廊坊市|

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

利用auomator從文章中提取單詞列表

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av