贅婿詞云圖制作

前言

之前的文章我們已經(jīng)介紹了如何使用wordcloud庫制作中英文詞云圖,并介紹了中英文停用詞的使用方法,介紹了如何美化詞云圖,例如換字體背景顏色,背景換成圖片等,那這次我們就以現(xiàn)在很火的電視劇贅婿為例,制作贅婿小說的詞云圖。

數(shù)據(jù)準(zhǔn)備

  • 贅婿小說txt
  • 停用詞表
  • 一張贅婿相關(guān)背景圖

制作流程

  • 讀取小說文本
  • 利用jieba庫對文本進(jìn)行分詞
  • 設(shè)置停用詞表
  • 利用wordcloud庫制作詞云圖

代碼

根據(jù)上面的流程,編寫代碼。

from matplotlib import pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator
import jieba

fp = open('贅婿.txt','r')
text = fp.read()
cut_word = " ".join(jieba.cut(text))

stopwords = set()
content = [line.strip() for line in open('hit_stopwords.txt','r').readlines()]
stopwords.update(content)

background_image = plt.imread('贅婿.jpg')

wc = WordCloud(background_color = 'white',
               font_path = r'/System/Library/Fonts/Supplemental/Songti.ttc',
               stopwords = stopwords,
               mask = background_image,
               max_words=2000)
wc.generate(cut_word)

#改變字體顏色
img_colors = ImageColorGenerator(background_image)
#字體顏色為背景圖片的顏色
wc.recolor(color_func=img_colors)

plt.imshow(wc, interpolation='bilinear')
plt.axis('off') #取消坐標(biāo)軸
plt.show()

詞云圖可以看出,還是有很多次我們還需要過濾掉,這部分內(nèi)容在jieba庫的使用中再進(jìn)行講解。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容