Description
任一個英文的純文本文件,統(tǒng)計其中的單詞出現的個數。
Analysis
查閱了資料后發(fā)現python有個collections的模塊可以對單詞進行統(tǒng)計,主要是用到了Counter這個類
Solution
# -*- coding: utf-8 -*-
from collections import Counter
import re
def cal():
with open('./test.txt', 'r', encoding='utf-8') as f:
data = f.read()
data = data.lower()
# 使用正則表達式子去掉式子中的\n字符
datalist = re.split(r'[\s\n]+', data)
# 將list用Counter初始化
return Counter(datalist).most_common()
if __name__ == '__main__':
dict = cal()
# 返回的列表中的每個元素都是一個字典,第一個元素是單詞,第二個元素是出現的次數
for i in range(len(dict)):
print("%15s ----->%3s" %(dict[i][0], dict[i][1]))