厲害了!Python程序員利用程序整理出的Python英語(yǔ)高頻詞匯表

有不少編程初學(xué)者會(huì)問(wèn)這樣一個(gè)問(wèn)題:我英語(yǔ)不好,還能不能學(xué)編程?會(huì)不會(huì)有影響?

我的回答是:,會(huì)。

能學(xué),是因?yàn)殡m然編程用的都是英語(yǔ),但翻來(lái)覆去就那么一些關(guān)鍵字,寫(xiě)一陣子就都記住了。中文的學(xué)習(xí)資料也不少,足夠?qū)W會(huì)。

但肯定會(huì)有影響,主要有幾點(diǎn):

看不懂報(bào)錯(cuò)

在這里我還是要推薦下我自己建的web前端開(kāi)發(fā)學(xué)習(xí)群:731669587,群里都是學(xué)web前端開(kāi)發(fā)的,如果你正在學(xué)習(xí)前端 ,小編歡迎你加入,今天分享的這個(gè)案例已經(jīng)上傳到群文件,大家都是軟件開(kāi)發(fā)黨,不定期分享干貨(只有前端軟件開(kāi)發(fā)相關(guān)的),包括我自己整理的一份2018最新的前端進(jìn)階資料和高級(jí)開(kāi)發(fā)教程,歡迎進(jìn)階中和進(jìn)想深入前端的小伙伴。下邊繼續(xù):

看不懂官方文檔,只能看別人翻譯的二手貨。翻譯版本不能準(zhǔn)確傳達(dá)意思不說(shuō),很多前沿技術(shù)的版本更新速度也比翻譯的速度快多了。你看 Django 就從來(lái)沒(méi)有一個(gè)中文版本能跟上的。

看不懂 StackOverflow 上的問(wèn)答

無(wú)法使用參與 Github 上的項(xiàng)目

沒(méi)法好好用 Google(當(dāng)然這不僅是英語(yǔ)問(wèn)題)

總結(jié)下來(lái)就是:可以學(xué),但會(huì)吃力,尤其在更進(jìn)一步提升時(shí)會(huì)有限制。而如果英語(yǔ)好,則事半功倍。

而英語(yǔ)本身的作用也不僅僅是對(duì)編程幫助。多花點(diǎn)時(shí)間學(xué)英語(yǔ),哪怕僅僅多背一些單詞也是有用的。

于是,為了讓編程小白+英語(yǔ)苦手在開(kāi)始時(shí)能有些方向,我們嘗試用程序整理了一份Python 高頻詞匯表,供參考。

關(guān)于這份詞匯表的說(shuō)明

內(nèi)容來(lái)源包括《Head First Python》、《Learn Python The Hard Way》、《Python for Data Analysis》等20多本Python書(shū)籍,Python 官方文檔、pandas、requests、django 等10份文檔,Github awesome-python 項(xiàng)目下近400個(gè)項(xiàng)目的 readme 說(shuō)明,以及 stackoverflow 下 Python 及常用庫(kù)的問(wèn)答 topics 400+ 回答等資源。通過(guò)程序從中采集了詞頻最高的單詞,再加上人工篩選,最終整理出近 2000 個(gè)單詞。

需要指出的是,單詞的中文釋義我們使用了金山的翻譯接口。但某些詞匯在計(jì)算機(jī)和編程領(lǐng)域有特殊的含義,翻譯接口未必能夠給出,所以會(huì)存在一定的問(wèn)題。對(duì)此,我們?cè)谧越ǖ木W(wǎng)頁(yè)版工具上提供了“用戶(hù)自定義解釋”的接口,供大家修正和補(bǔ)充解釋。如果遇到解釋不到位的單詞,歡迎各位提交補(bǔ)充。(扇貝上已提交的單詞本暫無(wú)法修改釋義)

程序的實(shí)現(xiàn)方法

1. 文檔抓取

4 個(gè)不同渠道來(lái)源,通過(guò)?requests + BeautifulSoup?實(shí)現(xiàn)。

2. 詞頻統(tǒng)計(jì)

import refrom collections import Counter# 打開(kāi)文件,讀取數(shù)據(jù)with open(filename, 'r', encoding='utf-8') as f: raw_words = f.read()# 正則匹配所有單詞words = re.findall('[a-z]+', raw_words.lower())# 統(tǒng)計(jì)單詞c = Counter(words)# 提取出前詞頻前 100 的單詞c.most_common(100)

3. 翻譯接口

使用了金山的API。

import requests# 請(qǐng)求APIurl = 'http://www.iciba.com/index.php?a=getWordMean&c=search&word=' + wordreq = requests.get(url)# 處理返回的JSON數(shù)據(jù)info = req.json()data = info['baesInfo']['symbols'][0]means = data['parts'][0]['means']

4. 網(wǎng)站展示

網(wǎng)站基于?django?搭建。數(shù)據(jù)的導(dǎo)入使用了?peewee?庫(kù),直接與 django 的 ORM 對(duì)接。

怎么樣?歡迎大家留言交流討論

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容