
公眾號:你想看的World(Youw2s)
Derek最近搗鼓了一個學習英語的社群,糾集了一群有共同愛好的朋友一起利用閑暇的時間學習英語。通過這個學習群,Derek認識了很多很有毅力的英語學習者,于是,Derek的微信朋友圈里面多了一條另類的風景線,“背單詞打卡”;現(xiàn)在幾乎所有背單詞的APP,都有分享朋友圈發(fā)送打卡信息給朋友的功能,于是,我開始每天看著很多人“我已經(jīng)在XXAPP上背單詞xx天了,今天已經(jīng)征服了xx個單詞”。一般看到這種情況,我非常喜歡給大家點個贊,因為我知道,“背單詞”,絕對是一個非常苦的差事,不管你使用什么APP,這種充滿了負反饋,不斷挑戰(zhàn)你耐心的學習活動,實在是值得上一個大大贊。
或許是好為人師的緣故,身邊不斷有朋友向Derek請教背單詞的方法和技巧,企圖找到一個不那么痛苦的方式。因為問的人太多,我突然覺得應該寫個文章出來共同討論下這個問題。
我首先明確一下我自己的認知,背單詞雖然不是學習英語的全部,但的的確確是英語水平提高必不可少的一個重要環(huán)節(jié)。所以,企圖從本文里找到一個捷徑的同學可能要失望了,我確實拿不出一個“躺在床上就學好英語”的好辦法來。因此,我并不打算在本文討論是否需要背單詞的問題,也不討論方法問題,我打算聊聊,如果要背單詞,你應該選什么詞表。
實際上,本文是寫給那些準備真正提升英語能力,希望通過英語能更好的了解這個世界的朋友??荚圏h的選擇其實非常小,幾乎所有的為考試準備的學習方法里面,都有一個對應的詞表,需要考試的朋友可以略過了,因為你只需要關(guān)注大綱要求的詞表即可。
為什么我們需要一個詞表
現(xiàn)在,是一個移動智能終端極度發(fā)達的時代,幾乎所有成人朋友在打算重拾英語的時候,都會選擇使用手機APP來背單詞,而所有的APP背單詞軟件都有幾大必須存在的功能:
- 適合各個水平階段的詞表
- 有對應音標
- 帶發(fā)音,例句
- 科學的記憶曲線,方便復習
這幾個功能,幾乎所有的背單詞APP都有,結(jié)合我們今天的主題,我們聊聊詞表。
在選擇開始背單詞前,這幾乎是你的第一個需要作出決定的事情,你選擇什么樣的詞表來背?準備考試的朋友還好辦,考啥背啥,根據(jù)大綱來,如果準備中考,就背中考詞表,如果準備高考,就找找高考詞表。
對成人學習者來說,這個選擇就比較尷尬了,很多的成人英語學習者對自己的英文水平其實并不了解,他們掌握英語的目的是使用它,而不是應付考試。這個時候,大部分人的選擇就比較盲目。上過大學的朋友,丟掉英語多年,比較可能選的詞表是四級詞匯或者六級詞匯,沒有上過的呢,很多都是從什么小學詞匯,中學詞匯,新概念第一、第二冊開始,還有些朋友,估計是聽過一些英語學習的講座,選擇了一些比較另類的詞表,比如說,老友記詞表,絕望主婦詞表來背。
朋友們,既然是學習英語的目的是真正的使用,那么大家有沒有想過:
我們學了十幾年英語,每個人心中都必然有個疑問:
想要流暢輕松的讀懂大部分的網(wǎng)頁,小說,報刊,新聞等原版材料,大概需要多少詞匯量?
著名網(wǎng)站testyourvocab.com歷時幾年,做了一個比較真實完整的調(diào)查。

調(diào)查結(jié)果如下:
- 絕大多數(shù)母語成年人士的詞匯量為20,000–35,000 words
- 8歲的母語人士平均詞匯量為10,000 words
- 4歲的母語人士平均詞匯量為5,000 words
- 母語人士的詞匯量大小主要是4到15歲之間的閱讀量決定
令人比較喪氣的結(jié)果如下: - 絕大多數(shù)外語人士的詞匯量僅為4,500 words
- 在英語國家居住的母語人士詞匯量平均僅為10,000 words
不少人看到這里肯定心存懷疑,考完專八背完托福詞匯卻無法流暢閱讀的也大有人在,與語言學家的研究“大相徑庭”。
究其原因,關(guān)鍵在于對“常用詞匯”的認知。
語言學家發(fā)現(xiàn)的另一個有趣事實是:
英語使用頻率最高的9個單詞,在任何一篇100詞以上的文章中出現(xiàn)的頻率達25%!
所以,想要高效背單詞,必須了解每個單詞在母語使用者日常生活中出現(xiàn)的頻率高低。
詞匯量不在于你背了多少生僻單詞,而在于你日常生活會用的有多少。Active vocabulary才是英語學習中最重要的部分。
問題浮出水面了,到底有沒有一個詞表,真正適合以實用為目的。寫到這里,聰明的大伙可能已經(jīng)明白了,如果要說以實用為目的,顯而易見,就是根據(jù)英語詞匯使用的頻率統(tǒng)計出來的詞匯表了。那么,這樣的一個東西,存在嗎?如果存在,它是否權(quán)威?
先給答案:存在?。?!絕對存在?。?quán)威?。?!絕對權(quán)威?。。?/strong>
COCA詞表的介紹

COCA,全稱Corpus of Contemporary American English,即當代美國英語語料庫,它是這個世紀里最大的美國語言學研究項目,地位影響深遠。
最重要的是,它研究的對象全部都是當代美國英語語料,基本不包括20世紀早期和19世紀的語料。
COCA項目至今還沒結(jié)束,目前收集了4億詞匯的文獻資料。這4億詞匯的基礎(chǔ)材料包括1990至2015年這幾十年里閱讀量最廣泛的小說和雜志(TIME, New Yorker等都是項目的參與者),電影、電視節(jié)目,大量的電話記錄和面對面談話記錄,甚至還包括911報告等)。它根據(jù)使用時間、文獻性質(zhì)等使用統(tǒng)計學方法進行分類統(tǒng)計,等于是在編一本帶詞頻和流行用法的新美國英語使用辭典。
在COCA當前成果基礎(chǔ)上,美國楊百翰大學對這個資料庫用計算機方法篩選出了美語使用頻率最高的5000和20000個高頻詞匯。曾經(jīng)有人用GMAT和GRE的資料驗證了一下這個詞匯表的覆蓋率,證明它的20000單詞覆蓋率真的很高,幾乎全部覆蓋,只有一兩個很個別的詞沒查到。
這個詞匯表最好的地方在于是每個單詞不僅帶詞頻和同義詞,而且還根據(jù)不同的詞性標注著collocation,也就是所謂的搭配用法。就是標出和這個詞使用最相關(guān)、密度最高的詞的集合。
有了它,我們就知道美國人對這個詞的最常用的幾十種用法和使用環(huán)境。
比如說script排3315,這個詞的搭配里,常見的形容詞搭配是final, original和feminine,常見的名詞搭配是movie, film, writer,常見的動詞搭配是write, read, follow. 所以我們知道這個詞的用法就有final script, write a script等等。這個比死記硬背好太多了。
這個語料庫涵蓋美國現(xiàn)當代時期的口語(spoken)、小說(fiction)、流行雜志(pop magazine)、報紙(newspaper)和學術(shù)期刊(academic)五大類型的語料庫,并且在這五個類型方面基本呈均勻平衡分布。
美國當代英語語料庫的文本內(nèi)容包括:
- 口語(spoken):包括150個電視或廣播節(jié)目對話,約85000000字。
- 小說(fiction):包括短篇故事、戲?。娪皠”荆s81000000字。
- 雜志(popular magazines):包括新聞、健康、家庭園藝、女性話題、財經(jīng)、宗教、運動等將近100種不同領(lǐng)域的雜志,約86000000字。
- 報紙(newspapers):包括10家報紙不同版面(地方新聞、評論、運動、財經(jīng))的文章,約81000000字。
- 學術(shù)期刊(academic journals):包括近100種不同種類的期刊,約81000000字。
在這個龐大的語料庫中使用頻率最高的20000個單詞極具代表性,幾乎覆蓋所有權(quán)威英語考試的詞表。
COCA的詞表的樣子
COCA的最常用20000詞的詞表,是一個有2000多頁的文件,這份文件里面,沒有詞匯的解釋,如下圖,主要包含幾個部分
- 詞頻
- 根據(jù)詞性的搭配,如前面最經(jīng)常搭配什么詞匯,后面經(jīng)常搭配什么詞匯;
-
近義詞;
- 189代表詞頻,也就是company做n(名詞)時,它出現(xiàn)的頻率在英語中是189位。
- 后面adj代表有哪些形容詞經(jīng)常和company這個名詞搭配。小黑點代表詞的位置,比如 drug company, phone company,不要理解成company drug, company phone。至于為什么有的詞有小黑點有的沒有,我也沒搞明白。
- 后面的大黑點代表同義詞。company做公司解釋時,意思是business等,做朋友解釋時,意思是companionship等,等等。
- 后面的203345代表在4.5億中出現(xiàn)的次數(shù)。0.93代表分布均勻度。越接近1代表在各種文體中分布越均勻。詞頻排名=次數(shù) * 均勻度。
- 有些詞的均勻度后還有個類似S,M等后綴,代表這個詞主要出現(xiàn)在如下文體中:Spoken, Fiction, Magazines, Newspapers, Academic
如何使用COCA詞表
寫了這么多,終于找到一個真正按照語言實際使用情況的詞表了,這就意味著,這個兩萬的詞表拿下,就掌握了英語世界的最高頻使用的詞匯,這可比任何為考試準備的詞表更適合成年的英語學習者了。那么,這個詞表怎么使用呢?怎么才能開始使用這個詞表呢?
扇貝單詞APP
扇貝上面有很多熱心人制作的各種詞表,有些免費,部分收費,在扇貝上面就有這個COCA的20000詞表,大家搜索一下應該可以看到,如下圖,如果手里還有貝殼的話,大家可以購買。

自行導入
目前,有很多背單詞的APP,支持詞表的自行導入,你可以用一個包含了詞表的純文本文件,直接導入到軟件里面背誦,據(jù)Derke所知,“知米背單詞”這個APP就可以自行導入詞表。只要你的詞表是UTF-8格式的純文本,都可以導入到“知米背單詞”。


如何獲得COCA詞表,下載資源
COCA詞表如果直接拿來背單詞,就是上面大家看到的那樣,確實難以直接使用,為了方便大家,造福群眾,Derek秉承著不給解決方法只提出問題的任何干貨都是耍流氓的思路,啟動了我的看家本領(lǐng),編程序,我從PDF文件中提取了20000所有詞表,并對文件根據(jù)詞性進行了分類,還體貼的分成了10000,20000,兩個文件,并提供20000分詞性的版本,即按動詞,形容詞,副詞等幾個大類進行了分解。做到這一步,如果你還不點贊我就真生氣了,現(xiàn)在提供如下幾個文件下載:
- 20000詞表純TXT版本
- 0-10000 詞表純TXT版本
- 10000-20000詞表TXT版本
- 20000詞表分詞性版
- COCA原版詞表2200頁PDF
注意:詞表不包含單詞解釋,大部分的軟件在導入詞表時,會自動添加解釋。



如何獲得:大家需要學習可以向我借閱,這是地址( https://pan.baidu.com/s/1bBcQr8 密碼: ti43)
公眾號:你想看的World(Youw2s)