2022-03-03 第三章 課后習題

  • 3.1 使用NLTK工具下載簡·奧斯汀所著的Emma小說原文,并去掉其中的停用詞。
  • 3.2 使用NLTK提供的WordNet計算兩個詞(不是詞義)的相似度,計算方法為兩詞各種詞義之間的最大相似度。
  • 3.3 使用NLTK提供的SentiWordNet工具計算一個句子的情感傾向性,計算方法為每個詞所處詞性下的每個詞義情感傾向性之和。
  • 3.4 使用真實文本對比LTP與正向最大匹配分詞的結果,并人工分析哪些結果LTP正確,正向最大匹配錯誤;哪些結果LTP錯誤,正向最大匹配正確;以及哪些結果兩個結果都錯誤。
  • 3.5 分析view、reshape、transpose和permute四種調整張量形狀方法各自擅長處理的問題。
  • 3.6 安裝PyTorch并實際對比使用和不使用GPU時,三個大張量相乘時的效率。
  • 3.7 下載最新的Common Crawl數據,并實現抽取中文、去重、繁簡轉換、數據清洗等功能。
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容