語料獲取 英文維基百科 中文維基百科 預(yù)處理數(shù)據(jù) 將xml的壓縮文件處理成text格式 將wiki.zh.text中的繁體字轉(zhuǎn)化為簡體字,利用開源項(xiàng)目opencc 分詞,利用...
IP屬地:廣東
語料獲取 英文維基百科 中文維基百科 預(yù)處理數(shù)據(jù) 將xml的壓縮文件處理成text格式 將wiki.zh.text中的繁體字轉(zhuǎn)化為簡體字,利用開源項(xiàng)目opencc 分詞,利用...