文本相似性的應(yīng)用場景會有很多,在工業(yè)界我粗略遇到過: 熱點做輿情識別監(jiān)控的時候,需要對全網(wǎng)文章進行聚合,聚合過程中需要知道哪些文章是一致的 推薦...
前言 在自然語言處理領(lǐng)域,我們有一種類型的問題是如何在一堆文本中提取出核心詞/句子。而無論是對于長文本還是短文本,往往幾個關(guān)鍵詞就可以代表整個文...
更多來自于GitHub:Reflection_Summary. Bert的雙向體現(xiàn)在什么地方? mask+attention,mask的word...
本文主要是為了講解xDeepFM的框架,及如何用tensorflow去實現(xiàn)主干部分,如果需要直接拆箱可用,可以參考:xDeepFM,我的部分代碼...
前言 最近在看AutoML,業(yè)界在 automl 上的進展還是很不錯的,個人比較看好這個方向,所以做了一些了解: Google: Cloud A...
本系列為深入篇,盡可能完善專題知識,并不會所有的都會出現(xiàn)在面試中,更多內(nèi)容,詳見:Reflection_Summary,歡迎交流。 另外,歡迎大...
本系列為深入篇,盡可能完善專題知識,并不會所有的都會出現(xiàn)在面試中,更多內(nèi)容,詳見:Reflection_Summary,歡迎交流。 另外,歡迎大...
我們搞了個python的工具包PyTls。 做這件事的初衷是發(fā)生了一個星期要用python同時開發(fā)3個項目的情況,我發(fā)現(xiàn)了兩個現(xiàn)象:1.有很多定...
上個月由于業(yè)務(wù)需要定制化了一個中文語境下的手機號碼識別庫YMMNlpUtils DEMO解析 Github地址 現(xiàn)在由于業(yè)務(wù)需求,又新增了一個語...