監(jiān)督學(xué)習(xí) KNN K-近鄰算法是一個(gè)分類模型,原理是:存在一個(gè)已經(jīng)標(biāo)注好的訓(xùn)練集合,數(shù)據(jù)結(jié)構(gòu)是特征集+label;我們通過比較未標(biāo)注數(shù)據(jù)與已標(biāo)注數(shù)據(jù)的特征之間的相似關(guān)系,取前...
監(jiān)督學(xué)習(xí) KNN K-近鄰算法是一個(gè)分類模型,原理是:存在一個(gè)已經(jīng)標(biāo)注好的訓(xùn)練集合,數(shù)據(jù)結(jié)構(gòu)是特征集+label;我們通過比較未標(biāo)注數(shù)據(jù)與已標(biāo)注數(shù)據(jù)的特征之間的相似關(guān)系,取前...
從目標(biāo)去衡量-定義理想態(tài) 對于任何需求來講,我們都會(huì)有一個(gè)需求目標(biāo),解決什么問題;對于功能性場景來說,我們的目標(biāo)就是用戶使用流程/感知沒有就是完成基本任務(wù);但是對于推薦這種策...
業(yè)務(wù)架構(gòu) 由前文可以看出,推薦系統(tǒng)的本質(zhì)就是擬合一個(gè)用戶滿意度的函數(shù)y=(Xi,Xu,Xc) 函數(shù)結(jié)果受主要受內(nèi)容Xi、用戶Xu、上下文Xc三個(gè)維度的影響因子影響;一般還會(huì)外...
推薦系統(tǒng)的目標(biāo) 信息爆炸的產(chǎn)品中,通過推薦系統(tǒng)幫助用戶從大量信息中篩選出用戶最可能感興趣的; 從場景上分析,推薦實(shí)際上對用戶來說大多是被動(dòng)的,需求并不清晰。用戶的心理決策如下...
應(yīng)用背景 目前在對話機(jī)器人領(lǐng)域,開放域的閑聊型對話技術(shù)不成熟,基本算是”人工智障“; 而在封閉域,單純的任務(wù)型對話脫離場景落地困難,難以取代GUI當(dāng)前的地位,基本算是”可以用...
當(dāng)前閑聊機(jī)器人有兩種實(shí)現(xiàn)方式:基于檢索 與 基于生成 基于檢索的chatbot 檢索這種方式,在搜索與推薦系統(tǒng)中通常會(huì)用的到。具體來說是衡量一種相似度; 在人機(jī)對話的開放域,...
什么是基于數(shù)據(jù)驅(qū)動(dòng) 前面有說過基于目標(biāo)/任務(wù)/流程驅(qū)動(dòng)的DM系統(tǒng),這些方法其實(shí)都屬于手動(dòng)設(shè)計(jì)特征,復(fù)雜的對話邏輯是由人來設(shè)計(jì)處理邏輯去完成的。這樣的方法在小范圍內(nèi)其實(shí)表現(xiàn)會(huì)更...
以目標(biāo)為中心的DM 對于任務(wù)型對話來講,我們?nèi)绻胍M(jìn)行復(fù)雜的對話管理,首先要進(jìn)行復(fù)雜場景的抽象。什么是對話過程中一直不變的?流程不是,雖然它能快速解決問題對話有順序,但不必...
NLU定義 自然語言理解(NLU)就是要獲得一個(gè)計(jì)算機(jī)能用來計(jì)算的語義框架文字本身就是人類用來承載語義的工具,語義框架就是對其含義的抽象,語言的表示是多樣的,但是背后的語義是...
聲紋識(shí)別 原理 任何兩個(gè)人的聲紋圖譜都有所差異,通過檢測相同音素的聲紋特征就可以判斷出是否同一個(gè)人。因此聲紋也是作為生物識(shí)別的手段之一。其識(shí)別流程類似于人臉識(shí)別,輸入經(jīng)過模型...
什么是BERT BERT是谷歌最新提出的語言模型,在處理NLP的各項(xiàng)任務(wù)上,這個(gè)通用模型基本完爆所有模型。可以說是未來NLP的領(lǐng)軍人物了。這個(gè)是谷歌在超大規(guī)模的語料上訓(xùn)練出的...
什么是GAN 這兩年來,GAN生成對抗網(wǎng)絡(luò)非?;?,時(shí)不時(shí)的有新奇應(yīng)用爆出來。比如機(jī)器創(chuàng)作名畫、二次元頭像,還有生成非常美的攝影作品,甚至在某些網(wǎng)站出現(xiàn)AI換臉的騷操作。 實(shí)際...
RNN是什么 RNN即序列神經(jīng)網(wǎng)絡(luò),通常用來處理人類語言、音樂等具有序列屬性的任務(wù) 人類語言本身作為一種符號(hào)并沒有意義,只不過是人類對其賦予了意義。而這種意義體現(xiàn)在每個(gè)字(語...
CNN是啥 CNN即卷積神經(jīng)網(wǎng)絡(luò),通常用來處理計(jì)算機(jī)視覺方面的任務(wù) 雖然之前介紹過通用神經(jīng)網(wǎng)絡(luò),但是為什么還要用CNN來處理圖像呢? 因?yàn)橥ㄓ媒Y(jié)構(gòu)在在處理很多任務(wù)上缺乏’技巧...