隱含馬爾科夫模型通信的本質(zhì)就是編解碼和傳輸?shù)倪^(guò)程觀測(cè)信號(hào):發(fā)送源的信息:已知的情況下,求得令條件概率達(dá)到最大值得那個(gè)信息串,即(解碼) 通過(guò)貝葉斯公式,上述公式等價(jià)變換為發(fā)送...
官方定義 (?:pattern) 匹配 pattern 但不獲取匹配結(jié)果,也就是說(shuō)這是一個(gè)非獲取匹配,不進(jìn)行存儲(chǔ)供以后使用。這在使用 "或" 字符 (|) 來(lái)組合一個(gè)模...
Refer to: www.threemeal.com/blog/12/ 中間件 中間件是一個(gè)鉤子框架,它們可以介入Django的請(qǐng)求和響應(yīng)處理過(guò)程。它是一個(gè)輕量級(jí)、底層的“...
寫(xiě)作計(jì)劃: 線性模型LR(沒(méi)有考慮特征間的關(guān)聯(lián))——>LR +多項(xiàng)式模型(特征組合,不適用于特征稀疏場(chǎng)景,泛化能力弱)——>FM(適用于稀疏特征場(chǎng)景*,泛化能力強(qiáng))——>FF...
1、在自然界數(shù)據(jù)的分布通常是正態(tài)分布(如年齡、身高、體重等),所以當(dāng)我們對(duì)數(shù)據(jù)潛在分布模式不清楚時(shí),這是最好的近似。 2、在ML/AI中,目標(biāo)通常是使得數(shù)據(jù)線性可分,甚至意味...
準(zhǔn)備數(shù)據(jù) 查看結(jié)果 SUM(), MIN(),MAX(),AVG()等聚合函數(shù) 對(duì)一定窗口期內(nèi)的數(shù)據(jù)進(jìn)行聚合 在這里根據(jù)cookieid進(jìn)行分組,然后按照create_tim...
實(shí)例,多節(jié)點(diǎn)寫(xiě)入
巧用廣播,Spark向Kafka寫(xiě)入數(shù)據(jù)Kafka生產(chǎn)者類(lèi)不能實(shí)例化,需要包裝成一個(gè)可實(shí)例化的類(lèi) 注冊(cè)為廣播對(duì)象
樣本平均值average: 樣本方差variance: 總體均值(期望)mean: 總體方差variance: 樣本方差 中心極限定理,足夠樣本量情況下,樣本的均值趨于總體的...
CART是一顆二叉樹(shù)(分類(lèi)或回歸) 分類(lèi)樹(shù)的節(jié)點(diǎn)分裂 基于Gini指數(shù) 數(shù)據(jù)集,預(yù)測(cè)婚姻 演示: 最終選擇{Officer}、{Student、Teacher}的劃分方法 回...
年初的時(shí)候,我參考SAS評(píng)分卡指南整理了一份如何設(shè)計(jì)評(píng)分卡的文檔,后來(lái)請(qǐng)同事用 R語(yǔ)言重新寫(xiě)了一遍。評(píng)分卡還有一個(gè)很高大上的名字,叫規(guī)則引擎。按說(shuō)規(guī)則引擎要復(fù)雜得多,至少還要...
主要對(duì)比模型當(dāng)前性能Current Performance和開(kāi)發(fā)性能Dev Performance的差異 一、前端分析 1、模型穩(wěn)定性 2、特征分析 當(dāng)PSI值大于0.25,...
評(píng)分區(qū)間,好壞用戶(hù)分布 [注:bad用戶(hù)是正例] Gini = (AUC-0.5)/0.5 = 2*AUC-1 由上表得KS曲線 由上表得ROC曲線