其實,能否/是否被“證實/證偽”都是一些相對的狀態(tài)與概念。很多“科學(xué)”的結(jié)論與認(rèn)知存在時間上的局限性。 1、無法證實,只能證偽 Causal inference中,我們可以通...
其實,能否/是否被“證實/證偽”都是一些相對的狀態(tài)與概念。很多“科學(xué)”的結(jié)論與認(rèn)知存在時間上的局限性。 1、無法證實,只能證偽 Causal inference中,我們可以通...
問題1:Memorization can't generalize? 由wide&deep文中定義:Memorization can be loosely defined a...
在各種體系設(shè)計與問題建模中,線性系統(tǒng)往往能幫助我們做很多簡化,使得很多問題的求解上變得更容易,并且有更好的解析解,更優(yōu)的bound,更好的收斂理論。例如各種規(guī)劃,控制理論中對...
Variance估計的難處 再次回顧一下Bengio 對當(dāng)代DNN的理解:Machine learning is essentially a form of applied ...
由于在廣告,推薦,營銷,甚至很多更特定的業(yè)務(wù)場景中,整個鏈路囿于資源局限性,通常在一定工程與算法的限制下,被拆分成了多個模塊。一個typical的鏈路:召回粗排精排OR層[出...
1、充分?jǐn)M合的模型,分某特征取值維度在訓(xùn)練集上積分(例如區(qū)分產(chǎn)品類型進行預(yù)估值積分),是否等于訓(xùn)練集上的統(tǒng)計值。 A:不是,需要具體分析。 a、理想狀態(tài),當(dāng)模型排序能力100...
在推薦場景下,模型auc大于0.5,其排序能力一定高于隨機嗎?模型離線評估auc大于0.5,上線后發(fā)現(xiàn)與隨機推薦沒差別?排序的商品結(jié)果與用戶沒有相關(guān)性? 關(guān)于相關(guān)性與偏置信息...
Entropy 信息量:值域發(fā)生概率越小,信息量越大。不確定性越高,信息量越大。 信息熵:值域,更確切為:,為類別數(shù)量:Skewed Probability Distribu...
必需做Causal Inference的根源在于:The “fundamental problem of causal inference” (Holland, 1986) ...
何謂好的 Infrastructure 好的infra意味著:“無論在這些點上用多么山寨雷人的方法去做,只要tech driver的解釋能力足夠強,那么結(jié)果就能得到保證,用機...
Variance問題: 對于Bandit中,一類核心的方法是給出估計的confidence Interval,然后根據(jù)其Upper Bound來進行bandit。主要有TS與...
問題 解決評估本身存在bias的問題。評估policy評估m(xù)odel 0、根源問題雖然我們對于模型本身的訓(xùn)練。policy本身的設(shè)計。都考慮到了各種bias的問題。試圖在某種...
理解 estimator param的variance到底意味著什么,我們?yōu)槭裁葱枰芯克???dāng)代工業(yè)界復(fù)雜模型(namely DNN)的variance如何,為何需要Shri...
對于GLM來說,如何估計其prediction 的Confidence Interval?以及如何估計其Coefficients 的Variance?【這個常常在線性模型用以...
Formulation: Bias的類型其實有很多,其中有的是非常明確的,而有的問題并非well defined。我們這里討論如何將各種Bias都準(zhǔn)確地形式化出來,構(gòu)建一個體...
Confounding bias [1]& Selection bias[2]的差異與相似處。 之前的文章從直覺上討論了系統(tǒng)中的各種bias。其實Selection Bias...
Causality & Correlation "相關(guān)性(Correlation/Prediction/Association)不意味著因果關(guān)系(Causality)”。但經(jīng)...
目標(biāo)形態(tài)多樣性 推薦,搜索,廣告這些業(yè)務(wù)的形態(tài),在目標(biāo)上有很大的差異。特別是在現(xiàn)在越來越復(fù)雜的產(chǎn)品中,不同的產(chǎn)品對這些業(yè)務(wù)有這不同的訴求與目標(biāo)。 1、基本形態(tài)目標(biāo)最基本的搜索...
機制設(shè)計的核心地位 不同的業(yè)務(wù),場景,共同形成了客觀意義上的產(chǎn)品。而整個產(chǎn)品的參與者與產(chǎn)品的交互構(gòu)成了該產(chǎn)品的生命形態(tài)。(參與者包含了用戶,客戶以及員工等等)(譬如小紅書,它...