https://cloud.tencent.com/developer/article/1666552
https://cloud.tencent.com/developer/article/1480301?from=article.detail.1666552
https://cloud.tencent.com/developer/article/1631574?from=article.detail.1666552
JS散度
https://zhuanlan.zhihu.com/p/74075915
https://zhuanlan.zhihu.com/p/35709485
不確定性函數(shù) f(x) = -log p(x) ,概率越小,不確定性越大
交叉墑:用來(lái)優(yōu)化不確定性的,預(yù)測(cè) 和 實(shí)際分布之間的不確定性
【Adtributor 算法】
https://blog.csdn.net/Eaton18/article/details/103797563
https://cloud.tencent.com/developer/article/1644348
核心思路:對(duì)每個(gè)維度,找出真實(shí)值和預(yù)測(cè)值存在巨大差異的幾個(gè)因素,如果這些因素累加在一其的波動(dòng)占整體波動(dòng)很大比例,則認(rèn)為這幾個(gè)因素就是造成這次收入波動(dòng)的根本因素
Adtributor缺點(diǎn)及局限
(1)上述是針對(duì)基本類(lèi)型的KPI的計(jì)算公式(例如PV、交易量),對(duì)于派生類(lèi)型的KPI(多個(gè)基本類(lèi)型KPI計(jì)算得到,例如成功率)就不太適用了
(2)將根因限定在一維的假設(shè)不太符合我們的實(shí)際場(chǎng)景,同時(shí)用解釋性和驚奇性的大小來(lái)衡量根因也不完全合理。因?yàn)槠錄](méi)有考慮到維度之間的相互影響以及「外部根因」的可能
(3)Adtributor的根因分析嚴(yán)重依賴(lài)于整體KPI的變化情況,對(duì)于整體變化不大,但是內(nèi)部波動(dòng)較為劇烈的數(shù)據(jù)表現(xiàn)不好
相關(guān)論文
Adtributor: Revenue Debugging in Advertising Systems
Recursive Adtributor
iDice: Problem Identification for Emerging Issues
翻譯
主要貢獻(xiàn)是尋找effective combination
HotSpot: Anomaly Localization for Additive KPIs with Multi-Dimensional Attributes
翻譯
Squeeze:Generic and Robust Localization of Multi-Dimensional Root Causes
Bayesian structure learning algorithm
知乎精答
https://www.zhihu.com/question/331456480/answer/806871325