論文 | 信息檢索結(jié)果Ranking的評(píng)價(jià)指標(biāo)《RankDCG: Rank-Ordering Evaluation Measure》

未經(jīng)允許,不得轉(zhuǎn)載,謝謝~~

一 文章簡(jiǎn)介

為什么要提出這個(gè)新的評(píng)價(jià)算法?

  1. 我們都知道ranking過程對(duì)于信息檢索的結(jié)果是非常重要的,那么我們就需要有一些算法能評(píng)價(jià)ranking的結(jié)果到底如何。
  2. 現(xiàn)有用來評(píng)價(jià)ranking的常用算法有:Kendall's τ, Average Precision(AP) , Mean Average Precision(MAP),Discounted Cumulative Gain (DCG), nDCG.
  3. 跟簡(jiǎn)單的分類任務(wù)只需要一個(gè)accuracy不一樣,盡管已經(jīng)有了那么多的ranking measures,但仍然存在一些問題。
  4. 尤其是在解決“對(duì)那些具有相同等級(jí)分布和傾斜等級(jí)分布多個(gè)關(guān)系的離散值元素進(jìn)行排序任務(wù)時(shí)”;
  5. 所以本文基于nDCG算法提出了RankDCG,并提出一些標(biāo)準(zhǔn)來測(cè)試這些算法,實(shí)驗(yàn)發(fā)現(xiàn)只有本文的RankDCG滿足全部的要求。

二 排序問題描述

  1. Ordering:用網(wǎng)頁檢索的例子來看就是要在接近無窮大的數(shù)據(jù)集中找到相應(yīng)的信息并對(duì)它們進(jìn)行相關(guān)性排序。
  2. 問題可以用數(shù)學(xué)的方式定義為:
    • A為一系列元素: A = [x1,x2,x3,...,xn];
    • f(x)度量了元素x與query的相關(guān)性,f(x)屬于0-1;
    • 通常我們能在A中的n個(gè)元素找到m個(gè)相關(guān)的元素,并按相關(guān)性由高到低進(jìn)行排序得到目標(biāo)結(jié)果B;
    • B = [x|x ∈ A,f(x) > 0], 且 B = [ f(x1) > f(x2) > f(x3) > ... > f(xm) ];
  3. 在本文中考慮現(xiàn)實(shí)世界中經(jīng)常出現(xiàn)的排序問題,例如推薦系統(tǒng)和用戶排序;這跟上面提到的網(wǎng)頁檢索有一些不太一樣的地方,包括:
    • 在這里每個(gè)元素都是相關(guān)的;
    • 待排序的都是離散值;
    • 會(huì)出現(xiàn)多個(gè)元素具有相同等級(jí)的情況;
    • 排序結(jié)果可能會(huì)出現(xiàn)只有非常少數(shù)的top result是相關(guān)的情況;
  4. 針對(duì)上述問題,重新定義了目標(biāo)結(jié)果B的表示為: B = [f(x1) ≥ f(x2) ≥ f(x3) ≥ ... ≥ f(xn)],并對(duì)ranking measure提出了需要能夠正確反映上述4點(diǎn)的要求。

三 現(xiàn)有評(píng)價(jià)方法

信息檢索領(lǐng)域有多個(gè)方法來評(píng)價(jià)rank ordering的好壞,但是沒有一個(gè)對(duì)上面描述的這種問題是完全適用的,接下來先看看目前常用的一些評(píng)價(jià)算法。

3.1 F-measure(F-score)

  1. 這是一個(gè)在IR中非常常見的評(píng)價(jià)指標(biāo);
  2. 同時(shí)考慮了檢測(cè)精度p和召回率r;


  3. 但是不適用于所有元素都相關(guān)的情況,也沒有將不同的ranks考慮在內(nèi),所以不適合作為rank-ordering的評(píng)價(jià)標(biāo)準(zhǔn)。

3.2 Average Precision and Mean Average Precision

  1. AP


  • 其中:P(k) = precision@k , ?R(k) = |recall(k?1)?recall(k)|.
  • 其實(shí)理論上的AP應(yīng)該等于綠色的precision-recall線的下方面積,而用近似計(jì)算就等于看成是一小塊的長(zhǎng)方形的面積之和,即為圖中紅色虛線的下方面積。
  1. MAP


  • 其中:Q 是query的集合,而q是單個(gè)的query,即對(duì)所有query的AP求平均。
  1. AP,MAP都可以評(píng)價(jià)rank-ordering問題;
  2. AP,MAP基于rank與rank之間沒有關(guān)系的這個(gè)前提,沒有考慮多個(gè)元素會(huì)是同一個(gè)rank的情況;
  3. AP,MAP對(duì)所有的rank values都是用相同的cost對(duì)待,沒有考慮需要將更多的注意力放在少數(shù)幾個(gè)high-rank的元素上。

3.3 Kendall’s τ

  1. 這個(gè)算法考慮了給定list和結(jié)果list之間元素對(duì)之間的匹配程度;


  2. c表示匹配的元素對(duì)的數(shù)量,d表示不匹配的元素對(duì)數(shù)量;
  3. 這個(gè)算法仍然沒有考慮多個(gè)元素值相同rank,與非常少的top-k個(gè)相關(guān)元素分布情況。
  4. 關(guān)于這個(gè)算法這里給出一個(gè)具體的例子:


3.4 Discounted Cumulative Gain (DCG)

  1. 這個(gè)算法考慮了rank排序的問題,是目前文章中介紹過的唯一一個(gè)用了cost function的算法;
  2. 本文也是自己與這個(gè)算法做的改進(jìn);


  3. rel()指的是相關(guān)度度量函數(shù),i 表示元素所在的位置;


  4. 這里有一個(gè)很不錯(cuò)的例子哦.
  5. 標(biāo)準(zhǔn)的DCG根據(jù)元素所在的位置不同給出不同的cost;
  6. 而文章作者認(rèn)為[9,1,1]對(duì)于結(jié)果[1,9,1]與[1,1,9]應(yīng)該是一樣的(因?yàn)橹挥幸粋€(gè)9是top-1,而且都出錯(cuò)了)

四 本文評(píng)價(jià)算法:RankDCG

  1. 從一個(gè)例子開始分析:
  2. 下面兩張圖為standard DCG與別人改進(jìn)的DCG在各個(gè)元素上的cost圖:


  3. 不足之處:這兩個(gè)算法都將一般以上的cost放在了最高rank的元素上,這會(huì)導(dǎo)致整個(gè)評(píng)價(jià)算法引導(dǎo)ranking的走向找到top-rank的元素而不是做好ordering工作。
  4. 所以文章做的第一個(gè)工作:提出了新的rel()函數(shù),具體體現(xiàn)為將原來的變成:

    具體步驟是:在L中有10個(gè)rank值,但是只有4個(gè)不同的rank,所以按照rank value對(duì)元素進(jìn)行分組,得到4,那個(gè)第一個(gè)sublist的rankvalue就改成4,后面的sublist依次遞減。

  5. 這樣可以得都到以下的結(jié)果圖,可以看到整個(gè)cost下降更均衡了。


  6. 現(xiàn)在這樣其實(shí)還有一個(gè)問題,基于位置的折損函數(shù)cost會(huì)導(dǎo)致本來rank value一樣的值最后得到的cost卻是不一樣的,例如最后4個(gè)1。
  7. 文章做的第二個(gè)工作就是將基于位置的折損改成新的折損系統(tǒng),具體方法是對(duì)L‘的rank value做一個(gè)翻轉(zhuǎn),將值依次賦給各個(gè)sublist。最后得到:


  8. 這時(shí)候的cost圖為:


  9. 最后也模仿DCG->nDCG的過程,做了一次歸一化,即最終的RankDCG算法等于:


寫在最后

寫完了嘻嘻~~

簡(jiǎn)書不支持公式真的有點(diǎn)小小的不方便,所有的公式都來自論文presentation的截圖。

最后,不是做信息檢索的,這篇論文只是課程的一個(gè)報(bào)告,有理解不正確或者不到位之處歡迎大佬評(píng)論獲或者私信謝謝ヾ(?°?°?)??

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 項(xiàng)目管理術(shù)語英漢對(duì)照表2018-7-20 A Abstract Resource 抽象資源 Abstraction...
    007明_陽閱讀 6,685評(píng)論 0 51
  • 直接上代碼吧 { title:'SDK名稱', key:'sdkName', width:...
    easy_mark閱讀 3,522評(píng)論 0 0
  • 我也拿不準(zhǔn)未來會(huì)是什么樣子。我不知道自己會(huì)走上什么樣的道路。好像一切都是模糊和不確定。 管他呢,關(guān)于未來等我老去的...
    一口枯井閱讀 264評(píng)論 0 1
  • 每次爬山我都特別鄙視一種人,穿著高跟鞋的人。 于是,今天我穿著小坡跟涼鞋爬了山...... 我特別喜歡爬山,曾經(jīng)說...
    良小順閱讀 521評(píng)論 0 1
  • 1、感恩老公今早給寶寶穿衣服。 2、感恩今早做了不辣的豆瓣醬豆腐,好吃! 3、感恩一大早姐姐上來,把兒子帶到媽媽家...
    與真我合一之路閱讀 227評(píng)論 0 0

友情鏈接更多精彩內(nèi)容