【Tag Recommendation】Flickr Tag Recommendation based on Collective Knowledge

論文信息

  • WWW 2008
  • Yahoo! Research
  • tagging(給item推薦tag)問題

標(biāo)簽應(yīng)用:

  1. 在一個(gè)應(yīng)用程序中,推薦的標(biāo)簽被呈現(xiàn)給用戶,用戶可以選擇相關(guān)標(biāo)簽并將它們添加到照片中。
  2. 推薦標(biāo)簽直接用于豐富檢索系統(tǒng)的索引。

主要工作

  • 分析用戶如何標(biāo)記照片和他們提供的標(biāo)簽類型
  • 提出了四種不同的標(biāo)簽推薦策略。
    基于此分析,我們通過推薦可添加到照片的一組標(biāo)簽來呈現(xiàn)和評(píng)估標(biāo)簽推薦策略以支持照片注釋任務(wù)中的用戶。 實(shí)證評(píng)估的結(jié)果表明,我們可以有效地為各種照片推薦相關(guān)標(biāo)簽。

數(shù)據(jù)集 Flickr Photo

52 million photos
188 million tags(3.7 million unique tags.)

TAG BEHAVIOUR IN FLICKR

How do users tag
Distribution of the Tag Frequency in Flickr

The x-axis represents the 3.7 million unique tags, ordered by descending tag frequency.
The y-axis refers to the tag frequency.

冪律的中間部分包含最有趣的標(biāo)簽推薦候選者,因?yàn)椋?/p>

  • 尾部的標(biāo)簽被判斷為不穩(wěn)定的描述符;
  • 頭部包含的標(biāo)簽過于通用而無用
Distribution of the number of tags per photo in Flickr

The x-axis represents the 52 million photos, ordered by the number of tags per photo (descending).
The y-axis refers to the number of tags assigned to the corresponding photo.

The definition of photo-tag classes and the number of photos in each class
What are users tagging
Most frequent WordNet categories for Flickr tags

用戶不僅標(biāo)記照片的視覺內(nèi)容,而且在很大程度上提供拍攝照片的更廣泛的上下文,例如位置,時(shí)間和動(dòng)作。

TAG RECOMMENDATION STRATEGIES

Given a photo with user-defined tags, an ordered list of m candidate tags is derived for each of the user-defined tags, based on tag co-occurrence. The lists of candidate tags are then used as input for tag aggregation and ranking, which ultimately produces the ranked list of n recommended tags.

使用 co-occurrence 來推導(dǎo)標(biāo)簽之間的關(guān)系。 給定用戶定義的標(biāo)簽和照片,與用戶定義的標(biāo)簽共存的標(biāo)簽通常是推薦的良好候選者。


Tag Co-occurrence

我們將兩個(gè)標(biāo)簽之間的 Co-occurrence 定義為其中兩個(gè)標(biāo)簽用于相同的注釋的次數(shù)。通常將共現(xiàn)計(jì)數(shù)與標(biāo)簽的總頻率標(biāo)準(zhǔn)化。 基本上有兩種不同的歸一化方法:對(duì)稱和非對(duì)稱。

  • 對(duì)稱系數(shù)擅長(zhǎng)識(shí)別等同的標(biāo)簽


    Symmetric measures
  • 不對(duì)稱標(biāo)簽共現(xiàn)更可能提供比其對(duì)稱對(duì)手更合適的候選標(biāo)簽多樣性
    可以將此解釋為照片用標(biāo)簽tj注釋的概率,因?yàn)樗怯脴?biāo)簽ti注釋的。


    Asymmetric measures
Tag Aggregation and Promotion

當(dāng)已知每個(gè)用戶定義標(biāo)簽的候選標(biāo)簽列表時(shí),需要標(biāo)簽聚合步驟以將列表合并為單個(gè)排名。



aggregation methods:

  • Vote
    does not take the co-occurrence values of the candidate tags into account.
  • Sum
    uses the co-occurrence values to produce the final ranking.

實(shí)驗(yàn)

給定Flickr照片和一組用戶定義的標(biāo)簽,系統(tǒng)必須推薦標(biāo)簽,這些標(biāo)簽是照片的良好描述符。 系統(tǒng)提供標(biāo)簽列表(按照作為照片的良好描述符的可能性的降序排序)。 期望這樣的系統(tǒng)向用戶呈現(xiàn)推薦標(biāo)簽,使得用戶可以通過從列表中選擇相關(guān)標(biāo)簽來擴(kuò)展注釋。

Evaluation Metric

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi閱讀 7,814評(píng)論 0 10
  • 晚上十點(diǎn),女兒才睡下,微信提示聲響起。 女孩輕輕地一聲問候:姐,你睡了么? 我回:還沒。 收到的是她一串開心的笑臉...
    陳思潼閱讀 869評(píng)論 0 0
  • 感賞兒子昨天晚上做作業(yè)狀態(tài)不錯(cuò),口算又快又準(zhǔn)。 感賞兒子昨晚做完作業(yè)開心地開電視。 感賞兒子昨晚按時(shí)睡覺。 感賞兒...
    輝_0495閱讀 220評(píng)論 0 0
  • 凌晨?jī)牲c(diǎn)多的時(shí)候,被鍥而不舍的電話鈴聲吵醒。正當(dāng)我內(nèi)心極度不滿準(zhǔn)備狠狠懟那個(gè)擾我清夢(mèng)的人一頓的時(shí)候,那人說的話讓我...
    L君_君無閱讀 445評(píng)論 0 1
  • 1、動(dòng)畫:0a unit 9 2、音頻:0a1–12 滾動(dòng)播放。 游戲: M:Hello,badly.l a...
    xiaohao226234閱讀 284評(píng)論 0 0

友情鏈接更多精彩內(nèi)容