曲庫(kù)染色

本次重點(diǎn)關(guān)注了一下Pandora的Music Genome Project(音樂基因組計(jì)劃),last.fm的分析方式基于播放歷史和社會(huì)化關(guān)系的部分會(huì)更多,而不像Pandora對(duì)音樂本身有比較詳盡的拆分。Spotify的相關(guān)資料較少,待查。

一、 Pandora的Music Genome Project

簡(jiǎn)要的說Music Genome Project就是通過專家的智慧,以450多種“基因”來描述一首音樂。其中一種基因代表一種聲音的特征。比如“主唱的性別”“電吉他的失真程度”“背景人聲的類型”等等。

Pandora將音樂先分為了了5個(gè)大類流行/搖滾(Pop/Rock),嘻哈/電子(Hip-Hop/Electronica),世界音樂(World Music),爵士(Jazz)和古典(Classical)。根據(jù)音樂類型的不同,搖滾/流行大概包含150個(gè)“基因”,嘻哈/電子含有350個(gè),爵士樂含有差不多400個(gè),世界音樂和古典含有300~450個(gè)。每個(gè)“基因”都會(huì)被賦予[0,5]的以0.5位單位的計(jì)量數(shù),反應(yīng)特征強(qiáng)度。所以在Music Genome Project的數(shù)據(jù)庫(kù)中,每首歌都是由一組多維向量描述。這些tag的標(biāo)注工作全部由Pandora的音樂家人工進(jìn)行。一首歌需要花費(fèi)20到30分鐘,還需經(jīng)過復(fù)核。

由“一致的標(biāo)準(zhǔn)和框架”“專家控制tag”很大程度上保證了tag的質(zhì)量,但也會(huì)有一些問題,放在后文討論。


二、 Pandora的“基因”

當(dāng)你Google“Music Genome Project”時(shí),會(huì)發(fā)現(xiàn)這已經(jīng)是個(gè)注冊(cè)商標(biāo)了。且Pandora已經(jīng)為這份“Genes List”申請(qǐng)專利,這是商業(yè)機(jī)密。不過我們還是能夠從前臺(tái)看到一些露出來的部分。選幾個(gè)例子來看一下,流行電子,爵士,后搖,古典各選一首:


1. Owl City和蹲妹的《Good Time》

Owl City和蹲妹的《Good Time》

這首歌一般看就是一首典型的電子流行曲,但是展示出來的“genes”包括:

electronica influences:電子樂影響

mild rhythmic syncopation:不知道怎么翻譯

heavy use of vocal harmony(antiphony):大量人聲和聲

repetitive melodic phrasing:重復(fù)的樂句

extensive vamping:不知道怎么翻譯

a clear focus on recording studio production:不知道怎么翻譯

paired vocal harmony:成對(duì)的人聲和聲

major key tonality:主key音調(diào)(不知道怎么翻譯)

prominent use of synth:明顯的合成器使用

upbeat lyrics:樂觀向上的樂詞


2. Max Richter的《On The Nature of Dayligt》

Max Richter的《On The Nature of Dayligt》

后搖器樂,沒聽見人聲

a tranquil mood:心情平靜

a subdued,expressive aesthetic:柔和的,有表現(xiàn)力的美

a feeling of melancholy:一種憂郁感

a Contemporary style:當(dāng)代(?)的風(fēng)格

a small string ensemble:

cello:大提琴

viola:中提琴

violin:小提琴

tonal harmony:調(diào)性和聲

a slow and stately tempo:一種緩慢莊嚴(yán)的拍子


3. Django Reinhardt《Time on My Hands》

Django Reinhardt《Time on My Hands》

new orleans influences:受到新奧爾良的影響

swing influences:強(qiáng)節(jié)奏爵士音樂的影響

world music influences:世界音樂的影響

a mid-tempo dance style:中板舞曲風(fēng)格

a violin solo:小提琴獨(dú)奏

a great acoustic guitar solo:非常牛逼的木吉他獨(dú)奏

a lazy swing groove:不知道怎么翻譯

two-step style:兩步舞曲風(fēng)格


4. 巴赫《suite for solo cello無伴奏大提琴組曲》


巴赫《suite for solo cello無伴奏大提琴組曲》

a subdued, expressive aesthetic:柔和,富有表現(xiàn)力的美感

an acclaimed work:廣受好評(píng)的作品

a well-known composer:著名作曲家

tonal harmony:

major key tonality:

a Baroque style:巴洛克風(fēng)格


根據(jù)Pandora的Blog放出的文章,Steve Hogan在比較兩個(gè)音樂作品的差異時(shí),用了以下五個(gè)維度:

人聲表現(xiàn)(Vocal performance

歌詞(Lyrics

旋律(Melody

韻律(Rhythm

配器/樂器(Instrumentation)

Pandora后臺(tái)的tag大概也是按照這五個(gè)大類區(qū)分的。

但結(jié)合上面四個(gè)例子,我認(rèn)為后臺(tái)的tag還會(huì)有:“Mood and Atomosphere情緒和氛圍”這一大類。翻了幾首器樂為主線的曲子,很多都會(huì)出現(xiàn)相關(guān)的tag描述。

pandora相關(guān)文章:

http://blog.pandora.com/us/from-the-music-genome-project-the-anatomy-of-a-scary-soundtrack/


三、 曲庫(kù)分類

以上這幾類的分類,可以區(qū)分為兩種:track的自然屬性和社會(huì)屬性。

自然屬性是為客觀的天然屬性:如tempo,配器,人聲類型,主唱性別等

社會(huì)屬性為帶有打tag人經(jīng)驗(yàn)或者情感的屬性:情感,場(chǎng)景,還有類似【a subdued, expressive aesthetic】這類的屬性。

其中第一種比較客觀,但第二種會(huì)受到打tag人特質(zhì)的影響,所以這類tag如果全由曲庫(kù)運(yùn)營(yíng)來打肯定是不全且不客觀的。運(yùn)營(yíng)者打出來的標(biāo)簽很可能只是“符合受過音樂高等教育的人的口味”而已。一個(gè)文藝青年可能使用打雷姐的歌做睡前放松,但這種情況會(huì)在一個(gè)樸實(shí)的勞動(dòng)人民身上發(fā)生嗎,顯然不會(huì)。

The idea that all music is equal and deserves equal rights is somehow fundamentally a democratic idea; as is the corresponding idea that the public, and not some small cadre of experts, is the best judge of musical quality.But the fact that some music not only attracts more listeners, but also seems to mean more to more people over a longer period of time, indicates that there is actually something fundamentally unequal about music as well.”

所以我們給曲庫(kù)染色的目的是創(chuàng)建tag,tracks和用戶三者之間的聯(lián)系。有一個(gè)重點(diǎn)是如何把用戶的影響加入到“影響tag和track”的因素里。

1. 用戶 - 標(biāo)簽:第三方數(shù)據(jù)

- 去爬曲庫(kù)中曲目在豆瓣,蝦米上的用戶打的tag(但是質(zhì)量問題?如果不采用人工篩選的話)

- 去爬歌單豆單的title和曲目列表。提取title中關(guān)鍵字分配至曲目列表作為臨時(shí)tag,最后做匯總,出現(xiàn)率高的成為正式tag


2. 用戶 - 歌曲:人群屬性tag

所有歌曲都應(yīng)該有一個(gè)人群屬性標(biāo)簽(什么樣的用戶什么場(chǎng)景什么時(shí)間會(huì)喜歡這首歌)

- 建立一個(gè)用戶屬性的分析策略:收集音樂使用案例,分析用戶屬性和歌曲自然屬性的關(guān)系,以自然屬性給歌曲打上社會(huì)屬性。

- 之前葉子提到的收集賣出去音樂的用戶反饋,記錄用戶屬性+對(duì)音樂的偏好



3. 標(biāo)簽 - 歌曲:

自然屬性標(biāo)簽具體要打什么,要找懂音樂的人來定,Pandora有篇報(bào)道中提到,第一次進(jìn)行屬性拆分的時(shí)候,一會(huì)議室的人在一小時(shí)內(nèi)寫出了200+的可用屬性。


建議閱讀:[1] 一文

部分引用來源:

[1] More on Pandora: genres, genomes, and musical taste(http://scholarslab.org/digital-humanities/more-on-pandora-genres/)

[2] wiki百科:Music Genome Project

[3] 一些采訪和新聞

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容