這篇文章主要做了以下這些內(nèi)容:
- 收集豆瓣電影排名榜單信息并加以處理成便于調(diào)用的文檔形式。
- 分析榜單中影片相關的數(shù)據(jù),并運用了多種不同的圖表展示這些數(shù)據(jù)之間的關系關系。
經(jīng)過前幾段的簡單分析,我們可以發(fā)現(xiàn)豆瓣TOP250榜單對于國內(nèi)電影主流文化還是比較契合的
我們都知道世界上沒有一份絕對公平的榜單,世界上的好電影絕對不止250部,孰優(yōu)孰劣這種主觀的問題本身就沒有絕對的答案。現(xiàn)在大量的算法在研究如何做智能算法、個性化推薦算法、預測型算法,但是算法得到的結(jié)果總是客觀存在的,以客觀事物來揣摩人們的主觀內(nèi)心想法始終是一件很難做得面面俱到的事情。
因此我們也不能忽視此類普適的非個性化推薦算法,這份TOP250榜單以其廣泛的適應性,在缺乏足夠多的數(shù)據(jù)支撐智能算法分析的情況下來說,是一個很好的解決方案。
有待改進的地方
- 對于評分相同的影片并不一定代表影片質(zhì)量就相當,還需要考慮評分的標準差、不對稱性等高階數(shù)據(jù)的影響因素。
- 數(shù)據(jù)可視化部分增加更多交互性,比如顯示鼠標懸停位置的數(shù)據(jù)詳情顯示。
- 數(shù)據(jù)源的動態(tài)分析,增加時間維度的分析。追蹤排行榜的變化,相應的自動調(diào)整展示的分析結(jié)果。
- 單一數(shù)據(jù)源局限性較大,增加與其他榜單如
IMDb的數(shù)據(jù)比較可以更加凸顯其特點。