相關(guān)文章
- 海量數(shù)據(jù)處理之經(jīng)典實(shí)例分析
top k 問(wèn)題中各種場(chǎng)景分析的很好:
單機(jī)+單核+足夠大內(nèi)存
單機(jī)+多核+足夠大內(nèi)存
單機(jī)+單核+受限內(nèi)存
多機(jī)+受限內(nèi)存
https://segmentfault.com/a/1190000000510258
- 多路歸并思路
http://www.cnblogs.com/daoluanxiaozi/archive/2012/03/29/2423087.html - 外排序:如何給10^7個(gè)數(shù)據(jù)量的磁盤文件排序
位圖和多路歸并、都有實(shí)現(xiàn)
http://blog.csdn.net/v_JULY_v/article/details/6451990
注:隨機(jī)數(shù)產(chǎn)生必須srand()和rand()配合使用函數(shù)一:int rand(void);從srand (seed)中指定的seed開(kāi)始,返回一個(gè)[seed, RAND_MAX(0x7fff))間的隨機(jī)整數(shù)。
函數(shù)二:void srand(unsigned seed);參數(shù)seed是rand()的種子,用來(lái)初始化rand()的起始值。
可以認(rèn)為rand()在每次被調(diào)用的時(shí)候,它會(huì)查看:
1) 如果用戶在此之前調(diào)用過(guò)srand(seed),給seed指定了一個(gè)值,那么它會(huì)自動(dòng)調(diào)用srand(seed)一次來(lái)初始化它的起始值。
2) 如果用戶在此之前沒(méi)有調(diào)用過(guò)srand(seed),它會(huì)自動(dòng)調(diào)用srand(1)一次。
參考鏈接:http://blog.sina.com.cn/s/blog_8cf0057a01011ekt.html - 倒排索引與正排索引
概念解釋的很清楚
http://blog.sina.com.cn/s/blog_5b29caf701015tpa.html - 倒排索引關(guān)鍵詞不重復(fù)Hash編碼:(這個(gè)可以選擇了解)
https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/%E5%80%92%E6%8E%92%E7%B4%A2%E5%BC%95%E5%85%B3%E9%94%AE%E8%AF%8D%E4%B8%8D%E9%87%8D%E5%A4%8DHash%E7%BC%96%E7%A0%81.md - 海量數(shù)據(jù)中尋找中位數(shù)
http://www.voidcn.com/blog/zhouwei1221q/article/p-3715373.html
教你如何迅速秒殺掉:99%的海量數(shù)據(jù)處理面試題(july總結(jié)很全面)
http://blog.csdn.net/v_july_v/article/details/7382693
海量數(shù)據(jù)處理之歸并、堆排、前K方法的應(yīng)用:一道面試題(一提多法)
http://www.ahathinking.com/archives/19.html
題集
http://blog.csdn.net/wdzxl198/article/details/8925892
https://github.com/nonstriater/Learn-Algorithms/blob/master/%E7%AE%97%E6%B3%95%E9%97%AE%E9%A2%98%E9%80%89%E7%BC%96/%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86.md