Hadoop概述開源分布式計(jì)算平臺,以HDFS、MapReduce為核心,為用戶提供了系統(tǒng)底層細(xì)節(jié)透明的分布式基礎(chǔ)架構(gòu).高容錯、高伸縮MR允許用...
題目:100w個(gè)數(shù)中找出最大的100個(gè)。 維護(hù)一個(gè)100個(gè)元素的小根堆即可。 或者直接維護(hù)一個(gè)用來存儲當(dāng)前最大的100個(gè)數(shù)的數(shù)組,每次把新來的數(shù)...
將所有查詢進(jìn)行hash(query)%10,映射成新的10個(gè)文件,大約每個(gè)1GB。對每個(gè)文件使用hash_map統(tǒng)計(jì)頻率并排序,然后對10個(gè)結(jié)果...
分析:IP總個(gè)數(shù)2^32 = 4G,如果單機(jī)用一個(gè)hash表來存儲,光IP部分就得4G*4 = 16G,不現(xiàn)實(shí) 把文件按照hash(IP)%10...
一個(gè)文件占用內(nèi)存大小為5G x 64B = 320G,遠(yuǎn)大于實(shí)際內(nèi)存4G,不能一次性載入內(nèi)存。把每個(gè)文件中的url進(jìn)行hash(url)%100...
題目:輸入一個(gè)整數(shù)n,求從1到n這n個(gè)整數(shù)的十進(jìn)制表示中1出現(xiàn)的次數(shù)。 解法:
題目:輸入一個(gè)正整數(shù)數(shù)組,把數(shù)組里所有數(shù)字拼接起來排成一個(gè)數(shù),打印能拼接處的所有數(shù)字中最小的一個(gè)。例如輸入數(shù)組{3,32,321},則打印出這3...
題目:把n個(gè)骰子仍在地上,所有骰子朝上一面的點(diǎn)數(shù)之和為s。輸入n,打印出s的所有可能的值出現(xiàn)的概率。 n個(gè)骰子的點(diǎn)數(shù)之和最小為n,最大值為6n,...
題目一:輸入一個(gè)英文句子,翻轉(zhuǎn)句子中單詞的順序,但單詞內(nèi)字符的順序不變。為簡單起見,標(biāo)點(diǎn)符號和普通字母一樣處理。例如輸入字符串"I am a s...