故事:坐在我隔壁的小王問我什么是HyperLogLog

1

最近坐我隔壁的小王同志,心情真是糟透了。不但工作不順心,被老板狠狠的批了一頓,連女朋友也跟別人跑了(Y 的讓你天天在我面前秀)。

真是不可謂不慘,我都快要同情他了。

看著他萎靡又迷離的眼神,我實(shí)在不忍心,就勸他請假幾天出去散散心。

臨走前,我交代他,有什么緊急的事,就聯(lián)系哥。

還有,不要忘了我們之間的暗號哦 ~

2

于是,小王就拖著疲憊的身軀,背著雙肩背包和最新款mac,穿著他最心愛的格子衫出發(fā)了。

去哪呢,這是一個問題。平時宅在家里習(xí)慣了,想來一場說走就走的旅行還是真不容易呀。

就在小王犯難的時候。

耳機(jī)里應(yīng)時地傳來一句歌聲:”坐上了火車去拉薩,去看那神奇的布達(dá)拉?!?/p>

額,那就去布達(dá)拉宮吧。參觀一下號稱世界上海拔最高的建筑,同時感受一下西藏妹子人民的熱情。

3

帶著對未來的憧憬,踏上旅途的小王,坐在高鐵上,聽著音樂,很快就進(jìn)入了夢鄉(xiāng)。

夢中他做了一個奇怪的夢,夢到自己不知怎地來到了陌生的世界。

而自己卻不知身在何處,身邊只有陣陣的風(fēng)沙跟隨。

心道,我這是到哪了,不是應(yīng)該到布達(dá)拉宮了嗎。

努力的向遠(yuǎn)處張望,卻怎么也看不真切。

終于睜大眼睛看清了。

卻發(fā)現(xiàn),迎面走過來一位乘務(wù)員小姐姐,輕啟紅唇,對小王說,先生到站了,還請趕快準(zhǔn)備行李下車了。

4

哦,原來是個夢啊。

心道,這該死的福報,給我搞的都快分不清自己是莊周還是蝴蝶了。

趕緊下了車,跟著大部隊,走向布達(dá)拉宮的方向。

還沒進(jìn)到布達(dá)拉宮里邊,小王就感受到了這偉大建筑的雄偉壯觀。真是不虛此行啊。

不自覺的就加快了腳步,想一探究竟。

走著走著,小王卻發(fā)現(xiàn)周圍的人一個一個都不見了蹤影,只留下自己形單影只。

忽然,眼前一白,再睜開眼,發(fā)現(xiàn)自己置身于一片山林之中。

就在小王心覺奇怪時,隱約聽到遠(yuǎn)處傳來一陣陣的嬉笑聲和水流聲。

好奇心驅(qū)使下,小王循著聲音走去。隔著一片草叢,發(fā)現(xiàn)了讓他血脈噴張的畫面。

一群 x 身 x x 的仙女正在水中戲耍,一個個毫無顧忌的互相嬉鬧。姣好的身材一覽無余。

就在小王看的入神之際,突然聽到一聲大喊:誰?!

下一刻就發(fā)現(xiàn)他面前站著一個身穿廣袖流仙裙的仙女。還未來得及反應(yīng),就感覺腦袋一沉,昏睡過去了。。。

5

也不知道過了多長時間,小王感覺好像一個世紀(jì)都過去了。睜開眼發(fā)現(xiàn)自己正躺在一個類似古代閨房的床上。卻發(fā)現(xiàn)身體無論如何也是動不了一分。

透過屏風(fēng),像是聽到有幾個女孩子在談話。

“怎么從來沒有見過這樣的人,他為什么和我們長的不太一樣?!?/p>

“他到底是干什么的,為什么可以穿越結(jié)界,來到我們女兒國。一般人是做不到的。”

正在討論間,卻發(fā)現(xiàn)聲音截然而止。然后聽到整齊劃一的聲音,“恭迎女王陛下”。

然后,發(fā)現(xiàn)進(jìn)來了一個仙女,擁有著絕世容顏,毫無瑕疵的臉蛋,美的不可方物。

原來這就是女兒國的國王。

女王畢竟是見過世面的人,知道小王就是傳說中的男人。

然后把小王的禁錮給解除了。小王瞬間感覺身上沉重的力量消失了,渾身輕松。

6

(場景切換)

本來小王只請假了一周,但是眼看第二周就要過完了,也沒再收到過小王的消息。

我也納悶,這家伙怎么回事,旅游放松一下就好了,竟然把時間都忘了。

這還有一大堆工作,我?guī)退抵?,再不回來我就報警了?。o奈)。

。。。

某天深夜,當(dāng)我正在發(fā)奮寫文章時,手機(jī)突然收到一條消息。

天王蓋地虎

臥槽,這是小王給我發(fā)暗號了?

當(dāng)時,我們約定只有緊急情況下才發(fā)暗號,莫非是小王遇到了什么麻煩?

于是,我趕緊對暗號,希望他不要出什么事才好。

小雞燉蘑菇

隨后,小王給我簡單敘述了他這一周多的經(jīng)歷。如果不是星哥我經(jīng)歷豐富,差點(diǎn)都被他搞懵逼了。

下面是小王的自述:《《《

那天,我決定去布達(dá)拉宮看宮殿,不料,卻走到了女兒國的宮殿。

這不要緊,關(guān)鍵是女兒國現(xiàn)在遭遇了一些事情,環(huán)境惡化,已經(jīng)影響到她們的正常生活了。

為了她們的子孫后代,急需一位心地善良,心靈純潔之人幫助她們化解危機(jī)。

其實(shí)要做的事情也很簡單,就是讓我和女兒國的仙女們一起雙修就好了。

在女王陛下的一再懇求下,本著助人為樂的精神,我只能留下來幫她們了。

為了更快更效率的完成任務(wù),我記錄了這段時間和哪些仙女進(jìn)行過雙修,并把她們進(jìn)行了編號。

這個好說,因?yàn)閿?shù)據(jù)量目前也不大,我決定用 Redis 的 Set 集合來裝填數(shù)據(jù)就可以。

set = {id1,id2,id3}

隨著需要我?guī)椭娜嗽絹碓蕉?,我發(fā)現(xiàn)仙女們各自的體質(zhì)也稍有不同。因此,每個人和我雙修的次數(shù)也不固定。

于是,我只能修改記錄方式。

用 zset 來分別記錄每個人和我雙修的次數(shù),

zset = {id1: count1, id2: count2, id3: count3}

后來,仙女?dāng)?shù)量實(shí)在是太多了,以上記錄方式已經(jīng)行不通了,內(nèi)存會爆掉的。索性我就不算了,何必給自己添麻煩呢。

但是,突然,有天我正在和一個仙女雙修呢。女王陛下來到我旁邊,看著我辛苦的樣子(也或許是我?guī)洑獾膫?cè)顏)。發(fā)現(xiàn)我滿臉汗水,于是用那還殘留著女王香氣的手帕溫柔地幫我擦汗。

我能清晰的感覺到女王在我耳邊吐氣如蘭,一雙美眸撲閃撲閃地看著我。那細(xì)膩光滑、吹彈可破的臉蛋兒,就像剛剝殼的雞蛋一樣。

就在我內(nèi)心波瀾起伏時,女王問我,哥哥,你能估算一下現(xiàn)在大概有多少個仙女雙修過了嗎。

這下我慌了,這可怎么辦呢,我可沒有計算這個東東啊。

星哥,江湖救急啊。

》》》

看到這里,我真是氣不打一處來,這特么合著我給你頂包,你在外邊逍遙快活呢。這真不是人干的事兒啊。

我:你 Y 的,瘦弱的小身板,能經(jīng)得起折騰嗎?

小王: 哎呀,星哥你就不用擔(dān)心我這個了。我在這天天吃好喝好的,女王還每天給我喝大補(bǔ)湯,我很 OK 的。你趕緊給我解決方案吧。

聽到這,我氣的打字的雙手都在顫抖。單身狗沒有人權(quán)啊,真是人比人氣死人,和小王比,生活真是一個天上一個地下。

生氣歸生氣,但誰讓我是好人呢(滴,好人卡),就好事做到底吧。

7

:那個,你可以用 HyperLogLog 啊,它的鍵只需要花費(fèi) 12K 的內(nèi)存,就可以計算 2^64 個不同元素的基數(shù)。這樣就大大節(jié)省你的內(nèi)存了。

小王:HyperLogLog 是什么鬼,沒聽說過???還有,你說的基數(shù)是什么意思呢?

: HyperLogLog 是用來做基數(shù)統(tǒng)計的一種算法。當(dāng)輸入元素的數(shù)量越來越大時,它所占用的空間卻是固定的。這是和集合的不同點(diǎn),集合是元素越多,占用空間越大。

基數(shù)很好理解,就比如說有一個數(shù)據(jù)集存儲了每個仙女每次雙修的編號 {1, 3, 5, 8, 3, 5, 9},那么去除重復(fù)元素后的基數(shù)集就是 {1, 3, 5, 8, 9},基數(shù)就是它的個數(shù),這里就是 5 ,代表有 5 個仙女和你一起雙修過了。

因?yàn)槟汴P(guān)心的是有多少個仙女和你雙修過,不關(guān)心具體都是誰。

小王:這個聽起來好像很牛批的樣子,那我怎么使用呢?

:你可以使用 pfadd 命令添加元素,命令格式:pfadd key element [element ...],例如,我添加三個仙女,pfadd fairy_practice id1 id2 id3。

當(dāng)計算基數(shù)時,就可以用 pfcount 命令,格式:pfcount key [key ...]。如果 key 為一個,計算的是這個 HyperLogLog 的近似基數(shù)。如果 key 為多個,就可以計算它們的近似基數(shù)和。

注意,這里的基數(shù)計算是一個估算值,并不是一個準(zhǔn)確的值。

HyperLogLog 只會根據(jù)輸入的元素計算基數(shù),而不會存儲元素本身。這是和集合的另外一個不同點(diǎn),集合會存儲每個輸入的元素。

所以,你用 pfcount fairy_practice 就滿足要求了。因?yàn)榕醪痪妥屇阌嬎阋粋€大概值嗎,而且也沒有讓你說出仙女的具體名字啊。

小王:臥槽,這個真是太神奇了。星哥你可是幫了我大忙了。等我忙完這陣子,回去就給你帶女兒國的特產(chǎn)哈。

:我去你大 x 的。女兒國能有什么特產(chǎn),不都是仙女么,你能給我?guī)韼讉€仙女嗎?

小王:。。。(好像不能)

聽到這,我真是要被氣死了,真是豈有此理,太敷衍我了。

氣的我一下子就把電腦給合上了。

天馬行空無厘頭,vx搜「星哥聊編程」

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容