好的算法模型需要有大量的數(shù)據(jù)來“喂”,哪怕最開始的算法模型很簡單很不合理,通過大規(guī)模的數(shù)據(jù)且結(jié)合一些方式方法也能“喂養(yǎng)”出好的模型來。 所以,如何利用現(xiàn)有數(shù)據(jù)成了最初的關(guān)鍵點...
好的算法模型需要有大量的數(shù)據(jù)來“喂”,哪怕最開始的算法模型很簡單很不合理,通過大規(guī)模的數(shù)據(jù)且結(jié)合一些方式方法也能“喂養(yǎng)”出好的模型來。 所以,如何利用現(xiàn)有數(shù)據(jù)成了最初的關(guān)鍵點...
Pinot是一個每秒可以處理數(shù)以萬計分析類查詢的系統(tǒng),支持近實時地從流式數(shù)據(jù)源進(jìn)行數(shù)據(jù)攝取。簡單來說作為一個分析類系統(tǒng):數(shù)據(jù)進(jìn)得快、查詢返回快。 為了達(dá)到數(shù)據(jù)消費的實時性,P...
前幾天說過發(fā)起了一個《一起讀Paper》的活動,今天結(jié)合自己的經(jīng)驗聊聊怎么去讀一篇論文。 我們讀論文往往都是想從中學(xué)到點經(jīng)驗,讀完一篇論文一定要有一定的產(chǎn)出,否則也就看個熱鬧...
最近抽風(fēng),沒事會在知乎上回答一些問題,也許是想在這個世界上多留下點痕跡吧 :) 幾次看到類似這樣的題目: 作為一個程序員,如何提高自己? 我經(jīng)常是這么回答的: 看開源優(yōu)秀代碼...
對于分布式存儲系統(tǒng),我們都會使用多副本的機制來保證數(shù)據(jù)的安全性。譬如對于 TiKV 來說,我們默認(rèn)會使用 3 個副本,如果需要更高等級的安全性,譬如在銀行領(lǐng)域,我們則會使用 ...
Slice是Presto里面用來對內(nèi)存高效地、自由地進(jìn)行操作的接口。它在Presto里面很關(guān)鍵, Presto里面另外一個關(guān)鍵類 Block 就大量用到了它,要充分理解 Bl...
Presto作為一個計算引擎,除了支持一些常見的數(shù)字、字符串類型的數(shù)據(jù),還支持一些別的系統(tǒng)里面比較少見的自定義的 IpAddress, Geometry 等等高級類型,今天來...