字節(jié)跳動(dòng)內(nèi)推了 ~~~ 如果是社招,郵件名請(qǐng)以“姓名-職位”命名,發(fā)送簡(jiǎn)歷到 liaojiayi@bytedance.com如果是校招,直接訪問投遞鏈接: https://j...
個(gè)人見解 :)。
數(shù)據(jù)SCT定律:存儲(chǔ),計(jì)算,時(shí)間其實(shí)沒有SCT定律,這個(gè)是我根據(jù)分布式CAP定律瞎造的。不過呢,從大數(shù)據(jù)這個(gè)行業(yè)來說,我們始終都是在存儲(chǔ),計(jì)算和時(shí)間進(jìn)行權(quán)衡,博弈以及突破。某種程度上來說,當(dāng)擁有其中兩者,可...
文章很棒!
```
我們沒有一個(gè)統(tǒng)一的大數(shù)據(jù)應(yīng)用,還是各種應(yīng)用孤立的跑在硬件上(我們會(huì)把Yarn,K8s當(dāng)做硬件),這個(gè)時(shí)候我們會(huì)嘗試使用Spark,Preso,Impala,Kylin等各種系統(tǒng)解決各自的問題。
```
關(guān)于這點(diǎn),YARN和K8S在數(shù)據(jù)處理中更多的是承擔(dān)一個(gè)資源管理的作用。而Spark,Presto,Impala等本身更專注于計(jì)算(ETL)本身。Kylin是一個(gè)相對(duì)完備的OLAP系統(tǒng),從處理到查詢展現(xiàn)。這些本身跟YARN等資源管理組件并沒有沖突哈。
數(shù)據(jù)SCT定律:存儲(chǔ),計(jì)算,時(shí)間其實(shí)沒有SCT定律,這個(gè)是我根據(jù)分布式CAP定律瞎造的。不過呢,從大數(shù)據(jù)這個(gè)行業(yè)來說,我們始終都是在存儲(chǔ),計(jì)算和時(shí)間進(jìn)行權(quán)衡,博弈以及突破。某種程度上來說,當(dāng)擁有其中兩者,可...
注:本文轉(zhuǎn)自我的個(gè)人博客。 Watermark是流式處理中的一個(gè)基礎(chǔ)概念,關(guān)于Watermark的概念有很多,在這里不做闡述。 Watermark特性 這不是官方的表述,我根...
最近遇到這個(gè)Exception,發(fā)現(xiàn)不少開源框架在實(shí)現(xiàn)快速讀寫文件時(shí),采用的都是FileChannel的map方法,示例如下: 這個(gè)方法的作用是將文件映射到堆外內(nèi)存中,然后通...
注:本文轉(zhuǎn)自我的個(gè)人博客(Spark - 利用WeakReference來清理對(duì)象)。 最近在stackoverflow上看到有人好奇Spark是在什么時(shí)機(jī)對(duì)Accumula...
注:本文轉(zhuǎn)自我的個(gè)人博客(Bitmap - 性能和原理研究) Paper原文地址:An Experimental Study of Bitmap Compression vs...
先科普一下大名鼎鼎的Two Sigma吧。2001年創(chuàng)立,現(xiàn)在管理多達(dá)500億美金的資產(chǎn),排名對(duì)沖基金公司的全球第四!?。∽鰹橐患抑膶?duì)沖基金,為何他們給Apache Sp...
注:本文轉(zhuǎn)自我的個(gè)人博客 Aerospike(3) - Evict機(jī)制。 在實(shí)時(shí)的場(chǎng)景中,我們往往會(huì)對(duì)Aerospike/Redis等設(shè)置evict機(jī)制,來防止流量暴增帶來的...
當(dāng)今的自主駕駛是典型的數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)業(yè),八仙過海各顯神通。無論技術(shù)多么先進(jìn),他們所有決策和算法都是來基于senor產(chǎn)生的數(shù)據(jù)。比如,以Udacity Lincoln MKZ為例...