最近了解了一些其他公司的數(shù)據(jù)架構(gòu)體系,感覺大體上都差不多,根據(jù)公司的具體場景也繪制了一個比較通用的數(shù)據(jù)平臺架構(gòu),算是mark下吧。
開始之前 Kafka源碼環(huán)境依賴Gradle、Scala和Zookeeper,所以需要提前將這些依賴安裝好,由于這三個依賴的安裝相對比較簡單,所...
詞云 做過數(shù)據(jù)分析的應(yīng)該對詞云這個概念不會陌生,詞云以云圖的方式將詞(一般指tag)的頻率信息很好的呈現(xiàn)出來。下面是來自百度百科的定義。 “詞云...
接觸Java有段時間了,基本的原理和使用大概清楚了,想通過閱讀源碼來進一步提升Java能力,聽說Doug Lea的java.util.concu...
前言 上一篇我們通過一個簡單的例子了解了基于XML配置文件的方式初始化Mybatis的過程,毫不夸張的說,MyBatis初始化的過程,就是創(chuàng)建 ...
前言 最近項目中使用到了Mybatis持久層框架,由于從來沒有深入的了解過基于Java語言實現(xiàn)的持久層框架,于是有點心血來潮,所以就有了這篇長文...
之前介紹過Apache Spark的基本概念以及環(huán)境準(zhǔn)備,本篇以分類算法為入口,主要熟悉下Spark的Python API,重點不在算法,而是A...
Apache Spark 簡介 Apache Spark 是什么 Apache Spark是一個分布式計算框架,旨在簡化運行于計算機集群上的并行...
每一個使用Git進行管理的項目,在其根目錄下都會存在一個名為 .git 的目錄,其內(nèi)容如下圖,接下來主要介紹下目錄中的HEAD、index、ob...