第2章 安裝kafka 本章介紹Apache Kafka broker的入門知識,包括如何搭建Apache ZooKeeper集群, Kafka...
理想情況下,在Kubernetes上部署應(yīng)用程序的開發(fā)人員不需要知道集群提供了什么存儲技術(shù),就像他們不需要知道用于運行pod的物理服務(wù)器的特征一...
譯者有話說 這是一本非常適合數(shù)據(jù)架構(gòu)師或準(zhǔn)數(shù)據(jù)架構(gòu)師閱讀的書!當(dāng)前IT行業(yè),越來越多的數(shù)據(jù)倉庫基于云環(huán)境創(chuàng)建,越來越多的數(shù)據(jù)倉庫要求實時性,越來...
管道概念與設(shè)計 什么是管道? 管道描述了從源頭系統(tǒng)到目標(biāo)系統(tǒng)的數(shù)據(jù)流,并定義了在此過程中如何轉(zhuǎn)換數(shù)據(jù)。 可以使用單個origin(初始)階段表示...
Spark The Definitive Guide(Spark權(quán)威指南) 中文版。本書詳細介紹了Spark2.x版本的各個模塊,目前市面上最好...
Spark The Definitive Guide(Spark權(quán)威指南) 中文版。本書詳細介紹了Spark2.x版本的各個模塊,目前市面上最好...
15.3 使用UDAFs構(gòu)建自定義聚合 在前面的小節(jié)中,您快速回顧了聚合數(shù)據(jù),在簡單數(shù)據(jù)集上執(zhí)行了聚合操作,并最終處理了真實的數(shù)據(jù)。在這些操作中...
Streamsets簡介及概述 StreamSets Data Collector是一個功能強大的企業(yè)級流處理平臺,可以使用該平臺來接入數(shù)據(jù),處...
關(guān)注公眾號:登峰大數(shù)據(jù),閱讀Spark實戰(zhàn)第二版(完整中文版),系統(tǒng)學(xué)習(xí)Spark3.0大數(shù)據(jù)框架! 如果您覺得作者翻譯的內(nèi)容有幫助,請分享給更...