Kafka實戰(zhàn)-入門 - 哥不是小蘿莉 - 博客園
http://www.cnblogs.com/smartloli/p/4530117.html
2.Kafka背景
Kafka它本質(zhì)上是一個消息系統(tǒng),由當時從LinkedIn出來創(chuàng)業(yè)的三人小組開發(fā),他們開發(fā)出了Apache Kafka實時信息隊列技術,該技術致力于為各行各業(yè)的公司提供實時數(shù)據(jù)處理服務解決方案。Kafka為LinkedIn的中樞神經(jīng)系統(tǒng),管理從各個應用程序的匯聚,這些數(shù)據(jù)經(jīng)過處理后再被【分發(fā)】到其他地方。Kafka不同于傳統(tǒng)的企業(yè)信息隊列系統(tǒng),它是以近乎【實時】的方式處理流經(jīng)一個公司的所有數(shù)據(jù),目前已經(jīng)服務于LinkedIn、Netflix、Uber以及Verizon,并為此建立了實時信息處理平臺。
流水數(shù)據(jù)是所有站點對其網(wǎng)站使用情況做報表時都要用到的數(shù)據(jù)中最常用的一部分,【流水數(shù)據(jù)】包括【PV,瀏覽內(nèi)容信息以及搜索記錄】等。這些數(shù)據(jù)通常是先以【日志文件】的形式存在,然后有周期的去對這些日志文件進行統(tǒng)計分析處理,然后獲得需要的KPI指標結(jié)果。