1. ZooKeeper 入門
1.1 是什么
ZooKeeper 是一個(gè)開源的分布式的,為分布式應(yīng)用提供協(xié)調(diào)服務(wù)的應(yīng)用。
工作機(jī)制:
ZooKeeper 從設(shè)計(jì)模式角度來理解:是一個(gè)基于觀察者模式的分布式服務(wù)管理框架,它負(fù)責(zé)存儲(chǔ)和管理大家都關(guān)心的數(shù)據(jù),然后接受觀察者的注冊(cè),一旦這些數(shù)據(jù)的狀態(tài)發(fā)生變化,ZooKeeper 就將負(fù)責(zé)通知已經(jīng)在 ZooKeeper 上注冊(cè)的那些觀察者做出相應(yīng)的反應(yīng)。
ZooKeeper = 文件系統(tǒng)+通知機(jī)制
1.2 特點(diǎn):

1)ZooKeeper:一個(gè)領(lǐng)導(dǎo)者(Leader),多個(gè)跟隨者(Follower)組成的集群;
2)集群只要有半數(shù)以上的節(jié)點(diǎn)存活,ZooKeeper 集群就能正常服務(wù)。
3)全局?jǐn)?shù)據(jù)一致:每個(gè) Server 保存一份相同的數(shù)據(jù)副本,Client 無論連接到哪個(gè) Server,數(shù)據(jù)都是一致的。
4)更新請(qǐng)求順序進(jìn)行,一次數(shù)據(jù)更新要么成功,要么失敗。
5)數(shù)據(jù)更新原子性,一次數(shù)據(jù)更新要么成功,要么失敗。
6)實(shí)時(shí)性,在一定時(shí)間范圍內(nèi),Client 能讀到最新數(shù)據(jù)。
1.3 ZooKeeper 數(shù)據(jù)結(jié)構(gòu)

ZooKeeper 數(shù)據(jù)模型的結(jié)構(gòu)與 Unix 文件系統(tǒng)很類似,整體上可以看做是一棵樹,每個(gè)節(jié)點(diǎn)稱作一個(gè) ZNode。每一個(gè) ZNode 默認(rèn)能夠存儲(chǔ) 1MB 的數(shù)據(jù),每個(gè) ZNode 都可以通過其路徑唯一標(biāo)識(shí)。
1.4 應(yīng)用場景
提供的服務(wù)包括:統(tǒng)一命名服務(wù)、統(tǒng)一配置管理、統(tǒng)一集群管理、服務(wù)器節(jié)點(diǎn)動(dòng)態(tài)上下線、軟負(fù)載均衡等。
- 統(tǒng)一命名服務(wù)

在分布式環(huán)境下,經(jīng)常需要對(duì)應(yīng)用/服務(wù)進(jìn)行統(tǒng)一命名,便于識(shí)別。
例如:IP 不容易記住,而域名容易記住。
-
統(tǒng)一配置管理
應(yīng)用場景-統(tǒng)一配置管理.png
- 分布式環(huán)境下,配置文件同步非常常見。
(1)一般要求一個(gè)集群中,所有節(jié)點(diǎn)的配置信息是一致的,比如 Kafka 集群。
(2)對(duì)配置文件修改后,希望能夠快速同步到各個(gè)節(jié)點(diǎn)上。
2)配置管理可交由 ZooKeeper 實(shí)現(xiàn)。
(1)可將配置信息寫入 ZooKeeper 上的一個(gè) Znode。
(2)各個(gè)客戶端服務(wù)監(jiān)聽這個(gè) Znode。
(3)一旦 Znode 中的數(shù)據(jù)被修改,ZooKeeper 將通知各個(gè)客戶端服務(wù)器。
- 統(tǒng)一集群管理

1)分布式環(huán)境中,實(shí)時(shí)掌握每個(gè)節(jié)點(diǎn)的狀態(tài)是必要的。
(1)可根據(jù)節(jié)點(diǎn)實(shí)時(shí)狀態(tài)做出一些調(diào)整。
2)ZooKeeper 可以實(shí)現(xiàn)實(shí)時(shí)監(jiān)控節(jié)點(diǎn)狀態(tài)變化
(1)可將節(jié)點(diǎn)信息寫入 ZooKeeper 上的一個(gè) ZNode。
(2)監(jiān)聽這個(gè) ZNode 可獲取它的實(shí)時(shí)狀態(tài)變化。
- 服務(wù)器動(dòng)態(tài)上下線

客戶端能實(shí)時(shí)洞察到服務(wù)器上下線的變化。
- 軟負(fù)載均衡

在 ZooKeeper 中記錄沒太服務(wù)器的訪問數(shù),讓訪問數(shù)最少的服務(wù)器去處理最新的客戶端請(qǐng)求。
2. ZooKeeper 安裝配置
2.1 安裝 部署
1)安裝
學(xué)習(xí)環(huán)境Mac通過 brew 安裝,過程略....
TODO:Linux 集群安裝待補(bǔ)充......
- 配置修改
brew 安裝 ZooKeeper 安裝配置文件位于/usr/local/etc/zookeeper下;
實(shí)際生產(chǎn)中 Linux 位于 ZooKeeper 安裝目錄 conf 下。
修改如下內(nèi)容:dataDir=/opt/module/zookeeper-3.4.10/zkData
(3)在/opt/module/zookeeper-3.4.10/這個(gè)目錄上創(chuàng)建zkData文件夾
3)操作 ZooKeeper
以下操作場景為mac 環(huán)境下 brew 本地安裝ZooKeeper演示環(huán)境,Linux 環(huán)境略有不同。
? (3)啟動(dòng)客戶端
? ~ zkCli
Connecting to localhost:2181
Welcome to ZooKeeper!
JLine support is enabled
WATCHER::
WatchedEvent state:SyncConnected type:None path:null
[zk: localhost:2181(CONNECTED) 0]
? (4)退出客戶端
[zk: localhost:2181(CONNECTED) 0] quit
Quitting...
? (5)停止 ZooKeeper
? ~ zkserver stop
ZooKeeper JMX enabled by default
Using config: /usr/local/etc/zookeeper/zoo.cfg
Stopping zookeeper ... STOPPED
2.2 配置參數(shù)解讀
Zookeeper中的配置文件zoo.cfg中參數(shù)含義解讀如下:
1.tickTime =2000:通信心跳數(shù),Zookeeper服務(wù)器與客戶端心跳時(shí)間,單位毫秒
Zookeeper使用的基本時(shí)間,服務(wù)器之間或客戶端與服務(wù)器之間維持心跳的時(shí)間間隔,也就是每個(gè)tickTime時(shí)間就會(huì)發(fā)送一個(gè)心跳,時(shí)間單位為毫秒。
它用于心跳機(jī)制,并且設(shè)置最小的session超時(shí)時(shí)間為兩倍心跳時(shí)間。(session的最小超時(shí)時(shí)間是2*tickTime)
2.initLimit =10:LF初始通信時(shí)限
集群中的Follower跟隨者服務(wù)器與Leader領(lǐng)導(dǎo)者服務(wù)器之間初始連接時(shí)能容忍的最多心跳數(shù)(tickTime的數(shù)量),用它來限定集群中的Zookeeper服務(wù)器連接到Leader的時(shí)限。
3.syncLimit =5:LF同步通信時(shí)限
集群中Leader與Follower之間的最大響應(yīng)時(shí)間單位,假如響應(yīng)超過syncLimit * tickTime,Leader認(rèn)為Follwer死掉,從服務(wù)器列表中刪除Follwer。
4.dataDir:數(shù)據(jù)文件目錄+數(shù)據(jù)持久化路徑
主要用于保存Zookeeper中的數(shù)據(jù)。
5.clientPort =2181:客戶端連接端口
監(jiān)聽客戶端連接的端口。
3. ZooKeeper 內(nèi)部原理
3.1 選舉機(jī)制
1)半數(shù)機(jī)制:集群中半數(shù)以上機(jī)器存活,集群可用。所以Zookeeper適合安裝奇數(shù)臺(tái)服務(wù)器。
2)Zookeeper雖然在配置文件中并沒有指定Master和Slave。但是,Zookeeper工作時(shí),是有一個(gè)節(jié)點(diǎn)為Leader,其他則為Follower,Leader是通過內(nèi)部的選舉機(jī)制臨時(shí)產(chǎn)生的。
3)以一個(gè)簡單的例子來說明整個(gè)選舉的過程。
假設(shè)有五臺(tái)服務(wù)器組成的Zookeeper集群,它們的id從1-5,同時(shí)它們都是最新啟動(dòng)的,也就是沒有歷史數(shù)據(jù),在存放數(shù)據(jù)量這一點(diǎn)上,都是一樣的。假設(shè)這些服務(wù)器依序啟動(dòng),來看看會(huì)發(fā)生什么,如圖所示。

(1)服務(wù)器1啟動(dòng),此時(shí)只有它一臺(tái)服務(wù)器啟動(dòng)了,它發(fā)出去的報(bào)文沒有任何響應(yīng),所以它的選舉狀態(tài)一直是LOOKING狀態(tài)。
(2)服務(wù)器2啟動(dòng),它與最開始啟動(dòng)的服務(wù)器1進(jìn)行通信,互相交換自己的選舉結(jié)果,由于兩者都沒有歷史數(shù)據(jù),所以id值較大的服務(wù)器2勝出,但是由于沒有達(dá)到超過半數(shù)以上的服務(wù)器都同意選舉它(這個(gè)例子中的半數(shù)以上是3),所以服務(wù)器1、2還是繼續(xù)保持LOOKING狀態(tài)。
(3)服務(wù)器3啟動(dòng),根據(jù)前面的理論分析,服務(wù)器3成為服務(wù)器1、2、3中的老大,而與上面不同的是,此時(shí)有三臺(tái)服務(wù)器選舉了它,所以它成為了這次選舉的Leader。
(4)服務(wù)器4啟動(dòng),根據(jù)前面的分析,理論上服務(wù)器4應(yīng)該是服務(wù)器1、2、3、4中最大的,但是由于前面已經(jīng)有半數(shù)以上的服務(wù)器選舉了服務(wù)器3,所以它只能接收當(dāng)小弟的命了。
(5)服務(wù)器5啟動(dòng),同4一樣當(dāng)小弟。
關(guān)于ZooKeeper選舉機(jī)制的更多介紹,請(qǐng)參考:http://www.itdecent.cn/p/3476587a6fa1
3.2 節(jié)點(diǎn)類型

