探索Redis設(shè)計(jì)與實(shí)現(xiàn)13:Redis集群機(jī)制及一個(gè)Redis架構(gòu)演進(jìn)實(shí)例

本文轉(zhuǎn)自互聯(lián)網(wǎng)

本系列文章將整理到我在GitHub上的《Java面試指南》倉庫,更多精彩內(nèi)容請到我的倉庫里查看

https://github.com/h2pl/Java-Tutorial

喜歡的話麻煩點(diǎn)下Star哈

文章首發(fā)于我的個(gè)人博客:

www.how2playlife.com

本文是微信公眾號【Java技術(shù)江湖】的《探索Redis設(shè)計(jì)與實(shí)現(xiàn)》其中一篇,本文部分內(nèi)容來源于網(wǎng)絡(luò),為了把本文主題講得清晰透徹,也整合了很多我認(rèn)為不錯(cuò)的技術(shù)博客內(nèi)容,引用其中了一些比較好的博客文章,如有侵權(quán),請聯(lián)系作者。

該系列博文會(huì)告訴你如何從入門到進(jìn)階,Redis基本的使用方法,Redis的基本數(shù)據(jù)結(jié)構(gòu),以及一些進(jìn)階的使用方法,同時(shí)也需要進(jìn)一步了解Redis的底層數(shù)據(jù)結(jié)構(gòu),再接著,還會(huì)帶來Redis主從復(fù)制、集群、分布式鎖等方面的相關(guān)內(nèi)容,以及作為緩存的一些使用方法和注意事項(xiàng),以便讓你更完整地了解整個(gè)Redis相關(guān)的技術(shù)體系,形成自己的知識框架。

如果對本系列文章有什么建議,或者是有什么疑問的話,也可以關(guān)注公眾號【Java技術(shù)江湖】聯(lián)系作者,歡迎你參與本系列博文的創(chuàng)作和修訂。

轉(zhuǎn)自http://blog.720ui.com/2016/redis_action_04_cluster/#Replication%EF%BC%88%E4%B8%BB%E4%BB%8E%E5%A4%8D%E5%88%B6%EF%BC%89

下面介紹Redis的集群方案。

Replication(主從復(fù)制)

Redis的replication機(jī)制允許slave從master那里通過網(wǎng)絡(luò)傳輸拷貝到完整的數(shù)據(jù)備份,從而達(dá)到主從機(jī)制。為了實(shí)現(xiàn)主從復(fù)制,我們準(zhǔn)備三個(gè)redis服務(wù),依次命名為master,slave1,slave2。

配置主服務(wù)器

為了測試效果,我們先修改主服務(wù)器的配置文件redis.conf的端口信息

<pre>

  1. port 6300

</pre>

配置從服務(wù)器

replication相關(guān)的配置比較簡單,只需要把下面一行加到slave的配置文件中。你只需要把ip地址和端口號改一下。

<pre>

  1. slaveof 192.168.1.1 6379

</pre>

我們先修改從服務(wù)器1的配置文件redis.conf的端口信息和從服務(wù)器配置。

<pre>

  1. port 6301
  2. slaveof 127.0.0.1 6300

</pre>

我們再修改從服務(wù)器2的配置文件redis.conf的端口信息和從服務(wù)器配置。

<pre>

  1. port 6302
  2. slaveof 127.0.0.1 6300

</pre>

值得注意的是,從redis2.6版本開始,slave支持只讀模式,而且是默認(rèn)的??梢酝ㄟ^配置項(xiàng)slave-read-only來進(jìn)行配置。
此外,如果master通過requirepass配置項(xiàng)設(shè)置了密碼,slave每次同步操作都需要驗(yàn)證密碼,可以通過在slave的配置文件中添加以下配置項(xiàng)

<pre>

  1. masterauth <password>

</pre>

測試

分別啟動(dòng)主服務(wù)器,從服務(wù)器,我們來驗(yàn)證下主從復(fù)制。我們在主服務(wù)器寫入一條消息,然后再其他從服務(wù)器查看是否成功復(fù)制了。

Sentinel(哨兵)

主從機(jī)制,上面的方案中主服務(wù)器可能存在單點(diǎn)故障,萬一主服務(wù)器宕機(jī),這是個(gè)麻煩事情,所以Redis提供了Redis-Sentinel,以此來實(shí)現(xiàn)主從切換的功能,類似與zookeeper。

Redis-Sentinel是Redis官方推薦的高可用性(HA)解決方案,當(dāng)用Redis做master-slave的高可用方案時(shí),假如master宕機(jī)了,Redis本身(包括它的很多客戶端)都沒有實(shí)現(xiàn)自動(dòng)進(jìn)行主備切換,而Redis-Sentinel本身也是一個(gè)獨(dú)立運(yùn)行的進(jìn)程,它能監(jiān)控多個(gè)master-slave集群,發(fā)現(xiàn)master宕機(jī)后能進(jìn)行自動(dòng)切換。

它的主要功能有以下幾點(diǎn)

  • 監(jiān)控(Monitoring):不斷地檢查redis的主服務(wù)器和從服務(wù)器是否運(yùn)作正常。
  • 提醒(Notification):如果發(fā)現(xiàn)某個(gè)redis服務(wù)器運(yùn)行出現(xiàn)狀況,可以通過 API 向管理員或者其他應(yīng)用程序發(fā)送通知。
  • 自動(dòng)故障遷移(Automatic failover):能夠進(jìn)行自動(dòng)切換。當(dāng)一個(gè)主服務(wù)器不能正常工作時(shí),會(huì)將失效主服務(wù)器的其中一個(gè)從服務(wù)器升級為新的主服務(wù)器,并讓失效主服務(wù)器的其他從服務(wù)器改為復(fù)制新的主服務(wù)器; 當(dāng)客戶端試圖連接失效的主服務(wù)器時(shí), 集群也會(huì)向客戶端返回新主服務(wù)器的地址, 使得集群可以使用新主服務(wù)器代替失效服務(wù)器。

Redis Sentinel 兼容 Redis 2.4.16 或以上版本, 推薦使用 Redis 2.8.0 或以上的版本。

配置Sentinel

必須指定一個(gè)sentinel的配置文件sentinel.conf,如果不指定將無法啟動(dòng)sentinel。首先,我們先創(chuàng)建一個(gè)配置文件sentinel.conf

<pre>

  1. port 26379
  2. sentinel monitor mymaster 127.0.0.1 6300 2

</pre>

官方典型的配置如下

<pre>

  1. sentinel monitor mymaster 127.0.0.1 6379 2
  2. sentinel down-after-milliseconds mymaster 60000
  3. sentinel failover-timeout mymaster 180000
  4. sentinel parallel-syncs mymaster 1
  5. sentinel monitor resque 192.168.1.3 6380 4
  6. sentinel down-after-milliseconds resque 10000
  7. sentinel failover-timeout resque 180000
  8. sentinel parallel-syncs resque 5

</pre>

配置文件只需要配置master的信息就好啦,不用配置slave的信息,因?yàn)閟lave能夠被自動(dòng)檢測到(master節(jié)點(diǎn)會(huì)有關(guān)于slave的消息)。

需要注意的是,配置文件在sentinel運(yùn)行期間是會(huì)被動(dòng)態(tài)修改的,例如當(dāng)發(fā)生主備切換時(shí)候,配置文件中的master會(huì)被修改為另外一個(gè)slave。這樣,之后sentinel如果重啟時(shí),就可以根據(jù)這個(gè)配置來恢復(fù)其之前所監(jiān)控的redis集群的狀態(tài)。

接下來我們將一行一行地解釋上面的配置項(xiàng):

<pre>

  1. sentinel monitor mymaster 127.0.0.1 6379 2

</pre>

這行配置指示 Sentinel 去監(jiān)視一個(gè)名為 mymaster 的主服務(wù)器, 這個(gè)主服務(wù)器的 IP 地址為 127.0.0.1 , 端口號為 6300, 而將這個(gè)主服務(wù)器判斷為失效至少需要 2 個(gè) Sentinel 同意,只要同意 Sentinel 的數(shù)量不達(dá)標(biāo),自動(dòng)故障遷移就不會(huì)執(zhí)行。

不過要注意, 無論你設(shè)置要多少個(gè) Sentinel 同意才能判斷一個(gè)服務(wù)器失效, 一個(gè) Sentinel 都需要獲得系統(tǒng)中多數(shù)(majority) Sentinel 的支持, 才能發(fā)起一次自動(dòng)故障遷移, 并預(yù)留一個(gè)給定的配置紀(jì)元 (configuration Epoch ,一個(gè)配置紀(jì)元就是一個(gè)新主服務(wù)器配置的版本號)。換句話說, 在只有少數(shù)(minority) Sentinel 進(jìn)程正常運(yùn)作的情況下, Sentinel 是不能執(zhí)行自動(dòng)故障遷移的。sentinel集群中各個(gè)sentinel也有互相通信,通過gossip協(xié)議。

除了第一行配置,我們發(fā)現(xiàn)剩下的配置都有一個(gè)統(tǒng)一的格式:

<pre>

  1. sentinel <option_name> <master_name> <option_value>

</pre>

接下來我們根據(jù)上面格式中的option_name一個(gè)一個(gè)來解釋這些配置項(xiàng):

  • down-after-milliseconds 選項(xiàng)指定了 Sentinel 認(rèn)為服務(wù)器已經(jīng)斷線所需的毫秒數(shù)。
  • parallel-syncs 選項(xiàng)指定了在執(zhí)行故障轉(zhuǎn)移時(shí), 最多可以有多少個(gè)從服務(wù)器同時(shí)對新的主服務(wù)器進(jìn)行同步, 這個(gè)數(shù)字越小, 完成故障轉(zhuǎn)移所需的時(shí)間就越長。

啟動(dòng) Sentinel

對于 redis-sentinel 程序, 你可以用以下命令來啟動(dòng) Sentinel 系統(tǒng)

<pre>

  1. redis-sentinel sentinel.conf

</pre>

對于 redis-server 程序, 你可以用以下命令來啟動(dòng)一個(gè)運(yùn)行在 Sentinel 模式下的 Redis 服務(wù)器

<pre>

  1. redis-server sentinel.conf --sentinel

</pre>

以上兩種方式,都必須指定一個(gè)sentinel的配置文件sentinel.conf, 如果不指定將無法啟動(dòng)sentinel。sentinel默認(rèn)監(jiān)聽26379端口,所以運(yùn)行前必須確定該端口沒有被別的進(jìn)程占用。


測試

此時(shí),我們開啟兩個(gè)Sentinel,關(guān)閉主服務(wù)器,我們來驗(yàn)證下Sentinel。發(fā)現(xiàn),服務(wù)器發(fā)生切換了。



當(dāng)6300端口的這個(gè)服務(wù)重啟的時(shí)候,他會(huì)變成6301端口服務(wù)的slave。

Twemproxy

Twemproxy是由Twitter開源的Redis代理, Redis客戶端把請求發(fā)送到Twemproxy,Twemproxy根據(jù)路由規(guī)則發(fā)送到正確的Redis實(shí)例,最后Twemproxy把結(jié)果匯集返回給客戶端。

Twemproxy通過引入一個(gè)代理層,將多個(gè)Redis實(shí)例進(jìn)行統(tǒng)一管理,使Redis客戶端只需要在Twemproxy上進(jìn)行操作,而不需要關(guān)心后面有多少個(gè)Redis實(shí)例,從而實(shí)現(xiàn)了Redis集群。



Twemproxy本身也是單點(diǎn),需要用Keepalived做高可用方案。

這么些年來,Twenproxy作為應(yīng)用范圍最廣、穩(wěn)定性最高、最久經(jīng)考驗(yàn)的分布式中間件,在業(yè)界廣泛使用。

但是,Twemproxy存在諸多不方便之處,最主要的是,Twemproxy無法平滑地增加Redis實(shí)例,業(yè)務(wù)量突增,需增加Redis服務(wù)器;業(yè)務(wù)量萎縮,需要減少Redis服務(wù)器。但對Twemproxy而言,基本上都很難操作。其次,沒有友好的監(jiān)控管理后臺界面,不利于運(yùn)維監(jiān)控。

Codis

Codis解決了Twemproxy的這兩大痛點(diǎn),由豌豆莢于2014年11月開源,基于Go和C開發(fā)、現(xiàn)已廣泛用于豌豆莢的各種Redis業(yè)務(wù)場景。

Codis 3.x 由以下組件組成:

  • Codis Server:基于 redis-2.8.21 分支開發(fā)。增加了額外的數(shù)據(jù)結(jié)構(gòu),以支持 slot 有關(guān)的操作以及數(shù)據(jù)遷移指令。具體的修改可以參考文檔 redis 的修改。
  • Codis Proxy:客戶端連接的 Redis 代理服務(wù), 實(shí)現(xiàn)了 Redis 協(xié)議。 除部分命令不支持以外(不支持的命令列表),表現(xiàn)的和原生的 Redis 沒有區(qū)別(就像 Twemproxy)。對于同一個(gè)業(yè)務(wù)集群而言,可以同時(shí)部署多個(gè) codis-proxy 實(shí)例;不同 codis-proxy 之間由 codis-dashboard 保證狀態(tài)同步。
  • Codis Dashboard:集群管理工具,支持 codis-proxy、codis-server 的添加、刪除,以及據(jù)遷移等操作。在集群狀態(tài)發(fā)生改變時(shí),codis-dashboard 維護(hù)集群下所有 codis-proxy 的狀態(tài)的一致性。對于同一個(gè)業(yè)務(wù)集群而言,同一個(gè)時(shí)刻 codis-dashboard 只能有 0個(gè)或者1個(gè);所有對集群的修改都必須通過 codis-dashboard 完成。
  • Codis Admin:集群管理的命令行工具??捎糜诳刂?codis-proxy、codis-dashboard 狀態(tài)以及訪問外部存儲。
  • Codis FE:集群管理界面。多個(gè)集群實(shí)例共享可以共享同一個(gè)前端展示頁面;通過配置文件管理后端 codis-dashboard 列表,配置文件可自動(dòng)更新。
  • Codis HA:為集群提供高可用。依賴 codis-dashboard 實(shí)例,自動(dòng)抓取集群各個(gè)組件的狀態(tài);會(huì)根據(jù)當(dāng)前集群狀態(tài)自動(dòng)生成主從切換策略,并在需要時(shí)通過 codis-dashboard 完成主從切換。
  • Storage:為集群狀態(tài)提供外部存儲。提供 Namespace 概念,不同集群的會(huì)按照不同 product name 進(jìn)行組織;目前僅提供了 Zookeeper 和 Etcd 兩種實(shí)現(xiàn),但是提供了抽象的 interface 可自行擴(kuò)展。


Codis引入了Group的概念,每個(gè)Group包括1個(gè)Redis Master及一個(gè)或多個(gè)Redis Slave,這是和Twemproxy的區(qū)別之一,實(shí)現(xiàn)了Redis集群的高可用。當(dāng)1個(gè)Redis Master掛掉時(shí),Codis不會(huì)自動(dòng)把一個(gè)Slave提升為Master,這涉及數(shù)據(jù)的一致性問題,Redis本身的數(shù)據(jù)同步是采用主從異步復(fù)制,當(dāng)數(shù)據(jù)在Maste寫入成功時(shí),Slave是否已讀入這個(gè)數(shù)據(jù)是沒法保證的,需要管理員在管理界面上手動(dòng)把Slave提升為Master。

Codis使用,可以參考官方文檔https://github.com/CodisLabs/codis/blob/release3.0/doc/tutorial_zh.md

Redis 3.0集群

Redis 3.0集群采用了P2P的模式,完全去中心化。支持多節(jié)點(diǎn)數(shù)據(jù)集自動(dòng)分片,提供一定程度的分區(qū)可用性,部分節(jié)點(diǎn)掛掉或者無法連接其他節(jié)點(diǎn)后,服務(wù)可以正常運(yùn)行。Redis 3.0集群采用Hash Slot方案,而不是一致性哈希。Redis把所有的Key分成了16384個(gè)slot,每個(gè)Redis實(shí)例負(fù)責(zé)其中一部分slot。集群中的所有信息(節(jié)點(diǎn)、端口、slot等),都通過節(jié)點(diǎn)之間定期的數(shù)據(jù)交換而更新。

Redis客戶端在任意一個(gè)Redis實(shí)例發(fā)出請求,如果所需數(shù)據(jù)不在該實(shí)例中,通過重定向命令引導(dǎo)客戶端訪問所需的實(shí)例。

Redis 3.0集群,目前支持的cluster特性

  • 節(jié)點(diǎn)自動(dòng)發(fā)現(xiàn)
  • slave->master 選舉,集群容錯(cuò)
  • Hot resharding:在線分片
  • 集群管理:cluster xxx
  • 基于配置(nodes-port.conf)的集群管理
  • ASK 轉(zhuǎn)向/MOVED 轉(zhuǎn)向機(jī)制


如上圖所示,所有的redis節(jié)點(diǎn)彼此互聯(lián)(PING-PONG機(jī)制),內(nèi)部使用二進(jìn)制協(xié)議優(yōu)化傳輸速度和帶寬。節(jié)點(diǎn)的fail是通過集群中超過半數(shù)的節(jié)點(diǎn)檢測失效時(shí)才生效??蛻舳伺credis節(jié)點(diǎn)直連,不需要中間proxy層??蛻舳瞬恍枰B接集群所有節(jié)點(diǎn),連接集群中任何一個(gè)可用節(jié)點(diǎn)即可。redis-cluster把所有的物理節(jié)點(diǎn)映射到[0-16383]slot上cluster負(fù)責(zé)維護(hù)node<->slot<->value。


選舉過程是集群中所有master參與,如果半數(shù)以上master節(jié)點(diǎn)與master節(jié)點(diǎn)通信超時(shí),認(rèn)為當(dāng)前master節(jié)點(diǎn)掛掉。

當(dāng)集群不可用時(shí),所有對集群的操作做都不可用,收到((error) CLUSTERDOWN The cluster is down)錯(cuò)誤。如果集群任意master掛掉,且當(dāng)前master沒有slave,集群進(jìn)入fail狀態(tài),也可以理解成進(jìn)群的slot映射[0-16383]不完成時(shí)進(jìn)入fail狀態(tài)。如果進(jìn)群超過半數(shù)以上master掛掉,無論是否有slave集群進(jìn)入fail狀態(tài)。

環(huán)境搭建

現(xiàn)在,我們進(jìn)行集群環(huán)境搭建。集群環(huán)境至少需要3個(gè)主服務(wù)器節(jié)點(diǎn)。本次測試,使用另外3個(gè)節(jié)點(diǎn)作為從服務(wù)器的節(jié)點(diǎn),即3個(gè)主服務(wù)器,3個(gè)從服務(wù)器。

修改配置文件,其它的保持默認(rèn)即可。

<pre>

  1. 根據(jù)實(shí)際情況修改

  2. port 7000
  3. 允許redis支持集群模式

  4. cluster-enabled yes
  5. 節(jié)點(diǎn)配置文件,由redis自動(dòng)維護(hù)

  6. cluster-config-file nodes.conf
  7. 節(jié)點(diǎn)超時(shí)毫秒

  8. cluster-node-timeout 5000
  9. 開啟AOF同步模式

  10. appendonly yes

</pre>

創(chuàng)建集群

目前這些實(shí)例雖然都開啟了cluster模式,但是彼此還不認(rèn)識對方,接下來可以通過Redis集群的命令行工具redis-trib.rb來完成集群創(chuàng)建。
首先,下載 https://raw.githubusercontent.com/antirez/redis/unstable/src/redis-trib.rb。

然后,搭建Redis 的 Ruby 支持環(huán)境。這里,不進(jìn)行擴(kuò)展,參考相關(guān)文檔。

現(xiàn)在,接下來運(yùn)行以下命令。這個(gè)命令在這里用于創(chuàng)建一個(gè)新的集群, 選項(xiàng)–replicas 1 表示我們希望為集群中的每個(gè)主節(jié)點(diǎn)創(chuàng)建一個(gè)從節(jié)點(diǎn)。

<pre>

  1. redis-trib.rb create --replicas 1 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006

</pre>

5.3、測試


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • redis redis是單線程的,但是一般的作為緩存使用的話,redis足夠了,因?yàn)樗淖x寫速度太快了。官方的一個(gè)...
    普度眾生的面癱青年閱讀 5,298評論 0 4
  • 單機(jī)/單點(diǎn) 單點(diǎn)故障/瓶頸:多個(gè)節(jié)點(diǎn)負(fù)載:面向數(shù)據(jù):一變多(一致性<弱一致,最終一致性>)》可用性最終一致性:一部...
    壹點(diǎn)零閱讀 856評論 0 3
  • 沒有想到回來第一個(gè)被療愈的對象是我女兒(我想著是先幫李胖療愈一下了)療愈并不是代表這個(gè)人有什么問題,而是幫...
    宇宙的黃星星閱讀 596評論 1 3
  • 之前寫過一篇文章,是關(guān)于最近的頓悟的,但是因?yàn)槔锩嬗刑嗟呢?fù)能量了,所以重寫一篇,這些頓悟,來自于一本書,以...
    觸角碎碎念閱讀 529評論 0 0
  • 10月30號。老婆大人在擁堵的高速上追尾了。還好人都沒事。 開了四年的Rouge光榮退役。辭別時(shí)還是挺感懷的。 剛...
    alucardzhou閱讀 242評論 0 0

友情鏈接更多精彩內(nèi)容