（1）RabbitMQ的高可用性

RabbitMQ是比較有代表性的，因?yàn)槭腔谥鲝淖龈呖捎眯缘?，我們就以他為例子講解第一種MQ的高可用性怎么實(shí)現(xiàn)。

rabbitmq有三種模式：單機(jī)模式，普通集群模式，鏡像集群模式

1）單機(jī)模式

就是demo級別的，一般就是你本地啟動(dòng)了玩玩兒的，沒人生產(chǎn)用單機(jī)模式

2）普通集群模式

意思就是在多臺機(jī)器上啟動(dòng)多個(gè)rabbitmq實(shí)例，每個(gè)機(jī)器啟動(dòng)一個(gè)。但是你創(chuàng)建的queue，只會(huì)放在一個(gè)rabbtimq實(shí)例上，但是每個(gè)實(shí)例都同步queue的元數(shù)據(jù)。完了你消費(fèi)的時(shí)候，實(shí)際上如果連接到了另外一個(gè)實(shí)例，那么那個(gè)實(shí)例會(huì)從queue所在實(shí)例上拉取數(shù)據(jù)過來。

這種方式確實(shí)很麻煩，也不怎么好，沒做到所謂的分布式，就是個(gè)普通集群。因?yàn)檫@導(dǎo)致你要么消費(fèi)者每次隨機(jī)連接一個(gè)實(shí)例然后拉取數(shù)據(jù)，要么固定連接那個(gè)queue所在實(shí)例消費(fèi)數(shù)據(jù)，前者有數(shù)據(jù)拉取的開銷，后者導(dǎo)致單實(shí)例性能瓶頸。

而且如果那個(gè)放queue的實(shí)例宕機(jī)了，會(huì)導(dǎo)致接下來其他實(shí)例就無法從那個(gè)實(shí)例拉取，如果你開啟了消息持久化，讓rabbitmq落地存儲消息的話，消息不一定會(huì)丟，得等這個(gè)實(shí)例恢復(fù)了，然后才可以繼續(xù)從這個(gè)queue拉取數(shù)據(jù)。

所以這個(gè)事兒就比較尷尬了，這就沒有什么所謂的高可用性可言了，這方案主要是提高吞吐量的，就是說讓集群中多個(gè)節(jié)點(diǎn)來服務(wù)某個(gè)queue的讀寫操作。

3）鏡像集群模式

這種模式，才是所謂的rabbitmq的高可用模式，跟普通集群模式不一樣的是，你創(chuàng)建的queue，無論元數(shù)據(jù)還是queue里的消息都會(huì)存在于多個(gè)實(shí)例上，然后每次你寫消息到queue的時(shí)候，都會(huì)自動(dòng)把消息到多個(gè)實(shí)例的queue里進(jìn)行消息同步。

這樣的話，好處在于，你任何一個(gè)機(jī)器宕機(jī)了，沒事兒，別的機(jī)器都可以用。壞處在于，第一，這個(gè)性能開銷也太大了吧，消息同步所有機(jī)器，導(dǎo)致網(wǎng)絡(luò)帶寬壓力和消耗很重！第二，這么玩兒，就沒有擴(kuò)展性可言了，如果某個(gè)queue負(fù)載很重，你加機(jī)器，新增的機(jī)器也包含了這個(gè)queue的所有數(shù)據(jù)，并沒有辦法線性擴(kuò)展你的queue

那么怎么開啟這個(gè)鏡像集群模式呢？我這里簡單說一下，避免面試人家問你你不知道，其實(shí)很簡單rabbitmq有很好的管理控制臺，就是在后臺新增一個(gè)策略，這個(gè)策略是鏡像集群模式的策略，指定的時(shí)候可以要求數(shù)據(jù)同步到所有節(jié)點(diǎn)的，也可以要求就同步到指定數(shù)量的節(jié)點(diǎn)，然后你再次創(chuàng)建queue的時(shí)候，應(yīng)用這個(gè)策略，就會(huì)自動(dòng)將數(shù)據(jù)同步到其他的節(jié)點(diǎn)上去了。

（2）kafka的高可用性

kafka一個(gè)最基本的架構(gòu)認(rèn)識：多個(gè)broker組成，每個(gè)broker是一個(gè)節(jié)點(diǎn)；你創(chuàng)建一個(gè)topic，這個(gè)topic可以劃分為多個(gè)partition，每個(gè)partition可以存在于不同的broker上，每個(gè)partition就放一部分?jǐn)?shù)據(jù)。

這就是天然的分布式消息隊(duì)列，就是說一個(gè)topic的數(shù)據(jù)，是分散放在多個(gè)機(jī)器上的，每個(gè)機(jī)器就放一部分?jǐn)?shù)據(jù)。

實(shí)際上rabbitmq之類的，并不是分布式消息隊(duì)列，他就是傳統(tǒng)的消息隊(duì)列，只不過提供了一些集群、HA的機(jī)制而已，因?yàn)闊o論怎么玩兒，rabbitmq一個(gè)queue的數(shù)據(jù)都是放在一個(gè)節(jié)點(diǎn)里的，鏡像集群下，也是每個(gè)節(jié)點(diǎn)都放這個(gè)queue的完整數(shù)據(jù)。

kafka 0.8以前，是沒有HA機(jī)制的，就是任何一個(gè)broker宕機(jī)了，那個(gè)broker上的partition就廢了，沒法寫也沒法讀，沒有什么高可用性可言。

kafka 0.8以后，提供了HA機(jī)制，就是replica副本機(jī)制。每個(gè)partition的數(shù)據(jù)都會(huì)同步到吉他機(jī)器上，形成自己的多個(gè)replica副本。然后所有replica會(huì)選舉一個(gè)leader出來，那么生產(chǎn)和消費(fèi)都跟這個(gè)leader打交道，然后其他replica就是follower。寫的時(shí)候，leader會(huì)負(fù)責(zé)把數(shù)據(jù)同步到所有follower上去，讀的時(shí)候就直接讀leader上數(shù)據(jù)即可。只能讀寫leader？很簡單，要是你可以隨意讀寫每個(gè)follower，那么就要care數(shù)據(jù)一致性的問題，系統(tǒng)復(fù)雜度太高，很容易出問題。kafka會(huì)均勻的將一個(gè)partition的所有replica分布在不同的機(jī)器上，這樣才可以提高容錯(cuò)性。

這么搞，就有所謂的高可用性了，因?yàn)槿绻硞€(gè)broker宕機(jī)了，沒事兒，那個(gè)broker上面的partition在其他機(jī)器上都有副本的，如果這上面有某個(gè)partition的leader，那么此時(shí)會(huì)重新選舉一個(gè)新的leader出來，大家繼續(xù)讀寫那個(gè)新的leader即可。這就有所謂的高可用性了。

寫數(shù)據(jù)的時(shí)候，生產(chǎn)者就寫leader，然后leader將數(shù)據(jù)落地寫本地磁盤，接著其他follower自己主動(dòng)從leader來pull數(shù)據(jù)。一旦所有follower同步好數(shù)據(jù)了，就會(huì)發(fā)送ack給leader，leader收到所有follower的ack之后，就會(huì)返回寫成功的消息給生產(chǎn)者。（當(dāng)然，這只是其中一種模式，還可以適當(dāng)調(diào)整這個(gè)行為）

消費(fèi)的時(shí)候，只會(huì)從leader去讀，但是只有一個(gè)消息已經(jīng)被所有follower都同步成功返回ack的時(shí)候，這個(gè)消息才會(huì)被消費(fèi)者讀到。

怎么保證消息隊(duì)列消費(fèi)的冪等性？

先大概說一說可能會(huì)有哪些重復(fù)消費(fèi)的問題。

首先就是比如rabbitmq、rocketmq、kafka，都有可能會(huì)出現(xiàn)消費(fèi)重復(fù)消費(fèi)的問題，正常。因?yàn)檫@問題通常不是mq自己保證的，是給你保證的。然后我們挑一個(gè)kafka來舉個(gè)例子，說說怎么重復(fù)消費(fèi)吧。

kafka實(shí)際上有個(gè)offset的概念，就是每個(gè)消息寫進(jìn)去，都有一個(gè)offset，代表他的序號，然后consumer消費(fèi)了數(shù)據(jù)之后，每隔一段時(shí)間，會(huì)把自己消費(fèi)過的消息的offset提交一下，代表我已經(jīng)消費(fèi)過了，下次我要是重啟啥的，你就讓我繼續(xù)從上次消費(fèi)到的offset來繼續(xù)消費(fèi)吧。

但是凡事總有意外，比如我們之前生產(chǎn)經(jīng)常遇到的，就是你有時(shí)候重啟系統(tǒng)，看你怎么重啟了，如果碰到點(diǎn)著急的，直接kill進(jìn)程了，再重啟。這會(huì)導(dǎo)致consumer有些消息處理了，但是沒來得及提交offset，尷尬了。重啟之后，少數(shù)消息會(huì)再次消費(fèi)一次。

其實(shí)重復(fù)消費(fèi)不可怕，可怕的是你沒考慮到重復(fù)消費(fèi)之后，怎么保證冪等性。

給你舉個(gè)例子吧。假設(shè)你有個(gè)系統(tǒng)，消費(fèi)一條往數(shù)據(jù)庫里插入一條，要是你一個(gè)消息重復(fù)兩次，你不就插入了兩條，這數(shù)據(jù)不就錯(cuò)了？但是你要是消費(fèi)到第二次的時(shí)候，自己判斷一下已經(jīng)消費(fèi)過了，直接扔了，不就保留了一條數(shù)據(jù)？

一條數(shù)據(jù)重復(fù)出現(xiàn)兩次，數(shù)據(jù)庫里就只有一條數(shù)據(jù)，這就保證了系統(tǒng)的冪等性

冪等性，我通俗點(diǎn)說，就一個(gè)數(shù)據(jù)，或者一個(gè)請求，給你重復(fù)來多次，你得確保對應(yīng)的數(shù)據(jù)是不會(huì)改變的，不能出錯(cuò)。

其實(shí)還是得結(jié)合業(yè)務(wù)來思考，我這里給幾個(gè)思路：

（1）比如你拿個(gè)數(shù)據(jù)要寫庫，你先根據(jù)主鍵查一下，如果這數(shù)據(jù)都有了，你就別插入了，update一下好吧

（2）比如你是寫redis，那沒問題了，反正每次都是set，天然冪等性

（3）比如你不是上面兩個(gè)場景，那做的稍微復(fù)雜一點(diǎn)，你需要讓生產(chǎn)者發(fā)送每條數(shù)據(jù)的時(shí)候，里面加一個(gè)全局唯一的id，類似訂單id之類的東西，然后你這里消費(fèi)到了之后，先根據(jù)這個(gè)id去比如redis里查一下，之前消費(fèi)過嗎？如果沒有消費(fèi)過，你就處理，然后這個(gè)id寫redis。如果消費(fèi)過了，那你就別處理了，保證別重復(fù)處理相同的消息即可。

還有比如基于數(shù)據(jù)庫的唯一鍵來保證重復(fù)數(shù)據(jù)不會(huì)重復(fù)插入多條，我們之前線上系統(tǒng)就有這個(gè)問題，就是拿到數(shù)據(jù)的時(shí)候，每次重啟可能會(huì)有重復(fù)，因?yàn)閗afka消費(fèi)者還沒來得及提交offset，重復(fù)數(shù)據(jù)拿到了以后我們插入的時(shí)候，因?yàn)橛形ㄒ绘I約束了，所以重復(fù)數(shù)據(jù)只會(huì)插入報(bào)錯(cuò)，不會(huì)導(dǎo)致數(shù)據(jù)庫中出現(xiàn)臟數(shù)據(jù)

如何保證MQ的消費(fèi)是冪等性的，需要結(jié)合具體的業(yè)務(wù)來看

數(shù)據(jù)丟失怎么辦（如何保證消息的可靠性傳輸）

（1）rabbitmq

1）生產(chǎn)者弄丟了數(shù)據(jù)

生產(chǎn)者將數(shù)據(jù)發(fā)送到rabbitmq的時(shí)候，可能數(shù)據(jù)就在半路給搞丟了，因?yàn)榫W(wǎng)絡(luò)啥的問題，都有可能。

此時(shí)可以選擇用rabbitmq提供的事務(wù)功能，就是生產(chǎn)者發(fā)送數(shù)據(jù)之前開啟rabbitmq事務(wù)（channel.txSelect），然后發(fā)送消息，如果消息沒有成功被rabbitmq接收到，那么生產(chǎn)者會(huì)收到異常報(bào)錯(cuò)，此時(shí)就可以回滾事務(wù)（channel.txRollback），然后重試發(fā)送消息；如果收到了消息，那么可以提交事務(wù)（channel.txCommit）。但是問題是，rabbitmq事務(wù)機(jī)制一搞，基本上吞吐量會(huì)下來，因?yàn)樘男阅堋?/p>

所以一般來說，如果你要確保說寫rabbitmq的消息別丟，可以開啟confirm模式，在生產(chǎn)者那里設(shè)置開啟confirm模式之后，你每次寫的消息都會(huì)分配一個(gè)唯一的id，然后如果寫入了rabbitmq中，rabbitmq會(huì)給你回傳一個(gè)ack消息，告訴你說這個(gè)消息ok了。如果rabbitmq沒能處理這個(gè)消息，會(huì)回調(diào)你一個(gè)nack接口，告訴你這個(gè)消息接收失敗，你可以重試。而且你可以結(jié)合這個(gè)機(jī)制自己在內(nèi)存里維護(hù)每個(gè)消息id的狀態(tài)，如果超過一定時(shí)間還沒接收到這個(gè)消息的回調(diào)，那么你可以重發(fā)。

事務(wù)機(jī)制和cnofirm機(jī)制最大的不同在于，事務(wù)機(jī)制是同步的，你提交一個(gè)事務(wù)之后會(huì)阻塞在那兒，但是confirm機(jī)制是異步的，你發(fā)送個(gè)消息之后就可以發(fā)送下一個(gè)消息，然后那個(gè)消息rabbitmq接收了之后會(huì)異步回調(diào)你一個(gè)接口通知你這個(gè)消息接收到了。

所以一般在生產(chǎn)者這塊避免數(shù)據(jù)丟失，都是用confirm機(jī)制的。

2）rabbitmq弄丟了數(shù)據(jù)

就是rabbitmq自己弄丟了數(shù)據(jù)，這個(gè)你必須開啟rabbitmq的持久化，就是消息寫入之后會(huì)持久化到磁盤，哪怕是rabbitmq自己掛了，恢復(fù)之后會(huì)自動(dòng)讀取之前存儲的數(shù)據(jù)，一般數(shù)據(jù)不會(huì)丟。除非極其罕見的是，rabbitmq還沒持久化，自己就掛了，可能導(dǎo)致少量數(shù)據(jù)會(huì)丟失的，但是這個(gè)概率較小。

設(shè)置持久化有兩個(gè)步驟，第一個(gè)是創(chuàng)建queue的時(shí)候?qū)⑵湓O(shè)置為持久化的，這樣就可以保證rabbitmq持久化queue的元數(shù)據(jù)，但是不會(huì)持久化queue里的數(shù)據(jù)；第二個(gè)是發(fā)送消息的時(shí)候?qū)⑾⒌膁eliveryMode設(shè)置為2，就是將消息設(shè)置為持久化的，此時(shí)rabbitmq就會(huì)將消息持久化到磁盤上去。必須要同時(shí)設(shè)置這兩個(gè)持久化才行，rabbitmq哪怕是掛了，再次重啟，也會(huì)從磁盤上重啟恢復(fù)queue，恢復(fù)這個(gè)queue里的數(shù)據(jù)。

而且持久化可以跟生產(chǎn)者那邊的confirm機(jī)制配合起來，只有消息被持久化到磁盤之后，才會(huì)通知生產(chǎn)者ack了，所以哪怕是在持久化到磁盤之前，rabbitmq掛了，數(shù)據(jù)丟了，生產(chǎn)者收不到ack，你也是可以自己重發(fā)的。

哪怕是你給rabbitmq開啟了持久化機(jī)制，也有一種可能，就是這個(gè)消息寫到了rabbitmq中，但是還沒來得及持久化到磁盤上，結(jié)果不巧，此時(shí)rabbitmq掛了，就會(huì)導(dǎo)致內(nèi)存里的一點(diǎn)點(diǎn)數(shù)據(jù)會(huì)丟失。

3）消費(fèi)端弄丟了數(shù)據(jù)

rabbitmq如果丟失了數(shù)據(jù)，主要是因?yàn)槟阆M(fèi)的時(shí)候，剛消費(fèi)到，還沒處理，結(jié)果進(jìn)程掛了，比如重啟了，那么就尷尬了，rabbitmq認(rèn)為你都消費(fèi)了，這數(shù)據(jù)就丟了。

這個(gè)時(shí)候得用rabbitmq提供的ack機(jī)制，簡單來說，就是你關(guān)閉rabbitmq自動(dòng)ack，可以通過一個(gè)api來調(diào)用就行，然后每次你自己代碼里確保處理完的時(shí)候，再程序里ack一把。這樣的話，如果你還沒處理完，不就沒有ack？那rabbitmq就認(rèn)為你還沒處理完，這個(gè)時(shí)候rabbitmq會(huì)把這個(gè)消費(fèi)分配給別的consumer去處理，消息是不會(huì)丟的。

（2）kafka

1）消費(fèi)端弄丟了數(shù)據(jù)

唯一可能導(dǎo)致消費(fèi)者弄丟數(shù)據(jù)的情況，就是說，你那個(gè)消費(fèi)到了這個(gè)消息，然后消費(fèi)者那邊自動(dòng)提交了offset，讓kafka以為你已經(jīng)消費(fèi)好了這個(gè)消息，其實(shí)你剛準(zhǔn)備處理這個(gè)消息，你還沒處理，你自己就掛了，此時(shí)這條消息就丟咯。

這不是一樣么，大家都知道kafka會(huì)自動(dòng)提交offset，那么只要關(guān)閉自動(dòng)提交offset，在處理完之后自己手動(dòng)提交offset，就可以保證數(shù)據(jù)不會(huì)丟。但是此時(shí)確實(shí)還是會(huì)重復(fù)消費(fèi)，比如你剛處理完，還沒提交offset，結(jié)果自己掛了，此時(shí)肯定會(huì)重復(fù)消費(fèi)一次，自己保證冪等性就好了。

生產(chǎn)環(huán)境碰到的一個(gè)問題，就是說我們的kafka消費(fèi)者消費(fèi)到了數(shù)據(jù)之后是寫到一個(gè)內(nèi)存的queue里先緩沖一下，結(jié)果有的時(shí)候，你剛把消息寫入內(nèi)存queue，然后消費(fèi)者會(huì)自動(dòng)提交offset。

然后此時(shí)我們重啟了系統(tǒng)，就會(huì)導(dǎo)致內(nèi)存queue里還沒來得及處理的數(shù)據(jù)就丟失了

2）kafka弄丟了數(shù)據(jù)

這塊比較常見的一個(gè)場景，就是kafka某個(gè)broker宕機(jī)，然后重新選舉partiton的leader時(shí)。大家想想，要是此時(shí)其他的follower剛好還有些數(shù)據(jù)沒有同步，結(jié)果此時(shí)leader掛了，然后選舉某個(gè)follower成leader之后，他不就少了一些數(shù)據(jù)？這就丟了一些數(shù)據(jù)啊。

生產(chǎn)環(huán)境也遇到過，我們也是，之前kafka的leader機(jī)器宕機(jī)了，將follower切換為leader之后，就會(huì)發(fā)現(xiàn)說這個(gè)數(shù)據(jù)就丟了

所以此時(shí)一般是要求起碼設(shè)置如下4個(gè)參數(shù)：

給這個(gè)topic設(shè)置replication.factor參數(shù)：這個(gè)值必須大于1，要求每個(gè)partition必須有至少2個(gè)副本

在kafka服務(wù)端設(shè)置min.insync.replicas參數(shù)：這個(gè)值必須大于1，這個(gè)是要求一個(gè)leader至少感知到有至少一個(gè)follower還跟自己保持聯(lián)系，沒掉隊(duì)，這樣才能確保leader掛了還有一個(gè)follower吧

在producer端設(shè)置acks=all：這個(gè)是要求每條數(shù)據(jù)，必須是寫入所有replica之后，才能認(rèn)為是寫成功了

在producer端設(shè)置retries=MAX（很大很大很大的一個(gè)值，無限次重試的意思）：這個(gè)是要求一旦寫入失敗，就無限重試，卡在這里了

我們生產(chǎn)環(huán)境就是按照上述要求配置的，這樣配置之后，至少在kafka broker端就可以保證在leader所在broker發(fā)生故障，進(jìn)行l(wèi)eader切換時(shí)，數(shù)據(jù)不會(huì)丟失

3）生產(chǎn)者會(huì)不會(huì)弄丟數(shù)據(jù)

如果按照上述的思路設(shè)置了ack=all，一定不會(huì)丟，要求是，你的leader接收到消息，所有的follower都同步到了消息之后，才認(rèn)為本次寫成功了。如果沒滿足這個(gè)條件，生產(chǎn)者會(huì)自動(dòng)不斷的重試，重試無限次。

數(shù)據(jù)的順序性

1）rabbitmq保證數(shù)據(jù)的順序性

如果存在多個(gè)消費(fèi)者，那么就讓每個(gè)消費(fèi)者對應(yīng)一個(gè)queue，然后把要發(fā)送的數(shù)據(jù)全都放到一個(gè)queue，這樣就能保證所有的數(shù)據(jù)只到達(dá)一個(gè)消費(fèi)者從而保證每個(gè)數(shù)據(jù)到達(dá)數(shù)據(jù)庫都是順序的。

（1）rabbitmq：拆分多個(gè)queue，每個(gè)queue一個(gè)consumer，就是多一些queue而已，確實(shí)是麻煩點(diǎn)；或者就一個(gè)queue但是對應(yīng)一個(gè)consumer，然后這個(gè)consumer內(nèi)部用內(nèi)存隊(duì)列做排隊(duì)，然后分發(fā)給底層不同的worker來處理

1）kafka保證數(shù)據(jù)的順序性

?kafka 寫入partion時(shí)指定一個(gè)key，列如訂單id，那么消費(fèi)者從partion中取出數(shù)據(jù)的時(shí)候肯定是有序的，當(dāng)開啟多個(gè)線程的時(shí)候可能導(dǎo)致數(shù)據(jù)不一致，這時(shí)候就需要內(nèi)存隊(duì)列，將相同的hash過的數(shù)據(jù)放在一個(gè)內(nèi)存隊(duì)列里，這樣就能保證一條線程對應(yīng)一個(gè)內(nèi)存隊(duì)列的數(shù)據(jù)寫入數(shù)據(jù)庫的時(shí)候順序性的，從而可以開啟多條線程對應(yīng)多個(gè)內(nèi)存隊(duì)列

（2）kafka：一個(gè)topic，一個(gè)partition，一個(gè)consumer，內(nèi)部單線程消費(fèi)，寫N個(gè)內(nèi)存queue，然后N個(gè)線程分別消費(fèi)一個(gè)內(nèi)存queue即可

MQ積壓幾百萬條數(shù)據(jù)怎么辦？

這個(gè)是我們真實(shí)遇到過的一個(gè)場景，確實(shí)是線上故障了，這個(gè)時(shí)候要不然就是修復(fù)consumer的問題，讓他恢復(fù)消費(fèi)速度，然后傻傻的等待幾個(gè)小時(shí)消費(fèi)完畢。這個(gè)肯定不能在面試的時(shí)候說吧。

一個(gè)消費(fèi)者一秒是1000條，一秒3個(gè)消費(fèi)者是3000條，一分鐘是18萬條，1000多萬條

所以如果你積壓了幾百萬到上千萬的數(shù)據(jù)，即使消費(fèi)者恢復(fù)了，也需要大概1小時(shí)的時(shí)間才能恢復(fù)過來

一般這個(gè)時(shí)候，只能操作臨時(shí)緊急擴(kuò)容了，具體操作步驟和思路如下：

1）先修復(fù)consumer的問題，確保其恢復(fù)消費(fèi)速度，然后將現(xiàn)有cnosumer都停掉

2）新建一個(gè)topic，partition是原來的10倍，臨時(shí)建立好原先10倍或者20倍的queue數(shù)量

3）然后寫一個(gè)臨時(shí)的分發(fā)數(shù)據(jù)的consumer程序，這個(gè)程序部署上去消費(fèi)積壓的數(shù)據(jù)，消費(fèi)之后不做耗時(shí)的處理，直接均勻輪詢寫入臨時(shí)建立好的10倍數(shù)量的queue

4）接著臨時(shí)征用10倍的機(jī)器來部署consumer，每一批consumer消費(fèi)一個(gè)臨時(shí)queue的數(shù)據(jù)

5）這種做法相當(dāng)于是臨時(shí)將queue資源和consumer資源擴(kuò)大10倍，以正常的10倍速度來消費(fèi)數(shù)據(jù)

6）等快速消費(fèi)完積壓數(shù)據(jù)之后，得恢復(fù)原先部署架構(gòu)，重新用原先的consumer機(jī)器來消費(fèi)消息

（2）這里我們假設(shè)再來第二個(gè)坑

假設(shè)你用的是rabbitmq，rabbitmq是可以設(shè)置過期時(shí)間的，就是TTL，如果消息在queue中積壓超過一定的時(shí)間就會(huì)被rabbitmq給清理掉，這個(gè)數(shù)據(jù)就沒了。那這就是第二個(gè)坑了。這就不是說數(shù)據(jù)會(huì)大量積壓在mq里，而是大量的數(shù)據(jù)會(huì)直接搞丟。

這個(gè)情況下，就不是說要增加consumer消費(fèi)積壓的消息，因?yàn)閷?shí)際上沒啥積壓，而是丟了大量的消息。我們可以采取一個(gè)方案，就是批量重導(dǎo)，這個(gè)我們之前線上也有類似的場景干過。就是大量積壓的時(shí)候，我們當(dāng)時(shí)就直接丟棄數(shù)據(jù)了，然后等過了高峰期以后，比如大家一起喝咖啡熬夜到晚上12點(diǎn)以后，用戶都睡覺了。

這個(gè)時(shí)候我們就開始寫程序，將丟失的那批數(shù)據(jù)，寫個(gè)臨時(shí)程序，一點(diǎn)一點(diǎn)的查出來，然后重新灌入mq里面去，把白天丟的數(shù)據(jù)給他補(bǔ)回來。也只能是這樣了。

假設(shè)1萬個(gè)訂單積壓在mq里面，沒有處理，其中1000個(gè)訂單都丟了，你只能手動(dòng)寫程序把那1000個(gè)訂單給查出來，手動(dòng)發(fā)到mq里去再補(bǔ)一次

（3）然后我們再來假設(shè)第三個(gè)坑

如果走的方式是消息積壓在mq里，那么如果你很長時(shí)間都沒處理掉，此時(shí)導(dǎo)致mq都快寫滿了，咋辦？這個(gè)還有別的辦法嗎？沒有，誰讓你第一個(gè)方案執(zhí)行的太慢了，你臨時(shí)寫程序，接入數(shù)據(jù)來消費(fèi)，消費(fèi)一個(gè)丟棄一個(gè)，都不要了，快速消費(fèi)掉所有的消息。然后走第二個(gè)方案，到了晚上再補(bǔ)數(shù)據(jù)吧。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

如何保證消息隊(duì)列的高可用和冪等性以及數(shù)據(jù)丟失，順序一致性

如何保證消息隊(duì)列的高可用和冪等性以及數(shù)據(jù)丟失，順序一致性

（1）RabbitMQ的高可用性

（2）kafka的高可用性

怎么保證消息隊(duì)列消費(fèi)的冪等性？

其實(shí)還是得結(jié)合業(yè)務(wù)來思考，我這里給幾個(gè)思路：

數(shù)據(jù)丟失怎么辦（如何保證消息的可靠性傳輸）

（1）rabbitmq

1）生產(chǎn)者弄丟了數(shù)據(jù)

2）rabbitmq弄丟了數(shù)據(jù)

（2）kafka

2）kafka弄丟了數(shù)據(jù)

數(shù)據(jù)的順序性

1）rabbitmq保證數(shù)據(jù)的順序性

1）kafka保證數(shù)據(jù)的順序性

（2）kafka：一個(gè)topic，一個(gè)partition，一個(gè)consumer，內(nèi)部單線程消費(fèi)，寫N個(gè)內(nèi)存queue，然后N個(gè)線程分別消費(fèi)一個(gè)內(nèi)存queue即可

MQ積壓幾百萬條數(shù)據(jù)怎么辦？

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

如何保證消息隊(duì)列的高可用和冪等性以及數(shù)據(jù)丟失，順序一致性

（1）RabbitMQ的高可用性

（2）kafka的高可用性

怎么保證消息隊(duì)列消費(fèi)的冪等性？

其實(shí)還是得結(jié)合業(yè)務(wù)來思考，我這里給幾個(gè)思路：

數(shù)據(jù)丟失怎么辦（如何保證消息的可靠性傳輸）

（1）rabbitmq

1）生產(chǎn)者弄丟了數(shù)據(jù)

2）rabbitmq弄丟了數(shù)據(jù)

（2）kafka

2）kafka弄丟了數(shù)據(jù)

數(shù)據(jù)的順序性

1）rabbitmq保證數(shù)據(jù)的順序性

1）kafka保證數(shù)據(jù)的順序性

（2）kafka：一個(gè)topic，一個(gè)partition，一個(gè)consumer，內(nèi)部單線程消費(fèi)，寫N個(gè)內(nèi)存queue，然后N個(gè)線程分別消費(fèi)一個(gè)內(nèi)存queue即可

MQ積壓幾百萬條數(shù)據(jù)怎么辦？

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

如何保證消息隊(duì)列的高可用和冪等性以及數(shù)據(jù)丟失，順序一致性

怎么保證消息隊(duì)列消費(fèi)的冪等性？

其實(shí)還是得結(jié)合業(yè)務(wù)來思考，我這里給幾個(gè)思路：

（2）kafka：一個(gè)topic，一個(gè)partition，一個(gè)consumer，內(nèi)部單線程消費(fèi)，寫N個(gè)內(nèi)存queue，然后N個(gè)線程分別消費(fèi)一個(gè)內(nèi)存queue即可

MQ積壓幾百萬條數(shù)據(jù)怎么辦？