1 消息隊列概述
消息隊列中間件是分布式系統(tǒng)中重要的組件,主要解決應(yīng)用耦合,異步消息,流量削鋒等問題。實現(xiàn)高性能,高可用,可伸縮和最終一致性架構(gòu)。是大型分布式系統(tǒng)不可缺少的中間件。
目前在生產(chǎn)環(huán)境,使用較多的消息隊列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等。
2 消息隊列是怎么工作?
消息隊列系統(tǒng),一般都包含3個角色:隊列服務(wù)端,隊列的生產(chǎn)者,隊列的消費者。
消息隊列系統(tǒng)類似于這個場景:有一條信息傳送帶不停地運轉(zhuǎn)。在傳送帶的起點,工人a不斷地把信息放在一個盒子,把盒子放到傳送帶上,盒子被傳送帶傳送到終點。在終點上,工人b把盒子上的信息取出來,進行處理。
在上面的場景中,不停運轉(zhuǎn)的傳送帶就是隊列服務(wù)端,在傳送帶起點不斷放盒子的工人a就是隊列的生產(chǎn)者,在傳送帶終點不斷取盒子的工人b就是隊列的消費者。
消息隊列的服務(wù)端,現(xiàn)在有大量的開源的應(yīng)用,例如RabbitMQ ,ZeroMQ ,redis等。
隊列的生產(chǎn)者和服務(wù)者,是針對消息隊列服務(wù)端開發(fā)的客戶端,例如,RabbitMQ就有針對java,php等語言開發(fā)的客戶端。
例如,在app后端中,用代碼調(diào)用 java客戶端,把要發(fā)送的短信信息放在ZeroMQ中,這里java客戶端是充當隊列的生產(chǎn)者。
寫一個守護進程,在守護進程中,通過代碼調(diào)用 java客戶端把要發(fā)送的短信信息不斷地從ZeroMQ取出來,然后發(fā)送出去。
3 為什么要用消息隊列?
假設(shè)一個老大,接到一個任務(wù)要處理完。在處理這個任務(wù)時,把這個任務(wù)分解為幾個小任務(wù),只要分別完成了這幾個小任務(wù),整個任務(wù)也就完成了。
做到某個小任務(wù)時,發(fā)現(xiàn)這個小任務(wù)需要花很多時間完成,而且這個小任務(wù)遲點完成也不影響整個任務(wù)的完成進度。于是,老大把這個小任務(wù)交個一個小弟去做,自己去接著完成其他的任務(wù)。
在上面的例子中,老大就是后臺系統(tǒng),小弟就是消息隊列系統(tǒng),當后臺系統(tǒng)發(fā)現(xiàn)完成某些小任務(wù)需要花很多時間,而且遲點完成也不影響整個任務(wù)的,就會把這些小任務(wù)交給消息隊列系統(tǒng)。
在實際的app后端中,發(fā)送郵件,發(fā)送短信,推送等這些任務(wù),都非常適合在消息隊列系統(tǒng)中做的。大家想想,這些任務(wù)是不是都需要花比較多的時間,而且遲點完成也不影響的。把這些任務(wù)放在隊列中,可加快請求的響應(yīng)時間。
4 消息隊列應(yīng)用場景
以下介紹消息隊列在實際應(yīng)用中常用的使用場景。異步處理,應(yīng)用解耦,流量削鋒和消息通訊四個場景。
4.1 異步處理
場景說明:用戶注冊后,需要發(fā)注冊郵件和注冊短信。傳統(tǒng)的做法有兩種1.串行的方式;2.并行方式。
-
串行方式:將注冊信息寫入數(shù)據(jù)庫成功后,發(fā)送注冊郵件,再發(fā)送注冊短信。以上三個任務(wù)全部完成后,返回給客戶端。
串行方式.png 并行方式:將注冊信息寫入數(shù)據(jù)庫成功后,發(fā)送注冊郵件的同時,發(fā)送注冊短信。以上三個任務(wù)完成后,返回給客戶端。與串行的差別是,并行的方式可以提高處理的時間。

假設(shè)三個業(yè)務(wù)節(jié)點每個使用50毫秒鐘,不考慮網(wǎng)絡(luò)等其他開銷,則串行方式的時間是150毫秒,并行的時間可能是100毫秒。
因為CPU在單位時間內(nèi)處理的請求數(shù)是一定的,假設(shè)CPU1秒內(nèi)吞吐量是100次。則串行方式1秒內(nèi)CPU可處理的請求量是7次(1000/150)。并行方式處理的請求量是10次(1000/100)。
小結(jié):如以上案例描述,傳統(tǒng)的方式系統(tǒng)的性能(并發(fā)量,吞吐量,響應(yīng)時間)會有瓶頸。如何解決這個問題呢?
引入消息隊列,將不是必須的業(yè)務(wù)邏輯,異步處理。改造后的架構(gòu)如下:

按照以上約定,用戶的響應(yīng)時間相當于是注冊信息寫入數(shù)據(jù)庫的時間,也就是50毫秒。注冊郵件,發(fā)送短信寫入消息隊列后,直接返回,因此寫入消息隊列的速度很快,基本可以忽略,因此用戶的響應(yīng)時間可能是50毫秒。因此架構(gòu)改變后,系統(tǒng)的吞吐量提高到每秒20 QPS。比串行提高了3倍,比并行提高了兩倍。
4.2 應(yīng)用解耦
場景說明:用戶下單后,訂單系統(tǒng)需要通知庫存系統(tǒng)。傳統(tǒng)的做法是,訂單系統(tǒng)調(diào)用庫存系統(tǒng)的接口。如下圖:

傳統(tǒng)模式的缺點:
- 假如庫存系統(tǒng)無法訪問,則訂單減庫存將失敗,從而導(dǎo)致訂單失敗;
- 訂單系統(tǒng)與庫存系統(tǒng)耦合;
如何解決以上問題呢?引入應(yīng)用消息隊列后的方案,如下圖:

- 訂單系統(tǒng):用戶下單后,訂單系統(tǒng)完成持久化處理,將消息寫入消息隊列,返回用戶訂單下單成功。
- 庫存系統(tǒng):訂閱下單的消息,采用拉/推的方式,獲取下單信息,庫存系統(tǒng)根據(jù)下單信息,進行庫存操作。
假如:在下單時庫存系統(tǒng)不能正常使用。也不影響正常下單,因為下單后,訂單系統(tǒng)寫入消息隊列就不再關(guān)心其他的后續(xù)操作了。實現(xiàn)訂單系統(tǒng)與庫存系統(tǒng)的應(yīng)用解耦。
4.3 流量削鋒
流量削鋒也是消息隊列中的常用場景,一般在秒殺或團搶活動中使用廣泛。
應(yīng)用場景:秒殺活動,一般會因為流量過大,導(dǎo)致流量暴增,應(yīng)用掛掉。為解決這個問題,一般需要在應(yīng)用前端加入消息隊列。
- 可以控制活動的人數(shù);
- 可以緩解短時間內(nèi)高流量壓垮應(yīng)用;

用戶的請求,服務(wù)器接收后,首先寫入消息隊列。假如消息隊列長度超過最大數(shù)量,則直接拋棄用戶請求或跳轉(zhuǎn)到錯誤頁面;
秒殺業(yè)務(wù)根據(jù)消息隊列中的請求信息,再做后續(xù)處理。
4.4 日志處理
日志處理是指將消息隊列用在日志處理中,比如Kafka的應(yīng)用,解決大量日志傳輸?shù)膯栴}。架構(gòu)簡化如下:

- 日志采集客戶端,負責日志數(shù)據(jù)采集,定時寫受寫入Kafka隊列;
- Kafka消息隊列,負責日志數(shù)據(jù)的接收,存儲和轉(zhuǎn)發(fā);
- 日志處理應(yīng)用:訂閱并消費kafka隊列中的日志數(shù)據(jù);
以下是新浪kafka日志處理應(yīng)用案例:

- Kafka:接收用戶日志的消息隊列。
- Logstash:做日志解析,統(tǒng)一成JSON輸出給Elasticsearch。
- Elasticsearch:實時日志分析服務(wù)的核心技術(shù),一個schemaless,實時的數(shù)據(jù)存儲服務(wù),通過index組織數(shù)據(jù),兼具強大的搜索和統(tǒng)計功能。
- Kibana:基于Elasticsearch的數(shù)據(jù)可視化組件,超強的數(shù)據(jù)可視化能力是眾多公司選擇ELK stack的重要原因。
5 消息通訊
消息通訊是指,消息隊列一般都內(nèi)置了高效的通信機制,因此也可以用在純的消息通訊。比如實現(xiàn)點對點消息隊列,或者聊天室等。
-
點對點通訊:
點對點通訊.png
客戶端A和客戶端B使用同一隊列,進行消息通訊。 -
聊天室通訊:
聊天室通訊.png
客戶端A,客戶端B,客戶端N訂閱同一主題,進行消息發(fā)布和接收。實現(xiàn)類似聊天室效果。
以上實際是消息隊列的兩種消息模式,點對點或發(fā)布訂閱模式。模型為示意圖,供參考。
6 JMS消息服務(wù)
講消息隊列就不得不提JMS 。JMS(JAVA Message Service,java消息服務(wù))API是一個消息服務(wù)的標準/規(guī)范,允許應(yīng)用程序組件基于JavaEE平臺創(chuàng)建、發(fā)送、接收和讀取消息。它使分布式通信耦合度更低,消息服務(wù)更加可靠以及異步性。
在EJB架構(gòu)中,有消息bean可以無縫的與JM消息服務(wù)集成。在J2EE架構(gòu)模式中,有消息服務(wù)者模式,用于實現(xiàn)消息與應(yīng)用直接的解耦。
JMS具有兩種通信模式:
- Point-to-Point Messaging Domain (點對點)
- Publish/Subscribe Messaging Domain (發(fā)布/訂閱模式)
在JMS API出現(xiàn)之前,大部分產(chǎn)品使用“點對點”和“發(fā)布/訂閱”中的任一方式來進行消息通訊。JMS定義了這兩種消息發(fā)送模型的規(guī)范,它們相互獨立。任何JMS的提供者可以實現(xiàn)其中的一種或兩種模型,這是它們自己的選擇。JMS規(guī)范提供了通用接口保證我們基于JMS API編寫的程序適用于任何一種模型。
6.1 消息模型
在JMS標準中,有兩種消息模型P2P(Point to Point),
Publish/Subscribe(Pub/Sub)。
- P2P模式

P2P模式包含三個角色:消息隊列(Queue),發(fā)送者(Sender),接收者(Receiver)。每個消息都被發(fā)送到一個特定的隊列,接收者從隊列中獲取消息。隊列保留著消息,直到他們被消費或超時。
P2P的特點
- 每個消息只有一個消費者(Consumer)(即一旦被消費,消息就不再在消息隊列中);
- 發(fā)送者和接收者之間在時間上沒有依賴性,也就是說當發(fā)送者發(fā)送了消息之后,不管接收者有沒有正在運行,它不會影響到消息被發(fā)送到隊列;
- 接收者在成功接收消息之后需向隊列應(yīng)答成功。
如果希望發(fā)送的每個消息都會被成功處理的話,那么需要P2P模式。
- Pub/sub模式

包含三個角色主題(Topic),發(fā)布者(Publisher),訂閱者(Subscriber) 。多個發(fā)布者將消息發(fā)送到Topic,系統(tǒng)將這些消息傳遞給多個訂閱者。
Pub/Sub的特點
- 每個消息可以有多個消費者;
- 發(fā)布者和訂閱者之間有時間上的依賴性。針對某個主題(Topic)的訂閱者,它必須創(chuàng)建一個訂閱者之后,才能消費發(fā)布者的消息;
- 為了消費消息,訂閱者必須保持運行的狀態(tài)。
為了緩和這樣嚴格的時間相關(guān)性,JMS允許訂閱者創(chuàng)建一個可持久化的訂閱。這樣,即使訂閱者沒有被激活(運行),它也能接收到發(fā)布者的消息。
如果希望發(fā)送的消息可以不被做任何處理、或者只被一個消息者處理、或者可以被多個消費者處理的話,那么可以采用Pub/Sub模型。
6.2 消息消費
在JMS中,消息的產(chǎn)生和消費都是異步的。對于消費來說,JMS的消息者可以通過兩種方式來消費消息。
- 同步(Synchronous)
訂閱者或接收者通過receive方法來接收消息,receive方法在接收到消息之前(或超時之前)將一直阻塞; - 異步(Asynchronous)
訂閱者或接收者可以注冊為一個消息監(jiān)聽器。當消息到達之后,系統(tǒng)自動調(diào)用監(jiān)聽器的onMessage方法。
JNDI:Java命名和目錄接口,是一種標準的Java命名系統(tǒng)接口??梢栽诰W(wǎng)絡(luò)上查找和訪問服務(wù)。通過指定一個資源名稱,該名稱對應(yīng)于數(shù)據(jù)庫或命名服務(wù)中的一個記錄,同時返回資源連接建立所必須的信息。
JNDI在JMS中起到查找和訪問發(fā)送目標或消息來源的作用。
6.3 JMS編程模型

- 管理對象(Administered objects)-連接工廠(Connection Factories)和目的地(Destination)
- 連接對象(Connections)
- 會話(Sessions)
- 消息生產(chǎn)者(Message Producers)
- 消息消費者(Message Consumers)
- 消息監(jiān)聽者(Message Listeners)
ConnectionFactory
創(chuàng)建Connection對象的工廠,針對兩種不同的jms消息模型,分別有QueueConnectionFactory和TopicConnectionFactory兩種??梢酝ㄟ^JNDI來查找ConnectionFactory對象。Destination
Destination的意思是消息生產(chǎn)者的消息發(fā)送目標或者說消息消費者的消息來源。對于消息生產(chǎn)者來說,它的Destination是某個隊列(Queue)或某個主題(Topic);對于消息消費者來說,它的Destination也是某個隊列或主題(即消息來源)。
所以,Destination實際上就是兩種類型的對象:Queue、Topic可以通過JNDI來查找Destination。Connection
Connection表示在客戶端和JMS系統(tǒng)之間建立的鏈接(對TCP/IP socket的包裝)。Connection可以產(chǎn)生一個或多個Session。跟ConnectionFactory一樣,Connection也有兩種類型:QueueConnection和TopicConnection。Session
Session是操作消息的接口。可以通過session創(chuàng)建生產(chǎn)者、消費者、消息等。Session提供了事務(wù)的功能。當需要使用session發(fā)送/接收多個消息時,可以將這些發(fā)送/接收動作放到一個事務(wù)中。同樣,也分QueueSession和TopicSession。消息的生產(chǎn)者
消息生產(chǎn)者由Session創(chuàng)建,并用于將消息發(fā)送到Destination。同樣,消息生產(chǎn)者分兩種類型:QueueSender和TopicPublisher??梢哉{(diào)用消息生產(chǎn)者的方法(send或publish方法)發(fā)送消息。消息消費者
消息消費者由Session創(chuàng)建,用于接收被發(fā)送到Destination的消息。兩種類型:QueueReceiver和TopicSubscriber??煞謩e通過session的createReceiver(Queue)或createSubscriber(Topic)來創(chuàng)建。當然,也可以session的creatDurableSubscriber方法來創(chuàng)建持久化的訂閱者。MessageListener
消息監(jiān)聽器。如果注冊了消息監(jiān)聽器,一旦消息到達,將自動調(diào)用監(jiān)聽器的onMessage方法。EJB中的MDB(Message-Driven Bean)就是一種MessageListener。
深入學習JMS對掌握JAVA架構(gòu),EJB架構(gòu)有很好的幫助,消息中間件也是大型分布式系統(tǒng)必須的組件。
7 常用消息隊列
7.1 Kafka

Kafka作為時下最流行的開源消息系統(tǒng),被廣泛地應(yīng)用在數(shù)據(jù)緩沖、異步通信、匯集日志、系統(tǒng)解耦等方面。相比較于RocketMQ等其他常見消息系統(tǒng),Kafka在保障了大部分功能特性的同時,還提供了超一流的讀寫性能。
Kafka是一種分布式的,基于發(fā)布/訂閱的消息系統(tǒng)。主要設(shè)計目標如下:
以時間復(fù)雜度為O(1)的方式提供消息持久化能力,即使對TB級以上數(shù)據(jù)也能保證常數(shù)時間復(fù)雜度的訪問性能。
高吞吐率。即使在非常廉價的商用機器上也能做到單機支持每秒100K條以上消息的傳輸。
支持Kafka Server間的消息分區(qū),及分布式消費,同時保證每個Partition內(nèi)的消息順序傳輸。
同時支持離線數(shù)據(jù)處理和實時數(shù)據(jù)處理。
Scale out:支持在線水平擴展。
很明顯的看出Kafka的性能遠超RabbitMQ。不過這也是理所當然的,畢竟2個消息隊列實現(xiàn)的協(xié)議是不一樣的,處理消息的場景也大有不同。RabbitMQ適合處理一些數(shù)據(jù)嚴謹?shù)南?,比如說支付消息,社交消息等不能丟失的數(shù)據(jù)。Kafka是批量操作切不報證數(shù)據(jù)是否能完整的到達消費者端,所以適合一些大量的營銷消息的場景。
7.2 RabbitMQ

RabbitMQ是使用Erlang編寫的一個開源的消息隊列,本身支持很多的協(xié)議:AMQP,XMPP, SMTP, STOMP,也正因如此,它非常重量級,更適合于企業(yè)級的開發(fā)。同時實現(xiàn)了Broker構(gòu)架,這意味著消息在發(fā)送給客戶端時先在中心隊列排隊。對路由,負載均衡或者數(shù)據(jù)持久化都有很好的支持。
它支持開放的高級消息隊列協(xié)議 (AMQP,Advanced Message Queuing Protocol),從根本上避免了生產(chǎn)廠商的封閉,使用任何語言的各種客戶都可以從中受益。這種協(xié)議提供了相當復(fù)雜的消息傳輸模式,所以基本上不需要MassTransit或NServiceBus的配合。它還具有“企業(yè)級”的適應(yīng)性和穩(wěn)定性。這些東西對我的客戶來說十分的有吸引力。
7.3 ZeroMQ
號稱最快的消息隊列系統(tǒng),尤其針對大吞吐量的需求場景。跟其它幾個接受測試的產(chǎn)品不同,你不需要安裝和運行一個消息服務(wù)器,或中間件。你只需要簡單的引用ZeroMQ程序庫,可以使用NuGet安裝,然后你就可以愉快的在應(yīng)用程序之間發(fā)送消息了。非常有趣的是,他們也同樣使用這方式在任何利用ZeroMQ進行強大的進程內(nèi)通信的語言里創(chuàng)建Erlang風格的這種執(zhí)行角色。ZeroMQ和其它的不是一個級別。它的性能驚人的高。公平的說,ZeroMQ跟其它幾個比起來像頭巨獸,盡管這樣,結(jié)論很清楚:如果你希望一個應(yīng)用程序發(fā)送消息越快越好,你選擇ZeroMQ。當你不太在意偶然會丟失某些消息的情況下更有價值。其中,Twitter的Storm中使用ZeroMQ作為數(shù)據(jù)流的傳輸。
7.4 ActiveMQ

Java世界的中堅力量?;?strong>JMS協(xié)議。它有很長的歷史,而且被廣泛的使用。它還是跨平臺的,給那些非微軟平臺的產(chǎn)品提供了一個天然的集成接入點。然而,它只有跑過了MSMQ才有可能被考慮。
ActiveMQ是Apache下的一個子項目。 類似于ZeroMQ,它能夠以代理人和點對點的技術(shù)實現(xiàn)隊列。同時類似于RabbitMQ,它少量代碼就可以高效地實現(xiàn)高級應(yīng)用場景。
7.5 Jafka
Jafka是在Kafka之上孵化而來的,即Kafka的一個升級版。具有以下特性:快速持久化,可以在O(1)的系統(tǒng)開銷下進行消息持久化;高吞吐,在一臺普通的服務(wù)器上既可以達到10W/s的吞吐速率;完全的分布式系統(tǒng),Broker、Producer、Consumer都原生自動支持分布式,自動實現(xiàn)負載均衡;支持Hadoop數(shù)據(jù)并行加載,對于像Hadoop的一樣的日志數(shù)據(jù)和離線分析系統(tǒng),但又要求實時處理的限制,這是一個可行的解決方案。
7.6 MSMQ
這是微軟的產(chǎn)品里唯一被認為有價值的東西。對我的客戶來說,如果MSMQ能證明可以應(yīng)對這種任務(wù),他們將選擇使用它。關(guān)鍵是這個東西并不復(fù)雜,除了接收和發(fā)送,沒有別的;它有一些硬性限制,比如最大消息體積是4MB。然而,通過和一些像MassTransit或NServiceBus這樣的軟件的連接,它完全可以解決這些問題。
7.7 Redis

是一個Key-Value的NoSQL數(shù)據(jù)庫,開發(fā)維護很活躍,雖然它是一個Key-Value數(shù)據(jù)庫存儲系統(tǒng),但它本身支持MQ功能,所以完全可以當做一個輕量級的隊列服務(wù)來使用。對于RabbitMQ和Redis的入隊和出隊操作,各執(zhí)行100萬次,每10萬次記錄一次執(zhí)行時間。測試數(shù)據(jù)分為128Bytes、512Bytes、1K和10K四個不同大小的數(shù)據(jù)。實驗表明:入隊時,當數(shù)據(jù)比較小時Redis的性能要高于RabbitMQ,而如果數(shù)據(jù)大小超過了10K,Redis則慢的無法忍受;出隊時,無論數(shù)據(jù)大小,Redis都表現(xiàn)出非常好的性能,而RabbitMQ的出隊性能則遠低于Redis。


