節(jié)點客戶端(node client):
節(jié)點客戶端本身也是一個ES節(jié)點(一般不保存數(shù)據(jù),不能成為主節(jié)點),它能以無數(shù)據(jù)節(jié)點身份加入到集群中。因為它是集群環(huán)境中的一個節(jié)點,所以它知道整個集群狀態(tài)(所有節(jié)點駐留,分片分布在哪些節(jié)點等等), 可以把需要執(zhí)行的操作自動路由到節(jié)點上,而少一個網(wǎng)絡躍點。
Node node = NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();
GetResponse getResponse = client.prepareGet(index,type,"2").get();
System.out.println(JSONObject.toJSONString(getResponse));
當你啟動node時,你可以在你的項目/src/main/resources/elasticsearch.yml文件中定義簡單的設置cluster.name或者明確地使用clusterName方法來加入到指定的集群中。
使用elasticsearch.yml的方式: cluster.name: yourclustername
通過Java的方式:
Node node = NodeBuilder.nodeBuilder().clusterName("elasticsearch").local(true).node() ;
使用節(jié)點客戶端的好處是,操作可以自動地路由到這些操作被執(zhí)行的節(jié)點,而不需要執(zhí)行雙跳(double hop)。例如,索引操作將會在該操作最終存在的分片上執(zhí)行。
當你啟動了一個節(jié)點,最重要的決定是它是否將保有數(shù)據(jù)。大多數(shù)情況下,我們僅僅需要用到clients,而不需要分片分配給它們。這可以通過設置node.data為false或者設置node.local為true來簡單實現(xiàn)。
Node node = NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();
傳輸客戶端(Transport Client)
作為更輕量的傳輸客戶端能夠請求到遠程集群。它自己不加入集群,只是簡單的獲得一個或者多個初始化的transport地址,并以輪詢的方式與這些地址進行通信。比較像傳統(tǒng)的CS程序的架構,比如數(shù)據(jù)庫連接。
Settings settings = Settings.builder()
.put("cluster.name","my-application") .build();
TransportClient client = TransportClient.builder()
.settings(settings).build()
.addTransportAddress(newInetSocketTransportAddress(InetAddress.getByName("ip"),9300));
傳輸客戶端可以嗅到集群的其他部分,并將它們加入到機器列表。為了開啟該功能,可以設置client.transport.sniff為true。
其他的transfersport客戶端設置有如下幾個:
client.transport.ignore_cluster_name:true:忽略連接節(jié)點的集群名驗證
client.transport.ping_timeout一個節(jié)點的響應時間,默認是5s
client.transport.nodes_sampler_intervalsample/ping 節(jié)點的時間間隔,默認是5s
節(jié)點客戶端與傳輸客戶端的區(qū)別
- 第一種方式,相當于額外啟動了一個ES的
node節(jié)點,這個節(jié)點和集群中的其他節(jié)點沒有任何區(qū)別。只是這個node是由我們編碼控制的,可以設置這個node是不存數(shù)據(jù)的節(jié)點(沒有特殊原因你就應該這個設置)。
- 第二種方法,相當于獲取了所有
node節(jié)點的client,發(fā)送請求的時候遍歷當前可用的client(這里可用指的是可以連接,但是node本身不一定可用,比如node正在恢復中,還沒有加入到集群,這就會產(chǎn)生問題。)跟方法一相比,方法二會產(chǎn)生雙跳(double hop),即當前遍歷到node1,但訪問的數(shù)據(jù)在node2,請求先轉(zhuǎn)發(fā)到node1,又由node1轉(zhuǎn)發(fā)到node2。
遍歷方式:每次請求通過AtomicInteger進行原子加1(超過最大值后設置為0),按當前可用client數(shù)取模。
獲取當前可用client的方法:使用線程池,遍歷當前可用client,如果client未連接,嘗試進行一次連接,連接成功加入可用client中,如果client已經(jīng)連接直接加入可用client。
可以通過設置client.transport.sniff是否為true,來設置是使用SimpleNodeSampler還是SniffNOdesSampler,默認是false,就是使用SimpleNodeSampler。具體實現(xiàn)在org.elasticsearch.client.transport.TransportClientNodesService中。
簡單的說,SimpleNodeSampler會限制當前可用client一定是在配置中設置的節(jié)點。而SniffNodesSampler會使用所有發(fā)現(xiàn)的client,即使這個client的node,不在配置中。
當集群中某個node掛掉之后,重新加入的時候,因為是通過判斷client是否可以連接,而不是node是否可用,這會導致這個時候使用這個client發(fā)送請求的時候產(chǎn)生異常。而方法一不會,因為還沒加入集群的node,對于自己創(chuàng)建的node來說是不可見的。
使用情況
如果要將應用程序和Elasticsearch集群進行解耦,傳輸客戶端是一個理想的選擇。例如 如果你的應用程序需要快速的創(chuàng)建和銷毀到集群的鏈接,傳輸客戶端比節(jié)點客戶端更"輕",因為它不是集群的
轉(zhuǎn)載自ES Java 客戶端 - 做個有夢想的咸魚 - 博客園