一、常見問題
1、.java.net.SocketException: (Connection reset或者Connect reset by peer:Socket write error)。
該異常在客戶端和服務(wù)器端均有可能發(fā)生,引起該異常的原因有兩個,第一個就是如果一端的Socket被關(guān)閉(或主動關(guān)閉或者因為異常退出而引起的關(guān)閉),另一端仍發(fā)送數(shù)據(jù),發(fā)送的第一個數(shù)據(jù)包引發(fā)該異常(Connect reset by peer)。另一個是一端退出,但退出時并未關(guān)閉該連接,另一端如果在從連接中讀數(shù)據(jù)則拋出該異常(Connection reset)。簡單的說就是由連接斷開后的讀和寫操作引起的。
2、java.net.BindException:Address already in use: JVM_Bind。
該異常發(fā)生在服務(wù)器端進(jìn)行new ServerSocket(port)(port是一個0,65536的整型值)操作時。異常的原因是以為與port一樣的一個端口已經(jīng)被啟動,并進(jìn)行監(jiān)聽。此時用netstat -an命令,可以看到一個Listending狀態(tài)的端口。只需要找一個沒有被占用的端口就能解決該問題了。
3、java.net.SocketException: Socket is closed。
該異常在客戶端和服務(wù)器均可能發(fā)生。異常的原因是本端主動關(guān)閉了連接后(調(diào)用了Socket的close方法)再對網(wǎng)絡(luò)連接進(jìn)行讀寫操作。
4、java.net.ConnectException: Connection refused: connect。
該異常發(fā)生在客戶端進(jìn)行 new Socket(ip, port)操作時,該異常發(fā)生的原因是或者具有ip地址的機(jī)器不能找到(也就是說從當(dāng)前機(jī)器不存在到指定ip路由),或者是該ip存在,但找不到指定的端口進(jìn)行監(jiān)聽。出現(xiàn)該問題,首先檢查客戶端的ip和port是否寫錯,如果正確則從客戶端ping一下服務(wù)器看是否能ping通,如果能ping通(服務(wù)器端把ping禁掉則需要另外的辦法),則看在服務(wù)器端的監(jiān)聽指定端口的程序是否啟動,這個肯定能解決這個問題。
5、java.net.SocketException: Connection reset 或者Connect reset by peer:Socket write error。
該異常在客戶端和服務(wù)器端均有可能發(fā)生,引起該異常的原因有兩個,第一個就是假如一端的 Socket 被關(guān)閉(或主動關(guān)閉或者因為異常退出而引起的關(guān)閉), 另一端仍發(fā)送數(shù)據(jù),發(fā)送的第一個數(shù)據(jù)包引發(fā)該異常(Connect reset by peer)。另一個是一端退出,但退出時并未關(guān)閉該連接,另 一 端 假 如 在 從 連 接 中 讀 數(shù) 據(jù) 則 拋 出 該 異 常(Connection reset)。簡單的說就是在連接斷開后的讀和寫操作引起的。
對于服務(wù)器,一般的原因可以認(rèn)為:
a) 服務(wù)器的并發(fā)連接數(shù)超過了其承載量,服務(wù)器會將其中一些連接主動 Down 掉。
b) 在數(shù)據(jù)傳輸?shù)倪^程中,瀏覽器或者接收客戶端關(guān)閉了,而服務(wù)端還在向客戶端發(fā)送數(shù)據(jù)。
6、java.net.SocketException: Broken pipe。
該異常在客戶端和服務(wù)器均有可能發(fā)生。在第4個異常的第一種情況中(也就是拋出 SocketExcepton:Connect reset by peer:Socket write error后),如果再繼續(xù)寫數(shù)據(jù)則拋出該異常。前兩個異常的解決方法是首先確保程序退出前關(guān)閉所有的網(wǎng)絡(luò)連接,其次是要檢測對方的關(guān)閉連接操作,發(fā)現(xiàn)對方關(guān)閉連接后自己也要關(guān)閉該連接。
二、注意事項
1、長短連接區(qū)分
所謂的長連接是指一經(jīng)建立就永久保持。短連接的情況是,準(zhǔn)備數(shù)據(jù)—>建立連接—>發(fā)送數(shù)據(jù)—>關(guān)閉連接。很多的程序員寫了多年的網(wǎng)絡(luò)程序,居然不知道什么是長連接,什么是短連接。
2、長連接維護(hù)
維護(hù)包括兩個方面,首先是檢測對方的主動斷連(即調(diào)用 Socket的close方法),其次是檢測對方的宕機(jī)、異常退出及網(wǎng)絡(luò)不通。這是一個健壯的通信程序必須具備的。檢測對方的主動斷連很簡單,主要一方主動斷連,另一方如果在進(jìn)行讀操作,則此時的返回值只-1,一旦檢測到對方斷連,則應(yīng)該主動關(guān)閉本端的連接(調(diào)用Socket的close方法)。而檢測對方的宕機(jī)、異常退出及網(wǎng)絡(luò)不通,常用方法是用“心跳”,也就是雙方周期性的發(fā)送數(shù)據(jù)給對方,同時也從對方接收“心跳”,如果連續(xù)幾個周期都沒有收到對方心跳,則可以判斷對方宕機(jī)、異常退出或者網(wǎng)絡(luò)不通,此時也需要主動關(guān)閉本端連接,如果是客戶端可在延遲一定時間后重新發(fā)起連接。雖然Socket有一個keep alive選項來維護(hù)連接,如果用該選項,一般需要兩個小時才能發(fā)現(xiàn)對方的宕機(jī)、異常退出及網(wǎng)絡(luò)不通。
3、處理效率。
不管是客戶端還是服務(wù)器,如果是長連接一個程序至少需要兩個線程,一個用于接收數(shù)據(jù),一個用于發(fā)送心跳,寫數(shù)據(jù)不需要專門的線程,當(dāng)然另外還需要一類線程(俗稱Worker線程)用于進(jìn)行消息的處理,也就是說接收線程僅僅負(fù)責(zé)接收數(shù)據(jù),然后再分發(fā)給Worker進(jìn)行數(shù)據(jù)的處理。如果是短連接,則不需要發(fā)送心跳的線程,如果是服務(wù)器還需要一個專門的線程負(fù)責(zé)進(jìn)行連接請求的監(jiān)聽。這些是一個通信程序的整體要求,具體到你的程序中,就看你如何對程序進(jìn)行優(yōu)化。