equals方法和hashCode方法均是Object對(duì)象的方法。Object中關(guān)于hashCode約定的規(guī)范如下:
- 在應(yīng)用程序的執(zhí)行期間,只要對(duì)象的equals方法的比較操作所用到的信息沒(méi)有被修改,那么對(duì)同一個(gè)對(duì)象調(diào)用多次,hashCode方法都必須始終如一地返回同一個(gè)整數(shù)。在同一個(gè)應(yīng)用程序的多次執(zhí)行過(guò)程中,每次執(zhí)行所返回的整數(shù)可以不一致。
2.如果兩個(gè)對(duì)象根據(jù)equals(Object)方法比較是相等的,那么調(diào)用這兩個(gè)對(duì)象中任意一個(gè)對(duì)象的hashCode方法都必須產(chǎn)生同樣的整數(shù)結(jié)果。
3.如果兩個(gè)對(duì)象根據(jù)equals(Object)方法比較是不相等的,那么調(diào)用這兩個(gè)對(duì)象中任意一個(gè)對(duì)象的hashCode方法,則不一定要產(chǎn)生不同的整數(shù)結(jié)果。但是程序員應(yīng)該知道,給不相等的對(duì)象產(chǎn)生截然不同的整數(shù)結(jié)果,有可能提高散列表(hash table)的性能。


如果某個(gè)類違反Object的hashCode的通用約定,會(huì)導(dǎo)致該類無(wú)法結(jié)合所有基于散列的集合一起正常運(yùn)轉(zhuǎn),如:HashMap、HashSet和HashTable。
覆蓋equals方法而沒(méi)有覆蓋hashCode方法違反了約定的第2條:相等的對(duì)象必須具有相等的散列碼。
如下示例:
package com.wuyafu.java.effective.hashcode;
import java.util.HashMap;
import java.util.Map;
public class PhoneNumber {
private final short areaCode;
private final short prefix;
private final short lineNumber;
public PhoneNumber(int areaCode, int prefix, int lineNumber) {
rangeCheck(areaCode, 999, "area code");
rangeCheck(prefix, 999, "prefix");
rangeCheck(lineNumber, 9999, "lineNumber");
this.areaCode = (short)areaCode;
this.prefix = (short)prefix;
this.lineNumber = (short)lineNumber;
}
private static void rangeCheck(int arg, int max, String name){
if (arg < 0|| arg > max) {
throw new IllegalArgumentException(name + ":" + arg);
}
}
@Override
public boolean equals(Object o){
if (o == this)
return true;
if (!(o instanceof PhoneNumber))
return false;
PhoneNumber pn = (PhoneNumber)o;
return pn.lineNumber == lineNumber
&& pn.prefix == prefix
&& pn.areaCode == areaCode;
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
Map<PhoneNumber, String> m =
new HashMap<PhoneNumber, String>();
m.put(new PhoneNumber(408, 867, 5309), "Jenny");
System.out.println(m.get(new PhoneNumber(408, 867, 5309)));
}
}
由于PhoneNumber類沒(méi)有覆蓋hashCode方法,從而導(dǎo)致兩個(gè)相等的實(shí)例具有不相等的散列碼,違反了hashCode的約定。
為解決這個(gè)問(wèn)題,只需為PhoneNumber類提供一個(gè)適當(dāng)?shù)膆ashCode方法即可。
如下:
@Override
public int hashCode(){return 42;}
該方法確保了相等的對(duì)象總是具有同樣的散列碼。但是它也極為惡劣,因?yàn)樗沟妹總€(gè)對(duì)象都具有同樣的散列碼。因此每個(gè)對(duì)象都被映射到同一個(gè)散列桶中,使散列表退化為鏈表。
一個(gè)好的散列函數(shù)通常傾向于“為不相等的對(duì)象產(chǎn)生不相等的散列碼”,散列函數(shù)應(yīng)該把集合中不相等的實(shí)例均勻地分布到所有可能的散列值上。實(shí)現(xiàn)這種理想狀態(tài)很難,但如下方法可以接近理想狀態(tài):

在散列碼的計(jì)算過(guò)程中,可以把冗余域排除在外。
在公式中result不能為0,17為任意選的值。
31為奇素?cái)?shù),有更好的性能
利用上述接近辦法,修改PhoneNumber類的hashCode方法如下:
@Override
public int hashCode(){
int result = 17;
result = 31 * result + areaCode;
result = 31 * result + prefix;
result = 31 * result + lineNumber;
return result;
}
如果一個(gè)類是不可變的,并且計(jì)算散列碼的開(kāi)銷也比較大,就應(yīng)該考慮把散列碼緩存在對(duì)象內(nèi)部,而不是每次請(qǐng)求的時(shí)候都重新計(jì)算散列碼??梢酝ㄟ^(guò)“延遲初始化”散列碼的方式來(lái)實(shí)現(xiàn),修改PhoneNumber類的hashCode方法如下:
private volatile int hashCode;
@Override
public int hashCode(){
int result = hashCode;
if (result == 0) {
result = 17;
result = 31* result + areaCode;
result = 31* result + prefix;
result = 31* result + lineNumber;
}
}
總結(jié):當(dāng)覆蓋equals方法時(shí),要覆蓋hashCode方法,并且采用公式來(lái)將對(duì)象的關(guān)鍵域參與到散列碼的計(jì)算中,確保不相同的對(duì)象在不同的散列桶中。若該類是不可變的,可以考慮使用“延遲初始化”散列碼的方式。