TreeSet

TreeSet是一個有序的集合,它的作用是提供有序的Set集合。它繼承了AbstractSet抽象類,實現了NavigableSet<E>,Cloneable,Serializable接口。TreeSet是基于TreeMap實現的,TreeSet的元素支持2種排序方式:自然排序或者根據提供的Comparator進行排序。

(1)TreeSet繼承于AbstractSet,并且實現了NavigableSet接口。
(2)TreeSet是一個包含有序的且沒有重復元素的集合,通過TreeMap實現。TreeSet中含有一個"NavigableMap類型的成員變量"m,而m實際上是"TreeMap的實例"。
TreeSet用法
public static void demoOne() {
TreeSet<Person> ts = new TreeSet<>();
ts.add(new Person("張三", 11));
ts.add(new Person("李四", 12));
ts.add(new Person("王五", 15));
ts.add(new Person("趙六", 21));
System.out.println(ts);
}
執(zhí)行結果:會拋出一個 異常:java.lang.ClassCastException
顯然是出現了類型轉換異常。原因在于我們需要告訴TreeSet如何來進行比較元素,如果不指定,就會拋出這個異常
如何解決:
如何指定比較的規(guī)則,需要在自定義類(Person)中實現Comparable接口,并重寫接口中的compareTo方法
public class Person implements Comparable<Person> {
private String name;
private int age;
...
public int compareTo(Person o) {
return 0; //當compareTo方法返回0的時候集合中只有一個元素
return 1; //當compareTo方法返回正數的時候集合會怎么存就怎么取
return -1; //當compareTo方法返回負數的時候集合會倒序存儲
}
}
為什么返回0,只會存一個元素,返回-1會倒序存儲,返回1會怎么存就怎么取呢?原因在于TreeSet底層其實是一個二叉樹機構,且每插入一個新元素(第一個除外)都會調用compareTo()方法去和上一個插入的元素作比較,并按二叉樹的結構進行排列。
- 如果將
compareTo()返回值寫死為0,元素值每次比較,都認為是相同的元素,這時就不再向TreeSet中插入除第一個外的新元素。所以TreeSet中就只存在插入的第一個元素。 - 如果將
compareTo()返回值寫死為1,元素值每次比較,都認為新插入的元素比上一個元素大,于是二叉樹存儲時,會存在根的右側,讀取時就是正序排列的。 - 如果將
compareTo()返回值寫死為-1,元素值每次比較,都認為新插入的元素比上一個元素小,于是二叉樹存儲時,會存在根的左側,讀取時就是倒序序排列的。
示例代碼,需求:現在要制定TreeSet中按照String長度比較String。
//定義一個類,實現Comparator接口,并重寫compare()方法,
class CompareByLength implements Comparator<String> {
@Override
public int compare(String s1, String s2) { //按照字符串的長度比較
int num = s1.length() - s2.length(); //長度為主要條件
return num == 0 ? s1.compareTo(s2) : num; //內容為次要條件
}
}
public static void demoTwo() {
//需求:將字符串按照長度排序
TreeSet<String> ts = new TreeSet<>(new CompareByLen()); //Comparator c = new CompareByLen();
ts.add("aaaaaaaa");
ts.add("z");
ts.add("wc");
ts.add("nba");
ts.add("cba");
System.out.println(ts);
}
TreeSet的部分源碼:
package java.util;
public class TreeSet<E> extends AbstractSet<E>
implements NavigableSet<E>, Cloneable, java.io.Serializable
{
// 使用NavigableMap對象的key來保存Set集合的元素
private transient NavigableMap<E,Object> m;
//使用PRESENT作為Map集合中的value
private static final Object PRESENT = new Object();
// 不帶參數的構造函數。創(chuàng)建一個空的TreeMap
//以自然排序方法創(chuàng)建一個新的TreeMap,再根據該TreeMap創(chuàng)建一個TreeSet
//使用該TreeMap的key來保存Set集合的元素
public TreeSet() {
this(new TreeMap<E,Object>());
}
// 將TreeMap賦值給 "NavigableMap對象m"
TreeSet(NavigableMap<E,Object> m) {
this.m = m;
}
//以定制排序的方式創(chuàng)建一個新的TreeMap。根據該TreeMap創(chuàng)建一個TreeSet
//使用該TreeMap的key來保存set集合的元素
public TreeSet(Comparator<? super E> comparator) {
this(new TreeMap<E,Object>(comparator));
}
// 創(chuàng)建TreeSet,并將集合c中的全部元素都添加到TreeSet中
public TreeSet(Collection<? extends E> c) {
this();
// 將集合c中的元素全部添加到TreeSet中
addAll(c);
}
// 創(chuàng)建TreeSet,并將s中的全部元素都添加到TreeSet中
public TreeSet(SortedSet<E> s) {
this(s.comparator());
addAll(s);
}
// 返回TreeSet的順序排列的迭代器。
// 因為TreeSet時TreeMap實現的,所以這里實際上時返回TreeMap的“鍵集”對應的迭代器
public Iterator<E> iterator() {
return m.navigableKeySet().iterator();
}
// 返回TreeSet的逆序排列的迭代器。
// 因為TreeSet時TreeMap實現的,所以這里實際上時返回TreeMap的“鍵集”對應的迭代器
public Iterator<E> descendingIterator() {
return m.descendingKeySet().iterator();
}
// 返回TreeSet的大小
public int size() {
return m.size();
}
// 返回TreeSet是否為空
public boolean isEmpty() {
return m.isEmpty();
}
// 返回TreeSet是否包含對象(o)
public boolean contains(Object o) {
return m.containsKey(o);
}
// 添加e到TreeSet中
public boolean add(E e) {
return m.put(e, PRESENT)==null;
}
// 刪除TreeSet中的對象o
public boolean remove(Object o) {
return m.remove(o)==PRESENT;
}
// 清空TreeSet
public void clear() {
m.clear();
}
// 將集合c中的全部元素添加到TreeSet中
public boolean addAll(Collection<? extends E> c) {
// Use linear-time version if applicable
if (m.size()==0 && c.size() > 0 &&
c instanceof SortedSet &&
m instanceof TreeMap) {
//把C集合強制轉換為SortedSet集合
SortedSet<? extends E> set = (SortedSet<? extends E>) c;
//把m集合強制轉換為TreeMap集合
TreeMap<E,Object> map = (TreeMap<E, Object>) m;
Comparator<? super E> cc = (Comparator<? super E>) set.comparator();
Comparator<? super E> mc = map.comparator();
//如果cc和mc兩個Comparator相等
if (cc==mc || (cc != null && cc.equals(mc))) {
//把Collection中所有元素添加成TreeMap集合的key
map.addAllForTreeSet(set, PRESENT);
return true;
}
}
return super.addAll(c);
}
// 返回子Set,實際上是通過TreeMap的subMap()實現的。
public NavigableSet<E> subSet(E fromElement, boolean fromInclusive,
E toElement, boolean toInclusive) {
return new TreeSet<E>(m.subMap(fromElement, fromInclusive,
toElement, toInclusive));
}
// 返回Set的頭部,范圍是:從頭部到toElement。
// inclusive是是否包含toElement的標志
public NavigableSet<E> headSet(E toElement, boolean inclusive) {
return new TreeSet<E>(m.headMap(toElement, inclusive));
}
// 返回Set的尾部,范圍是:從fromElement到結尾。
// inclusive是是否包含fromElement的標志
public NavigableSet<E> tailSet(E fromElement, boolean inclusive) {
return new TreeSet<E>(m.tailMap(fromElement, inclusive));
}
// 返回子Set。范圍是:從fromElement(包括)到toElement(不包括)。
public SortedSet<E> subSet(E fromElement, E toElement) {
return subSet(fromElement, true, toElement, false);
}
// 返回Set的頭部,范圍是:從頭部到toElement(不包括)。
public SortedSet<E> headSet(E toElement) {
return headSet(toElement, false);
}
// 返回Set的尾部,范圍是:從fromElement到結尾(不包括)。
public SortedSet<E> tailSet(E fromElement) {
return tailSet(fromElement, true);
}
// 返回Set的比較器
public Comparator<? super E> comparator() {
return m.comparator();
}
// 返回Set的第一個元素
public E first() {
return m.firstKey();
}
// 返回Set的最后一個元素
public E first() {
public E last() {
return m.lastKey();
}
// 返回Set中小于e的最大元素
public E lower(E e) {
return m.lowerKey(e);
}
// 返回Set中小于/等于e的最大元素
public E floor(E e) {
return m.floorKey(e);
}
// 返回Set中大于/等于e的最小元素
public E ceiling(E e) {
return m.ceilingKey(e);
}
// 返回Set中大于e的最小元素
public E higher(E e) {
return m.higherKey(e);
}
// 獲取第一個元素,并將該元素從TreeMap中刪除。
public E pollFirst() {
Map.Entry<E,?> e = m.pollFirstEntry();
return (e == null)? null : e.getKey();
}
// 獲取最后一個元素,并將該元素從TreeMap中刪除。
public E pollLast() {
Map.Entry<E,?> e = m.pollLastEntry();
return (e == null)? null : e.getKey();
}
// 克隆一個TreeSet,并返回Object對象
public Object clone() {
TreeSet<E> clone = null;
try {
clone = (TreeSet<E>) super.clone();
} catch (CloneNotSupportedException e) {
throw new InternalError();
}
clone.m = new TreeMap<E,Object>(m);
return clone;
}
// java.io.Serializable的寫入函數
// 將TreeSet的“比較器、容量,所有的元素值”都寫入到輸出流中
private void writeObject(java.io.ObjectOutputStream s)
throws java.io.IOException {
s.defaultWriteObject();
// 寫入比較器
s.writeObject(m.comparator());
// 寫入容量
s.writeInt(m.size());
// 寫入“TreeSet中的每一個元素”
for (Iterator i=m.keySet().iterator(); i.hasNext(); )
s.writeObject(i.next());
}
// java.io.Serializable的讀取函數:根據寫入方式讀出
// 先將TreeSet的“比較器、容量、所有的元素值”依次讀出
private void readObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
// Read in any hidden stuff
s.defaultReadObject();
// 從輸入流中讀取TreeSet的“比較器”
Comparator<? super E> c = (Comparator<? super E>) s.readObject();
TreeMap<E,Object> tm;
if (c==null)
tm = new TreeMap<E,Object>();
else
tm = new TreeMap<E,Object>(c);
m = tm;
// 從輸入流中讀取TreeSet的“容量”
int size = s.readInt();
// 從輸入流中讀取TreeSet的“全部元素”
tm.readTreeSet(size, s, PRESENT);
}
// TreeSet的序列版本號
private static final long serialVersionUID = -2479143000061671589L;
}
從上述可以看出,TreeSet的構造函數都是通過新建一個TreeMap作為實際存儲Set元素的容器。因此得出結論: TreeSet的底層實際使用的存儲容器就是TreeMap。
對于TreeMap而言,它采用一種被稱為”紅黑樹”的排序二叉樹來保存Map中每個Entry。每個Entry被當成”紅黑樹”的一個節(jié)點來對待。
對于如下代碼:
TreeMap<String,Double> map = new TreeMap<String,Double>();
map.put("ccc",89.0);
map.put("aaa",80.0);
map.put("bbb",89.0);
map.put("bbb",89.0);
如上代碼所示,程序向TreeMap放入四個值。根據”紅黑樹”的定義,程序會把”ccc,89.0”這個Entry做為該”紅黑數”的根節(jié)點,然后執(zhí)行put(“aaa”,”80.0”)時會將其作為新的節(jié)點添加到已存在的紅黑樹中。也就是說,以后每次向TreeMap中放入一個key-value對,系統(tǒng)都需要將Entry當成一個新的節(jié)點,添加到存在的”紅黑樹”中,通過這種方式就可以保證TreeMap中所有的key都是按一定順序地排列的。
由于TreeMap底層采用一顆”紅黑樹”來保存集合中的Entry。所以TreeMap添加元素,取出元素的性能都比HashMap低。當TreeMap添加元素時,需要通過循環(huán)找到新增的Entry的插入位置,因為比較耗性能。當取出元素時,也需要通過循環(huán)才能找到合適的Entry一樣比較耗性能。但并不是說TreeMap性能低于HashMap就一無是處,TreeMap中的所有Entry總是按key根據指定的排序規(guī)則保持有序狀態(tài)。
備注:紅黑樹是一種自平衡二叉查找樹 , 它們當中每一個節(jié)點的比較值都必須大于或等于在它的左子樹中的所有節(jié)點,并且小于或等于在它的右子樹中的所有節(jié)點。這確保紅黑樹運作時能夠快速的在樹中查找給定的值。
現在我們來觀察TreeMap的put(K key,V value)方法,該方法將Entry放入TreeMap的Entry鏈,并維護該Entry鏈的有序狀態(tài)。下面列出源碼:
public V put(K key, V value) {
//定義一個t來保存根元素
Entry<K,V> t = root;
//如果t==null,表明是一個空鏈表
if (t == null) {
//如果根節(jié)點為null,將傳入的鍵值對構造成根節(jié)點(根節(jié)點沒有父節(jié)點,所以傳入的父節(jié)點為null)
root = new Entry<K,V>(key, value, null);
//設置該集合的size為1
size = 1;
//修改此時+1
modCount++;
return null;
}
// 記錄比較結果
int cmp;
Entry<K,V> parent;
// 分割比較器和可比較接口的處理
Comparator<? super K> cpr = comparator;
// 有比較器的處理,即采用定制排序
if (cpr != null) {
// do while實現在root為根節(jié)點移動尋找傳入鍵值對需要插入的位置
do {
//使用parent上次循環(huán)后的t所引用的Entry
// 記錄將要被摻入新的鍵值對將要節(jié)點(即新節(jié)點的父節(jié)點)
parent = t;
// 使用比較器比較父節(jié)點和插入鍵值對的key值的大小
cmp = cpr.compare(key, t.key);
// 插入的key較大
if (cmp < 0)
t = t.left;
// 插入的key較小
else if (cmp > 0)
t = t.right;
// key值相等,替換并返回t節(jié)點的value(put方法結束)
else
return t.setValue(value);
} while (t != null);
}
// 沒有比較器的處理
else {
// key為null拋出NullPointerException異常
if (key == null)
throw new NullPointerException();
Comparable<? super K> k = (Comparable<? super K>) key;
// 與if中的do while類似,只是比較的方式不同
do {
parent = t;
cmp = k.compareTo(t.key);
if (cmp < 0)
t = t.left;
else if (cmp > 0)
t = t.right;
else
return t.setValue(value);
} while (t != null);
}
// 沒有找到key相同的節(jié)點才會有下面的操作
// 根據傳入的鍵值對和找到的“父節(jié)點”創(chuàng)建新節(jié)點
Entry<K,V> e = new Entry<K,V>(key, value, parent);
// 根據最后一次的判斷結果確認新節(jié)點是“父節(jié)點”的左孩子還是又孩子
if (cmp < 0)
parent.left = e;
else
parent.right = e;
// 對加入新節(jié)點的樹進行調整
fixAfterInsertion(e);
// 記錄size和modCount
size++;
modCount++;
// 因為是插入新節(jié)點,所以返回的是null
return null;
}
上面程序中的兩個do…while就是實現”排序二叉樹”的關鍵算法。每當程序希望添加新節(jié)點時,總是從樹的根節(jié)點開始比較,即將根節(jié)點當成當前節(jié)點。
- 如果新增節(jié)點大于當前節(jié)點且當前節(jié)點的右子節(jié)點存在,則以右子節(jié)點作為當前節(jié)點。并繼續(xù)循環(huán)
- 如果新增節(jié)點小于當前節(jié)點且當前節(jié)點的左子節(jié)點存在,則以左子節(jié)點作為當前節(jié)點。并繼續(xù)循環(huán)
- 如果新增節(jié)點等于當前節(jié)點,則新增節(jié)點覆蓋當前節(jié)點,并結束循環(huán)。
當TreeMap根據key來取出value時,TreeMap對應的方法如下:
public V get(Object key) {
//根據key取出Entry
Entry<K,V> p = getEntry(key);
//取出Entry所包含的value
return (p==null ? null : p.value);
}
現在我們可以知道,其實get(Object key)方法實質上是由getEntry()方法實現的?,F在我們來看getEntry(Object key)的源碼:
final Entry<K,V> getEntry(Object key) {
// 如果有比較器,返回getEntryUsingComparator(Object key)的結果
if (comparator != null)
return getEntryUsingComparator(key);
// 查找的key為null,拋出NullPointerException
if (key == null)
throw new NullPointerException();
// 如果沒有比較器,而是實現了可比較接口
//將key強制轉換為Comparable接口
Comparable<? super K> k = (Comparable<? super K>) key;
// 獲取根節(jié)點
Entry<K,V> p = root;
// 從根節(jié)點開始對樹進行遍歷查找節(jié)點
while (p != null) {
// 把key和當前節(jié)點的key進行比較
int cmp = k.compareTo(p.key);
// key小于當前節(jié)點的key
if (cmp < 0)
// p “移動”到左節(jié)點上
p = p.left;
// key大于當前節(jié)點的key
else if (cmp > 0)
// p “移動”到右節(jié)點上
p = p.right;
// key值相等則當前節(jié)點就是要找的節(jié)點
else
// 返回找到的節(jié)點
return p;
}
// 沒找到則返回null
return null;
}
getEntry(Object obj)方法也是充分利用排序二叉樹的特性來搜索目標Entry。程序依然從二叉數的根節(jié)點開始,如果被搜索節(jié)點大于當前節(jié)點,程序向”右子樹”搜索,如果小于,則向”左子樹”搜索。如果相等則說明找到了指定節(jié)點。
我們觀察到當該TreeMap采用了定制排序。在采用定制排序的方式下,TreeMap采用getEntryUsingComparator(key)方法來根據key獲取Entry。
final Entry<K,V> getEntryUsingComparator(Object key) {
K k = (K) key;
// 獲取比較器
Comparator<? super K> cpr = comparator;
// 其實在調用此方法的get(Object key)中已經對比較器為null的情況進行判斷,這里是防御性的判斷
if (cpr != null) {
// 獲取根節(jié)點
Entry<K,V> p = root;
// 遍歷樹
while (p != null) {
// 獲取key和當前節(jié)點的key的比較結果
int cmp = cpr.compare(k, p.key);
// 查找的key值較小
if (cmp < 0)
// p“移動”到左孩子
p = p.left;
// 查找的key值較大
else if (cmp > 0)
// p“移動”到右節(jié)點
p = p.right;
// key值相等
else
// 返回找到的節(jié)點
return p;
}
}
// 沒找到key值對應的節(jié)點,返回null
return null;
}
其實getEntry()和getEntryUsingComparator()這兩個方法實現思路幾乎完全類似。只是前者對自然排序的TreeMap獲取有效,后者對定制排序的TreeMap有效。
通過上述源碼其實不難看出,TreeMap這個工具類的實現其實很簡單?;蛘哒f,從本質上來說TreeMap就是一棵”紅黑樹”,每個Entry就是一個節(jié)點。
總結
1、不能有重復的元素;
2、具有排序功能;
3、TreeSet中的元素必須實現Comparable接口并重寫compareTo()方法,TreeSet判斷元素是否重復 、以及確定元素的順序 靠的都是這個方法;
①對于Java類庫中定義的類,TreeSet可以直接對其進行存儲,如String,Integer等,因為這些類已經實現了Comparable接口);
②對于自定義類,如果不做適當的處理,TreeSet中只能存儲一個該類型的對象實例,否則無法判斷是否重復。
4、依賴TreeMap。
5、相對HashSet,TreeSet的優(yōu)勢是有序,劣勢是相對讀取慢。根據不同的場景選擇不同的集合。