Java流庫(kù)(java.util.stream)
流提供了一種讓我們可以在比集合更高的概念級(jí)別上指定計(jì)算的數(shù)據(jù)視圖。通過(guò)使用流,我們可以說(shuō)明想要完成什么任務(wù),而不是說(shuō)明如何去實(shí)現(xiàn)它。(這一點(diǎn)受益于lambda表達(dá)式)我們將操作的調(diào)度留給具體的實(shí)現(xiàn)去解決。
流大量的用到了lambda表達(dá)式(同根生于Java8)之后的篇幅將會(huì)說(shuō)到lambda表達(dá)式
一、 流的特點(diǎn)
流的特點(diǎn)
- 流并不儲(chǔ)存元素。這些元素可能存儲(chǔ)在底層的集合中,或這是按需生成。
- 流的操作不會(huì)修改其數(shù)據(jù)源。例如,filter方法不會(huì)從新的流中移除元素,而是會(huì)生成一個(gè)新的流,其中不包含被過(guò)濾掉的元素。
- 流的操作是盡可能惰性執(zhí)行的。這意味著直至需要其結(jié)果時(shí),操作才會(huì)執(zhí)行。例如如果我們只想查找前5個(gè)長(zhǎng)單詞(長(zhǎng)度大于x的String)而不是所有長(zhǎng)單詞,那么filter方法就會(huì)在匹配到第5個(gè)單詞后停止過(guò)濾。因此,我們甚至可以創(chuàng)建無(wú)限流。
典型流程
- 創(chuàng)建一個(gè)流。
- 指定將初始流轉(zhuǎn)換為其他流的中間操作,可能包含多個(gè)步驟。
- 應(yīng)用終止操作,從而產(chǎn)生結(jié)果。這個(gè)操作會(huì)強(qiáng)制執(zhí)行之前的惰性操作。從此之后,這個(gè)流就再也不能用了。
二、 流的創(chuàng)建
JavaAPI中有大量方法都可以產(chǎn)生流
API
-
java.util.Stream<T> 8自身產(chǎn)生流的方法(需要通過(guò)現(xiàn)有流對(duì)象)-
Stream<T> filter(Predicate<? super T> p)產(chǎn)生一個(gè)流,其中包含當(dāng)前流中滿足p的所有元素
這里的Predicate<? super T> 非常靈性,保證了傳入的p對(duì)象中的
boolean test(T t);方法一定能接受流中的每個(gè)元素。因?yàn)楸WC了Predicate<T>中的T是Stream<T>的超類。 -
Long count()產(chǎn)生當(dāng)前流中元素的數(shù)量。這是一個(gè)終止操作。(嚴(yán)格上不算創(chuàng)建)
java.util.Collection 1.2的default方法 default Stream<E> stream()-
default Stream<E> parallelStream()產(chǎn)生當(dāng)前集合中所有元素的順序流或者并行流。
-
-
java.util.Stream 8的一些靜態(tài)方法-
static <T> Stream<T> of(T... values)產(chǎn)生一個(gè)元素為給定值的流。
-
static <T> Stream<T> empty()產(chǎn)生一個(gè)不包含任何元素的流。
-
static <T> Stream<T> generate(Supplier<T> s)產(chǎn)生一個(gè)無(wú)限流,它的值是通過(guò)反復(fù)調(diào)用函數(shù)s而構(gòu)建的。
-
static <T> Stream<T> iterate(T seed, UnaryOperator<T> f)產(chǎn)生一個(gè)無(wú)限流,他的元素包含種子、在種子上調(diào)用f產(chǎn)生的值、在前一個(gè)元素上調(diào)用f產(chǎn)生的值,等等。
-
-
java.util.Arrays 1.2的靜態(tài)方法-
static <T> Stream<T> stream(T[] array, int startInclusive, int endExclusive) 8產(chǎn)生一個(gè)流,他的元素是由數(shù)組中指定范圍內(nèi)的元素構(gòu)成的。
-
-
java.util.regex.Pattern 1.4的靜態(tài)方法-
Stream<String> splitAsStream(CharSequence input) 8產(chǎn)生一個(gè)流,它的元素是輸入中由該模式界定的部分。
-
-
java.nio.file.Files 7static Stream<String> lines(Path path) 8-
static Stream<String> lines(Path path, Charset cs) 8產(chǎn)生一個(gè)流,它的元素是只定文件中的行,該文件的字符集為UTF-8,或者為指定的字符集。
-
java.util.function.Supplier<T> 8-
T get()提供一個(gè)值。
-
三、 filter、map和flatMap方法
流的轉(zhuǎn)換會(huì)產(chǎn)生一個(gè)新的流,它的元素派生自另一個(gè)流中的元素。
filter:filter轉(zhuǎn)換會(huì)產(chǎn)生一個(gè)流,它的元素與某種條件相匹配。filter的引元是Predicate<T> ,即從T到boolean的函數(shù)。
map:通常,我們想要按照某種方式來(lái)轉(zhuǎn)換流中的值,此時(shí),可以使用map方法并傳遞執(zhí)行該轉(zhuǎn)換的函數(shù)。
flatMap:見(jiàn)名之意,這是map方法的變種,可以將所有結(jié)果生成(攤平)在一個(gè)流里。即如果是在map方法中返回Stream<Stream<T>>,可以使用flatMap得到結(jié)果Stream<T>
APIjava.util.stream.Stream 8
-
Stream<T> filter(Predicate<? super T> predicate)產(chǎn)生一個(gè)流,它包含當(dāng)前流中所有滿足斷言條件的元素。
-
<R> Stream<R> map (Function<? super T,? extends R> mapper)產(chǎn)生一個(gè)流,它包含將mapper應(yīng)用于當(dāng)前流中所有元素產(chǎn)生的結(jié)果。
注1:如果返回值是流,則返回流的流(準(zhǔn)確來(lái)說(shuō)返回R就是R的流)
注2:R和T的意思。R為返回值,所以返回值需要是R的子類。T是入?yún)ⅲㄔ蠸tream<T>中的T類型),所以接受參數(shù)需要是T的超類
-
<R> Stream<R> flatMap (Function<? super T,? extends Stream<? extends R>> mapper)產(chǎn)生一個(gè)流,它是通過(guò)將mapper應(yīng)用于當(dāng)前流中所有元素所產(chǎn)生的結(jié)果連接到一起而獲得的。
注意:這里的每個(gè)結(jié)果都是一個(gè)流。
四、 抽取子流和連接流
調(diào)用stream.limit(n)會(huì)返回一個(gè)新的流,它在n個(gè)元素之后結(jié)束。(如果原來(lái)的流更短,那么就會(huì)在流結(jié)束時(shí)結(jié)束)。這個(gè)方法對(duì)于裁剪無(wú)限流的尺寸會(huì)顯得特別有用。
例如:
Stream<Double> stream = Stream.generate(Math::random).limit(100L);
stream.forEach(System.out::println);
調(diào)用stream.skip(n)正好相反:它會(huì)丟棄前n個(gè)元素。
例如:取前200自然數(shù),然后去掉前100個(gè)
Stream<Integer> stream = Stream.iterate(1, (n)->n+1);
stream = stream.limit(200).skip(100);
stream.forEach(System.out::println);
我們可以用Stream類的靜態(tài)方法concat方法將兩個(gè)流連接起來(lái)
例如:
Stream<? extends Object> result = Stream.concat(stream, stream2);
result.forEach(System.out::println);
注意:第一個(gè)流不應(yīng)該是無(wú)限的,否則第二個(gè)流永遠(yuǎn)都不會(huì)得到處理的機(jī)會(huì)。
API java.util.stream.Stream 8
-
Stream<T> limit(Long maxSize)產(chǎn)生一個(gè)流,其中包含了當(dāng)前流中最初的maxSize個(gè)元素。
-
Stream<T> skip(Long n)產(chǎn)生一個(gè)流,它的元素時(shí)當(dāng)前流中除了前n個(gè)元素之外的所有元素。
-
static <T> Stream<T> concat(Stream<? extends T> a, Stream<? extends T> b)產(chǎn)生一個(gè)流,它的元素時(shí)a的元素后面跟著b的元素。
五、 其他的流轉(zhuǎn)換
一、 流的去重,distinct方法,它的元素是從原有流中產(chǎn)生的,即原來(lái)的元素按照同樣的順序剔除重復(fù)元素后產(chǎn)生的。這個(gè)流顯然能夠記住它已經(jīng)看到的元素
二、 流的排序,有多種sorted方法的變體可用。其中一種用于操作Comparable元素的流,而另一種可以接受一個(gè)Comparator。
三、 peek方法,peek方法會(huì)產(chǎn)生一個(gè)流,它的元素與原來(lái)流中的元素相同,但是在每次獲取一個(gè)元素時(shí),都會(huì)調(diào)用一個(gè)函數(shù)(你傳入peek的函數(shù)Consumer<T>類型)。
API java.util.stream.Stream 8
-
Stream<T> distinct()產(chǎn)生一個(gè)流,包含當(dāng)前流中所有不同元素。
Stream<T> sorted()-
Stream<T> sorted(Comparator<? super T> comparator)產(chǎn)生一個(gè)流,它的元素時(shí)當(dāng)前流中的所有元素按照順序排列的。第一個(gè)方法要求元素是實(shí)現(xiàn)了Comparable類的實(shí)例。
-
Stream<T> peek(Comsumer<? super T> action)產(chǎn)生一個(gè)流,它與當(dāng)前流中的元素相同,在獲取其中每個(gè)元素時(shí),會(huì)見(jiàn)其傳遞給action。
六、 簡(jiǎn)單約簡(jiǎn)(重要)
約簡(jiǎn)是一種終結(jié)操作(terminal operation),它們會(huì)將流約簡(jiǎn)為可以在程序中使用的非流值
API java.util.stream.Stream 8
Optional<T> max(Comparator<? super T> comparator)-
Optional<T> min(Comparator<? super T> comparator)分別產(chǎn)生這個(gè)流的最大元素和最小元素,使用由給定比較器定義的排序規(guī)則,如果這個(gè)流為空,會(huì)產(chǎn)生一個(gè)空的Optional對(duì)象。這些操作都是終結(jié)操作。
Optional<T> findFirst()-
Optional<T> findFirst()分別產(chǎn)生這個(gè)流的第一個(gè)和任意一個(gè)元素,如果這個(gè)流為空,會(huì)產(chǎn)生一個(gè)空的Optional對(duì)象。這些操作都是中介操作。
boolean anyMatch(Predicate<? super T> predicate)boolean allMatch(Predicate<? super T> predicate)-
boolean noneMatch(Predicate<? super T> predicate)分別在這個(gè)流中任意元素、所有元素和沒(méi)有任何元素匹配給定斷言時(shí)返回true。這些操作都是終結(jié)操作。
七、 收集結(jié)果
API
-
java.util.stream.BaseStream 8-
Iterator<T> oteratpr()產(chǎn)生一個(gè)獲取當(dāng)前流中的各個(gè)元素的迭代器。這是一種終結(jié)操作。
-
-
java.util.stream.Stream 8-
void forEach(Consumer<? super T> action)在流的每個(gè)元素上調(diào)用action。這是一種終結(jié)操作。
Object[] toArray()-
<A> A[] toArray(IntFunction<A[]> generator)產(chǎn)生一個(gè)對(duì)象數(shù)組,或者在將引用A[]::new傳遞給構(gòu)造器時(shí),返回一個(gè)A類型的數(shù)組。這些都是終結(jié)操作。
-
<R,A> R collect(Collector<? super T,A,R> collector)使用給定的收集器來(lái)收集當(dāng)前流中的元素。Collectors類有用于多種收集齊的工廠方法。例如
Set<Integer> set = stream.collect(Collectors.toSet()); TreeSet<Integer> treeSet = stream.collect(Collectors.toCollection(TreeSet::new)); // 第二種方法可以控制獲得的集的種類
-
-
java.util.stream.Collectors 8注:Collectors全部是static方法,建議使用靜態(tài)導(dǎo)入
static <T> Collector<T,?,List<T>> toList()-
static <T> Collector<T,?,Set<T>> toSet()產(chǎn)生一個(gè)將元素收集到列表或集中的收集器。
-
static <T,C extends Collection<T>> Collector<T,?,C> toCollection(Supplier<C> collectionFactory)產(chǎn)生一個(gè)將元素收集到任意集合中早的收集器。可以傳遞一個(gè)諸如
TreeSet::new的構(gòu)造引用。 static Collector<CharSequence,?,String> joining()static Collector<CharSequence,?,String> joining(CharSequence delimiter)-
static Collector<CharSequence,?,String> joining(CharSequence delimiter,CharSequence prefix,CharSequence suffix)產(chǎn)生一個(gè)連接字符串的收集齊。分隔符會(huì)置于字符串之間,而第一個(gè)字符串之前可以有前綴,最后一個(gè)字符串之后可以有后綴。如果沒(méi)有指定,那么它們都為空。
static <T> Collector<T,?,IntSummaryStatistics> summarizingInt(ToIntFunction<? super T> mapper)static <T> Collector<T,?,LongSummaryStatistics> summarizingInt(ToLongFunction<? super T> mapper)-
static <T> Collector<T,?,DoubleSummaryStatistics> summarizingInt(ToDoubleFunction<? super T> mapper)產(chǎn)生能夠生成(Int|Long|Double)SummaryStatistics對(duì)象的收集齊,通過(guò)它可以獲得將mapper應(yīng)用于每個(gè)元素后產(chǎn)生結(jié)果的個(gè)數(shù)、總和、平均值、最大值和最小值。例如:
Stream<Double> stream = Stream.generate(Math::random).limit(100L); DoubleSummaryStatistics summary = stream.collect(Collectors.summarizingDouble((D)->D*10)); summary.getAverage(); summary.getCount(); summary.getMax(); summary.getMin(); summary.getSum();
-
IntSummaryStatistics 8LongSummaryStatistics 8DoubleSummaryStatistics 8-
Long getCount()產(chǎn)生匯總后的元素個(gè)數(shù)。
(int|long|double) getSum()-
double getAverage()產(chǎn)生匯總后元素的總和或平均值,或者在沒(méi)有任何元素時(shí)返回0。
(int|long|double) getMax()-
(int|long|double) getMin()產(chǎn)生匯總后的元素的最大值和最小值,或者在沒(méi)有任何元素時(shí),產(chǎn)生(Integer|Long|Double).(MAX|MIN)_VALUE。
-
八、 收集到映射表中(Map)
API java.util.stream.Collectors 8
static<T,K,U,M extends Map<K,U>> Collector<T,?,M> toMap(Function<? supper T,? extends K> keyMapper, Function<? super T,? extends U> valueMapper, BinaryOperator<U> mergeFunction, Supplier<M> mapSupplier)-
static<T,K,U,M extends ConcurrentMap<K,U>> Collector<T,?,M> toConcurrentMap(Function<? supper T,? extends K> keyMapper, Function<? super T,? extends U> valueMapper, BinaryOperator<U> mergeFunction, Supplier<M> mapSupplier)產(chǎn)生一個(gè)收集器,它會(huì)產(chǎn)生一個(gè)映射表(Map)或并發(fā)映射表(ConcurrentMap)。keyMapper和valueMapper函數(shù)會(huì)應(yīng)用到每個(gè)收集到的元素上,從而在所產(chǎn)生的映射表中生成一個(gè)鍵/值項(xiàng)。默認(rèn)情況下,當(dāng)兩個(gè)元素產(chǎn)生相同的鍵時(shí),會(huì)拋出一個(gè)IllegalStateException異常。你可以提供一個(gè)mergeFunction來(lái)合并具有相同鍵的值。默認(rèn)情況下,其結(jié)果是一個(gè)HashMap或ConcurrentHashMap。你可以提供一個(gè)mapSupplier,它會(huì)產(chǎn)生所期望的映射表實(shí)例。
注,最后的兩個(gè)參數(shù)(mergeFunction,mapSupplier)可以沒(méi)有,API中也提供了沒(méi)有這倆個(gè)參數(shù)的函。
九、 群組和分區(qū)
API java.util.stream.Collectors 8
static <T,K> Collector<T,?,Map<K,List<T>>> groupingBy(Function<? super T,? extends K> classifier)-
static <T,K> Collector<T,?,ConcurrentMap<K,List<T>>> groupingByConcurrent(Function<? super T,? extends K> classifier)產(chǎn)生一個(gè)收集器,它會(huì)產(chǎn)生一個(gè)映射表或并發(fā)映射表,其鍵是將classifier應(yīng)用于所有收集到的元素上所產(chǎn)生的結(jié)果,而值是由具有相同鍵的元素構(gòu)成的一個(gè)個(gè)列表。
-
static <T> Collector<T,?,Map<Boolean,List<T>>> partitioningBy(Preditcate<? super T> predicate)產(chǎn)生一個(gè)收集器,它會(huì)產(chǎn)生一個(gè)映射表,其鍵是true/false,而值是由滿足/不滿足斷言的元素構(gòu)成的列表。
十、 下游收集器
Collectors提供了很多強(qiáng)大的功能,其中下游收集器可以讓我們輕松(可能吧)地處理下游數(shù)據(jù)(Map<K,V>中的V)
作為下游收集器,可以直接在groupingBy方法中使用,例如:
Stream<Double> stream = Stream.generate(Math::random).limit(10000L).map((k)->k*10);
Map<Integer, Long> collect = stream.collect(Collectors.groupingBy((k)->{return k.intValue();},Collectors.counting()));
collect.forEach((k,v)->System.out.println("K:"+k+" V:"+v));
API java.util.stream.Collectors 8
-
static <T> Collector<T,?,Long> counting()產(chǎn)生一個(gè)可以對(duì)收集到的元素進(jìn)行計(jì)數(shù)的收集器。
static<T> Cikkectir<T,?,Integer> summingInt(ToIntFunction<? super T> mapper)static<T> Cikkectir<T,?,Long> summingLong(ToLongFunction<? super T> mapper)-
static<T> Cikkectir<T,?,Double> summingDouble(ToIntFunction<? super T> mapper)產(chǎn)生一個(gè)收集器,對(duì)將mapper應(yīng)用到收集到的元素上之后產(chǎn)生的值計(jì)算總和。
例如:
Map<Integer, Integer> collect2 = stream.collect(Collectors.groupingBy((k)->{return k.intValue();},Collectors.summingInt((k)->k.intValue()))); collect2.forEach((k,v)->System.out.println("K:"+k+" V:"+v)); // 這將產(chǎn)生以0-9分開(kāi)的10各組,v為每個(gè)組中所有數(shù)的合 static <T> Collector<T,?,Optional<T>> maxBy(Comparator<? super T> comparator)-
static <T> Collector<T,?,Optional<T>> minBy(Comparator<? super T> comparator)產(chǎn)生一個(gè)收集器,使用comparator指定的排序方法,計(jì)算收集到的元素中的最大值和最小值。
-
static <T,U,A,R> Collector<T,?,R> mapping(Function<? super T,? extends U> mapper, Collector<? super U,A,R> downstream)產(chǎn)生一個(gè)收集器,它會(huì)產(chǎn)生一個(gè)映射表,其鍵是將mapper應(yīng)用到收集到的數(shù)據(jù)上而產(chǎn)生的,其值是使用downstream收集器收集到的具有相同鍵的元素。
十一、 約簡(jiǎn)操作
reduce方法是一種用于從流中計(jì)算某個(gè)值的通用機(jī)制,其最簡(jiǎn)單的形式將接受一個(gè)二元函數(shù),并從前兩個(gè)元素開(kāi)始持續(xù)應(yīng)用它。
注意:如果收集操作是并行的,reduce就不是線程安全的,小心使用。
API java.util.stream.Stream 8
Optional<T> reduce(BinaryOperator<T> accumulator)T reduce(T identity, BinaryOperator<T> accumulator)-
<U> U reduce(U identity,BiFunction<U, ? super T, U> accumulator,BinaryOperator<U> combiner)注意:如果reduce是并行流,那么reduce會(huì)產(chǎn)生多個(gè)結(jié)果,需要提供第二個(gè)函數(shù)(組合器)將結(jié)果合并。
用給定的accumulator函數(shù)產(chǎn)生流中元素的積累總和。如果提供了幺元,那么第一個(gè)被累計(jì)的元素就是該幺元。如果提供了組合器,那么它可以用來(lái)將分別累計(jì)的各個(gè)部分整合成總和。例如:
int result = words.reduce(0,(total,word)->total+word.length(), (total1, total2)->total1+total2); -
<R> R collect(Supplier<R> supplier, BiConsumer<R, ? super T> accumulator, BiConsumer<R, R> combiner)將元素收集到類型R的結(jié)果中。在每個(gè)部分上,都會(huì)調(diào)用cupplier來(lái)提供初始結(jié)果,調(diào)用accumulator來(lái)交替的將元素添加到結(jié)果中,并調(diào)用combiner來(lái)整合兩個(gè)結(jié)果。