Java8 Lambda(三)-强大的collect操作
collect
应该说是Stream
中最强大的终端操作了,使用其几乎能得到你想要的任意数据的聚合,下面好好分析该工具的用法.
在Stream接口中有如下两个方法
1 | <R> R collect(Supplier<R> supplier, |
很明显第一种相当于简易实现版本,第二种为高级用法.更多更复杂的操作都封装到Collector接口中,并提供一些静态方法供使用者调用.下面逐一分析.
简易调用形式
简易调用形式就是第一种接口,接口如下
1 | <R> R collect(Supplier<R> supplier, |
调用方式如下,很明显第一个参数supplier
为结果存放容器,第二个参数accumulator
为结果如何添加到容器的操作,第三个参数combiner
则为多个容器的聚合策略.
1 | String concat = stringStream.collect(StringBuilder::new, StringBuilder::append,StringBuilder::append).toString(); |
那么换一种,我想对一个List
1 | // 由于基本类型都是不可变类型,所以这里用数组当做容器 |
那么再换一种,有一个Person
类,其拥有type与name两个属性,那么使用collect
把他收集到Map集合中,其中键为type,值为person的集合.如下代码所示,看明白了相信就掌握了该方法.
1 | Lists.<Person>newArrayList().stream() |
Collector高级调用
Collector
接口是使得collect
操作强大的终极武器,对于绝大部分操作可以分解为旗下主要步骤,提供初始容器->加入元素到容器->并发下多容器聚合->对聚合后结果进行操作,同时Collector
接口又提供了of
静态方法帮助你最大化的定制自己的操作,官方也提供了Collectors
这个类封装了大部分的常用收集操作.
另外CollectorImpl
为Collector
的实现类,因为接口不可实例化,这里主要完成实例化操作.
1 | //初始容器 |
Collectors的方法封装
Collectors
作为官方提供的收集工具类,那么其很多操作都具有参考性质,能帮助我们更加理解Collector
接口,万变不离其宗,最终只是上面五个函数接口的混合操作,下面来分析下官方是如何使用这几个接口的.
toList()
容器: ArrayList::new
加入容器操作: List::add
多容器合并: left.addAll(right); return left;
聚合后的结果操作: 这里直接返回,因此无该操作,默认为castingIdentity()
优化操作状态字段: CH_ID
这样看起来很简单,那么对于Map,Set等操作都是类似的实现.
1 | public static <T> |
joining()
容器: StringBuilder::new
加入容器操作: StringBuilder::append
多容器合并: r1.append(r2); return r1;
聚合后的结果操作: StringBuilder::toString
优化操作状态字段: CH_NOID
1 | public static Collector<CharSequence, ?, String> joining() { |
下面来个复杂的
groupingBy()
groupingBy
是toMap
的一种高级方式,弥补了toMap
对值无法提供多元化的收集操作,比如对于返回Map<T,List<E>>
这样的形式toMap
就不是那么顺手,那么groupingBy
的重点就是对Key和Value值的处理封装.分析如下代码,其中classifier
是对key值的处理,mapFactory
则是指定Map的容器具体类型,downstream
为对Value的收集操作,具体代码这里不做分析,无非是把值一个一个的put进指定容器.
1 | public static <T, K, D, A, M extends Map<K, D>> |
对于之前用原生collect
方法做的收集操作那么就可以很容易改写为groupBy形式
1 | //原生形式 |
reducing()
reducing
是针对单个值的收集,其返回结果不是集合家族的类型,而是单一的实体类T
容器: boxSupplier(identity)
,这里包裹用的是一个长度为1的Object[]数组,至于原因自然是不可变类型的锅
加入容器操作: a[0] = op.apply(a[0], t)
多容器合并: a[0] = op.apply(a[0], b[0]); return a;
聚合后的结果操作: 结果自然是Object[0]所包裹的数据a -> a[0]
优化操作状态字段: CH_NOID
那么看到这里困惑是不是有一种恍然大悟的感觉,反正我是有的.
1 | public static <T> Collector<T, ?, T> |
那么接下来就是对之前Collect的一些操作的改造
1 | //原生操作 |
可能遇到的问题
记录下生产中使用该工具遇到的一些小错误
toMap所产生的异常
toMap的操作主要如下代码,异常来自两个方面
- 操作调用的是
map.merge
方法,该方法遇到value为null的情况会报npe,即使你使用的是hashMap可以接受null值,也照样报.搞不懂这里为什么这样设计. - 未指定冲突合并策略,也就是第三个参数
BinaryOperator<U> mergeFunction
时遇到重复的key会直接抛IllegalStateException
,因此需要注意.
总结
到此对于collect
的操作应该就很清晰了,希望通过这些例子能掌握核心,也就是Collector
接口中那几个函数的作用,希望对你有帮助.
- 版权声明: 感谢您的阅读,本文由屈定's Blog版权所有。如若转载,请注明出处。
- 文章标题: Java8 Lambda(三)-强大的collect操作
- 文章链接: https://mrdear.cn/posts/java_stream3.html