Java8-10-Stream分组与分区详解

shengguo 发布于2019-08-16 10:57 / 1832人阅读

摘要：上一篇我们介绍了的概念与实际的一些操作，本篇我们继续来学习的另一个重要操作，分组与分区。注意到分组后的返回类型是，结果集中会将作为，对应的集合作为返回。

上一篇我们介绍了Strem的概念与实际的一些操作，本篇我们继续来学习Stream的另一个重要操作，分组与分区。
我们在上一篇介绍Stream的操作时，会经常使用到Collectors这个类，这个类实际上是一个封装了很多常用的汇聚操作的一个工厂类。我们之前用到过

//将结果汇聚到ArrayList中
Collectors.toList();

//将结果汇聚到HashSet中
Collectors.toSet();

以及更为通用的

//将结果汇聚到一个指定类型的集合中
Collectors.toCollection(Supplier collectionFactory);

Stream分组

在实际开发中，对于将一个集合的内容进行分组或分区这种需求也非常常见，所以我们继续学习下Collectors类中的groupingBy和partitioningBy方法。

public static Collector groupingBy(Function classifier){
    //...
}

groupingBy接收一个Function类型的变量classifier，classifier被称作分类器，收集器会按着classifier作为key对集合元素进行分组，然后返回Collector收集器对象，假如现在有一个实体Student

public class Student {
    private String name;
    private int score;
    private int age;

    public Student(String name,int score,int age){
        this.name = name;
        this.score = score;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getScore() {
        return score;
    }

    public void setScore(int score) {
        this.score = score;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }
}

我们现在按Student的name进行分组，如果使用sql来表示就是select * from student group by name; 再看下使用Stream的方式

Map> collect = students.stream().collect(Collectors.groupingBy(Student::getName));

这里我们使用方法引用（类名::实例方法名）替代lambda表达式（s -> s.getName()）的方式来指定classifier分类器，使集合按Student的name来分组。
注意到分组后的返回类型是Map>，结果集中会将name作为key，对应的Student集合作为value返回。
那如果按name分组后，想求出每组学生的数量，就需要借助groupingBy另一个重载的方法

public static Collector groupingBy(Function classifier,Collector downstream){
    //...
}

第二个参数downstream还是一个收集器Collector对象，也就是说我们可以先将classifier作为key进行分组，然后将分组后的结果交给downstream收集器再进行处理

//按name分组 得出每组的学生数量 使用重载的groupingBy方法，第二个参数是分组后的操作
Map collect1 = students.stream().collect(Collectors.groupingBy(Student::getName, Collectors.counting()));

Collectors类这里也帮我们封装好了用于统计数量的counting()方法，这里先了解一下counting()就是将收集器中元素求总数即可，后续我们会再深入源码学习。

我们还可以对分组后的数据求平均值

Map collect2 = students.stream().collect(Collectors.groupingBy(Student::getName, Collectors.averagingDouble(Student::getScore)));

averagingDouble方法接收一个ToDoubleFunction参数

@FunctionalInterface
public interface ToDoubleFunction {

    /**
     * Applies this function to the given argument.
     *
     * @param value the function argument
     * @return the function result
     */
    double applyAsDouble(T value);
}

ToDoubleFunction实际上也是Function系列函数式接口中的其中一个特例，接收一个参数，返回Double类型（这里是接收一个Student返回score）。因为分组后的集合中每个元素是Student类型的，所以我们无法直接对Student进行求平均值

//伪代码
Collectors.averagingDouble(Student))

所以需要将Student转成score再求平均值，Collectors.averagingDouble(Student::getScore))。

Stream分区

针对上面的Student，我们现在再加一个需求，分别统计一下及格和不及格的学生（分数是否>=60）
这时候符合Stream分区的概念了，Stream分区会将集合中的元素按条件分成两部分结果，key是Boolean类型，value是结果集，满足条件的key是true，我们看下示例。

Map> collect3 = students.stream().collect(Collectors.partitioningBy(student -> student.getScore() >= 60));
System.out.println(collect3.get(true));//输出及格的Student
System.out.println(collect3.get(false));//输出不及格的Student

partitioningBy方法接收一个Predicate作为分区判断的依据，满足条件的元素放在key为true的集合中，反之放在key为false的集合中

//partitioningBy方法
public static Collector partitioningBy(Predicate predicate) {
    return partitioningBy(predicate, toList());
}

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/70778.html

《从0到1学习Flink》—— Flink Data transformation(转换)

摘要：这些切片称为窗口。函数允许对常规数据流进行分组。通常，这是非并行数据转换，因为它在非分区数据流上运行。 showImg(https://segmentfault.com/img/remote/1460000017874226?w=1920&h=1271); 前言在第一篇介绍 Flink 的文章《《从0到1学习Flink》—— Apache Flink 介绍》中就说过 Flink ...

oujie 2019-08-16 14:24 评论0 收藏0

发表评论

登陆后可评论

0条评论

shengguo

男|高级讲师

我要关注我要私信

TA的文章

tomcat https

阅读 1989·2021-11-25 09:43
环境影响着一个人...最高月薪20K，想成为最优秀的人，就要向最优秀的人学习

阅读 1640·2021-09-02 15:21
我们来翻翻元素样式的族谱-getComputedStyle

阅读 3609·2019-08-30 15:52
一些问题

阅读 1637·2019-08-30 12:48
提升网站页面速度的14条最佳实践（二）

阅读 1454·2019-08-30 10:57
移动端H5页面中1px边框的几种解决方法

阅读 3067·2019-08-26 17:41
JS去重的几种实现方法

阅读 823·2019-08-26 11:59
for 循环 var 和 let

阅读 1505·2019-08-26 10:41

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

Java8-10-Stream分组与分区详解

相关文章

《从0到1学习Flink》—— Flink Data transformation(转换)

发表评论

0条评论

shengguo

男|高级讲师

TA的文章

tomcat https

环境影响着一个人...最高月薪20K，想成为最优秀的人，就要向最优秀的人学习

我们来翻翻元素样式的族谱-getComputedStyle

一些问题

提升网站页面速度的14条最佳实践（二）

移动端H5页面中1px边框的几种解决方法

JS去重的几种实现方法

for 循环 var 和 let

最新活动