资讯专栏INFORMATION COLUMN

Java8新特性第3章(Stream API)

andycall / 1457人阅读

摘要:另外,像这样生成值的操作和这样产生副作用的操作都是天然急性求值,因为它们必须要产生具体的结果。这样可以大大减少维持中间结果所带来的开销。现在我们需要筛选出含有平米以上房源的小区,并按照小区名排序。

转载请注明出处:https://zhuanlan.zhihu.com/p/20540202

Stream作为Java8的新特性之一,他与Java IO包中的InputStream和OutputStream完全不是一个概念。Java8中的Stream是对集合功能的一种增强,主要用于对集合对象进行各种非常便利高效的聚合和大批量数据的操作。结合Lambda表达式可以极大的提高开发效率和代码可读性。

假设我们需要把一个集合中的所有形状设置成红色,那么我们可以这样写

for (Shape shape : shapes){
    shape.setColor(RED)
}

如果使用Java8扩展后的集合框架则可以这样写:

shapes.foreach(s -> s.setColor(RED));

__第一种__写法我们叫外部迭代,for-each调用shapesiterator()依次遍历集合中的元素。这种外部迭代有一些问题:

for循环是串行的,而且必须按照集合中元素的顺序依次进行;

集合框架无法对控制流进行优化,例如通过排序、并行、短路求值以及惰性求值改善性能。

上面这两个问题我们会在后面的文章中逐步解答。

__第二种__写法我们叫内部迭代,两段代码虽然看起来只是语法上的区别,但实际上他们内部的区别其实非常大。用户把对操作的控制权交还给类库,从而允许类库进行各种各样的优化(例如乱序执行、惰性求值和并行等等)。总的来说,内部迭代使得外部迭代中不可能实现的优化成为可能。

外部迭代同时承担了做什么(把形状设为红色)和怎么做(得到Iterator实例然后依次遍历),而内部迭代只负责做什么,而把怎么做留给类库。这样代码会变得更加清晰,而集合类库则可以在内部进行各种优化。

一、什么是Stream

Stream不是集合元素,它也不是数据结构、不能保存数据,它更像一个更高级的Interator。Stream提供了强大的数据集合操作功能,并被深入整合到现有的集合类和其它的JDK类型中。流的操作可以被组合成流水线(Pipeline)。拿前面的例子来说,如果我只想把蓝色改成红色:

shapes.stream()
      .filter(s -> s.getColor() == BLUE)
      .forEach(s -> s.setColor(RED));

Collection上调用stream()会生成该集合元素的流,接下来filter()操作会产生只包含蓝色形状的流,最后,这些蓝色形状会被forEach操作设为红色。

如果我们想把蓝色的形状提取到新的List里,则可以:

List blue = shapes.stream()
                          .filter(s -> s.getColor() == BLUE)
                          .collect(Collectors.toList());

collect()操作会把其接收的元素聚集到一起(这里是List),collect()方法的参数则被用来指定如何进行聚集操作。在这里我们使用toList()以把元素输出到List中。

如果每个形状都被保存在Box里,然后我们想知道哪个盒子至少包含一个蓝色形状,我们可以这么写:

Set hasBlueShape = shapes.stream()
                               .filter(s -> s.getColor() == BLUE)
                              .map(s -> s.getContainingBox())
                              .collect(Collectors.toSet());

map()操作通过映射函数(这里的映射函数接收一个形状,然后返回包含它的盒子)对输入流里面的元素进行依次转换,然后产生新流。

如果我们需要得到蓝色物体的总重量,我们可以这样表达:

int sum = shapes.stream()
                .filter(s -> s.getColor() == BLUE)
                .mapToInt(s -> s.getWeight())
                .sum();
二、Stream vs Collection

流(Stream)和集合(Collection)的区别:

Collection主要用来对元素进行管理和访问;

Stream并不支持对其元素进行直接操作和直接访问,而只支持通过声明式操作在其之上进行运算后得到结果;

Stream不存储值

对Stream的操作会产生一个结果,但是Stream并不会改变数据源;

大多数Stream的操作(filter,map,sort等)都是以惰性的方式实现的。这使得我们可以使用一次遍历完成整个流水线操作,并可以用短路操作提供更高效的实现。

三、惰性求值 vs 急性求值

filter()map()这样的操作既可以被急性求值(以filter()为例,急性求值需要在方法返回前完成对所有元素的过滤),也可以被惰性求值(用Stream代表过滤结果,当且仅当需要时才进行过滤操作)在实际中进行惰性运算可以带来很多好处。比如说,如果我们进行惰性过滤,我们就可以把过滤和流水线里的其它操作混合在一起,从而不需要对数据进行多遍遍历。相类似的,如果我们在一个大型集合里搜索第一个满足某个条件的元素,我们可以在找到后直接停止,而不是继续处理整个集合。(这一点对无限数据源是很重要,惰性求值对于有限数据源起到的是优化作用,但对无限数据源起到的是决定作用,没有惰性求值,对无限数据源的操作将无法终止)

对于filter()map()这样的操作,我们很自然的会把它当成是惰性求值操作,不过它们是否真的是惰性取决于它们的具体实现。另外,像sum()这样生成值的操作和forEach()这样产生副作用的操作都是__天然急性求值__,因为它们必须要产生具体的结果。

我们拿下面这段代码举例:

int sum = shapes.stream()
                .filter(s -> s.getColor() == BLUE)
                .mapToInt(s -> s.getWeight())
                .sum();

这里的filter()map()都是惰性的,这就意味着在调用sum()之前不会从数据源中提取任何元素。在sum()操作之后才会把filter()map()sum()放在对数据源一次遍历中。这样可以大大减少维持中间结果所带来的开销。

四、举个栗子?

前面长篇大论的介绍概念实在太枯燥,为了方便大家理解我们用Streams API来实现一个具体的业务场景。

假设我们有一个房源库项目,这个房源库中有一系列的小区,每个小区都有小区名和房源列表,每套房子又有价格、面积等属性。现在我们需要筛选出含有100平米以上房源的小区,并按照小区名排序。

我们先来看看不用Streams API如何实现:

List result = new ArrayList<>();
for (Community community : communities) {
        for (House house : community.houses) {
            if (house.area > 100) {
                result.add(community);
                break;
            }
        }
    }
    Collections.sort(result, new Comparator() {
        @Override
        public int compare(Community c1, Community c2) {
            return c1.name.compareTo(c2.name);
        }
    });
    return result;      

如果使用Streams API:

return communities.stream()
          .filter(c -> c.houses.stream().anyMatch(h -> h.area>100))
          .sorted(Comparator.comparing(c -> c.name))
          .collect(Collectors.toList());

如果大家喜欢这一系列的文章,欢迎关注我的知乎专栏、GitHub、简书博客。

知乎专栏:https://zhuanlan.zhihu.com/baron

GitHub:https://github.com/BaronZ88

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/66489.html

相关文章

  • 在Android项目中使用Java8

    摘要:现在爸爸终于让平台支持了,这篇文章中便来和大家聊聊如何在项目中配置使用。要想在项目中使用的新特性,需要将你的升级到及以上版本,并采用新的编译。 转载请注明出处:https://zhuanlan.zhihu.com/p/23279894 前言 在过去的文章中我介绍过Java8的一些新特性,包括: Java8新特性第1章(Lambda表达式) Java8新特性第2章(接口默认方法) J...

    junnplus 评论0 收藏0
  • Java8特性1(Lambda表达式)

    摘要:一表达式匿名内部类最大的问题在于其冗余的语法,比如前面的中五行代码仅有一行是在执行任务。总结基于词法作用域的理念,表达式不可以掩盖任何其所在上下文的局部变量。 转载请注明出处:https://zhuanlan.zhihu.com/p/20540175 在介绍Lambda表达式之前,我们先来看只有单个方法的Interface(通常我们称之为回调接口): public interface...

    ningwang 评论0 收藏0
  • Java8实战》-十一笔记(CompletableFuture:组合式异步编程)

    摘要:组合式异步编程最近这些年,两种趋势不断地推动我们反思我们设计软件的方式。第章中介绍的分支合并框架以及并行流是实现并行处理的宝贵工具它们将一个操作切分为多个子操作,在多个不同的核甚至是机器上并行地执行这些子操作。 CompletableFuture:组合式异步编程 最近这些年,两种趋势不断地推动我们反思我们设计软件的方式。第一种趋势和应用运行的硬件平台相关,第二种趋势与应用程序的架构相关...

    hlcfan 评论0 收藏0
  • Java学习路线总结,搬砖工逆袭Java架构师(全网最强)

    摘要:哪吒社区技能树打卡打卡贴函数式接口简介领域优质创作者哪吒公众号作者架构师奋斗者扫描主页左侧二维码,加入群聊,一起学习一起进步欢迎点赞收藏留言前情提要无意间听到领导们的谈话,现在公司的现状是码农太多,但能独立带队的人太少,简而言之,不缺干 ? 哪吒社区Java技能树打卡 【打卡贴 day2...

    Scorpion 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<