深入理解Java内存模型（二）——重排序

tunny 发布于2019-08-14 16:02 / 2708人阅读

摘要：前情提要深入理解内存模型一基础编译器运行时会对指令进行重排序。以处理器的猜测执行为例，执行线程的处理器可以提前读取并计算，然后把计算结果临时保存到一个名为重排序缓冲的硬件缓存中。请看下篇深入理解内存模型三顺序一致性

前情提要 深入理解Java内存模型（一）——基础

Java编译器、运行时会对指令进行重排序。这种重排序在单线程和多线程情况下分别有什么影响呢？

数据依赖性

如果两个操作访问同一个变量，且这两个操作中有一个为写操作，此时这两个操作之间就存在数据依赖性。数据依赖分下列三种类型：

  -------- -------------- -------------------------------
  名称     代码示例       说明
  写后读   a = 1;b = a;   写一个变量之后，再读这个位置。
  写后写   a = 1;a = 2;   写一个变量之后，再写这个变量。
  读后写   a = b;b = 1;   读一个变量之后，再写这个变量。
  -------- -------------- -------------------------------

上面三种情况，只要重排序两个操作的执行顺序，程序的执行结果将会被改变。

前面提到过，编译器和处理器可能会对操作做重排序。编译器和处理器在重排序时，会遵守数据依赖性，编译器和处理器不会改变存在数据依赖关系的两个操作的执行顺序。

注意，这里所说的数据依赖性仅针对单个处理器中执行的指令序列和单个线程中执行的操作，不同处理器之间和不同线程之间的数据依赖性不被编译器和处理器考虑。

as-if-serial语义

as-if-serial语义的意思指：不管怎么重排序（编译器和处理器为了提高并行度），（单线程）程序的执行结果不能被改变。编译器，runtime 和处理器都必须遵守as-if-serial语义。

为了遵守as-if-serial语义，编译器和处理器不会对存在数据依赖关系的操作做重排序，因为这种重排序会改变执行结果。但是，如果操作之间不存在数据依赖关系，这些操作可能被编译器和处理器重排序。为了具体说明，请看下面计算圆面积的代码示例：

    double pi  = 3.14;    //A
    double r   = 1.0;     //B
    double area = pi * r * r; //C

上面三个操作的数据依赖关系如下图所示：

如上图所示，A和C之间存在数据依赖关系，同时B和C之间也存在数据依赖关系。因此在最终执行的指令序列中，C不能被重排序到A和B的前面（C排到A和B的前面，程序的结果将会被改变）。但A和B之间没有数据依赖关系，编译器和处理器可以重排序A和B之间的执行顺序。下图是该程序的两种执行顺序：

as-if-serial语义把单线程程序保护了起来，遵守as-if-serial语义的编译器，runtime 和处理器共同为编写单线程程序的程序员创建了一个幻觉：单线程程序是按程序的顺序来执行的。as-if-serial语义使单线程程序员无需担心重排序会干扰他们，也无需担心内存可见性问题。

程序顺序规则

根据happens-before的程序顺序规则，上面计算圆的面积的示例代码存在三个happens-
before关系：

A happens-before B；

B happens-before C；

A happens-before C；

这里的第3个happens-before关系，是根据happens-before的传递性推导出来的。

这里A happens-before B，但实际执行时B却可以排在A之前执行（看上面的重排序后的执行顺序）。在第一章提到过，如果A happens-before B，JMM并不要求A一定要在B之前执行。JMM仅仅要求前一个操作（执行的结果）对后一个操作可见，且前一个操作按顺序排在第二个操作之前。这里操作A的执行结果不需要对操作B可见；而且重排序操作A和操作B后的执行结果，与操作A和操作B按happens- before顺序执行的结果一致。在这种情况下，JMM会认为这种重排序并不非法（not illegal），JMM允许这种重排序。

在计算机中，软件技术和硬件技术有一个共同的目标：在不改变程序执行结果的前提下，尽可能的开发并行度。编译器和处理器遵从这一目标，从happens-before的定义我们可以看出，JMM同样遵从这一目标。

重排序对多线程的影响

现在让我们来看看，重排序是否会改变多线程程序的执行结果。请看下面的示例代码：

class ReorderExample {
int a = 0;
boolean flag = false;

public void writer() {
    a = 1;                   //1
    flag = true;             //2
}

Public void reader() {
    if (flag) {                //3
        int i =  a * a;        //4
        ……
    }
}
}

flag变量是个标记，用来标识变量a是否已被写入。这里假设有两个线程A和B，A首先执行writer()方法，随后B线程接着执行reader()方法。线程B在执行操作4时，能否看到线程A在操作1对共享变量a的写入？

答案是：不一定能看到。

由于操作1和操作2没有数据依赖关系，编译器和处理器可以对这两个操作重排序；同样，操作3和操作4没有数据依赖关系，编译器和处理器也可以对这两个操作重排序。让我们先来看看，当操作1和操作2重排序时，可能会产生什么效果？请看下面的程序执行时序图：

如上图所示，操作1和操作2做了重排序。程序执行时，线程A首先写标记变量flag，随后线程B读这个变量。由于条件判断为真，线程B将读取变量a。此时，变量a还根本没有被线程A写入，在这里多线程程序的语义被重排序破坏了！

※注：本文统一用红色的虚箭线表示错误的读操作，用绿色的虚箭线表示正确的读操作。

下面再让我们看看，当操作3和操作4重排序时会产生什么效果（借助这个重排序，可以顺便说明控制依赖性）。下面是操作3和操作4重排序后，程序的执行时序图：

在程序中，操作3和操作4存在控制依赖关系。当代码中存在控制依赖性时，会影响指令序列执行的并行度。为此，编译器和处理器会采用猜测（Speculation）执行来克服控制相关性对并行度的影响。以处理器的猜测执行为例，执行线程B的处理器可以提前读取并计算a*a，然后把计算结果临时保存到一个名为重排序缓冲（reorder buffer ROB）的硬件缓存中。当接下来操作3的条件判断为真时，就把该计算结果写入变量i中。

从图中我们可以看出，猜测执行实质上对操作3和4做了重排序。重排序在这里破坏了多线程程序的语义！

在单线程程序中，对存在控制依赖的操作重排序，不会改变执行结果（这也是as-if-serial语义允许对存在控制依赖的操作做重排序的原因）；但在多线程程序中，对存在控制依赖的操作重排序，可能会改变程序的执行结果。

参考文献

Computer Architecture: A Quantitative Approach, 4th
Edition

Concurrent Programming on
Windows

Concurrent Programming in Java™: Design Principles and
Pattern

JSR-133: Java Memory Model and Thread Specification

JSR 133 (Java Memory Model) FAQ

关于作者

程晓明，Java软件工程师，系统分析师、信息项目管理师。专注于并发编程。个人邮箱：asst2003@163.com。

请看下篇深入理解Java内存模型（三）——顺序一致性

via ifeve

GPU云服务器云服务器 java重排序指令深入理解java基础重排序数组重排序

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/66144.html

深入理解volatile类型——从Java虚拟机内存模型角度

摘要：本文从内存模型角度，探讨的实现原理。通过共享内存或者消息通知这两种方法，可以实现通信或同步。基于共享内存的线程通信是隐式的，线程同步是显式的而基于消息通知的线程通信是显式的，线程同步是隐式的。锁规则锁的解锁，于于锁的获取或加锁。一、前言在java多线程编程中，volatile可以用来定义轻量级的共享变量，它比synchronized的使用成本更低，因为它不会引起线程上下文的切换和调...

mushang 2019-08-16 10:47 评论0 收藏0
深入理解Java内存模型（一）——基础

摘要：线程之间的通信由内存模型本文简称为控制，决定一个线程对共享变量的写入何时对另一个线程可见。为了保证内存可见性，编译器在生成指令序列的适当位置会插入内存屏障指令来禁止特定类型的处理器重排序。并发编程模型的分类在并发编程中，我们需要处理两个关键问题：线程之间如何通信及线程之间如何同步（这里的线程是指并发执行的活动实体）。通信是指线程之间以何种机制来交换信息。在命令式编程中，线程之间的...

jsdt 2019-08-14 11:42 评论0 收藏0
深入理解Java内存模型（七）——总结

摘要：编译器，和处理器会共同确保单线程程序的执行结果与该程序在顺序一致性模型中的执行结果相同。正确同步的多线程程序的执行将具有顺序一致性程序的执行结果与该程序在顺序一致性内存模型中的执行结果相同。前情提要深入理解Java内存模型（六）——final 处理器内存模型顺序一致性内存模型是一个理论参考模型，JMM和处理器内存模型在设计时通常会把顺序一致性内存模型作为参照。JMM和处理器内...

paney129 2019-08-14 11:45 评论0 收藏0
Java 双重加锁单例与 java 内存重排序特性

摘要：关于对于重排序的讲解，强烈推荐阅读程晓明写的深入理解内存模型二重排序。语义语义单线程下，为了优化可以对操作进行重排序。编译器和处理器为单个线程实现了语义，但对于多线程并不实现语义。双重加载的单例模式分析即双重检查加锁。版权声明：本文由吴仙杰创作整理，转载请注明出处：https://segmentfault.com/a/1190000009231182 1. 引言在开始分析双重加锁单...

HackerShell 2019-08-16 10:31 评论0 收藏0
深入理解Java内存模型（六）——final

摘要：对于域，编译器和处理器要遵守两个重排序规则在构造函数内对一个域的写入，与随后把这个被构造对象的引用赋值给一个引用变量，这两个操作之间不能重排序。这个屏障禁止处理器把域的写重排序到构造函数之外。下一篇深入理解内存模型七总结与前面介绍的锁和volatile相比较，对final域的读和写更像是普通的变量访问。对于final域，编译器和处理器要遵守两个重排序规则：在构造函数内对一个fi...

lixiang 2019-08-14 16:02 评论0 收藏0