摘要:如何检测死锁由于死锁极难通过人工的方式查出来,因此提供了命令来检测某个进程中心线程的情况,并排查有没有死锁。线程持有的锁,等待的锁。避免出现死锁,如果出现了死锁,则可以使用命令查看线程是否有死锁。
前言
在 Java 的并发编程中,有一个问题需要特别注意,那就是死锁,如果发生了死锁,基本就是重启,而重启将会丢失运行中的数据。所以,了解死锁的形成并排查死锁到预防死锁成了一个重要的问题。
我们了解任何一个事情的步骤是:what,how,why,why not。
1. 什么是死锁?我们还是直接写一段代码来看看:
package hello; public class DeadLock { public static void main(String[] args) { new Thread(() -> { try { new DeadLock().resource1(); } catch (InterruptedException e) { } } ).start(); new Thread(() -> { try { new DeadLock().resource2(); } catch (InterruptedException e) { } } ).start(); } void resource1() throws InterruptedException { synchronized ("resource1") { System.out.println("获取资源1"); // 等待 1 秒让另一个线程拿到锁 Thread.sleep(1000); resource2(); } } void resource2() throws InterruptedException { synchronized ("resource2") { System.out.println("获取资源2"); // 等待 1 秒让另一个线程拿到锁 Thread.sleep(1000); resource1(); } } }
上面的代码中,我们启用了两个线程,分别抢占2个资源,但这两个资源又分别被不同的对象(字符串)锁住了。当第一个线程调用 resource1 方法,进入同步块,拿到锁,并等待 1 秒钟让另一个线程进入 resource2 同步块,当第二个线程进入同步块后,注意:此时, 拿着 resourec1 锁的线程企图拿到 resource2 的锁,但这个时候,拿着 resource2 的线程也想去拿 resource1 的锁。于是就出现了互相僵持的情况,谁也无法拿到对方的锁,整个系统就卡死了。
这种情况就是死锁。
像我们现在写的代码是自己故意造出来的死锁,我们能够发现,那如果是线上环境怎么办,假如我们的系统卡死了,我们怎么知道到底是哪一段代码出现了问题,有没有可能使死锁的问题。也就是如何检测死锁。
2. 如何检测死锁?由于死锁极难通过人工的方式查出来,因此JDK 提供了命令来检测某个java进程中心线程的情况,并排查有没有死锁。上面命令呢? jps , 用来查看java 程序的进程号,当然在 Linux 中也可以通过别的方式获取, jstack 进程号命令则可以答应对应进程的栈信息,并找到死锁。
我们就刚刚的程序,在 windows 上使用该命令。
C:Usersstateis0>jps 11060 2084 Launcher 10712 RemoteMavenServer 18040 Jps 11820 DeadLock C:Usersstateis0>jstack 11820 2017-12-29 18:52:38 Full thread dump Java HotSpot(TM) Client VM (25.131-b11 mixed mode): "DestroyJavaVM" #11 prio=5 os_prio=0 tid=0x051fe800 nid=0x1e0c waiting on condition [0x00000000] java.lang.Thread.State: RUNNABLE "Thread-1" #10 prio=5 os_prio=0 tid=0x18777800 nid=0x5664 waiting for monitor entry [0x18e0f000] java.lang.Thread.State: BLOCKED (on object monitor) at hello.DeadLock.resource1(DeadLock.java:31) - waiting to lock <0x07415a50> (a java.lang.String) at hello.DeadLock.resource2(DeadLock.java:43) - locked <0x0742bd18> (a java.lang.String) at hello.DeadLock.lambda$main$1(DeadLock.java:20) at hello.DeadLock$$Lambda$2/4983748.run(Unknown Source) at java.lang.Thread.run(Thread.java:748) "Thread-0" #9 prio=5 os_prio=0 tid=0x18776c00 nid=0x4dc4 waiting for monitor entry [0x18d7f000] java.lang.Thread.State: BLOCKED (on object monitor) at hello.DeadLock.resource2(DeadLock.java:41) - waiting to lock <0x0742bd18> (a java.lang.String) at hello.DeadLock.resource1(DeadLock.java:33) - locked <0x07415a50> (a java.lang.String) at hello.DeadLock.lambda$main$0(DeadLock.java:11) at hello.DeadLock$$Lambda$1/5592464.run(Unknown Source) at java.lang.Thread.run(Thread.java:748) "Service Thread" #8 daemon prio=9 os_prio=0 tid=0x186e4c00 nid=0x172c runnable [0x00000000] java.lang.Thread.State: RUNNABLE "C1 CompilerThread0" #7 daemon prio=9 os_prio=2 tid=0x186af000 nid=0x53f8 waiting on condition [0x00000000] java.lang.Thread.State: RUNNABLE "Monitor Ctrl-Break" #6 daemon prio=5 os_prio=0 tid=0x1861e800 nid=0x3928 runnable [0x18b3f000] java.lang.Thread.State: RUNNABLE at java.net.SocketInputStream.socketRead0(Native Method) at java.net.SocketInputStream.socketRead(SocketInputStream.java:116) at java.net.SocketInputStream.read(SocketInputStream.java:171) at java.net.SocketInputStream.read(SocketInputStream.java:141) at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:284) at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:326) at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:178) - locked <0x07861da0> (a java.io.InputStreamReader) at java.io.InputStreamReader.read(InputStreamReader.java:184) at java.io.BufferedReader.fill(BufferedReader.java:161) at java.io.BufferedReader.readLine(BufferedReader.java:324) - locked <0x07861da0> (a java.io.InputStreamReader) at java.io.BufferedReader.readLine(BufferedReader.java:389) at com.intellij.rt.execution.application.AppMainV2$1.run(AppMainV2.java:64) "Attach Listener" #5 daemon prio=5 os_prio=2 tid=0x179c0800 nid=0x40a0 waiting on condition [0x00000000] java.lang.Thread.State: RUNNABLE "Signal Dispatcher" #4 daemon prio=9 os_prio=2 tid=0x17985c00 nid=0x5004 runnable [0x00000000] java.lang.Thread.State: RUNNABLE "Finalizer" #3 daemon prio=8 os_prio=1 tid=0x17972400 nid=0x41a8 in Object.wait() [0x17cff000] java.lang.Thread.State: WAITING (on object monitor) at java.lang.Object.wait(Native Method) - waiting on <0x0ca1b830> (a java.lang.ref.ReferenceQueue$Lock) at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:143) - locked <0x0ca1b830> (a java.lang.ref.ReferenceQueue$Lock) at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:164) at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:209) "Reference Handler" #2 daemon prio=10 os_prio=2 tid=0x17960000 nid=0x4ef0 in Object.wait() [0x17c6f000] java.lang.Thread.State: WAITING (on object monitor) at java.lang.Object.wait(Native Method) - waiting on <0x0ca1b9d0> (a java.lang.ref.Reference$Lock) at java.lang.Object.wait(Object.java:502) at java.lang.ref.Reference.tryHandlePending(Reference.java:191) - locked <0x0ca1b9d0> (a java.lang.ref.Reference$Lock) at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:153) "VM Thread" os_prio=2 tid=0x1795a800 nid=0x3f54 runnable "VM Periodic Task Thread" os_prio=2 tid=0x18739400 nid=0x4a14 waiting on condition JNI global references: 229 // 找到一个死锁 Found one Java-level deadlock: ============================= "Thread-1": waiting to lock monitor 0x17978de4 (object 0x07415a50, a java.lang.String), which is held by "Thread-0" "Thread-0": waiting to lock monitor 0x1797a974 (object 0x0742bd18, a java.lang.String), which is held by "Thread-1" Java stack information for the threads listed above: =================================================== "Thread-1": at hello.DeadLock.resource1(DeadLock.java:31) // 等待 0x07415a50 锁 - waiting to lock <0x07415a50> (a java.lang.String) at hello.DeadLock.resource2(DeadLock.java:43) // 持有 0x0742bd18 - locked <0x0742bd18> (a java.lang.String) at hello.DeadLock.lambda$main$1(DeadLock.java:20) at hello.DeadLock$$Lambda$2/4983748.run(Unknown Source) at java.lang.Thread.run(Thread.java:748) "Thread-0": at hello.DeadLock.resource2(DeadLock.java:41) // 等待 0x0742bd18 锁 - waiting to lock <0x0742bd18> (a java.lang.String) at hello.DeadLock.resource1(DeadLock.java:33) // 持有 0x07415a50 - locked <0x07415a50> (a java.lang.String) at hello.DeadLock.lambda$main$0(DeadLock.java:11) at hello.DeadLock$$Lambda$1/5592464.run(Unknown Source) at java.lang.Thread.run(Thread.java:748) // 发现了一个死锁 Found 1 deadlock. C:Usersstateis0>
Thread-1 waiting to lock <0x07415a50> locked <0x0742bd18>
Thread-0 waiting to lock <0x0742bd18> locked <0x07415a50>
我们首先使用 jps 命令找到 java 进程号,然后使用 jstack 进程号 打印进程栈的信息,其中,在最后的部分,jstack 告诉我们,他找到了一个死锁,其中又详细的信息:Thread-1 线程(这里我们没有给线程其合适的名字,如果在线上,给线程起一个合适的名字将更有利于排查)持有 String 类型的编号为 0x07415a50 的锁,等待编号为 0x07415a50 的锁 , 但这个锁由 Thread-0 持有,于此同时,Thread-0 和 Thread-1 相反。Thread-0 线程持有 0x07415a50 的锁,等待 0x07415a50 的锁。我们的注释里也写上了。
那么发生了死锁,该怎么办呢?最简单的办法就是重启,重启之后,对 jstack 中打印的堆栈信息中的代码进行修改。重新发布。当然还有一些高级策略,比如让进程回滚到死锁前的状态,然后让他们顺序进入同步块。
3. 死锁有哪些形成的原因一般来说,要出现死锁问题需要满足以下条件:
互斥条件:一个资源每次只能被一个线程使用。
请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放。
不剥夺条件:进程已获得的资源,在未使用完之前,不能强行剥夺。
循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。
死锁是由四个必要条件导致的,所以一般来说,只要破坏这四个必要条件中的一个条件,死锁情况就应该不会发生。
如果想要打破互斥条件,我们需要允许进程同时访问某些资源,这种方法受制于实际场景,不太容易实现条件;
打破不可抢占条件,这样需要允许进程强行从占有者那里夺取某些资源,或者简单一点理解,占有资源的进程不能再申请占有其他资源,必须释放手上的资源之后才能发起申请,这个其实也很难找到适用场景;
进程在运行前申请得到所有的资源,否则该进程不能进入准备执行状态。这个方法看似有点用处,但是它的缺点是可能导致资源利用率和进程并发性降低;
避免出现资源申请环路,即对资源事先分类编号,按号分配。这种方式可以有效提高资源的利用率和系统吞吐量,但是增加了系统开销,增大了进程对资源的占用时间。
4 总结并发编程中的坑很多,尤其死锁,造成的问题基本只能靠重启来解决,如果遇到了数据保存在内存中但没有持久化的话,那么重启将出现很大的问题。因此我们在用锁的时候,一定要小心。避免出现死锁,如果出现了死锁,则可以使用 jstack 命令查看线程是否有死锁。用以排查问题。
总之并发的坑很多,楼主以后将会多多分析。
good luck !!!!
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/69426.html
摘要:我的是忙碌的一年,从年初备战实习春招,年三十都在死磕源码,三月份经历了阿里五次面试,四月顺利收到实习。因为我心理很清楚,我的目标是阿里。所以在收到阿里之后的那晚,我重新规划了接下来的学习计划,将我的短期目标更新成拿下阿里转正。 我的2017是忙碌的一年,从年初备战实习春招,年三十都在死磕JDK源码,三月份经历了阿里五次面试,四月顺利收到实习offer。然后五月怀着忐忑的心情开始了蚂蚁金...
摘要:关于并发编程,其目的就是为了让程序运行得更快,但是,并不是启动更多的线程就能让程序更大限度的并发执行。对于软件资源限制考虑使用资源池将资源复用,例如数据库连接池等资源限制情况下进行并发编程根据不同的资源限制调整程序的并发度。 关于并发编程,其目的就是为了让程序运行得更快,但是,并不是启动更多的线程就能让程序更大限度的并发执行。有哪些影响并发编程的因素呢? 一、文章导图 showImg(...
摘要:结构型模式适配器模式桥接模式装饰模式组合模式外观模式享元模式代理模式。行为型模式模版方法模式命令模式迭代器模式观察者模式中介者模式备忘录模式解释器模式模式状态模式策略模式职责链模式责任链模式访问者模式。 主要版本 更新时间 备注 v1.0 2015-08-01 首次发布 v1.1 2018-03-12 增加新技术知识、完善知识体系 v2.0 2019-02-19 结构...
摘要:因为多线程竞争锁时会引起上下文切换。减少线程的使用。举个例子如果说服务器的带宽只有,某个资源的下载速度是,系统启动个线程下载该资源并不会导致下载速度编程,所以在并发编程时,需要考虑这些资源的限制。 最近私下做一项目,一bug几日未解决,总惶恐。一日顿悟,bug不可怕,怕的是项目不存在bug,与其惧怕,何不与其刚正面。 系列文章传送门: Java多线程学习(一)Java多线程入门 Jav...
阅读 2296·2021-11-24 09:39
阅读 2540·2021-11-22 15:24
阅读 2979·2021-09-02 09:48
阅读 3013·2021-07-26 22:01
阅读 1436·2019-08-30 11:09
阅读 1674·2019-08-29 18:47
阅读 603·2019-08-29 15:40
阅读 2134·2019-08-29 15:22