资讯专栏INFORMATION COLUMN

线程池中你不容错过的一些细节

kgbook / 1527人阅读

摘要:第二还是大家对线程池的理解不够深刻,比如今天要探讨的内容。我认为线程池它就是一个调度任务的工具。而在线程池这个场景中却恰好就是要利用它只是一个普通方法调用。

背景

上周分享了一篇《一个线程罢工的诡异事件》,最近也在公司内部分享了这个案例。

无独有偶,在内部分享的时候也有小伙伴问了之前分享时所提出的一类问题:

这其实是一类共性问题,我认为主要还是两个原因:

我自己确实也没讲清楚,之前画的那张图还需要再完善,有些误导。

第二还是大家对线程池的理解不够深刻,比如今天要探讨的内容。

线程池的工作原理

首先还是来复习下线程池的基本原理。

我认为线程池它就是一个调度任务的工具。

众所周知在初始化线程池会给定线程池的大小,假设现在我们有 1000 个线程任务需要运行,而线程池的大小为 10~20,在真正运行任务的过程中他肯定不会创建这1000个线程同时运行,而是充分利用线程池里这 10~20 个线程来调度这1000个任务。

而这里的 10~20 个线程最后会由线程池封装为 ThreadPoolExecutor.Worker 对象,而这个 Worker 是实现了 Runnable 接口的,所以他自己本身就是一个线程。

深入分析

这里我们来做一个模拟,创建了一个核心线程、最大线程数、阻塞队列都为2的线程池。

这里假设线程池已经完成了预热,也就是线程池内部已经创建好了两个线程 Worker

当我们往一个线程池丢一个任务会发生什么事呢?

第一步是生产者,也就是任务提供者他执行了一个 execute() 方法,本质上就是往这个内部队列里放了一个任务。

之前已经创建好了的 Worker 线程会执行一个 while 循环 ---> 不停的从这个内部队列里获取任务。(这一步是竞争的关系,都会抢着从队列里获取任务,由这个队列内部实现了线程安全。)

获取得到一个任务后,其实也就是拿到了一个 Runnable 对象(也就是 execute(Runnable task) 这里所提交的任务),接着执行这个 Runnablerun() 方法,而不是 start(),这点需要注意后文分析原因。

结合源码来看:

从图中其实就对应了刚才提到的二三两步:

while 循环,从 getTask() 方法中一直不停的获取任务。

拿到任务后,执行它的 run() 方法。

这样一个线程就调度完毕,然后再次进入循环从队列里取任务并不断的进行调度。

再次解释之前的问题

接下来回顾一下我们上一篇文章所提到的,导致一个线程没有运行的根本原因是:

在单个线程的线程池中一但抛出了未被捕获的异常时,线程池会回收当前的线程并创建一个新的 Worker
它也会一直不断的从队列里获取任务来执行,但由于这是一个消费线程,根本没有生产者往里边丢任务,所以它会一直 waiting 在从队列里获取任务处,所以也就造成了线上的队列没有消费,业务线程池没有执行的问题。

结合之前的那张图来看:

这里大家问的最多的一个点是,为什么会没有是根本没有生产者往里边丢任务,图中不是明明画的有一个 product 嘛?

这里确实是有些不太清楚,再次强调一次:

图中的 product 是往内部队列里写消息的生产者,并不是往这个 Consumer 所在的线程池中写任务的生产者。

因为即便 Consumer 是一个单线程的线程池,它依然具有一个常规线程池所具备的所有条件:

Worker 调度线程,也就是线程池运行的线程;虽然只有一个。

内部的阻塞队列;虽然长度只有1。

再次结合图来看:

所以之前提到的【没有生产者往里边丢任务】是指右图放大后的那一块,也就是内部队列并没有其他线程往里边丢任务执行 execute() 方法。

而一旦发生未捕获的异常后,Worker1 被回收,顺带的它所调度的线程 task1(这个task1 也就是在执行一个 while 循环消费左图中的那个队列) 也会被回收掉。

新创建的 Worker2 会取代 Worker1 继续执行 while 循环从内部队列里获取任务,但此时这个队列就一直会是空的,所以也就是处于 Waiting 状态。

我觉得这波解释应该还是讲清楚了,欢迎还没搞明白的朋友留言讨论。
为什是 run() 而不是 start()

问题搞清楚后来想想为什么线程池在调度的时候执行的是 Runnablerun() 方法,而不是 start() 方法呢?

我相信大部分没有看过源码的同学心中第一个印象就应该是执行的 start() 方法;

因为不管是学校老师,还是网上大牛讲的都是只有执行了 start() 方法后操作系统才会给我们创建一个独立的线程来运行,而 run() 方法只是一个普通的方法调用。

而在线程池这个场景中却恰好就是要利用它只是一个普通方法调用

回到我在文初中所提到的:我认为线程池它就是一个调度任务的工具。

假设这里是调用的 Runnablestart 方法,那会发生什么事情。

如果我们往一个核心、最大线程数为 2 的线程池里丢了 1000 个任务,那么它会额外的创建 1000 个线程,同时每个任务都是异步执行的,一下子就执行完毕了

从而没法做到由这两个 Worker 线程来调度这 1000 个任务,而只有当做一个同步阻塞的 run() 方法调用时才能满足这个要求。

这事也让我发现一个奇特的现象:就是网上几乎没人讲过为什么在线程池里是 run 而不是 start,不知道是大家都觉得这是基操还是没人仔细考虑过。
总结

针对之前线上事故的总结上次已经写得差不多了,感兴趣的可以翻回去看看。

这次呢可能更多是我自己的总结,比如写一篇技术博客时如果大部分人对某一个知识点讨论的比较热烈时,那一定是作者要么讲错了,要么没讲清楚。

这点确实是要把自己作为一个读者的角度来看,不然很容易出现之前的一些误解。

在这之外呢,我觉得对于线程池把这两篇都看完同时也理解后对于大家理解线程池,利用线程池完成工作也是有很大好处的。

如果有在面试中加分的记得回来点赞、分享啊。

你的点赞与分享是对我最大的支持

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/73923.html

相关文章

  • 线程池没你想那么简单(续)

    摘要:前言前段时间写过一篇线程池没你想的那么简单,和大家一起撸了一个基本的线程池,具备线程池基本调度功能。线程池自动扩容缩容。回调以上就是线程池的构造函数以及接口的定义。所以我们在使用线程池时,其中的任务一定要做好异常处理。线程异常捕获的重要性。 showImg(https://segmentfault.com/img/remote/1460000019403163?w=1904&h=108...

    svtter 评论0 收藏0
  • 线程池没你想那么简单

    摘要:如何优雅的使用和理解线程池线程池中你不容错过的一些细节由于篇幅限制,本次可能会分为上下两篇。不接受新的任务,同时等待现有任务执行完毕后退出线程池。慎用方法关闭线程池,会导致任务丢失除非业务允许。前言 原以为线程池还挺简单的(平时常用,也分析过原理),这次是想自己动手写一个线程池来更加深入的了解它;但在动手写的过程中落地到细节时发现并没想的那么容易。结合源码对比后确实不得不佩服 Doug Le...

    Leck1e 评论0 收藏0
  • 线程池没你想那么简单

    摘要:如何优雅的使用和理解线程池线程池中你不容错过的一些细节由于篇幅限制,本次可能会分为上下两篇。不接受新的任务,同时等待现有任务执行完毕后退出线程池。慎用方法关闭线程池,会导致任务丢失除非业务允许。 showImg(https://segmentfault.com/img/remote/1460000019230693); 前言 原以为线程池还挺简单的(平时常用,也分析过原理),这次是想自...

    ruicbAndroid 评论0 收藏0
  • LinuxCon+ContainerCon+CloudOpen首次来华,国际开源盛会不容错过

    摘要:月日,国家会议中心,由主办的合称将强势登陆北京这是首次来华,在这场三合一的开源技术盛会中,来自国内外的开发人员架构师系统管理员专家商业领袖等数千名专业人士将汇聚一堂。后被收购,梁胜出任云平台首席技术官,也成为首位华人。 6月19-20日,国家会议中心,由The Linux Foundation主办的LinuxCon + ContainerCon + CloudOpen (合称LC3) ...

    Corwien 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<