Kafka参数调优实战，看这篇文章就够了！【石杉的架构笔记】

cloud 发布于2019-05-23 17:28 / 1175人阅读

摘要：那这条消息的延迟就是秒钟。避免一个迟迟凑不满，导致消息一直积压在内存里发送不出去的情况。

个人公众号：石杉的架构笔记（ID:shishan100）

1、背景引入：很多同学看不懂Kafka参数

2、一段Kafka生产端的示例代码

3、内存缓冲的大小

4、多少数据打包为一个Batch合适？

5、要是一个Batch迟迟无法凑满咋办？

6、最大请求大小

7、重试机制

8、持久化机制

1、背景引入：很多同学看不懂kafka参数

今天给大家聊一个很有意思的话题，大家知道很多公司都会基于Kafka作为MQ来开发一些复杂的大型系统。

而在使用Kafka的客户端编写代码与服务器交互的时候，是需要对客户端设置很多的参数的。

所以我就见过很多年轻的同学，可能刚刚加入团队，对Kafka这个技术其实并不是很了解。

此时就会导致他们看团队里的一些资深同事写的一些代码，会看不懂是怎么回事，不了解背后的含义，这里面尤其是一些Kafka参数的设置。

所以这篇文章，我们还是采用老规矩画图的形式，来聊聊Kafka生产端一些常见参数的设置，让大家下次看到一些Kafka客户端设置的参数时，不会再感到发怵。

2、一段Kafka生产端的示例代码

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092"); 
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("buffer.memory", 67108864); 
props.put("batch.size", 131072); 
props.put("linger.ms", 100); 
props.put("max.request.size", 10485760); 
props.put("acks", "1"); 
props.put("retries", 10); 
props.put("retry.backoff.ms", 500);
KafkaProducer producer = new KafkaProducer(props);

3、内存缓冲的大小

首先我们看看“buffer.memory”这个参数是什么意思？

Kafka的客户端发送数据到服务器，一般都是要经过缓冲的，也就是说，你通过KafkaProducer发送出去的消息都是先进入到客户端本地的内存缓冲里，然后把很多消息收集成一个一个的Batch，再发送到Broker上去的。

所以这个“buffer.memory”的本质就是用来约束KafkaProducer能够使用的内存缓冲的大小的，他的默认值是32MB。

那么既然了解了这个含义，大家想一下，在生产项目里，这个参数应该怎么来设置呢？

你可以先想一下，如果这个内存缓冲设置的过小的话，可能会导致一个什么问题？

首先要明确一点，那就是在内存缓冲里大量的消息会缓冲在里面，形成一个一个的Batch，每个Batch里包含多条消息。

然后KafkaProducer有一个Sender线程会把多个Batch打包成一个Request发送到Kafka服务器上去。

那么如果要是内存设置的太小，可能导致一个问题：消息快速的写入内存缓冲里面，但是Sender线程来不及把Request发送到Kafka服务器。

这样是不是会造成内存缓冲很快就被写满？一旦被写满，就会阻塞用户线程，不让继续往Kafka写消息了。

所以对于“buffer.memory”这个参数应该结合自己的实际情况来进行压测，你需要测算一下在生产环境，你的用户线程会以每秒多少消息的频率来写入内存缓冲。

比如说每秒300条消息，那么你就需要压测一下，假设内存缓冲就32MB，每秒写300条消息到内存缓冲，是否会经常把内存缓冲写满？经过这样的压测，你可以调试出来一个合理的内存大小。

4、多少数据打包为一个Batch合适？

接着你需要思考第二个问题，就是你的“batch.size”应该如何设置？这个东西是决定了你的每个Batch要存放多少数据就可以发送出去了。

比如说你要是给一个Batch设置成是16KB的大小，那么里面凑够16KB的数据就可以发送了。

这个参数的默认值是16KB，一般可以尝试把这个参数调节大一些，然后利用自己的生产环境发消息的负载来测试一下。

比如说发送消息的频率就是每秒300条，那么如果比如“batch.size”调节到了32KB，或者64KB，是否可以提升发送消息的整体吞吐量。

因为理论上来说，提升batch的大小，可以允许更多的数据缓冲在里面，那么一次Request发送出去的数据量就更多了，这样吞吐量可能会有所提升。

但是这个东西也不能无限的大，过于大了之后，要是数据老是缓冲在Batch里迟迟不发送出去，那么岂不是你发送消息的延迟就会很高。

比如说，一条消息进入了Batch，但是要等待5秒钟Batch才凑满了64KB，才能发送出去。那这条消息的延迟就是5秒钟。

所以需要在这里按照生产环境的发消息的速率，调节不同的Batch大小自己测试一下最终出去的吞吐量以及消息的延迟，设置一个最合理的参数。

5、要是一个Batch迟迟无法凑满怎么办？

要是一个Batch迟迟无法凑满，此时就需要引入另外一个参数了，“linger.ms”

他的含义就是说一个Batch被创建之后，最多过多久，不管这个Batch有没有写满，都必须发送出去了。

给大家举个例子，比如说batch.size是16kb，但是现在某个低峰时间段，发送消息很慢。

这就导致可能Batch被创建之后，陆陆续续有消息进来，但是迟迟无法凑够16KB，难道此时就一直等着吗？

当然不是，假设你现在设置“linger.ms”是50ms，那么只要这个Batch从创建开始到现在已经过了50ms了，哪怕他还没满16KB，也要发送他出去了。

所以“linger.ms”决定了你的消息一旦写入一个Batch，最多等待这么多时间，他一定会跟着Batch一起发送出去。

避免一个Batch迟迟凑不满，导致消息一直积压在内存里发送不出去的情况。这是一个很关键的参数。

这个参数一般要非常慎重的来设置，要配合batch.size一起来设置。

举个例子，首先假设你的Batch是32KB，那么你得估算一下，正常情况下，一般多久会凑够一个Batch，比如正常来说可能20ms就会凑够一个Batch。

那么你的linger.ms就可以设置为25ms，也就是说，正常来说，大部分的Batch在20ms内都会凑满，但是你的linger.ms可以保证，哪怕遇到低峰时期，20ms凑不满一个Batch，还是会在25ms之后强制Batch发送出去。

如果要是你把linger.ms设置的太小了，比如说默认就是0ms，或者你设置个5ms，那可能导致你的Batch虽然设置了32KB，但是经常是还没凑够32KB的数据，5ms之后就直接强制Batch发送出去，这样也不太好其实，会导致你的Batch形同虚设，一直凑不满数据。

6、最大请求大小

“max.request.size”这个参数决定了每次发送给Kafka服务器请求的最大大小，同时也会限制你一条消息的最大大小也不能超过这个参数设置的值，这个其实可以根据你自己的消息的大小来灵活的调整。

给大家举个例子，你们公司发送的消息都是那种大的报文消息，每条消息都是很多的数据，一条消息可能都要20KB。

此时你的batch.size是不是就需要调节大一些？比如设置个512KB？然后你的buffer.memory是不是要给的大一些？比如设置个128MB？

只有这样，才能让你在大消息的场景下，还能使用Batch打包多条消息的机制。但是此时“max.request.size”是不是也得同步增加？

因为可能你的一个请求是很大的，默认他是1MB，你是不是可以适当调大一些，比如调节到5MB？

7、重试机制

“retries”和“retries.backoff.ms”决定了重试机制，也就是如果一个请求失败了可以重试几次，每次重试的间隔是多少毫秒。

这个大家适当设置几次重试的机会，给一定的重试间隔即可，比如给100ms的重试间隔。

8、持久化机制

“acks”参数决定了发送出去的消息要采用什么样的持久化策略，这个涉及到了很多其他的概念，大家可以参考之前专门为“acks”写过的一篇文章：

简历写Kafka，面试官大概率会让你讲acks参数对消息持久化的影响。

END

欢迎长按下图关注公众号：石杉的架构笔记！

公众号后台回复资料，获取作者独家秘制学习资料

石杉的架构笔记，BAT架构经验倾囊相授

GPU云服务器云服务器 mysql调优参数 linux kafka 参数服务器的架构文章服务器架构笔记

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/7301.html

Android工程师转型Java后端开发之路，自己选的路，跪着也要走下去！

本文是公众号读者jianfeng投稿的面试经验恭喜该同学成功转型目录：毅然转型，没头苍蝇制定目标，系统学习面试经历毅然转岗，没头苍蝇首先，介绍一下我的背景。本人坐标广州，2016年毕业于一个普通二本大学，曾经在某机构培训过Android。2018年初的时候已经在两家小公司工作干了两年的android开发，然后会一些Tomcat、Servlet之类的技术，当时的年薪大概也就15万这样子。由于个人发展...

番茄西红柿 2019-05-23 15:18 评论0 收藏0
【转】成为Java顶尖程序员，看这10本书就够了

摘要：实战高并发程序设计这本书是目前点评推荐比较多的书，其特色是案例小，好实践代码有场景，实用。想要学习多线程的朋友，这本书是我大力推荐的，我的个人博客里面二十多篇的多线程博文都是基于此书，并且在这本书的基础上进行提炼和总结而写出来的。学习的最好途径就是看书，这是我自己学习并且小有了一定的积累之后的第一体会。个人认为看书有两点好处：showImg(/img/bVr5S5);　　1.能出版出...

DTeam 2019-08-14 15:09 评论0 收藏0
阿里小哥带你玩转JVM：揭秘try-catch-finally在JVM底层都干了些啥？

摘要：当触发异常的字节码的索引值在某个异常表条目的监控范围内，虚拟机会判断所抛出的异常和该条目想要捕获的异常是否匹配。作者：李瑞杰目前就职于阿里巴巴，狂热JVM爱好者让我们准备一个函数:showImg(https://user-gold-cdn.xitu.io/2019/5/19/16acbce35adfefb7);然后，反编译他的字节码：showImg(https://user-gold-cd...

番茄西红柿 2019-05-23 16:08 评论0 收藏0
阿里小哥带你玩转JVM：揭秘try-catch-finally在JVM底层都干了些啥？

摘要：当触发异常的字节码的索引值在某个异常表条目的监控范围内，虚拟机会判断所抛出的异常和该条目想要捕获的异常是否匹配。作者：李瑞杰目前就职于阿里巴巴，狂热JVM爱好者让我们准备一个函数:showImg(https://user-gold-cdn.xitu.io/2019/5/19/16acbce35adfefb7);然后，反编译他的字节码：showImg(https://user-gold-cd...

番茄西红柿 2019-05-23 16:08 评论0 收藏0

发表评论

登陆后可评论

0条评论

cloud

男|高级讲师

我要关注我要私信

TA的文章

#黑五#Database Mart，美国达拉斯VPS/独服/GPU服务器4折优惠，月付低至$3.59

阅读 2916·2021-11-22 11:56
【Python从入门到实战】一篇文章带你搞懂Python中的类~

阅读 3621·2021-11-15 11:39
Python中if判断语句

阅读 949·2021-09-24 09:48
VoLLcloud：大促销-香港vps大带宽-CMI三网直连-全场7折-月付低至2.8刀-2G冗余-

阅读 813·2021-08-17 10:14
庆祝新年?画一颗圣诞树?还是...

阅读 1385·2019-08-30 15:55
calc

阅读 2799·2019-08-30 15:55
【winter重学前端笔记13】浏览器：一个浏览器是如何工作的？CSS计算

阅读 1388·2019-08-30 15:44
margin 实现水平居中，垂直居中原理

阅读 2833·2019-08-30 10:59

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

Kafka参数调优实战，看这篇文章就够了！【石杉的架构笔记】

相关文章

Android工程师转型Java后端开发之路，自己选的路，跪着也要走下去！

【转】成为Java顶尖程序员，看这10本书就够了

阿里小哥带你玩转JVM：揭秘try-catch-finally在JVM底层都干了些啥？

阿里小哥带你玩转JVM：揭秘try-catch-finally在JVM底层都干了些啥？

发表评论

0条评论

cloud

男|高级讲师

TA的文章

#黑五#Database Mart，美国达拉斯VPS/独服/GPU服务器4折优惠，月付低至$3.59

【Python从入门到实战】一篇文章带你搞懂Python中的类~

Python中if判断语句

VoLLcloud：大促销-香港vps大带宽-CMI三网直连-全场7折-月付低至2.8刀-2G冗余-

庆祝新年?画一颗圣诞树?还是...

calc

【winter重学前端笔记13】浏览器：一个浏览器是如何工作的？CSS计算

margin 实现水平居中，垂直居中原理

最新活动