Spring/Hibernate 应用性能优化的7种方法

lavor 发布于2019-08-14 12:48 / 2236人阅读

摘要：对于大多数典型的企业应用而言，其性能表现几乎完全依赖于持久层的性能。速成法使用批处理对于批处理程序，驱动程序提供了旨在减少网络来回传输的优化方法。速成法检查错误的提交间隔如果你使用批处理程序，提交间隔会对性能造成十倍甚至百倍的影响。

对于大多数典型的 Spring/Hibernate 企业应用而言，其性能表现几乎完全依赖于持久层的性能。此篇文章中将介绍如何确认应用是否受数据库约束，同时介绍七种常用的提高应用性能的速成法。本文系 OneAPM 工程师编译整理。

如何确认应用是否受限于数据库

确认应用是否受限于数据库的第一步，是在开发环境中进行测试，并使用 VisualVM 进行监控。VisualVM 是一款包含在 JDK 中的 Java 分析器，在命令行输入 jvisualvm 即可调用。

启用 Visual VM 之后，尝试以下步骤：

双击你正在运行的应用

选择 Sampler

点击 Settings 复选框

选择Profile only packages，然后输入下列包：

your.application.packages.*

org.hibernate.*

org.springframework.*

your.database.driver.package, 比如 oracle.*

点击 Sample CPU

如果应用性能受限于数据库，其 CPU 分析结果看起来会像下图：

我们看到，客户端 Java 进程花在等待数据库从网络中返回结果的时间占56%。

看到数据库查询是导致应用运行缓慢的原因，其实是好兆头。Hibernate 反射调用占比32.7%是正常情况，无法进一步优化。

性能调优第一步：定义基准运行

性能调优的第一步是为程序定义基准运行，我们要定义一组能有效执行的输入数据，让程序基准运行与生产环境下的运行差不多。

主要的区别在于基准运行的耗时要小很多。作为参考，5到10分钟的执行时间比较不错。

什么是好的基准？

好的基准应该具备以下特征：

功能正确

输入数据的种类与生产环境下相似

在短时间内执行完毕

基准运行的优化方案可以外推至完整运行

定义好的基准是成功解决问题的一半。

什么是不好的基准

例如，通过批量运行处理通讯系统的电话数据记录，选取10000条记录就是错误的做法。

原因是：前10000条记录可能多为语音电话，而未知的性能问题可能发生在短信流量的处理过程中。一开始如果基准不够好，就会导致错误的结论。

收集 SQL 日志与查询时间

SQL 查询的执行语句与其执行时间可以通过 log4jdbc等方式收集。详细了解如何使用 log4jdbc 收集 SQL 查询信息，点击文章使用 log4jdbc 优化 Spring/Hibernate 应用 SQL 日志。

查询的执行时间是从 Java 客户端收集的，该时间包含查询数据库的来回网络调用。SQL 查询的日志如下：

16 avr. 2014 11:13:48 | SQL_QUERY /* insert your.package.YourEntity */ insert into YOUR_TABLE (...) values (...) {executed in 13 msec}

预处理语句也是很重要的信息来源，它们常常会透露出常用的查询类型。了解更多的日志讯息，可以查看文章：Hibernate 为什么/在何处使用该 SQL 查询？

通过 SQL 日志可以了解哪些指标？

SQL 日志可以回答下列问题：

哪些是执行过的最慢查询？

哪些是最常用的查询？

生成主键的耗时是多少？

是否有数据适合缓存？

如何解析 SQL 日志

对于大量的日志文件，最可行的解析方式就是使用命令行工具，该方法的好处是非常灵活，只要写一小段脚本或命令，我们可以抽取出几乎大多数指标。只要你喜欢，任何命令行工具都适用。

如何你习惯了 Unix 命令行，bash 或是一个好选择。Bash 也可以在 Windows 工作站使用，Cygwin 或 Git 都包含了 bash 命令行。

常用的速成法

下面介绍的速成法能找出 Spring/Hibernate 应用中常见的性能问题，以及对应的解决方案。

速成法1——减少生成主键的代价

在插入操作频繁的进程中，主键的生成策略很重要。生成 id 的一种常见方法是使用数据库序列，通常一张表一个 id，从而避免在不同表间进行插入时的冲突。

问题在于，如果要插入50条记录，我们希望为了获取这50个 id，可以避免50趟查询数据库的来回网络调用，让 Java 进程不一直等待。

Hibernate 通常如何解决此问题？

Hibernate 提供了优化的 ID 生成器以避免此问题。也即，对于序列，会默认使用 HiLo id 生成器。以下是 HiLo 序列生成器的工作方式：

调用一次序列，获得 1000 (高值)

用以下方式计算50个 id

1000 * 50 + 0 = 50000

1000 * 50 + 1 = 50001

...

1000 * 50 + 49 = 50049, 达到低值 (50)

为新的高值1001调用序列，依次类推

因此一次序列调用，可生成50个键，从而减少数次来回网络调用导致的负担。

这些优化的键生成器默认在 Hibernate 4中开启。如要禁用，可将 hibernate.id.new_generator_mappings 设置为 false。

为什么生成主键仍是一个问题？

问题在于，如果你声明键生成策略为 AUTO，且未启用优化的键生成器，那么应用最后会面临大量的序列调用。

为了确保启用优化的键生成器，请将键生成策略改为 SEQUENCE 而非 AUTO。

@Id
@GeneratedValue(strategy = GenerationType.SEQUENCE, generator = "your_key_generator")
private Long id;

改变设定之后，在插入操作频繁的应用中能看到10%到20%的性能提升，而且几乎没有改动代码。

速成法2——使用 JDBC 批处理 inserts/updates

对于批处理程序，JDBC 驱动程序提供了旨在减少网络来回传输的优化方法：”JDBC batch inserts/updates“。使用该方法后，插入或更新会先在驱动层排队，然后再传送到数据库。

当达到阈值后，所有排队的语句都会一次性传给数据库。这可以避免驱动程序逐一传送语句，导致网络来回传送的负担。

经过以下配置，就能激活批处理 inserts/updates：

100  
true  
true

仅设置 JDBC 批处理大小并不够。因为 JDBC 驱动程序只会在收到对同一张表 insert/updates 时批处理这些语句。

如果收到对一张新表的插入语句，JDBC 驱动程序会先清除对前一张表的批处理语句，然后开始分批处理针对新表的 SQL 语句。

Spring Batch 内置了相似的功能。该优化能在插入操作频繁的应用中带来30%到40%的性能提升，而不用改动任何代码行。

速成法3——定期清理 Hibernate 会话

在向数据库添加或修改数据时，Hibernate 会在会话中保留一版已经存在的实体，以防在会话关闭之前这些实体再度被修改。

但是，多数情况下，一旦对应的插入操作已经在数据库中完成，我们就可以安心地丢弃那些实体。这会释放 Java 客户端进程中的内存，避免过久的 Hibernate 会话导致的性能问题。

这种长久的会话应该尽量避免。但如果出于某种原因不得不使用它们，以下是控制内存消耗的方法：

entityManager.flush();
entityManager.clear();

flush 会触使新实体中的插入语句传送至数据库。clear 则会释放会话中的新实体。

速成法4——减少 Hibernate dirty-checking(脏数据检查) 的代价

Hibernate 内部使用了一种机制用于追踪被修改的实体，名为 dirty-checking。该机制并不基于实体类中的 equals 和 hashcode 方法。

Hibernate 尽可能将 dirty-checking 的性能成本保持在最低值，只在需要时使用 dirty-check。但是该机制也有成本，在列数很多的表中该成本尤其可观。

在进行任何优化之前，最重要的是使用 VisualVM 测量 dirty-checking 的成本。

如何避免 dirty-checking ？

dirty-checking 可以通过以下方式禁用：

@Transactional(readOnly=true)
public void someBusinessMethod() {
....
}

禁用 dirty-checking 的另一种方式是使用 Hibernate 无状态会话，预知详情请查看文档。

速成法5——搜索”坏“查询计划

检查最慢查询列表，看看有没有好的查询计划。最常见的”坏“查询计划包括：

全表搜索：通常缺少一个索引或表统计过期时进行全表搜索。

全笛卡尔连接：意思是计算多张表的全笛卡尔乘积。检查一下缺少的连接条件，或拆分为几个步骤以简化查询。

速成法6——检查错误的提交间隔

如果你使用批处理程序，提交间隔会对性能造成十倍甚至百倍的影响。

请确保提交间隔是符合预期的（对于 Spring 批任务，通常是100到1000之间）。经常，该参数的配置不正确。

速成法7—— 使用二级查询缓存

如果一些数据可以缓存，则可以查看本文了解如何设置 Hibernate 缓存：Hibernate 二级/查询缓存的陷阱。

结论

解决应用性能问题的关键，在于通过收集一些指标发现当前的瓶颈。

没有一些测量指标，往往无法在短时间内找到真正的问题根源。

此外，很多典型的数据库驱动应用的性能陷阱，如果一开始就使用了 Spring Batch，就能够避免。

原文地址：http://blog.jhades.org/performance-tuning-of-spring-hibernate-applications/

OneAPM for Java 能够深入到所有 Java 应用内部完成应用性能管理和监控，包括代码级别性能问题的可见性、性能瓶颈的快速识别与追溯、真实用户体验监控、服务器监控和端到端的应用性能管理。想阅读更多技术文章，请访问 OneAPM 官方博客

云服务器 GPU云服务器深度学习的7种 js的数据7种类型在家赚钱的十种方法数据迁移的四种方法

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/64716.html

纳税服务系统【总结】

摘要：要是使用到日历的话，我们想到使用这个日历类上面仅仅是我个人总结的要点，如果有错误的地方还请大家给我指正。纳税服务系统总结纳税服务系统是我第一个做得比较大的项目(不同于javaWeb小项目),该项目系统来源于传智Java32期，十天的视频课程(想要视频的同学关注我的公众号就可以直接获取了) 我跟着练习一步一步完成需求，才发觉原来Java是这样用来做网站的，Java有那么多的类库，页面...

ispring 2019-08-15 14:48 评论0 收藏0
慕课网_《Spring入门篇》学习总结

摘要：入门篇学习总结时间年月日星期三说明本文部分内容均来自慕课网。主要的功能是日志记录，性能统计，安全控制，事务处理，异常处理等等。《Spring入门篇》学习总结时间：2017年1月18日星期三说明：本文部分内容均来自慕课网。@慕课网：http://www.imooc.com教学示例源码：https://github.com/zccodere/s...个人学习源码：https://git...

Ververica 2019-08-16 10:29 评论0 收藏0
SSH框假中spring充当了管理容器的角色

摘要：在框假中充当了管理容器的角色。中也有对事务的管理，中事务管理是通过创建和维护来完成。这也就是所谓控制反转的概念所在依赖控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。在SSH框假中spring充当了管理容器的角色。我们都知道Hibernate用来做持久层，因为它将JDBC做了一个良好的封装，程序员在与数据库进行交互时可以不用书写大量的SQL语句。Struts是用来做应用层...

WrBug 2019-08-14 17:45 评论0 收藏0
[转载]使用IntelliJ IDEA开发SpringMVC网站（一）开发环境

摘要：最近在做某在线教育平台网站的开发，按师兄的建议要用来搞。现在把开发过程中的一些相关经验贴出来。事先声明，请确保和都已经安装好。对于不使用的开发者，可以直接建一个简单的项目。使用的话，请按照图进行操作。访问GitHub下载最新源码：https://github.com/gaussic/Sp... 文章已针对IDEA 2016做了一定的更新，部分更新较为重要，请重新阅读文章并下载最新源码...

Ali_ 2019-08-16 15:07 评论0 收藏0
Reflection：Java反射机制的应用场景

近期在维护公司项目的时候遇到一个问题，因为实体类中的 set 方法涉及到了业务逻辑，因此在给对象赋值的过程中不能够使用 set 方法，为了实现功能，所以采用了反射的机制给对象属性赋值，借此机会也了解了反射的一些具体用法和使用场景，分以下两点对反射进行分析：反射的优势和劣势反射的应用场景反射的优势和劣势个人理解，反射机制实际上就是上帝模式，如果说方法的调用是 Java 正确的打开方式...

浠ラ箍 2019-08-15 10:48 评论0 收藏0