资讯专栏INFORMATION COLUMN

集群因子对索引性能的影响

IT那活儿 / 2816人阅读
集群因子对索引性能的影响
点击上方“IT那活儿”公众号,关注后了解更多内容,不管IT什么活儿,干就完了!!!


01

最近在学习sql优化,好奇集群因子对索引性能的影响。
首先介绍一下什么是集群因子。
官网文档上原文:

A measure of the row order in relation to an indexed value such as last name. 

The more order that exists in row storage for this value, the lower the clustering factor。

简而言之,当使用索引对表进行扫描时,需要扫描表的数据块的数量。该值越小越好。

02

通过下面的小实验来确定其作用和影响
2.1 创建两张表t1,t2
t2根据object_id排序就行创建;
2.2 创建索引
2.3 查询索引集群因子
2.4 测试
结论:可以看出一致读相差两倍,影响集群因子的主要因素是索引上连续行对应的rowid是否分布在相同的块上,如果不在同一个块上,对应的集群因子则加1 。
上述实验中表tab2的创建是根据排序后的列DATA_OBJECT_ID,则索引的集群因子比排序的小。假设返回的行rowid在1个块里,则只需要回表一次,rowid在10个块里则需要回表10次。
当然所查数据都在buffer cache中则集群因子不影响性能。走唯一索引也不影响。集群因子在表创建时就决定了,只能通过order by排序后创建才能更改。

本文作者:吕金臣(上海新炬王翦团队)

本文来源:“IT那活儿”公众号

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/129376.html

相关文章

  • Hadoop 托管Hadoop集群 UHadoop

    摘要:如果长时间之后,集群的数据量还是不均衡,可以在集群管理页面提交数据均衡请求,如下图数据均衡数据均衡也可以在节点提交均衡命令是判断集群是否平衡的目标参数。 Hadoop本篇目录访问HDFS数据提示Operation category READ is not supported in state standby?为什么HDFS实际可用空间比配置的小?为什么/home/hadoop/etc/had...

    ernest.wang 评论0 收藏2864
  • Hadoop学习热身——HDFS概念

    摘要:助辅助做元数据的备份。元数据存储在内存和磁盘中,这是因为磁盘的读写效率较低,而保存到内存又有断电消失的隐患。但磁盘中的元数据并不是最新的,内存中的元数据才是实时的。将中的和复制到自身节点上并加载进内存,根据的记录操作更改元数据信息。 HDFS(Hadoop Distributed File System ) 前言:最近正式进入了大数据框架的学习阶段,文章来自个人OneNote笔记全部...

    AnthonyHan 评论0 收藏0

发表评论

0条评论

IT那活儿

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<