资讯专栏INFORMATION COLUMN

JS 中 Array.sort 的那些事儿

Sike / 3390人阅读

摘要:然而有时候的结果和预期结果还是有些差异的。中文的可以通过来获取。啊次比例中毓比侊啊比侊比例次毓中当然和允许传入参数指定,有兴趣的可以去上看看用法。对于中文或者需要本地化比较的场景下,可以使用或者来进行比较。

大家都知道 js 自带了一个排序方法 sort,很多时候需要排序的时候也都直接使用了 sort 方法来排序。然而有时候 sort 的结果和预期结果还是有些差异的。

看下面的代码

[1, 23, 2, 3].sort()

自然语言情况下,我们期望的 排序结果应该是 [1,2,3,23] ,然而实际结果 [1, 2, 23, 3]

首先我们来看下各个浏览器( js 引擎) 的排序算法。

浏览器 使用的 JavaScript 引擎 排序算法 源码地址
Google Chrome V8 插入排序和快速排序 sort 源码实现
Mozilla Firefox SpiderMonkey 归并排序 sort 源码实现
Safari Nitro(JavaScriptCore ) 归并排序和桶排序 sort 源码实现
Microsoft Edge 和 IE(9+) Chakra 快速排序 sort 源码实现
注:上述表格数据来源于 排序算法

v8 为例, 它分别使用了 插入排序和 快速排序,分别使用的场景 可以查看源码,也可以看 justjavac 大佬的这篇文章 ,同时这篇文章也分析了一个排序的坑。

sort 没传递 compareFn 的时候,就会使用默认的 compareFn ,而 sort 很多的坑都源于这里。 根据 justjavac 大大的那篇文章里的分析和 ecma 标准里的声明,我们得知compareFn 会在内部尝试调用 toString 将比较的对象转化成字符串。

在转化成字符串这一步之后,坑就出现了。当 xy (这里 xy 都已经是字符串了)进行比较的,其实是依据字典序来比较的,而比较的对象其实数据的 charCode

字典序的比较方法引用一下 维基百科上的说法:

是先按照第一个字母、以 a、b、c……z 的顺序排列;如果第一个字母一样,那么比较第二个、第三个乃至后面的字母。如果比到最后两个单词不一样长(比如,sigh 和 sight),那么把短者排在前。

因此,在 [1, 23, 2, 3].sort() 中,比较的时候其实是 "1"、"23"、"2"、"3"、 来进行比较的(注意引号,是字符串)。 下面是这些字符串的 charCode 表:

1 23 2 3
49 50 51 50 51

"1""23" 比较,先比较第一位 charCode, 49 小于50,直接判定成功,"1"<"23" ,而 "23""2" 比较,第一位 charCode 相同,判断不了,看第二位; 而第二位上 一个是 51,一个是”空“ 的,因此 2 < 23。而"23""3" 比较, 由于2charCode 小于 3 的, 因此也直接判定成功,23 < 3。

类比可以考虑一下我们小学时候使用的字典 ,字典前面的拼音索引, ai 的拼音也始终在 ba 前面,因为 a 的字典序小于 b

同样的,来看下英文: ["a","ba","b","c","ca"]

a b ba c ca
97 98 98 97 99 97

根据上面的规则,我们可以很容易推断出排序结果: ["a", "b", "ba", "c", "ca"]

最后看看中文的: ["啊","次","比例","中","毓","比侊"]

比例 比侊
21834 27425 27604 20363 20013 27603 27604 20362

同样的,根据上面的规则,结果也是一目了然:["中", "啊", "次", "毓", "比侊", "比例"]

中文的 charCode可以通过 charCodeAt 来获取。

这样的排序结果很多时候并不是我们需要的,因此 sort 也允许我们传入一个 compareFn 来实现自定义排序规则,通过返回 -1、0、1 来觉得排序结果的大小顺序。对于可以比较的数值,我们可以通过 x-y 的方式来处理,那么中文又该怎么办呢?能不能按照拼音的顺序来排序?

答案是肯定的!

String 现在有了一个 localeCompare 的方法用于本地化比较。

["啊","次","比例","中","毓","比侊"].sort((x,y) => x.localeCompare(y))
// ["啊", "比侊", "比例", "次", "毓", "中"]

在 MDN 中,在涉及到大量比较的时候更推荐的是 Intl.Collator。 Intl 对象是 ECMAScript 国际化 API 的一个命名空间,它提供了精确的字符串对比,数字格式化,日期和时间格式化。

const collator = new Intl.Collator()
["啊","次","比例","中","毓","比侊"].sort(collator.compare)
// ["啊", "比侊", "比例", "次", "毓", "中"]

当然 localeCompareIntl.Collator 允许传入参数指定 locale, 有兴趣的可以去 MDN 上看看用法。

最后,内置 sort 的默认 compareFn 方法是基于字典序排序的, 而字典序比较的对象是 数据的 charCode。当 sort 默认的排序行为和预期不一样或者无法满足需求的时候,我们可以传入自定义的 compareFn 来进行排序。对于中文或者需要本地化比较的场景下,可以使用 String.localeCompare 或者 Intl.Collator 来进行比较。

最后的最后,如有错误,欢迎大家指出,一起讨论进步。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/108624.html

相关文章

  • JavaScript30秒, 从入门到放弃之Array(四)

    摘要:使用把指定运算结果为的数组元素添加到二维数组的第一个数组中,运算结果为的数组元素添加到二维数组的第二个数组中。所以改成了,它是不改变数组元素的,没有副作用,不干扰后续。方法将剩余的所有数组元素以的方式返回结果数组。 原文地址:JavaScript30秒, 从入门到放弃之Array(四)博客地址:JavaScript30秒, 从入门到放弃之Array(四) 水平有限,欢迎批评指正 ma...

    wuaiqiu 评论0 收藏0
  • JS专题之数组去重

    摘要:将元素作为对象的键,默认键对应的值为如果对象中没有这个键,则将这个元素放入结果数组中去。 前言 数组去重在日常开发中的使用频率还是较高的,也是网上随便一抓一大把的话题,所以,我写这篇文章目的在于归纳和总结,既然很多人都在提的数组去重,自己到底了解多少呢。又或者是如果自己在开发中遇到了去重的需求,自己能想到更好的解决方案吗。 这次我们来理一理怎么做数组去重才能做得最合适,既要考虑兼容性,...

    only_do 评论0 收藏0
  • [聊一聊系列]聊一聊前端模板与渲染那些事儿

    摘要:欢迎大家收看聊一聊系列,这一套系列文章,可以帮助前端工程师们了解前端的方方面面不仅仅是代码作为现代应用,的大量使用,使得前端工程师们日常的开发少不了拼装模板,渲染模板。我们今天就来聊聊,拼装与渲染模板的那些事儿。一改俱改,一板两用。 欢迎大家收看聊一聊系列,这一套系列文章,可以帮助前端工程师们了解前端的方方面面(不仅仅是代码):https://segmentfault.com/blog...

    UCloud 评论0 收藏0
  • [聊一聊系列]聊一聊前端模板与渲染那些事儿

    摘要:欢迎大家收看聊一聊系列,这一套系列文章,可以帮助前端工程师们了解前端的方方面面不仅仅是代码作为现代应用,的大量使用,使得前端工程师们日常的开发少不了拼装模板,渲染模板。我们今天就来聊聊,拼装与渲染模板的那些事儿。一改俱改,一板两用。 欢迎大家收看聊一聊系列,这一套系列文章,可以帮助前端工程师们了解前端的方方面面(不仅仅是代码):https://segmentfault.com/blog...

    Yangder 评论0 收藏0
  • [聊一聊系列]聊一聊前端模板与渲染那些事儿

    摘要:欢迎大家收看聊一聊系列,这一套系列文章,可以帮助前端工程师们了解前端的方方面面不仅仅是代码作为现代应用,的大量使用,使得前端工程师们日常的开发少不了拼装模板,渲染模板。我们今天就来聊聊,拼装与渲染模板的那些事儿。一改俱改,一板两用。 欢迎大家收看聊一聊系列,这一套系列文章,可以帮助前端工程师们了解前端的方方面面(不仅仅是代码):https://segmentfault.com/blog...

    褰辩话 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<