资讯专栏INFORMATION COLUMN

python之排序操作及heapq模块

dongfangyiyu / 3505人阅读

摘要:内置的模块接下来我们一一介绍。小伙伴们有没有想我为何介绍这个模块,并且和排序放在一起呢,其实在很多时候我们需要找序列中的前几个最大值或者最小值,使用此模块中的方法是最好不过的了。

说到排序,很多人可能第一想到的就是sorted,但是你可能不知道python中其实还有还就中方法哟,并且好多种场景下效率都会比sorted高。那么接下来我就依次来介绍我所知道的排序操作。
sorted(iterable, *, key=None, reverse=False)

list1=[1,6,4,3,9,5]
list2=["12","a6","4","c34","b9","5"]

print(sorted(list1))    #[1, 3, 4, 5, 6, 9]
print(sorted(list2))    #["12", "4", "5", "a6", "b9", "c34"]
#总结上面两种排序:字符串排序根据元素首字符的ASCII比较进行排序,
#数字类型按照大小排序,数字不能混合排序

list3=[
    {"name":"jim","age":23,"price":500},
    {"name":"mase","age":23,"price":600},
    {"name":"tom","age":25,"price":2000},
    {"name":"alice","age":22,"price":300},
    {"name":"rose","age":21,"price":2400},
]

print(sorted(list3,key=lambda s:(s["age"],s["price"])))
#[{"name": "rose", "age": 21, "price": 2400}, {"name": "alice", "age": 22, "price": 300}, {"name": "jim", "age": 23, "price": 500}, {"name": "mase", "age": 23, "price": 600}, {"name": "tom", "age": 25, "price": 2000}]

最后的reverse参数我就不作说明了,就是把结果进行倒序,可用作降序排列
介绍一种比lambda效率高的方式:
operator模块中的方法itemgetter
>>> itemgetter(1)("ABCDEFG")
"B"
>>> itemgetter(1,3,5)("ABCDEFG")
("B", "D", "F")
>>> itemgetter(slice(2,None))("ABCDEFG")
"CDEFG
运用到上述代码
print(sorted(list3,key=itemgetter("age","price")))    #结果同上但效率会比较高

接下来的排序操作涉及到一个非常重要的一种数据结构——堆,不过今天我主要介绍这个模块中的方法,具体什么是堆,及其还有一种数据结构——栈,有时间我会专门写一篇文章来介绍。
heapq(Python内置的模块)

__all__ = ["heappush", "heappop", "heapify", "heapreplace", "merge",
           "nlargest", "nsmallest", "heappushpop"]

接下来我们一一介绍。
nlargest与nsmallest,通过字面意思可以看出方法大致的作用,接下来动手测验

nlargest(n, iterable, key=None)
nsmallest(n, iterable, key=None)
#n:查找个数    iterable:可迭代对象    key:同sorted

list1=[1,6,4,3,9,5]
list2=["12","a6","4","c34","b9","5"]
list3=[
    {"name":"jim","age":23,"price":500},
    {"name":"mase","age":23,"price":600},
    {"name":"tom","age":25,"price":2000},
    {"name":"alice","age":22,"price":300},
    {"name":"rose","age":21,"price":2400},
]

from operator import itemgetter
import heapq

print(heapq.nlargest(len(list1),list1))
print(heapq.nlargest(len(list2),list2))
print(heapq.nlargest(len(list3),list3,key=itemgetter("age","price")))
#以上代码输出结果同sorted

print(heapq.nsmallest(len(list1),list1))
print(heapq.nsmallest(len(list2),list2))
print(heapq.nsmallest(len(list3),list3,key=itemgetter("age","price")))
#结果是降序
[1, 3, 4, 5, 6, 9]
["12", "4", "5", "a6", "b9", "c34"]
[{"name": "rose", "age": 21, "price": 2400}, {"name": "alice", "age": 22, "price": 300}, {"name": "jim", "age": 23, "price": 500}, {"name": "mase", "age": 23, "price": 600}, {"name": "tom", "age": 25, "price": 2000}]

heappush,heappop,heapify,heapreplace,heappushpop
堆结构特点:heap[0]永远是最小的元素(利用此特性排序)

heapify:对序列进行堆排序,
heappush:在堆序列中添加值
heappop:删除最小值并返回
heappushpop:添加并删除堆中最小值且返回,添加之后删除
heapreplace:添加并删除队中最小值且返回,删除之后添加

nums=[54,23,64.,323,53,3,212,453,65]
heapify(nums)    #先进行堆排序
print(heappop(nums))    #3
print(heappush(nums,50))    #添加操作,返回None
print(heappushpop(nums,10))    #由于是添加后删除,所以返回10
print(heappop(nums))    #23
print(heapreplace(nums,10))    #和heappushpop,返回50
print(nums)    #[10, 53, 54, 65, 323, 64.0, 212, 453]

merge:合并多个序列

list1 = [1, 2, 3, 4, 5, 12]
set1 = {2, 3, 9, 23, 54}
s = list(merge(list1,set1))
print(s)    #[1, 2, 2, 3, 3, 4, 5, 9, 12, 54, 23]
#发现输出结果不仅进行了合并,还进行了排序,有意思哈,可是换个代码测验,你再看一下

list1 = [31, 2, 83, 24, 5, 12]
set1 = {2, 83, 9, 23, 54}
s = list(merge(list1,set1))
print(s)    #[2, 9, 31, 2, 83, 24, 5, 12, 83, 54, 23]
#你们肯定想这是什么鬼,一点都没有头绪,其实经过我的多次测验,还是有规律的,但是由于没有什么作用就不大篇幅说明了,喜欢刨根问题的小伙伴可以尝试自己思考一下。

小伙伴们有没有想我为何介绍这个模块,并且和排序放在一起呢,其实在很多时候我们需要找序列中的前几个最大值或者最小值,使用此模块中的方法是最好不过的了。
如果需要全部排序我们使用sorted,需要查找最大或最小的几个或者多个我们使用alargest/asmallest,查找最大最小使用max/min

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42809.html

相关文章

  • Pythonheapq 模块源码分析

    摘要:原文链接起步模块实现了适用于列表的最小堆排序算法。本文内容将分为三个部分,第一个部分简单介绍模块的使用第二部分回顾堆排序算法第三部分分析中的实现。总结堆排序结合图来理解还是比较好理解的。 原文链接:https://www.hongweipeng.com/i... 起步 heapq 模块实现了适用于Python列表的最小堆排序算法。 showImg(https://segmentfaul...

    CoderBear 评论0 收藏0
  • Python 列表推导优先级队列的实现

    摘要:主要介绍列表列表推导有关的话题,最后演示如何用列表实现一个优先级队列。笛卡尔积列表推导还可以生成两个或以上的可迭代类型的笛卡尔积。两个优先级相同的元素和,操作按照它们被插入到队列的顺序返回。变量的作用是保证同等优先级元素的正确排序。 这一篇是《流畅的 python》读书笔记。主要介绍列表、列表推导有关的话题,最后演示如何用列表实现一个优先级队列。 Python 内置序列类型 Pytho...

    darkerXi 评论0 收藏0
  • Python基础(十)模块

    摘要:是回调函数,当链接服务器和相应数据传输完毕时触发本函数可选。仅仅是针对的,在中,已经没有这个模块了,取代它的是。由于以流式读取文件,从而速度较快,切少占用内存,但是操作上稍复杂,需要用户实现回调函数。 编写模块 模块是程序 模块就是一个扩展名为.py的Python程序。 编写模块 #!/usr/bin/env python # coding=utf-8 lang = python 引...

    jlanglang 评论0 收藏0
  • Python奇遇记:数据结构窥探

    摘要:挤掉了堆中实现了堆排序。你可以用堆排序来查找一个序列中最大的或者最小的几个元素。除了使用堆排序,中还有排序和,这两个排序最终生成以列表表示的排序结果,堆排序也是。 这次我们来说说python中的数据结构。当然了,不会讲很基础的内容。 用过python的都知道,python有着与其他语言很不一样的数据类型,像什么列表、元组、集合、字典之类。这些数据类型造就了python简单易用同时又很强...

    mrli2016 评论0 收藏0
  • 4-array/heapq/queue模块

    摘要:定义了一个非常类似的模块,其函数接受两个参数,第一个参数是预先定义好的类型,第二个参数,一般为一个序列。很少见到代码输出是中实现堆排序的模块。这里主要看一下优先级队列定义优先级比较输出 array array 定义了一个非常类似list的模块,其array 函数接受两个参数,第一个参数是预先定义好的类型,第二个参数,一般为一个序列。 很少见到代码: import array a = ...

    forrest23 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<