资讯专栏INFORMATION COLUMN

Python每日一练0010

jayzou / 1567人阅读

摘要:问题你有一个字典或者实例的序列,然后你想根据某个特定的字段来分组迭代访问。

问题

你有一个字典或者实例的序列,然后你想根据某个特定的字段来分组迭代访问。

解决方案

使用itertools.groupby() 函数

假设有下列的字典列表:

rows = [
    {"address": "5412 N CLARK", "date": "07/01/2012"},
    {"address": "5148 N CLARK", "date": "07/04/2012"},
    {"address": "5800 E 58TH", "date": "07/02/2012"},
    {"address": "2122 N CLARK", "date": "07/03/2012"},
    {"address": "5645 N RAVENSWOOD", "date": "07/02/2012"},
    {"address": "1060 W ADDISON", "date": "07/02/2012"},
    {"address": "4801 N BROADWAY", "date": "07/01/2012"},
    {"address": "1039 W GRANVILLE", "date": "07/04/2012"},
]

现在按照date字段来分组访问,就可以使用itertools.groupby()

from itertools import groupby
from operator import itemgetter
rows.sort(key=itemgetter("date"))
for key, group in groupby(rows, key=itemgetter("date")):
    print(key)
    for item in group:
        print(4 * " ", item)

输出

07/01/2012
     {"address": "5412 N CLARK", "date": "07/01/2012"}
     {"address": "4801 N BROADWAY", "date": "07/01/2012"}
07/02/2012
     {"address": "5800 E 58TH", "date": "07/02/2012"}
     {"address": "5645 N RAVENSWOOD", "date": "07/02/2012"}
     {"address": "1060 W ADDISON", "date": "07/02/2012"}
07/03/2012
     {"address": "2122 N CLARK", "date": "07/03/2012"}
07/04/2012
     {"address": "5148 N CLARK", "date": "07/04/2012"}
     {"address": "1039 W GRANVILLE", "date": "07/04/2012"}
讨论

itertools.groupby迭代器和一个可选的key参数,按key来分组的,如果key是None的话,则按元素分组

itertools.groupby返回每个不同的key和一个迭代器对象,这个迭代器对象就是key对应的一组元素

并且itertools.groupby要求分组之前,迭代器的所有元素必须是有序的,原因跟itertools.groupby的实现有关

itertools.groupby()大致实现:

class groupby:
    # [k for k, g in groupby("AAAABBBCCDAABBB")] --> A B C D A B
    # [list(g) for k, g in groupby("AAAABBBCCD")] --> AAAA BBB CC D
    def __init__(self, iterable, key=None):
        if key is None:
            key = lambda x: x
        self.keyfunc = key
        self.it = iter(iterable)
        self.tgtkey = self.currkey = self.currvalue = object()
    def __iter__(self):
        return self
    def __next__(self):
        while self.currkey == self.tgtkey:
            self.currvalue = next(self.it)    # Exit on StopIteration
            self.currkey = self.keyfunc(self.currvalue)
        self.tgtkey = self.currkey
        return (self.currkey, self._grouper(self.tgtkey))
    def _grouper(self, tgtkey):
        while self.currkey == tgtkey:
            yield self.currvalue
            try:
                self.currvalue = next(self.it)
            except StopIteration:
                return
            self.currkey = self.keyfunc(self.currvalue)
来源

Python Cookbook

关注

欢迎关注我的微信公众号:python每日一练

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41451.html

相关文章

  • Python每日一练0003

    摘要:问题在每日一练中介绍了如何一个可迭代对象,使用运算符即可但往往我们遇到的问题是可迭代对象中的数量是不确定的这个时候该如何拿到我们想要的元素,比如我们只需要可迭代对象的第一个或者最后一个元素而已解决方案使用中的运算符例如我们需要拿到一个元组的 问题 在每日一练0001中介绍了如何unpack一个可迭代对象,使用,运算符即可 但往往我们遇到的问题是可迭代对象中的数量是不确定的 这个时候该如...

    happyfish 评论0 收藏0
  • Python每日一练0002

    摘要:问题如何序列化输出元素包含字符串元组的字符串元组好绕举个例子将输出为解决方案容易想到使用函数,但函数要求元素必须都是字符串类型,否则会抛出错误一个比较简单的方法是将给进中,然后再将给进函数,最后指定函数的参数来输出如果想要将结果存储起来,那 问题 如何序列化输出元素包含字符串元组的字符串元组(好绕) 举个例子 >>> zoo1 = (monkey, elephant) >>> zoo2...

    yvonne 评论0 收藏0
  • Python每日一练0024

    摘要:问题如何执行外部命令,如解决方案使用库在之前,使用函数在及之后,使用函数讨论命令的执行默认不需要环境,所以当你使用作为参数时,需要将置位,否则会报错误通常来说对于执行系统命令,我们会想到,但在官方文档中已经建议了使 问题 如何执行外部命令,如ls -l 解决方案 使用subprocess库 在Python 3.5之前,使用subprocess.call()函数 >>> import s...

    wqj97 评论0 收藏0
  • Python每日一练0023

    摘要:问题如何判断一个文件是否存在解决方案这个问题可以分成几类问题如果这里的文件指的是文件或目录,我们可以用方法如果这里的文件指的是普通的文件,我们可以用方法如果这里的文件指的是目录,我们可以用方法并且在之后,可以使用面向对象的方法使用库来判断, 问题 如何判断一个文件是否存在 解决方案 这个问题可以分成几类问题 如果这里的文件指的是文件或目录,我们可以用os.path.exists()方法...

    wuyangnju 评论0 收藏0
  • Python每日一练0020

    摘要:问题你需要执行简单的日期操作,计算两个日期间隔多少天某个日期后的多少天是几月几日转换时间字符串的格式等解决方案使用库中的和类其中类代表一个日期时间,例如年月日点分秒类代表一个日期间隔对于实例,可以直接进行数学运算得到一个实例,也就是两个日 问题 你需要执行简单的日期操作,计算两个日期间隔多少天、某个日期后的多少天是几月几日、转换时间字符串的格式等 解决方案 使用datetime库中的d...

    Berwin 评论0 收藏0

发表评论

0条评论

jayzou

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<