资讯专栏INFORMATION COLUMN

3 - collections 模块

Gemini / 1196人阅读

摘要:总结以上这些在日常使用的时候如果不了解,很少会去用到,但如果想写出优雅,简洁的代码,这些概念会起到一定的帮助作用参考

collections 数据类型

collections 数据类型主要是为了弥补 list /tuple / dict 的额外数据类型

ChainMap

代码:

import collections
## 赋值,合并字典的作用
a = {"a":"A"}
b = {"b":"B"}

m = collections.ChainMap(a,b)
for k,v in m.items():
    print("key: {} | value:{}".format(k,v))

print(m)

如果字典中有重复的key值

a = {"a":"A","b":"B"}
b = {"b":"C"}
m2 = collections.ChainMap(a,b)
print(m2)

for k,v in m2.items():
    print("key: {} | value:{}".format(k,v))

输出:

ChainMap({"a": "A", "b": "B"}, {"b": "C"})
key: a | value:A
key: b | value:B

结论:
结果是没有合并,如果只是合并字典的值,还是直接使用update即可, 这个模块不怎么会用到,了解即可

Counter

Counter 顾名思义,就是计算总数的意思,可以计算出一个序列中每个元素的个数,一个简单的例子

>>> import collections
>>> collections.Counter("Hello World")
Counter({"l": 3, "o": 2, "H": 1, "e": 1, " ": 1, "W": 1, "r": 1, "d": 1})

可以使用如下的写法,来得到自己想要的元素的个数

>>> a =  collections.Counter("Hello World")
>>> a["W"]
1

除此之外,Counter对象还支持直接运算

import collections

c1 = collections.Counter("Hello World")
c2 = collections.Counter("Hello Python")

print("c1 + c2 =",c1 + c2)
print("c1 - c2 = ",c1 - c2)
print("c1 | c2 = ",c1 | c2)
print("c1 & c2 = ",c1 & c2)

输出:

c1 + c2 = Counter({"l": 5, "o": 4, "H": 2, "e": 2, " ": 2, "W": 1, "r": 1, "d": 1, "P": 1, "y": 1, "t": 1, "h": 1, "n": 1})
c1 - c2 =  Counter({"l": 1, "W": 1, "r": 1, "d": 1})
c1 | c2 =  Counter({"l": 3, "o": 2, "H": 1, "e": 1, " ": 1, "W": 1, "r": 1, "d": 1, "P": 1, "y": 1, "t": 1, "h": 1, "n": 1})
c1 & c2 =  Counter({"l": 2, "o": 2, "H": 1, "e": 1, " ": 1})
defaultdict

众所周知,当需要获取一个字典的值,可以使用 xx[key] 这样的形式去获取,如果key值不存在,那么就会抛出一个错误,所以大部分推荐的做法是,使用 get 方法来获取字典的值,比如:

test = {"a":"b"}
test.get("a")
# 如果获取一个不存在的 key 值
test.get("b") # 返回None
# 但是通过get 可以指定一个 key 值
test.get("b","this is b") # 返回 this is b

defaultdict 也差不多是这样的道理,当你获取一个不存在的 key 值的时候,返回默认值

import collections

def default_value():
    return "Default value"


m = collections.defaultdict(default_value,foo="aaa")
print(m["fxx"]) # 返回 Default value
deque

双端队列,元素可以从两端弹出,插入和删除操作限定在队列的两边进行

from collections import deque
d = deque("abcdefg")
print(d) # deque(["a", "b", "c", "d", "e", "f", "g"])
d.remove("c")
print(d) # deque(["a", "b", "d", "e", "f", "g"])
d.append("h")
print(d) #deque(["a", "b", "d", "e", "f", "g", "h"])
d.appendleft("1")
print(d) #deque(["1", "a", "b", "d", "e", "f", "g", "h"])
# 使用pop 获取队列中的值
d.pop()
print(d) # deque(["1", "a", "b", "d", "e", "f", "g"])
d.popleft()
print(d) # deque(["a", "b", "d", "e", "f", "g"])

也可以使用线程来消费双端队列

from collections import deque
import time
import threading


# deque 也可以用线程通信
d1 = deque(range(1000))
def task(direction,i,nextSource):
    while True:
        try:
            item = nextSource()
            print("方向:{} 线程: {} 正在处理: {} ".format(direction,i,item))
        except IndexError as e:
            break
        else:
            time.sleep(1)
    

right_ts = [threading.Thread(target=task,args=("right",i,d1.pop))for i in range(10)]
left_ts = [threading.Thread(target=task,args=("left",i,d1.popleft)) for i in range(10)]

for tl in left_ts:
    tl.start()

for tr in right_ts:
    tr.start()

for tl in left_ts:
    tl.join()

for tr in right_ts:
    tr.join()
OrderedDict

使用字典的时候,其输出时,不一定按照当时添加的顺序输出,例如:

d = {}
d["a"]= "A"
d["b"] = 3
d["c"]= 1
d["d"]="B"
d["c"]="C"
for k,v in d.items():
    print(k,"=>",v)

输出:

a => A
b => 3
c => C
d => B

但是 OrderedDict 会

d = OrderedDict()
d["a"]= "A"
d["b"] = 3
d["s"]= 1
d["d"]="B"
d["c"]="C"
for k,v in d.items():
    print(k,"=>",v)

输出:

a => A
b => 3
s => 1
d => B
c => C

当需要使用dict 来作为运算和存储的时候,这就是一个比较有用的特点了。

总结

以上这些在日常使用的时候如果不了解,很少会去用到,但如果想写出优雅,简洁的代码,这些概念会起到一定的帮助作用

参考

《The Python3 Standard Library By Example》

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42978.html

相关文章

  • 不可不知的python模块--collections

    摘要:原生的也可以从头部添加和取出对象就像这样但是值得注意的是,对象的这两种用法的时间复杂度是,也就是说随着元素数量的增加耗时呈线性上升。 基本介绍 Python拥有一些内置的数据类型,比如str, int, list, tuple, dict等, collections模块在这些内置数据类型的基础上,提供了几个额外的数据类型: namedtuple(): 生成可以使用名字来访问元素内容的...

    韩冰 评论0 收藏0
  • node.js操作Mongodb数据库

    摘要:接下去完成与本机上数据库的连接,这是一个异步函数,当连接完成之后,触发执行其回调函数,参数指代这个数据库本身。同样是在完成数据库连接的回调函数当中对这个对象进行操作。当完成修改操作之后触发执行其回调函数,表示对修改结果的反馈。 一、node.js对于mongodb的基本操作 1、数据库的开机 首先我们要先对数据库进行开机的操作,建立一个文件夹用于存放数据库文档。如D:mongo,接下去...

    SKYZACK 评论0 收藏0
  • Backbone源码解读(二)

    摘要:以为例构造函数的内容构造函数的内部一般会做以下几个操作各种给内部对象设置属性。为什么呢源码做出了解释。在里面会调用用户传入的回调函数并触发事件表示已经同步了。整个的源码事实上就是这两组东西。 1. 开场 强烈建议一边看着源码一边读本文章,本文不贴大段代码。源码地址。在写backbone应用的时候,说实话,大部分的时间都是在写这三个模块的内容。关于这三个模块的分析网上随随便便就能找到一堆...

    Sleepy 评论0 收藏0
  • JavaScript 是如何工作的:模块的构建以及对应的打包工具

    摘要:挂机科了次使用这个结构,匿名函数就有了自己的执行环境或闭包,然后我们立即执行。注意,匿名函数的圆括号是必需的,因为以关键字开头的语句通常被认为是函数声明请记住,中不能使用未命名的函数声明。 这是专门探索 JavaScript 及其所构建的组件的系列文章的第 20 篇。 想阅读更多优质文章请猛戳GitHub博客,一年百来篇优质文章等着你! 如果你错过了前面的章节,可以在这里找到它们: ...

    hedzr 评论0 收藏0

发表评论

0条评论

Gemini

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<