百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python强大的内置模块collections

itomcoil 2025-05-03 14:45 26 浏览

1. 模块说明

collections 是 Python 的一个内置模块,所谓内置模块的意思是指 Python 内部封装好的模块,无需安装即可直接使用。

  • collections 包含了一些特殊的容器,针对 Python 内置的容器,例如:list、dict、set、tuple,提供了另一种选择;
  • namedtuple:可以创建包含名称的 tuple;
  • deque:类似于 list 的容器,可以快速的在队列头部和尾部添加、删除元素;
  • OrderedDict:dict的子类,可以记住元素的添加顺序;
  • defaultdict:dict的子类,可以调用提供默认值的函数;
  • Counter:dict的子类,计算可hash的对象;


2. 实战代码

(1). testNamedTuple函数

Python 提供了很多非常好用的基本类型,比如不可变类型 tuple,我们可以轻松地用它来表示一个二元向量。

namedtuple 是一个函数,它用来创建一个自定义的 tuple 对象,并且规定了 tuple 元素的个数,并可以用属性而不是索引来引用 tuple 的某个元素。

如此一来,我们用 namedtuple 可以很方便地定义一种数据类型,它具备 tuple 的不变性,又可以根据属性来引用,使用十分方便。

本示例中我们使用了一个三维坐标 x,y,z 来定义一个 tuple 对象,对象元素有3个,然后通过坐标值来引用相应的值即可。

from collections import namedtuple
from collections import deque
from collections import defaultdict
from collections import OrderedDict
from collections import Counter


def testNamedTuple():
    vector=namedtuple('vector',['x','y','z'])
    flag=vector(3,4,5)
    print(type(flag))
    print(isinstance(flag,vector))
    print(isinstance(flag,tuple)) #通过这里的判定我们就可以知晓它是元组类型
    print(flag.x,flag.y,flag.z)


(2). testDeque函数

deque是栈和队列的一种广义实现,deque是 "double-end queue" 的简称;

deque支持线程安全、有效内存地以近似O(1)的性能在 deque 的两端插入和删除元素,尽管 list 也支持相似的操作,但是它主要在固定长度操作上的优化,从而在 pop(0) 和 insert(0,v)(会改变数据的位置和大小)上有O(n)的时间复杂度。

在数据结构中,我们知道队列和堆栈是两个非常重要的数据类型,一个先进先出,一个后进先出。

在 python 中,使用 list 存储数据时,按索引访问元素很快,但是插入和删除元素就很慢,因为 list 是线性存储,数据量大的时候,插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向链表结构,非常适合实现队列和堆栈这样的数据结构。

def testDeque():
    list1=[x*x for x in range(101)]
    delist=deque(list1) #对列表进行了一次再处理,让list1列表变成了双向链表结构
    delist.append(1000)#将x添加到deque的右侧
    delist.appendleft(2000)#将x添加到deque的左侧
    delist.pop(1000)#移除和返回deque中最右侧的元素,如果没有元素,将会报出IndexError;
    delist.popleft()#移除和返回deque中最左侧的元素,如果没有元素,将会报出IndexError;
    delist.count(1)#返回deque中元素等于1的个数
    delist.remove(10000)#移除第一次出现的value,如果没有找到,报出ValueError;
    delist.reverse()#反转deque中的元素,并返回None;
    list2=[1,3,4,5]
    delist.extend(list2)#将可迭代变量iterable中的元素添加至deque的右侧
    delist.extendleft(list2)#将变量iterable中的元素添加至deque的左侧,往左侧添加序列的顺序与可迭代变量iterable中的元素相反
    delist.maxlen()#只读的属性,deque的最大长度,如果无解,就返回None
    delist.rotate(1)#从右侧反转n步,如果n为负数,则从左侧反转
    delist.clear()#将deque中的元素全部删除,最后长度为0;


(3). testDefaultdict函数

defaultdict是内置数据类型 dict 的一个子类,基本功能与 dict 一样,只是重写了一个方法__missing__(key)和增加了一个可写的对象变量 default_factory。

使用 dict 字典类型时,如果引用的 key 不存在,就会抛出 KeyError。如果希望 Key 不存在时,返回一个默认值,就可以用 defaultdict。

def testDefaultdict():
    dict1= defaultdict(lambda: 'default') #Key不存在时,返回一个默认值,就可以用default,defaultdict的其他行为跟dict是完全一样的
    dict1["k1"]="v1"
    print(dict1["k2"])

    list2= [('yellow',11),('blue',2),('yellow',3),('blue',4),('red',5),('red',10)]
    dict1 = defaultdict(list)#使用list作为default_factory,很容易将一个key-value的序列转换为一个关于list的词典
    for k,v in list2:
        dict1[k].append(v)
    print(dict1)


(4). testOrderedDict函数

OrderedDict类似于正常的词典,只是它记住了元素插入的顺序,当在有序的词典上迭代时,返回的元素就是它们第一次添加的顺序。这样 dict 就是一个有序的字典。

使用 dict 时,key 是无序的。在对 dict 做迭代时,我们无法确定 key 的顺序。但是如果想要保持 key 的顺序,可以用 OrderedDict。

def testOrderedDict():
    dict1=dict([('aaa', 111), ('ddd',444),('bbb', 222), ('ccc', 333)])
    print(dict1)

    dict2 = OrderedDict([('ddd',444),('aaa', 111), ('bbb', 222), ('ccc', 333)])#OrderedDict的key会按照插入的顺序排列,不是key本身排序
    print(dict2)

    dict3 = {"banana": 33, "apple": 222, "pear": 1, "orange": 4444}
    # dict sorted by key
    dict4=OrderedDict(sorted(dict3.items(), key=lambda t: t[0]))
    print("dict4",dict4)
    # dict sorted by value
    dict5=OrderedDict(sorted(dict3.items(), key=lambda t: t[1]))
    print("dict5",dict5)
    # dict sorted by length of key string
    dict6 = OrderedDict(sorted(dict3.items(), key=lambda t: len(t[0])))
    print("dict6",dict6)
    print(dict6['apple'])


(5). testCounter函数

def testCounter():
    '''counter可以支持方便、快速的计数'''
    str1="abcdefgabcedergeghdjlkabcdefe" #将可迭代的字符串初始化counter
    str2=Counter(str1)
    print(str2) #从输出的内容来看,Counter实际上也是dict的一个子类
    for k,v in str2.items():
        print(k,v)

    dict3 = {"banana": 33, "apple": 222, "pear": 1, "orange": 4444,"apples":2}#将dict初始化counter
    dict4=Counter(dict3)
    print(dict4)
    print(dict4["test"])#Counter对象类似于字典,如果某个项缺失,会返回0,而不是报出KeyError;

    dict5=Counter(high=9,age=33,money=-1)#将args初始化counter
    print(dict5)
    #elements返回一个迭代器,每个元素重复的次数为它的数目,顺序是任意的顺序,如果一个元素的数目少于1,那么elements()就会忽略它;
    list1=list(dict5.elements())
    print(list1)

    #most_common返回一个列表,包含counter中n个最大数目的元素
    #,如果忽略n或者为None,most_common()将会返回counter中的所有元素,元素有着相同数目的将会以任意顺序排列;
    str1 = "abcdefgabcedergeghdjlkabcdefe"
    list1=Counter(str1).most_common(3)
    print(list1)

if __name__ == '__main__':
    # testNamedTuple()
    # testCounter()
    testDefaultdict()
    # testDeque()
    # testOrderedDict()

相关推荐

《Queendom》宣布冠军!女团MAMAMOO四人激动落泪

网易娱乐11月1日报道据台湾媒体报道,南韩女团竞争回归的生死斗《Queendom》昨(10/31)晚播出大决赛,并以直播方式进行,6组女团、女歌手皆演唱新歌,并加总前三轮的赛前赛、音源成绩与直播现场投...

正确复制、重写别人的代码,不算抄袭

我最近在一篇文章提到,工程师应该怎样避免使用大量的库、包以及其他依赖关系。我建议的另一种方案是,如果你没有达到重用第三方代码的阈值时,那么你就可以自己编写代码。在本文中,我将讨论一个在重用和从头开始编...

HTML DOM tr 对象_html event对象

tr对象tr对象代表了HTML表格的行。HTML文档中出现一个<tr>标签,就会创建一个tr对象。tr对象集合W3C:W3C标签。集合描述W3Ccells返回...

JS 打造动态表格_js如何动态改变表格内容

后台列表页最常见的需求:点击表头排序+一键全选。本文用原生js代码实现零依赖方案,涵盖DOM查询、排序算法、事件代理三大核心技能。效果速览一、核心思路事件入口:为每个<th>绑...

连肝7个晚上,总结了66条计算机网络的知识点

作者|哪吒来源|程序员小灰(ID:chengxuyuanxiaohui)计算机网络知识是面试常考的内容,在实际工作中经常涉及。最近,我总结了66条计算机网络相关的知识点。1、比较http0....

Vue 中 强制组件重新渲染的正确方法

作者:MichaelThiessen译者:前端小智来源:hackernoon有时候,依赖Vue响应方式来更新数据是不够的,相反,我们需要手动重新渲染组件来更新数据。或者,我们可能只想抛开当前的...

为什么100个前端只有1人能说清?浏览器重排/重绘深度解析

面试现场的"致命拷问""你的项目里做过哪些性能优化?能具体讲讲重排和重绘的区别吗?"作为面试官,我在秋招季连续面试过100多位前端候选人,这句提问几乎成了必考题。但令...

HTML DOM 介绍_dom4j html

HTMLDOM(文档对象模型)是一种基于文档的编程接口,它是HTML和XML文档的编程接口。它可以让开发人员通过JavaScript或其他脚本语言来访问和操作HTML和XML文档...

JavaScript 事件——“事件流和事件处理程序”的注意要点

事件流事件流描述的是从页面中接收事件的顺序。IE的事件流是事件冒泡流,而NetscapeCommunicator的事件流是事件捕获流。事件冒泡即事件开始时由最具体的元素接收,然后逐级向上传播到较为不...

探秘 Web 水印技术_水印制作网页

作者:fransli,腾讯PCG前端开发工程师Web水印技术在信息安全和版权保护等领域有着广泛的应用,对防止信息泄露或知识产品被侵犯有重要意义。水印根据可见性可分为可见水印和不可见水印(盲水印)...

国外顶流网红为流量拍摄性侵女学生?仅被封杀三月,回归仍爆火

曾经的油管之王,顶流网红DavidDobrik复出了。一切似乎都跟他因和成员灌酒性侵女学生被骂到退网之前一样:住在950万美元的豪宅,开着20万美元的阿斯顿马丁,每条视频都有数百万观看...人们仿佛...

JavaScript 内存泄漏排查方法_js内存泄漏及解决方法

一、概述本文主要介绍了如何通过Devtools的Memory内存工具排查JavaScript内存泄漏问题。先介绍了一些相关概念,说明了Memory内存工具的使用方式,然后介绍了堆快照的...

外贸独立站,网站优化的具体内容_外贸独立站,网站优化的具体内容有哪些

Wordpress网站优化,是通过优化代码、数据库、缓存、CSS/JS等内容,提升网站加载速度、交互性和稳定性。网站加载速度,是Google搜索引擎的第一权重,也是SEO优化的前提。1.优化渲染阻塞。...

这8个CSS工具可以提升编程速度_css用什么编译器

下面为大家推荐的这8个CSS工具,有提供函数的,有提供类的,有提取代码的,还有收集CSS的统计数据的……请花费两分钟的时间看完这篇文章,或许你会找到意外的惊喜,并且为你的编程之路打开了一扇新的大门。1...

vue的理解-vue源码 历史 简介 核心特性 和jquery区别 和 react对比

一、从历史说起Web是WorldWideWeb的简称,中文译为万维网我们可以将它规划成如下的几个时代来进行理解石器时代文明时代工业革命时代百花齐放时代石器时代石器时代指的就是我们的静态网页,可以欣...