百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python哈希表及解析公式(python中的哈希算法)

itomcoil 2025-06-09 22:38 8 浏览

1. 封装和解构

1.1 封装

说明: 等号(=)右边有多个数值仅通过逗号分割,就会封装到一个元组,称为封装packing。

# 示例:
x = 1,
y = 1,2
print(type(x), x)
print(type(y), y)

# 输出结果如下:
<class 'tuple'> (1,)
<class 'tuple'> (1, 2)

备注: 如果右边只有一个数值且没有用逗号,其实是一个整数类型,请留意。另外等号右边一定先运行,再赋值给左边。

1.2 解构

说明: 等号(=)右边容器类型的元素与左边通过逗号分割的变量要一 一对应,称为解构unpacking。

x,y = (1,2)  # [1,2] {1,2} {'a':1,'b':2}
print(x)
print(y)

# 输出结果如下:
1
2

备注: 右边的容器可以是元组、列表、字典、集合等,必须是可迭代对象。

错误示范:

x,y = (1,2,3)
print(x)
print(y)

# 输出结果如下:
ValueError: too many values to unpack (expected 2)

说明: 左、右两边个数一定要一致,不然会抛出'ValueError'错误。

剩余变量解构

说明: python3引入了剩余变量解构(rest),'尽可能'收集剩下的数据组成一个列表。

x, *rest = [1,2,3,4,5,6]
print(type(x), x)
print(type(rest), rest)  # 剩余没有赋值的就是rest的了

# 输出结果如下:
<class 'int'> 1
<class 'list'> [2, 3, 4, 5, 6]
*rest, y = [1,2,3,4,5,6]
print(type(rest), rest)
print(type(y), y)

# 输出结果如下:
<class 'list'> [1, 2, 3, 4, 5]
<class 'int'> 6

错误示例:

  • 不能单独使用说明: 等号左边只有一个标识符,无法解构。*rest = [1,2,3,4,5,6] print(rest) # 输出结果如下: #语法错误 SyntaxError: starred assignment target must be in a list or tuple
  • 不能多次同时使用x, *rest1, *rest2, y = [1,2,3,4,5,6] print(rest1) print(rest2) # 输出结果如下: #语法错误,其中一个rest就把剩余元素拿走了,另外一个rest怎么拿? SyntaxError: two starred expressions in assignment

另外一种丢弃变量下划线:'_'

说明: '_'是合法的标识符,大多场景表示不关心该值。

x, *_, y = [1,2,3,4,5,6]
print(x)
print(_)
print(y)
# 输出结果如下:
1
[2, 3, 4, 5]
6
_, *rest, _ = [1,2,3,4,5,6]
print(_)  # '_'是上一次输出值
print(rest)
# 输出结果如下:
6
[2, 3, 4, 5]

2. 集合Set

说明: 集合是'可变的、无序的、不重复'的元素集合。

成为集合元素是有条件的:'元素必须可hash、可迭代'

可哈希对象如下(不可变):

  • 数值型:int(整数)、float(浮点)、complex(复数)
  • 布尔型:True(是)、False(否)
  • 字符串:string(字符串)、bytes(字节)
  • tuple(元组)
  • None(空)

可以通过内置hash函数判断是否可hash:

s1 = [1,2,3]
print(hash(s1))

# 输出结果如下:
TypeError: unhashable type: 'list'  # 列表是不可hash的

2.1 初始化

说明:

  • set() -> new empty set object,新的空集合
  • set(iterable) -> new set object,元素必须可迭代
s = {}  # 注意这个是空字典,不是空集合
s1 = set()  # 空集合
s2 = set([1,2,3])  # 注意列表里面元素迭代出来的是整数,可hash
s3 = set("abcd")
print(s1)
print(s2)
print(s3)

# 输出结果如下:
set()
{1, 2, 3}
{'c', 'd', 'a', 'b'}

错误示例:

s = set([[1]]) # 列表套列表,迭代出来是列表,不可hash
print(s)

# 输出结果如下:
TypeError: unhashable type: 'list'

2.2 增加

  • s.add(element)说明: 增加一个元素到集合,如果元素已经存在,则不操作。
s1 = set([1,2,3])
s1.add(4)
print(s1)

# 输出结果如下:
{1, 2, 3, 4}
  • s.update(*element))说明: 合并一个或多个元素到集合中,元素必须可迭代(把迭代的元素并到集合),和后面讲的并集一样。
s1 = set([1,2,3])
s1.update((4,5,6),[7,8,9])
print(s1)

# 输出结果如下:
{1, 2, 3, 4, 5, 6, 7, 8, 9}

2.3 删除

  • remove(element)说明: 从集合中移除一个元素,如果元素不存在抛出'KeyError'错误。s1 = {1,2,3,4,5,6} s1.remove(6) print(s1) # 输出结果如下: {1, 2, 3, 4, 5}
  • discard(element)说明: 也是从集合中移除一个元素,如果元素不存在不会报异常,啥都不做。s1 = {1,2,3,4,5,6} s1.discard(6) print(s1) # 输出结果如下: {1, 2, 3, 4, 5}
  • pop()说明: 因为集合是无序的,所以是删除'任意'一个元素,如果是空集则抛出'KeyError'错误。s1 = {1,2,3,4,5,6} print(s1.pop()) # 随机的(因为无序) print(s1) # 输出结果如下: 1 {2, 3, 4, 5, 6}
  • clear()说明: 删除所有元素,都不推荐使用的啦。s1 = {1,2,3,4,5,6} s1.clear() print(s1) # 输出结果如下: set()

2.4 遍历

说明: 集合是个容器,是可以遍历的,但是效率都是O(n)。

s1 = {1,2,3}
for s in s1:
    print(s)
# 输出结果如下:
1
2
3

说到这里,你觉得集合set和列表list哪个遍历效率更高呢?

答案是set,因为set的元素是hash值作为key(下面讲的字典也是hash值),查询时间复杂度为O(1),而list是线性数据结构,时间复杂度是O(n)。

大家可以按照如下进行验证下,随着数据规模越来越大,很明显就可以看出哪个效率高。

2.5 并集&交集&差集&对称差集

  • 并集说明: 将多个集合的所有元素合并在一起组成新的集合。s1 = {1,2,3} s2 = {3,4,5} print(s1.union(s2)) # 输出结果如下: {1, 2, 3, 4, 5}备注:还可以使用运算符 '|'、'update(element)'、'|='。
  • 交集说明: 取多个集合的共同(相交)元素s1 = {1,2,3} s2 = {3,4,5} print(s1.intersection(s2)) # 输出结果如下: {3}备注:还可以使用'&'、's.intersection_update(element)'、'&='。
  • 差集说明: 属于一个集合但不属于另一个集合的元素组成的集合。s1 = {1,2,3} s2 = {3,4,5} print(s1.difference(s2)) # 输出结果如下: {1, 2}备注:还可以使用'-'、's.difference_update(element)'、'-='.
  • 对称差集说明: 多个集合中,不属于交集元素组成的集合。s1 = {1,2,3} s2 = {3,4,5} print(s1.symmetric_difference(s2)) # 输出结果如下: {1, 2, 4, 5}备注:还可以使用'^'、's1.symmetric_difference_update(s2)'、'^='.

3.字典

说明: 字典是由任意个item(元素)组成的集合,item是由key:value对组成的二元组。

  • 字典是'可变的':支持增删改查;
  • 字典是'无序的':key存储是无序的,非线性数据结构(请不要让表面蒙蔽了你哈);
  • 字典是'key不重复':key是唯一的,且必须可'hash';

3.1 初始化

# 空字典
d1 = {}
d2 = dict()

# 示例:
d3 = dict(a=1,b=2,c=3)
d4 = dict(d3)
d5 = dict([('a',1),('b',2),('c',3)])  # 元素必须是可迭代的
d6 = {'a':1,'b':2,'c':3}

# 输出结果都是:
{'a': 1, 'b': 2, 'c': 3}

3.2 增删改查

  • 增加&修改元素1)通过'd[key] = value'方式:备注:如果key不存在,则新增,key存在则直接覆盖(修改元素)。# 增加 & 修改 d = {'a':1,'b':2,'c':3} d['d'] = 4 # 增加 d['a'] = 11 # 修改 print(d) # 输出结果如下: {'a': 11, 'b': 2, 'c': 3, 'd': 4}2)通过d.update([E, ]**F) -> None# 增加 & 修改 d = {'a':1,'b':2,'c':3} d.update(d=4) print(d) # 输出结果如下: {'a': 1, 'b': 2, 'c': 3, 'd': 4}
  • 删除元素1)d.pop()key存在则移除,并返回对应value值。key不存在,返回给定的缺省值,否则抛出KeyError。d = {'a':1,'b':2,'c':3} print(d.pop('c',None)) print(d) # 输出结果如下: 3 {'a': 1, 'b': 2}

2)d.popitem()

  • 删除并返回一个任意的item(key:value)。
  • 如果是空字典,抛出KeyError。d = {'a':1,'b':2,'c':3} print(d.popitem()) print(d) # 输出结果如下: ('c', 3) {'a': 1, 'b': 2}

3)d.clear()

  • 删除所有item,不推荐使用。d = {'a':1,'b':2,'c':3} d.clear() print(d)
  • 查找元素通过key这个键就可以快速找到value值。时间复杂度是O(1),不会随着数据规模大而降低效率。

正常访问元素:

d = {'a':1,'b':2,'c':3}
print(d['a'])
print(d.get('b'))

# 输出结果如下:
1
2

key不存在的处理方式:

d = {'a':1,'b':2,'c':3}
print(d.get('d',None))  # 如果key不存在,缺省返回None
print(d.setdefault('d',100))  # 如果key不存在,则新增key:value对
print(d)

# 输出结果如下:
None
100
{'a': 1, 'b': 2, 'c': 3, 'd': 100}

3.3 遍历

  • 遍历键:keyd = {'a':1,'b':2,'c':3} # 方法1: for k in d: # 缺省是遍历key print(k) # 方法2: for k in d.keys(): print(k) # 方法3: for k, _ in d.items(): print(k) # 输出结果如下: a b c
  • 遍历值:valued = {'a':1,'b':2,'c':3} # 方法1: for v in d.values(): print(v) # 方法2: for k in d: # print(d[k]) # 也可以用 print(d.get(k)) # 方法3: for _, v in d.items(): print(v) # 输出结果如下: 1 2 3
  • 遍历item:key-valued = {'a':1,'b':2,'c':3} for item in d.items(): print(item) # 输出结果如下: ('a', 1) ('b', 2) ('c', 3)
  • 其他问题这种情况在遍历的时候,不能够删除元素,不能改变字典的size。d = {'a':1,'b':2,'c':3} for k in d: print(d.pop(k)) # 输出结果如下: RuntimeError: dictionary changed size during iteration优雅的删除方式:d = {'a':1,'b':2,'c':3} key_list = [] for k in d: key_list.append(k) for k in key_list: print('已删除key:', d.pop(k))然并卵,想要清除,直接用clear()啦。

4.解析式和生成器表达式

4.1 列表解析式

语法

  • [ 返回值 for 元素 in 可迭代对象 if 条件 ]
  • 列表解析使用中括号'[ ]'表示
  • 返回一个新的列表

优点

  • 提高效率
  • 代码轻量
  • 可读性高

示例需求:请从给定区间中提取能够被2整除的元素。

大众普遍的写法:

list = []
for i in range(10):
    if i % 2 == 0:
        list.append(i)
print(list)

# 输出结果如下:
[0, 2, 4, 6, 8]

再来感受一下简单而优雅的写法:

print([i for i in range(10) if i % 2 == 0])

# 输出结果如下:
[0, 2, 4, 6, 8]

以上就是列表解析式,也叫列表推导式。

4.2 生成器表达式

语法

  • ( 返回值 for 元素 in 可迭代对象 if 条件 )
  • 生成器表达使用中括号'( )'表示
  • 返回一个生成器对象(generator)

特点:

  • 按需计算,就是需要取值的时候才去计算(而列表解析式是一次性计算立即返回所有结果)
  • 前期并不怎么占用内存,最后取值多了就跟列表解析式一样;
  • 计算耗时极短,本身并不返回结果,返回的是生成器对象;

看下生成器对象是长什么样的(不要认为是元组解析式,哈哈):

x = (i for i in range(10) if i % 2 == 0)
print(type(x))
print(x)

# 输出结果如下:
<class 'generator'>  # 生成器
<generator object <genexpr> at 0x000001A143ACBA98> # 生成器对象

那生成器对象是如何计算得到结果:

import time
x = (i for i in range(10) if i % 2 == 0)
for i in range(6):  # 仅一次循环取值
    time.sleep(0.5)
    print(next(x))
 time.sleep(1)
print(next(x))  # for循环已经计算完所有结果了,不能取值,故抛出异常

# 输出结果如下:
0
2
4
6
8
StopIteration  # 已经超出可迭代范围,抛出异常

备注:生成器表达式只能迭代一次。

4.3 集合解析式

集合解析式和列表解析式语法类似,不做过多解析。

语法:

  • { 返回值 for 元素 in 可迭代对象 if 条件 }
  • 集合解析式用花括号'{ }'表示
  • 返回一个集合

示例:

print({i for i in range(10) if i % 2 == 0})

# 输出结果如下:
{0, 2, 4, 6, 8}

4.4 字典解析式

字典解析式和集合解析式语法类似,不做过多解析。

语法:

  • { key:value for 元素 in 可迭代对象 if 条件 }
  • 字典解析式用花括号'{ }'表示
  • 返回一个字典

示例:

print({i:(i+1) for i in range(10) if i % 2 == 0})

# 输出结果如下:
{0: 1, 2: 3, 4: 5, 6: 7, 8: 9}

总体来说,解析式写起来如果让人简单易懂、又高效,是非常推荐大家使用的。

但有的场景写起来很复杂,那还是得用for...in循环拆分来写。

大家平时学习Python的时候肯定会遇到很多问题,小编我为大家准备了Python学习资料,将这些免费分享给大家!如果想要的可以找我领取

领取方式:

如果想获取这些学习资料,先关注我然后私信小编“01”即可免费领取!(私信方法:点击我头像进我主页右上面有个私信按钮)

如果这篇文章对你有帮助,请记得给我来个评论+转发

相关推荐

麦克斯韦方程高斯-博内-陈定理嘉当外微分斯托克斯方程之间的联系

一、麦克斯韦方程的外微分形式1.电磁场张量的几何表示在微分几何中,电磁场由2-形式F描述,称为电磁场强形式:其中E为电场,B为磁场,dt为时间坐标。2.麦克斯韦方程的微分形式第二式(无...

机器视觉(四):空域图像增强(常见的空域图像增强处理方法有哪些)

一、图像处理技术概述1.定义对原始获取图像进行一系列的运算处理,称为图像处理。图像处理是机器视觉技术的方法基础,包括图像增强、边缘提取、图像分割、形态学处理、图像投影、配准定位和图像特征提取等方法。2...

基于机器视觉的安全气囊检测系统研究

21世纪以来,汽车行业发展迅猛。安全气囊作为汽车的安全辅助工具,它的出现大大降低了死亡率,因而必须确保其尺寸精确,并能正常使用。对安全气囊传统的检测方法主要是借助千分表、轮廓仪等工具进行人工抽检[...

高斯泼溅综合指南(高斯pp)

高斯泼溅(GaussianSplatting)是一种表示3D场景和渲染新视图的方法,在“实时辐射场渲染的3D高斯泼溅”中引入。它可以被认为是NeRF类模型的替代品,就像当年的NeRF...

基于DSP和ARM的电气化铁路接触线覆冰监测系统设计

张学武(中铁第一勘察设计院集团有限公司,陕西西安710043)摘要:为预防接触线上的冰害事故以及为除冰融冰提供支持,设计了集成视频传输、覆冰厚度测量、导线温度测量、现场微气象采集的接触线覆冰监测系...

OpenCV 线性滤波(opencv 线性拟合)

OpenCV线性滤波线性滤波图像滤波与滤波器图像滤波,指的是在尽量保留图像特征的条件下对目标图像得噪声进行抑制,是图像处理当中不可缺少的部分。平滑录播室低频增强的空间域滤波技术,它的目的有两类:一类...

几种典型的图像去噪算法总结(图像去噪的定义)

(一)高斯低通滤波去噪高斯低通滤波器(GaussianLowPassFilter)是一类传递函数为高斯函数的线性平滑滤波器。又由于高斯函数是正态分布的密度函数。因此高斯低通滤波器对于去除服从正态...

深度解析卷积:从原理到应用(卷积到底是什么)

一、卷积的基本概念卷积是一种在数学领域尤其是分析数学中占据重要地位的运算方式。它通过两个函数和来生成第三个函数。设和是上的两个可积函数,卷积的积分表达式为:。在离散情况下,卷积定义为。从...

基于混合高斯模型的物体成分拟合方法

郎波,樊一娜,黄静,王鹏(北京师范大学珠海分校信息技术学院,广东珠海519087)为了寻求代价更小、效率更高、适应性更强的图像原型表征方法,借鉴成分识别理论的观点,设计出一种更符合人类认知原...

30天Python 入门到精通(python入门到精通书籍)

以下是一个为期30天的Python入门到精通学习课程,专为零基础新手设计。课程从基础语法开始,逐步深入到面向对象编程、数据处理,最后实现运行简单的大语言模型(如基于HuggingFace...

Python 最好用的 8 个 VS Code 扩展

1.PythonextensionforVisualStudioCode这个扩展是由微软官方提供的,支持但不仅限于以下功能:通过Pylint或Flake8支持代码检查在VSCo...

Textual:为 Python 增加漂亮的文本用户界面(TUI)

导读:如果你的代码是用Python编写的,你应该使用Textual来帮助你编写TUI(文本用户界面)。快速入门使用TextualPython在Linux上有像TkInterdocs...

pytest框架进阶自学系列 | 常用插件的使用

书籍来源:房荔枝梁丽丽《pytest框架与自动化测试应用》一边学习一边整理老师的课程内容及实验笔记,并与大家分享,侵权即删,谢谢支持!附上汇总贴:pytest框架进阶自学系列|汇总_热爱编程的通...

ShapeNet数据集及dataset代码分析

1.数据集简介ShpaeNet是点云中一个比较常见的数据集,它能够完成部件分割任务,即部件知道这个点云数据大的分割,还要将它的小部件进行分割。它总共包括十六个大的类别,每个大的类别有可以分成若干个小类...

「教程」5 分钟带你入门 kivy(怎么学kp)

原创:星安果AirPythonkivy语言通过编写界面UI,然后利用Python定义一些业务逻辑,可以移植很多功能模块到移动端直接执行。下面对kivy常见用法做一个汇总。1、什么是...