Python 数据结构七大高级技巧,不允许你还不会
itomcoil 2025-06-09 22:38 6 浏览
掌握数据结构的高效使用是成为优秀Python程序员的关键。下面我将分享一些实用的数据结构技巧,帮助您编写更高效、更优雅的代码。
1. 列表(List)高级技巧
1.1 列表推导式与条件筛选
# 基本列表推导式
squares = [x**2 for x in range(10)]
# 带条件的列表推导式
even_squares = [x**2 for x in range(10) if x % 2 == 0]
# 多重循环
matrix = [[1, 2], [3, 4], [5, 6]]
flattened = [num for row in matrix for num in row] # [1, 2, 3, 4, 5, 6]
1.2 列表切片技巧
lst = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
# 获取最后三个元素
last_three = lst[-3:] # [7, 8, 9]
# 反转列表
reversed_lst = lst[::-1] # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
# 每隔两个元素取一个
every_second = lst[::2] # [0, 2, 4, 6, 8]
1.3 列表排序高级用法
# 基本排序
lst = [5, 2, 9, 1]
lst.sort() # 原地排序
sorted_lst = sorted(lst) # 返回新列表
# 自定义排序
students = [{'name': 'Alice', 'grade': 89},
{'name': 'Bob', 'grade': 72},
{'name': 'Charlie', 'grade': 93}]
# 按grade降序排序
students_sorted = sorted(students, key=lambda x: x['grade'], reverse=True)
# 多重排序条件
from operator import itemgetter
students.sort(key=itemgetter('grade', 'name')) # 先按grade,再按name排序
2. 字典(Dict)高级技巧
2.1 字典推导式
# 基本字典推导式
square_dict = {x: x**2 for x in range(5)} # {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}
# 带条件的字典推导式
even_square_dict = {x: x**2 for x in range(10) if x % 2 == 0}
# 键值交换
original = {'a': 1, 'b': 2, 'c': 3}
inverted = {v: k for k, v in original.items()}
2.2 字典合并
# Python 3.5+ 使用 ** 操作符
dict1 = {'a': 1, 'b': 2}
dict2 = {'b': 3, 'c': 4}
merged = {**dict1, **dict2} # {'a': 1, 'b': 3, 'c': 4}
# 使用 | 操作符 (Python 3.9+)
merged = dict1 | dict2
# 保留原始字典
from collections import ChainMap
chained = ChainMap(dict1, dict2)
print(chained['b']) # 输出 2 (dict1中的值)
2.3 默认值处理
# 使用setdefault
d = {}
for k, v in [('a', 1), ('b', 2), ('a', 3)]:
d.setdefault(k, []).append(v) # {'a': [1, 3], 'b': [2]}
# 使用defaultdict
from collections import defaultdict
dd = defaultdict(list)
for k, v in [('a', 1), ('b', 2), ('a', 3)]:
dd[k].append(v) # defaultdict(<class 'list'>, {'a': [1, 3], 'b': [2]})
# 使用get方法处理缺失键
value = d.get('nonexistent', 'default')
3. 集合(Set)高级技巧
3.1 集合运算
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
# 并集
union = a | b # {1, 2, 3, 4, 5, 6}
# 交集
intersection = a & b # {3, 4}
# 差集
difference = a - b # {1, 2}
# 对称差集 (只在其中一个集合中)
symmetric_diff = a ^ b # {1, 2, 5, 6}
3.2 集合推导式
# 基本集合推导式
squares = {x**2 for x in range(-5, 6)} # {0, 1, 4, 9, 16, 25}
# 带条件的集合推导式
odd_squares = {x**2 for x in range(10) if x % 2 != 0} # {1, 9, 25, 49, 81}
3.3 集合去重应用
# 列表去重
lst = [1, 2, 2, 3, 4, 4, 5]
unique_lst = list(set(lst)) # 顺序可能改变
# 保持顺序的去重
from collections import OrderedDict
unique_ordered = list(OrderedDict.fromkeys(lst)) # [1, 2, 3, 4, 5]
4. 元组(Tuple)高级技巧
4.1 命名元组
from collections import namedtuple
# 创建命名元组类型
Point = namedtuple('Point', ['x', 'y'])
# 实例化
p = Point(11, y=22)
# 访问
print(p.x) # 11
print(p[0]) # 11 (仍然支持索引)
4.2 元组拆包
# 基本拆包
x, y = (1, 2)
# 扩展拆包
first, *middle, last = (1, 2, 3, 4, 5) # first=1, middle=[2,3,4], last=5
# 忽略某些值
_, second, _ = (1, 2, 3) # second=2
# 字典拆包到函数参数
def greet(name, age):
print(f"Hello {name}, you are {age}")
person = {'name': 'Alice', 'age': 25}
greet(**person)
5. 高级数据结构
5.1 堆(Heap)操作
import heapq
# 创建堆
heap = []
heapq.heappush(heap, 5)
heapq.heappush(heap, 2)
heapq.heappush(heap, 1)
# 获取最小元素
smallest = heapq.heappop(heap) # 1
# 堆化现有列表
lst = [5, 3, 1, 4, 2]
heapq.heapify(lst) # 原地转换为堆
# 获取n个最大/最小元素
largest = heapq.nlargest(3, lst) # [5, 4, 3]
smallest = heapq.nsmallest(2, lst) # [1, 2]
5.2 双端队列(deque)
from collections import deque
d = deque(maxlen=3) # 固定长度队列
d.append(1) # [1]
d.append(2) # [1, 2]
d.append(3) # [1, 2, 3]
d.append(4) # [2, 3, 4] (自动移除最左边的1)
# 两端操作
d.appendleft(0) # [0, 2, 3]
d.pop() # 移除并返回3
d.popleft() # 移除并返回0
5.3 计数器(Counter)
from collections import Counter
# 基本计数
words = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
word_counts = Counter(words) # {'apple': 3, 'banana': 2, 'orange': 1}
# 获取最常见元素
top_two = word_counts.most_common(2) # [('apple', 3), ('banana', 2)]
# 数学运算
more_words = ['apple', 'orange', 'grape']
more_counts = Counter(more_words)
combined = word_counts + more_counts # {'apple':4, 'banana':2, 'orange':2, 'grape':1}
difference = word_counts - more_counts # {'apple':2, 'banana':2}
6. 数据结构的性能优化
6.1 选择合适的数据结构
操作 | 列表 | 集合 | 字典 |
查找元素 | O(n) | O(1) | O(1) |
插入 | O(1)/O(n) | O(1) | O(1) |
删除 | O(n) | O(1) | O(1) |
排序 | O(n log n) | 无 | 无 |
6.2 使用bisect维护有序列表
import bisect
lst = [1, 3, 4, 4, 6, 8]
# 插入元素保持有序
bisect.insort(lst, 5) # [1, 3, 4, 4, 5, 6, 8]
# 查找插入位置
index = bisect.bisect_left(lst, 4) # 2 (第一个4的位置)
index = bisect.bisect_right(lst, 4) # 4 (最后一个4之后的位置)
6.3 使用数组(array)优化数值存储
import array
# 创建整型数组
arr = array.array('i', [1, 2, 3, 4, 5]) # 比列表更节省内存
# 操作类似列表
arr.append(6)
print(arr[2]) # 3
7. 实用技巧集合
7.1 字典键的多重查找
def get_value(d, *keys):
for key in keys:
if key in d:
return d[key]
return None
data = {'name': 'Alice', 'username': 'alice123'}
name = get_value(data, 'name', 'username', 'nickname') # 'Alice'
7.2 扁平化嵌套数据结构
from collections.abc import Iterable
def flatten(items):
for item in items:
if isinstance(item, Iterable) and not isinstance(item, (str, bytes)):
yield from flatten(item)
else:
yield item
nested = [1, [2, [3, 4], 5]]
list(flatten(nested)) # [1, 2, 3, 4, 5]
7.3 数据结构的深拷贝
import copy
original = [[1, 2], [3, 4]]
shallow = copy.copy(original) # 浅拷贝
deep = copy.deepcopy(original) # 深拷贝
original[0][0] = 99
print(shallow) # [[99, 2], [3, 4]] (受影响)
print(deep) # [[1, 2], [3, 4]] (不受影响)
掌握这些数据结构技巧将显著提升您的Python编程能力,使您能够编写出更高效、更易维护的代码。记住,选择合适的数据结构往往比算法优化更能提升程序性能。
相关推荐
- 麦克斯韦方程高斯-博内-陈定理嘉当外微分斯托克斯方程之间的联系
-
一、麦克斯韦方程的外微分形式1.电磁场张量的几何表示在微分几何中,电磁场由2-形式F描述,称为电磁场强形式:其中E为电场,B为磁场,dt为时间坐标。2.麦克斯韦方程的微分形式第二式(无...
- 机器视觉(四):空域图像增强(常见的空域图像增强处理方法有哪些)
-
一、图像处理技术概述1.定义对原始获取图像进行一系列的运算处理,称为图像处理。图像处理是机器视觉技术的方法基础,包括图像增强、边缘提取、图像分割、形态学处理、图像投影、配准定位和图像特征提取等方法。2...
- 基于机器视觉的安全气囊检测系统研究
-
21世纪以来,汽车行业发展迅猛。安全气囊作为汽车的安全辅助工具,它的出现大大降低了死亡率,因而必须确保其尺寸精确,并能正常使用。对安全气囊传统的检测方法主要是借助千分表、轮廓仪等工具进行人工抽检[...
- 高斯泼溅综合指南(高斯pp)
-
高斯泼溅(GaussianSplatting)是一种表示3D场景和渲染新视图的方法,在“实时辐射场渲染的3D高斯泼溅”中引入。它可以被认为是NeRF类模型的替代品,就像当年的NeRF...
- 基于DSP和ARM的电气化铁路接触线覆冰监测系统设计
-
张学武(中铁第一勘察设计院集团有限公司,陕西西安710043)摘要:为预防接触线上的冰害事故以及为除冰融冰提供支持,设计了集成视频传输、覆冰厚度测量、导线温度测量、现场微气象采集的接触线覆冰监测系...
- OpenCV 线性滤波(opencv 线性拟合)
-
OpenCV线性滤波线性滤波图像滤波与滤波器图像滤波,指的是在尽量保留图像特征的条件下对目标图像得噪声进行抑制,是图像处理当中不可缺少的部分。平滑录播室低频增强的空间域滤波技术,它的目的有两类:一类...
- 几种典型的图像去噪算法总结(图像去噪的定义)
-
(一)高斯低通滤波去噪高斯低通滤波器(GaussianLowPassFilter)是一类传递函数为高斯函数的线性平滑滤波器。又由于高斯函数是正态分布的密度函数。因此高斯低通滤波器对于去除服从正态...
- 深度解析卷积:从原理到应用(卷积到底是什么)
-
一、卷积的基本概念卷积是一种在数学领域尤其是分析数学中占据重要地位的运算方式。它通过两个函数和来生成第三个函数。设和是上的两个可积函数,卷积的积分表达式为:。在离散情况下,卷积定义为。从...
- 基于混合高斯模型的物体成分拟合方法
-
郎波,樊一娜,黄静,王鹏(北京师范大学珠海分校信息技术学院,广东珠海519087)为了寻求代价更小、效率更高、适应性更强的图像原型表征方法,借鉴成分识别理论的观点,设计出一种更符合人类认知原...
- 30天Python 入门到精通(python入门到精通书籍)
-
以下是一个为期30天的Python入门到精通学习课程,专为零基础新手设计。课程从基础语法开始,逐步深入到面向对象编程、数据处理,最后实现运行简单的大语言模型(如基于HuggingFace...
- Python 最好用的 8 个 VS Code 扩展
-
1.PythonextensionforVisualStudioCode这个扩展是由微软官方提供的,支持但不仅限于以下功能:通过Pylint或Flake8支持代码检查在VSCo...
- Textual:为 Python 增加漂亮的文本用户界面(TUI)
-
导读:如果你的代码是用Python编写的,你应该使用Textual来帮助你编写TUI(文本用户界面)。快速入门使用TextualPython在Linux上有像TkInterdocs...
- pytest框架进阶自学系列 | 常用插件的使用
-
书籍来源:房荔枝梁丽丽《pytest框架与自动化测试应用》一边学习一边整理老师的课程内容及实验笔记,并与大家分享,侵权即删,谢谢支持!附上汇总贴:pytest框架进阶自学系列|汇总_热爱编程的通...
- ShapeNet数据集及dataset代码分析
-
1.数据集简介ShpaeNet是点云中一个比较常见的数据集,它能够完成部件分割任务,即部件知道这个点云数据大的分割,还要将它的小部件进行分割。它总共包括十六个大的类别,每个大的类别有可以分成若干个小类...
- 「教程」5 分钟带你入门 kivy(怎么学kp)
-
原创:星安果AirPythonkivy语言通过编写界面UI,然后利用Python定义一些业务逻辑,可以移植很多功能模块到移动端直接执行。下面对kivy常见用法做一个汇总。1、什么是...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)