Python排序90%人只会用sorted()?这7个高阶技巧让你代码效率翻倍
itomcoil 2025-08-05 18:55 2 浏览
高效处理数据的关键,往往从掌握排序开始。排序操作在Python编程中的重要性常被低估——直到你面对一个杂乱无章的数据集。作为数据处理的核心操作之一,排序效率直接决定了程序性能和代码可读性。无论你正在清洗用户数据、生成报表还是优化算法,不同的排序方法选择可能带来截然不同的执行效率。
本文将全面解析Python 3中列表排序的7种核心方法和5个高阶技巧,助你摆脱对内置排序的浅层理解,真正掌握灵活高效的数据整理能力。
一、基础排序:两大核心武器
1、sort()方法:原地高效排序
o 适用场景:当原始数据无需保留,直接修改列表内容
o 特点:无返回值,直接在原列表上操作(节省内存)
numbers = [5, 2, 9, 1, 5, 6]
numbers.sort() # 升序
# 结果:[1, 2, 5, 5, 6, 9]
numbers.sort(reverse=True) # 降序
# 结果:[9, 6, 5, 5, 2, 1]
2、sorted()函数:安全无副作用
o 适用场景:需保留原始数据,生成新排序列表
o 特点:返回新列表,原数据保持不变
origin = [5, 2, 9, 1, 5, 6]
new_sorted = sorted(origin) # 升序
# origin不变,new_sorted为[1, 2, 5, 5, 6, 9]
选择建议:大数据集优先用sort()省内存;需保留原始数据时用sorted()
二、自定义排序:解锁key参数的威力
1、单条件排序
通过key参数指定排序依据,处理非默认规则场景:
words = ["apple", "banana", "cherry", "date"]
# 按长度排序
sorted_words = sorted(words, key=len)
# 结果:['date', 'apple', 'banana', 'cherry']
# 按第二个字母排序
sorted_words = sorted(words, key=lambda x: x[1])
# 结果:['banana', 'date', 'apple', 'cherry']
2、多条件排序
用元组实现优先级排序,处理复杂业务规则:
students = [
{'name':'Alice', 'age':25, 'score':85},
{'name':'Bob', 'age':25, 'score':92},
{'name':'Charlie', 'age':23, 'score':85}
]
# 先按年龄升序,同年龄按分数降序
sorted_students = sorted(
students,
key=lambda x: (x['age'], -x['score'])
)
3、优化技巧:使用operator模块
itemgetter比lambda性能更高,尤其在处理大型数据集时:
from operator import itemgetter
# 等效于lambda x: (x['age'], x['score'])
sorted_students = sorted(students, key=itemgetter('age', 'score'))
关键认知:key函数应尽量轻量——它会被调用n次,复杂逻辑将显著影响性能
三、高级排序技巧:应对特殊场景
1、自定义对象排序
类对象需定义__lt__方法或使用attrgetter:
from operator import attrgetter
class Product:
def __init__(self, id, price):
self.id = id
self.price = price
def __repr__(self):
return f"Product(id={self.id}, price={self.price})"
products = [Product(1, 50), Product(2, 30)]
# 按价格排序
sorted_products = sorted(products, key=attrgetter('price'))
2、混合类型排序
当数字与字符串混合时,用类型判断实现可控排序:
mixed = [3, 'apple', 2, 'banana', 1]
# 数字在前,字符串在后,各类内部排序
sorted_mixed = sorted(mixed, key=lambda x: (isinstance(x, str), x))
四、性能优化与陷阱规避
1、时间复杂度认知
o Python内置排序使用Timsort算法,平均与最坏复杂度均为O(n log n)
o 百万级整数排序通常在0.3-0.5秒内完成
2、关键性能实践
# 低效做法(每次调用计算平方)
data.sort(key=lambda x: x**2)
# 优化方案(预计算减少重复运算)
decorated = [(x**2, x) for x in data]
decorated.sort()
result = [x for _, x in decorated]
3、稳定性保障
Python排序是稳定排序——相同键值元素保持原始相对顺序。这在多条件排序中尤为重要:
# 首次按名称排序
data.sort(key=lambda x: x['name'])
# 再按分数排序时,同名者保持原顺序
data.sort(key=lambda x: x['score'])
五、实战场景扩展
1、字典排序
grades = {'Alice': 85, 'Bob': 92, 'Charlie': 78}
# 按键排序
sorted_by_key = dict(sorted(grades.items()))
# 按值排序
sorted_by_value = dict(sorted(grades.items(), key=lambda item: item[1]))
2、忽略大小写的字符串排序
words = ['Apple', 'banana', 'Cherry', 'date']
# 统一转小写比较
sorted_ignore_case = sorted(words, key=lambda x: x.lower())
3、部分排序(Top K问题)
对大列表只需前K个结果的场景:
import heapq
numbers = [3, 1, 4, 1, 5, 9, 2, 6, 5]
# 获取最大的3个元素
top3 = heapq.nlargest(3, numbers)
print(top3) # [9, 6, 5]
真正高效的开发者,懂得在基础语法与专业工具间灵活切换,让数据整理成为创造价值的加速器而非性能瓶颈。
- 上一篇:第四章:Python函数
- 下一篇:python学习教程-第七节内容
相关推荐
- python学习教程-第七节内容
-
函数(重点)基本概念Python函数的语法是编程中的核心概念之一,它允许你将代码块封装为可重复调用的单元。基本语法定义函数:示例参数类型位置参数(PositionalArguments)按参数定义...
- Python排序90%人只会用sorted()?这7个高阶技巧让你代码效率翻倍
-
高效处理数据的关键,往往从掌握排序开始。排序操作在Python编程中的重要性常被低估——直到你面对一个杂乱无章的数据集。作为数据处理的核心操作之一,排序效率直接决定了程序性能和代码可读性。无论你正在清...
- 第四章:Python函数
-
4.1函数的定义与调用4.1.1理论知识函数是组织好的、可重复使用的代码块,用于执行特定的任务。它可以提高代码的复用性和可维护性。在Python中,定义函数使用def关键字,其基本语法如下:def...
- ArcGIS 一个独立运行的Python程序编写和打包
-
写代码#coding=utf8#-*-coding:UTF-8-*-importarcpyfromarcpyimportenvimportosimportsys##########...
- python入门到脱坑经典案例—计算三角形的面积
-
下面为大家详细讲解如何用Python计算三角形面积。我们会从最基础的数学公式开始,逐步深入编程实现,并涵盖多个实用版本。以下是完整的教学指南:1.数学原理回顾三角形面积公式:面积=(底边长度...
- Python运算技巧:10种计算列表平方的高效方法
-
1.使用for循环此方法遍历列表中的每个数字,使用**运算符计算其平方,然后将结果添加到新的列表中。2.使用列表推导式此方法使用列表推导式,这是一种更简洁的方式,可以在现有列表的每个项目上执行操作...
- 墙裂推荐,5个学习Python编程最佳的开源库
-
学习Python少不了的就是项目,我在GitHUB上找了几个比较好的开源库,大家可以跟着去学习。1、learn-python3这个存储库一共有19本Jupyter笔记本。它涵盖了字符串和条件之类的基础...
- 使用Python玩转ftplib库:实现ftp文件传输自动化全攻略
-
大家好!在日常工作中都会使用到ftp功能,用于上传和下载文件等,本章主要介绍Python的标准库ftplib来实现FTP文件传输,帮助我们实现ftp自动化。一、ftplib库核心函数速查表1连接与登...
- Python零基础入门学习23:常用第三方库之图像处理库Pillow
-
注:本文所有代码均经过Python3.7实际运行检验,保证其严谨性。本文约2000字,阅读时间约为4分钟。Pillow库的概述Pillow库是Python最好的图像处理库,可能是使用频率最高的图像处...
- Python编程之BeautifulSoup库
-
#头条创作挑战赛#BeautifulSoup是一个可以从HTML或XML文件中快速提取数据的Python库。它能够通过转从入门到精通Python网络爬虫框架Scrapy38换器实...
- Python3 新一代Http请求库Httpx使用(详情版)
-
我们经常使用Python语言的朋友们都清楚,requests是使用率非常高的HTTP库,甚至更早Python2中使用的是urllib、urllib2,也给我们提供了许多方便的功能。但是自从...
- 小白也可以玩的Python爬虫库,收藏一下
-
最近,微软开源了一个项目叫「playwright-python」,作为一个兴起项目,出现后受到了大家热烈的欢迎,那它到底是什么样的存在呢?今天为你介绍一下这个传说中的小白神器。Playwright是...
- apscheduler,一个超厉害的 Python 库!
-
大家好,今天为大家分享一个超厉害的Python库-apscheduler。Github地址:https://github.com/agronholm/apschedulerAPSchedule...
- 给3D Slicer添加Python第三方插件库
-
对临床医生或医学影像算法研究人员来说,3DSlicer是不错的临床实践或科研工具。随着人工智能和深度学习技术的普及,python已经作为原型开发和验证的计算机编程语言。3DSlicer自带pyt...
- Paramiko:一个非常实用的Python库
-
前言Python的Paramiko库,它是一个用于实现SSHv2协议的客户端和服务器的库。通过使用Paramiko,我们可以在Python程序中轻松地实现远程服务器的管理、文件传输等功能。特别做智能硬...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)