更有效地使用 Python Pandas 的 4 个技巧
itomcoil 2025-10-02 20:41 14 浏览
一个简单而实用的指南
照片由simon sun在Unsplash上拍摄
Pandas 是一个用于数据分析和操作任务的非常实用且功能强大的库。自 2019 年以来,我一直在使用 Pandas,它始终能够为我的任务提供解决方案。
在使用 Pandas 大约 3 年后,我意识到一开始我并没有非常有效地使用它。在某些情况下,我解决特定问题的方法比最佳解决方案要长。我也没有非常有效和准确地使用某些功能。
我仍然能够完成任务。然而,当我发现更优化和实用的做事方式时,我的整个工作流程都得到了改进。
在本文中,我将分享 4 个技巧,帮助您充分利用 Pandas。让我们从创建一个示例 DataFrame 开始,以在示例中使用。
将 numpy 导入为 np
将 pandas 导入为 pddf = pd.DataFrame({
"团队": ["A","A","B","B","B",np.nan,np.nan,"C"],
"玩家": [
“约翰”、“简”、“阿什莉”、“艾米丽”、“马特”、“珍妮”、“麦克斯”、“亚历克斯”
]、
“得分”:[81、84、np.nan、91、np。南, 86, 94, 89]
})df
df(作者图片)
我们有一个包含 3 列和 8 行的 DataFrame,并且在 team 和 score 列中存在一些缺失值。
1. 带空值的 value_counts 函数
value_counts 函数是 Pandas 最常用的函数之一。它计算列中每个不同值的出现次数。默认情况下,它不考虑空值(即缺失值)。这可能会产生误导,尤其是在我们处理大文件时。
df["团队"].value_counts()# 输出
B 3
A 2
C 1
名称:团队,数据类型:int64
team 列中有空值,但我们在 value_counts 函数的输出中看不到它们。我们可以使用下面的 dropna 参数使其计算空值。
df["团队"].value_counts(dropna=False)# 输出
B 3
A 2
NaN 2
C 1
名称:团队,dtype:int64
现在输出更准确。
2. 使用其他列填充缺失值
现实生活中的数据集通常包含不能总是被忽略的缺失值。我们需要妥善处理它们以产生准确可靠的输出。
我们有不同的选项来填充缺失值。最优的取决于数据和任务的特性。例如,我们可以使用列平均值来填充缺失值。处理时间序列数据时,上一个或下一个值可能是更好的选择。
另一种选择是使用其他列中的数据。在我们的 DataFrame 中,我们可以使用 player 列填充 team 列中的缺失值。我将向您展示完成这项任务的两种不同技术。第一个是使用 loc 方法手动选择缺失值。
df.loc[df["Team"].isna()==True, "Team"] = df["Player"]
左侧选择团队列中的缺失值。右侧将玩家列中的值分配给这些值。
第二种是直接使用fillna函数。
df["Team"].fillna(df["Player"], inplace=True)df
df(作者图片)
3. 使用 Python 字典
字典是 Python 的内置数据结构。它在数据分析和操作中的各种任务中派上用场。我们还可以将它们与 Pandas 函数一起使用,以使它们更有用。
例如,replace 函数用于替换列或 DataFrame 中的值。考虑我们有一个包含每个球员的球队数据的球队字典。
团队= {
“约翰”:“A”,
“简”:“A”,
“阿什利”:“B”,
“艾米丽”:“B”,
“马特”:“B”,
“珍妮”:“C” ,
“最大”:“C”,
“亚历克斯”:“C”
}
我们可以使用这个字典将球队列中的球员姓名替换为他们的球队名称。
df["团队"] = df["团队"].replace(团队)df
df(作者图片)
我们也可以按如下方式执行此操作:
df["Team"] = df["Team"].replace("Jenny","C")
df["Team"] = df["Team"].replace("Max","C")
这绝对不如使用字典方便。此外,我们可能有几个值要替换。在这种情况下,无需编写几行代码,而是使用字典只需一行即可完成任务。
您可以使用 Python 字典增强其他一些 Pandas 函数。这是我写的关于这个主题的更详细的文章。
4. 缺失值的整数列
分数列中的值是整数,但它们显示为浮点数。原因是此列中的缺失值。
整数的默认数据类型不支持空值,因此数据类型向上转换为浮点数。如果将这些值表示为整数很重要,则可以使用可为空的整数数据类型。
df["Score"] = df["Score"].astype(pd.Int64Dtype())df
df(作者图片)
现在分数显示为整数。
数据清理和操作是任何面向数据的产品的重要组成部分。Pandas 提供了多种功能和方法来加快和简化您的工作流程。为了充分利用 Pandas,您应该尝试发掘任何功能的全部潜力。
您可以成为Medium 会员,以解锁对我的作品以及 Medium 其他内容的完全访问权限。如果您已经是,如果您想在我发布新文章时收到电子邮件,请不要忘记订阅。
感谢您的阅读。如果您有任何反馈,请告诉我。
相关推荐
- python创建文件夹,轻松搞定,喝咖啡去了
-
最近经常在录视频课程,一个课程下面往往有许多小课,需要分多个文件夹来放视频、PPT和案例,这下可好了,一个一个手工创建,手酸了都做不完。别急,来段PYTHON代码,轻松搞定,喝咖啡去了!import...
- 如何编写第一个Python程序_pycharm写第一个python程序
-
一、第一个python程序[掌握]python:python解释器,将python代码解释成计算机认识的语言pycharm:IDE(集成开发环境),写代码的一个软件,集成了写代码,...
- Python文件怎么打包为exe程序?_python3.8打包成exe文件
-
PyInstaller是一个Python应用程序打包工具,它可以将Python程序打包为单个独立可执行文件。要使用PyInstaller打包Python程序,需要在命令行中使用py...
- 官方的Python环境_python环境版本
-
Python是一种解释型编程开发语言,根据Python语法编写出来的程序,需要经过Python解释器来进行执行。打开Python官网(https://www.python.org),找到下载页面,选择...
- [编程基础] Python配置文件读取库ConfigParser总结
-
PythonConfigParser教程显示了如何使用ConfigParser在Python中使用配置文件。文章目录1介绍1.1PythonConfigParser读取文件1.2Python...
- Python打包exe软件,用这个库真的很容易
-
初学Python的人会觉得开发一个exe软件非常复杂,其实不然,从.py到.exe文件的过程很简单。你甚至可以在一天之内用Python开发一个能正常运行的exe软件,因为Python有专门exe打包库...
- 2025 PyInstaller 打包说明(中文指南),python 打包成exe 都在这里
-
点赞标记,明天就能用上这几个技巧!linux运维、shell、python、网络爬虫、数据采集等定定做,请私信。。。PyInstaller打包说明(中文指南)下面按准备→基本使用→常用...
- Python自动化办公应用学习笔记40—文件路径2
-
4.特殊路径操作用户主目录·获取当前用户的主目录路径非常常用:frompathlibimportPathhome_dir=Path.home()#返回当前用户主目录的Path对象...
- Python内置tempfile模块: 生成临时文件和目录详解
-
1.引言在Python开发中,临时文件和目录的创建和管理是一个常见的需求。Python提供了内置模块tempfile,用于生成临时文件和目录。本文将详细介绍tempfile模块的使用方法、原理及相关...
- python代码实现读取文件并生成韦恩图
-
00、背景今天战略解码,有同学用韦恩图展示各个产品线的占比,效果不错。韦恩图(Venndiagram),是在集合论数学分支中,在不太严格的意义下用以表示集合的一种图解。它们用于展示在不同的事物群组之...
- Python技术解放双手,一键搞定海量文件重命名,一周工作量秒搞定
-
摘要:想象一下,周五傍晚,办公室的同事们纷纷准备享受周末,而你,面对着堆积如山的文件,需要将它们的文件名从美国日期格式改为欧洲日期格式,这似乎注定了你将与加班为伍。但别担心,Python自动化办公来...
- Python路径操作的一些基础方法_python路径文件
-
带你走进@机器人时代Discover点击上面蓝色文字,关注我们Python自动化操作文件避开不了路径操作方法,今天我们来学习一下路径操作的一些基础。Pathlib库模块提供的路径操作包括路径的...
- Python爬取下载m3u8加密视频,原来这么简单
-
1.前言爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放。今天就教大家如果通过python爬取下载m3u8加密视频...
- 探秘 shutil:Python 高级文件操作的得力助手
-
在Python的标准库中,shutil模块犹如一位技艺精湛的工匠,为我们处理文件和目录提供了一系列高级操作功能。无论是文件的复制、移动、删除,还是归档与解压缩,shutil都能以简洁高效的方式完成...
- 怎么把 Python + Flet 开发的程序,打包为 exe ?这个方法很简单!
-
前面用Python+Flet开发的“我的计算器v3”,怎么打包为exe文件呢?这样才能分发给他人,直接“双击”运行使用啊!今天我给大家分享一个简单的、可用的,把Flet开发的程序打包为...
- 一周热门
- 最近发表
-
- python创建文件夹,轻松搞定,喝咖啡去了
- 如何编写第一个Python程序_pycharm写第一个python程序
- Python文件怎么打包为exe程序?_python3.8打包成exe文件
- 官方的Python环境_python环境版本
- [编程基础] Python配置文件读取库ConfigParser总结
- Python打包exe软件,用这个库真的很容易
- 2025 PyInstaller 打包说明(中文指南),python 打包成exe 都在这里
- Python自动化办公应用学习笔记40—文件路径2
- Python内置tempfile模块: 生成临时文件和目录详解
- python代码实现读取文件并生成韦恩图
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)