Pandas数据帧筛选方法汇总,值得收藏
itomcoil 2025-09-18 01:23 2 浏览
子集选择是数据操作中最常执行的步骤之一。Pandas提供了许多不同的方法来筛选数据帧,来获得选定的数据子集。在本文中,我们就要来处理数据时遇到的问题以及解决办法。
开始之前,我们先来创建一个示例数据帧。
#创建一个简单的数据帧
df = pd.DataFrame({
'name' : [ 'Chi', 'Alex', 'Sam', 'Hoang', 'Linh', 'Dung', 'Anh'],
'function' : [ 'Marketing', 'Tech', 'Tech', 'Finance', 'Finance', 'Marketing', 'HR'],
'address' : [ 'Hanoi', 'Saigon', 'Hanoi', 'Saigon', 'Hanoi', 'Hanoi', 'Saigon'],
'gender' : ['F', 'M', 'F', 'M', 'M', 'M', 'F'],
'favourite_fruit' : [ 'apple', 'banana', 'orange', 'watermelon', 'grape', np.NAN, 'kumquat'],
'age' : [20,25,21,26,30,31,23]
})
以下是我们创建的 df 数据帧:
基于多个条件选择行
基于某些特定条件选择行范围的方法很少。
#使用数据帧方法
df[(df.age >=25) & (df.address == 'Hanoi')]
#使用query函数
df.query('age >= 25 & address == "Hanoi"')
#使用loc函数
df.loc[(df.age >= 25) & (df.address == 'Hanoi')]
所有这些方法产生的结果如下:
使用loc、iloc选择一系列行
在本节中,介绍几种使用 loc 和 iloc 筛选数据帧的方法。
1.使用loc选择一系列行
df.loc[0:3]
输出:
2.使用iloc选择一系列行
df.iloc[0:3]
输出:
为什么 df.loc [0:3] 返回4行,而 df.iloc[0:3] 仅返回3行?
如我们所见,使用 loc 和 iloc 的结果有所不同。造成这种差异的原因是:
- loc不返回基于索引位置的输出,而是基于索引的标签。
- iloc根据索引中的位置选择行。这也意味着iloc只能处理整数。
你也可以参考下面的示例,获取更多参考。在下方的示例中,把 index 设置为“name”列,这样你就可以更清楚地理解它的用法和我的解释了。
df4 = df.copy()
df4.set_index('name', inplace = True)
输出:
接下来让我们再次尝试上面的示例,看看loc如何处理索引标签。
index = ['Chi', 'Sam', 'Hoang']
df4.loc[index]
输出:
根据条件选择必需列
如果有几百列数据,而你可能只想选择其中的某些列,那么可以在loc语句中的条件之后添加列的列表中。
我们可以通过下面的示例来获取 age≥25 岁的人的“name”、“gender”和“address”。
df.loc[(df.age >=25), ['name','gender','address']]
输出:
同时选择行和列
1.使用loc、iloc选择所有行和某些特定列
#使用 iloc
df4.iloc[:,[1,2,3]]
#使用 loc和列名称
df4.loc[:, ['address','gender','favourite_fruit']]
输出:
2.使用loc、iloc选择一系列特定的行和列
# 使用 iloc
df4.iloc[2:6,3:4]
# 使用 loc
df4.loc['Sam':'Dung',['favourite_fruit']]
输出:
3.使用loc、iloc选择不相交的行和列
#使用 iloc
df4.iloc[[1,3],[2,4]]
#使用 loc
df4.loc[['Alex','Hoang'],['gender','age']]
输出:
4.使用 get.loc 和索引方法选择行和列
column_start = df4.columns.get_loc('address')
column_end = df4.columns.get_loc('favourite_fruit')
df4.iloc[1:4,column_start:column_end]
也可以使用.loc方法执行类似的任务。这两个操作产生相同的结果。
row_start = df4.index[1]
row_end = df4.index[3]
df4.loc[row_start:row_end, 'address':'gender']
输出:
在数据帧中选择单个元素
以下几种方法可以选择数据集中的单个元素,包括 loc、iloc、iat 和 at 方法。
通过代码,我们来看看 df4 数据,看看 Hoang 最喜欢的水果是什么?
row_position = df4.index.get_loc('Hoang')column_position = df4.columns.get_loc('favourite_fruit')
#使用 iloc
df4.iloc[row_position,column_position]
#使用 iat
df4.iat[row_position,column_position]
#使用 loc
df4.loc['Hoang','favourite_fruit']
#使用 at
df4.at['Hoang','favourite_fruit']
基本上,上述4种方法检索都得到了相同的结果,即“watermelon(西瓜)”。但是,这些方法的运行速度略有不同,at 和 iat 方法比 loc 和 iloc 方法快一点。
总结
以上为Pandas筛选数据帧时的一些常用技巧。如果你在学习Pandas,或者需要Pandas来筛选数据,这些技巧值得一学!
相关推荐
- Python GUI 编程入门教程 第11章:数据库操作与文件管理
-
11.1数据库操作:与SQLite结合在许多应用中,数据的存储和管理是必不可少的部分。Tkinter本身并不自带数据库支持,但你可以通过Python的sqlite3模块来将数据库功能集成到Tkint...
- Python GUI 编程入门教程 第12章:图形绘制与用户交互
-
12.1图形绘制:Canvas控件Tkinter提供了一个非常强大的控件Canvas,可以用来绘制各种图形,如线条、矩形、圆形等。通过Canvas控件,用户可以在GUI中添加绘图、图像和其他复杂的内...
- Python GUI 编程入门教程 第16章:图形绘制与动画效果
-
16.1使用Canvas绘制图形Tkinter的Canvas控件是一个非常强大的绘图工具,可以用来绘制各种基本图形,如线条、矩形、圆形、文本等。Canvas允许你通过编程创建和修改图形元素,非常适合...
- Python GUI 编程入门教程 第10章:高级布局与界面美化
-
10.1高级布局管理:使用grid和placeTkinter提供了三种常用的布局管理方式:pack、grid和place。在本章中,我们重点介绍grid和place,这两种布局方式相较于pack更加...
- 手机Python编程神器——AidLearning
-
【下载和安装】1、让我们一起来看下吧,直接上图。第一眼看到是不是觉得很高逼格,暗黑画风,这很大佬。其实它就是------AidLearning。一个运行在安卓平台的linux系统,而且还包含了许多非常...
- Python GUI开发:从零开始创建桌面应用
-
在数字化时代,桌面应用依然是我们日常生活中不可或缺的一部分。无论是办公软件、游戏还是各种工具,它们都依赖于图形用户界面(GUI)来提供直观的操作体验。Python的wxPython库为我们提供了一个强...
- Python界面(GUI)编程PyQt5窗体小部件
-
一、简介在Qt(和大多数用户界面)中,“小部件”是用户可以与之交互的UI组件的名称。用户界面由布置在窗口内的多个小部件组成。Qt带有大量可用的小部件,也允许您创建自己的自定义和自定义小部件。二、小部件...
- 自学Python的8个正确顺序仅供参考
-
今天决定写一个Python新人的自学指南,好多人搞不清楚自学的顺序及路线,今天提供给大家参考一下,其实自学编程真的没有难。1【Python基础】安装并配置Python环境和编译软件Pycharm,这...
- Python | Python交互式编程神器_python交互运行
-
很多Pythoner不怎么喜欢用Python交互式界面编程,例如使用Jupyter工具。感觉交互式编程没有把代码敲完再debug舒服。但是在对一些模块/功能进行调试的时候还是非常香的。例如我在写爬虫程...
- Python GUI 编程入门教程 第14章:构建复杂图形界面
-
14.1界面布局管理在Tkinter中,界面控件的排列是通过布局管理器来实现的。Tkinter提供了三种布局管理器:pack、grid和place,每种布局管理器都有其独特的用途和优势。14.1.1...
- Python数据库编程教程:第 1 章 数据库基础与 Python 连接入门
-
1.1数据库的核心概念在开始Python数据库编程之前,我们需要先理解几个核心概念。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它就像一个电子化的文件柜,能让我们高效...
- Python GUI 编程入门教程 第1章:Tkinter入门
-
1.1什么是Tkinter?Tkinter是Python的标准GUI库,它是Python语言的内置模块,无需额外安装。在Tkinter中,我们可以创建窗口、按钮、标签、文本框等常见的GUI元素。1....
- 用Python做个简单的登录页面_python怎么编写一个登录界面
-
我们上网时候,很多网站让你登录,没有账号注册会员,不能复制、粘贴都不让你操作。那我们怎么去实现这个窗口呢?很多语言都可以实现,根据你的需求去确定用哪个,这里我们学习python,就用tkinter测...
- Python入门学习教程:第 16 章 图形用户界面(GUI)编程
-
16.1什么是GUI编程?图形用户界面(GraphicalUserInterface,简称GUI)是指通过窗口、按钮、菜单、文本框等可视化元素与用户交互的界面。与命令行界面(CLI)相比,...
- 推荐系统实例_推荐系统有哪三个部分组成
-
协同过滤算法:#第14课:推荐系统实践-完整的协同过滤推荐系统示例#1.导入必要的库importpandasaspdfromsklearn.metrics.pairwise...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)