百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Pandas数据帧筛选方法汇总,值得收藏

itomcoil 2025-09-18 01:23 2 浏览

子集选择是数据操作中最常执行的步骤之一。Pandas提供了许多不同的方法来筛选数据帧,来获得选定的数据子集。在本文中,我们就要来处理数据时遇到的问题以及解决办法。

开始之前,我们先来创建一个示例数据帧。

#创建一个简单的数据帧
df = pd.DataFrame({
    'name' :     [ 'Chi', 'Alex', 'Sam', 'Hoang', 'Linh', 'Dung', 'Anh'],
    'function' : [ 'Marketing', 'Tech', 'Tech', 'Finance', 'Finance', 'Marketing', 'HR'],
    'address' :  [ 'Hanoi', 'Saigon', 'Hanoi', 'Saigon', 'Hanoi', 'Hanoi', 'Saigon'],
    'gender' :   ['F', 'M', 'F', 'M', 'M', 'M', 'F'],
    'favourite_fruit' : [ 'apple', 'banana', 'orange', 'watermelon', 'grape', np.NAN, 'kumquat'],
    'age' : [20,25,21,26,30,31,23]
})

以下是我们创建的 df 数据帧:

基于多个条件选择行

基于某些特定条件选择行范围的方法很少。

#使用数据帧方法
df[(df.age >=25) & (df.address == 'Hanoi')] 

#使用query函数
df.query('age >= 25 & address == "Hanoi"') 

#使用loc函数
df.loc[(df.age >= 25) & (df.address == 'Hanoi')] 

所有这些方法产生的结果如下:

使用loc、iloc选择一系列行

在本节中,介绍几种使用 loc 和 iloc 筛选数据帧的方法。

1.使用loc选择一系列行

df.loc[0:3] 

输出:

2.使用iloc选择一系列行

df.iloc[0:3]

输出:

为什么 df.loc [0:3] 返回4行,而 df.iloc[0:3] 仅返回3行?

如我们所见,使用 loc 和 iloc 的结果有所不同。造成这种差异的原因是:

  • loc不返回基于索引位置的输出,而是基于索引的标签。
  • iloc根据索引中的位置选择行。这也意味着iloc只能处理整数。

你也可以参考下面的示例,获取更多参考。在下方的示例中,把 index 设置为“name”列,这样你就可以更清楚地理解它的用法和我的解释了。

df4 = df.copy()
df4.set_index('name', inplace = True) 

输出:

接下来让我们再次尝试上面的示例,看看loc如何处理索引标签。

index = ['Chi', 'Sam', 'Hoang']
df4.loc[index] 

输出:

根据条件选择必需列

如果有几百列数据,而你可能只想选择其中的某些列,那么可以在loc语句中的条件之后添加列的列表中。

我们可以通过下面的示例来获取 age≥25 岁的人的“name”、“gender”和“address”。

df.loc[(df.age >=25), ['name','gender','address']] 

输出:

同时选择行和列

1.使用loc、iloc选择所有行和某些特定列

#使用 iloc
df4.iloc[:,[1,2,3]]

#使用 loc和列名称
df4.loc[:, ['address','gender','favourite_fruit']]

输出:

2.使用loc、iloc选择一系列特定的行和列

# 使用 iloc
df4.iloc[2:6,3:4]

# 使用 loc
df4.loc['Sam':'Dung',['favourite_fruit']]

输出:

3.使用loc、iloc选择不相交的行和列

#使用 iloc
df4.iloc[[1,3],[2,4]]

#使用 loc
df4.loc[['Alex','Hoang'],['gender','age']]

输出:

4.使用 get.loc 和索引方法选择行和列

column_start = df4.columns.get_loc('address')
column_end = df4.columns.get_loc('favourite_fruit')
df4.iloc[1:4,column_start:column_end] 

也可以使用.loc方法执行类似的任务。这两个操作产生相同的结果。

row_start = df4.index[1]
row_end = df4.index[3]
df4.loc[row_start:row_end, 'address':'gender']

输出:

在数据帧中选择单个元素

以下几种方法可以选择数据集中的单个元素,包括 loc、iloc、iat 和 at 方法。

通过代码,我们来看看 df4 数据,看看 Hoang 最喜欢的水果是什么?

row_position = df4.index.get_loc('Hoang')column_position = df4.columns.get_loc('favourite_fruit')

#使用 iloc
df4.iloc[row_position,column_position]

#使用 iat
df4.iat[row_position,column_position]

#使用 loc
df4.loc['Hoang','favourite_fruit'] 

#使用 at
df4.at['Hoang','favourite_fruit'] 

基本上,上述4种方法检索都得到了相同的结果,即“watermelon(西瓜)”。但是,这些方法的运行速度略有不同,at 和 iat 方法比 loc 和 iloc 方法快一点。

总结

以上为Pandas筛选数据帧时的一些常用技巧。如果你在学习Pandas,或者需要Pandas来筛选数据,这些技巧值得一学!

相关推荐

Python GUI 编程入门教程 第11章:数据库操作与文件管理

11.1数据库操作:与SQLite结合在许多应用中,数据的存储和管理是必不可少的部分。Tkinter本身并不自带数据库支持,但你可以通过Python的sqlite3模块来将数据库功能集成到Tkint...

Python GUI 编程入门教程 第12章:图形绘制与用户交互

12.1图形绘制:Canvas控件Tkinter提供了一个非常强大的控件Canvas,可以用来绘制各种图形,如线条、矩形、圆形等。通过Canvas控件,用户可以在GUI中添加绘图、图像和其他复杂的内...

Python GUI 编程入门教程 第16章:图形绘制与动画效果

16.1使用Canvas绘制图形Tkinter的Canvas控件是一个非常强大的绘图工具,可以用来绘制各种基本图形,如线条、矩形、圆形、文本等。Canvas允许你通过编程创建和修改图形元素,非常适合...

Python GUI 编程入门教程 第10章:高级布局与界面美化

10.1高级布局管理:使用grid和placeTkinter提供了三种常用的布局管理方式:pack、grid和place。在本章中,我们重点介绍grid和place,这两种布局方式相较于pack更加...

手机Python编程神器——AidLearning

【下载和安装】1、让我们一起来看下吧,直接上图。第一眼看到是不是觉得很高逼格,暗黑画风,这很大佬。其实它就是------AidLearning。一个运行在安卓平台的linux系统,而且还包含了许多非常...

Python GUI开发:从零开始创建桌面应用

在数字化时代,桌面应用依然是我们日常生活中不可或缺的一部分。无论是办公软件、游戏还是各种工具,它们都依赖于图形用户界面(GUI)来提供直观的操作体验。Python的wxPython库为我们提供了一个强...

Python界面(GUI)编程PyQt5窗体小部件

一、简介在Qt(和大多数用户界面)中,“小部件”是用户可以与之交互的UI组件的名称。用户界面由布置在窗口内的多个小部件组成。Qt带有大量可用的小部件,也允许您创建自己的自定义和自定义小部件。二、小部件...

自学Python的8个正确顺序仅供参考

今天决定写一个Python新人的自学指南,好多人搞不清楚自学的顺序及路线,今天提供给大家参考一下,其实自学编程真的没有难。1【Python基础】安装并配置Python环境和编译软件Pycharm,这...

Python | Python交互式编程神器_python交互运行

很多Pythoner不怎么喜欢用Python交互式界面编程,例如使用Jupyter工具。感觉交互式编程没有把代码敲完再debug舒服。但是在对一些模块/功能进行调试的时候还是非常香的。例如我在写爬虫程...

Python GUI 编程入门教程 第14章:构建复杂图形界面

14.1界面布局管理在Tkinter中,界面控件的排列是通过布局管理器来实现的。Tkinter提供了三种布局管理器:pack、grid和place,每种布局管理器都有其独特的用途和优势。14.1.1...

Python数据库编程教程:第 1 章 数据库基础与 Python 连接入门

1.1数据库的核心概念在开始Python数据库编程之前,我们需要先理解几个核心概念。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它就像一个电子化的文件柜,能让我们高效...

Python GUI 编程入门教程 第1章:Tkinter入门

1.1什么是Tkinter?Tkinter是Python的标准GUI库,它是Python语言的内置模块,无需额外安装。在Tkinter中,我们可以创建窗口、按钮、标签、文本框等常见的GUI元素。1....

用Python做个简单的登录页面_python怎么编写一个登录界面

我们上网时候,很多网站让你登录,没有账号注册会员,不能复制、粘贴都不让你操作。那我们怎么去实现这个窗口呢?很多语言都可以实现,根据你的需求去确定用哪个,这里我们学习python,就用tkinter测...

Python入门学习教程:第 16 章 图形用户界面(GUI)编程

16.1什么是GUI编程?图形用户界面(GraphicalUserInterface,简称GUI)是指通过窗口、按钮、菜单、文本框等可视化元素与用户交互的界面。与命令行界面(CLI)相比,...

推荐系统实例_推荐系统有哪三个部分组成

协同过滤算法:#第14课:推荐系统实践-完整的协同过滤推荐系统示例#1.导入必要的库importpandasaspdfromsklearn.metrics.pairwise...