喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。
亲爱的数据探索者们,你们好!如果你对挖掘数据的深层含义充满好奇,那么这篇文章将是你的理想指南。请跟随我一起,我们将深入探索Python中的pandas库,这是数据分析的瑞士军刀。
首先,你需要先安装Python程序和开发环境:
「Python3.11.0」手把手教你安装最新版Python运行环境
Python启航:30天编程速成之旅(第2天)-IDE安装
【Python教程】JupyterLab 开发环境安装
在上一篇文章中,我们揭开了pandas的神秘面纱,学习了如何安装和调用它,以及如何创建和查看基本的数据结构。今天,我们将更进一步,学习如何选择数据,这是数据分析中的关键步骤。
前期准备数据代码:
import pandas as pd
import numpy as np
# 使用date_range方法创建连续的日期
my_date = pd.date_range("20241001", periods=7)
# 传递带有日期时间索引的 NumPy 数组来创建 DataFrame
df = pd.DataFrame(np.random.randn(7, 4), index=my_date, columns=['第一次', '第二次', '第三次', '第四次'])
df
数据:
数据选择的技巧
在pandas中,数据选择是一门艺术,也是一种科学。我们可以通过多种方式来选择我们感兴趣的数据。
选择单列数据
想象一下,你只对“第一次”尝试的结果感兴趣。在pandas中,这非常简单:
df["第一次"]
运行结果 :
选择多行数据
如果你想要查看前三行的数据,或者特定日期范围内的数据,pandas也能轻松应对:
df[0:3]
df["2024-10-02":"2024-10-04"]
按标签选择
有时候,我们更倾向于使用标签来选择数据。pandas提供了loc方法,让我们能够精确地选择我们想要的行和列:
df.loc[my_date[0]]
df.loc[:, ["第二次", "第四次"]]
df.loc["2024-10-02":"2024-10-04", ["第二次", "第四次"]]
df.loc[my_date[0], "第二次"]
要快速访问标量(相当于前面的方法):
df.at[my_date[0], "第二次"]
按位置选择
如果你更喜欢按位置来选择数据,iloc方法是你的好帮手:
df.iloc[3]
df.iloc[3:5, 0:2]
df.iloc[[1, 2, 4], [0, 2]]
df.iloc[1:3, :]
df.iloc[:, 1:3]
快速访问单个值
在数据分析中,我们经常需要快速访问单个值。
df.iloc[1, 1]
df.iat[1, 1]
喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。