百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

超全的100个Pandas函数汇总 pandas 常用函数

itomcoil 2024-12-28 13:34 44 浏览

上次分享了10个使用频率非常高的Pandas函数,同学们都觉得很有用。今天,咱们继续~~

我整理了100个Pandas常用的函数,分别分为6类:统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。赶紧收藏起来吧!

统计汇总函数

函数

含义

min()

计算最小值

max()

计算最大值

sum()

求和

mean()

计算平均值

count()

计数(统计非缺失元素的个数)

size()

计数(统计所有元素的个数)

median()

计算中位数

var()

计算方差

std()

计算标准差

quantile()

计算任意分位数

cov()

计算协方差

corr()

计算相关系数

skew()

计算偏度

kurt()

计算峰度

mode()

计算众数

describe()

描述性统计(一次性返回多个统计结果)

groupby()

分组

aggregate()

聚合运算(可以自定义统计函数)

argmin()

寻找最小值所在位置

argmax()

寻找最大值所在位置

any()

等价于逻辑“或”

all()

等价于逻辑“与”

value_counts()

频次统计

cumsum()

运算累计和

cumprod()

运算累计积

pct--_change()

运算比率(后一个元素与前一个元素的比率)

# describe函数总结数据集分布的集中趋势,分散和形状
import numpy as np
import pandas as pd
data = {'a':[12,13,14,15,11],'b':['a','b','c','d','c']}
df = pd.DataFrame(data)
df.describe() #默认返回数字字段
df.describe(include='all')

数据清洗函数

函数

含义

duplicated()

判断序列元素是否重复。

drop_duplicates()

删除重复值

hasnans()

判断序列是否存在缺失(返回TRUE或FALSE)

isnull()

判断序列元素是否为缺失(返回与序列长度一样的bool值)

notnull()

判断序列元素是否不为缺失(返回与序列长度一样的bool值)

dropna()

删除缺失值

fillna()

缺失值填充

ffill()

前向后填充缺失值(使用缺失值的前一个元素填充)

bfill()

后向填充缺失值(使用缺失值的后一个元素填充)

dtypes()

检查数据类型

astype()

类型强制转换

pd.to_datetime

转日期时间型

factorize()

因子化转换

sample()

抽样

where()

基于条件判断的值替换

replace()

按值替换(不可使用正则)

str.replace()

按值替换(可使用正则)

str.split.str()

字符分隔

import numpy as np
import pandas as pd
data = {'a':[12,13,14,15,12],'b':['a','b','c','d','c']}
df = pd.DataFrame(data)
df.duplicated('a')
df.drop_duplicates('a','first',inplace = True) #删除重复项并保留第一次出现的项
df

数据筛选函数

函数

含义

isin()

成员关系判断

between()

区间判断

loc()

条件判断(可使用在数据框中)

iloc()

索引判断(可使用在数据框中)

compress()

条件判断

nlargest()

搜寻最大的n个元素

nsmallest()

搜寻最小的n个元素

str.findall()

子串查询(可使用正则)

df = pd.DataFrame({'population': [59000000,65000000,434000,434000,434000,337000,11300,11300,11300],
'GDP': [1937894,2583560,12011,4520,12128,17036,182,38,311],
'alpha-2': ["IT","FR","MT","MV","BN","IS","NR","TV","AI"]},
index=["Italy", "France","Malta","Maldives","Brunei","Iceland","Nauru","Tuvalu","Anguilla"])
df
df.nlargest(3, 'population') #搜寻“population”列中具有最大值的三行

绘图与元素级运算函数

函数

含义

hist()

绘制直方图

plot()

可基于kind参数绘制更多图形(饼图,折线图,箱线图等)

map()

元素映射

apply()

基于自定义函数的元素级操作

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt #使用 matplotlib 仅仅是用来 show 图片
df = pd.read_csv('forestfires.csv')
df.plot('temp','FFMC',kind = 'scatter',color='LightGreen') # scatter散点图
plt.show()

时间序列函数

函数

含义

dt.date()

抽取出日期值

dt.time()

抽取出时间(时分秒)

dt.year()

抽取出年

dt.mouth()

抽取出月

dt.day()

抽取出日

dt.hour()

抽取出时

dt.minute()

抽取出分钟

dt.second()

抽取出秒

dt.quarter()

抽取出季度

dt.weekday()

抽取出星期几(返回数值型)

dt.weekday_name()

抽取出星期几(返回字符型)

dt.week()

抽取出年中的第几周

dt.dayofyear()

抽取出年中的第几天

dt.daysinmonth()

抽取出月对应的最大天数

dt.is_month_start()

判断日期是否为当月的第一天

dt.is_month_end()

判断日期是否为当月的最后一天

dt.is_quarter_start()

判断日期是否为当季度的第一天

dt.is_quarter_end()

判断日期是否为当季度的最后一天

dt.is_year_start()

判断日期是否为当年的第一天

dt.is_year_end()

判断日期是否为当年的最后一天

dt.is_leap_year()

判断日期是否为闰年

其他函数

函数

含义

append()

序列元素的追加(需指定其他序列)

diff()

一阶差分

round()

元素的四舍五入

sort_values()

按值排序

sort_index()

按索引排序

to_dict()

转为字典

tolist()

转为列表

unique()

元素排重

相关推荐

Python编程实现求解高次方程_python求次幂
Python编程实现求解高次方程_python求次幂

#头条创作挑战赛#编程求解一元多次方程,一般情况下对于高次方程我们只求出近似解,较少的情况可以得到精确解。这里给出两种经典的方法,一种是牛顿迭代法,它是求解方程根的有效方法,通过若干次迭代(重复执行部分代码,每次使变量的当前值被计算出的新值...

2025-10-23 03:58 itomcoil

python常用得内置函数解析——sorted()函数

接下来我们详细解析Python中非常重要的内置函数sorted()1.函数定义sorted()函数用于对任何可迭代对象进行排序,并返回一个新的排序后的列表。语法:sorted(iterabl...

Python入门学习教程:第 6 章 列表

6.1什么是列表?在Python中,列表(List)是一种用于存储多个元素的有序集合,它是最常用的数据结构之一。列表中的元素可以是不同的数据类型,如整数、字符串、浮点数,甚至可以是另一个列表。列...

Python之函数进阶-函数加强(上)_python怎么用函数

一.递归函数递归是一种编程技术,其中函数调用自身以解决问题。递归函数需要有一个或多个终止条件,以防止无限递归。递归可以用于解决许多问题,例如排序、搜索、解析语法等。递归的优点是代码简洁、易于理解,并...

Python内置函数range_python内置函数int的作用

range类型表示不可变的数字序列,通常用于在for循环中循环指定的次数。range(stop)range(start,stop[,step])range构造器的参数必须为整数(可以是内...

python常用得内置函数解析——abs()函数

大家号这两天主要是几个常用得内置函数详解详细解析一下Python中非常常用的内置函数abs()。1.函数定义abs(x)是Python的一个内置函数,用于返回一个数的绝对值。参数:x...

如何在Python中获取数字的绝对值?

Python有两种获取数字绝对值的方法:内置abs()函数返回绝对值。math.fabs()函数还返回浮点绝对值。abs()函数获取绝对值内置abs()函数返回绝对值,要使用该函数,只需直接调用:a...

贪心算法变种及Python模板_贪心算法几个经典例子python

贪心算法是一种在每一步选择中都采取当前状态下最优的选择,从而希望导致结果是全局最优的算法策略。以下是贪心算法的主要变种、对应的模板和解决的问题特点。1.区间调度问题问题特点需要从一组区间中选择最大数...

Python倒车请注意!负步长range的10个高能用法,让代码效率翻倍

你是否曾遇到过需要倒着处理数据的情况?面对时间序列、日志文件或者矩阵操作,传统的遍历方式往往捉襟见肘。今天我们就来揭秘Python中那个被低估的功能——range的负步长操作,让你的代码优雅反转!一、...

Python中while循环详解_python怎么while循环

Python中的`while`循环是一种基于条件判断的重复执行结构,适用于不确定循环次数但明确终止条件的场景。以下是详细解析:---###一、基本语法```pythonwhile条件表达式:循环体...

简单的python-核心篇-面向对象编程

在Python中,类本身也是对象,这被称为"元类"。这种设计让Python的面向对象编程具有极大的灵活性。classMyClass:"""一个简单的...

简单的python-python3中的不变的元组

golang中没有内置的元组类型,但是多值返回的处理结果模拟了元组的味道。因此,在golang中"元组”只是一个将多个值(可能是同类型的,也可能是不同类型的)绑定在一起的一种便利方法,通常,也...

python中必须掌握的20个核心函数——sorted()函数

sorted()是Python的内置函数,用于对可迭代对象进行排序,返回一个新的排序后的列表,不修改原始对象。一、sorted()的基本用法1.1方法签名sorted(iterable,*,ke...

12 个 Python 高级技巧,让你的代码瞬间清晰、高效

在日常的编程工作中,我们常常追求代码的精简、优雅和高效。你可能已经熟练掌握了列表推导式(listcomprehensions)、f-string和枚举(enumerate)等常用技巧,但有时仍会觉...

Python的10个进阶技巧:写出更快、更省内存、更优雅的代码

在Python的世界里,我们总是在追求效率和可读性的完美平衡。你不需要一个数百行的新框架来让你的代码变得优雅而快速。事实上,真正能带来巨大提升的,往往是那些看似微小、却拥有高杠杆作用的技巧。这些技巧能...