百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python每日一库之Numpy

itomcoil 2025-01-10 14:20 31 浏览

什么是Numpy?

Numpy 用于在数组中执行数学和逻辑运算。使用 NumPy 的主要目的是提高内存效率,它可以管理任何维度的大量数据。Numpy 用于执行数组和矩阵运算。

Numpy 可以执行矩阵运算、三角函数、线性代数、统计等等。

Numpy ndarray 提供多维数组对象。

Numpy中的数组有哪些类型?


标量 - 它只有单个元素0D

向量 - 它有 n 个元素,但是,元素应该是行或列(简单地总结元素列表)1D

矩阵 - 矩阵在2D行和列中保存值

Tensor-Tensor 有 n 维的行和列元素。

如何安装Numpy

使用 pip 安装 NumPy 包

pip install numpy

Pandas 和 Numpy 相辅相成,是两个最重要的 Python 库,如果你想了解Pandas,请查看我之前的Pandas文章:Python每日一库之Pandas

最重要的 Numpy 数据类型是什么?

  • 一维数组

最重要的对象之一是称为 ndarray 的 N 维数组类型。

我们可以将一维数组视为具有一个或多个元素的表的一列或一行:

存储在 ndarray 中的所有项目都必须是同一类型。这意味着 ndarray 是一个同质数据块。ndarray 有跨步信息。该数值是维度中下一个元素的字节数。

这有助于数组在内存中导航,并且不需要复制数据。

每个 ndarray 都包含一个指向其在计算机中的内存位置的指针。它还包含它的 dtype、它的形状和步幅元组。步幅是整数,表示它必须移动的字节数才能到达维度中的下一个元素。

数组包含相同类型的对象的集合,例如整数

要创建一个数组:

import numpy as np

a = np.array([1,2,3])
  • 多维数组

多维数组有不止一列。

我们可以将多维数组视为 Excel 电子表格——它具有列和行。每一列都可以被视为一个维度。

我们可以实例化一个数组对象:

numpy.array([,.,.,.,])
numpy.array([1,2]) #1D 
numpy.array([[1,2],[10,20]]) #2D#对于复杂类型
numpy.array([1,2], dtype=complex) #1D complex

如果要创建 3D 数组:

  • 这将创建 3 个具有 4 行和 5 列的数组,每个数组具有随机整数。
3DArray = np.random.randint(10, size=(3, 4, 5))

还有其他类型可用,例如:

  1. 布尔值
  2. 整数(有符号和无符号)
  3. 浮点数
  4. 复杂的

何时使用数组

就像数组数据结构一样,Python 中的列表也是一种数据结构,列表是可变的,并且是有序的元素序列。它很灵活,可以保存任意数据。此外,我们可以有效地将项目附加到列表中。但是,列表比数组占用更多空间,数组是 C语言数组的封装。如果要执行数学运算,则应使用 Numpy 数组。此外,我们可以在数组上执行我们无法在列表上执行的算术函数。

创建数组的不同方法

  • 如果要创建没有任何元素的数组
numpy.empty(2) #这将创建 2 个元素的一维数组
numpy.empty([2,3]) #这将创建二维数组(2 行,每列 3 列)
  • 如果要创建一个0s的数组
numpy.zeros(2) #它将创建一个有2个元素的一维数组,都是0 
#注意方法的参数是shape,它可以是int或tuple
  • 如果要创建一个1s的数组
numpy.ones(2) # 这将创建具有 2 个元素的一维数组,均为 1
  • 如果你想从一个元素序列创建一个numpy数组
numpy.asarray([python sequence]) #e.g. numpy.asarray([1,2])
  • 从内存中的缓冲区创建numpy数组
#可以在内存中复制字符串
x = np.fromstring(‘hi’, dtype=’int8')
#直接引用字符串的缓冲区,这样可以节省内存,可以传入dtype参数,默认是float
a = np.frombuffer(x, dtype=’int8')
  • 如果要创建一系列元素
array = np.arange(3) #array 将包含 0,1,2
  • 如果要创建一个具有均匀分布的值的数组
#numpy.arange(first, last, step, type)
numpy.arange(0,6,2) # 返回[0,2,4]
  • 如果要创建一个数组,其中值在一个区间之间呈线性间隔
#numpy.linspace(first, last, number)
numpy.linspace(0,10,5)  # 返回[0,2.5,5,7.5,10]
  • 如果要创建一个数组,其中值在一个间隔之间以对数间隔
#numpy.logspace(first, end, number)
a= numpy.logspace(1, 15, 4)
#[1.00000000e+01 4.64158883e+05 2.15443469e+10 1.00000000e+15]
  • 随机数生成
np.random.rand(3,2) #3行,2列

添加/删除/排序元素

  • 添加元素
a = [0] 
np.append(a, [1,2]) #adds 1,2 at the end 
# [0,1,2]
  • 删除元素
# np.delete(array, 1) 从数组中删除元素1
a = np.delete([0,1,2], 1) #results in [0,2]
  • 元素排序

对数组进行排序,请调用 sort(array, axis, kind, orderby) 函数

# np.sort(array1, axis=1, kind = 'quicksort')
a = np.sort([[0,3,2],[1,2,3]], axis=1, kind = 'quicksort' )
#[[0 2 3] 
# [1 2 3]]

NumPy 数组函数和属性

  • shape:查找数组的维度(列数/行数)
#array = np.array([[..],[..]]) 
#print(array.shape)

a = np.array([[1,2],[3,4]])
print(a.shape)
# (2,2) # 行、列

#可以通过设置 shape 属性来改变数组的形状(调整大小)
array.shape = (1,2) #1 行 2 列
#如果想在不复制任何数据的情况下更改数组的形状,可以使用reshape()方法
array = np.arange(10) 
array.reshape(2,5) #这将返回一个2行5列的数组
#还可以将维度值设置为 -1,这将让 Numpy 从数据中推断出维度
#想展平一个数组而不返回一个副本,我们可以使用 ravel() 函数
array.ravel() # 这会将上面的数组重塑为1d的10个元素
#我们想展平一个数组并生成一个副本,那么我们可以使用 flatten() 方法
a = array.flatten() #这将返回一个一维数组
  • 如果我们要求一个数组的维度
a = np.array([[1,2],[3,4]])
print(a.ndim)
  • 如果我们要求一个数组每个元素的长度
a = np.array([0,1,2]).itemsize
print(a)
  • 如果我们想要对数组的一个子集进行切片
array = np.arange(100)
#获取第三个元素:
array[2] #prints 2
#获取索引中的项目
array[3:5] #3 是开始,5 是结束, prints [3 4]
#获取3-10个元素,步长是4:
array[2:9:4] #prints [2 6]
#从第二个元素开始获取所有元素
array[1:] #prints [1-99]
#也可以传入N维索引
array = np.array([[0,1,3],[1,2,4]])
print(array[[0,1],[1,2]]) #prints [1 4]
  • 数组切片中的条件
#获取所有 NAN 元素
array[np.isnan(array)]

#where()可用于传入布尔表达式
np.where(array > 2) # 将返回所有符合条件的元素
  • 广播数组
#当对两个不同大小的数组执行数学运算时,较小的数组被广播到较大数组的大小
large_array = np.arange(15).reshape(5,3) #5 行 3 列数组
small_array = np.arange(5).reshape(5,1) #5 行 1 列数组
final_array = small_array * large_array 
print (final_array)

需要注意的关键是广播兼容两个数组,其中第一个数组的列数与第二个数组的行数相同,或者任何数组的长度为 1。

  • 连接数组
a = [1,2] 
b= [3,4] 
c = [a,b] 
#输出:[[1, 2], [3, 4]]

np.concatenate(c) 
#输出:[1 2 3 4]
np.stack(c) #
#输出:
#[[1 2] 
#[3 4]]
# 可以使用 vstack 或 hstach 方法将它们堆叠起来
np.hstack(c) #
#输出:
#[1 2 3 4]
np.vstack(c) #
#输出:
#[[1 2] 
#[3 4]]
  • 字符串操作

可以使用字符串的操作,比如添加,大写,小写,替换等。

add(), upper(), lower(), replace()
  • 创建 numpy 数组的深拷贝
new_array = np.copy(array)

要重复一个数组,我们可以使用 repeat() 或 tile() 函数。repeat(n) 将简单地重复每个元素 n 次。n 也可以是一个数组,其中每个元素将根据 n 的值以不同的方式重复,例如 [1,5] 意味着我们需要重复第一个元素一次,第二个元素重复 5 次。对于多维数组,我们可以传入axis属性。tile(array, (n,m)) 略有不同,因为除了重复元素之外,它还对 n 行和 m 列的项目进行平铺/堆叠。

  • 自定义数组函数

使用 np.fromnpfunc(my_new_ufunc, elements) 创建新的 func,然后在 NumPy 数组上执行它

  • 结构化数组

我们想创建一个包含多种数据类型元素的数组,那么我们可以创建一个结构化数组。我们可以设置 dtype,它是一个包含元素名称和类型的元组列表。结构化数组比 pandas DataFrame 更快,因为它们消耗更少的内存,因为每个元素都表示为固定数量的字节,它们是精简的,因此是高效的低级数组,也可以被视为表格结构。

type = [('column_1', np.int32, 'column_2', np.float64]) 
array = np.array([1,2], [2.4, -1], dtype=type)
  • 数学函数

Numpy 提供了一系列强大的数学函数,由于 Numpy 具有丰富的数学特性,因此在 Numpy 之上构建了许多库

#加、减、乘、除、幂、模
#要对两个数组 a 和 b 执行基本算术函数:

a = [1,2] 
b= [3,4] 
c = np.add(a, b) 
c = np.subtract(a, b) 
c = np.multiply(a, b) 
c = np.divide( a, b) 
c = np.power(a, b) 
c = np.power(a, 2) 
#得到余数
c= np.mod(a, b) 
c = np.remainder(a, b)

#四舍五入,ceiling向上取整,floor向下取整
#要更改数组所有元素的精度:

np.around(array, 4) # 4dp 
np.ceil(array) #1.8 会变成 2 
np.floor(array) #1.8 会变成 1
  • 三角函数
array = [0, 1] 
np.sin(array) 
np.cos(array) 
np.tan(array) 
np.arcsin(array) 
np.arccos(array) 
np.arctan(array)
  • 统计
a = [1,2]
np.amin(a, 0) #min in the axis
np.amax(a, 0) #max in the axis
np.percentile(a, 10)
np.median(a)
np.std(a)
np.average(a)
np.mean(a)
np.var(a)
  • 代数

Numpy 包含一个称为 linalg 的模块。它具有许多代数函数

1. dot() #两个数组的点积
2. inner() #两个数组的内积
3. 行列式() #一个数组的行列式
4.solve() #求解矩阵方程
5. inv() #逆矩阵
6. matmul() #两个数组的矩阵乘积

关于 Numba 的注意事项

我们可以使用 Numba 为 Numpy 创建快速函数。Numba 函数本质上是纯 Python 函数。诀窍是使用 nb.jit(func) 将函数编译成更快的 Numba 版本。我们还可以在函数上使用 @numba.vectorize 装饰器将代码编译成 NumPy ufunc。尽管 Numba 不支持所有 Python 代码,但它可以处理大部分用纯 Python 编写的数值算法。

概括

本文概述了 NumPy 库的核心功能。自从 2005 年 NumPy 与 Numarray 的功能相结合以来,它已经获得了巨大的普及,并被认为是使用的关键 Python 库之一。

文章概述了 NumPy 数组的关键功能和属性,感谢阅读,Happy Code!

相关推荐

python创建文件夹,轻松搞定,喝咖啡去了

最近经常在录视频课程,一个课程下面往往有许多小课,需要分多个文件夹来放视频、PPT和案例,这下可好了,一个一个手工创建,手酸了都做不完。别急,来段PYTHON代码,轻松搞定,喝咖啡去了!import...

如何编写第一个Python程序_pycharm写第一个python程序

一、第一个python程序[掌握]python:python解释器,将python代码解释成计算机认识的语言pycharm:IDE(集成开发环境),写代码的一个软件,集成了写代码,...

Python文件怎么打包为exe程序?_python3.8打包成exe文件

PyInstaller是一个Python应用程序打包工具,它可以将Python程序打包为单个独立可执行文件。要使用PyInstaller打包Python程序,需要在命令行中使用py...

官方的Python环境_python环境版本

Python是一种解释型编程开发语言,根据Python语法编写出来的程序,需要经过Python解释器来进行执行。打开Python官网(https://www.python.org),找到下载页面,选择...

[编程基础] Python配置文件读取库ConfigParser总结

PythonConfigParser教程显示了如何使用ConfigParser在Python中使用配置文件。文章目录1介绍1.1PythonConfigParser读取文件1.2Python...

Python打包exe软件,用这个库真的很容易

初学Python的人会觉得开发一个exe软件非常复杂,其实不然,从.py到.exe文件的过程很简单。你甚至可以在一天之内用Python开发一个能正常运行的exe软件,因为Python有专门exe打包库...

2025 PyInstaller 打包说明(中文指南),python 打包成exe 都在这里

点赞标记,明天就能用上这几个技巧!linux运维、shell、python、网络爬虫、数据采集等定定做,请私信。。。PyInstaller打包说明(中文指南)下面按准备→基本使用→常用...

Python自动化办公应用学习笔记40—文件路径2

4.特殊路径操作用户主目录·获取当前用户的主目录路径非常常用:frompathlibimportPathhome_dir=Path.home()#返回当前用户主目录的Path对象...

Python内置tempfile模块: 生成临时文件和目录详解

1.引言在Python开发中,临时文件和目录的创建和管理是一个常见的需求。Python提供了内置模块tempfile,用于生成临时文件和目录。本文将详细介绍tempfile模块的使用方法、原理及相关...

python代码实现读取文件并生成韦恩图

00、背景今天战略解码,有同学用韦恩图展示各个产品线的占比,效果不错。韦恩图(Venndiagram),是在集合论数学分支中,在不太严格的意义下用以表示集合的一种图解。它们用于展示在不同的事物群组之...

Python技术解放双手,一键搞定海量文件重命名,一周工作量秒搞定

摘要:想象一下,周五傍晚,办公室的同事们纷纷准备享受周末,而你,面对着堆积如山的文件,需要将它们的文件名从美国日期格式改为欧洲日期格式,这似乎注定了你将与加班为伍。但别担心,Python自动化办公来...

Python路径操作的一些基础方法_python路径文件

带你走进@机器人时代Discover点击上面蓝色文字,关注我们Python自动化操作文件避开不了路径操作方法,今天我们来学习一下路径操作的一些基础。Pathlib库模块提供的路径操作包括路径的...

Python爬取下载m3u8加密视频,原来这么简单

1.前言爬取视频的时候发现,现在的视频都是经过加密(m3u8),不再是mp4或者avi链接直接在网页显示,都是经过加密形成ts文件分段进行播放。今天就教大家如果通过python爬取下载m3u8加密视频...

探秘 shutil:Python 高级文件操作的得力助手

在Python的标准库中,shutil模块犹如一位技艺精湛的工匠,为我们处理文件和目录提供了一系列高级操作功能。无论是文件的复制、移动、删除,还是归档与解压缩,shutil都能以简洁高效的方式完成...

怎么把 Python + Flet 开发的程序,打包为 exe ?这个方法很简单!

前面用Python+Flet开发的“我的计算器v3”,怎么打包为exe文件呢?这样才能分发给他人,直接“双击”运行使用啊!今天我给大家分享一个简单的、可用的,把Flet开发的程序打包为...