百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

阿六详解 python 中的迭代操作和迭代器、生成器的区别

itomcoil 2025-01-12 15:34 17 浏览

前言

小伙伴们迭代器和生成器是 python 面试的时候,被问概率较高的一个知识点,很多小伙伴都不太分得清这两者的区别,今天就来给大家详细的讲解迭代器和生成器的区别。

一、可迭代对象

在讲解迭代器和生成器之前,我们得先说说可迭代对象,所谓的可迭代对象就是能够通过 for 循环迭代,逐一返回其成员项的对象称为可迭代对象, python 中可迭代对象包括

  • 1、所有序列类型 :如 list、 str 和 tuple、range
  • 2、非序列类型: dict、set、文件对象
  • 3、实现了 __iter__() 方法的任意对象
  • 4、实现了序列语义的 __getitem__() 方法的任意对象。

二、for 循环迭代到底干了啥?

1、 __iter__() 方法

__iter__() 在 python 中也被称作迭代协议,只要对象拥有 __iter__() 方法,那么该对象就实现了迭代协议,就可以进行迭代操作。

另外 __iter__() 方法的返回值,必须是一个迭代器(迭代器下章详细讲解)。

python 中的 list、str、tuple、dict、set 等类型都实现了 __iter__() (迭代协议),所以能够直接进行遍历。

当我们用 for 去遍历任何一个对象时,for 循环执行的时候,会先去调用对象的 __iter__(),根据 __iter__() 返回的迭代器,再进行迭代操作。

下面是我自己定义的一个实现 __iter__() 方法,可迭代对象的类

  class MyArray:
    """自定义的可迭代对象类"""
    def __iter__(self):
        return iter([11, 22, 33, 44])
  
if __name__ == '__main__':
    m = MyArray()
    for i in m:
        print(i)

执行结果:

  11
22
33
44

上面案例遍历自定义 MyArray 类的对象,可以看到遍历出来的是 __iter__() 返回迭代器中的数据

2、__getitem__() 方法

__getitem__() 是用来实现序列类型数据索引取值的魔术方法。python 中的 str、list、dict 等类型的数据均实现了该方法。

  li = [11,22,33]
dic = {'a':11,'b':22}
# 列表索引取值,本质上调用的是 li.__getitem__(1)方法去取值的。
li[1]

前面说到 for 循环遍历对象的时候,会先去调用对象的 __iter__() 方法,如果对象没有定义 __iter__() 方法,那么 for 在遍历的时候,就会从索引 0 开始,循环调用 __getitem__(),,把 __getitem__() 的返回值,作为遍历出来的数据,直到 __getitem__() 中抛出异常,则终止循环。

下面是通过 __getitem__() 方法实现的可迭代对象的类。

  class Mylist2:
    """自定义的序列类类"""
    li = ['a1', 'a2', 'a3', 'a4']
    def __getitem__(self, item):
        # iten是for循环内部传进来的索引值,从0开始
        return self.li[item]
  
if __name__ == '__main__':
    m2 = Mylist2()
    for i in m2:
        print(i)

执行结果:

  a1
a2
a3
a4

从上面的案例中我们可以看到我们在遍历 Mylist2 这个类的对象时,其实就是不断的调用对象的 __getitem__ 方法来获取遍历出来的值。

三、迭代器(Iterator)

理解了什么是可迭代对象和 for 循环迭代的机制之后,我们再来了解一下迭代器协议和迭代器。

2.1 迭代器协议:

  迭代器协议由一个`__iter__` 方法和__next__方法共同构成。实现了这两个方法的对象就实现了迭代器协议。
  • 1、对象实现了迭代协议的对象(实现了 __iter__ 方法)
  • 2、对象实现了 __next__ 方法,__next__ 方法在迭代完所有数据之后,会抛出 StopIteration 的错误信息。

2.2迭代器

  • 1、实现了迭代器协议的对象,就是一个迭代器
  • 2、所有的可迭代对象 都可以通过内置函数 iter()转换为迭代器:
  • 3、迭代器对象能够使用 内置函数 next 进行迭代操作,当所有数据迭代完毕后,再使用 next 迭代,会抛出异常 StopIteration。
  • 4、所有的迭代器都是可迭代对象,因为迭代器协议包含了迭代协议

# 将列表转换为一个迭代器

iter_li = iter([11,22,33,44])

# 通过next对迭代器进行迭代操作,每次可以迭代出来一个数据

s1 = next(iter_li)

print('s1:',s1)

s2 = next(iter_li)

print('s2:',s2)


# 上述代码运行结果为:

s1 :11

s2 :22

四、生成器

问题:什么是生成器?生成器有什么作用?

是一种特殊的迭代器,具备迭代器所有的特性,生成器内部不存储数据,只保存生成数据的计算规则,在存储大量数据的时候,能够节约内存的开销

python 中定义生成器,一共有两种方式,一种是生成器表达式,另一种是生成器函数。

4.1、生成器表达式

生成器表达式的语法其实就是把列表推导式的中括号改成小括号,如下:

  gen_ =(item for item in range(10))
print(gen_)

运行结果:

  <generator object <genexpr> at 0x00000000023A8DB0>

上面运行的结果是一个 generator object,就是一个生成器对象,而上面写的表达式,就叫做生成器表达式

4.2、生成器函数

在函数中使用 yeild 关键字可以定义一个生成器函数。只要当函数中有 yeild 这个关键字,那么就不能再把它看成一个简单的函数,调用函数不会直接执行函数内部的代码,而是直接返回的就是一个生成器对象

  def func():
    for i in item:
        yeild i

#调用函数   
gen_lsit = func()
print(type(gen_list))
#返回的是一个generator对象

#同样也可以使用next生成数据
next(gen_list)

五、生成器和迭代器的区别:

生成器属于迭代器的一种,如何区分迭代器和生成器?

  • 1、迭代器类型是 Iterator 类型,生成器是 Generator 类型。
  • 2、生成器内部不存储数据,只保存生成数据的计算规则
  • 3、生成器比迭代器多了 3 个方法 send 方法:在生成数据的同时,可以和生成器内部进行数据交互 close: 生成可以调用 close 方法进行关闭 throw: 可以在生成器内部上一次暂停的 yield 处引发一个指定的异常类型。生成器内部可以通过捕获的异常类型来做不同的处理
  def gen():
    for i in range(10):
        yield i

g = gen()
print(next(g))

print(g.send(10))

# close:关闭生成器
# g.close()

# throw :在生成器内部主动引发一个异常   参数:异常类型  异常信息
# g.throw(ValueError, "hello python")

好了今天就到这里了,喜欢的可以给我点赞加关注哟。

相关推荐

最强聚类模型,层次聚类 !!_层次聚类的优缺点

哈喽,我是小白~咱们今天聊聊层次聚类,这种聚类方法在后面的使用,也是非常频繁的~首先,聚类很好理解,聚类(Clustering)就是把一堆“东西”自动分组。这些“东西”可以是人、...

python决策树用于分类和回归问题实际应用案例

决策树(DecisionTrees)通过树状结构进行决策,在每个节点上根据特征进行分支。用于分类和回归问题。实际应用案例:预测一个顾客是否会流失。决策树是一种基于树状结构的机器学习算法,用于解决分类...

Python教程(四十五):推荐系统-个性化推荐算法

今日目标o理解推荐系统的基本概念和类型o掌握协同过滤算法(用户和物品)o学会基于内容的推荐方法o了解矩阵分解和深度学习推荐o掌握推荐系统评估和优化技术推荐系统概述推荐系统是信息过滤系统,用于...

简单学Python——NumPy库7——排序和去重

NumPy数组排序主要用sort方法,sort方法只能将数值按升充排列(可以用[::-1]的切片方式实现降序排序),并且不改变原数组。例如:importnumpyasnpa=np.array(...

PyTorch实战:TorchVision目标检测模型微调完

PyTorch实战:TorchVision目标检测模型微调完整教程一、什么是微调(Finetuning)?微调(Finetuning)是指在已经预训练好的模型基础上,使用自己的数据对模型进行进一步训练...

C4.5算法解释_简述c4.5算法的基本思想

C4.5算法是ID3算法的改进版,它在特征选择上采用了信息增益比来解决ID3算法对取值较多的特征有偏好的问题。C4.5算法也是一种用于决策树构建的算法,它同样基于信息熵的概念。C4.5算法的步骤如下:...

Python中的数据聚类及可视化分析实践

探索如何通过聚类分析揭露糖尿病预测数据集的特征!我们将运用Python的强力工具,深入挖掘数据,以直观的可视化揭示不同特征间的关系。一同探索聚类分析在糖尿病预测中的实践!所有这些可视化都可以通过数据操...

用Python来统计大乐透号码的概率分布

用Python来统计大乐透号码的概率分布,可以按照以下步骤进行:导入所需的库:使用Python中的numpy库生成数字序列,使用matplotlib库生成概率分布图。读取大乐透历史数据:从网络上找到大...

python:支持向量机监督学习算法用于二分类和多分类问题示例

监督学习-支持向量机(SVM)支持向量机(SupportVectorMachine,简称SVM)是一种常用的监督学习算法,用于解决分类和回归问题。SVM的目标是找到一个最优的超平面,将不同类别的...

25个例子学会Pandas Groupby 操作

groupby是Pandas在数据分析中最常用的函数之一。它用于根据给定列中的不同值对数据点(即行)进行分组,分组后的数据可以计算生成组的聚合值。如果我们有一个包含汽车品牌和价格信息的数据集,那么可以...

数据挖掘流程_数据挖掘流程主要有哪些步骤

数据挖掘流程1.了解需求,确认目标说一下几点思考方法:做什么?目的是什么?目标是什么?为什么要做?有什么价值和意义?如何去做?完整解决方案是什么?2.获取数据pandas读取数据pd.read.c...

使用Python寻找图像最常见的颜色_python 以图找图

如果我们知道图像或对象最常见的是哪种颜色,那么可以解决图像处理中的几个用例,例如在农业领域,我们可能需要确定水果的成熟度。我们可以简单地检查一下水果的颜色是否在预定的范围内,看看它是成熟的,腐烂的,还...

财务预算分析全网最佳实践:从每月分析到每天分析

原文链接如下:「链接」掌握本文的方法,你就掌握了企业预算精细化分析的能力,全网首发。数据模拟稍微有点问题,不要在意数据细节,先看下最终效果。在编制财务预算或业务预算的过程中,通常预算的所有数据都是按月...

常用数据工具去重方法_数据去重公式

在数据处理中,去除重复数据是确保数据质量和分析准确性的关键步骤。特别是在处理多列数据时,保留唯一值组合能够有效清理数据集,避免冗余信息对分析结果的干扰。不同的工具和编程语言提供了多种方法来实现多列去重...

Python教程(四十):PyTorch深度学习-动态计算图

今日目标o理解PyTorch的基本概念和动态计算图o掌握PyTorch张量操作和自动求导o学会构建神经网络模型o了解PyTorch的高级特性o掌握模型训练和部署PyTorch概述PyTorc...