Python迭代器系统学习路线第528讲_核心原理与实战案例详解【指导】

Python迭代器是运行时底层协议,非语法糖;for循环隐式调用iter(),要求对象实现__iter__或__getitem__;int不满足故报错;迭代器一次性、需处理StopIteration;生成器是迭代器子类。

Python 的迭代器不是语法糖,是语言运行时底层协议的体现;掌握它不靠死记 __iter____next__,而在于理解「谁在调用、何时中断、状态如何保存」。

为什么 for 循环能遍历 list 却不能直接遍历 int?

因为 for 语句背后隐式调用 iter(),而该函数只接受实现了 __iter__(返回迭代器)或 __getitem__(支持整数索引且从 0 开始)的对象。int 没有这两个方法,所以报 TypeError: 'int' object is not iterable

  • liststrdict 都实现了 __iter__,返回各自对应的迭代器对象(如 list_iterator
  • range 是个特例:它本身是可迭代对象,但不依赖 __getitem__,而是通过 __iter__ 返回一个轻量级的 range_iterator
  • 自定义类只要返回一个带 __next__ 方法的对象(不管是不是自身),就能被 for 消费

手动模拟 for 循环:用 try/except 处理 StopIteration 才是关键

写迭代器时最容易忽略的是异常边界——StopIteration 不是错误,而是协议约定的终止信号。Python 内部用它跳出循环,你手动调用 next() 时必须处理它。

numbers = iter([1, 2, 3])
while True:
    try:
        print(next(numbers))
    except StopIteration:
        break
  • 漏掉 try/except 会导致程序崩溃,尤其在不确定长度的生成逻辑中(比如读文件、网络流)
  • next(iterator, default) 可以避免异常,但仅适用于需要默认值的场景;无法区分「到底有没有下一个」和「就是到头了」
  • 生成器函数(含 yield)自动封装了 StopIteration 抛出逻辑,所以不用手动写

迭代器 vs 生成器 vs 可迭代对象:三者关系一张图说清

可迭代对象(Iterable)是顶层接口,迭代器(Iterator)是具体实现,生成器(Generator)是迭代器的一种子类型(也是可迭代对象)。

  • 可迭代对象:有 __iter__ 方法,调用后返回一个迭代器(如 [].__iter__()
  • 迭代器:有 __iter__(通常返回自身)和 __next__(返回下一个值或抛 StopIteration
  • 生成器:由 yield 定义的函数返回的对象,本质是迭代器,但多了 send()throw()close() 等协程能力

判断方式:from collections.abc import Iterator, Iterable,再用 isinstance(obj, Iterator)isinstance(obj, Iterable)

真实项目里迭代器最常踩的坑:状态残留与不可重用

迭代器是一次性消耗品。一旦抛出 StopIteration,它就进入终态,后续任何 next() 调用都继续抛异常。这不是 bug,是设计使然。

  • 把同一个迭代器对象传给多个函数,第二个函数会立即遇到 StopIteration
  • 想重复使用?得重新调用 iter()(比如 iter(my_list))或重构为可迭代对象(加 __iter__ 返回新迭代器)
  • 生成器函数每次调用都会返回新生成器对象,天然规避这个问题;但生成器对象本身仍是一次性的

复杂点在于:有些第三方库返回的“迭代器”其实是带缓存或惰性求值逻辑的封装,表面像迭代器,实则内部维护状态机——这时得看文档,不能只靠 isinstance(..., Iterator) 判断行为。