当前位置：首页 > Python > 正文

Python可迭代对象的本质探究 | 深入理解Python迭代机制

LiaoRaoZun
Python
2025-07-22
266

Python可迭代对象的本质探究

在Python中，可迭代对象(Iterable)是支撑for循环、列表推导等功能的基石。本文将深入剖析：

可迭代对象与迭代器的核心区别
迭代器协议的双方法机制
for循环背后的实现原理
如何创建自定义可迭代对象

一、可迭代对象的核心特征

可迭代对象的本质特征是实现了__iter__()方法，该方法返回一个迭代器对象。常见可迭代对象包括：

list_data = [1, 2, 3]     # 列表
tuple_data = (4, 5, 6)    # 元组
dict_data = {'a': 7}      # 字典
str_data = "hello"        # 字符串
file = open('data.txt')   # 文件对象

二、迭代器协议剖析

迭代器必须同时实现两个核心方法：

__iter__()：返回迭代器自身（使迭代器也可迭代）
__next__()：返回下一个元素，耗尽时抛出StopIteration异常

内存高效原理

迭代器通过惰性计算实现内存高效：

# 传统列表（立即加载所有数据）
numbers = [x for x in range(1000000)]  # 占用大量内存

# 迭代器（按需生成数据）
numbers_iter = iter(range(1000000))   # 几乎不占内存

三、for循环的运作机制

以下代码揭示for循环的等价实现：

# 标准for循环
for item in iterable:
    print(item)

# 实际等价于
iterator = iter(iterable)  # 调用__iter__获取迭代器
while True:
    try:
        item = next(iterator)  # 调用__next__获取元素
        print(item)
    except StopIteration:
        break

四、自定义可迭代对象实现

实现斐波那契数列迭代器：

class FibonacciIterator:
    def __init__(self, max_count):
        self.max_count = max_count
        self.count = 0
        self.a, self.b = 0, 1
        
    def __iter__(self):
        return self
        
    def __next__(self):
        if self.count >= self.max_count:
            raise StopIteration
        value = self.a
        self.a, self.b = self.b, self.a + self.b
        self.count += 1
        return value

# 使用示例
fib = FibonacciIterator(5)
for n in fib:
    print(n)  # 输出: 0, 1, 1, 2, 3

五、可迭代对象与迭代器的关键区别

特性	可迭代对象(Iterable)	迭代器(Iterator)
核心方法	仅需实现__iter__()	需同时实现__iter__()和__next__()
状态保存	不保存迭代状态	保存当前迭代状态
重用性	可重复迭代	耗尽后不可复用

生成器：迭代器的语法糖

使用yield简化迭代器创建：

def fibonacci(max_count):
    a, b = 0, 1
    count = 0
    while count < max_count:
        yield a
        a, b = b, a + b
        count += 1

# 使用生成器
for num in fibonacci(5):
    print(num)  # 输出: 0, 1, 1, 2, 3