• 请问Python在读取文件时用的迭代器和readline有何区别? 在我看来都是一次只读一行啊 谢谢

    2016/01/27 董飞 3 评论  ,  , 

如题

2 收藏


直接登录
最新评论
  • 笑虎   2016/01/27

    举个不太恰当的例子:
    a = iter(“abcd”)
    然后:
    for p in a:…

    a.__next__()
    有什么区别?

  • 偷天神猫   2016/01/29

    我想使用迭代器和readline的区别大概在于“读到文件末尾的时候,是否会抛出异常(是否用到了__next__方法),以及读取内容方式的差异”

    每次调用readline,会前进到下一行进行读取,至文件末尾时返回空字符串,并不会抛出异常。而使用迭代器读至文件末尾时会抛出StopInteration异常

    python有个迭代协议:含有__next__()方法的对象会反复调用该方法来返回数据流中的后继项,当没有可用数据时,产生一个StopInteration异常
    迭代器是遵循迭代协议的物件。所有迭代工具内部在每次迭代时都会调用__next__(),并且捕捉StopIteration异常来确定何时离开。

    for循环会将文件内容预加载到内存中,生成字符串列表。所以用这样的方式去读取文本文件,运行最快,写法也很简单。

    而readline的优势在于,当我们只需要读取某行时,可以在readline的size参数里直接指定,并不需要加载整个文件,当然readline还有其他方便的内置函数,文档上都有一一列出

    • 偷天神猫   2016/01/29

      更正下,
      for line in open(r’filedir’):
      do something
      这种写法并不会将文件内容全部加载至内存,这种写法处理完当前行之后,系统会自动回收资源,也就是说only reads one line at a time

      for line in open(r’filedir’).readlines():
      do something
      这样会将整个文件的内容预加载到内存,因为你用到了readlines