python生成器读取大文本文件_使用python生成器处理大型文本文件

134 阅读 0 评论 89 点赞

我是靠谱客的博主开朗电灯胆，这篇文章主要介绍python生成器读取大文本文件_使用python生成器处理大型文本文件，现在分享给大家，希望可以做个参考。

我是新来的使用生成器，已经阅读了一些，但需要一些帮助处理大块文本文件。我知道已经讨论过这个主题，但是示例代码的解释非常有限，如果不理解发生了什么，就很难修改代码。

我的问题相当简单，我有一系列包含人类基因组测序数据的大型文本文件，格式如下：chr22 1 0

chr22 2 0

chr22 3 1

chr22 4 1

chr22 5 1

chr22 6 2

这些文件的长度在1Gb到20Gb之间，太大，无法读入RAM。所以我想一次读10000行的数据，这样我就可以对这些数据的最后一列进行计算。

基于这个链接here我写了以下内容：def read_large_file(file_object):

"""A generator function to read a large file lazily."""

bin_size=5000

start=0

end=start+bin_size

# Read a block from the file: data

while True:

data = file_object.readlines(end)

if not data:

break

start=start+bin_size

end=end+bin_size

yield data

def process_file(path):

try:

# Open a connection to the file

with open(path) as file_handler:

# Create a generator object for the file: gen_file

for block in read_large_file(file_handler):

print(block)

# process block

except (IOError, OSError):

print("Error opening / processing file")

return

if __name__ == '__main__':

path='C:/path_to/input.txt'

process_file(path)

在'process_block'中，我希望返回的'block'对象是一个10000个元素的列表，但它不是？第一个列表是843个元素。第二个是2394个元素？

我想拿回一个街区的N行数，但我对这里发生的事情感到很困惑？

这个解决方案here似乎有帮助，但我还是不明白如何修改它，使其一次读取N行？

这个here看起来也是一个非常好的解决方案，但是同样，没有足够的背景解释让我理解足够多的内容来修改代码。

有什么需要帮忙的吗？

最后

以上就是开朗电灯胆最近收集整理的关于python生成器读取大文本文件_使用python生成器处理大型文本文件的全部内容，更多相关python生成器读取大文本文件_使用python生成器处理大型文本文件内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：python生成器读取大文本文件
浏览次数：134 次浏览
发布日期：2024-05-01 16:10:02
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_7_o_26_fw_13_jky.html

python生成器读取大文本文件_使用python生成器处理大型文本文件

最后

评论列表共有 0 条评论

发表评论取消回复

python生成器读取大文本文件_使用python生成器处理大型文本文件

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复