--php,mysql,java,redis,php redis,ajax,jsp,struts,linux,javascript,html,staruml,window,lua,cocos2dx,python,ansible,shell,ansible,sed,awk,go,docker,vue,js,架构

python 如何读取超大的文件

2025-1-13 杜世伟 Python

在 Python 中读取超大的文件（例如，文件的大小大于系统内存）时，通常需要逐行或分块读取，以避免将整个文件加载到内存中，从而导致内存不足的问题。以下是几种常见的方法：

1. 使用 open 和迭代器逐行读取
这是最常见的方法。通过文件对象的迭代器，逐行读取文件。

with open('large_file.txt', 'r', encoding='utf-8') as file:
for line in file:
process_line(line) # 对每行进行处理

这种方式非常高效，因为它不会一次性将整个文件加载到内存，而是逐行读取。

2. 分块读取文件内容
如果需要以更大的块为单位读取，可以使用 read 方法指定块的大小。
with open('large_file.txt', 'r', encoding='utf-8') as file:
while True:
chunk = file.read(1024 * 1024) # 每次读取 1 MB

阅读全文>>

标签: python open pands mmap

评论(0) 浏览(1043)

Python四种逐行读取文件内容的方法

2017-3-27 杜世伟 Python

下面是四种Python逐行读取文件内容的方法，并分析了各种方法的优缺点及应用场景，以下代码在python3中测试通过， python2中运行部分代码已注释，稍加修改即可。
方法一：readline函数

#-*- coding: UTF-8 -*-
f = open("./code.txt") # 返回一个文件对象
line = f.readline() # 调用文件的 readline()方法
while line:
#print line, # 在 Python 2中，后面跟 ',' 将忽略换行符
print(line, end = '') # 在 Python 3中使用
line = f.readline()
f.close()
优点：节省内存，不需要一次性把文件内容放入内存中
缺点：速度相对较慢

阅读全文>>

标签: python open fileinput readline readlines

评论(0) 浏览(14644)

python 文件操作方法

2016-3-1 杜世伟 Python

python 文件操作方法
1 文件对象的方法操作
2 file.close() 关闭文件
3 file.fileno() 返回文件的描述符(file descriptor ,FD, 整数值)
4 file.flush() 刷新文件的内部缓冲区
5 file.isatty() 判断 file 是否是一个类 tty 设备
6 file.nexta() 返回文件的下一行(类似于 file.readline() ), 或在没有其它行时
7 引发 StopIteration 异常
8 file.read(size=-1) 从文件读取 size 个字节, 当未给定 size 或给定负值的时候, 读
9 取剩余的所有字节, 然后作为字符串返回.如果打开模式无b,则read按字符读取，否则按字节读取
10 file.readline(size=-1) 从文件中读取并返回一行(包括行结束符), 或返回最大 size
11 file=open('test','ab')
12 file.write(bytes('hehe',encoding='utf-8')) 向文件写入字符串 (会覆盖原有数据，坑
13 file.close() 关闭文件
14 file.tell获取当前指针的位置
15 file.read()如果打开模式无b,则read按字符读取，否则按字节读取
16 file.fileno文件描述符
17 file.truncat 截断数据，清除文件指针之后的数据

阅读全文>>

标签: python open file

评论(0) 浏览(10453)

孤独求学人

记录自己技术路上的点点滴滴~

python 如何读取超大的文件

Python四种逐行读取文件内容的方法

python 文件操作方法

链接

搜索

热门日志

分类

最新日志

随机日志