Python2与Python3文件读写的差异
在Python 2和Python 3之间,文件读写操作存在显著差异,主要是因为字符串的语义发生了变化。
- python 2.x:写入文件前对unicode编码,读入文件后对二进制字符串解码。
- python 3.x:open函数指定't'的文本模式,encoding指定编码格式。
文件读写方式的基本用法
f = open('b.txt', 'w+')
f.write('hello world') # 写入文件
f.seek(0) # 重置指针
txt = f.read() # 读取文件
print(txt) # hello world
f.close()
- 打开文件:使用open函数以写入模式打开文件。
- 写入数据:使用文件对象的write方法写入数据。
- 指针定位:使用seek方法可以改变文件读写的位置。使用tell方法可以获取当前指针位置。
- 关闭文件:使用文件对象的close方法关闭文件。
下面看一下文件的打开模式都有哪些
模式 | 描述 |
'r':以只读模式打开文件 | 不存在会报错。 |
'w':以只写模式打开文件 | 如果文件不存在则创建, |
'a':以追加模式打开文件 | 如果文件不存在则创建,文件指针在文件开头, |
'+':以读写方式打开文件 | 不能单独使用,需要与其他模式一起使用 |
'b':以二进制方式打开文件 | 不能单独使用,需要与其他模式一起使用,如:rb、wb |
使用with open语句,它会自动处理文件的打开和关闭
上面我们看到,使用 open 函数打开文件后,必须显式调用 close 方法关闭文件,以释放资源。如果忘记关闭文件,可能会导致资源泄漏或文件被锁定。而with open语句是上下文管理器的一部分,确保文件在使用结束后自动关闭。with open 语句简化了文件操作,避免了显式调用 close 方法,即使发生异常,文件也会被正确关闭。
with open('b.txt', 'r') as file:content = file.read()print(content)
综上,除非有特殊需要,使用with open语句适用于大多数情况。
如何逐行读取文件
我们使用 read 读取文件时,是一次性把文件内容读取进来,在处理较大的文件时,明显不太合理,这时我们就需要逐行读取文件内容。下面多提高几种方式开拓一下思路:
方案一:使用for循环逐行读取文件
最简单的方法是使用for循环逐行读取文件。Python的文件对象是可迭代的,因此可以直接在for循环中使用它们。
with open('b.txt', 'r') as file:for line in file:print(line, end='')
方案二:使用readline() 或 readlines() 方法逐行读取
Python的文件对象提供了readline 和 readlines 方法,可以用来逐行读取文件。
with open('b.txt', 'r') as file:line = file.readline()while line:print(line, end='')line = file.readline()with open('b.txt', 'r') as file:lines = file.readlines()
for line in lines:print(line, end='')
方案三:使用iter()函数逐行读取
with open('b.txt', 'r') as file:file_iter = iter(file)for line in file_iter:print(line, end='')
方案四:使用next()函数逐行读取
因为python的文件对象也是可迭代的,所以也可以使用内置的next()函数逐行读取文件。
with open('b.txt', 'r') as file:while True:try:line = next(file)print(line, end='')except StopIteration:break
方案五:使用标准库中的 linecache 模块逐行读取特定行
linecache模块可以用于读取文本文件的特定行。这对于大型文件中查找特定行或逐行处理文件的特定部分非常有用。
import linecache
line = linecache.getline('b.txt', 3)
print(line)
文件查找、复制、移动、重命名、删除等操作
os.listdir:列出指定目录下的文件和子目录
os.rename:不仅可以重命名文件,还可以将文件移动到其他目录
os.remove:删除指定文件
shutil.copy:轻松复制文件
glob.glob:快速查找指定文件