Python 文件对象提供了各种方法和属性来访问和修改文件。使用文件对象,我们可以读写任何文件。
任何时候,只要我们打开文件,Python都会返回文件对象。Python可以通过内置函数比如open() 或者 os.popen()来创建文件对象。
当IO相关原因导致文件操作失败时候,IOError 异常就会被触发。比如,尝试向只读文件执行写操作的时候。
文件对象类型
Python有三种不同类型的文件对象:
- 文本文件
- 二进制文件
- 原始文件
文本文件(TextIOWrapper)
三种文件中,文本文件是最常用的类型。通常,我们使用文本文件来存储字符数据或者用明文存储信息。
我们可以通过open() 函数打开文件,并且会返回一个TextIOWrapper文件对象。
file = open('test.txt', 'w')
print(type(file))
# Output:
二进制文件(BufferedReader和BufferedWriter)
在计算机中,数据是以二进制格式存储在磁盘上的。比如,我们可以用二进制文件来存储图片或者音频等。程序需要翻译二进制文件并展示给用户。二进制文件也被称为buffered 文件。这种文件类型是用于读写二进制数据的。
同样,我们可以通过内置函数open() 打开二进制文件,不过mode 需要修改为二进制模式的。这个时候文件指针会在文件开头,并且如果是读二进制会返回BufferedReader,如果是写二进制文件会返回BufferedWriter。
file = open('test.txt', 'rb')
print(type(file))
# Output:
原始文件
原始文件是未处理数据的集合。这意味着原始文件是没有被计算机以任何形式修改过。原始文件也叫作unbuffered 文件。这种类型很少会用,了解即可。
file = open('test.txt', 'rb', buffering=0)
print(type(file))
# Output:
文件对象属性
文件对象有很多属性用于获取文件各种细节信息,比如文件名,打开模式等。
- name: 返回文件名,这是一个只读属性,通常如果是通过open()函数创建的文件会返回文件名,否则会返回文件对象字符串标识。
- encoding: 返回文件使用的编码方式,比如UTF-8。这个属性也是只读的。当向文件中写入Unicode 字符串,那么就会被编码格式转换成字节字符串,如果没有指定就是None,这种情况就会使用系统默认的编码方式。
- mode: 返回文件访问模式。
with open(r'E:\pynative\files\test.txt', "r") as fp:
print('Is Closed:', fp.closed)
print('Encoding Used:', fp.encoding)
print('Access Mode:', fp.mode)
print('NewLines Found:', fp.newlines)