一文带你搞懂Python中的文件操作

一、文件的编码

计算机中有许多可用编码:

  • UTF-8
  • GBK
  • Big5

UTF-8是目前全球通用的编码格式

除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可。

二、文件的读取

2.1 open()打开函数

注意:此时的fopen函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问,后续面向对象课程会给大家进行详细的介绍。

name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。

mode:设置打开文件的模式(访问模式):只读、写入、追加等。

encoding:编码格式(推荐使用UTF-8)

open(name, mode, encoding)

例子:

f = open('./test.txt', 'r', encoding='utf-8')

2.2 mode常用的三种基础访问模式

模式描述
f以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
w打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除 。如果该文件不存在,创建新文件。
a打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。
如果该文件不存在,创建新文件进行写入。

2.3 读操作相关方法

操作汇总

操作功能
文件对象 = open(file, mode, encoding)打开文件获得文件对象
文件对象.read(num)读取指定长度字节<br/>不指定num读取文件全部
文件对象.readline()读取一行
文件对象.readlines()读取全部行,得到列表
for line in 文件对象for循环文件行,一次循环得到一行数据
文件对象.close()关闭文件对象
with open() as f通过with open语法打开文件,可以自动关闭

2.3.1 read()方法:

num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

文件对象.read(num)

2.3.2 readlines()方法

readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。

f = open('python.txt')
content = f.readlines()

# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)

# 关闭文件
f.close()

例:

readline()方法:一次读取一行内容

f = open('python.txt')

content = f.readline()
print(f'第一行:{content}')

content = f.readline()
print(f'第二行:{content}')

# 关闭文件
f.close()

for循环读取文件行:

for line in open("python.txt", "r"):
 print(line)

# 每一个line临时变量,就记录了文件的一行数据

2.3.3 close() 关闭文件对象

f = open("python.txt", "r")

f.close()

# 最后通过close,关闭文件对象,也就是关闭对文件的占用
# 如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用。

2.3.4 with open 语法

with open("python.txt", "r") as f:
 f.readlines()

# 通过在with open的语句块中对文件进行操作
# 可以在操作完成后自动关闭close文件,避免遗忘掉close方法

案例:通过文件读取操作,读取此文件,统计itheima单词出现的次数

itheima python itcast
beijing shanghai itheima
shenzhen guangzhou itheima
wuhan hangzhou itheima
zhengzhou bigdata itheima

index = 0
with open('./test.txt', 'r', encoding='utf-8') as f:
 for line in f:
 line = line.strip()
 # print(line)
 str = line.split(' ')
 print(str)
 for val in str:
 if val == 'it':
 index += 1

print(f'index:{index}')

三、文件的写入

写操作快速入门

注意:

直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区

  • 当调用flush的时候,内容会真正写入文件
  • 这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)
  • 文件如果不存在,使用”w”模式,会创建新文件
  • 文件如果存在,使用”w”模式,会将原有内容清空

例:

# 1. 打开文件
f = open('python.txt', 'w')

# 2.文件写入
f.write('hello world')

# 3. 内容刷新
f.flush()

四、文件的追加

追加写入操作快速入门

注意:

  • a模式,文件不存在会创建文件
  • a模式,文件存在会在最后,追加写入文件

案例演示:

# 1. 打开文件,通过a模式打开即可
f = open('python.txt', 'a')

# 2.文件写入
f.write('hello world')

# 3. 内容刷新
f.flush()

五、文件操作综合案例

完成文件备份案例:

bill.txt

name,date,money,type,remarks
周杰轮,2022-01-01,100000,消费,正式
周杰轮,2022-01-02,300000,收入,正式
周杰轮,2022-01-03,100000,消费,测试
林俊节,2022-01-01,300000,收入,正式
林俊节,2022-01-02,100000,消费,测试
林俊节,2022-01-03,100000,消费,正式
林俊节,2022-01-04,100000,消费,测试
林俊节,2022-01-05,500000,收入,正式
张学油,2022-01-01,100000,消费,正式
张学油,2022-01-02,500000,收入,正式
张学油,2022-01-03,900000,收入,测试
王力鸿,2022-01-01,500000,消费,正式
王力鸿,2022-01-02,300000,消费,测试
王力鸿,2022-01-03,950000,收入,正式
刘德滑,2022-01-01,300000,消费,测试
刘德滑,2022-01-02,100000,消费,正式
刘德滑,2022-01-03,300000,消费,正式
f2 = open('bill.txt.bak', 'a', encoding="utf-8")
with open('bill', 'r', encoding="UTF-8") as f:
 for line in f:
 line = line.strip()
 str = line.split(',')
 if str[4] == '测试':
 continue
 else:
 f2.write(f'{line}\n')

f2.close()
作者:玲小叮当原文地址:https://segmentfault.com/a/1190000042869535

%s 个评论

要回复文章请先登录注册