十五、文件

15.1 C 文件概述

所谓“文件”是指一组相关数据的有序集合。这个数据集有一个名称,叫做文件名。文件通常是驻留在外部介质(如磁盘等)上的,在使用时才调入内存中来。

从不同的角度可对文件作不同的分类。从用户的角度看,文件可分为普通文件和设备文件两种。普通文件 是指驻留在磁盘或其它外部介质上的一个有序数据集,可以是源文件、目标文件、可执行程序;也可以是一组待输入处理的原始数据,或者是一组输出的结果。对于源文件、目标文件、可执行程序可以称作程序文件,对输入输出数据可称作数据文件。设备文件 是指与主机相联的各种外部设备,如显示器、打印机、键盘等。在操作系统中,把外部设备也看作是一个文件来进行管理,把它们的输入、输出等同于对磁盘文件的读和写。

通常把显示器定义为 标准输出文件,一般情况下在屏幕上显示有关信息就是向标准输出文件输出。如前面经常使用的printf, putchar函数就是这类输出。键盘通常被指定为 标准输入文件,从键盘上输入就意味着从标准输入文件上输入数据。scanf, getchar函数就属于这类输入。

从文件编码的方式来看,文件可分为 ASCII 码文件二进制码文件 两种。ASCII 文件也称为文本文件,这种文件在磁盘中存放时每个字符对应一个字节,用于存放对应的ASCII 码;二进制文件是按二进制的编码方式来存放文件的。

ASCII 码文件可在屏幕上按字符显示,例如源程序文件就是ASCII 文件,用DOS命令TYPE可显示文件的内容。由于是按字符显示,因此能读懂文件内容。二进制文件虽然也可在屏幕上显示,但其内容无法读懂。

C系统在处理这些文件时,并不区分类型,都看成是字符流,按字节进行处理。输入输出字符流的开始和结束只由程序控制而不受物理符号(如回车符)的控制。因此也把这种文件称作 “流式文件”。

15.2 文件指针

在C语言中用一个指针变量指向一个文件,这个指针称为文件指针。通过文件指针就可对它所指的文件进行各种操作。

其定义的一般形式为:FILE *指针变量标识符;

其中 FILE 为大写,它实际上是由系统定义的一个结构,该结构中含有文件名、文件状态和文件当前位置等信息,在编写源程序时不必关心FILE结构的细节。

FILE *fp;//表示fp是指向FILE结构的指针变量,通过fp即可找存放某个文件信息的结构变量,然后按结构变量提供的信息找到该文件,实施对文件的操作。//习惯上也笼统地把fp称为指向一个文件的指针。

15.3 文件的打开与关闭

文件在进行读写操作之前要先打开,使用完毕要关闭。所谓打开文件,实际上是建立文件的各种有关信息,并使文件指针指向该文件,以便进行其它操作。关闭文件则断开指针与文件之间的联系,也就禁止再对该文件进行操作。在C语言中,文件操作都是由库函数来完成的。

15.3.1文件打开( fopen 函数):

其使用的一般形式为:文件指针名 = fopen(文件名,使用文件方式);

其中,文件指针名必须是被说明为FILE 类型的指针变量;文件名是被打开文件的文件名;使用文件方式是指文件的类型和操作要求;文件名是字符串常量或字符串数组。

FILE *fp;fp = fopen("c:\\abc2", "rb"); //表示打开 C 盘下的 abc2 (二进制)文件,只允许进行读操作;//两个反斜线 “//” 中的第一个表示转义字符,第二个表示根目录。

使用文件的 12 种方式

对于文件使用方式的几点说明:
(1)共由 6 个字符 r, w, a, t, b, + 拼接而成,各个字符的含义为:

字符含义
r(read)
w(write)
a(append)追加
t(text)文本文件(可省略)
b(banary)二进制文件
+读、写

(2)凡用 “r” 打开一个文件时,该文件必须已经存在,且只能从该文件读出;
(3)用 “w” 打开的文件只能向该文件写入。若打开的文件不存在,则以指定的文件名建立该文件,若打开的文件已经存在,则将该文件删去,重建一个新文件;
(4)若要向一个已存在的文件追加新的信息,只能用 “a” 方式打开文件。但此时该文件必须是存在的,否则将会出错。
(5)在打开一个文件时,如果出错,fopen 将返回一个空指针值NULL。在程序中可以用这一信息来判别是否完成打开文件的工作,并作相应的处理。因此常用以下程序段打开文件:

FILE *fp;if(fp = fopen("c:\\abc2", "rb")==NULL){printf("\nerror open!");getch();//从键盘输入一个字符,但不在屏幕上显示;//(其作用为等待,只有当用户从键盘任意敲一个键时,程序再继续执行)exit(1);//敲键后执行 exit(1) 退出程序}

(6)把一个文本文件读入内存时,要将ASCII 码转换成二进制码,而把文件以文本方式写入磁盘时,也要把二进制码转换成ASCII 码,因此文本文件的读写要花费较多的转换时间。对二进制文件的读写不存在这种转换。
(7)标准输入文件(键盘),标准输出文件(显示器),标准出错输出(出错信息)是由系统打开的,可直接使用。

15.3.2 文件关闭( fclose 函数):

fclose(文件指针);
正常完成关闭文件操作时,fclose 函数返回值为0。如返回非零值则表示有错误发生。

15.4 文件读写

15.4.1 字符读写函数

以字符(字节)为单位的读写函数。每次可从文件读出或向文件写入一个字符。
1 . 读字符函数 fgetc,从指定文件中读一个字符,形式为:字符变量 = fgetc(文件指针);

ch = fgetc(fp);//从打开的文件fp中读取一个字符并送入ch 中。

说明:
(1)在 fgetc 函数调用中,读取的文件必须是以读或读写方式打开的;
(2)读取字符的结果也可以不向字符变量赋值,但这样读出的字符不能保存;
(3)在文件内部有一个位置指针。用来指向文件的当前读写字节。在文件打开时,该指针总是指向文件的第一个字节。使用fgetc函数后,该位置指针将向后移动一个字节。因此可连续多次使用fgetc函数,读取多个字符。应注意文件指针和文件内部的位置指针不是一回事。文件指针是指向整个文件的,须在程序中定义说明,只要不重新赋值,文件指针的值是不变的。文件内部的位置指针用以指示文件内部的当前读写位置,每读写一次,该指针均向后移动,它不需在程序中定义说明,而是由系统自动设置的。

2 . 写字符函数 fputc,把一个字符写入指定的文件中,形式为:fputc(字符量, 文件指针);
其中,待写入的字符量可以是字符常量或变量。

fputc('a', fp);//把字符 a 写入 fp 所指向的文件中

说明:
(1)被写入的文件可以用写、读写、追加方式打开,用写或读写方式打开一个已存在的文件时将清除原有的文件内容,写入字符从文件首开始。如需保留原有文件内容,希望写入的字符以文件末开始存放,必须以追加方式打开文件。被写入的文件若不存在,则创建该文件。
(2)每写入一个字符,文件内部位置指针向后移动一个字节。
(3)fputc 函数有一个返回值,如写入成功则返回写入的字符,否则返回一个EOF。可用此来判断写入是否成功。

15.4.2 字符串读写函数

1 . 读字符串函数 fgets,从指定的文件中读一个字符串到字符数组中,形式为:fgets(字符数组名, n, 文件指针);
其中的n是一个正整数。表示从文件中读出的字符串不超过n-1个字符。在读入的最后一个字符后加上串结束标志 ’\0’ 。

fgets(str, n, fp);//从 fp 所指的文件中读出 n-1 个字符送入字符数组 str 中

说明:
(1)在读出n-1个字符之前,如遇到了换行符或EOF,则读出结束。
(2)fgets 函数也有返回值,其返回值是字符数组的首地址。
2 . 写字符串函数 fputs,向指定的文件写入一个字符串,其形式为:fputs(字符串, 文件指针);
其中字符串可以是字符串常量,也可以是字符数组名,或指针变量。

fputs("abcd", fp);//将字符串 abcd 写入 fp 所指的文件中

15.4.3 数据块读写函数

读数据块函数:fread(buffer, size, count, fp);
写数据块函数:fwrite(buffer, size, count, fp);
其中,buffer 是一个指针,在fread函数中,它表示存放输入数据的首地址。在fwrite函数中,它表示存放输出数据的首地址;
size表示数据块的字节数;
count表示要读写的数据块块数;
fp表示文件指针。

fread(fa, 4, 5, fp);//从fp所指的文件中,每次读4个字节(一个实数)送入实数组fa中,连续读5次,即读5个实数到fa中。

15.4.4 格式化读写函数

fscanf函数,fprintf 函数与前面使用的scanf和 printf函数的功能相似,都是格式化读写函数。两者的区别在于fscanf 函数和 fprintf函数的读写对象不是键盘和显示器,而是磁盘文件

格式化读函数:fscanf(文件指针,格式字符串, 输入表列);
格式化写函数:fprintf(文件指针,格式字符串, 输出表列);

15.5 文件的随机读写

顺序读写,即读写文件只能从头开始,顺序读写各个数据。但在实际问题中常要求只读写文件中某一指定的部分。为了解决这个问题可移动文件内部的位置指针到需要读写的位置,再进行读写,这种读写称为随机读写。实现随机读写的关键是要按要求移动位置指针,这称为文件的定位。

15.5.1文件定位

1 . rewind 函数,将文件内部的位置指针移动到文件首。形式为:rewind(文件指针);

2 . fseek 函数,移动文件内部位置指针,形式为:fseek(文件指针, 位移量, 起始点);
注意, fseek 函数一般用于二进制文件。
其中,“文件指针” 指向被移动的文件;
“位移量”表示移动的字节数,要求位移量是long型数据,以便在文件长度大于64KB时不会出错。当用常量表示位移量时,要求加后缀”L”。
“起始点”表示从何处开始计算位移量,规定的起始点有三种:文件首,当前位置和文件尾,其表示方法为:

fseek(fp, 100L, 0);//把位置指针移动到离文件首 100 个字节出

15.5.2 文件检测函数

1 . 文件结束检测函数(feof 函数),功能为判断文件是否处于文件结束位置,如文件结束,则返回值为1,否则为0。
格式为:feof(文件指针);
2 . 读写文件出错检测函数(ferror 函数),功能为检查文件在用各种输入输出函数进行读写时是否出错。如 ferror 返回值为 0 表示未出错,否则表示有错。
格式为:ferror(文件指针);
3 . 文件出错标志和文件结束标志置 0 函数(clearerr 函数),用于清除出错标志和文件结束标志,使它们为 0 值。
格式为:clearerr(文件指针);