当前位置:
文档之家› 计算机操作系统原理-文件管理
计算机操作系统原理-文件管理
3、目录
为了便于对文件进行存取和管理,文件系统为所有的文件建 立了目录,每个文件在目录中都有一个登记项,称为文件目录 项,每个目录项记录着一个文件的名字及其外存地址等该文件 的管理和使用信息。
实现文件按名字存取; 实现文件共享和保护。 文件目录项又称为文件控制块(File Control Block, FCB),它除了记录文件名字和外存地址外,通常还保存了文 件的创建者、创建日期、访问权限和长度等。 有些系统中,目录也以特殊文件形式进行保存,称为“目录 文件”。
按用途分类 系统文件 库文件 用户文件
文件的保护类型 只读文件 读写文件 可执行文件 不保护文件
信息流向 输入文件 输出文件
输入/输出文件
文件分类(续)
文件的信息(Unix采用这种方式划分)
普通文件:包括用户的ASCII或二进制文件 特殊文件:包括目录文件和I/O设备文件
文件的后缀
exe, com, bin:可执行文件 c, cc, cpp, java, pas:程序源代码 bat, sh: 命令文件 txt, doc: 文本数据,文本文档 lib, dll: 库文件 zip, rar: 压缩文件 mpeg, mov, rm: 多媒体文件 ……
文件目录 文件名 索引表地址
Jeep
19
9
17
1
19
10
25
-1
-1
-1
假设:块的大小为4K, 每个盘块号占4字节, 文件大于4M 则这个块中可以存放1024个盘块号(4M)。 该如何表示?
多级索引
二级索引:将一个大文件的所有索引表(二级索引
)的地址放在另一个索引表(一级索引)中。如果文件非
常大,还可用三级、四级。
符合ISO9660标准的支持CD-ROM的文件系统。
xfs、gfs、ReiserFS、bwfs……
二、文件的结构
文件的结构指文件中信息的配置和构造方式,有逻辑 结构和物理结构之分。
逻辑结构:是从用户观点出发所观察到的文件组织形式, 是用户可以直接处理的数据及其结构,它独立于文件的物 理特性,又称为文件组织 。
,增加了系统开销。 可靠性问题,如指针出错。
补充:FAT12
早期MS-DOS所使用的是FAT12文件系统。即一个 FAT表项占12位,共可表示4096个表项。
只能支持8+3格式的文件名; 若以物理盘块(扇区,大小一般为512字节)为分配单位
,则每个磁盘分区的容量仅为2MB(4096 * 512B) 一个物理磁盘支持4个磁盘逻辑分区,所以相应的磁盘容
区容易形成外碎片)
必须事先知道文件长度,对文件进行内容增、删比较困难 磁带上的文件只能是顺序文件,因为磁带是顺序存取设备。
2)链接文件
一个文件的 信息存放在 若干不连续 的物理块中 ,各块之间 通过指针连 接。包括隐 式链接和显 示链接
磁盘空间
0 1 10 2 3 4567 8 9 16 10 25 11 12 13 14 15 16 1 17 18 19 20 21 22 23 24 25 -1 26 27 28 29 30 31
量仅为8MB 为使FAT12支持更大的磁盘,引入了一个新的分配单位:
“簇”的概念。
补充:簇的基本概念
“簇(Cluster)”是一组连续的扇区,簇的大小一般为2n个 盘块(扇区),如512B/1KB/2KB/8KB等,进行文件空间分 配时,不再以盘块而是以“簇(Cluster)”为基本单位。 当簇大小为1KB时,FAT12可支持最大磁盘容量为16MB 当簇大小为4KB时,FAT12可支持最大磁盘容量为64MB 优点:增加支持的磁盘大小,减小了FAT表大小,降低存 取开销,提高了磁盘的I/O效率 缺点:造成更大的簇内零头(类似于页式管理中负责存取和管理文件信息的模块称为文件系统。它负责管理 文件的存储、检索、更新、共享和保护,并为用户提供一整套方便有效的文 件使用和操作方法。
文件系统
用户 系统
• 基本目标:实现“按名存取”; • 提供方便的操作和统一的 调用 接口,屏蔽底层细节。
• 组织、分配、回收文件的存储 空间; • 负责文件的存储、检索、共 享 和保护。 • 重要目标:提高文件存取速度
使用64位磁盘地址,理论支持2的64次方字节磁盘分区; 具有一定的系统容错功能,提供一些机制来保证文件系统
的一致性; 提供诸如文件和文件夹权限、加密、磁盘配额和压缩等高
级功能。
3)索引文件
FAT存在两个问题:
不能支持高效的直接存取; FAT占用较大的内存空间;
打开一个文件时,完 全没有必要将整个FAT 表调入内存
补充:FAT16
一个FAT表项占16位,共可表示65536个簇。MSDOS及Windows 95使用。
FAT16中每个簇中可有盘块数4、8、16、32、64 ,因此支 持的最大分区为:655356* 64 * 512B = 2048MB
FAT16仍然采用8+3格式文件名 Windows 95对FAT16进行了扩展,文件名长度可达到255
支持255长度文件名; 优点:支持更大的硬盘,簇大小可以设置的比较小,减少
簇内碎片。 缺点:由于FAT表扩大,运行速度比FAT16稍慢;不能保
持向下兼容。
补充:NTFS
NTFS以卷为单位,将一个卷中的所有文件信息、目 录信息以及可用的未分配空间信息,都以文件记录的 方式记录在一张主控文件表MFT(Master File Table )中。Windows XP及以后操作系统支持。
文件目录 文件名 始址 末址
jeep 9
25
data
隐式链接
next
链接文件(续)
隐式链接不便于随机 存取。
显式链接将链接各物 理块的指针存放在一个 专门的链接表中:FAT (File Allocation Table),整个文件系 统一张
系统启动时,FAT被 读入内存
文件目录 文件名 首址
索引号 索引表块(26#)
0 108
索引号 索引表块(1#)
1 210
0
26
1
32
.
┇
┇
.
┇
. 123
1023 136
. 103
从系统角度看到的文件信息的组织形式称为文件的物理结构。 实际上就是文件的存储结构,即文件信息在文件存储介质(如磁 盘)上的存储组织形式。主要分为3大类:
1)顺序文件:早期文件系统使用,现今仅在磁盘文件对换 区的使用上还能看到其影子。
2)链接文件:分为隐式链接和显式链接两类。FAT12、 FAT16、FAT32文件系统使用的就是显式链接方式;
信息项:是构成文件内容的基本单位,可以是一个字符, 也可以是一个记录。
文件的组成部分
文件体:文件本身的信息
sort.c
文件说明:文件存储和管理信息
• 文件名称 • 文件内部标识符 • 文件类型 •文件存储位置 •文件大小 • 访问权限 • 时间、日期、用户标识 ……
文件属性
文件控制块 (FCB)
个字符,这种扩展FAT16也称为VFAT
补充:FAT32
一个FAT表项占32位,共可表示4G个簇。Windows 95及以后系列操作系统支持
FAT32支持2T及以上分区:4G * 512B = 2TB,理论上最 大可支持128T的分区(32K簇大小)。一些操作系统对 FAT32支持的分区大小进行了限制,如windows 2000无法 使用FAT32格式化超过32G的分区;
Jeep 19
19
9 17 1 10 25 -1 -1 -1
文件jeep的 单级索引表
索引文件特点
优点:
能顺序存取,又能直接存取。 满足了文件动态增长、插入删除的要求。 没有外碎片,外存空间利用率较高。
缺点
索引表本身需要存储空间; 文件比较小时,索引表利用率低;
0123 4567 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
jeep 9
显式链接
物理 块号
0 1 …
9 10 … 16 …
25 …
FAT
10
16
25 1 -1
链接文件特点
优点
提高了磁盘空间利用率,不存在外部碎片问题。 有利于文件插入和删除,及其动态扩充。
缺点:
隐式链接不支持随机存取,显式链接随机查找慢。 显式链接中的FAT表需占用较大内存空间。 存储空间可能不连续,带来更多的寻道次数和寻道时间。 需要牺牲一些空间存放链接指针,同时需要维护这些指针
文件管理
文件系统概述 文件的逻辑结构与物理结构 文件的存取方式与文件操作 文件目录结构及检索 文件存储空间的管理 文件共享与保护 文件系统的一致性
一 文件系统概述(
1、文件
磁带
磁盘
光盘
优盘
定义:是记录在外存上的,具有符号名的,在逻 sort.c 辑上具有完整意义的一组相关信息项的集合。
逻辑结构
记录式文件 流式文件
物理结构
连续文件 链接文件 索引文件
6、目前常用的文件系统类型
FAT12/FAT16 FAT32 NTFS ext2/ext3/ext4
HPFS UDF 其他
MS-DOS。文件名采用8.3格式,FAT12最大支持16M分区, FAT16最大支持2G分区,Win95对FAT16进行了扩展,支持长 文件名(255个字符),称为VFAT
定长记录
变长记录
文件的逻辑结构(续)
2)无结构的流式文件:由字符序列组成的文件,其内部不 再划分结构,字符是该文件的基本信息单位。