【Linux】文件系统
文章目录
- 文件系统
- 1. 了解磁盘的物理结构
- 2. 磁盘的具体物理存储结构
- 3. 逻辑抽象
- 4. 文件系统
- 5. 软硬连接
- 5.1 制作软硬连接,对比差别
文件系统
我们目前的文件都是被打开的,如果没有被打开那,在哪里?
一定不是在内存当中,只能在磁盘等外设当中存在着
磁盘文件,如果没有被打开,如何理解这些文件?没有打开的文件都有什么问题?
- 如何被合理存储的问题
- 主要是为了解决:快速定位,快速读取和写入 — 磁盘文件也是这样
- 目前我们标识一个文件主要是通过文件名的方式
- 如何定位一个文件
- 如何对文件进行读取和写入
1. 了解磁盘的物理结构
磁盘使我们计算机上唯一的一个机械设备,同时它还是外设,它表明了它加载到内存的速度非常慢
盘片一共有两个面,有一摞盘片,一面有一个磁头,一个磁头负责一个面的读取。
磁头和盘面是没有挨着的,距离依旧很近,对数据写入和读取,更改基本元素的南北极,读取南北极
向磁盘写入:N->S
删除磁盘数据:S->N
2. 磁盘的具体物理存储结构
尝试在硬件上,理解数据的一次读和写
磁盘中的基本存储单元:扇区,一个扇区是512字节或者4kb
一般磁盘,所有的扇区都是512字节。 通半径的所有扇区:磁道
只需要确定用哪一个磁头读取:
首先要定位哪一个面:在一个面上,如何在硬件上定位一个扇区?
- 先定位在哪一个磁道,由半径决定
- 在确定在该磁道,再确定在哪一个扇区–根据扇区的编号,定位一个扇区
柱面就是磁道
磁头(head) 柱面(cylinder) 扇区(sector)
未来定义一个扇区 CHS定位法
一个普通文件(属性+数据)都是0,1数据,无非就是占用一个或者多个扇区,来进行数据存储的,我们既然能够使用CHS定位法定位任意一个扇区,我们就能够定位多个扇区,从而将文件从硬件角度,进行读取和写入
3. 逻辑抽象
如果操作系统能够得知任意一个CHS地址,就能够访问任意一个扇区,那么操作系统内部是不是直接使用CHS地址那?
不是,这是为什么?
- 操作系统是软件,磁盘是硬件,硬件定位一个地址CHS,但是如果操作系统直接用了这个地址,万一硬件变了?操作系统是不是也要发生改变。这不符合解耦的思想,操作系统要和磁盘做好解耦工作
- 即便是扇区,512字节,单位IO的基本数据量也是很小的!硬件512字节,操作系统进行IO,基本单位是4kb,这是非常浪费时间的、
磁盘:块设备,所以OS需要一套新的地址,来进行块级别的访问
这种磁带想必大家都见过,磁带本来是一个圆形的,但是如果我们将它拉直,是不是就是一个线性的
初步完成了一个从物理逻辑到线性逻辑的抽象的过程!!数组是天然有下标的
这个时候要定位一个扇区,只需要一个数组下标就可以了。
假设数组的下标是N, 而其中我们OS是以4kb为单位进行IO的,一个操作系统级别的文件要包括8个扇区!甚至在操作系统角度,并不关心扇区
计算机常规的访问方式:起始地址+偏移量的方式(语言,数据类型)
我们只需要知道数据块的起始地址(第一个扇区的下标地址)+ 4kb的类型,我们把数据块看做一个类型
所以块的本质,就是一个数组的下标,以后我们表示一个块,就可以采用线性下标的方式,定位任何一个块了
OS->N->LBA->逻辑地址块
,可是磁盘只认CHS所以我们要知道
LBA <-----> CHS
的相互转化
这个相互转化,只需要了解就可以了
OS系统要管理磁盘,就将磁盘看成一个大数组,对磁盘的管理,变成了对数组的管理。先描述在组织
4. 文件系统
我们使用ls -l
的时候除了看到文件名,还看到了文件元数据
每行包含7列:
- 模式
- 硬链接数
- 文件所有者
- 组
- 大小
- 最后修改的时间
- 文件名
ls -l
读取存储在磁盘上的文件信息,然后显示出来。
这个信息除了通过这种方式来读取,还有一个stat命令能够看到更多信息
这个执行结果,我们需要了解几样东西
innode
- 超级快(Super Block):存放文件系统本身的结构信息。记录的信息主要有:block和inode的总量,未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个文件系统结构就被破坏了。 超级块在各个分区里都会存在,而且是统一更新的
- GDT,Group Descriptor Table:块描述符,描述块组属性信息
- 块位图(Block Bitmap):快位图里面记录了那个数据已经被占用了,那个数据没有被占用
- inode位图(inode Bitmap):一般而言,一个文件内部所有属性的集合,inode节点(128字节),一个文件,一个inode其中即便是一个分区,内部也存在大量的文件即会存在大量的inode节点,一个group需要有一个区域,来专门保存该group内所有文件的inode节点。inode表分组内部,可能会存在多个inode,需要将inode区分开来,每一个inode都会有自己的inode编号!inode编号,也属于对应文件的id
而文件的内容是变化的,我们使用数据块来进行文件内容的保存的,所以一个有效文件要保存,就需要【1,n】数据块。如果是多个文件需要更多的数据块
Linux要查找一个文件,是根据inode编号来进行查找的,包括读取内容。一个inode对应一个文件,而改文件inode属性和改文件对应的数据块,是有映射关系的
将属性和数据分开存放的想法看起来简单,但实际上是如何工作的?
- inodeVS文件名
Linux只认识inode号,文件的inode属性中,并不存在文件名!文件名是用户给的
- 重新认识目录
目录是文件吗?是的,Linux下一切皆是文件,目录也有inode
- 任何一个文件,一定在一个目录内部,所以目录的内容是什么?需要数据块,目录的数据块里面保存的是该目录下文件名和inode编号对应的映射关系,而且在目录内,文件名和inode互为key值
- 当我们访问一个一个文件的时候,我们是在特定目录下访问的
- 先要在当前目录下,找到这个文件的inode编号
- 一个目录也是一个文件,也一定在一个分区里面,结合inode,在该分区中找到分组,在该分组中inode table中找到文件的inode
- 通过inode和对应的datalock的映射关系,找到文件的数据块,并加载到OS,并完成显示到显示器
如何理解文件的增删改查
根据文件名找到inode,再根据inode属性中的映射关系,设置block Bitmap对应的bit位,置为0就可以,最后inode number设置inode Bitmap对应的bit位设为0。删除文件,只需要修改位图就可以了
如果文件被误删了,我们该怎么办?
- inode确定分组,inode number是一个分区内唯一有效,不能跨分区
- 我们学习到的分区,分组,填写系统属性,都是OS完成的?分区完成之后,后面要让分区能够被正常使用,我们需要对分区进行格式化,格式化的过程,其实是OS向分区写入文件系统的管理属性信息
- 我们如果inode只是单单的用数组建立和datablock的映射关系,15 * 4kb,是不是意味着只能存放:60kb的数据
创建一个文件主要有以下4个操作:
- 存储属性,内核先找到一个空闲的i节点。内核把文件信息记录到其中
- 存储数据,这个文件需要存储在三个磁盘块,内核找到了三个空闲块:300, 500, 800。将内核缓冲区的第一块数据复制到300,下一块复制到500
- 记录分配情况,文件内容按照顺序300, 500, 800存放。内核在inode上的磁盘分区记录了上述块列表
- 添加文件名到目录,新的文件名,Linux如何在当前的目录中记录这个文件?内核将入口添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来
5. 软硬连接
5.1 制作软硬连接,对比差别
软连接,类似Windows的快捷方式,软连接内部存放的都是自己所指向的文件的路径。软连接是一个独立的连接的文件,有自己的inode number,必有自己的inode属性和内容
建立软连接的命令是 ln -s 源文件 目标文件
,其中 -s
表示创建软链接。例如,将 /home/user1/file1
创建一个软连接到 /home/user2/file2
,可以使用以下命令:
ln -s /home/user1/file1 /home/user2/file2
这样,/home/user2/file2
就成为了 /home/user1/file1
的软链接,对 /home/user2/file2
的操作实际上是对 /home/user1/file1
的操作。
硬连接,硬连接和目标文件公用一个inode number,意味着,硬连接一定是和目标文件使用同一个inode的。那么硬连接究竟是干了什么,?建立了新的文件名和老的inode的映射关系,有多少个文件名指向我硬连接数,本质上是一个引用计数
建立硬连接的命令是 ln 源文件 目标文件
,其中不需要使用 -s
参数。例如,将 /home/user1/file1
创建一个硬链接到 /home/user2/file2
,可以使用以下命令:
ln /home/user1/file1 /home/user2/file2
这样,/home/user2/file2
就成为了 /home/user1/file1
的硬链接,对 /home/user2/file2
的操作实际上是对 /home/user1/file1
的操作。因为硬链接是对同一文件的多个名称,所以在文件系统中只有一个文件,所以无法在不同的文件系统中创建硬链接。
解释一下文件的三个时间:
- Access:最后访问的时间
- Modify:文件内容最后修改的时间
- Change:属性最后修改的时间