当前位置：首页 > article >正文

【Linux】文件系统

article 2025/2/22 2:25:30

文章目录

文件系统
- 1. 了解磁盘的物理结构
- 2. 磁盘的具体物理存储结构
- 3. 逻辑抽象
- 4. 文件系统
- 5. 软硬连接
- - 5.1 制作软硬连接，对比差别

文件系统

我们目前的文件都是被打开的，如果没有被打开那，在哪里？

一定不是在内存当中，只能在磁盘等外设当中存在着

磁盘文件，如果没有被打开，如何理解这些文件？没有打开的文件都有什么问题？

如何被合理存储的问题
主要是为了解决：快速定位，快速读取和写入 — 磁盘文件也是这样
目前我们标识一个文件主要是通过文件名的方式
1. 如何定位一个文件
2. 如何对文件进行读取和写入

1. 了解磁盘的物理结构

磁盘使我们计算机上唯一的一个机械设备，同时它还是外设，它表明了它加载到内存的速度非常慢

盘片一共有两个面，有一摞盘片，一面有一个磁头，一个磁头负责一个面的读取。

磁头和盘面是没有挨着的，距离依旧很近，对数据写入和读取，更改基本元素的南北极，读取南北极

向磁盘写入：N->S

删除磁盘数据：S->N

2. 磁盘的具体物理存储结构

尝试在硬件上，理解数据的一次读和写

磁盘中的基本存储单元：扇区，一个扇区是512字节或者4kb

一般磁盘，所有的扇区都是512字节。通半径的所有扇区：磁道

只需要确定用哪一个磁头读取：

首先要定位哪一个面：在一个面上，如何在硬件上定位一个扇区？

先定位在哪一个磁道，由半径决定
在确定在该磁道，再确定在哪一个扇区–根据扇区的编号，定位一个扇区

柱面就是磁道

磁头（head）柱面（cylinder）扇区（sector）

未来定义一个扇区 CHS定位法

一个普通文件（属性+数据）都是0,1数据，无非就是占用一个或者多个扇区，来进行数据存储的，我们既然能够使用CHS定位法定位任意一个扇区，我们就能够定位多个扇区，从而将文件从硬件角度，进行读取和写入

3. 逻辑抽象

如果操作系统能够得知任意一个CHS地址，就能够访问任意一个扇区，那么操作系统内部是不是直接使用CHS地址那？

不是，这是为什么？

操作系统是软件，磁盘是硬件，硬件定位一个地址CHS，但是如果操作系统直接用了这个地址，万一硬件变了？操作系统是不是也要发生改变。这不符合解耦的思想，操作系统要和磁盘做好解耦工作
即便是扇区，512字节，单位IO的基本数据量也是很小的！硬件512字节，操作系统进行IO，基本单位是4kb，这是非常浪费时间的、

磁盘：块设备，所以OS需要一套新的地址，来进行块级别的访问

这种磁带想必大家都见过，磁带本来是一个圆形的，但是如果我们将它拉直，是不是就是一个线性的

初步完成了一个从物理逻辑到线性逻辑的抽象的过程！！数组是天然有下标的

这个时候要定位一个扇区，只需要一个数组下标就可以了。

假设数组的下标是N，而其中我们OS是以4kb为单位进行IO的，一个操作系统级别的文件要包括8个扇区！甚至在操作系统角度，并不关心扇区

计算机常规的访问方式：起始地址+偏移量的方式（语言，数据类型）我们只需要知道数据块的起始地址（第一个扇区的下标地址）+ 4kb的类型，我们把数据块看做一个类型

所以块的本质，就是一个数组的下标，以后我们表示一个块，就可以采用线性下标的方式，定位任何一个块了

OS->N->LBA->逻辑地址块，可是磁盘只认CHS所以我们要知道

LBA <-----> CHS的相互转化

这个相互转化，只需要了解就可以了

OS系统要管理磁盘，就将磁盘看成一个大数组，对磁盘的管理，变成了对数组的管理。先描述在组织

4. 文件系统

我们使用ls -l的时候除了看到文件名，还看到了文件元数据

每行包含7列：

模式
硬链接数
文件所有者
组
大小
最后修改的时间
文件名

ls -l读取存储在磁盘上的文件信息，然后显示出来。

这个信息除了通过这种方式来读取，还有一个stat命令能够看到更多信息

这个执行结果，我们需要了解几样东西

innode

超级快（Super Block）：存放文件系统本身的结构信息。记录的信息主要有：block和inode的总量，未使用的block和inode的数量，一个block和inode的大小，最近一次挂载的时间，最近一次写入数据的时间，最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏，可以说整个文件系统结构就被破坏了。超级块在各个分区里都会存在，而且是统一更新的
GDT，Group Descriptor Table：块描述符，描述块组属性信息
块位图（Block Bitmap）：快位图里面记录了那个数据已经被占用了，那个数据没有被占用
inode位图（inode Bitmap)：一般而言，一个文件内部所有属性的集合，inode节点（128字节），一个文件，一个inode其中即便是一个分区，内部也存在大量的文件即会存在大量的inode节点，一个group需要有一个区域，来专门保存该group内所有文件的inode节点。inode表分组内部，可能会存在多个inode，需要将inode区分开来，每一个inode都会有自己的inode编号！inode编号，也属于对应文件的id

而文件的内容是变化的，我们使用数据块来进行文件内容的保存的，所以一个有效文件要保存，就需要【1，n】数据块。如果是多个文件需要更多的数据块

Linux要查找一个文件，是根据inode编号来进行查找的，包括读取内容。一个inode对应一个文件，而改文件inode属性和改文件对应的数据块，是有映射关系的

将属性和数据分开存放的想法看起来简单，但实际上是如何工作的？

inodeVS文件名

Linux只认识inode号，文件的inode属性中，并不存在文件名！文件名是用户给的

目录是文件吗？是的，Linux下一切皆是文件，目录也有inode

任何一个文件，一定在一个目录内部，所以目录的内容是什么？需要数据块，目录的数据块里面保存的是该目录下文件名和inode编号对应的映射关系，而且在目录内，文件名和inode互为key值
当我们访问一个一个文件的时候，我们是在特定目录下访问的
1. 先要在当前目录下，找到这个文件的inode编号
2. 一个目录也是一个文件，也一定在一个分区里面，结合inode，在该分区中找到分组，在该分组中inode table中找到文件的inode
3. 通过inode和对应的datalock的映射关系，找到文件的数据块，并加载到OS，并完成显示到显示器

如何理解文件的增删改查

根据文件名找到inode，再根据inode属性中的映射关系，设置block Bitmap对应的bit位，置为0就可以，最后inode number设置inode Bitmap对应的bit位设为0。删除文件，只需要修改位图就可以了

如果文件被误删了，我们该怎么办？

inode确定分组，inode number是一个分区内唯一有效，不能跨分区
我们学习到的分区，分组，填写系统属性，都是OS完成的？分区完成之后，后面要让分区能够被正常使用，我们需要对分区进行格式化，格式化的过程，其实是OS向分区写入文件系统的管理属性信息
我们如果inode只是单单的用数组建立和datablock的映射关系，15 * 4kb，是不是意味着只能存放：60kb的数据

创建一个文件主要有以下4个操作：

存储属性，内核先找到一个空闲的i节点。内核把文件信息记录到其中
存储数据，这个文件需要存储在三个磁盘块，内核找到了三个空闲块：300， 500， 800。将内核缓冲区的第一块数据复制到300，下一块复制到500
记录分配情况，文件内容按照顺序300， 500， 800存放。内核在inode上的磁盘分区记录了上述块列表
添加文件名到目录，新的文件名，Linux如何在当前的目录中记录这个文件？内核将入口添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来

5. 软硬连接

5.1 制作软硬连接，对比差别

软连接，类似Windows的快捷方式，软连接内部存放的都是自己所指向的文件的路径。软连接是一个独立的连接的文件，有自己的inode number，必有自己的inode属性和内容

建立软连接的命令是 ln -s 源文件目标文件，其中 -s 表示创建软链接。例如，将 /home/user1/file1 创建一个软连接到 /home/user2/file2，可以使用以下命令：

ln -s /home/user1/file1 /home/user2/file2

这样，/home/user2/file2 就成为了 /home/user1/file1 的软链接，对 /home/user2/file2 的操作实际上是对 /home/user1/file1 的操作。

硬连接，硬连接和目标文件公用一个inode number，意味着，硬连接一定是和目标文件使用同一个inode的。那么硬连接究竟是干了什么，？建立了新的文件名和老的inode的映射关系，有多少个文件名指向我硬连接数，本质上是一个引用计数

建立硬连接的命令是 ln 源文件目标文件，其中不需要使用 -s 参数。例如，将 /home/user1/file1 创建一个硬链接到 /home/user2/file2，可以使用以下命令：

ln /home/user1/file1 /home/user2/file2

这样，/home/user2/file2 就成为了 /home/user1/file1 的硬链接，对 /home/user2/file2 的操作实际上是对 /home/user1/file1 的操作。因为硬链接是对同一文件的多个名称，所以在文件系统中只有一个文件，所以无法在不同的文件系统中创建硬链接。

解释一下文件的三个时间：