Linux-GlusterFS
文章目录
- GlusterFS
🏡作者主页:点击!
🤖Linux专栏:点击!
⏰️创作时间:2025年02月17日20点10分
GlusterFS
分布式存储,存储在不同地方,形成副本机制
常见的分布式存储架构
- HDFS:大数据的分布式存储,吞吐量很大,文件系统
- Swift:对象存储服务,需要URL链接
- Ceph:统一存储、支持块存储、对象存储和文件存储
- GlusterFS:也是文件系统,不能够提供块存储
GlusterFS优点
- 支持扩展到PB级别的存储
- 支持处理成千上万的客户端
- 兼容POSIX标准
- 使用通用硬件
- 开源产品
- 支持使用任何支持扩展属性的磁盘文件系统
- 支持使用行业标准协议进行访问 NFS SMB
- 支持复制、配额、地址复制、快照和 bitrot 检测
- 支持优化不同的工作负载
GlusterFS特点
- 高可用性:GlusterFS能够自动检测存储节点的故障,将数据转移到其他节点上,保证数据的高可用性
- 负载均衡:GlusterFS采用分布式存储方式,能够自动将数据均匀地分散在不同的存储节点上,有效地实现负载均衡
- 可扩展性:GlusterFS的Scale-Out架构可以实现随着存储需求的增加,添加更多的存储节点,增加存储容量
- 数据安全:GlusterFS采用数据冗余方式,将数据复制到多个存储节点上,以保证数据的安全性
- 高性能:GlusterFS的弹性哈希算法能够实现快速读写,支持多个客户端并发访问,提高系统性能
- 易于管理:GlusterFS提供了一套完整的管理工具,使得系统管理员可轻松的管理存储节点和文件系统
GlusterFS架构
Brick:存储块——存储空间
Volume:逻辑卷——一组存储空间的集合,一组Brick的集合
FUSE:一个内核模块,允许用户创建自己的文件系统,无需修改该内核代码
VFS:内核空间对用户提供的访问磁盘的接口
Glusterd:后台管理进程:在存储集群中的每个节点上运行的管理进程
GlusterFS常见卷
- Distrubute 分布式卷
文件分布在各个块上,文件只能存储在磁盘1或者磁盘2上 分布式卷没有数据冗余
基础模型
扩展的时候比较方便- Replicated 复制卷
复制卷中数据创建冗余,数据的副本会保存到所有的存储空间,副本数量可由客户端创建卷时决定
提高可靠性和数据冗余- Distrubute Replication 分布复制卷
文件分布在复制的Brick集上,Brick的数量必须是副本数量的倍数
另外我们指定 Brick 的顺序也很重要
相邻的Brick成为彼此的副本 1234 1324,12、34成为副本 13、24成为副本- Dispersed 分散卷
分散卷基于纠删码,跨卷中的多个Brick存储,分散冗余卷具有高可靠性,不浪费空间
卷中的冗余 Brick 数量可以与客户端在创建卷时设置
异或算法计算出来的校验值是可以用来恢复数据的- Distributed Dispersed 分布式分散卷
相当于分布式复制卷,使用分散的子卷而不是复制的子卷
Brick的数量必须是第一个子卷的倍数,目的是轻松地缩放卷的大小,在不同Brick之间分配负载