glusterfs节点故障处理

一、声明

本文为学习笔记,转载请标明原文链接、作者、参考博文链接。

二、glusterfs节点故障处理

1. 节点故障

1.1 配置文件丢失

1.1.1 配置新机器或者恢复系统,并保持原来的网络配置和磁盘挂载配置。
1.1.2 挂载数据盘
1.1.3 安装glusterfs,并与原有集群的配置相同。
1.1.4 恢复glsuterfs的配置.
1.1.4.1 恢复/var/lib/glusterd/glusterd.info文件。
1.1.4.2 拷贝/var/lib/glusterd/peers/目录下的文件,按照其他主机的格式将文件复制过来。
1.1.4.3 启动glusterfs。
1.1.4.4 启动数据修复。需要注意不要影响性能。

1.2 数据丢失

1.2.1 执行 gluster volume info 查看本机的brick 目录配置,然后mkdir 好brick 目录。
1.2.2 然后再为brick 目录设置扩展属性。
主要恢复3个扩展熟悉 trusted.gfid,trusted.glusterfs.dht,trusted.glusterfs.volume-id。这些扩展熟悉值 去集群其他机器该brick 对应副本上获取 getfattr -d -m. -e hex brickdir,然后再执行 setfattr -n name -v value brickdir 设置上, 在该机器上所有的brick dir 恢复成功后,然后就重启glusterd 服务(systemctl restart glusterd)即可。
1.2.3 后台修复进程会自动修复不一致数据(每15分钟自动触发)或者手动执行(gluster v volname heal full )立即触发修复。

1.3 配置文件和数据都丢失

1.3.1 方法一

1.3.1.1 配置新机器新ip,配置和宕机节点相同。
1.3.1.2 在集群中任意一台上执行,gluster peer probe newip,把新机器加入集群。
1.3.1.3 执行 gluster volume replace-brick volname badbrick newipbrick commit force 用新的brick替换旧brick,然后 gluster peer detach oldip force。

1.3.2 方法二

按照配置文件丢失 和 数据丢失 方法来恢复。

Previous Post

glusterfs调优

Next Post

glustefs参考博文

Related Posts