Ceph 集群维护 (四)
ceph集群配置、部署与运维
http://docs.ceph.org.cn/rados/
4.1:通过套接字进行单机管理
每个node节点上都有不同数量的OSD数量
启动osd进程会在 /var/run/ceph下生成soke文件
ls /var/run/ceph
ceph-osd.0.asok=
ceph-osd.1.asok=
ceph-osd.2.asok=
ceph-osd.3.asok=
ceph-osd.4.asok=
可在node节点或者mon节点通过ceph命令进行单机管理本机的mon或者osd服务
先将admin认证文件同步到mon或者node节点
ceph@ceph-deploy:/home/ceph/ceph-cluster$scp ceph.client.admin.keyring root@172.31.6.101:/etc/ceph
#指定要管理的asok文件
[root@ceph-node1 ~]# ceph -- admin-socket /var/run/ceph/ceph-osd.0.asok --help
-- admin-daemon
在 mon节点获取daemon服务帮助:
#帮助信息:
ceph-mon1~]#ceph --admin-daemon /var/run/ceph/ceph-mon.cephjmon1.asok help
#mon状态:
ceph-mon1~]# ceph --admin-daemon /var/run/ceph/ceph-mon.ceph-mon1.asok mon_ status
#查看配置信息:
ceph-mon1~]# ceph - admin-daemon /var/run/ceph/ceph-mon.ceph-mon1.asok config show
4.2 ceph集群的停止或重启
重启之前按照正确的流程,要提前设置ceph集群不要将OSD标 记为out,避免node节点关闭服务后被踢出ceph集群外
node节点每隔6s向mon节点汇报一次OSD状态,连续20秒后没有通告正常mon就会把OSD标记为OUT ,就会触发磁盘的高可用开始磁盘的选举和数据同步。
#关闭服务前设置noout
[ceph@ceph-deploy ceph-cluster]$ ceph osd set noout
noout is set
#启动服务后取消noout
[ceph@ceph-deploy ceph-cluster]$ ceph osd unset noout
noout is unset
4.2.1 关闭顺序
- 关闭服务前设置noout
- 关闭存储客户端停止读写数据
- 如果使用RGW,关闭RGW
- 关闭cephfs 元数据服务
- 关闭ceph OSD
- 关闭ceph manager
- 关闭 ceph monitor
4.2.2 启动顺序
- 启动 ceph monitor
- 启动 ceph manager
- 启动 ceph OSD
- 启动 ceph FS 元数据服务
- 启动RGW
- 启动存储客户端
- 启动服务后取消 noout
4.2.3 服务时间偏差
http://docs.ceph.org.cn/rados/configuration/mon-config-ref/
重启发现:
cluster: id:5ac860ab- 9a4e- 4edd- 9da2 e3de293a8d44 health: HEALTH WARN clock skew detected on mon. ceph-mon2, mon. ceph-mon3 noout flag(s) set
通常由于服务器重启后导致时间不太一致,因为服务器有时间同步计划任务同步周期还没到
可以设置监视器运行的时钟漂移量,默认为0.050秒即50毫秒
cat /ceph.conf
#设置监视器运行的时钟漂移量
mon clock drift allowed =3
#时钟偏移警告的退避指數即连续多少次时间偏差后就出发警告
mon clock drift warn backoff= 10
#同步配置文件mon服务器
[ceph@ceph-deploy ceph-cluster]$ ceph-deploy --overwrite-conf config push stor01..3)
#重启mon
#拷贝方式
#ceph@ceph-deploy:~/ceph-cluster$ scp ceph.conf root@172.31.6.101: /etc/ceph/
#ceph@ceph-deploy:~/ceph-cluster$ scp ceph.conf root@172.31.6.102: /etc/ceph/
#ceph@ceph-deploy:~/ceph-cluster$ scp ceph.conf root@172.31.6.103: /etc/ceph/
[root@ceph-mon1 ~]# ntpdate timel.aliyun.com && hwclock -W
root@ceph-mon1:~# systemctl restart ceph-mon@ceph-mon1.service
4.3 ceph 配置文件
Ceph的主配置文件是/etc/ceph/ceph.conf
,ceph 服务在启动时会检查ceph.conf分号;和#在配置文件中都是注释,ceph.conf 主要由以下配置段组成:
[global] #全局配置[osd] #osd专用配置,可以使用osd.N, 来表示某一个OSD专用配置,N为osd的编号,如0、2、1等,
[mon] #mon专用配置,也可以使用mon.A来为某一个monitor节点做专用配置,其中A为该节点的名称,ceph-monitor-2、 ceph-monitor-1 等,使用命令ceph mon dump可以获取节点的名称、
[client] #客户端专用配置.
ceph 文件的加載順序
$CEPH_CONF 环境变量
-c 指定配置文件位置
/etc/ceph/ceph.conf
~/.ceph/ceph.conf
./ceph.conf