当你的ceph集群状态遇到如下状态时,
$ ceph -s
cluster 3a4399c0-2458-475f-89be-ff961fbac537
health HEALTH_WARN 191 pgs stale; mds cluster is degraded
monmap e3: 1 mons at {0=192.168.0.5:6789/0}, election epoch 1, quorum 0 0
mdsmap e34: 1/1/1 up {0=a=up:replay}
osdmap e114: 3 osds: 3 up, 3 in
pgmap v244: 576 pgs, 3 pools, 0 bytes data, 0 objects
117 MB used, 298 GB / 298 GB avail
191 stale+active+clean
385 active+clean
$ ceph health detail
HEALTH_WARN mds cluster is degraded; mds a is laggy
mds cluster is degraded
mds.a at 192.168.0.5:6800/16244 rank 0 is replaying journal
mds.a at 192.168.0.5:6800/16244 is laggy/unresponsive
这说明的集群中的mds出现问题了,你可以试试以下两种方法。
方法一, 停掉并删除mds服务。
如果你不需要使用cephfs,那么你的ceph集群就不需要使用mds服务,你可以按照如下方法,将mds服务删除掉。
$ sudo service ceph stop md
$ ceph mds rm mds
并且记得删除掉ceph.conf文件中关于mds的配置。而有些时候,你即使删掉了mds服务,但集群的状态还是warning,这个应该是一个bug了。
方法二,创建一个文件系统。
$ceph mds newfs metadata data --yes-i-really-mean-it