← 返回列表

一种服务器集群的故障监控方法、装置、设备及存储介质

申请号: CN202311654834.X
申请人: 杭州沃趣科技股份有限公司
申请日期: 2023/12/5

摘要文本

本发明涉及服务器监控技术领域,尤其是一种服务器集群的故障监控方法、装置、设备及存储介质,其中,所述方法包括:获取服务器集群的关系信息;对服务器集群的关系信息进行处理,生成服务器集群的连接关联图;获取服务器集群的当前属性信息;根据服务器集群的连接关联图和服务器集群的当前属性信息,生成服务器集群的故障状态图,以使得根据服务器集群的故障状态图,对服务器集群的故障进行监控;可知,能够直观查询出服务器集群中每一服务器的故障状态,并可以根据故障状态按照一定的连接关系,确定出整体发生故障的概率,进而实现了的服务器集群的故障监控。 数据由马 克 数 据整理

专利详细信息

项目 内容
专利名称 一种服务器集群的故障监控方法、装置、设备及存储介质
专利类型 发明授权
申请号 CN202311654834.X
申请日 2023/12/5
公告号 CN117349128B
公开日 2024/3/22
IPC主分类号 G06F11/30
权利人 杭州沃趣科技股份有限公司
发明人 陈栋; 李春; 魏兴华; 李建辉; 杨禹航; 吴炎; 臧冰凌; 张文件; 罗春; 王显伟
地址 浙江省杭州市滨江区长河街道滨安路1190号3幢智汇领地科技园A区A楼11层1101室

专利主权项内容

1.一种服务器集群的故障监控方法,其特征在于,所述方法包括:获取服务器集群的关系信息,其中,服务器集群的关系信息包括若干个服务器的关系信息,其中,每一服务器的关系信息是指任一服务器与除自身之外的其他服务器之间通信连接关系;对服务器集群的关系信息进行处理,生成服务器集群的连接关联图,其中,所述对服务器集群的关系信息进行处理,生成服务器集群的连接关联图还包括如下步骤:根据服务器集群的关系信息,确定出服务器集群的连接关联服务器ID集,其中,所述方法还通过如下步骤确定服务器集群的连接关联服务器ID集:S211,获取服务器集群对应的服务器ID列表A={A,A,……,A,……,A},A是指第i个服务器ID,i=1,2……m,m为服务器集群对应的服务器ID数量;12imiS212,根据A对应的服务器集群的关系信息,获取A对应的连接关联服务器ID集B={B,B,……,B,……,B},B={B,B,……,B,……,B},B是指A对应的第j个连接关联服务器ID,j=1,2……n(i),n(i)是指A对应的连接关联服务器ID数量,即B为服务器集群的连接关联服务器ID集;12imii1i2ijin(i)ijii根据服务器集群的连接关联服务器ID集,生成服务器集群的连接关联图,所述服务器集群的连接关联图为树状结构的关联图,其中,所述服务器集群的连接关联图包括一个连接关联根节点和s层连接关联的叶子节点,每一层的连接关联的叶子节点的数量不一致,其中,所述方法还通过如下步骤生成服务器集群的连接关联图:S221,获取A对应的连接关联服务器ID数量列表n={n(1),n(2),……,n(i),……,n(m)};S222,根据n,确定出所述连接关联的根节点,所述连接关联的根节点为当仅n(i)为n中最小关联服务器ID数量时的A,在S222步骤中还通过如下步骤确定所述连接关联的根节点:iS2221,根据n,获取第一中间服务器ID集C={C,C,……,C,……,C},C为第x个第一中间服务器ID,x=1,2……p,p为第一中间服务器ID的数量,所述第一中间服务器ID是指n中最小值对应的服务器ID;12xpxS2222,从B中获取C对应的关联服务器ID数量列表z={z(1),z(2),……,z(x),……,z(p)},z(x)为C对应的关联服务器ID数量;xS2223,当任一z(x)为z中最小关联服务器ID数量时,确定C为所述连接关联的根节点;xS223,根据所述连接关联的根节点,确定出所有的叶子节点D={D,D,……,D,……,D},D={D,D,……,D,……,D},D为第r层中第y个叶子节点,r=1,2……s,y=1,2……q(r),q(r)为第r层的叶子节点数量;可以理解为:D表征为在A中除D对应的服务器ID列表和所述连接关联的根节点对应的服务器ID之外且不大于预设的第一服务器ID数量阈值的任一服务器ID,在S223步骤中还通过如下步骤确定D:12rsrr1r2ryrq(r)ryryr-11yS2231,获取所述连接关联的根节点对应的第二中间服务器ID列表U={U,U,……,U,……,U},U为所述连接关联的根节点对应的第g个第二中间服务器ID,g=1,2……v,v为所述连接关联的根节点对应的第二中间服务器ID数量,所述第二中间服务器ID为从B中所述连接关联的根节点对应的关联服务器ID;12gvgS2232,获取到每一U对应的关联服务器ID数量且将U对应的关联服务器ID数量不大于预设的第一服务器ID数量阈值的U作为D;ggg1y获取服务器集群的当前属性信息;根据服务器集群的连接关联图和服务器集群的当前属性信息,生成服务器集群的故障状态图,以使得根据服务器集群的故障状态图,对服务器集群的故障进行监控。