摘要:单点问题是单点故障(SinglePointofFailure)造成系统失效的通俗说法。MooseFS由于设计了metaserver,到目前为止还没有做系统级冗余的计划。但是,metaserver并不能实时自动切换,所以,只有我们自己来设计了。这篇就是介绍如何设计实施故障的自动切换,以及故障排除后的自动恢复。 192.168.1.1前言:单点问题是单点故障(SinglePointofFailure)造成系统失效的通俗说法。对于单点问题,我们解决的方案一般是采用冗余设备或者热备,因为硬件的错误或者人为的原因,总是有可能造成单个或多个节点的失效,有时我们做节点的或者升级,也需要暂时停止某些节点,所以一个可靠的系统必须能承受单个或多个节点的停止。 我原本的架构是由DRBD和MooseFS所组成,DRBD实现了基于网络的raid1,HA和Pacemaker实现基于策略的故障转移;而MooseFS由于设计了metaserver,到目前为止还没有做系统级冗余的计划。但是,metaserver并不能实时自动切换,所以,只有我们自己来设计了。这篇就是介绍如何设计实施故障的自动切换,以及故障排除后的自动恢复。 名词定义 引起产品故障的,且没有冗余或替代的工作程序作为补救的局部故障。(GJB451-90) 单点失效是导致一项产品完成任务的性能不可逆转地降低到合同水平以下的单一硬件失效或软件差错(产品发生单点失效的方式就是产品的单点失效模式)。(MIL-STD-1543B-88) 某产品的失效将导致系统的失效,且不能由贮备或代替的工作程序来补偿。(MIL-STD-721C-81) 高可用 高可用(HA)有两种不同的含义,在广义中,是指整个系统的高可用(HighAvailability)性,在狭义方面,一般指主机的冗余接管,如主机HA,如果不特殊说明,本书中的HA都指广义的高可用性。在高可用的解释方面,可以分为如下一些方面: (4)介质失败,一般指存放数据的介质故障(Mediailures) 以下为具体描述与实现步骤。 用途: 解决mfsmaster的单点问题,同样可以作为其他需要高可用的标准配置方法 规划: 使用drbd实现主备机的灾容,Heartbeat做心跳监测,Pacemaker实现服务(资源)的切换及控制等 描述: drbd双主模式对网络和配置要求比较高,在此结构下不采用; drbd需要清空一个分区,并且不能格式化 软件: : 【编辑推荐】  | 
不良信息举报Q:2000617|Archiver|ROS软路由论坛 ROSABC.com 网络方案网络工程交流
GMT+8, 2025-11-4 15:38 , Processed in 0.028874 second(s), 15 queries .
Powered by Discuz! X3.4
Copyright © 2001-2021, Tencent Cloud.