请关注我们的微信号:i_server_arch 服务器断电就意味着业务应用被强迫终止,这是业务人员最不希望见到的,它比一般的硬件故障更让人恼火和揪心。而电源往往扮演者这种风险的引发者。 服务器断电引发的业务风险有哪些? 单点类业务(开发、测试和办公平台等) 1、业务中断:业务无法继续向用户提供服务,影响用户体验; 2、数据恢复:掉电引发数据丢失,需要数据恢复,产生运维成本; 集群类业务(WEB前端、缓存、数据库等) 掉电引发数据丢失,根据业务的不同分类可能需要数据恢复(比如缓存型业务就不需要数据恢复),有一定的运维成本发生; 分布式存储(hadoop、分布式文件系统等) 存储类业务遇到单机断电掉线都将被作为一个节点的故障处理,因此数据恢复可能会占去大量的时间(自动化数据恢复除外); 通常,为了避免电源单电故障,会采用两个电源作备份冗余。但是随着电源可靠性的不断提高,电源的故障率已经非常得低了。而大规模部署双电方案的服务器成本也是非常高昂的。那么这两种方案该如何选择呢? 用故障率评估两种方案: 假设服务器总数为W万台,单电源服务器年故障率为x%,电源仅占到所有故障总数的y%,那么电源的年故障率应该在xy/10000,一年内电源故障次数为:Wxy。可以根据这个公式去评估一个集群一年内的断电次数:假设一年内允许的断电次数为Z,那么只要让Wxy |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|