服务器是怎么做到每年只停机30秒的?
关键业务服务器对可靠性有着极为严格的要求。调研数据显示,服务器中断服务一分钟在不同行业所造成的金钱损失极为惨重。关键业务服务器的可靠性已成为各行业的重中之重。随着技术的不断发展,关键业务服务器的标准也在不断提高,从过去的五个九提升到现在的六个九甚至七个九的可用性标准。这意味着服务器非计划停机的时间越来越短,确保业务连续性的需求更加迫切。
根据ITIC的统计,大多数企业对服务器的可靠性要求已经达到了四个九的水平,并且这一要求还在迅速增长。为了满足这样的高可靠性需求,服务器的RAS(高可靠性、高可用性、高服务性)特性变得至关重要。这一特性曾是大型机的独特优势,但随着X86服务器在RAS功能上的不断进步,它们已经占据了市场的主导地位。尽管关键业务服务器仍有部分市场份额不在X86的控制之下,但X86服务器的可靠性已经非常高,仅比某些特定服务器低一点。
那么,这些RAS特性具体是什么呢?它们绝对不是简单的焚香祷告,而是实实在在的硬件保证。其中之一就是内存镜像技术,类似于磁盘的RAID模式,它通过冗余存储数据来确保数据的可靠性。当内存发生故障时,备份数据可以立即投入使用,保证系统的正常运行。除了内存镜像,还有SDDC、SDDC+1、DDDC和ADDDC等技术用于纠正内存错误,确保数据的准确性。
还有内存巡警技术,它像高速巡警一样定期扫描内存可能存在的错误,并及时纠正。错误的报告和隔离也是关键业务服务器的重要功能之一。通过WHEA等技术,服务器能够向操作系统报告错误,操作系统可以做出相应的动作来确保系统的稳定运行。这些技术的综合应用使得关键业务服务器具有极高的可靠性和可用性,为企业的关键业务提供了强有力的支持。CPU、内存与设备的热插拔技术
尽管通过SDDC等手段对硬件错误进行纠正,但隐患仍可能逐渐恶化,直至无法纠正。为避免此类情况,必须及时移除并替换出错设备。
当操作系统向管理员报告错误时,很多人会选择关机更换设备,但这种操作会严重影响服务的可用性。而现在,我们需要在操作系统持续提供服务的情况下,实现设备、内存甚至CPU的热插拔替换。
总结
实现6个9甚至7个9的高可靠性是一个系统工程,需要从整体角度考虑。除了RAS功能外,服务器硬件如磁盘驱动器也与普通民用设备有所不同,其高昂的价格反映了其高可靠性。
这些功能无疑增加了服务器的成本,因此像Google、FB、亚马逊和阿里等大型云服务公司选择从操作系统级别的软件冗余来解决系统高可靠性问题。当一台服务器出现故障时,可以直接整台下线,而不用更换CPU或内存。其他2到3台服务器仍在持续提供服务,确保服务不会中断。
在一些大型关键部门如银行和电信行业,他们仍然依赖传统的RAS技术来保证系统的可靠性。这可能是因为这些部门对数据的可靠性和安全性有着更高的要求,需要采取更为稳妥的措施来确保系统的稳定运行。
网络推广
- 洞口建站公司有哪些?选择合适的建站公司,助
- 天津百度关键词排名售后保障一般有哪些
- 云南百度网站优化价格合理性的看法
- 河南百度快照排名有没有优惠
- 涞源专业的网站建设公司:打造企业数字化形象
- 上海网站优化公司怎样做网站排名
- 滦平专业的网站建设公司:打造您理想的网站解
- 潼关专业的建站公司:打造您的网站成功之路
- 兴隆百度关键词seo:提升网站曝光与流量的关键
- 隆化企业网站建设公司:助力企业数字化转型
- 北京百度seo排名怎么做才能放大客户需求
- 永仁网站优化:提升网站流量的有效策略
- 增城专业的建站公司:打造您的理想网站
- 钟祥seo网站排名关键词优化指南
- 东明建站公司:助您实现线上梦想的最佳选择
- 提升网站流量与排名的策略:繁峙百度优化服务