数据中心发生故障是常事,但因为使用了冗余技术,保证了业务的连续性。针对数据中心的一般故障,比如硬件、软件、网络、电源等方面,有多种成熟的冗余技术做保障。数据中心冗余技术按照ISO7层协议进行区分:从最底层的双备份,数据链路层的网卡冗余,网络层的路由收敛,以及ISO4~7层的负载均衡等。
在这个信息高度发展的社会,企业对数据中心的依赖性越来越大。一旦数据中心出现故障,企业员工可能会无法正常工作、无法交易导致公司订单丢失、企业可能会失去大量的客户等等严重问题。根据META Group的统计,各行业平均每小时因为数据中心故障造成的损失高达$1,010,536.00美元。其中能源、通信、制造业的损失分列前三甲。
中国目前有将近54万个数据中心在运营,并正以每年18%的复合增长率高速增长,与数据中心相关的基础设施建设市场以达到千亿的规模。这么多的数据中心,几乎天天都会有大大小小的故障出现。可实际这么多的故障并没有造成多么严重的损失,这主要是因为几乎所有的数据中心都采用了各种冗余备份技术,从而当故障发生时,业务能及时切换到正常的运转层面,维持数据中心的正常运转。当排查完故障后,再将业务切回正常运转的层面。
一般数据中心的故障来源有:硬件故障、软件故障、链路故障、电源/环境故障、资源利用问题、网络设计问题六个方面。减少这些故障的最简单方式就是冗余技术,可以通过对设备、链路、服务器提供冗余备份,从而将故障对用户业务的影响降低到最小。
根据数据中心中业务的网络层级,可将冗余技术具体分为四大类:
数据中心冗余技术
ISO 4~7层冗余技术
我们知道OSI协议参考模型定义了7层网络结构,其中四层以上都属于应用层,应用层具有区别各种高层应用和识别内容的能力。数据中心通过引入负载均衡技术,可对数据中心服务器群访问实现冗余备份,还可以完成网络加速,流量工程等一系列优化功能。数据中心可以采用两台负载均衡设备互为冗余备份。设备正常运行过程中可以手动同步配置信息和自动同步会话信息。当一台设备发生故障时,另一台设备可以快速感知设备故障,接管故障设备的业务,保证故障设备的当前业务不中断。