5月27日下午5点,拥有将近3亿活跃用户的支付宝出现了大面积访问故障。据悉,包括北京、上海、广东、武汉、西安、湖南、浙江、四川、福建等地用户均受到不同程度的影响,如手机和电脑支付宝无法登陆、无法正常支付、余额错误等问题。据支付宝官微回应称,故障原因是杭州市萧山区某地光纤被挖断。2.5小时后,支付宝才恢复正常使用。
无独有偶,18个小时后,拥有超2.5亿用户的携程官方网站与APP也出现了访问故障,官方回应称其原因为部分服务器遭到不明攻击。受此影响,携程股价盘前暴跌11.67%,而宕机带来的业务损失也不是小数字。近12小时后,携程官网及APP终于恢复正常。
一时间,网民类似的戏谑之言在网上比比皆是。事实上,相关事件之所以引得广泛关注,主要原因就在于今天的互联网与大众生活已紧密相关。接连发生的两次故障事件,让更多普通用户只是感受到了平日里“赖以生存”的网络之脆弱,而让高度依赖网络和IT能力的相关企业却是产生了空前的关注与警醒。
周星驰电影《功夫》里有句名言:能力越大,责任就越大。而短时间的两次故障正凸显出互联网+下,企业容灾备份和IT管理亟待进一步提升的问题。在中国这样的人口大国,随着用户数量激增,企业背后的数据安全和整个IT系统的管理也变得更加重要,影响着企业的服务质量、品牌声誉与用户的信赖。正因如此,探讨一下企业如何避开互联网道路上的“坑”,要远比谈论“一把铁锹的威力”重要得多。
万物互联时代更需理性
“万物互联时代,基础设施的复杂性和安全问题势必更加突出。包括今天的支付宝光缆被挖断,携程被攻击宕机。再一次展示了传统行业铁锹和IT时代运维管理的力量,凸显了网络时代的脆弱性。在互联网+轰轰烈烈的大潮下,如何处理好营养的极大丰富,与基础设施非常脆弱的问题?”这是某位行业专家在朋友圈里写下的反思。
带着这些问题,记者走访了相关专业人士。一位国有银行人士称,相对移动支付或大型网站,传统金融机构更为理性,在涉及资金交易的重要系统灾备方面往往有着更充分的准备,发生大范围数据故障的几率更低,而这种理性也在某种程度上意味着服务安全级别的提升。
异地灾备,联手避“坑”
就此次事件记者也专门采访了国内领先的整合IT服务商神州信息,其专家也持类似观点:当前企业业务受益互联网+的带动不断扩张,为保障业务安全和稳定,很多银行与企业都实施了“两地三中心”的异地灾备方案,神州信息也在其中承接了很多工作。在实施过程中不仅可帮助企业在同城部署一个灾备中心,还会在异地部署另一个备份中心,并在此基础上辅以完善的灾备技术与解决方案,确保数据、业务因突发灾难或其他因素中断时的及时可恢复性。实现了“两地三中心”灾备,一旦企业某个机房的核心数据库或业务系统出现故障,系统将按照预定策略,自动切换到同城或异地的灾备中心,确保业务不间断,从而大大提高业务连续性,高度保障系统的连续运行与核心数据安全。
同时这位负责人也指出,作为中国最大的第三方支付平台,支付宝日均支付的数据量远远超出一般银行,其容灾管理也更加复杂,异地灾备的部署难度也更大。但企业用户只要有数据保护的必要性,采取异地灾备方式就是当前有效的解决方案之一。特别是在云备份平台的支持下,异地灾备可以最大程度的避免自然灾难或战争等极端情况给企业造成的影响。
“24小时内出现的两起大面积突发事件,让每个企业重新认识到了灾备和IT运维管理的重要性。大型网站的架构与业务系统错综复杂,各种服务之间的依赖关系也会随时间推移难以厘清,一旦出现问题,重建过程将繁琐耗时。只有不断提高网络安全意识,完善相关管理机制,才能从根源上更好地解决问题。”