8月23-24日,上海银联支付学院举行了由全公司15只队伍参加的技能大比武。目的为促进银联向科技型、数据型公司转型,同时提升云计算团队专业运维能力。为力求模拟最真实的互联网大规模运维场景,每个队伍被要求采用1000个计算节点和若干控制节点完成5道运维考题。15组1000台主机同时读写大量数据及大批量网络传输,不只是对每只参赛队伍的技能考验,同时也是对华为云性能及保障能力的考验。
为保障此次银联 “比武”活动顺利进行,不让一台机器出现问题,华为云在赛前制定了详细的保障计划和扎实的准备工作,包含风险评估、规避方案实施、应急预案制作、按时巡检、现场+远程值守等。
此次保障的关键点如下:
15000台云主机,6小时内全部发放完毕。云计算天然就是弹性的,华为云多维卸载架构,支持云主机资源的极致快速发放。其核心的延时加载技术不仅能做到虚拟机秒级发放,而且数据安全性、系统可靠性更有保障。该技术用户不感知,无需自行配置。
善用内存文件系统,消除存储压力。15000台云主机同时读写大文件,会对共享存储造成百倍于其IO能力的压力。华为云运维团队创新地在短时间内对计算节点增加了内存文件系统,并在15000台节点上批量部署,从而实现文件读写不落盘,成功消除IO瓶颈风险。
提前判断大流量对网关节点的影响,配置分发网络QOS及更改传输文件大小进行规避。15000台云主机采用P2P方式传输大文件,对集中处理流量的网关节点会造成巨大冲击。华为云网络运维团队通过比对不同QOS限速,不同传输文件大小情况下网关节点的运行情况,选择了最优的参数配置,确保了不影响现有租户的业务稳定运行。
主机安全配置和巡检,确保主机安全。主机直接暴露在公网上会产生巨大的安全风险,容易被攻击。通过配置华为云主机安全检测及自动告警,加上人员定时值守,保障主机安全平稳运行。
对于云服务来说,性能和可靠性是永恒的话题。凭借在ICT领域30年的经验积累,华为云在底层架构上以高可靠、高性能、高并发、高安全打造了自己的产品优势,同时针对此类大型活动,华为云将To B的服务优势发挥到了极致,使得整个保障过程专业化、流程化、服务化。
2018年2季度,全球著名的市场研究公司Forrester Wave的报告中,华为云已进入国内公有云领域中的领导者象限。展望未来,华为云继续在创新的道路上加速奔跑,以创新技术助力客户持续成功。
HUAWEI CONNECT 2018作为华为自办的面向ICT产业的全球性年度旗舰大会,将于2018年10月10日-12日在上海隆重举行。本届大会以“+智能,见未来”为主题,旨在搭建一个开放、合作、共享的平台,与客户伙伴一起共同探讨如何把握新机遇创造智能未来。欲了解更多详情,请参阅:https://www.huawei.com/cn/press-events/events/huaweiconnect2018?ic_medium=hwdc&ic_source=corp_banner_allwayson&source=corp_banner