春节与清明假期,作为中国领先的在线旅行服务提供商艺龙,经历了从百万到亿级MAU的海量用户增长,研发与运维团队在极高的压力下,应用可用性还是经受住了考验,为用户交出一份满意的答卷。自2014年10月起,艺龙整体研发团队进行了一次大规模扩充,加大了研发力度,将研发的工作重点转移到核心业务逻辑的实现上,将应用性能管理的工作交给了听云。听云为艺龙研发团队提供了四大技术保障。
图:艺龙无线技术部架构师谈应用性能管理助力艺龙关键业务提升
1. 峰值的处理亟不可待
4-6月是旅游旺季,也是所有旅游App的峰值期,艺龙喊出了“奋战九十天,每天十万单”的口号。在此期间,艺龙内部对应用的监控质量要求达到了顶峰。2015年第一季度,艺龙的整体业务同比增长50%,其中75%以上的业务增长来自移动端。高并发的业务特点给艺龙App在网络请求、网络波动、接口响应方面带来了很大的压力,导致用户体验下降。
艺龙为了实现优质的用户体验,在客户端进行底层全优化的基础上,采用听云App帮助艺龙解决了从API接口响应到2G、3G、4G不同网络下的性能监控问题,实时了解网络请求对服务端带来的性能压力,并且成功将响应时间均值控制在10毫秒内,达到业内领先。
2.三周一个迭代是怎么做到的?
艺龙App的版本管理采取敏捷迭代的方式,每三周为一个迭代周期。但为了加速迭代,艺龙App从整体架构上进行了优化,其中团队内各频道会由频道PM、UI、测试分别进行项目迭代。与此同时,艺龙App采用了热加载、插件化系统,实施的新框架会对用户行为进行分析,由听云App提供的客户端应用性能管理帮助艺龙实时发现崩溃、交互性能瓶颈等问题,艺龙可以快速在线进行修复,无需进行版本更新。
听云App对于艺龙来说还是第三方指标监控体系。艺龙在使用听云App的过程中,会为自己不同版本的产品设定阈值,根据阈值表现进行强制升级,而艺龙的产品在经过端口切换后,也从过去各版本上下兼容的传统做法提升为根据插件包或版本的阈值表现而进行升级。这样的好处是通过监控可以从前端、后端进行有效控制,大大降低了维护成本,不再需要同时维护多个版本。通过听云App监测,可有效加快迭代并延续产品生命周期,完成迭代闭环,从而不断满足用户需求。
3.惊心动魄的运营商事故处理
春节期间,各地区不同运营商的网络状况存在很大的差异,听云App监测到艺龙在河南等地区联通网络的断线率高达50%以上,这对当地订单影响极其严重,交易成功率下降十分明显。此时用户在搜索、购买产品的整个过程中,体验十分糟糕,同时从艺龙服务端也看不到任何用户数据。经听云App的报警反馈后,艺龙实施了问题追踪,发现当地联通运营商出现了严重的运营商劫持情况,后来经过与当地运营商进行沟通和对问题的迅速处理后,及时解决了运营商劫持情况,减少了经济损失的扩大。
4.关键业务快速提升
除了用户留存率与交易成功率外,“夜间留存率”即线下用户在合约酒店的留宿率也是艺龙非常关心的核心业务指标,听云App所提供的性能画像,可以快速发现请求响应时间、崩溃率、错误率等重要指标,通过7*24小时的NOC支持,保障艺龙的研发与运维人员能够在第一时间快速发现、定位并解决性能问题。
同时,艺龙App本身存在分频道开发的特殊性,那么就需要听云App对各个频道分别进行性能监测,这样才能保证实时将网络状况进行反馈,加快从App整体到分支频道的迭代速度,并实时提升了用户体验,实现关键业务的提升。
关于听云
听云作为国内APM领域第一品牌,拥有听云App、听云Network、听云Server、听云CDN四条重要产品线。从移动客户端到服务器端再到网络层面,全方位帮助客户实时监控定位从崩溃、报错、代码效率质量低下、交互过慢、第三方API调用失败、到网络环境出错等多维度复杂的性能问题。