现场,神州信息软件产品中心技术专家王东分享了在金融科技化带来IT新常态下,通过公司对行业发展的认知以及多年来在IT运维领域的经验总结和实践积累,对当前IT运维提出的全新思考。
什么是双模IT?
过去两年中,在座的各位都一定感受到了互联网金融创新对信息技术带来的深刻变化。一方面,为了保障传统企业的持续增长,安全生产运行依然是科技部门的首要工作。另一方面,伴随着云计算带来的应用繁荣,依托于互联网架构的新应用不断出现,应用开发迭代周期从数月缩短为数以天计,类似于秒杀、红包等突发性高并发应用需要更加弹性的技术架构。如何同时运维管理这样两种不同的架构,成为科技部门的一个难题。
正是基于企业所面临的问题,高级咨询机构Gartner于2014年提出了关于双模IT的理念。
为什么聚焦双模IT?
今天我们已经可以很清楚的看到,很多企业内部同时存在着这两种IT类别。第一种模式对应的是企业传统应用,其目标客户群相对明确,功能需求相对固定,容量增长可预期。第二类模式对应的是创新应用,对应的功能需求是不明确的,目标客户群是不确定的,容量需求波动也很大。
可以预见,在未来5-8年中双模IT将在企业中长期存在,双模IT也是由传统向新模式过渡的合理选择。
分析.问题来了
对于模式一的企业,由于服务产品类型单一,这座工厂的做法就是采用标准化的“监管控”管理手段,实现服务产品的规模化量产。
如果把企业的信息科技部门比作一座IT服务工厂,这座工厂的作用就是把各种IT资源加工成各种IT服务产品并交付给最终用户。IT应用或者服务作为一种特殊的产品,同样面临用户对产品的功能与质量的要求越来越高,产品更新换代的周期越来越短的变化。
但过渡到双模态之后,这座服务工厂需要同时生产多种类别的服务产品,运营管理上就产生了新的变化。既要支持模式一的管理,强调拓展性、效率、安全和精确度;又要达成模式二的管理,强调敏捷性和速度。换言之,企业要用不同的管理方式来应对这两种IT模式,一分为二又殊途同归。最难的是,如何落实到具体的操作层面。
发现.三个最难点
1. 为保障新模态的IT应用所需要的敏捷高效,IT运营管理需要提供更多的个性化,管理支撑流程将出现从1到N的变化,这些新流程之间要有一个共享的底层平台,而不能成为新的管理孤岛。
2. 由于新模态IT的资源使用呈跳跃式波动,运营管理人员必须获得资源的动态使用情况并做出及时的调整和调度。
3. 随着应用用户群的扩展,习惯于互联网应用方式的用户将不再满足于被动接受服务,他们追求更加方便快捷的体验。运营管理者需要能提供透明的自动式服务通道,让最终用户能全方位地参与服务的交付过程。
思考.如何应对
围绕以上问题,我们通过制造业的发展中获得启发:
双模IT完全可以借鉴现代制造业“柔性生产系统”的模式,同时支持交易量大、业务稳定的传统业务,以及种类多、需求频繁变化的创新业务,围绕服务产品或者场景把复杂的、相关联的工作进行整合,简化运维和用户的接触界面,实现服务透明化。
在现代制造业中,柔性生产系统通过在生产系统上叠加操作控制和信息管理这两个子系统,实现产品制造的优化管理,其中信息管理系统主要实现动态决策,操作控制子系统用以动态控制生产的执行。
基于以上的探索过程,神州信息认为一套包括生产子系统、信息管理子系统和操作控制子系统的“柔性IT系统”应该是符合双模IT管理的最优解决方案
具体体现在:
生产子系统由实现IT服务交付的各类软硬件IT资源组成,这里不做赘述。
信息管理子系统最主要的是获取IT资源状态的静态信息(CMDB)和动态信息(端到端监控),根据外部服务场景触发选择和基于智能化的分析决策(ITOA),确定对应的服
CMDB信息是柔性IT管理的基石,必须采用动态跟踪手段确保信息的准确性。通过系统部署联动可以实现配置初始信息的完整和及时,辅以自动化审核手段能够确保信息的准确。
务交付方案。
操作控制子系统则按照选择的服务交付方案,调度和操作IT资源执行预定义的运维流程,实现服务交付的实时与自动化。
这当中,对于构建柔性IT系统过程中引出了一个关键点:
需要建立一套基于服务产品或者场景的入口和监控流程
要实现这点,需要将传统的IT管理升级为基于服务场景的柔性管理框架。柔性IT服务管理解决方案主要分为场景管理层和操作层,分别对应于柔性IT的信息管理子系统以及操作控制子系统。
场景管理层为所有类型的用户提供专属的服务门户,通过个人工作门户、移动APP以及大屏幕等访问渠道,用户可以选择或者触发相应的服务场景。例如,对于业务部门用户来说,可以通过访问服务超市选择IT服务需求场景,开发人员则可通过开发者门户触发全栈式运营场景,而运维技术人员可以采用ITSM系统实现日常运维场景的触发、响应和处理跟踪。
场景策略管理器预定义服务执行流程和场景预设条件验证,确保服务会按照真实预定的路径和流程执行交付。从提高服务交付效率的角度来说,一个柔性IT系统至少需要提供系统预备、应用部署、云操作、日常维护、业务操作、自动巡检、自动发现、应急切换等全生命周期的自动化运维能力。
全自动化生命周期
日常运维——计划作业、自动开市、自动闭市、系统重启、应用备份、系统变更、故障处理;
业务操作——业务清算、账号管理;
自动巡检——基础设施巡检、后台应用巡检、前端体验巡检、应用日志巡检、合规性检查、自定义巡检;
应急切换——应急切换、灾备切换、演练管理;
应用部署——应用部署、软件统一分发、发布检查、版本基线管理;
云管理——虚拟机创建、虚拟机回收、虚拟机启停管理、虚拟机资源配置、虚拟机模板管理、网络自动化、裸机安装及配置
自动化调度引擎。要实现柔性IT服务框架,在操作层必须提供灵活的流程引擎,除了完成各种复杂逻辑的服务流程,还能够支持人机互动等复杂场景的操作;操作流程可以通过调度引擎调用预定义的各类操作组件,实现对各种IT资源的无人化操作;作为高弹性的操控核心,调度引擎还需要支持高并发多冗余的特性,确保稳定准确可靠地完成IT服务交付。
有了这样一个“柔性IT运维平台”,各种类型的业务服务、维护操作、应急处置方案,甚至各种经验知识都能够以场景方式在技术平台上落地,这些场景的积累将帮助各个企业形成自己独特的IT运维专家系统,最终过渡到智能化的运维模式。
以上就是我们在双模IT环境下打造柔性IT系统的一些的想法。感谢各位的聆听,谢谢大家!
采用行业社区模式,来自不同用户的运维最佳实践流程、工具和操作组件库可以成为共享的支持资源