在人工智能(AI)技术蓬勃发展的当下,Kubernetes(K8s)依然是企业追求敏捷开发的首选工具。以AI领域的先驱OpenAI为例,其底层的核心调度与计算平台正是基于K8s构建的。
K8s,这一由谷歌开源的容器编排引擎,凭借其自动化部署、大规模伸缩以及应用容器化管理的能力,在生产环境中扮演着举足轻重的角色。为了应对应用请求的负载均衡,企业往往需要在生产环境中部署多个应用实例,而K8s则能够简化这一过程,通过内置的负载均衡策略,实现对应用实例的高效管理、发现和访问。
追溯K8s的起源,它源自谷歌内部的一个服务和应用管理系统——Borg。面对日益增长的应用程序和复杂的服务管理需求,谷歌创建了Borg系统,采用容器化思想,将应用程序打包成容器并在集群中运行。2014年前后,谷歌将Borg的部分经验开源,推出了Kubernetes项目,这一项目由Google、Red Hat、Microsoft等公司共同推动,旨在为云原生应用提供一个开源的容器编排和管理平台。
与此同时,云原生概念也应运而生。2015年,Google联合Linux基金会成立了云原生计算基金会(CNCF),Kubernetes成为CNCF管理的首个开源项目。CNCF致力于推广云原生,并明确了云原生的三大支柱:容器化、微服务、DevOps。在这一背景下,金融行业作为数字化转型的先行者,也开始积极拥抱云原生技术。金融行业对于业务快速多变的需求,促使云原生技术因其快速、弹性的特点,与原先的大集中架构相融合,共同构成了当前银行IT系统的主流架构。
在这个过程中,K8s凭借其在云原生容器化过程中的卓越表现,赢得了金融行业数字化转型的青睐。青云科技云原生产品负责人于爽表示,在2020年甚至更早之前,用户的需求相对简单,主要是希望将容器用起来。然而,随着时间的推移,金融机构对于K8s的使用要求不断提高,不仅要求能够用起来,还要求用得更好。这也对云服务商提出了更高的要求,不仅需要提供容器化服务,还需要实现稳定与敏捷的兼顾。
以银行为例,目前绝大多数银行的内部结算系统都已经部署在K8s平台上。于爽指出,银行对于容器化平台的要求越来越高,不仅要求稳定可靠,还要求具备高效的微服务管理能力。用户对于K8s平台的差异化、定制化能力的要求也日益显现。以前,用户的需求主要停留在表面,只要平台能够提供一个界面,让用户能够使用K8s的某个功能就足够了。但现在,用户的需求变得更加深入和多样化,包括容器化改造、底层基础设施的大规模运维管理稳定性提升、上层数据库的容器化、操作系统内核优化、灾备和容灾以及稳定性等方面的需求。
以中国建设银行为例,目前建行的数据库资产已经全面实现了K8s化,包括核心数据库资产在内。这一趋势表明,K8s正在从简单的容器化工具,向具备复杂工作负载管理能力的平台演进。在AI时代,企业AI应用的落地对K8s平台提出了新的需求。AI大模型的出现,使得K8s平台需要支持更复杂的工作负载管理。于爽表示,AI时代的工作负载远比原先基于K8s运行Web应用或后台应用要复杂得多,这就要求K8s平台具备更强的后台管理能力和产品复杂度。
特别是在可观测性方面,随着AI应用开发的增多,K8s平台的可观测规模也提出了更高的要求。同时,观测行为对于IT环境的区别性和异构性在AI时代也发生了很大的变化。异构计算的普及以及不同厂商产品和解决方案的混合使用,使得可观测性成为一个难题。为了解决这一问题,青云科技等云服务商正在探索新的技术框架,如eBPF框架,以实现对基础设施和应用的无侵入可观测。
除了可观测性之外,AI大模型训练的负载通常是阶段性的,这也对K8s平台的弹性伸缩能力提出了更高的要求。K8s平台需要根据负载情况自动调整资源分配,确保AI应用的稳定性和可用性。同时,企业还需要不断优化资源调度算法,以确保AI应用能够优先获得所需的计算资源,同时不影响其他应用的正常运行。
K8s平台的应用场景也在不断拓展。除了金融行业之外,传统制造业在建设数字工厂的过程中也开始大量采用K8s平台作为底座。以某电池制造业龙头企业为例,该企业采用青云科技的KubeSphere容器平台进行了升级,实现了应用系统全面容器化部署,提升了应用系统的交付效率和弹性扩展能力。同时,该企业还构建了企业级容器云平台,对各大厂区进行统一管理,显著提升了厂区间协同效率与应用建设管理水平。
随着AI技术的普及,越来越多的高校科研项目开始应用AI大模型的能力辅助科研。高校师生对于开发平台的各方面要求也逐渐提升,K8s也成为了高校重要的IT基础设施之一。这一趋势表明,K8s平台的应用场景正在不断拓宽,其重要性也在不断提升。