国内某大型国企容器云落地实践

国内某大型国企是世界五百强前三名的巨型企业,IT 角色定位在传统的电网生产运营支撑,其 IT 基础架构相应比较传统。产品上广泛采用高性能软硬件搭配,部署方式上采取按项目集中式部署。因为软硬件紧密耦合,导致业务部署周期长、资源利用率低。伴随物联网和互联网应用的快速发展,该企业推出了智能电表、手机买电客户端等互联网特点的应用,并且大力引入大数据服务。基础架构支撑业务负载变化能力不足,动态扩展和回收能力无法满足业务全天候弹性需求,运维复杂度和成本居高不下的问题凸现。

2016年该企业提出了“一体化云平台”的 IT 转型路线,将建设“公共服务云”、“企业服务云”和“生产服务云”,分别承载对内和对外不同类型的业务。其中公共服务云和企业服务云都将基于PaaS+IaaS 平台来进行建设。

一、与 OpenStack 集成容器集群管理

将容器集群作为 IaaS 编排的资源之一,进行集群生命周期的管理。用户在部署容器集群时,在创建页面上选择集群类型:1 master,3 master 或者5 master,然后选择集群节点数,点击创建。平台自动创建容器集群所需要的虚拟机,为集群创建网络,分配主机 IP、创建并挂载硬盘,安装集群所需组件,形成可用于发布应用的整个集群环境。 技术方案:通过 OpenStack Magnum 组件,调用 Heat 编排模板,创建虚拟资源环境,调用数人云 API,完成对集群的部署操作。

二、平台账户统一管理

OpenStack 和数人云两个平台都提供了多租户能力。OpenStack 通过Keystone 提供用户认证服务,数人云通过自研的 Auth 提供用户认证服务,需要将两个平台的账户打通,每个用户可管理自己的虚拟资源、容器集群以及应用。

技术方案:两个平台都对接 LDAP,通过 LDAP 提供的统一的用户权限管理。

三、多环境、多应用的 DevOps 流水线

该平台通过数人云容器服务,打通开发、测试和生产环境的流水线。开发人员提交的测试环境的代码,自动化构建成生产标准容器镜像;同时快速构建拟真的测试环境,自动部署进行应用测试,保证测试效果。测试验证后的镜像一键发布到生产环境,并且支持快速回滚,大大降低了发布的风险。

四、海量高并发突发业务应用

互联网应用都会面临突发性高并发流量的挑战,例如节日促销活动,当天的流量是平日的十倍,在高峰期短时间会达到数十倍。该平台通过数人云容器服务,实现抢购业务应用容器化部署;当抢购流量峰值到来,能够在数秒快速扩展计算资源,秒级部署新的应用实例,快速扩容进行消峰。

客户收益

数人云为该系统提供了 PaaS 平台技术支撑,在原有容器云产品的基础上与 OpenStack 进行了深入集成,提供了完整的云环境治理管控平台能力,在一个系统界面下就可以完成所有操作,不仅提高了该企业的IT管理运维能力,也提升了其信息化项目交付的自动化、标准化水平。