数人云@微软新视界 探讨SRE在DevOps中的最佳实践

过去的一年中,很多企业和组织都正在或者计划采用DevOps的方式优化软件开发的流程,除了利用持续测试机制覆盖整个应用生命周期之外,很多的企业都开始通过类似的方式推动自身业务部署与运营。

1月14日,数人云CTO肖德时出席微软新视界DevOps专题开发者技术沙龙,并做 《SRE-DevOps在运维领域的具体实践》主题演讲,分享了SRE在运维领域的DevOps最佳实践。

SRE 是Site Reliability Engineer的简称,它源于国外互联网企业的是在运维模式上的全新探索,也是 DevOps 思想在运维方面的真正实践。

DevOps现在是国内外都非常热的一个概念,很多人狭窄地理解为DevOps就是让研发部门去做运维的事,或者运维部门做研发的事情。但实际上DevOps的思想更多是要把整个开发流程的界限打通,产品深入到研发的内部,研发可以把信息快速反馈给产品,开发和运维或者QA和运维之间的界限也需要打通,形成“开发团队与运营团队之间更具协作性、更高效的关系”。

肖德时指出,国外互联网企业将运维的角色职能扩展为SRE,也就是用软件工程师的方法和手段,来解决运维的难题。实际上SRE试图平衡服务不可用以及产品快速创新、提高运维效率之间的风险,因此SRE是要保证用户满意度,平衡各方面因素,包括功能、服务以及性能。可以说SRE就是DevOps的思想在开发和运维之间的一个平衡。

肖德时同时表示,SRE在运维实践上的一个亮点是构建平台化的服务体系。数人云最轻量级PaaS平台借鉴国外SRE的实践经验支持DevOps落地,该平台以调度器为核心,通过调度器实现应用的全生命周期管理,帮助企业管理海量监控、日志等产生的各类数据,自动分配应用资源、对业务运行状况进行自动分析。

目前,国内很多公司都在关注SRE如何在早期,中期,以及长期为项目提供持续性支持。数人云将通过持续传播SRE核心理念,打造助力企业DevOps落地的最轻量级PaaS平台,帮助提升企业IT工业化程度。

关于数人云

数人云创始团队来自谷歌、红帽和惠普,作为领先的云计算创新技术实践者,数人云致力于帮助传统企业提升IT对业务的支撑能力,帮助客户统一管理资源和应用,加速应用交付、提升运维效率,建设新一代基于云计算技术的IT架构体系。数人云重点聚焦于打造基于容器的最轻量级PaaS平台,在实现应用全生命周期管理的同时,管理海量监控、日志等产生的各类数据,自动分配应用资源、对业务运行状况进行自动分析,提升企业的IT工业化程度,构建灵动新IT。