运维变更难点分析和应对方式

提兵百万西湖上,立马吴山第一峰!这篇文章主要讲述运维变更难点分析和应对方式相关的知识,希望能为你提供帮助。
什么是变更?SRE对软件运行环境负责,这个过程中包括大量的资源的部署与配置,这些变更通常对应一定的风险
开发对代码质量和功能负责,这个过程中存在无数次的迭代,每一次的迭代都有能产生一定的未知风
【运维变更难点分析和应对方式】需要解决什么问题:

  • 我们需要一个能够清晰查看到当前已经发生的所有生产级变更事件,以便故障发生时,第一时间查看
  • 需要对核心配置变更梳理一个可落地的流程,将重大变更尽可能的规范化、自动化,拒绝人工操作
  • 需要对变更增加审核确认操作,一是允许此次变更的自动执行,二是变更事件触达团队成员 解决方案有哪些?
  • 主动上报变更?:由变更人主动发起,提交变更相关表单信息
    运维变更难点分析和应对方式

    文章图片

    缺点:半自动化,需要人为主动提交
  • 实现变更管理系统?:由变更管理系统做变更动作收拢,可以理解为所有的操作,将通过一个平台来进行
    运维变更难点分析和应对方式

    文章图片

    缺点:技术实现难度高,需要实现发布、修改配置等所有高危操作逻辑
  • 主动推动变更?:由各系统打点至统一存储
    运维变更难点分析和应对方式

    文章图片

    缺点:侵入性高,各个系统需要植入打点逻辑 我们如何选择的?

    推荐阅读