3.SRE.操作手册(基础篇)

SRE的根基起码应该包括:SLO、监控、告警、减少琐事和简单化。 SLO(服务质量目标):用于描述服务可靠性的程度。 SRE的职责并不只是将“所有工作”都自动化,并保持“on-call”状态。 一.入门 系统成熟度级别划分: 1.一个处于开发中的绿地应用,目前还没做过任何生产部署。 2.一个生产系统

    推荐阅读