作者:莫源
前言
中华财险是国内互联网金融行业的领导者,在企业云原生上云的过程中,完成了大量多租SaaS化业务的微服务化和容器化。其业务具有非常典型的金融属性,对架构稳定性、资源成本效率、数据安全等方面都提出了更高的要求和挑战,需要在实现降本增效的同时兼顾业务稳定性。在迁移的过程中,遇到了多租业务清算成本难、闲置/浪费资源发现难、优化策略与业务稳定性平衡难等挑战。中华财险工程师团队基于阿里云企业云原生IT成本治理方案沉淀了一套成熟的IT企业成本治理流程与系统,通过开箱即用的业务成本拆分、闲置资源可视化发现、弹性伸缩与混部等优化策略,将集群的闲置资源率从上云前的30%优化到10%以内。
中华财险的上云IT成本治理工作也荣获信通院2022年度云管和云网优秀案例:https://mp.weixin.qq.com/s/XB...
中华财险的云原生之路
云原生上云是目前企业上云的最佳路径,中华财险作为国内互联网金融行业的领导者也在驱动业务通过微服务化、云原生化的方式实现数字化转型。在云原生上云之前,中华财险的业务存在如下问题:
- 业务资源的管理权限分散在各个团队,生产环境和测试环境下沉在业务团队,业务团队为临时验证的版本冗余了大量的资源。
- 部分业务有明显的周期性,峰谷容量相差较大,造成资源低负载运行时间较长。
- 压测环境单位时间内需要大量的临时机器,复用闲置资源需要腾挪机器、协调跨团队资源,流程和成本较高。
- 缺少可量化的指标发现业务的浪费,单纯的利用率指标不能作为浪费的评判标准。
下面是一些优化过程中的关键路径:
- 通过命名空间进行多租业务的逻辑管理、财资拆分、浪费衡量
文章图片
【企业云原生IT成本治理案例解析 - 中华财险云原生上云IT成本治理之路】通过ACK成本分析发现集群浪费情况以及各应用成本分布
- 全量路压测进行容量预估与可靠性验证
- 建立成本浪费的衡量标准,发现浪费情况
文章图片
通过 ACK 成本分析发现集群应用的浪费情况
- 分时混部在线业务与临时业务错峰使用
- 定时伸缩实现核心业务资源预供给
- 闲置资源回收与业务弹性交付
中华财险基础设施团队一路走来,经历了线上生产业务从传统IT架构到上云、上云原生的过程,在这个云原生化的过程中,中华财险的业务量也翻了数倍。经过云成本优化的一系列措施,某业务容器化后总降低配置:232C 400G ,节省约7台 32C 64G 的ECS的云计算资源,降低了约20%的服务器成本。在进行了混部、业务高峰低谷的弹性伸缩等优化后,平均成本优化率可达约15%。
最后 从某种角度而言,中华财险基础设施团队的架构优化策略是非常朴素和实用的,通过数字化、模型化、可视化企业IT成本,用数据指导和优化IT成本治理,将集群的闲置资源率从上云前的30%优化到10%以内。企业IT成本治理向来不是新技术的试验场,选择合适自身情况的方案,用数据量化结果,有理有据地驱动企业降本增效。
相关文章:
《阿里云首家通过《可信云·云成本优化工具能力要求》评估,云原生企业 IT 成本治理方案助力企业 FinOps