2024云栖大会笔记

Posted by Shi Hai's Blog on September 20, 2024

云上DevOps自动化的最佳实践

云上成本管理治理流程

成本管理和组织、业务、流程等都有关系,如果有资源的浪费,就会有降配等动作。通过资源的成本分析、成本的异常分析,反向驱动成本降低。
把企业管理和云上管理联系在一起,通过不同维度的识别就可以看到企业的不同情况,通过各个业务单元自治方式实现全企业的管理。企业可能存在多账号,通过标签进行多账号间的管理从而实现不同的策略。
通过资源使用率来管理成本。
标签的设计原则:

  • 集体详尽是指所有的资源对象都须绑定已规划的标签值及其对应的标签值;
  • 有限值原则防止值过多带来的管理难度;
  • 尽量避免对同一属性含义使用两个或以上的标签键;
  • 在规划标签时同时考虑后续工作中增加或者减少标签值的映像。

通过资源标签对不同账号、不同资源进行管理,将成本可以分摊到不同组织下。
资源编排,通过json文件定义就可以完成所有资源的编排,做到基础设施即代码的效果。
借助资源管理Tag+系统运维管理OOS+弹性伸缩ESS+ECS云效助手实现资源持续发布与部署。

系统运维管理(CloudOps Orchestration Service,简称:OOS)

基于资源关系继承标签节省管理成本,比如:使用ECS时还需要关注EIP和磁盘,通过标签就可以实现主资源发生变化,从资源标签就可以进行跟随管理。

简化运维操作,提高自动化能力

用户自定义计划,可以部署在Workbench上可以定时或周期执行。
Workbench和OOS合作通过执行脚本可以实现服务的分批启动也可以实现动态扩缩容,保证实现的灵活性。
通过阿里云的大语言模型,用户可以输入需求,AI助手就很方便的返回结果,另外和Copilot合作提供服务的自助诊断服务。
通过知识运维、Workbench AI助手等帮助客户解决问题。

阿里云上的Iac和自动化

参考文档