测试经理
互联网
产品设计
分布式系统
工程师
创新
分布式
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

拥抱混沌工程 – 让你的系统在历练中茁壮成长

工程效率部

邹晟,去哪儿网工程效率高级工程师,主要负责 CI/CD 整个工具链的维护与流程优化,确保一线的开发和测试人员可以快速和可靠的交付需求。 有着近10年工作经验,曾经在索尼爱立信和IGT 等外企从事CI/CD相关工作,近3年一直从事 devops 领域相关工作,对一线工程师工作上遇到的各种工具、流程、效率方面的问题有着深刻的理解和丰富的经验。近期一直致力于落地和推广混沌工程理念来帮助业务线实现服务架构的高可用。

王天庆,前去哪儿网工程效率系统架构师,主要负责公司环境治理的产品规划,系统设计、实现、落地以及推广工作,推动公司Devops文化落地,帮助一线研发人员或者测试人员快速可靠的实现需求的交付。有着近10年的工作经验,从2014年一直从事devops相关领域工作,对Devops从0到1的建设有非常深入的理解,对于持续集成、服务治理、监控告警等领域都有较深入理解,并且是云原生的坚实拥护者。

邹晟,去哪儿网工程效率高级工程师,主要负责 CI/CD 整个工具链的维护与流程优化,确保一线的开发和测试人员可以快速和可靠的交付需求。 有着近10年工作经验,曾经在索尼爱立信和IGT 等外企从事CI/CD相关工作,近3年一直从事 devops 领域相关工作,对一线工程师工作上遇到的各种工具、流程、效率方面的问题有着深刻的理解和丰富的经验。近期一直致力于落地和推广混沌工程理念来帮助业务线实现服务架构的高可用。 王天庆,前去哪儿网工程效率系统架构师,主要负责公司环境治理的产品规划,系统设计、实现、落地以及推广工作,推动公司Devops文化落地,帮助一线研发人员或者测试人员快速可靠的实现需求的交付。有着近10年的工作经验,从2014年一直从事devops相关领域工作,对Devops从0到1的建设有非常深入的理解,对于持续集成、服务治理、监控告警等领域都有较深入理解,并且是云原生的坚实拥护者。

课程费用

5800.00 /人

课程时长

3小时

成为教练

课程简介

故障演练在这2年已然成为了各个公司都在探索的工程实践,它是一个遵循混沌工程实验原理并通过注入常见的故障场景来提升当前分布式系统的容错性的有效方式。混沌工程最早是由 Netflix 提出的,他们为了解决服务不稳定的问题创新性地引入了 ChaosMonkey,通过随机的给自己的服务制造混乱,从而促进工程师们在开发设计系统的时候就要考虑到服务的稳定性,这也逐渐成为了整个公司的工程师文化。后来,各大巨头google、 facebook、aws 、microsoft 也都采用了同样的方法来保障服务的稳定性。

历史总是惊人的相似,今天国内的互联网系统越来越复杂,很多公司也遇到了当初 Netflix 遇到的问题,因此故障演练开始进入大家的视线。本次工作坊旨在给大家讲解混沌工程理论与落地的经验。并通过此次工作坊,让大家可以设计出适合自己业务场景的故障演练平台,并切实的解决系统稳定性问题。

工作坊大纲:
一. 混沌工程介绍
1. 背景
2. 核心原则
3. 价值

二. 业内大厂是如何落地混沌工程的
1. 案例 - Netflix
2. 案例 - 阿里
3. 案例 - 携程

三. 我们是如何落地混沌工程的
1.流程设计
2.产品设计
2.1 故障画像分析
2.2 故障场景设计
2.3 故障预案设计
2.4 应用稳态指标设计
2.5 监控告警设计
2.6 演练范围设计
2.7 演练断路器设计
2.8 演练报告设计

3. 技术架构

4. 演练实战

四. 如何根据自己的场景落地混沌工程




目标收益

1. 了解混沌工程的背景、原理与价值
2. 了解业界大厂的混沌工程实践
3. 可以设计出适合自己的故障演练平台,并切实地提高线上系统的稳定性

培训对象

课程大纲


活动详情

提交需求