课程简介
在“自动化运维”里,通过最真实的案例总结出传统企业、互联网企业的痛点,实现方法,提炼出一套自有的思想模型。依托于这个模型利用流行的最适合自己的工具搭建自有架构;通过不断地演变,再结合企业实践涵盖了主流的工具、结合方法、实践方法、架构方案以及未来的方向。
本门课程涉及到的主要工具:zabbix/open-falcon/InfluxDB/Grafana等
目标收益
1、最佳案例实践:课程实例讲解来自于真实项目,不同企业不同的实践方向,让你豁然开朗。
2、工具选型与砌积木:从几百个流行的工具中挑出出最适合自己企业的工具,指点每个工具的优缺点,使用方法,让你使用起来游刃有余。
3、人工智能的应用:如何利用人工智能辅助运维?帮助我们大幅度减少报警,减少运维工作量。
4、企业案例剖析:学员根据企业现状,结合课程内容模拟一场实战演练。
培训对象
高级程序员、系统架构师、系统管理员、运维工程师、运维架构师、项目经理以及其他具有与运维相关的人员。
课程大纲
第一章:新思维模式 面对传统运维的转换,新时代下,应该有什么样的思考?做为运维老兵如何做思维的快速转变,做为运维新兵应该如何发展。企业在面临DevOps挑战时,该如何应对。本章节主要针对如上问题进行展开。 |
1、传维运维与云时代下的运维差异 1.1 传统运维的挑战 1.2 进入云时代的变化 2、DevOps概念讲解 2.1 什么是DevOps 2.2 为什么要DevOps 2.3 建设DevOps的五个关键点 3、运维学习路线 4、未来的发展方向 |
第二章:自动化运维架构建设思路 系统性了解自动化运维架构,大型互联网公司在建设自动化运维架构的思路。 剖析各大互联网运维架构建设步骤,人员架构组织,根据自己公司的特性,摸索适合自己的发展方向。 |
1、案例解析互联网运维架构剖析 1.1 某互联网社交公司 1.2 某电商公司 1.3 某搜索公司 2、自动化运维架构与业务特点 2.1 详细讲解架构特点 2.2 架构逐步构建思路 2.3 业务特点与架构耦合思路 3、典型的三层架构模式讲解 3.1 三层架构模式的通用性 3.2 如何快速构建模型 4、混和云模式下的管理思路 4.1 云时代下的底层建设 4.2 如何利用云服务构建 |
第三章:工具选型之路 目前开源的运维工具非常之多,如何挑选一门适合公司业务特点、以及主流的发展趋势变得尤为重点,避免个人及企业少走许多弯路;本章节将结合在各大公司实战经验以及业界发展逐步分析工具的特征与挑选方法。 |
1、工具选型思路概览 2、CMDB 管理工具挑选 2.1 CMDB基础概念 2.2 开源VS自建 3、CMDB 自建思路讲解 3.1 CMDB如何实现 3.2 案例解析 4、持续集成/持续部署工具 4.1 什么是持续集成(jenkins) 4.2 持续集成的前提 4.3 持续交付流水线的搭建 4.4 开源部署平台(ansible) 5、持续发布工具 6、分布式监控工具(zabbix/open-falcon) 6.1 监控平台架构 6.2 案例解析 7、大数据平台建设(elk/spark) 8、主流其它实用工具(InfluxDB/Grafana) |
第四章:企业案例剖析 大型互联网与传统企业分别是如何逐步建立起自动化运维体系的?结合多家公司不同业务,覆盖互联网、传统企业的一线实践经验亲身经历给大家剖析案例的精髓。 |
1、案例解析:某社交公司 1.1 遇到的问题:快速扩张、快速迭代 1.2 解决思路 1.3 工程实践 2、案例解析:某游戏公司 2.1 遇到的问题:监控系统问题较大,整体运维体系无法形成闭环; 2.2 解决思路 2.3 工程实践 |
第五章:AIOps 业界提得最多的AIOps在公司是否有落地的方案?如何选择切入点,如何将新技术引入至工作当中,从而改变工作状态。大型互联网企业一线经验:从机器学习至AIOps,从基础概念至落地的实践。 |
1、机器学习基本概念 1.1 机器学习及相关概念精讲 1.2 为什么运维要学习机器学习 2、什么是AIOps 2.1 几种运维需要的核心算法:归因分析、Granger... 2.2 核心算法如何落地在运维体系里 3、AIOps 的落地实践 3.1 报警异常收敛 3.2 报警信息关联分析 3.3 磁盘故障预测 3.4 业务关联信息分析 |
第六章:实践 动手做一遍好比听一百遍,听完课,马上结合公司的特点,进行分组讨论,制定目标,快速落地。 |
本部分为分组动手练习: 1、分析目前系统的现状、找到问题; 2、确定要实现的目标; 3、行成解决方案 4、落地实践的具体步骤 5、各小组分享自己的方案 6、讲师点评 |
第一章:新思维模式 面对传统运维的转换,新时代下,应该有什么样的思考?做为运维老兵如何做思维的快速转变,做为运维新兵应该如何发展。企业在面临DevOps挑战时,该如何应对。本章节主要针对如上问题进行展开。 1、传维运维与云时代下的运维差异 1.1 传统运维的挑战 1.2 进入云时代的变化 2、DevOps概念讲解 2.1 什么是DevOps 2.2 为什么要DevOps 2.3 建设DevOps的五个关键点 3、运维学习路线 4、未来的发展方向 |
第二章:自动化运维架构建设思路 系统性了解自动化运维架构,大型互联网公司在建设自动化运维架构的思路。 剖析各大互联网运维架构建设步骤,人员架构组织,根据自己公司的特性,摸索适合自己的发展方向。 1、案例解析互联网运维架构剖析 1.1 某互联网社交公司 1.2 某电商公司 1.3 某搜索公司 2、自动化运维架构与业务特点 2.1 详细讲解架构特点 2.2 架构逐步构建思路 2.3 业务特点与架构耦合思路 3、典型的三层架构模式讲解 3.1 三层架构模式的通用性 3.2 如何快速构建模型 4、混和云模式下的管理思路 4.1 云时代下的底层建设 4.2 如何利用云服务构建 |
第三章:工具选型之路 目前开源的运维工具非常之多,如何挑选一门适合公司业务特点、以及主流的发展趋势变得尤为重点,避免个人及企业少走许多弯路;本章节将结合在各大公司实战经验以及业界发展逐步分析工具的特征与挑选方法。 1、工具选型思路概览 2、CMDB 管理工具挑选 2.1 CMDB基础概念 2.2 开源VS自建 3、CMDB 自建思路讲解 3.1 CMDB如何实现 3.2 案例解析 4、持续集成/持续部署工具 4.1 什么是持续集成(jenkins) 4.2 持续集成的前提 4.3 持续交付流水线的搭建 4.4 开源部署平台(ansible) 5、持续发布工具 6、分布式监控工具(zabbix/open-falcon) 6.1 监控平台架构 6.2 案例解析 7、大数据平台建设(elk/spark) 8、主流其它实用工具(InfluxDB/Grafana) |
第四章:企业案例剖析 大型互联网与传统企业分别是如何逐步建立起自动化运维体系的?结合多家公司不同业务,覆盖互联网、传统企业的一线实践经验亲身经历给大家剖析案例的精髓。 1、案例解析:某社交公司 1.1 遇到的问题:快速扩张、快速迭代 1.2 解决思路 1.3 工程实践 2、案例解析:某游戏公司 2.1 遇到的问题:监控系统问题较大,整体运维体系无法形成闭环; 2.2 解决思路 2.3 工程实践 |
第五章:AIOps 业界提得最多的AIOps在公司是否有落地的方案?如何选择切入点,如何将新技术引入至工作当中,从而改变工作状态。大型互联网企业一线经验:从机器学习至AIOps,从基础概念至落地的实践。 1、机器学习基本概念 1.1 机器学习及相关概念精讲 1.2 为什么运维要学习机器学习 2、什么是AIOps 2.1 几种运维需要的核心算法:归因分析、Granger... 2.2 核心算法如何落地在运维体系里 3、AIOps 的落地实践 3.1 报警异常收敛 3.2 报警信息关联分析 3.3 磁盘故障预测 3.4 业务关联信息分析 |
第六章:实践 动手做一遍好比听一百遍,听完课,马上结合公司的特点,进行分组讨论,制定目标,快速落地。 本部分为分组动手练习: 1、分析目前系统的现状、找到问题; 2、确定要实现的目标; 3、行成解决方案 4、落地实践的具体步骤 5、各小组分享自己的方案 6、讲师点评 |