首页 存档 技术 查看内容

运维自动化之殇|高效运维最佳实践05

2018-3-30 13:00 |来自: 互联网 454 0

摘要: 本文是互联网专栏《高效运维最佳实践》的第05篇文字,由萧田国原创并授权“高效运维”公众号转发。本文未经作者授权,谢绝转载。 前言 这些年来,大家都在谈运维自动化。但是否也会困惑于“只见树木、不见森林”?或 ...

本文是互联网专栏《高效运维最佳实践》的第05篇文字,由萧田国原创并授权“高效运维”公众号转发。本文未经作者授权,谢绝转载。

前言

这些年来,大家都在谈运维自动化。但是否也会困惑于“只见树木、不见森林”?或者说,做了几年的运维自动化,但依然不能确定还有哪些工作没做?还有,怎样更优雅的实施运维自动化?

另外,运维自动化是万能的么?有哪些潜在问题?想了解5月底某网站大故障的独家剖析?且听本文分解~

本文实际上包括两部分,关于运维自动化的一些观点(前3部分)和运维自动化的痛点(第4部分)。如果已是运维自动化的专业人士,可以跳过前面内容,直接鉴赏第4部分运维自动化之殇。

依惯例放上目录,请享用:

  1. 什么是运维自动化?

  2. 运维自动化的三个阶段

  3. 怎么做运维自动化?

  4. 运维自动化之殇

好吧我们正式开始。

1. 什么是运维自动化?

有人从实用性的角度来表述运维自动化,就是把运维日常需要登录机器的操作,完全Web化,以后只需要点一下鼠标就搞定。然后,和监控结合,就有自动扩缩容,自动告警分析,自动故障发现,自动流量切换。

这种说法正确么?实际上,Web化只是最基础的工作(而且这更多是运维自助化),我们不能将Web化和运维自动化画上等号。

在了解运维自动化之前,让我们回到起点,先看看什么是运维。运维应包括如下:

环境定义:开发环境、测试环境、类生产环境、生产环境等;

部署:能够将部署包有效的部署到不同的环境;

监控:能够监控部署后的系统和应用;

告警响应:出现问题时的响应和处理机制;

性能优化:系统各个服务如Nginx、Java、PHP、DB或网络等的优化

SLA保障:通常要和业务相关部门讨论确定

所以,运维自动化,应该包括上述这些内容。我们结合起来,略举几例:

1)环境定义自动化

很多公司采用的是数据中心 虚拟机,团队需要某种环境的时候,必须要走流程申请,申请就意味着和不同部门打交道,挨个部门进行层层审批,很浪费时间。

所以环境/基础设施能否自动化很重要,负责开发、管理基础设施的部门,一定要提供方便的接口,帮助其他团队能自动创建资源。

2)部署自动化

这部分的进化过程大抵如此:Scripts -

声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部