如何做好今天的运维

华明 2023年3月23日

近年来很多声音讨论运维岗是不是会被替代的问题。

但随着ChatGPT的出现和更多大模型的发布,似乎每个岗位都应该考虑下自己被替代的问题了。

无论未来如何变化,现实是今天的我们仍然需要做好自己的工作,站好自己的岗。今天我将分享我所认为的优秀运维和架构师应该是怎样的。最后是关于运维将给人工智能时代带来哪些价值的些许思考。

运维和研发架构师一样,通常是从整体来维护和掌握业务的架构。但同一个工作的深度实在是良莠不齐,差距在哪里呢?


要做好一个优秀的运维或架构师,所需要的素质和能力有很多,但尤其重要的一点是对自己所负责系统和业务的了解深度!

运维和架构师工作的本质是让这个业务稳定高效的运行,而要达到这个目的的前提就是对所负责的业务了如指掌。

对一个业务和系统的了解包括:

* 对业务要产生的用户价值的了解
* 对业务系统中整个业务流程是如何运转的了解
* 对业务系统中各个核心功能的了解
* 对支撑这些核心功能运行的服务模块和组件的了解
* 对线上服务部署架构的了解
* 对线上服务的基础设施和资源的了解,物理机/服务器/容器/公有云。。

以及基于这些信息能够做出的监控、预案等技术方案。哪些监控是重要的,哪些预案是必要的,出现故障时可以舍弃哪些功能,优先恢复哪些模块,业务继续发展线上和架构上的瓶颈会在哪里?等等。

上面这个层次也许不全,但大致是这样。大多数运维或研发入职后就像一颗螺丝钉一样被放置在自己的岗位上,运维最先接触的东西可能是底层的这部分,而后有些人能往上走,很多人一直在底层徘徊。

当大多数运维同学被问及自己的核心竞争力时,往往迷茫,但如果你掌握了上面的整个业务知识体系,你的岗位实际已经离不开你。

十几年前我入行互联网运维的时候,非常不理解研发写了一个系统运行在线上,而且不是开源的,然后我需要费老大劲去了解这个专用系统,这对我来说意义有多大?但我发现周围较我更早入行的运维老手,个个都对自己负责的系统十分熟悉,甚至细化到线上模块一个配置项的含义。

后来我入职时的导师,在给部门的同学做晋升答辩分享时,开篇时说了一句话,大致是:首先把自己负责的业务介绍一遍。

这一句话让我突然意识到自己的工作似乎有所不足。是的,这就是问题,你的工作职责是负责维护好一个系统,但你却并不了解它,严格讲这是不称职的,职级越高越是如此。

所以要做一个优秀的运维和架构师,首先要夯实上面每一层的能力和信息。

但话说回来,现在的运维为什么已经不像之前的运维那样能够深入服务和业务了呢?


原因主要有几点:

  1. 互联网和IT系统的业务变得越来越复杂
  2. 微服务和高速的迭代进一步加剧了系统的复杂度和掌握的难度
  3. 服务梳理后沉淀的文档发挥的价值范围和时间都很有限
  4. 面对复杂的业务,缺少好的方法来建设一套合理的运维体系


如今,云原生、微服务等等技术让业务系统获得了巨大的进步,有没有方法和产品能让运维和架构师掌握业务系统的能力也获得进步呢?


这就是我们团队在致力解决的问题。我们希望实现一个结合了方法论和最佳实践的产品,并希望这个产品能够沉淀经验,越用越有价值,让运维和架构师通过这个产品能够轻松的掌握和理解自己的系统。

对详情感兴趣欢迎了解 => Flashcat

回到如今已无可回避的人工智能问题上,人工智能会不会颠覆一切,让如今的工作都变得没有意义?


就如今的人工智能技术而言,人工智能需要有价值的数据输入才能获得有价值的输出。

而我们现阶段的工作是在构建业务系统数据的意义和价值,未来这些数据将成为人工智能真正进入运维领域的基础。相信在人工智能普及的将来,我们今天为运维工作所做的努力仍然具备很高的价值。

如果你对我们的工作方向也感兴趣,欢迎交流合作。

开源版
Flashcat
Flashduty