摘要:在自动化运维还不普及的时候,运维人员更多的运用手动的方式完成运维工作,这种方式耗时长,效率低。由此,如何合理发挥人工智能技术辅助运维人员进行故障管理工作逐步成为了业界关注的焦点。阿里巴巴的GOC团队通过研究并使用AIOps系统到运维业务场景中的方式,积累了大量的智能运营的方法论和技术体系。 2009年,在自动化运维还不普及的时候,运维人员更多的运用手动方式完成运维工作,这种方式耗时长,效率较低。例如:运行业务的服务器有板卡故障时,运维人员往往需要将位于故障服务器上游及下游的服务器中对故障服务器的流量从配置文件中摘掉,再将出现故障的