【AIOps】智能运维平台功能之配置管理_AI.人工智能讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  AI.人工智能讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 91 | 回复: 0   主题: 【AIOps】智能运维平台功能之配置管理        上一篇   下一篇 
huang.wang
高级会员
等级:中将
经验:17255
发帖:397
精华:1
注册:1970-1-1
状态:在线
发送短消息息给huang.wang 加好友    发送短消息息给huang.wang 发消息
发表于: IP:您无权察看 2019-10-8 16:15:42 | [全部帖] [楼主帖] 楼主


image.png

在前面的两篇文章中,我们分别讲解了智能运维平台的监控管理功能以及平台的AI实现,今天文章的主角,则是智能运维平台另一重要功能——配置管理功能。

在运维领域,相信绝大多数从业人员对于配置管理数据库(CMDB)这个概念并不陌生,哪怕没有具体了解过也一定有所耳闻,因为无论是ITIL在企业落地、自动化运维还是如今炙手可热的智能运维(AIOps),都绕不开CMDB这个概念。甚至有人认为,CMDB是智能化运维平台的基石,足以见得CMDB的分量和重要性。

在实际的项目中,CMDB常常被认为是构建其它ITIL流程的基础而优先考虑,是否成功建立CMDB关乎着ITIL项目的成败。

在项目建设过程中,70%~80%的IT相关问题与环境的变更有着直接的关系。而实施变更管理的难点和重点并不是工具,而是流程——通过一个自动化的、可重复的流程管理变更,使得当变更发生的时候,有一个标准化的流程去执行,能够预测到这个变更对整个系统管理产生的影响,并对这些影响进行评估和控制。而变更管理流程自动化的实现关键就是CMDB,其关键度可见一斑。

本篇文章,将分别讲解CMDB的概念与作用、CMDB的应用历史与落地状态,最后从概念出发落实到具体功能,结合具体应用场景,抛砖引玉,简单讲解一下智能运维平台的配置管理功能。


CMDB的概念与作用

CMDB的概念

在讲解CMDB的理论概念之前,我们首先以一个实际生活中的小例子为引,来帮助理解CMDB的作用——一个人经营了一家店铺,在经营前期由于店铺规模较小,货物种类和货物数量都不多,平时只需要简单的进行记录与清点即可完成店铺的管理工作;但随着经营过程中店铺的规模逐渐增大,原本一排货架逐渐扩增到二十排,此时原有的管理方法虽然依旧可以完成店铺的管理,但是会耗费大量的时间与精力;随着经营规模的持续扩增,店铺变成了连锁商店,需要管理的货物的范围、种类和数量也越来越多,此时,简单的记录与清点已经满足不了当下的管理需求,在这种情况下,店主要求每一位雇员把所负责的区域的具体情况(包括销售状况、货物种类、货物存量等)汇总给他,并注明各区域的具体负责人,接下来他只需要根据这些反馈信息就能做具体决策,以达到更加便捷更高效地管理店铺的目的。

上文例子中店主对于连锁店的管理思想映射到运维领域,与CMDB的核心思想有异曲同工之妙。

image.png

在运维工作中,当一个业务系统处于初级阶段时,一般规模较小,通常只由少量的机器组成,运维人员日常工作场景也比较简单,只需要关注机器运行状态、网络是否畅通以及服务是否存活等基础问题;但随着业务的持续发展以及业务规模的不断提升,运维场景也变得越来越复杂,运维人员所面临的问题变成了部署变更过程中需要分级发布、监控管理需要多维度业务监控、业务需要容量规划、故障止损和诊断等问题。在如此大规模设备和服务运维的场景下,利用CMDB可以对各类运维资源进行高效的组织管理,以达到提升运维效率的目的。

CMDB,全称是Configuration Management Database,即配置管理数据库,负责存储与管理企业IT架构中设备的各种配置信息,通过识别、控制、维护,检查企业的IT资源,从而高效控制与管理不断变化的IT基础架构与IT服务,并为其它流程,例如事故管理、问题管理、变更管理、发布管理等流程提供准确的配置信息。CMDB与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。

通俗点说,CMDB可以存储并自动发现整个IT网络上的各种信息,包括一个IT网络上有多少台服务器、多少存储、设备的品牌、资产编号、维护人员、所属部门、服务器上运营什么操作系统、操作系统的版本、操作系统上有哪些应用、每个应用的版本等等;此外,CMDB还有一个非常重要的功能,即存储不同资源之间的依赖关系,这一功能的意义在于,如果网络上某个节点出现问题,则可以通过CMDB判断因此节点受到影响的业务。


CMDB的作用

随着如今IT技术的不断进步与发展,企业的IT环境越来越复杂,在这种大环境下,传统的管理方式显得力不从心。

首先,IT设备数量庞大、品种繁多,很难被统一有效得管理,IT设备的管理困难同时也导致了以这些IT设备为基础的各种IT服务管理的困难;此外,随着企业的发展,其IT环境也需要不断进行变更,因此如何评估某个设备或服务发生的事故或变更所造成的影响,以及如何为其它流程提供IT资源当前准确的配置信息也是企业需要面临的挑战。

CMDB的应用,则给以上难题带来了一个良好的解决方案,在某种程度上甚至可以说,CMDB就是为了解决以下这些问题而诞生的。CMDB的主要功能包括以下几点:

image.png

1、整合设备信息 

CMDB可以将众多IT设备、IT服务以及使用它们的部门与具体工作人员整合在一个完整的库中,将多个数据源合并至一个视图中,并按需求生成相应的报告,这种整合的信息的方式使得有效与高效的管理IT设备与服务成为可能。

2、可视化映射关系

CMDB能够将硬件、软件以及IT服务之间的物理和逻辑关系映射可视化,使得IT人员可以准确了解应用和其他组件之间的依存关系,判断变更影响和帮助解决可能出现的问题。与此同时,IT运维人员通过实时了解其工作对公司或客户业务的影响,对于服务水平的提高也有着很好的促进作用。

3、提供流程支持 

CMDB可以为其它IT运维流程提供准确的IT设备、IT服务的配置信息(包括当前设备或服务发生过的事故、问题、变更、发布等信息),这一功能对服务台和事故管理、问题管理、变更管理、发布管理来说有重要的意义,在这些变更的流程中,可以迅速查询当前设备变更所涉及到IT资源的准确信息,更快找到问题根源,极大的提高流程的运作效率。

4、软件库与硬件库

保证应用到IT环境的软件与硬件均是经过授权与测试,是保证IT环境质量与提供稳定IT服务的前提条件。通过支持DSL(Definitive Software Library,最终软件库)与DHS(Definitive Hardware Store,最终硬件库),以保证在发布管理中使用的软件与硬件均是通过授权与测试的。


CMDB的应用历史与落地现状

CMDB的应用历史

在CMDB概念被正式提出之前,类似的信息库已经被IT部门使用了多年,CMDB这个名词最开始出现应该是在ITIL V2.0中,其中对于配置管理的定义翻译如下:

1、计量组织和服务中所使用的所有IT资产和配置项的价值;

2、为其它服务管理流程提供有关IT基础架构配置的准确信息;

3、为事件管理、问题管理、变更管理和发布管理的运作提供支持;

4、核实有关IT基础架构的配置记录的正确性并纠正发现的错误。

ITIL即IT基础架构库(Information Technology Infrastructure Library,信息技术基础架构库)由英国政府部门CCTA(Central Computing and Telecommunications Agency)在20世纪80年代末制订,现由英国商务部OGC(Office of Government Commerce)负责管理,主要适用于IT服务管理(ITSM)。ITIL的修订为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。

ITIL理论体系的发展大致经历了一下三个阶段:

image.png

ITIL V1——1986~1999。由英国国家计算机和电信局(CCTA)实践开发的,总共有40多卷图书,出来后很快得到了欧洲的认可;

ITIL V2——英国商务部(OGC)在1999年推出来的,得到了世界的认可。OGC把它总结为10本图书;它的发展非常快,到2001年,被接纳为英国国家标准BS15000;2005年,被接纳为国际标准ISO20000;

ITIL V3——到了2007年5月30日颁布了3.0版本,基于服务生命周期与时俱进地融入了IT服务管理领域,是当前的最佳实践。

从ITIL的发展进程可以看出,CMDB概念早在1999年就被提出,但直到近些年才被国内的传统企业与互联网企业的大规模应用。按使用情况来看,CMDB在国内的应用历史大致可以分为如下三个时期。

1、信息滞后的接纳期

由于二十一世纪初期中国的IT进程稍显落后,因为CMDB的概念在1999年提出后经历了一段时间才被中国的IT界知晓并理解。

2、无存在感的蛰伏期

在CMDB刚被提出甚至被提出后的很长一段时间,国内企业对CMDB的需求并不强烈,CMDB处于一个看似高大上但实际需求并不明显的蛰伏期。

对于传统企业来说,当时大部分企业要么IT规模和复杂度有限,要么即便IT规模很大但是环境迭代十分缓慢,使用传统的“文档+人肉”的管理方式就足以应对,企业IT环境管理也没有多少痛楚;而对于互联网企业来说,彼时的互联网公司普遍处于成长过程中,还没有形成自己特有的配置管理方法论,更谈不上理念和技术输出。

3、需求旺盛的使用期

随着中国企业IT规模和复杂性的迅速增长,以及业务更新迭代的频率加快,传统的“文档+人肉”的管理方式难以与IT规模的增长速度相匹配,此时对于IT运维的标准化、统一化和自动化需求尤为明显,于是众大厂商纷纷寻找技术解决方案。此时,一直处于蛰伏期的CMDB终于等到了发光发热的时刻,迎来了需求旺盛的使用期。


CMDB在不同企业模式下的落地状况

由于传统企业与互联网企业发展模式的不同,在实践过程中,CMDB在这两种企业落地的方式和面目也不尽相同。

对于传统企业来说,CMDB落地多是与ITIL理念结合,作为ITIL中的一部分构建和部署。

但由于ITIL的笨重、庞大与臃肿,真正把ITIL用得好的企业很少,导致CMDB后来在传统企业中往往沦为了纯粹的静态资产管理和数据查询,而且这种静态资产往往还是失真的和混乱的,隔段时间需要重新梳理或者通过上一套新的系统来重建,导致下层运维苦不堪言。同时,CMDB这个概念在刚刚推出的时候,由于过于宽泛和模糊,难以被企业理解,即便有些企业理解了,在落地和使用之间还是存在很大的差距。

CMD在传统企业的落地直到BMC等传统软件巨头在自家的ITIL相关产品中推出CMDB管理的产品和解决方案后,才逐渐开始真正被使用。

相比于传统企业,互联网公司则要务实的多,对于CMDB的使用效果也更好。

在互联网公司,CMDB更多的是以应用发布、变更和管理为目的创建的——将与某个应用相关的从上层的进程、服务到底层的服务器、网络等配置悉数纳管,真正将CMDB的数据用起来;并且由于与应用管理流程打通,基本可以确保数据的质量。

当然,CMDB在互联网公司的落地也是并非一帆风顺,并且由于互联网公司并不特别看重ITIL这种重流程的模式,因此CMDB早期在每家互联网企业中的使用注定是个性化的、很难具备通用性,更谈不上技术输出。经过重重演进和互联网界内部的反复交流和重新定义,CMDB在近几年才逐渐形成大致统一的范式和标准。

智能运维平台的配置管理功能 

经过前文对CMDB概念、作用以及发展历史的介绍,相信大家对CMDB已经有了一定的了解。下面,通过具体应用场景中对配置管理功能的需求,结合联动北方智能运维平台的实际功能模块,来具体讲智能解运维平台的配置管理功能。

场景一:在设备的日常运维中,工程师需要面对很多的IT资源——有物理资源如机房、网络设备、安全设备、物理服务器等;也有数字资源如操作系统、中间件、数据库、云平台、IP等。在实际运行过程中,任何一个IT资源出现故障,都可能导致业务无法正常运行。因此需要找到统一管理这些IT资源的方法,以理清这些资源间的关联关系以这些资源对于彼此的影响。

场景二:当运维工程师从业务线或产品线的角度去查看某个业务线/产品线有多少个应用系统、哪些是核心的应用系统,这些应用系统是不是部署那些主机上,是否存在单点问题,资源是否合理分布等。在一般的运维过程中,每个应用系统的信息都存在,但这些关键信息可能都是散乱的,比如用物理机部署的可能在某一个工具上维护,用云主机部署的却是在云平台上进行维护,给整体的分析带来了不便,使得无法从更高的业务角度来判断和分析资源情况。

CMDB的应用可以很好的解决这些问题,以提高运维的效率,从而达到智能运维的目的。

落实到具体功能,为了解决以上场景中遇到的问题,联动北方智能运维平台的配置管理功能提供了模型管理、资源管理、连接管理与指标管理四个子功能,用户可以对通过这些功能更好地管理运维对象(资源、连结、指标等);同时针对不同企业的不同需求,联动北方智能运维平台在各子功能中也开放了自定义功能,使用起来更加灵活便捷。

1、模型管理

模型的主要功能是定义资源对象,通过模型把需要管理的IT资源进行定义,描述IT资源的各种信息属性,以便用户能快速、清楚的了解资源情况。

联动北方智能运维平台采用了两层的模型结构,第一层是大类,按照传统分成了业务应用、中间件、数据库、操作系统、主机硬件、网络设备、SAN交换机、磁盘阵列八类;第二层是大类下的产品细分,比如数据库可分为Oracle、MySQL、SQLServer等,所谓的模型管理,主要针对第二层进行自定义和维护,其主要内容要维护资源模型的属性和关系。

 image.png

运维平台已经预置了常用的资源模型以便用户使用,同时针对用户的个性化需求,也支持用户根据需要自由地创建新的模型以及模型属性。对于已有的模型,也支持对模型的新增、编辑、修改和删除,以及建立或删除与其它模型的关系。

此外,系统还提供模型拓扑功能,以树形的拓扑图的形式展示各资源模型间的关联关系。

 image.png

使用拓扑图形式的好处在于,能够以可视化的形式展示IT资源、部门、人员之间的关联关系,并且可通过在拓扑图上直接拖拽实现关联关系的定义与维护,直观、便捷的对模型之间的关联关系进行展现和管理。


2、资源管理

运维对象包括系统中的各种软硬件资源,资源管理是对这些运维对象进行的各种管理操作。主要功能包括创建资源、编辑资源、删除资源、维护资源实例关系等。

运维平台支持根据模型创建资源,同时也支持批量导入、导出资源、添加资源、查看和编辑资源、提供集成的自动更新资源信息工具等。 

以Tomcat为例,完成新建模型后,通过点击资源列表界面中的资源名称,即可进入资源详情界面。同时还支持资源属性的编辑和查看、资源关系的查看和具体化(添加资源间关系),也可以选择实例拓扑图以查看资源间的拓扑关系,如下图所示,直观地展示资源间的关系

image.png


3、连接管理

连接管理实现对连接数据的管理,方便连接的复用,在巡检项管理中可以选择可用连接,同时运维平台也支持连接导出导入、新建、编辑、删除等操作。

当用户使用连接导入功能时,平台提供了CSV模板,用户可参考模板调整和规范导入文件;对于已有的连接,系统会智能忽略,防止冗余信息的干扰,保证工作的流畅性。

image.png


4、指标管理

指标管理模块主要功能是建立一个标准指标库,包含各种运维指标的录入,用于工具管理的采集数据与标准指标一一对应,也可在报表展示过程中可以用标准指标展现。如图所示,可以点击标注指标项,填写基本信息,也可以通过导入指标的方式,批量导入。

 image.png

指标管理将所有CMDB管理对象的属性指标进行统一分类管理,定义CMDB资源对象的指标属性,指标属性范围包括CMDB中的主机、数据库、中间件、网络设备、业务系统、存储虚拟化设备。指标管理的意义在于能够为后续的监控管理提供基础的指标参数,指标是作业数据采集与告警规则设定的唯一标识。


配置管理功能作为运维平台最重要的功能之一,涵盖了整个运维项目的软硬件运行状态与连接关系,将运维资源统一管理起来,也为平台的其他功能提供了分析基础;同时,CMDB的构建也处于一个不断迭代的过程,配置管理功能也会随着不同时代的要求不断改进与拓展,相信以后会在智能运维中发挥更大的价值。


该贴被huang.wang编辑于2019-10-9 9:57:22


我超级酷,但是如果你回复我的话我可以不酷那么一小会儿。


——来自logo.png


赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论