relax集成配置

开始支持版本:BMC要求版本6.8.6.12及以上,relax版本要求1.1.2及以上

在管理员页面点击外部系统集成-RELAX集成配置:

输入对应的relax地址,即访问relax的URL,且界面配置后缀一定要加上/rpc

system的密码就是我们刚才在relax修改后的密码,然后点击测试,

注意:如果relax版本为网办relax1.2.3.1/ITSMv2.0 以上版本,且BMC版本低于6.8.7.19,需要在relax侧部署csrf的代理程序,同时在确保信息正确的情况下,可能出现界面测试失败的问题,可以先忽略,后续推送失败根据日志定位问题

然后将需要推送的告警资源选中,并保存:

然后进入指标配置页面

查看告警列表页面是否出现告警

BMC告警推送Relax工单对接

配置BMC

配置BMC后台与Relax对接的"基本信息"

系统管理-系统配置-外部系统集成-RELAX集成配置

在"基本信息"处配置相关信息是否与RELAX集成:打钩;

Relax地址:http://202.117.96.105:9090/relax/rpc(地址端口部分一定要是内网环境)用户名:system(Relax的系统机器人账号)注意:这个是系统自带账号,不允许删除的,如果你的系统中没有账号,请联系后端处理。密码:自定义配置(在Relax系统中修改一次默认密码)
这些信息配置完毕后点击"测试"按钮进行测试,如果显示"测试成功"即配置完毕;如果显示"测试失败",请检查relax地址(去掉"/rpc"后缀在CCS所在服务器打开网页进行登录验证)以及用户名/密码(用户名密码可通过登录Relax系统验证一次)

配置"告警同步设置"

告警级别打钩,根据客户现场需求进行级别选定(严重、主要、次要、告警、未知、信息)

告警类型打钩,根据客户现场需求进行选择(可用性告警、性能预警、配置预警)

选择资源/选择资源组,根据需求进行选择需要进行工单推送的资源/资源组点击保存即可完成配置

配置Relax系统

配置告警资源类型和服务目录对应关系

系统管理-外部接口-BMC告警工单接口

点击"新建"按钮

选择工单对应的所属服务目录"告警资源类型"需要手动去写入BMC系统中的资源类型,例如:华为交换机、华三交换机、锐捷交换机等等(这里的字段名字一定要和BMC系统的资源类型字段保持一致)

配置BMC系统IP,端口,用户名,密码

菜单路径:服务管理->流程定义->编辑"bmc告警流程"

启用编辑

依次点击"工程师处理"节点-动作配置-"受理"

拉至底部,编辑"受理策略"

编辑"调用第三方API"

配置系统的端口、用户名、密码等信息

备注:请求接口:BMC告警服务_告警确认受理

IP:BMC系统的IP(内网环境)

端口:端口号(内网环境)

用户名:admin(系统管理员账号)

密码:riiladmin(系统管理员密码)

告警id:外部接口数据标识

在这里配置IP、端口、用户名、密码的时候是需要手动输入的,点击 按钮即可

点击确定,发布流程

工单中显示的描述信息的配置说明

在该"告警流程中"编辑"开始"节点的"提交"动作

编辑"提交策略"

编辑"服务单配置"

编辑"描述"配置(点击 按钮进行编辑)

自定义进行编辑Groovy脚本

默认配置:

"资源类型:${resType} \n 名称:${resName} \n 资源IP: ${ip} \n 事件产生时间:${createTime} \n 告警信息:${name}"

配置说明:

在英文双引号中填写要显示的内容

${}中包裹的为告警信息中的属性名,告警信息对应的属性值会填充到该处

\n表示换行

注意事项:

两端要有英文双引号包裹

配置中不能使用回车换行

",$,{} 必须使用英文符号

附:告警对象及说明(此处可推送的字段信息为relax端已定义好的,如需推送其他相关字段,按需求提交)
{
"collectType": "RES", // 采集类型
"createTime": "2017-11-14 15:32", // 事件产生时间
"eventId": "MINOR_PERFORMANCE", // 事件id
"eventMsg": "", // 告警信息
"eventState": "-1", // 事件状态
"eventType": "PERF_EVENT", // 时间类型
"ip": "172.17.160.33", // IP
"level": "3", // 事件级别
"metricId": "CPURate", // 指标id
"metricName": "CPU利用率", // 指标名称
"name": "CPU利用率超标,当前值:1.25%(阈值:1%~2%)", // 事件名称
"plicyId": "RIIL_RMP_RES_HOST_WINDOWS_SNMP_DEFAULT", // 策略id
"resId": "c3a431fc-14fe-3221-9bfb-c43d0ef9fe05", // 资源id
"resName": "WIN-IO0SR7L9PL3", // 资源名称
"resTempId": "RIIL_RMT_HOST_WINDOWS", // 模型id
"resType": "Windows", // 资源类型
"subInstId": "" // 子资源id
}

特殊注意事项:

必须对"提交"按钮进行可见性条件设置

如果该节点有其他动作按钮且动作按钮不能删除的情况下必须配置(删除多余按钮或者配置登录用户不等于系统机器人)

在所有受理节点前配置"关闭"按钮,按钮可见性条件设置为操作用户等于系统机器人



在执行策略里面配置流程操作:跳转,跳转节点为"结束"节点,点击确定;在服务单配置里面配置流程状态等于已关闭。


到这一步,所有的配置已经完成,这时候可以开始测试工单推送了,如果工单没有正常推送过来,请排查以下内容

查看Relax日志

 \RuiJie\Relax\program\logs\its_relax_debug.log,查看报错信息,relax的配置相关错误可在此查验。

在CCS所在服务器查看日志
      路径为:RuiJie\RIIL\RIIL_BMC\workspace\logs\Service\RMC-SOAP.log
      建议测试内容:

BMC系统手动产生一条告警,看这条告警工单是否自动生成

如果生成工单之后,在Relax系统中受理这条工单,相对应的BMC系统的这条告警也会被自动受理掉,如果告警没有被受理,请检查2.2的配置

从新产生一条新的告警工单,然后在BMC系统手动恢复一下这条告警,在Relax中产生的对应工单状态就变为"已关闭"状态,如果状态没变,那就是"关闭"按钮没有配置好,请检查配置

测试截图:

修改BMC系统告警资源的只读共同体

Relax系统会对应生成一条工单信息

工单详情信息(请忽略其中两个未填写信息的字段,表单目前没有做好)

工单往下进行扭转,工程师进行受理该工单,在受理之前,请查看BMC系统的告警列表

在BMC系统受理列表处可查看受理记录

测试工单自动关闭,用上述方法产生一条告警并自动生成工单

当工单没有被受理之前,BMC系统中该资源告警恢复,工单状态就会变为"已关闭"

BMC告警推送relax失败排查思路

一、relax集成界面配置要正确

二、对接日志为RMC-SOAP.log,路径:RIIL_BMC/workspace/logs/service

问题现象:

一、BMC告警产生后,relax系统无工单产生

1、查看告警资源、告警级别是否符合推送条件(所有截图仅参考,只是提示怎么查看)

2、找到BMC产生的告警,获取告警事件ID,对应告警详情的eventId后的字符串即为告警事件ID

排查思路

a、查看日志,如日志中无对应的匹配项,且提示连接relax的地址失败/超时,需要检查BMC服务器能否正常访问relax系统

b、将获取到的告警事件ID在BMC告警推送relax的日志(RMC-SOAP.log)中进行搜索,看是否有匹配项,正确应该为找到一条“create relax order,eventId:xxxxx”的记录,看到此记录表明BMC推送告警成功,问题原因不在BMC侧,需排查relax日志(its_relax_debug.log)分析为何未产生工单的原因

 c、如发现日志中提示“资源类型:xxxxx 没有配置对应的服务目录”,则问题原因为relax侧在对接时未配置对应的服务目录

d、如遇到现场relax环境为(网办relax1.2.3.1及以上版本/ITSM2.0及以上版本的)且BMC版本低于6.8.7.19的,发现告警对接失败,且日志中提示有“relax login timeout,code is401”报错,

    此问题可以通过部署relax的代理程序解决,(联系relax支持获取部署方案)

BMC对接relax工单无法自动关闭,工单受理后动作不生效

1、如现场告警工单正常推送,但是推送的工单在未处理前告警已关闭但是工单无法自动关闭,检查relax流程【关闭】动作所在节点的配置(具体可联系relax侧支持)

2、如正常告警产生工单relax上受理后,BMC上告警为改变状态,依旧为未受理,检查relax侧受理动作配置(特别是“外部数据接口标识”填写的注意事项,可联系relax侧支持)