Changes for page 15 ITIL项目实施之事件管理流程设计说明书
Last modified by superadmin on 2024/10/29, 16:57
Change comment:
There is no comment for this version
Summary
Details
- Page properties
-
- Content
-
... ... @@ -1227,4 +1227,230 @@ 1227 1227 (% style="text-align:center" %) 1228 1228 [[image:1730191919642-679.png]] 1229 1229 1230 + 1231 +(% style="text-align:center" %) 1232 +[[image:1730191944307-579.png]] 1233 + 1234 +(% style="text-align:center" %) 1235 +[[image:1730191964946-762.png]] 1236 + 1237 + 1238 + 1239 +== **8.7(100.7)记录解决方案细节** == 1240 + 1241 +(% style="text-align:center" %) 1242 +[[image:1730191987839-301.png]] 1243 + 1244 + 1245 +流程描述如下: 1246 + 1247 + 1248 +(% style="text-align:center" %) 1249 +[[image:1730192020638-371.png]] 1250 + 1251 + 1252 +== **8.8(100.8)关闭事件** == 1253 + 1254 +(% style="text-align:center" %) 1255 +[[image:1730192044751-839.png]] 1256 + 1257 +== == 1258 + 1259 +流程描述如下: 1260 + 1261 +|**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** 1262 +| |监控系统自动告警?|服务台|事件记录|事件记录|((( 1263 +服务台判断是否是监控系统自动产生的告警; 1264 + 1265 +1. 是,转100.8.1更新事件状态 1266 +1. 否,转100.8.2与用户处确认事件解决 1267 +))) 1268 +|100.8.1|更新事件状态及结束代码,关闭事件|服务台|已解决的事件记录|关闭的事件|((( 1269 +更新事件记录,状态为“已关闭”,结束代码根据实际处理结果或用户反馈填写; 1270 + 1271 +如果该事件单有相关联的重复事件,应该将重复事件单一起关闭,重复事件的结束代码和该事件保持一致 1272 +))) 1273 +|100.8.2|与用户处确认事件解决|服务台|用户反馈|反馈结果|从事件请求人处确认所提供的解决方案是否有效 1274 +| |是否解决?|服务台| | |((( 1275 +判断是否解决方案是否有效? 1276 + 1277 +1. 是,转100.8.1 1278 +1. 否,转100.8.3重开单处理 1279 +))) 1280 +|100.8.3|重开单处理|服务台|未解决的事件记录|新的事件记录|((( 1281 +服务台将该事件单的的结束代码置为“不成功”,关闭保存; 1282 + 1283 +创建一个新的事件单,事件信息可以复制,分配到原处理人员处理,新事件单状态“分配到一线” 1284 + 1285 +注:服务台应该和原处理人员沟通事件的确认结果和后续的处理方式,并通过将事件单关联到新的事件单中 1286 +))) 1287 +| |是服务台分派吗?|一、二、三线支持| | |如果是服务台分派的事件单,需要返回到服务台,否则直接到100.8.4 1288 +|100.8.4|更新事件状态及结束代码,关闭事件|一、二、三线支持|已解决的事件记录|关闭的事件|((( 1289 +更新事件记录,状态为“已关闭”,结束代码根据实际处理结果填写; 1290 + 1291 +如果该事件单有相关联的重复事件,应该将重复事件单一起关闭,重复事件的结束代码和该事件保持一致 1292 +))) 1293 + 1294 +== == 1295 + 1296 +== **8.9(100.9)事件处理的监控** == 1297 + 1298 +(% style="text-align:center" %) 1299 +[[image:1730192072345-997.png]] 1300 + 1301 + 1302 +流程描述如下: 1303 + 1304 +|**序号**|**步骤名称**|(% style="width:106px" %)**责任人**|(% style="width:177px" %)**输入**|(% style="width:112px" %)**输出**|(% style="width:760px" %)**说明** 1305 +|100.9.1|事件队列的监控|(% style="width:106px" %)事件经理|(% style="width:177px" %)当前打开的事件单服务台的超时告警|(% style="width:112px" %) |(% style="width:760px" %)((( 1306 +事件经理可以从以下途径获取事件处理的信息 1307 + 1308 +1. 服务台系统自动发送的告警通知 1309 +1. 查询服务台系统的当前处理中的事件列表 1310 +))) 1311 +| |需要介入吗?|(% style="width:106px" %)事件经理|(% style="width:177px" %) |(% style="width:112px" %) |(% style="width:760px" %)((( 1312 +事件经理根据处理时限和该事件对业务的影响程度,判断是否需要及时介入,帮助协调资源解决 1313 + 1314 +1. 需要介入,转100.9.2 1315 +1. 不需要,则继续监控 1316 +))) 1317 +|100.9.2|召集资源协商解决|(% style="width:106px" %)事件经理|(% style="width:177px" %)((( 1318 +告警事件 1319 + 1320 +支持人员的电话通知 1321 +)))|(% style="width:112px" %)解决方案|(% style="width:760px" %)由于处理不及时而可能导致用户满意度下降的事件或疑难事件,事件经理负责召集相应二线专家,共同商讨并制定解决方案,并实施解决方案 1322 +| |可以解决吗?|(% style="width:106px" %)事件经理|(% style="width:177px" %) |(% style="width:112px" %) |(% style="width:760px" %)((( 1323 +1. 如果解决,转100.8关闭事件 1324 +1. 无法解决,转100.9.3升级到管理层解决 1325 +))) 1326 +|100.9.3|升级到管理层解决|(% style="width:106px" %)事件经理|(% style="width:177px" %)升级的事件记录|(% style="width:112px" %)解决方案|(% style="width:760px" %)事件经理负责将升级事件通报到管理层,通过高层寻求更多的资源介入,共同商讨和制定解决方案 1327 + 1328 +== == 1329 + 1330 +== **8.10(101)紧急事件处理子流程** == 1331 + 1332 +制定各系统应急处理预案 1333 + 1334 +为了确保系统发生重大故障时,能够尽快恢复业务,并充分调动技术力量,在最短时间内排除故障,各系统应该建立相应的应急处理预案,建议预案中的内容至少应涵盖以下方面: 1335 + 1336 +1. 应急预案启动条件 1337 +1. 应急处理小组负责人和成员联系名单和联系方式 1338 +1. 应急处理步骤 1339 +1. 应急信息通报 1340 +1. 应急善后处理 1341 +1. 应急保障措施(人员、培训、演习、场地等) 1342 + 1343 + 1344 +(% style="text-align:center" %) 1345 +[[image:1730192114139-276.png]] 1346 + 1347 + 1348 +紧急事件处理子流程说明如下: 1349 + 1350 +|**序号**|**步骤名称**|**说明** 1351 +|101.1|召集应急小组,协调应急会议|事件经理主持应急会议,并组织讨论、协调各方资源,分析紧急事件处理方案,并将紧急事件情况通报分公司人寿IT信息中心相关领导或总公司 1352 +|101.2|判断是否属于应急预案中的事件?|((( 1353 +应急小组和相关厂商根据紧急事件现象和影响程度,判断是否需要启动相应系统的应急预案? 1354 + 1355 +1. 如果没有应急预案,则进入101.4组织相关厂商共同分析紧急事件,制定处理方案并处理; 1356 +1. 如果有应急预案,则进入101.3按照应急预案处理 1357 +))) 1358 +|101.3|按照应急预案处理|根据各系统制定的应急预案中的实施步骤,处理紧急事件 1359 +|101.4|组织相关厂商共同分析,制定处理方案并处理|((( 1360 +应急小组负责组织相关厂商共同分析紧急事件,制定相应的处理方案,如果需要总公司介入处理,则向总公司申请介入; 1361 + 1362 +处理方案在实施前应得到应急小组和相关领导的认可; 1363 + 1364 +事件处理过程中如果需要中断业务或对系统的IT组件产生变更,则需要按照紧急变更管理流程的定义和要求,提出紧急变更请求 1365 +))) 1366 +|101.5|紧急事件解除确认?|((( 1367 +在紧急事件处理方案实施后,应急小组、相关厂商和相关部门对紧急事件是否解除进行确认 1368 + 1369 +1. 紧急事件如果没有解除,则重新进入101.4组织相关厂商共同分析紧急事件,制定处理方案并处理; 1370 +1. 如果解除,则进入101.6紧急事件善后处理和总结分析 1371 +))) 1372 +|101.6|善后处理和通报客户方|((( 1373 +紧急事件解除后,应急小组向申告方、公司相关领导简要报告紧急事件处理过程,解决方法,事件解除时间,业务恢复情况,并将该信息汇报到总公司 1374 + 1375 +对于影响度为重大的紧急事件,必须通过服务台提交《重大事件报告》 1376 + 1377 +紧急事件的处理人需要创建一个新问题,将紧急事件处理过程的详细信息记录到问题单中,提交到问题经理,由问题经理组织相关专家进行问题根源的分析 1378 +))) 1379 + 1380 += = 1381 + 1382 += = 1383 + 1384 += **9. 流程样例** = 1385 + 1386 +(% style="text-align:center" %) 1387 +[[image:图片7.jpg]] 1388 + 1389 + 1390 + 1391 +== **9.1 总公司内部** == 1392 + 1393 +总部人员财务部门小王,财务分析系统在总部内部执行,财务小王电话总公司服务台人员财务分析系统无法使用,服务台人员记录事件信息,与小王沟通后确认是“管理决策-财务分析系统-报送问题”的问题,首先根据服务目录查询知识库,如果有匹配的解决方案,则按照解决方案处理,如果需要发起变更,则由服务台人员根据解决方案创建变更工单。如果未在知识库中查询到匹配的解决方案,则进行重复事件判断,如是重复事件,则关联重复事件工单号,并置事件状态“XX处理中”,保存退出,同时服务台人员告知小王可以查询XX工单号可以了解决事件处理进度。如果不是重复事件,则判断事件性质、优先级、影响度等,如果此事件为紧急事件则转派给一线支持进行再确认,如果不是紧急事件则进行尝试解决,并更新事件状态为“服务台处理中”,如果服务台人员解决了此事件,则更新工单信息,并与小王确认解决方案及满意度。如果经尝试未能解决则转派一线支持,系统自动将事件状态置为“分派到一线” 1394 + 通过系统对服务目录判断将此工单分派给一线应用支持组中的财务支持小组组长,此时财务支持小组有四人,分别为A,B,C,D,财务支持小组组长根据实际情况手工将此工单派发给B,B接到服务台派发的关于财务分析系统的事件工单后,经判断属于本人处理范围之内,将事件状态置为“一线处理中”,对于服务台人员派发的事件进行优先级确认,此工单非紧急事件,根据服务目录查询知识库,未查到匹配的解决方案,且不是重复事件,B通过借助工具或运用自己技能尝试找出解决方案,如果未找到解决方案则点击按钮,系统会根据服务目录自动转派给二线支持人员。 1395 + 通过系统对服务目录判断将此工单分派给二线应用支持组中的财务支持小组组长,此时财务支持小组有三人,分别为E,F,G,财务支持小组组长根据实际情况将此工单派发给G,G进行分析后手工选择分派对象为F将此工单派发给F,F对此工单做进一步分析,经分析后属于防火墙设置问题,将此工单分派给二线基础设施组中的防火墙小组。系统根据F填写的服务目录查找到二线基础设施组中的防火墙小组,目前此小组有三人,为H,I,J,防火墙小组组长根据实际情况将此工单派发给J,J进行分析确认,确是防火墙设置问题,需要修改防火墙设置,须走变更,J根据需要修改的防火墙设置创建变更工单,并关联此事件单,J将事件状态置为“已解决”并将工单转派给服务台人员,由服务台人员告知小王,此事件单正在变更流程中处理。 1396 + 1397 +== == 1398 + 1399 +== **9.2 分公司内部** == 1400 + 1401 +杭州市分公司柜面操作员小李,反映查询系统有问题,电话告知浙江省分公司服务台人员,分公司服务台人员记录事件信息,与小李沟通后确认是“分公司自有系统-浙江省-查询系统”的问题,首先根据服务目录查询知识库,如果有匹配的解决方案,则按照解决方案处理,如果需要发起变更,则由分公司服务台人员根据解决方案创建变更工单。如果未在知识库中查询到匹配的解决方案,则进行重复事件判断,如是重复事件,则关联重复事件工单号,并置事件状态“XX处理中”,保存退出,同时分公司服务台人员告知小李可以查询XX工单号可以了解决事件处理进度。如果不是重复事件,则判断事件性质、优先级、影响度等,如果此事件为紧急事件则转派给一线支持进行再确认,如果不是紧急事件则进行尝试解决,并更新事件状态为“服务台处理中”,如果服务台人员解决了此事件,则更新工单信息,并与小李确认解决方案及满意度。如果经尝试未能解决则转派一线支持,系统自动将事件状态置为“分派到一线” 1402 + 1403 +通过系统对服务目录判断将此工单分派给分公司一线应用支持组中的查询支持小组组长,查询支持小组有两人,分别为A`,B`,查询支持小组组长根据实际情况将此工单派发给B`,B`经分析为数据库问题,填写分析过程后,将工单通过服务目录转派给分公司一线基础设施支持组中的数据库小组组长,此小组有三人,为C`,D`,E`,数据库小组组长根据实际情况将此工单派发给D`,D`进行分析判断后通过借助工具或运用自己技能尝试找出解决方案,D`将事件状态置为“已解决”并将工单转派给服务台人员,由分公司服务台人员与小李确认解决方案及满意度,并更新事件状态及事件结束代码。 1404 + 1405 +== == 1406 + 1407 +== **9.3 紧急事件** == 1408 + 1409 +山东省分公司信息技术部小张反映CBPS8版系统不可用,小张直接创建事件工单,根据经验技能判断现象分类为“核心运营-CBPS8版系统-宕库”,并确认此事件为紧急事件,通过服务目录自动将此工单分派给分公司一线应用支持组中的CBPS8版支持小组组长,小组有成员3人分别为F1,F2,F3,CBPS8版支持小组组长根据实际情况手工选择将此工单派发给F2,经F2再次确认此事件确实为紧急事件,同时系统通过邮件或短信方式自动通知分公司事件经理,经分析F2无法独立处理,由F2联系分公司事件经理G1,G1通过其他方式联系总公司负责业务应用的事件经理W3,同时F2点击按钮,系统通过服务目录将此工单转派给总公司二线应用系统专家组中的CBPS8版系统小组组长(不派发给小组成员)L1,由W3召集应急小组进行应急会议,根据之前制定的应急预案进行处理,同时W3与G1对事件处理过程进行沟通并确认紧急事件是否解决,L1发起对该紧急事件的问题请求。如果没有应用预案或已有应急预案无法解决此紧急事件,则由W3组织相关人员及厂商共同分析,制定解决方案并进行处理。事件处理结束后,将工单返回给山东省分公司信息技术部小张,由小张确认并关闭 1410 + 1411 +== == 1412 + 1413 +== **9.4 分公司与总公司** == 1414 + 1415 +贵阳市分公司业务处理人员小赵反映万能系统保全功能操作报错,联系贵州省分公司服务台人员,服务台人员记录事件信息并与小赵沟通确认是“核心运营-万能系统-保全模块”的问题,首先根据服务目录查询知识库,如果有匹配的解决方案,则按照解决方案处理,如果需要发起变更,则由服务台人员根据解决方案创建变更工单。如果未在知识库中查询到匹配的解决方案,则进行重复事件判断,如是重复事件,则关联重复事件工单号,并置事件状态“XX处理中”,保存退出,同时服务台人员告知小赵通过查询XX工单号可以了解决事件处理进度。如果不是重复事件,则判断事件性质、优先级、影响度等,如果此事件为紧急事件则转派给一线支持进行再确认,如果不是紧急事件则进行尝试解决,并更新事件状态为“服务台处理中”,如果服务台人员解决了此事件,则更新工单信息,并与小赵确认解决方案及满意度。如果经尝试未能解决则转派一线支持,系统自动将事件状态置为“分派到一线” 1416 + 1417 +通过系统对服务目录判断将此工单分派给分公司一线应用支持组中的万能支持小组组长,此时万能支持小组有两人,分别为A,B,万能支持小组组长根据实际情况手工将此工单派发给B,经B分析分公司一线内部无法解决,需转派给总公司二线 1418 + 1419 +通过系统对服务目录判断将此工单分派给总公司二线应用支持组中的万能支持小组组长,此时万能支持小组有三人,分别为C,D,E,万能支持小组组长根据实际情况手工将此工单派发给E,经E分析无法准确定位原因,需转派给总公司三线 1420 + 1421 +通过系统对服务目录判断将此工单分派给总公司三线开发支持组中的万能支持小组,此时万能支持小组有五人,分别为F,G,H,I,J,其中F为本组中的组长,系统将此工单派发给F,经F分析了解此事件,H是最适合的人选,由F通过手工选择组内人员的方式将此工单派发给H,经H分析确认,此事件是由系统BUG引起,H填写临时解决方案,并将事件状态设置为“已解决”,同时由H发起一个针对此事件的问题工单,并与此事件工单进行关联,系统自动将事件工单转派给贵州省分公司服务台,由服务台人员告知小赵针对此事件已经创建一问题工单。小赵可以通过此事件工单关联的问题工单查看问题处理进度。 1422 + 1423 += = 1424 + 1425 + 1426 += **10. 关键流程衡量指标** = 1427 + 1428 +为了控制流程的质量,必须为流程设置衡量指标。通过对指标的分析,可以有效地对流程的运行情况进行监控和改进。 1429 + 1430 +|**序号**|**衡量指标**|**指标计算说明** 1431 +|1|事件总数|((( 1432 +数量:在事件单中根据以下条件过滤 1433 + 1434 +1. 【重复事件标记】为空 1435 +1. 【事件结束代码】不等于‘消失’or‘误报’or‘可忽略’ 1436 +1. 【事件发生时间】在统计周期内 1437 +))) 1438 +|2|服务台解决率|((( 1439 +数量:在事件总数中过滤所有【事件解决人角色】=‘服务台’ 1440 + 1441 +比率:数量 / 事件总数 × 100 % 1442 +))) 1443 +|3|服务台平台响应时间|((( 1444 +响应时间:(【实际开始时间】-【登记时间】) 1445 + 1446 +总响应时间:在事件总数中统计各(【实际开始时间】-【登记时间】) 1447 + 1448 +平均响应时间:总响应时间/事件总数 1449 +))) 1450 +|4|一线解决率|((( 1451 +数量:在事件总数中过滤所有【事件解决人角色】=‘一线’ 1452 + 1453 +比率:数量 / 事件总数 × 100 % 1454 +))) 1455 + 1230 1230