由 superadmin 于 2024/10/01, 10:43 最后修改
修改评论
该版本没有评论
Summary
Details
- Page properties
-
- Content
-
... ... @@ -5,7 +5,7 @@ 5 5 6 6 本文档的内容是根据系统运行部目前的IT服务状况而制定的问题管理流程,进一步的流程更新将有系统运行部流程负责人负责。 7 7 8 -1. 8 +1. 9 9 11. **适用范围** 10 10 11 11 本文档是系统运行部实施问题管理流程的蓝本和指导思想,目标读者是与问题管理流程相关的所有技术与管理人员。 ... ... @@ -72,7 +72,7 @@ 72 72 73 73 问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。主要活动包括分析事件、找出问题、分派问题、确定根本原因以及找出解决方案、回顾及关闭,以消除事件或在其发生时降低对用户或业务的影响。其主要内容如下: 74 74 75 -1. 分析事件 75 +1. 分析事件 76 76 77 77 定期分析事件,找出潜在问题。 78 78 ... ... @@ -98,11 +98,11 @@ 98 98 99 99 高优先级的重大问题,向运行管理委员会报备,必要时管理层协助进行资源协调。 100 100 101 -1. 分派 101 +1. 分派 102 102 103 103 根据问题内容将问题记录分派给适当的技术小组。 104 104 105 -1. 根本原因分析 105 +1. 根本原因分析 106 106 107 107 被分派的小组人员将调查问题以期找出其原因,制定解决方案、变通方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化。 记录必须被更新以反映它是已定位原因状态,并且把任何变通方法、避免或最小化负面影响的动作行为也记录下来(如果需要添加到知识库中)。 108 108 ... ... @@ -114,7 +114,7 @@ 114 114 115 115 对问题的解决方案进行回顾,确认解决方案达到了预期的效果。 116 116 117 -1. 总结及关闭 117 +1. 总结及关闭 118 118 119 119 确认问题的信息记录已经填写完整,并关闭问题记录。 120 120 ... ... @@ -126,7 +126,7 @@ 126 126 127 127 定期对事件进行分析,对事件上报问题的情况进行评估。 128 128 129 -1. 129 +1. 130 130 11. **与其他流程的关系** 131 131 1. 和事件管理流程的关系 132 132 ... ... @@ -147,39 +147,39 @@ 147 147 知识库对问题管理流程提供支持,问题管理流程在处理过程中会引用知识;问题管理流程处理完成后,会向知识库发布知识。 148 148 149 149 150 -1. 150 +1. 151 151 11. **流程范围** 152 152 153 153 问题管理流程的范围是系统运行部所管辖的IT运行环境中所发生的问题进行管理,以采取主动性预防措施来降低事件数量。 154 154 155 -1. 155 +1. 156 156 11. **流程执行原则** 157 157 111. **常规原则** 158 158 1. 应该每半年对问题管理流程的流程关键衡量指标、流程执行效率、流程支撑工具有效性等进行回顾,以改进和优化流程。 159 159 160 160 1. 应该每月定期回顾和产生问题管理报表,对没有解决的问题,应该举行定期的问题管理会议对这些问题进行评估。 161 -11. 161 +11. 162 162 111. **趋势分析原则** 163 163 164 164 1. 事件管理流程定期提供事件分析报表,标识可能问题。 165 165 1. 问题管理员对事件管理流程提交的列表进行分析,发现问题。 166 -11. 166 +11. 167 167 111. **重复问题原则** 168 168 169 169 重复问题是指经过分析之后,根本原因相同并且还未关闭的问题。例如:问题管理员提出了几个问题,但是经过分析之后,发现这几个问题的根本原因是相同的,这几个问题就可以定义为重复问题。重复问题单直接关闭(结束代码为“重复问题”)。 170 170 171 -1. 172 -11. 171 +1. 172 +11. 173 173 111. **解决方案审核原则** 174 174 1. 优先级为L1的问题,实施解决方案之后,提交给运行管理委员会审核,确定该问题单是否可以关闭。 175 175 1. 优先级为L2的问题,实施解决方案之后,提交给问题管理委员会审核,确定该问题单是否可以关闭。 176 176 1. 其他较低优先级的问题单在实施了解决方案之后,由小组组长组织问题负责人回顾解决过程,然后由小组组长确认问题信息记录完整,关闭问题。 177 -11. 177 +11. 178 178 111. **问题关闭审核原则** 179 179 1. 优先级为L1的问题,实施解决方案之后,提交给运行管理委员会审核,确定该问题单是否可以关闭。 180 180 1. 优先级为L2的问题,实施解决方案之后,提交给问题管理委员会审核,确定该问题单是否可以关闭。 181 181 1. 优先级为L3/L4/L5的问题单在实施了解决方案之后,如果为本组问题,小组组长组织问题负责人对解决过程进行回顾,如果为跨组问题,由主负责小组组长召集相关专业组人员解决过程进行回顾,然后由小组组长确认问题信息记录完整,关闭问题。 182 -11. 182 +11. 183 183 111. **问题关闭原则** 184 184 185 185 关闭的问题需要满足以下标准: ... ... @@ -188,12 +188,12 @@ 188 188 1. 所有关联的事件已经关闭。 189 189 1. 所引发的事件A时间内不再出现。 190 190 1. 各类性能、容量的指标恢复正常。 191 -11. 191 +11. 192 192 111. **问题单重开原则** 193 193 194 194 已关闭的问题单不允许重开。如果问题重复发生,则创建一个新的问题单。 195 195 196 -1. 196 +1. 197 197 11. **流程相关定义** 198 198 111. **问题信息项** 199 199 ... ... @@ -246,9 +246,8 @@ 246 246 |44|原因定位|CODE|参见“原因定位”定义 247 247 | | | | 248 248 249 - 250 -1. 251 -11. 249 +1. 250 +11. 252 252 111. **问题来源** 253 253 254 254 根据问题的不同来源对问题分类如下: ... ... @@ -260,11 +260,10 @@ 260 260 |4|第三方检查或审计|第三方在检查或审计的过程中发现的问题,由相关小组负责提出 261 261 |5|管理过程中提出|领导在管理过程中提出的问题 262 262 263 -1. 264 -11. 262 +1. 263 +11. 265 265 111. **问题影响范围** 266 266 267 - 268 268 |**编号**|影响范围|**描述** 269 269 |1|S1|全行所有业务系统 270 270 |2|S2|全行一个或者多个重要业务系统 ... ... @@ -273,12 +273,10 @@ 273 273 |5|S5|总行或者分行的一个或者多个非重要业务系统 274 274 |6|S6|对业务有影响的一个或者多个办公系统 275 275 276 - 277 -1. 278 -11. 274 +1. 275 +11. 279 279 111. **问题影响度** 280 280 281 - 282 282 |**编号**|**影响度**|**描述** 283 283 |1|I1|引发服务中断,且没有临时规避措施 284 284 |2|I2|引发服务中断,但有临时规避措施 ... ... @@ -287,9 +287,8 @@ 287 287 |5|I5|没有引发服务中断,存在隐患,可能造成系统性能下降 288 288 |6|I6|没有引发服务中断,对服务没有直接影响(例如第三方审计提出的规范类的问题) 289 289 290 - 291 -1. 292 -11. 286 +1. 287 +11. 293 293 111. **问题优先级** 294 294 295 295 问题的优先级是问题负责人解决问题的参照标准,对于优先级为紧急/高的问题,管理层应该优先协调资源进行这些问题的解决。结合系统运行部的实际情况,问题的优先级定义如下: ... ... @@ -303,9 +303,8 @@ 303 303 |I5|L2|L3|L4|L4|L5|L5 304 304 |I6|L3|L4|L4|L4|L5|L5 305 305 306 - 307 -1. 308 -11. 301 +1. 302 +11. 309 309 111. **问题状态** 310 310 311 311 为了记录问题处理的生命周期,需要设置不同的状态加以描述,如下所示: ... ... @@ -324,8 +324,8 @@ 324 324 |11|已解决|问题得到解决 325 325 |12|已关闭|问题结束 326 326 327 -1. 328 -11. 321 +1. 322 +11. 329 329 111. **问题结束代码** 330 330 331 331 为了表明问题的不同解决方式,定义如下结束代码: ... ... @@ -338,8 +338,8 @@ 338 338 |5|重复问题|该问题为重复问题 339 339 |6|取消|问题被问题经理或小组组长审核后被取消 340 340 341 -1. 342 -11. 335 +1. 336 +11. 343 343 111. **原因分类** 344 344 345 345 |**编号**|**代码**|**描述** ... ... @@ -349,17 +349,16 @@ 349 349 350 350 //注:实施时需考虑对各分类的比例设置。// 351 351 352 -1. 353 -11. 346 +1. 347 +11. 354 354 111. **原因性质** 355 355 356 - 357 357 |**编号**|**代码**|**描述** 358 358 |0|非致命缺陷|目前或潜在地降低但不会中断服务 359 359 |1|致命缺陷|中断服务 360 360 361 -1. 362 -11. 354 +1. 355 +11. 363 363 111. **原因定位** 364 364 365 365 |**编号**|**代码**|**描述** ... ... @@ -383,9 +383,8 @@ 383 383 |42|系统支持应用软件缺陷|供电、机房、空调等监控等应用软件缺陷 384 384 |99|未知错误|未知错误 385 385 386 - 387 -1. 388 -11. 379 +1. 380 +11. 389 389 111. **问题分类(classification)** 390 390 391 391 问题分类是针对问题所属的专业类型进行划分的,通过问题分类可以定位解决问题的人,并针对问题分类进行分类统计。 ... ... @@ -416,8 +416,7 @@ 416 416 | 417 417 | 418 418 419 - 420 -1. 411 +1. 421 421 11. **关键角色、职责定义** 422 422 423 423 流程的实现是通过不同的流程角色以及其所赋有的职责来实现的,因此流程的每一个角色可以被定义为一系列职责的集合,在实际的管理操作中,不同的人员将被赋予不同的职责,也可能一个人被赋予多个职责。 ... ... @@ -424,8 +424,8 @@ 424 424 425 425 问题管理流程主要分为问题经理、小组组长、问题管理员、问题负责人、问题支持小组和问题管理委员会职责角色,分别简述如下: 426 426 427 -1. 428 -11. 418 +1. 419 +11. 429 429 111. **问题经理** 430 430 431 431 问题经理从总体上对问题管理流程的设计、实施、执行及优化负责,确保问题管理流程在系统运行部范围内被正确的执行。当流程不能够适应系统运行部的情况时,问题经理必须及时的对此进行分析、找出缺陷、进行改进,从而实现可持续提高。同时负责协调日常的问题管理工作,包括对问题的审核、监控、所需资源的协调、定期产生报表等。 ... ... @@ -457,7 +457,7 @@ 457 457 1. 有决策权,能够确保问题管理流程设计要求在实施项目中得到贯彻和执行 458 458 1. 具有很好的沟通技能,能够取得公司高层的支持,获得所需资源 459 459 1. 具有较强的计划、组织、领导和控制才能,能够综合各方意见,按时制订和定期优化问题管理流程 460 -11. 451 +11. 461 461 111. **小组组长** 462 462 1. 小组组长为当前各专业组组长 463 463 1. 领导本组问题管理人员,确保人员的技能水平 ... ... @@ -474,7 +474,7 @@ 474 474 1. 熟悉技术平台和技术环境 475 475 1. 较强的分析事件趋势的能力 476 476 1. 深刻熟悉问题管理流程 477 -11. 468 +11. 478 478 111. **问题管理员** 479 479 1. 对事件定期提供的事件问题列表进行检视、归纳并提出问题 480 480 1. 审核问题的有效性 ... ... @@ -494,7 +494,7 @@ 494 494 1. 较强的分析问题的能力和技巧,能够对问题的有效性提出建议 495 495 1. 较好的沟通和表达能力 496 496 1. 较强的统计分析能力 497 -11. 488 +11. 498 498 111. **问题负责人** 499 499 500 500 问题负责人为问题的诊断及解决提供技术支持。通常由各专业组技术人员承担。 ... ... @@ -520,7 +520,7 @@ 520 520 1. 较强的专业知识 521 521 1. 较强的分析问题的能力和技巧 522 522 1. 较好的沟通和表达能力 523 -11. 514 +11. 524 524 111. **问题管理委员会** 525 525 1. 问题管理委员会由问题经理及各个问题管理员组成 526 526 1. 问题管理委员定期召开例会,对问题管理的流程、执行效率作出分析并提出改进措施 ... ... @@ -532,7 +532,7 @@ 532 532 1. 较强的专业知识 533 533 1. 较强的分析问题的能力和技巧,能够对问题的有效性提出建议 534 534 1. 较好的沟通和表达能力 535 -11. 526 +11. 536 536 111. **问题支持小组** 537 537 538 538 问题支持小组为问题的诊断及解决提供技术支持。 ... ... @@ -552,7 +552,7 @@ 552 552 1. 较强的专业知识 553 553 1. 较强的分析问题的能力和技巧 554 554 1. 较好的沟通和表达能力 555 -11. 546 +11. 556 556 111. **流程角色和人员对应表** 557 557 558 558 在系统实施时由系统运行部根据实际运维在此表基础上完成具体的人员映射 ... ... @@ -575,12 +575,13 @@ 575 575 |(% colspan="2" %)问题负责人| | 576 576 |(% colspan="2" %)问题管理委员会| | 577 577 578 -1. 569 +1. 579 579 11. **概要流程设计** 580 580 581 581 问题管理流程概要设计图如下: 582 582 583 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps1.png]] 574 +(% style="text-align:center" %) 575 +[[image:0(1).png]] 584 584 585 585 问题管理概要设计流程描述如下: 586 586 ... ... @@ -687,13 +687,13 @@ 687 687 1. 在问题处理过程中出现异常时,如果必要则升级到问题经理,由问题经理进行协调。问题经理根据情况确定是否需要问题管理委员会或运行管理委员会协调。 688 688 ))) 689 689 690 -1. 682 +1. 691 691 11. **流程详细设计** 692 692 111. **(300.1)问题的识别和提交** 693 693 686 +(% style="text-align:center" %) 687 +[[image:1(1).png]] 694 694 695 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps2.png]] 696 - 697 697 描述如下: 698 698 699 699 |**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** ... ... @@ -760,14 +760,14 @@ 760 760 |300.1.9|分派任务|问题经理|跨组问题/重大问题|任务|问题经理给各小组组长分派任务,知会各组长。 761 761 |300.1.10|反馈|小组组长|任务|反馈意见|小组组长针对任务反馈意见。 762 762 763 -1. 764 -11. 755 +1. 756 +11. 765 765 111. **(300.2)问题审核与分派** 766 766 759 +(% style="text-align:center" %) 760 +[[image:2(1).png]] 767 767 768 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps3.png]] 769 769 770 - 771 771 描述如下: 772 772 773 773 |**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** ... ... @@ -784,15 +784,15 @@ 784 784 1. 如接受,则将状态改为“分析中”,转向300.3分析根本原因。 785 785 ))) 786 786 787 -1. 788 -11. 779 +1. 780 +11. 789 789 111. **(300.3)分析诊断问题** 790 790 783 +(% style="text-align:center" %) 784 +[[image:3(1).png]] 791 791 792 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps4.png]] 793 793 794 794 795 - 796 796 描述如下: 797 797 798 798 |**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** ... ... @@ -808,15 +808,14 @@ 808 808 |300.3.3|分析根本原因|问题支持小组|任务|根本原因|问题支持小组人员根据经验或工具分析问题的根本原因。 809 809 |300.3.4|记录根本原因|问题负责人|根本原因|更新的问题记录|更新问题记录,将问题的根本原因填入问题记录中,问题状态更新为“已定位原因”。 810 810 811 - 812 -1. 813 -11. 803 +1. 804 +11. 814 814 111. **(300.4)推荐解决方案** 815 815 807 +(% style="text-align:center" %) 808 +[[image:4(1).png]] 816 816 817 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps5.png]] 818 818 819 - 820 820 描述如下: 821 821 822 822 |**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** ... ... @@ -841,15 +841,14 @@ 841 841 ))) 842 842 |300.4.6|标识为已知错误|问题负责人|问题记录,相关信息、根本原因解决方案|已知错误|将问题发布为已知错误。 843 843 844 - 845 -1. 846 -11. 835 +1. 836 +11. 847 847 111. **(300.5)解决方案审核** 848 848 839 +(% style="text-align:center" %) 840 +[[image:5(1).png]] 849 849 850 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps6.png]] 851 851 852 - 853 853 描述如下: 854 854 855 855 |**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** ... ... @@ -887,14 +887,14 @@ 887 887 1. 否,转回300.4 888 888 ))) 889 889 890 -1. 891 -11. 880 +1. 881 +11. 892 892 111. **(300.6)实施解决方案** 893 893 884 +(% style="text-align:center" %) 885 +[[image:6(1).png]] 894 894 895 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps7.png]] 896 896 897 - 898 898 描述如下: 899 899 900 900 |**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** ... ... @@ -920,12 +920,12 @@ 920 920 ))) 921 921 |300.6.4|发布知识|问题负责人|已实施解决方案问题记录|知识记录|发布知识到知识库。 922 922 923 - 924 -1. 925 -11. 913 +1. 914 +11. 926 926 111. **(300.7)监控及回顾** 927 927 928 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps8.png]] 917 +(% style="text-align:center" %) 918 +[[image:7(1).png]] 929 929 930 930 931 931 描述如下: ... ... @@ -944,15 +944,14 @@ 944 944 1. 更新问题状态为‘已解决’。 945 945 ))) 946 946 947 - 948 -1. 949 -11. 937 +1. 938 +11. 950 950 111. **(300.8)关闭问题** 951 951 941 +(% style="text-align:center" %) 942 +[[image:8(1).png]] 952 952 953 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps9.png]] 954 954 955 - 956 956 描述如下: 957 957 958 958 |**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明** ... ... @@ -990,12 +990,12 @@ 990 990 1. 关闭问题记录。 991 991 ))) 992 992 993 - 994 -1. 995 -11. 982 +1. 983 +11. 996 996 111. **(300.9)问题跟踪与升级** 997 997 998 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps10.png]] 986 +(% style="text-align:center" %) 987 +[[image:9(1).png]] 999 999 1000 1000 描述如下: 1001 1001 ... ... @@ -1034,7 +1034,6 @@ 1034 1034 |//12//|按照问题分类统计当前阶段内已解决问题的数量、比例 1035 1035 |//13//|按照问题分类统计当前阶段未关闭的问题数量 1036 1036 1037 - 1038 1038 1. **问题管理流程报表** 1039 1039 1040 1040 报表可以分为两类:一类为周期性报表,一类为实时状态报表,现说明如下: ... ... @@ -1059,12 +1059,12 @@ 1059 1059 |12|按照问题分类统计当前阶段内已解决问题的数量、比例 1060 1060 |13|按照问题分类统计当前阶段未关闭的问题数量 1061 1061 1062 - 1063 1063 1. **问题管理流程改进建议** 1064 1064 1065 1065 问题管理流程改进可以与其他流程管理改进会议一起召开,作为一项内容,也可结合部门的例会一起召开, 这部分由问题经理负责, 建议的改进的流程如下: 1066 1066 1067 -[[image:file:///C:\Users\长河\AppData\Local\Temp\ksohtml5204\wps11.png]] 1054 +(% style="text-align:center" %) 1055 +[[image:10(1).png]] 1068 1068 1069 1069 1070 1070 描述如下: ... ... @@ -1125,6 +1125,3 @@ 1125 1125 1. 按预定周期或紧急需要进行流程改进计划的更新 1126 1126 ))) 1127 1127 1128 - 1129 - 1130 -