由 superadmin 于 2024/10/12, 15:32 最后修改
修改评论
该版本没有评论
Summary
Details
- Page properties
-
- Content
-
... ... @@ -3,15 +3,15 @@ 3 3 4 4 = 目录 = 5 5 6 -=== 一、问题管理设计目标 === 6 +==== 一、问题管理设计目标 ==== 7 7 8 -=== 二、问题管理流程 === 8 +==== 二、问题管理流程 ==== 9 9 10 -=== 三、问题管理相关表单、规范 === 10 +==== 三、问题管理相关表单、规范 ==== 11 11 12 -=== 四、问题管理角色、职责 === 12 +==== 四、问题管理角色、职责 ==== 13 13 14 -=== 五、问题管理考核标准 === 14 +==== 五、问题管理考核标准 ==== 15 15 16 16 17 17 = 一、问题管理设计目标 = ... ... @@ -58,12 +58,12 @@ 58 58 = 二、问题管理流程 = 59 59 60 60 61 - ==问题管理流程概述==61 +问题管理流程概述 62 62 63 63 [[image:1728638145695-907.png]] 64 64 65 65 66 - ==问题管理流程步骤概述==66 +问题管理流程步骤概述 67 67 68 68 |问题检测与记录|((( 69 69 * 判断事件管理创建的问题是否受理 ... ... @@ -94,9 +94,349 @@ 94 94 95 95 == == 96 96 97 - ==步骤一的流程说明:问题识别与记录==97 +步骤一的流程说明:问题识别与记录 98 98 99 -[[image:17286 38291834-716.png]]99 +[[image:1728647892425-490.png]] 100 100 101 +== == 101 101 103 +步骤二的流程说明:问题分类与分派 104 + 105 +[[image:1728647855815-599.png]] 106 + 107 + 108 +步骤三的流程说明:问题调查与诊断 109 + 110 +[[image:1728647951312-388.png]] 111 + 112 + 113 +步骤四的流程说明:问题解决 114 + 115 +[[image:1728647983097-743.png]] 116 + 117 + 118 +步骤五的流程说明:问题关闭 119 + 120 +[[image:1728648010831-375.png]] 121 + 122 + 123 +步骤六的流程说明:问题跟踪与监控 124 + 125 +[[image:1728648035490-365.png]] 126 + 127 + 128 + 129 += 三、问题管理相关表单、规范 = 130 + 131 +问题管理相关表单 ~-~- 问题来源 132 + 133 + 134 +根据问题的来源不同,可以分为以下的问题来源代码: 135 + 136 +|(% style="width:50px" %)编号|(% style="width:123px" %)代码|(% style="width:948px" %)描述 137 +|(% style="width:50px" %)1|(% style="width:123px" %)紧急事件|(% style="width:948px" %)((( 138 +紧急事件恢复服务后关联提出的问题,以便进行紧急事件的根本原因分析 139 + 140 +【例如】:某日发生了一起集群无法切换的事件,导致某台主机发生故障后,没有切换到备用主机中去,从而影响了业务,紧急事件的处理人员在采取了手工切换的替代措施后,恢复了服务 141 + 142 +为了分析为什么会发生该重大事件,以及查看其他的集群是否也存在类似的问题,此时可以提出一个问题记录,以便对该紧急事件进行分析 143 +))) 144 +|(% style="width:50px" %)2|(% style="width:123px" %)未解事件|(% style="width:948px" %)((( 145 +故障无法成功解决或者使用变通方式暂时解决,需要找出根本解决方案 146 + 147 +【例如】:某应用系统内存经常爆满当机,暂时没有解决方案,只能通过重启临时解决,此时需要提出一个问题记录,找到问题的根源是开发上面的问题还是其他,再驱动根本解决。 148 +))) 149 +|(% style="width:50px" %)3|(% style="width:123px" %)运维工作|(% style="width:948px" %)((( 150 +二线支持在日常维护工作中提出的问题 151 + 152 +【例如】:维护专家在日常维护中发现,目前的数据库版本可能会存在着死锁、性能下降等方面的问题,此时就可以提出一个问题记录,以便分析 153 +))) 154 +|(% style="width:50px" %)4|(% style="width:123px" %)故障分析|(% style="width:948px" %)((( 155 +分析事件记录找出的问题 156 + 157 +【例如】:在定期的会议中,对某应用系统操作咨询类的事件进行分析后发现,上一阶段该类型的事件比平常的时候多了30%,超过了规定的阀值,这表明该应用系统操作有可能存在着一些潜在的隐患,此时就可以提出一个问题记录,以找出问题的原因并解决 158 +))) 159 +|(% style="width:50px" %)5|(% style="width:123px" %)失败变更|(% style="width:948px" %)变更失败后,可能需要生成一个问题进入后续的解决过程 160 + 161 + 162 +问题分类 163 + 164 +问题分类与事件分类同步,原因是: 问题单来源很大程度上来自事件,同步分类有助于完整转述信息 事件管理的“故障现象”和“故障根源”区别的分类方式对于描述问题同样具有很大意义。 165 + 166 +|分类|原则|上级分类 167 +|类别(Category)|分类原则以能够清晰描述技术条线,从框架角度区分事件为准,如CRM域、计费域、MSS| 168 +|子类(Type)|分类原则以能够准确定位事件所在系统、设备或者功能单元,指导事件分派到相应处理组为准,且需要兼顾服务台人员的判断能力,如OCS系统|类别 169 +|现象(Item)|分类原则以能够描述故障现象为准,如计费出错|子类 170 +|根源(Causation)|分类原则以能够描述故障根源为准,如数据错误|子类 171 + 172 + 173 +分类示例表: 174 + 175 +|类别|子类| |((( 102 102 177 +))) 178 +|(% colspan="1" rowspan="4" %)计费域 ……|计费系统(HB)|现象|通话时长计算出错 179 +|统一充值系统(VC)|根源|账单计算出错 180 +|……| |数据错误 181 +| | |配置错误 182 + 183 + 184 +问题分派规范 185 + 186 +|**分派规范**|**描述** 187 +|规范一|基于目前管理状况,建议分派问题可以到技能组或岗位 188 +|规范二|可分派的人员组列表将根据问题分类和问题地点信息进行筛选 189 +|规范三|已分派的问题允许再次转派,组间转派到组,组内转派到人 190 +|规范四|再转派问题必须通过问题经理执行 191 +|规范五|组内转派问题不需要通过问题经理,可以直接转派 192 +|规范六|供应商等同于问题分析员,由问题经理直接分派 193 + 194 + 195 +问题严重等级规范 196 + 197 +问题的严重等级与事件管理同步,原因如下: 198 + 199 +* 问题单来源很大程度上来自事件,同步严重等级的计算方式有助于完整转述信息 200 +* 事件管理的“紧急程度”与“影响范围”交叉计算方式对于描述问题同样具有很大意义。 201 + 202 + 203 +问题严重等级(优先级) 204 + 205 +- 规则一:问题的严重等级由系统根据紧急程度和影响程度自动运算得出 206 + 207 + 计算规则如下表所示: 208 + 209 +|(% colspan="2" rowspan="2" %)**严重等级**|(% colspan="4" %)**影响程度** 210 +|**1级**(**极高)**|**2级**(**高)**|**3级**(**中)**|**4级**(**低)** 211 +|(% rowspan="3" %)**紧急程度**|**高**|极高|极高|高|中 212 +|**中**|极高|高|中|中 213 +|**低**|高|中|中|低 214 + 215 +问题紧急程度 216 + 217 +* - 规则一:问题的紧急程度划分为三级 ~-~-~-~- 高、中、低 218 +* - 规则二:问题紧急程度由用户或服务台按照“用户类型”和“分类”交叉运算得出 219 +* 规则三:没有明确用户类型的问题紧急程度默认为“中” 220 +* 规则四:投诉类事件和升级事件生成的问题紧急度默认为“高” 221 + 222 +|(% colspan="2" rowspan="2" %)**紧急程度(示例表)**|(% colspan="3" %)**用户类型** 223 +|**企业客户**|**VIP会员**|**普通会员和客户** 224 +|(% rowspan="3" %)**分类(三级)**|**计费出错**|高|中|低 225 +|**停开机出错**|高|中|低 226 +|**……**|高|中|低 227 + 228 + 问题影响程度 : 229 + 230 +* 规则一:问题影响程度由问题经理建单时主观定义 231 +* 规则二:问题的影响包括已经造成的或者可能会造成的影响 232 +* - 规则三:事件影响程度定义如下表所示 233 + 234 +|**影响程度**|**极高**|**高**|**中**|**低** 235 +|描述|((( 236 +重大的应用停机,影响很大数量的用户和业务单位。 237 + 238 +关键业务不能运行。 239 +)))|应用的使用受到重大限制;系统性能严重下降。|事件影响一小部分用户,属于一般性故障。|事件不直接影响生产,或是存在变通的方式。 240 + 241 + 242 +问题目标时间 243 + 244 +对于问题管理而言,处理的第一目标是从根本上解决问题,处理效率的考虑并不是最关键的 在这里我们使用“目标时间”来对处理效率进行衡量,主要是两点考虑: 245 + 246 +* 督促处理人员不要无限制的延误问题处理 247 +* 督促厂商的问题处理工作(厂商在问题处理中作为问题分析员角色) 248 + 249 +超过时间的问题单将执行超时上报 250 + 251 + 252 +| |**问题得到响应**|**问题单分派**|**问题得到解决**|**问题得到关闭** 253 +|**严重等级1**|8H|6H|3D|8H 254 +|**严重等级2**|1D|8H|5D|1D 255 +|**严重等级3**|2D|1D|10D|2D 256 +|**严重等级4**|3D|2D|20D|4D 257 + 258 + 259 +问题管理相关表单 ~-~- 问题状态 260 + 261 +状态代码用于鉴别事件和问题在处理过程中所处的状态。 262 + 263 +|**状态代码**|**描述** 264 +|**New(新建)**|**一个问题被记录或创建** 265 +|**Assigned (已分配)**|**一个问题已被分派给问题分析员或问题经理** 266 +|**Pending (等待中)**|**问题信息不完整,或在某些情况下阻止问题分析员对问题进行处理,进入等待** 267 +|**Work in Progress (处理中)**|**一个问题分析员接受了问题,并正在处理 ** 268 +|**Resolved (已解决)**|**为一个问题找到解决方案或变通方法** 269 +|**Closed (已关闭)**|**问题已经关闭** 270 + 271 + 272 +问题流转状态说明 273 + 274 +纵向(左列)为原始状态,横向(上行)为目标状态。 275 + 276 +|**状态**|**新建**|**已分派**|**处理中**|**等待中**|**已解决**|**已关闭** 277 +|**新建 **| |**Y**|**N**|**N**|**N**|**N** 278 +|**已分派**|**N**|**Y**|**Y**|**N**|**N**|**Y** 279 +|**处理中**|**N**|**Y**| |**Y**|**Y**|**Y** 280 +|**等待中**|**N**|**Y**|**Y**| |**Y**|**Y** 281 +|**已解决**|**N**|**Y**|**N**|**N**| |**Y** 282 +|**已关闭**|**N**|**N**|**N**|**N**|**N**| 283 + 284 + 285 +问题等待代码 286 + 287 +* 当处理中的问题由于各种原因进入等待状态时,需要填写等待代码 288 + 289 +|**等待代码**|**描述** 290 +|等待进一步的信息|需要等待获取更多信息 291 +|等待变更管理处理|等待变更流程处理 292 +|由于不可抗力 |由于灾难、气候条件、交通条件等不可抗因素 293 +|等待维护性需求处理|等待维护性需求处理 294 + 295 + 296 +问题关闭规范 297 + 298 +|**关闭规范**|**描述** 299 +|规范一|问题单只能由问题经理关闭 300 +|规范二|问题单在关闭前,必须填写关闭代码 301 +|规范三|问题单不允许自动关闭 302 +|规范四|已关闭的问题单不允许重新打开 303 + 304 +|**关闭代码**|**描述** 305 +|成功解决|问题被正常解决 306 +|未发现根源|问题无法发现根源 307 +|解决失败|问题的解决方案失败,不能解决这个问题 308 +|问题撤销|问题经理撤销问题单 309 +|提交需求|问题单已提交需求管理流程处理 310 + 311 + 312 +问题通知规范 313 + 314 +|**规范**|**描述** 315 +|规范一|在创建问题单后,通知对应的问题经理 316 +|规范二|问题单分派后,通知被分派的问题分析员 317 +|规范三|问题分析员提交转派申请后,通知问题经理 318 +|规范四|问题分析员处理完成,通知问题经理 319 + 320 + 321 +问题管理相关表单 ~-~- 问题记录信息项 322 + 323 +问题记录信息项建议(包括但不限于) 324 + 325 +|序号|信息项|说明 326 +|**1**|**问题ID**|**为每个问题分配一个唯一的序列号(系统自动产生)** 327 +|**2**|**请求人信息**|**问题请求人的信息,包括:姓名、省/分公司、部门、电子邮件、办公电话、手机(手工填写)** 328 +|**3**|**登记时间**|**生成问题记录的时间(系统自动产生)** 329 +|**4**|**地点**|**记录问题发生的地点(手工填写)** 330 +|**5**|**问题来源**|**参见“问题来源”定义** 331 +|**6**|**事件影响度**|**参见“问题紧影响程度”定义** 332 +|**7**|**事件紧急度**|**参见“问题紧急程度”定义** 333 +|**8**|**问题优先级**|**参见“问题优先级”定义** 334 +|**9**|**问题分类**|**参见“问题所属系统类型”定义** 335 +|**10**|**问题标题**|**简单描述问题(手工填写)** 336 +|**11**|**问题描述**|**详细描述问题内容(手工填写)** 337 +|**12**|**问题原因**|**详细记录问题产生的根本原因(手工填写)** 338 +|**13**|**重复问题标记**|**标记为重复问题,用已有标题号标注(手工填写)** 339 +|**14**|**问题状态**|**参见“问题状态”定义** 340 +|**15**|**问题经理**|**问题经理** 341 +|**16**|**受理组**|**将问题分配到问题处理专家组(手工填写)** 342 + 343 +|序号|信息项|说明 344 +|**17**|**受理人**|**将问题分配到各问题处理专家(手工填写)** 345 +|**18**|**问题日志**|**反映问题处理过程中问题信息项的变化历史,包括分配的人员,状态等信息(系统自动产生)** 346 +|**19**|**实际开始诊断时间**|**问题状态更新为“分析中”的时间(手工填写)** 347 +|**20**|**实际诊断结束时间**|**问题状态更新为“已有解决方案”的时间(手工填写)** 348 +|**21**|**解决方案**|**问题解决方案的详细描述(手工填写)** 349 +|**22**|**问题等待代码**|**参见“问题等待代码”定义** 350 +|**23**|**问题结束代码**|**参见“问题结束代码”定义** 351 +|**24**|**备注项**|**解释问题拒绝原因,无法解决的原因等** 352 +|**25**|**关联配置项**|**记录问题的配置项代码(手工填写)** 353 +|**26**|**关联的事件单号**|**记录引发该问题的事件单号(手工填写)** 354 +|**27**|**关联的变更单号**|**记录由问题发变更时,关联的变更单号(手工填写)** 355 +|**28**|**问题关闭时间**|**当问题状态更新为“结束并关闭”的时间(手工填写)** 356 +|**29**|**附件**|**附件** 357 + 358 + 359 += 四、问题管理角色、职责 = 360 + 361 +问题管理 ~-~- 角色、职责定义 362 + 363 +**原则:**一个人员可以担任多个角色,同一角色也可以由多人担任 364 + 365 +|**问题管理角色**|**主要职责**|**岗位映射** 366 +|**流程负责人**|**推动、推广问题管理流程,对流程的整体效果和效率负责。**| 367 +|**问题分析员**|((( 368 +**接受问题经理分派过来的问题** 369 + 370 +**分析和诊断问题,确定根本原因** 371 + 372 +**确定和测试解决方案** 373 + 374 +**提交变更请求并监控变更实施** 375 + 376 +**协助事件支持人员进行重大或紧急事件的处理** 377 + 378 +**需要时协调第三方的资源来帮助诊断和改正问题** 379 +)))|((( 380 +**企信部所有技术人员,分为不同领域的各个技能组** 381 + 382 +**各厂商,按照各自负责系统分为各个技能组** 383 +))) 384 +|**问题经理**|((( 385 +**领导问题管理小组,确保大家的积极性、技能水平** 386 + 387 +**定期组织相关人员对事件记录进行分析,发现潜在问题** 388 + 389 +**确认和审核问题** 390 + 391 +**必要时对问题进行上报** 392 + 393 +**监视问题的诊断、分析和处理过程** 394 + 395 +**必要时与帮助台及问题请求者沟通问题的相关信息** 396 + 397 +**必要时协调所需资源** 398 + 399 +**定期制定问题报表,提供正确决策信息** 400 +)))|**建议多人担任,分别为各个技术团队的负责人(如各二线处理小组负责人)** 401 + 402 + 403 + 404 += 五、问题管理考核标准 = 405 + 406 + 407 + 问题管理 ~-~- 考核指标 408 + 409 +问题管理考核指标如下: 410 + 411 +|代码|状态|说明 412 +|(% rowspan="4" %)**流程 413 +有效性**|**问题总数**|((( 414 +**数量:在问题单中根据以下条件过滤** 415 + 416 +**1. 【重复问题标记】为空** 417 + 418 +**2. 【问题结束代码】不等于“取消”** 419 + 420 +**3. 【登记时间】在统计周期内** 421 +))) 422 +|**未解决故障问题所占比率**|((( 423 +**数量:在问题总数中,【问题来源】=“未解事件”的问题数量** 424 + 425 +**比率:数量 / 问题总数 × 100 %** 426 +))) 427 +|**故障分析问题所占比率**|((( 428 +**数量:在问题总数中,【问题来源】=“故障分析”的问题数量** 429 + 430 +**比率:数量 / 问题总数 × 100 %** 431 +))) 432 +|**关闭问题数量**|**数量:【问题关闭时间】在统计周期内,【问题状态】=“结束并关闭”的问题数量** 433 +|(% rowspan="2" %)**执行效率**|**问题成功解决率**|((( 434 +**数量:在关闭问题数量中,【关闭代码】=“成功解决”的问题个数** 435 + 436 +**比率:数量 /关闭问题数量 × 100 %** 437 +))) 438 +|**平均解决时间**|((( 439 +**完成问题数量:【结束时间】在统计周期内的问题个数** 440 + 441 +**平均解决时间:累加完成问题的(【实际结束时间】-【实际开始时间】)/ 完成问题数量** 442 +)))
- 1728648035490-365.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +77.8 KB - Content