26 某电子口岸数据中心信息系统ITIL突发事件管理办法
第一章 总则
1、编制目的
为保障XX电子口岸系统各项业务的正常运行,规范突发事件管理流程,准确定位突发事件等级,并及时、有效和有序地处理电子口岸系统各类突发事件,特制定此管理办法。
2、编制原则
突发事件管理的各项工作遵循及时、准确、科学、规范的原则,坚持统一分级、统一管理、统一调度和质量控制。
3、适用范围
本办法适用于XX电子口岸数据中心处理电子口岸执法平台及相关信息系统发生的突发事件。
第二章 电子口岸信息系统自然及物理环境分级管理
1、分级原则
自然及物理环境包括各种对机房环境造成损坏的自然灾害、恐怖袭击和主机在机房内部的工作环境,包括电力、空调、消防、安防等部分。按照自然和机房环境对电子口岸信息系统造成影响和破坏的严重程度,将自然灾害和机房环境划分为二个等级。
一级物理环境:电子口岸执法平台核心机房及为其提供的UPS、空调等关键物理环境、影响和破坏机房安全工作的自然环境;
二级物理环境:核心机房的照明系统、通讯系统、消防等非关键环境及备份机房环境、影响和破坏备份机房安全工作的自然环境。
第三章 电子口岸信息系统应用分级管理
1、分级原则
电子口岸信息系统应用指由XX电子口岸数据中心开发和维护的,由电子口岸执法平台及相关信息系统承载的,完成电子口岸业务的相关应用。
一级应用:业务量大、影响范围广,业务实时性要求高,业务系统敏感、社会影响大;
二级应用:业务量较大,实时性要求较高;
三级应用:业务量较小,实时性要求较低,地方性项目;
非等级应用:业务量小,实时性要求低。
第四章 电子口岸信息系统基础平台分级管理
1、分级原则
1.1 安全设备分级原则
安全设备部分包括构成电子口岸执法平台信息系统及相关信息系统的IDS入侵检测系统、防火墙、加密机、防病毒网关等安全产品和设备。按照安全设备在系统中的作用及所承载的业务重要性,对安全设备实行分级管理。
一级服务器:电子口岸执法平台信息系统及相关信息系统生产环境的IDS入侵检测系统、防火墙、加密机、防病毒网关等安全设备。
二级服务器:电子口岸执法平台信息系统及相关信息系统同城备份环境的IDS入侵检测系统、防火墙、加密机、防病毒网关等安全设备。
1.2 主机服务器分级原则
主机服务器部分包括构成电子口岸执法平台信息系统及相关信息系统的主机及服务器。按照服务器在系统中的作用及服务器所承载的业务重要性,对主机服务器实行分级管理。
一级服务器:电子口岸执法系统和QuickPass系统的核心服务器、核心数据存储设备。
二级服务器:电子口岸执法系统和QuickPass系统的非核心服务器,如前台服务器和电子帐册服务器;电子口岸执法系统的同机房和同城的备份系统的核心服务器、存储设备;QuickPass系统的同机房备份系统的核心服务器、存储设备。
三级服务器:电子口岸执法系统和QuickPass系统的同机房备份系统和的非核心服务器,如前台服务器和电子帐册服务器。
非等级服务器:电子口岸执法系统和QuickPass系统的同城备份系统的非核心服务器,如前台服务器、MQ服务器和电子帐册服务器。
1.3 网络设备及线路分级原则
网络设备及线路部分包括构成电子口岸执法平台及相关信息系统的局域网、广域网、专网的网络设备及到各节点的网络线路。按照网络设备及线路在系统中的作用及所承载业务的重要性,对网络设备及线路实行分级管理。
一级网络设备和线路:在电子口岸生产系统网络中处于核心地位,能够影响生产系统网络整体稳定性、承载核心业务的重要网络设备。数据中心至海关总署、数据中心到大业务量的核心海关和分中心、数据中心到重要部委、数据中心到互联网等承载电子口岸核心或重要业务的主线路。
二级网络设备和线路:在电子口岸生产系统网络中处于辅助地位或在备份系统中处于核心地位的网络设备。数据中心到一般海关和分中心、数据中心到其他部委、银行等承载电子口岸其他业务的网络线路。
三级网络设备和线路:电子口岸生产系统和备份系统的附属设备,以及备份系统中处于辅助地位的网络设备。数据中心至总署、数据中心到各海关和分中心、数据中心到各部委、银行、数据中心到互联网等线路中,暂时处于备用状态的备份线路。
非等级网络设备和线路:用于电子口岸生产系统和备份系统中冷备及其他用途的网络设备。数据中心至总署、数据中心到各海关和分中心、数据中心到各部委、银行、数据中心到互联网等线路中,暂时或已经不承载业务的线路。
1.4 数据库分级原则
数据库是电子口岸执法平台的关键内容,对电子口岸系统的稳定运行起着重要作用。数据库部分包括构成电子口岸执法平台及相关信息系统的各种类型的数据库。
一级数据库:生产数据库,存储关健业务数据。主运行数据库、QP(通关)运行数据库、QP(电子帐册)运行数据库。
二级数据库:一级数据库的备份数据库。主运行备份数据库、QP(通关)运行备份数据库。
非等级数据库:电子帐册、电子手册托管服务器、租赁空间服务器、各运行系统对应的测试、培训数据库。
1.5 数据传输分级原则
数据传输部分包括电子口岸系统与各海关、部委、银行、现场链接用于数据传输的通道。
一级数据传输系统:生产系统和QP系统核心队列管理器和核心组;
二级数据传输系统:生产系统和QP系统非核心队列管理器、核心通道、核心队列和非核心组,生产系统热备传输系统;
非等级数据传输系统:生产系统和QP系统非核心通道和非核心队列;
第五章 电子口岸信息系统突发事件分级管理
1、突发事件分级原则
按照从外到内,从底层到高层的顺序,将信息系统分为物理环境、基础平台、应用三部分。
突发事件按照对系统的影响程度分为严重、中等和轻微三个等级。
应用 | 基础平台 | 环境 | |
严重 | 应用版本错误,相关配置被篡改,应用挂起、僵死、不可用,造成业务中断,数据积压严重,用户反映强烈 | 1、服务器、数据存储设备宕机、异常挂起; 2、网络设备硬件故障,导致设备不可用,对业务造成重大影响甚至中断; 3、线路故障,导致线路不可用,对业务造成重大影响甚至中断。 4、数据库完全不可用或某一节点不可用或数据库存在严重性能问题 | 由于外界原因造成设备损坏且机房无法进入,或机房电力空调系统出现严重故障,无法继续使用 |
中等 | 应用处理缓慢,导致数据积压较多,有用户反映 | 1、服务器、数据存储设备部分组件发生故障,导致性能大幅度下降 2、网络设备硬件故障,对设备性能造成影响,但仍可用,对业务造成轻微影响; 3、线路故障,导致线路质量问题(如丢包等),但仍可用,对业务造成轻微影响; 4、数据库部分不可用或数据库存在一般性性能问题 | 由于外界原因对系统造成轻微影响,但系统仍可用 |
轻微 | 应用存在数据积压,业务存在延时,但不会中断 | 1、服务器、数据存储设备冗余组件发生故障,没有影响系统性能,但系统存在的某些安全隐患。 2、网络设备硬件问题,对设备性能无影响,对业务无影响; 3、存在一般性故障或有发生故障的可能,但不影响数据库正常使用 | 由于外界原因使机房环境存在安全隐患,但暂时对系统无影响 |
2、电子口岸突发事件级别认定
运行监控人员使用“附录1.8 电子口岸信息系统突发事件分级速查表”,对突发事件进行定级和分级管理。
2.1 一级突发事件
一级基础平台、应用项目、物理环境发生严重、中等、轻微故障。
2.2 二级突发事件
二级基础平台、应用项目、物理环境发生严重、中等、轻微故障。
2.3 三级突发事件
三级基础平台、应用项目、物理环境发生严重、中等、轻微故障。
2.4 非等级突发事件
非等级基础平台、应用项目、物理环境发生故障。
突发事件分级表如下表所示。
第六章 电子口岸信息系统突发事件响应分级管理
1、突发事件响应分级原则
按照突发事件对业务系统连续性的影响程度、突发事件性质、可能的原因判断等,将突发事件响应级别分为一级响应、二级响应、三级响应和非等级响应。
2、突发事件响应级别认定
运行维护人员使用“附录1.9 电子口岸信息系统突发事件响应分级速查表”,对突发事件响应进行定级和分级管理。
2.1 一级响应
- 一级基础平台、应用项目、物理环境发生严重故障;
- 一级基础平台、应用项目、物理环境发生中等故障;
- 二级基础平台、应用项目、物理环境发生严重故障。
2.2 二级响应
- 一级基础平台、应用项目、物理环境发生轻微故障;
- 二级基础平台、应用项目、物理环境发生中等故障;
- 二级基础平台、应用项目、物理环境发生轻微故障;
- 三级基础平台、应用项目、物理环境发生严重故障。
2.3 三级响应
- 三级基础平台、应用项目、物理环境发生中等故障;
- 三级基础平台、应用项目、物理环境发生轻微故障。
2.4 非等级响应
- 非等级基础平台、应用项目、物理环境发生故障。
突发事件响应级别如下表所示。
3、突发事件响应升级机制
3.1 突发事件响应升级机制
当突发事件发生后,工程小组在规定时间内没有完成故障的定位和消除影响,为了保证系统的尽快恢复,原有的响应级别将进行提升,具体包括:
原本二级突发事件,如果在二级响应时间内未完成有效处理,且剩余处理时间小于一级事件的处理时间,突发事件响应则立即升为一级响应;
原本三级突发事件,如果在三级响应时间内未完成有效处理,且剩余处理时间小于二级事件的处理时间,突发事件响应则立即升为二级响应。
3.2 电子口岸突发事件响应升级
电子口岸生产系统中,对不同等级突发事件对应的处理时间定义分别为,
突发事件等级 | 一级 | 二级 | 三级 |
处理时间 | ≦2小时 | ≦4小时 | ≦8小时 |
因此,当突发事件发生后,在特定的时间内没有完成故障排除工作,则需要进行响应升级。
原本三级突发事件,如果在4个小时内未完成有效处理,突发事件响应则立即升为二级响应;
原本二级突发事件,如果在2个小时内未完成有效处理,突发事件响应则立即升为一级响应。
响应级别升级示意图如下图所示。
第七章 电子口岸信息系统突发事件响应及处理流程
1、突发事件响应及处理原则
1、突发事件分级与突发事件响应分级相分离原则;
2、突发事件发生并检测到后,需要立刻进行突发事件上报和响应预案启动等工作;
3、在无法确定突发事件的级别时,突发事件上报及预案启动均采用就高原则;
4、突发事件上报、响应、处理按照“电子口岸信息系统突发事件管理”规定进行;
5、突发事件处理按照“电子口岸信息系统安全应急预案(技术)”指导进行;
6、应急领导小组、应急工程小组人员及其它特定的技术人员保持24小时开机状态。
2 、电子口岸突发事件响应及处理流程管理
2.1 电子口岸突发事件上报管理
1、突发事件级别判定
突发事件级别认定由监控工程师或运行部技术工程师判定,判定依据使用“附件1.8 电子口岸信息系统突发事件分级速查表”。
突发事件响应定级由运行部技术工程师判定,判定依据使用“附件1.9 电子口岸信息系统突发事件响应分级速查表”。
2、上报接口
各部门指定专职上报科室,采用固定接口。
监控部门和运维部门分别指定客服部监控服务科和运行部安全保障科作为上报接口。
3、上报方式
突发事件发生并检测到后,立刻告知部门上报接口负责人,接口负责人登记后,通过专用手机,以群发的方式进行上报和报警。
4、上报对象及告知人
突发事件级别认定为一级突发事件时,须在5分钟以内上报:数据中心应急领导小组所有成员、运行部各科室负责人和特定联络人。
突发事件级别认定为二级突发事件时,须在5分钟以内上报:主管运行的数据中心领导、中心各有关部门负责人、运行部各科室负责人和特定联络人。
突发事件级别认定为三级突发事件时,须在10分钟以内上报:中心各有关部门负责人、运行部各科室负责人和特定联络人。
突发事件级别认定为非等级突发事件时,须在10分钟以内上报:运行部各科室负责人和特定联络人。
5、上报内容
突发事件上报人员上报内容包括突发事件发生起始时间、地点、现象及级别认定情况、可能影响范围等。
运行部上报内容包括突发事件响应级别、对系统影响程度、预计恢复时间等。
突发事件处理后上报内容包括事件原因、处理过程、目前系统运行状况、业务影响时间及改进建议等。
6、突发事件响应
中心各有关部门负责人、运行部各科室负责人和特定联络人在接到一级、二级突发事件报警后,应在5分钟以内呼叫并登录到数据中心应急处理电话会议系统,了解突发事件进展情况,并根据需要到达指定场所。
运行部、技术部、客服部部门负责人、运行部各科室负责人和特定联络人在接到一级、二级、三级突发事件报警后,应在5分钟以内呼叫并登录到数据中心应急处理电话会议系统,了解突发事件进展情况,并根据需要到达指定场所。
运行部各科室负责人和特定联络人在接到非等级突发事件报警后,及时了解突发事件进展情况,并在不影响业务正常运行的前提下尽快处理。
7、信息上报全过程示意图
从突发事件发生、被检测到直至突发事件处理完毕,共需要三次上报过程。
第一次上报:由监控工程师或运行部技术工程师完成。
突发事件发生并检测到后,监控工程师或技术工程师立刻由上报接口通过专用手机上报给相应人员,并通知运行部技术工程师。
第二次上报:由运行部技术工程师完成。
收到突发事件报警信息后,由技术工程师对突发事件进行判断,并迅速确认突发事件响应级别,由上报接口通过专用手机上报给相应领导,并将信息反馈给监控专用手机。
第三次上报:由运行部技术工程师完成。
突发事件处理完毕后,由运行部上报接口报给所有相关人员。上报内容包括处理完毕,目前系统运行状况等。
8、突发事件处理过程持续上报
如果突发事件无法在短时间内解决,则由运行部上报接口需要持续将最新处理情况按照规定通知到相关人员。
突发事件响应级别认定为一级,每30分钟进行一次处理情况上报;
突发事件响应级别认定为二级,每60分钟进行一次处理情况上报;
突发事件响应级别认定为三级,每120分钟进行一次处理情况上报;
2.2 电子口岸突发事件应急响应启动
当突发事件通过各种上报途径上报到中心应急领导小组、主管运行的中心领导、各有关部门领导后,各级别领导应根据突发事件级别认定情况、响应级别认定情况启动相应的电子口岸突发事件应急响应流程。
一级突发事件应急响应预案的启动由数据中心应急领导小组决定;
二级突发事件应急响应预案的启动由主管运行的中心领导决定;
三级突发事件应急响应预案的启动由运行部部门领导决定。
非等级突发事件应急响应预案的启动由运行部科室领导决定。
2.3 电子口岸突发事件关闭
突发事件处理完毕,经确认后,由决定突发事件应急响应预案的启动的领导授权发布突发事件关闭。
第八章 电子口岸信息系统突发事件事后处理
1、事后评估
突发事件处理完毕后,由处理部门牵头组织进行突发事件分析和评估,对突发事件定级和处理流程进行总结,提出相关改进建议。评估内容包括:原因分析、处理过程的经验总结、系统的改进建议等。
2、突发事件处理报告
突发事件处理完毕后,由事件处理部门负责编写突发事件处理报告,报告内容包括突发事件发生的时间、地点、原因、突发事件处理中采取的措施及控制情况和突发事件处理结果等。
由电子口岸应急工程小组组长将处理报告上报给电子口岸应急领导小组,根据需要报告海关总署或通告兄弟部委及海关单位。
由突发事件处理部门负责向领导小组汇报,并提交突发事件处理报告,同时将该处理报告存入案例库进行备案。
第九章 电子口岸信息系统突发事件应急预案日常维护
1、应急预案评估、更新
对制定的预案进行评估,包括预案与实际事件的吻合性,预案的合理性,实用性,可操作性,分析预案在制定和实施过程中存在的问题和缺陷,在此基础上提出相应得整改方案建议,经批准后供应急预案修改使用。
电子口岸应急预案的评估由应急领导小组组织,应急工程小组负责对预案进行评估,并提出整改方案,应急领导小组批准后,方可修改实施。评估工作每半年或应急演练、重大应急响应工作后组织。
2、应急响应培训
应急响应培训用于确保整个应急响应体系和电子口岸内的所有人员具备对信息安全事件的意识和知识,确保所有人员了解电子口岸应急响应的策略和应急预案,并能够熟练执行应急预案。
应急响应培训应建立在日常安全培训的基础上,或作为日常安全培训的一部分,重点培训有关应急准备和应急的各项知识、技术、技能和经验。
应急响应培训的重点应围绕应急预案展开,使所有人员了解各自在应急响应工作中的职责,明确发生信息安全事件时采取的步骤,应急响应培训工作应突出针对应急工程小组的专业培训,根据应急响应工程小组中不同的角色职责,制定和实施有针对性的技术培训。
由电子口岸工程小组负责应急人员培训工作的规划,定期组织对应急人员进行预案内容及各应急处理流程的培训。
----安全工程人员应接受最新的安全漏洞、入侵技术、攻击手段识别及随时评估方面的培训。
----应急工程人员接受有关系统、数据库、网络、应用、机房等安全工具、安全配置管理等方面的培训。
----应急工程人员接受有关备份恢复工具和安全恢复流程的培训。
应急响应培训应定期更新内容,并通过实际的应急响应演练过程,帮助所有人员不断更新应急响应有关的技术和技能,提高各类人员的应急工作熟练程度,提高突发事件发生时应急响应率。应强调培训效果的反馈机制的和培训计划的更新机制,通过考核、演练等方式及时发现培训中存在的问题,依据这些反馈结果调整培训课程设置、培训时间计划以及培训重点,关键岗位的人力资源同样需要备份,对于各关键岗位均必须培训多个能胜任该岗位应急工作的人员,保证工作的连续性。
3、预案演练
为了保证应急的能力,应每年至少组织一次应急行动演练,以提高处理应急事件的能力,进行验证。
应急演练的步骤如下:
- 由应急领导小组确定应急演练的目标和应急演练的范围;
- 按应急领导小组的要求,由应急工程小组制定应急响应演练的方案。
- 应急领导小组调配应急演练所需的各项资源,并协调应急演练过程中涉及的部门和单位。
- 应急领导小组组织相关部门和单位进行应急演练。
- 应急领导小组组织应急工程小组进行应急演练的评估,并通报应急演练的结果。
- 应急领导小组组织应急工程小组总结经验,根据演练结果对应急预案的更新,并对本单位的应急工作进行整改。
- 在每次应急响应过程结束后,应急领导小组应该对应急工程小组在工作中遇到的问题,分析应急响应预案的科学性和合理性,针对预案中的问题向应急工程小组提出修改意见,应急领导小组组织对修改意见进行评估,修改后的预案应经应急领导小组评估通过后,发布实施。
- 应急演练流程图如下:
4、保障措施
有效保障措施是顺利开展应急响应工作的前提,保障措施主要包括人员保障、设备保障、技术资料保障、经费保障和后勤保障。各项保障工作主要由应急领导小组负责协调。
人员保障
人力资源的保障是应急保障措施中的一项重要工作内容。为了提高应急工程小组的人员素质,应针对性制定并实施完善、高效、合理的人员培训和演练计划,以满足应急响应人力资源需求。在应急响应工作中,应急工程小组可根据工作需求抽调各部门人员,各部门工作人员应服从应急领导小组的统一协调和安排。
设备保障
为了保证在发生安全事件时能尽快恢复业务,各技术专业应该提前准备所需工具。
技术资料保障
全面的技术资料是高效的应急响应工作的前提和基础,应急技术资料包括系统、数据库、网络、安全、应用、物理场所等基础,以及厂商、重要客户的重要联系方式,这些资料要统一管理,及时更新,以保证与实际系统的一致性。同时运行部还应定期对系统进行风险评估,及时发现和纠正系统的潜在问题。
经费保障
在应急响应工作中,综合管理部门应对所需的相关经费给予保障。
后勤保障
在应急响应工作中,综合管理部门应做好充分的后勤保障工作,包括应急人员的饮食、交通、通信联络,安全保卫等工作,确保应急响应工作的顺利开展。