中国银监会办公厅关于银行综合业务系统故障有关风险提示的通知
(银监办发〔2009〕104号)
各银监局,各政策性银行、国有商业银行、股份制商业银行、金融资产管理公司,邮政储蓄银行:
近期,某银行综合业务系统发生故障,造成综合业务系统故障时间约11个小时,对客户服务中断达4个多小时。为吸取教训,加强风险管理,提高类似事件的防范及应急处置能力,现将事件原因及处置情况通报并作风险提示如下:
一、事件概况及原因分析。2009年1月下旬某日凌晨2点,某银行综合业务系统在进行批处理时发生数据库逻辑错误,由于备份和数据管理策略等因素,当日批处理前备份数据失效,也无法及时获取前一日备份,只能采取由两日前备份数据还原,并回滚两日交易数据予以恢复,当日下午1点后系统恢复运行。总结事件原因,在业务连续性计划和管理方面有以下两点值得注意:
(一)数据备份、保管、恢复策略应合理制定,确保备份数据在应急处理中能够发挥作用。本次事件中,该行采取的备份策略是本地备份当日批处理前数据、异地备份最近一日数据,而数据库错误发生在当日备份之前,致使本地备份无效;异地备份数据存放在另一分行金库,而开启金库需要5名人员同时赶到才能操作,致使备份数据在应急处置时无法使用,只能以更早的备份数据进行恢复,增大交易日志回滚量,延长了系统恢复时间。
(二)在软硬件产品支持服务方面应加强与系统厂商的联系。系统故障发生前一日,该行曾在双机热备系统环境下采用热插拔方式更换综合业务系统存储器缓存卡。事后,据系统厂商对主机系统、存储设备、数据库日志进行分析,表明由于该行综合业务系统各部件存在旧版本软件,该变更触发了系统未知错误,导致数据库产生不可用错误。
二、事件处置经验。本次事件对该银行运营产生了一定影响,但由于各方应急处置较得当,将损失降到较低水平,以下几点可供借鉴:
一是及时启动应急预案。在系统故障出现后,该行及时启动了重大突发事件应急预案,成立应急小组分工负责系统故障排除与恢复、业务应急处置、事件报告与对外信息发布,确保在突发事件处置期间“急而不乱”、“忙而有序”。
二是同业支持,共克难关。及时向属地监管部门报告,协调妥善处理资金汇划、清算等事宜,并请当地银行业金融机构进行技术支援,在应急情况下采取正确恢复策略,为最终排除故障发挥了重要作用。
三是应急手工服务,减少影响。各营业网点及时做好客户解释、服务工作,对务工人员春节前集中提现、退休人员领取养老金等特定群体服务需求,及时通过手工操作在规定的限额内办理,超限额批准后办理。