在大田国家信息资源管理院(国情资源)机房发生火灾,导致27日政府业务系统647个停止运行、给公众带来不便之际,有舆论指出,云环境双活/冗余建设不充分 加剧了本次事态。
27日,大田市儒城区国家情报资源管理院(国情资源)机房的窗户因火灾破碎。前一天,承载政府计算机系统的国情资源发生用于不间断电源装置(UPS)的锂离子电池起火事故,导致政府计算机服务大面积瘫痪。联合通讯社供图
26日晚上8点20分左右,大田儒城区华岩洞国家情报资源管理院发生锂电池火灾,消防当局正在进行灭火作业。联合新闻提供
26日晚上8点20分左右,大田儒城区华岩洞国家情报资源管理院发生锂电池火灾,消防当局正在进行灭火作业。联合通讯社供图
27日上午,在首尔钟路区政府首尔办公大楼新闻发布室举行的“国家情报资源管理院政府服务故障相关发布会”上,包括行政安全部次官 Kim Minjae 在内的与会者正在致意。自左起为消防厅装备技术局局长 Yoon Sanggi、行政安全部数字政府创新室室长 Lee Yongseok、Kim 次官、国家情报资源管理院院长 Lee Jaeyong。联合通讯社提供
国情资源火灾,暴露云端双活体系缺位 如果事先建立了配置相同的“孪生”云系统 ,一旦某一处发生灾难,就可以在另一处异地承担功能,从而避免大规模故障,但目前此类服务的双活(备份)体系 被指尚未真正建立起来。
行政安全部次官 Kim Minjae 当天在政府首尔办公大楼举行的简报会上表示:“此次火灾是在为将国情资源的不间断电源装置电池迁移至地下而进行作业时,在电源已被切断的一块电池上发生的”,并称:“将优先迅速恢复邮政金融和邮政等对国民影响较大的主要政府服务故障。”
李在镕 国家信息资源管理院院长(右)27日上午在首尔钟路区政府首尔办公大楼简报室举行的“国家信息资源管理院政府服务故障相关发布会”上回答记者提问。联合新闻提供
원본보기 아이콘
“如果有‘孪生云’,本可避免大规模故障” 前一天发生火灾的机房据悉是国家信息资源管理院自主管理的名为“G-Cloud Zone”的私有云环境。 该区域的灾难恢复(DR)系统属于 既需要服务器DR又需要云DR 两种机制并存的环境。但据分析,国情资源虽然已经具备服务器灾难恢复环境,却尚未完成云灾难恢复环境的建设 ,从而导致政府系统全面宕机,放大了本次事态。
3年前Kakao事故的“既视感” 有观点指出,此次夜间国情资源火灾引发的政府系统瘫痪,与3年前Kakao服务瘫痪事件如出一辙 。2022年10月,部署KakaoTalk服务器的数据中心发生火灾,包括国民常用即时通信工具KakaoTalk在内的大部分Kakao服务同时出现故障。当时经过通宵抢修,KakaoTalk等部分服务恢复正常,但大量用户在此过程中遭遇不便,引发混乱。
左为 Namgung Hoon、右为 Hong Euntaek,两位 Kakao 各自代表于2022年10月19日在京畿道城南市 Kakao 盆唐据点,就数据中心火灾引发的大规模服务瘫痪事件向全国民众公开致歉。
2022年10月19日上午,Kakao 各自代表 Namgung Hoon 在京畿道城南市板桥 Kakao Ajit 就“因数据中心火灾导致服务中断”召开全国记者会途中神情凝重。Nam 代表在当天记者会上宣布辞去 Kakao 代表一职。联合新闻提供
2022年10月15日下午,在发生火灾的京畿道城南市盆唐区三坪洞SK板桥园区A栋前,智能手机的Daum应用程序屏幕上显示错误信息。此次火灾目前已导致KakaoTalk、门户网站Daum等出现通信故障。 联合新闻提供
16日,在京畿道城南市 SK C&C 板桥园区 A 栋火灾现场,京畿消防火灾调查相关人员正进入现场。前一天下午3时30分左右,SK C&C 数据中心发生火灾,导致 Kakao、Naver 等服务器入驻企业的服务接连瘫痪。尤其是 KakaoTalk 聊天工具、门户 Daum、KakaoT、KakaoPage、KakaoPay 等 Kakao 各项服务全面出现故障,全国范围内约10个小时以上处于“全面瘫痪”状态。/ 记者 Kim Hyeonmin kimhyun81@
Kakao以此次瘫痪事件为契机,宣布将灾难恢复系统高度化为由3个数据中心联动的三重以上冗余架构 ,并承诺通过改善基础设施等措施强化服务稳定性。Kakao瘫痪事件曾引发社会混乱,数据中心管理的重要性一度成为舆论焦点,但如今国情资源再度发生火灾,管理缺失问题再次暴露无遗。
国家情报资源管理院火灾现场痕迹。韩联社供图
원본보기 아이콘
云计算行业一位相关人士表示:“鉴于相关资源的重要性,发生火灾的区域在灾难恢复(DR)系统方面,既需要服务器DR,又需要云DR这两种机制并存”,“火灾本身是首要原因,但由于云DR系统未能完善,才导致政府系统全面宕机并引发混乱。”
因预算等问题推迟……双活建设未能推进 另一方面,据悉国情资源大田本部原本计划与公州中心建设双活体系,但因预算等问题而被推迟 。今年年初,在提出云灾难恢复系统建设的具体方案后,曾制定在5年内分阶段迁移的计划,并打算自明年起开展详细咨询工作,但在此过程中,也出现了反对将政府云迁移至民间部门的意见。
Reporter
Seo Sojeong ssj@asiae.co.kr
subscribe icon 订阅
Edit
Hong Jayeon hongzaa@asiae.co.kr
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。