{调取该文章的TAG关键词}|西安一码通“崩溃”调查:一场系统性失灵的数字政府再思考 |钛媒体深度( 三 )


阿里云牵扯其中,不仅因为出现在一码通的采购清单中,也因为其负责西安政务云的建设 。政务云核心都采用私有云方式建设,西安政务云也是如此 。
前述接近项目消息人士透露,阿里云智能DNS解析在“一码通”中出现了解析错误问题,两条为“一码通”预留的VIP线路中,有一条出现故障 。此外,RDS数据库中大量慢SQL,也导致了流量拥堵 。这两个问题在后续排查中被快速解决 。
但在后续求证中,阿里云一位发言人直接向钛媒体App否认了上述两个问题,指出云平台遭遇流量拥堵消息失实,这位发言人对钛媒体App回复:“阿里云在西安一码通提供的是云底层设施,没有参与上层的系统搭建 。西安疫情期间,阿里云云平台运行稳定,DNS解析和RDS数据库产品也并没有发生故障,我们的技术团队一直在现场重点保障 。阿里云十分愿意为西安抗疫贡献更多力量 。”
“流量过载,饱和式流量冲到网络防火墙之后,导致流量被拦截,数据请求无法访问数据库,市民信息与后台数据库信息无法比对,最终导致手机端的展示系统无法显示,也就是瘫痪,这个是可以说得通的 。”李冬向钛媒体App表示 。
据钛媒体App了解,西安“一码通”的网络防火墙产品由启明星辰提供 。在一份2020年11月30日发布的“西安市电子政务统一平台网络安全服务外包项目单一来源采购征求意见公示”文件中,采购人为西安市大数据资源管理局,中标金额为392万元人民币,采用单一采购方式,中标方为启明星辰 。
{调取该文章的TAG关键词}|西安一码通“崩溃”调查:一场系统性失灵的数字政府再思考 |钛媒体深度
文章图片

西安市电子政务统一平台网络安全服务外包项目合同
问题到这里并没有结束 。钛媒体App了解到,网络防火墙阈值是可以人为调整和设置的,即便一开始在压测时阈值设置较低,收到报警后可由工程师在后台修改调整,并不需要耗费太长时间 。“但是从西安一码通的故障修复时间看(第一次故障次日修复,第二次故障约两小时修复),网络防火墙出现问题只是表象 。”李冬分析,深层次原因的排查应该在架构设计是否合理,计算存储带宽资源是否充足两个大的层面,而从以往经验来看,责任更多在前者 。
对此,截至发稿前,钛媒体App再次联系启明星辰,启明星辰回复称,一切以官方信息为准,目前官方信息暂未公布,同时启明星辰也否认防火墙本身出现问题 。钛媒体App获悉,启明星辰团队目前在现场积极参与故障的修复 。防火墙只是恰好成为故障爆发的弱环,超出设计本身限制 。
此外,数字政府项目层层分包(运营商以及大型企业都可以作为总包方,也会互相成为彼此的分包商)也是被外界诟病的一点,这在项目层面属于正常现象 。而在西安“一码通”项目中,西安电信作为项目总包,负有验收和把控项目的最终责任 。仅西安“一码通”项目就涉及不下十个分包商,更不要说项目规模更大的城市类项目 。如何做好分包商产品与服务质量管理,是总包以及项目主体不可推卸的责任,特别是涉及民生的关键基础设施项目 。
当汹涌的疫情成为西安“一码通”的新预设条件,这场“违背”预设的系统崩溃似乎也不那么让人意外了 。
现有架构应对高并发,力有未逮西安“一码通”的故障与多年前12306春运高峰宕机、双十一狂欢节淘宝与京东的宕机并无二致 。不同在于,12306与淘宝、京东的高并发是商业性的,而西安“一码通”故障涉及的是民生问题,出现在疫情防控的紧要关头 。

推荐阅读