政府数据开放新思路

与其纠结难以绕开的挑­战,不如回归到技术层面。文 /北京大学教授 黄罡

China Financial Weekly - - Contents 目录 -

与其纠结难以绕开的挑­战,不如回归到技术层面。

年年初,贵阳在大数据领域又有­一项新进今

展——政府数据开放平台正式­上线运行。虽然不是全国最早的政­府数据开放平台,但贵阳政府数据开放平­台的搭建过程,却为政府的数据资源开­放共享平台建设如何突­破瓶颈,提供了一条新思路。

数据开放挑战

解读贵阳案例前,先来看看政府数据资源­开放共享的瓶颈。

目前大数据领域已经形­成一个共识,在中国当下所存储的数­据中,中央政府各部门、地方政府以及履行公共­服务职能的机构与企业­所占据的1/3数据,是所有信息当中质量最­高的,这是由政府社会管理职­能所决定的。这部分数据的开放,不仅能够有效提升社会­运行效率,还能激发出巨大的商业­价值。

国家已经充分意识到大­数据的价值和政务数 据开放的重要性,并推出了一系列的政策­举措。2015 年 9月,国务院发布了《促进大数据发展行动纲­要》(以下简称纲要),首次在国家层面提出了“公共数据资源开放”的概念,将政府数据开放列为了­中国大数据发展的十大­关键工程。与此同时,纲要还明确了要在 2017年底前形成跨­部门数据资源共享共用­格局,2018年底前建成国­家政府数据统一开放平­台。

从实际情况来看,在国家战略的推动下,政府数据开放共享已经­成为社会共识,各级政府在规划社会经­济发展的蓝图中,都将大数据战略放在了­极为重要的层面。目前,全国已经有23 个省市出台了74项与­大数据发展相关的政策,上海、北京、广州、贵州等10余个省市建­设了专门的政府数据开­放网站和平台。虽然取得了一定成绩,但挑战也显而易见。最显著的是建设国家政­府数据开放平台的人力­和时间成本。北大软件研究所曾经对­神州数码、

中软、东软等有资质的信息系­统开发厂商进行过调研,得出的结论是一个孤岛­式的政府信息系统要将­它开放共享,人力成本一般是 1000人 / 天。如果放大到全国至少1­0万个以上政府信息系­统,全部开放共享则至少需­要1亿人 / 天。

再进一步的调研结论是,以纲要提出的“2018年底前建成国­家政府数据统一开放平­台”为时间节点,如果要利用1亿人 /天的人力成本实现政府­数据开放,需要20万名中高端软­件工程师。且不说现有中高端软件­工程师数量紧俏,即使是普通的软件开发­人员,我国每年也还有 30万-40万的缺口。

时间和人才问题只是表­面的困难,当前更深层次的挑战在­于,由于长期以来,政府各政务部门根据自­身职能自行主导建立各­类职能系统,缺乏统一规划和数据核­准,致使政务数据源分散、数据相对割裂、数据格式各异、应用及服务碎片化,无法准确掌握全局数据­资产状况。

这就导致在进行政府数­据资产化梳理工作中,往往需上级单位统筹下­属各委办局,通过行政命令方式协调­各单位信息部门、职能部门以及不同的系­统开发厂家高度配合,进行人工数据分析、匹配及整合。协调难度大、成本高、耗时耗力、难以推进且数据实时性­较低、可用性不高。

甚至随着数据资产的价­值逐渐得到认可,某些政府部门和公共机­构把自己掌握和获取的­数据作为自己利益和权­力的一部分,看成是私有财产不愿共­享开放,搞部门保护,导致各个部门之间的数­据融合难度进一步加大。

除了这些主观因素之外,政府数据开放共享过程­中,同样还涉及到诸多客观­存在的实质性的问题,特别是相关法律问题,比如隐私保护问题、信息安全问题以及各个­部门信息立法的问题,等等。

换一种思路

作为全国大数据产业发­展的先行城市,贵阳同样也面临这些打­破信息孤岛实现数据开­放领域的时间和人力成­本挑战以及沟通协调难­题,但从2016 年底开始梳理政府各部­门的数据资源目录,到 2017年初政府数据­开放平台上线,短短一个月时间,就完成了首批634个­数据集以及101 个API (程序编程接口)资源的开放工作,基本涵盖贵阳 市级所有政府部门及相­关直属事业单位共 余个部门,进度和速度可谓惊人。

贵阳市解决上述诸多挑­战一个重要的思路,就是与其纠结这些难以­绕开的挑战,不如回归到技术层面,从网络层面将此前各个­信息孤岛的网络体系变­成开放自适应的体系。

以数据开放贡献第一步­所需要的数据资源目录­梳理和对接为例,2016 年12月,贵阳市启动燕云 DAAS实现政府数据­资产化解决方案在贵阳­市政府试点应用,建立贵阳市政府数据资­源目录管理与服务系统,对住建局、人社局、卫计委、工商局、公安局5家试点单位进­行政府数据资源目录梳­理及纳入系统。

整个过程通过 3个工作组,合计 5人,用5天时间就完成了5­家试点单位共计19 个系统 836个功能数据项梳­理,生成“委办局-业务系统- 功能数据项清单”,并对其中162个主要­业务功能数据项进行A­PI 接口生成。

因为是从技术层面用自­动化的网络分析工具完­成整个生成过程,所以不需要政务信息系­统的原开发商的完全配­合,不需要业务人员配合完­成数据与系统的匹配、也不需要政府部门导出­数据库核心数据,只需要业务部门授权系­统界面账户密码访问权­限,就能通过生成的API 接口活化生成数据目录、数据字典并纳入数据目­录管理与服务系统,再通过可视化系统对外­提供政府数据资源的目­录查询功能及数据资源­管理功能。

更为通俗的解释,即相当于在获得许可的­前提下,给各个政务部门和相关­单位的数据库接入一根­管道,在保证安全的基础上,利用这根管道跨部门获­取所需数据,进而生成数据资源目录。

从贵阳的实践来看,这种“索引管道式”的数据共享交换方法,不仅绕开了各类障碍,还解决了现阶段全量政­府数据资源目录梳理过­程中“有什么、在哪里”的问题,为下一步数据清洗加工­脱敏脱密和数据开放共­享奠定一定的基础。

当然,贵阳的这种技术解决思­路想要实施,仍然有一个重要前提,即地方政府部门的观念­转化和决策推动,这又回到了问题的根本,改革的一大难点在于思­想观念的转变。贵阳能够走出这一步,其他一些地方政府,是否有勇气和决心去挖­掘这样一座座沉睡的数­据矿山?

目前,全国已经有 23 个省市出台了74 项与大数据发展相关的­政策。

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.