文/胡世龙
大数据时代,真正体现数据价值的可能不只是数据量的大小,而是数据的开放与融通。通过开放数据,让更大的社会和商业价值释放出来。在这方面,政府究竟能够扮演一个怎样的角色,上海提供了一个很好的观察样本。
DT君说
如果你生活在魔都,常坐公交,又讲求时间效率,那么“上海公交”这个APP一定是你的好伙伴。这个由上海交通部门开发的APP,实现了上海主城区内公交运营实时数据的整合,乘客可以便捷查询公交到站时间、规划线路。
如果你觉得每月缴纳水电煤不够方便,也厌倦了在不同的政府网站分别查询自己的社保、公积金等各种信息,你可以在“市民云”这个由上海市政府支持的城市公共服务平台上一站式搞定。
在上海,这种由政府整合内部数据、打破各部门的信息孤岛,让数据融通从而更好发挥公共数据社会价值的例子还有不少。而这背后,和上海近年来对政府数据共享开放的理念和持续推动不无关系。
上海在数据开放方面一直很积极,不少理念和做法都走在了全国前面。早在2012年,这里就设立了全国首个政府数据服务网站——上海市政府数据服务网(见截图)。2015年4月,市政府在经信委内部成立了专门的“大数据发展处”,负责全市大数据发展的顶层设计和统筹协调。同样是2015年,上海开始举办“上海开放数据创新应用大赛”(SODA大赛),通过大赛推动各个部门的数据开放。DT君去年也深入参与并报道了SODA大赛。
最近,DT君采访了上海市经信委大数据发展处崔艳春副处长。采访围绕SODA大赛、上海数据开放理念、数据开放的下一步等话题展开。DT君深刻的感受到,政府究竟能够在开放数据上扮演一个怎样的角色,上海提供了一个很好的观察样本。
(注:以下为采访实录,文中小标题为DT君所加。)
一个数据比赛,盘活了一众政府企业的数据开放
DT君:上海创办SODA大赛的背景和初衷是什么?
崔艳春:上海的信息化建设起步比较早,2012年时上海就启动了政府数据的开放工作。(DT君注:这一年上海建立了上海市政府数据服务网,是全国首个政府数据开放网站)一开始是找了9家数据比较丰富的部门做试点,后来到2014年的时候,是进入全面推进阶段,整个市一级的46家部门都加入到数据开放计划中来。
经过2、3年的推进,政府部门一点点在开放思想,把数据往网站上放。但我们发现整个网站的浏览量、下载量的效果不如我们预期那么好,当时就认为社会各方包括企业,对开放数据的认识还不是很清晰。
所以后来就想到办这个大赛,最早一届是在2014年,但当时还没有用SODA这个品牌。2015年时,我们正式命名为上海开放数据创新应用大赛(简称SODA)。办这个比赛也是为了通过这种形式,一方面加大社会各界对政府开放数据的认识,积极参与到我们的开放工作来,增加对政府数据的深度挖掘,从而促进社会和企业的创新创业。第二个方面也是希望政府带头,吸引更多的企业,参与到我们数据开放的生态圈中来。
DT君:SODA大赛对上海的数据开放工作,起到了怎样的效果?
崔艳春:比赛对于政府数据的开放,是有促进作用的。我们在2015年以前,政府数据开放网还是以excel这种静态数据的形式为主,对企业来说可能不解渴。后来到大赛之后,很多政府部门比如最早参与这个比赛的交通委,也觉得通过开放能得到社会肯定。从这个角度来说,大赛对其他政府部门的数据开放也有促进作用。
到了2016年,我们的网站上已经有很多的web service接口数据,现在已经有200多个,这个可能是更契合企业的需求的。
目前,上海的政府数据开放网的数据集数量已达1254个,覆盖了经济建设、文化科技、信用服务、交通出行等12个重点领域,提供数据产品、应用、APP、接口等多种开放格式。
另外,通过我们的数据开放网,对其他行业的数据开放和区域的数据开放也有促进作用。比如浦东现在也有了自己的开放数据网,闵行也有,在市一级的示范作用下,各个区都在加快步伐推动。
而行业性的数据,比如上海气象局就有大量的气象数据,他们现在也在策划建立专门的气象数据开放网。
数据开放的障碍,不在技术在机制
DT君:政府数据开放的最大的阻力在那些方面?
崔艳春:从技术上来看,没有太大的障碍,因为现在技术发展很快,更大的问题还是在于机制体制上。
这块有三个方面因素。一个是法律法规方面,政府数据的共享开放还没有相关的法律保障。这就给一些部门带来一些顾虑,开放出去了之后谁来负责数据的质量,如果质量有问题,是不是开放部门要承担相应的责任。他们其实是有顾虑的。
第二个方面,是现在的数据治理能力还不足、数据的标准也不统一。政府部门中,信息处理能力比较强的,本身的数据基础比较好的,开放数据的意愿、能力就比较强,而一些信息化处理能力较弱的部门,可能能力上也达不到,开放出来的数据的质量未必能符合用户的需求。
还有一个方面,在数据安全方面。这个也是我们比较谨慎的方面,因为单一领域的数据,我们开放出去也许没有问题,但是很多政府部门的数据融合应用了以后,会不会产生新的风险?以我们目前的经验是很难去研判的。
DT君:上海在减少数据开放的阻碍方面,做了哪些努力?
崔艳春:我们也是在做政府数据开放的过程中,意识到这一领域是有法律法规的缺失,另一方面可能也有一定技术方面的风险。
所以我们也是一边在推进一边在摸索,一边也在及时地“打补丁”。上海现在已经在立法方面开始做相关的课题研究,去年我们是出台了一个数据共享的管理办法,今年我们在做数据开放的管理办法的相关研究,希望在今明两年能够在全国率先推出一个针对数据开放方面的管理文件。
当更多城市扎堆数据竞赛,上海样本的下一步?
DT君:上海是如何打破各个政府部门间的“信息孤岛”的?
崔艳春:这个我们是跟数据开放同步在做的。我们2012年启动数据开放这项工作,当时定位就是“共享与开放”。共享,对政府内部,其实就是指数据孤岛的打通,各个部门的数据的融合。
各个政府部门的数据,都可以在数据开放平台上看得到,也建立了共享的通道。一个部门需要另一个部门的数据,也可以在这个平台上进行申请。
上海本身在基础数据积累方面,已经是非常丰富,我们有法人库、人口库、空间地理库等,基本上这些基础的数据我们都已经做了一定的汇聚,各个部门、区县街道都是可以调用这些数据的。
DT君:很多国内城市也开始办类似的数据开放大赛,和这些城市相比,上海在数据开放方面的做法和他们相比有什么不同?优势在哪里?
崔艳春:2015年的时候,还只是上海的SODA大赛,但2016年,全国各地的相关比赛越来越多。不仅是各个地方,各个行业等,都在办各种各样的数据比赛。这其实也是我们希望看到的。
我们每年都委托第三方机构对上海的SODA大赛和数据开放的效果做评估,并和全国其他城市进行评比。上海这两年总体还是保持在第一的位次。但我们现在也有很大压力,因为已经开始有一些城市,在单项指标上超过了上海。
怎么样能够在全国这么多大赛里面,继续保持SODA的领先?今年我们在SODA的大赛设计方面,也在思考怎样做转型。
上海是国际化都市,所以我们会往更国际化的方向转变,比如说,去年的比赛已经有国际化的团队进来,而且拿到了第2名的名次。今年我们会跟香港、澳门合作,因为他们都在办这样的比赛,我们也在和英国做更加紧密的合作。国际化,这是SODA保持领先的一个优势。
第二个优势是更多的企业能够参与。SODA的初衷是政府拿出数据,带动企业拿出数据,政企数据能够进行融合。
现在很多地方的比赛,要么是纯企业的数据,要么就是纯政府性质的数据,而SODA这样从一开始就把政府和企业的数据放一起来考虑的还是比较少的。这个也是我们的优势。
第三个可能是市场化。我们目前也考虑让SODA大赛更多向市场化方向转变。包括运营主体、运营方式等。我们现在在做这方面的研究,但是还没有完全确定下来。
如何加入数据侠
“数据侠”栏目网罗全球最IN的数据侠客,利用人工智能、机器学习等各种前瞻算法,从数据的视角洞察消费生活的方方面面,打造理性酷炫、活泼有趣的数据分析盛宴。用大数据,阐述事实及其背后的故事和逻辑趋势。
DT时代超级英雄正在组队!你也想要成为数据侠吗?请将你脑洞大开的数据作品,发到数据侠联盟盟主程一祥邮箱:chengyixiang@yicai.com。