1、引言
大数据时代来了。从 2012年开始,全世界掀起了一股大数据热潮,各行各业都受到了它的冲击,似乎一夜之间人人都在谈大数据,从 Google预测流感、 Twitter预测股市、到其实流传已久的 Target超市与怀孕少女、啤酒与尿布、榨菜指数等故事都成了有关大数据的谈资。在亚马逊中国的图书排行榜上,维克托·迈尔·舍恩伯格的《大数据时代:生活、工作与思维的大变革》成了 TOP 10的常客,高居 2013年亚马逊图书总榜的第 11位,京东图书总榜的第 5位,作为一本科技类图书,这是个前所未有的惊人成绩。
大数据的火不仅体现在畅销书上,也反映在了搜索引擎和社交媒体上:根据百度的搜索指数,从 2012年 5月开始,此前搜索指数几乎为 0的“大数据”一词异军突起,瞬间超越了“城市规划”的搜索指数,并持续攀升,一直保持着搜索热词的地位, 2014年以来“大数据”的搜索指数已经达到了“城市规划”一词的 10-20倍。在社交媒体上,截至 2014年 8月 20日,新浪微博有关“大数据”的微博有 4900余万条,“城市规划”和“城镇化”加在一起也只有 1000万左右。
图 1 百度搜索指数(大数据、城市规划)
由于概念所处的领域以及概念的受众面不同,上面这些搜索量的直接对比其实没有很大的意义,其价值在于我们规划人对“城市规划”一词的敏感度相对较高,容易形成有关“城市规划”信息的直观认识,因此这种量级的对比可以有助于我们从直观感受上体会“大数据”概念的热度。大数据不只是一个口号,也不仅仅是一个 IT技术术语,不能简单的将其视作某种技术,更不能孤立的看待它。大数据对于城市规划意味着新数据,新技术和新思维,甚至是新的规划方法论。
2、新数据
从新的数据资源的角度看,当下所提到“大数据”在很多场合其实并非是严格技术定义上的“大数据”,很多被纳入大数据语境、当作大数据时代的案例的数据其实并不是具备所谓 4V特征(Volume、Velocity、Variety、Value)的巨量数据,而之所以它们被当作大数据来讨论,是因为相较于其他时期,大数据时代的最大变化在于数据在线、开放了,开放数据中真正可直接获取的大数据资源是有限的,而“小数据”则开放程度高得多,所以大数据时代在这种意义上可以等同于开放数据时代。随着储备的数据资源增多,如何激活数据的价值,使数据活化,让数据和数据之间建立联系成了各界共同关注的问题。越来越多的政府部门、互联网公司、NGO组织都开始积极推进数据的开放,百度、阿里等互联网巨头都成立了促进数据开放的部门,此外在国内还诞生了以数据堂( DataTang.com)为代表的数据共享、交易的商业平台。
这些开放数据组织、网站的出现使城市规划、城市研究工作获得了新的数据来源。规划工作传统的数据基础高度依赖官方的测绘数据、统计资料以及政府的行业主管部门的官方数据。开放数据运动正在改变这一切,开放的地理数据(包括公众通过众包行为上传的轨迹数据、标注的 POI、道路数据、界线数据、建筑物模型数据等)、开放和半开放的社交网络数据、开放的政府数据、开放的科研数据等都成为传统规划数据获取渠道的优质替代者,并带来了传统规划数据获取渠道无法获得的新数据。
图 2 开放数据平台示例
比如开放街道地图( Open StreetMap)等开放地理数据使我们可以在不具备官方测绘资料的情况下开展城市研究和规划工作。 2013年北规院开展了《多源社会数据的智能获取与规划应用》课题,对互联网上的主要开放和半开放数据资源——尤其是开放的地理信息资源进行了探索和分类,并针对不同网站特征收集和开发了若干抓取工具,进行了比较系统的数据获取工作,生产了一套由点、线、面和社会属性(来自于政府资源网、企业黄页和安居客等房地产信息网站)构成的新空间数据。这些数据成了北规院开展诸多规划和研究项目的重要数据支撑。
图 3 《多源社会数据的智能获取与规划应用》课题示例
1/4 | 1 | 2 | 3 | 4 | > |
版权声明:
凡本网注明“来源:中国城市规划网”的所有作品,均为本网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中国城市规划网”。违反上述声明者,本网将追究其相关法律责任。授权事宜请邮件至www@planning.org.cn,中国城市规划网保留最终解释权。
凡本网注明“来源:XXX(非中国城市规划网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。