随着大数据时代的到来,人们获取数据的设备越来越先进,数据的存储及处理更加便捷,数据信息也越来越多。据不完全统计,现今全球每两天产生的数据量相当于人类有史来至2003年的产生数据总量。大数据时代,庞大的数据和城市规划之间能发生怎样的关系?
挑战: 共享是难题 技术是瓶颈
随着网络技术的发展,互联网已经遍布全球,但是依然存在着城市规划中数据难以获取的窘境。由于技术、体制、成本的影响,只有一些公司和政府才能对大数据资源进行收集、存储、和处理,因此,政府掌握了大数据的绝大部分,这对城市规划者在规划中无疑是一个非常大的挑战。
在城市规划中,城市的空间尺度较大,系统性繁杂导致规划者必须以不同的视角去研究城市,然而大数据的类型多、数量大,而且大多是跨行业数据,所以它们所利用的理论和方法都不一样,并且许多理论方法还尚未成熟,从而导致在数据的处理上增大了困难,一些数据理论还没有形成完整的理论体系,这给城市规划工作带来了巨大的挑战。
此外,城市规划的研究必须对社会群体和市民个体的意愿进行研究和分析,这就会深入到社会群体当中,也很容易涉及到个人隐私问题,这对大数据时代的数据伦理和安全产生了很大的安全隐患。
全样本是空中楼阁?
盲目的大数据崇拜者认为,在大数据时代任何事物都可以量化,而且通过发达的科技手段可以获得不间断的普查数据,足以达到“全样本”覆盖和“全样本”分析,避免了样本偏差问题,可以彻底淘汰传统统计学的小数据调查和分析方法。然而,在现阶段,先进的科技手段可以帮助人们获得很多的样本数据,却仍然不能获得“全样本”数据。
大数据可以为城市规划提供丰富的数据,然而在大数据时代初期,数据源还不能达到“全样本”的水平,城市规划依然面临着众多数据“陷阱”,如果不重视数据的质量问题,极有可能造成重大的偏差。因此,在城市规划的大数据应用中仍然有必要使用小数据统计调查的理论模型和分析方法,检验大数据的质量,并探究提升大数据质量的新方法。
相关关系取代因果关系?
有观点认为,大数据分析的样本更好、人工智能算法分析不带人为偏见和计算系统的能力非常强大;与传统分析方法比较,大数据分析可以发现更多的相关性,不需要因果关系解释现象背后的原因,甚至可以不需要学科专业知识足以生成更准确的结果。然而,依靠相关性分析而没有专业知识解读,一旦条件发生变化,便难以对预测模型做相应调整,极易出现错误。例如,谷歌公司作为大数据应用的先锋,其2009 年推出的“谷歌流感趋势”(GFT)是作为成功应用大数据而被广泛引用的案例。但是, 在2012~2013 年的流感季节,“谷歌流感趋势”预测门诊数量是美国疾病预防控制中心(CDC) 记录数量的两倍,出现了严重的错误。
不可否认,大数据如同20 世纪50年代的“数量革命”,将极大地推动城市规划的发展。但是,“数量革命”中也出现过类似“谷歌流感趋势”的错误,即用完全数值化、算式模型的方式研究社会人文问题,从而受到了尖锐的批判。由于随着分析数据的增加,结果中的伪相关将以指数级别增长,大数据应用遇到的类似问题将会更突出。鉴于城市规划的大数据应用仍处于探索阶段,因此需要借助城市规划专业的理论和知识来阐述数字代表的信息,寻找其相关性,辨析潜在的因果关系。
一方面,经济的迅猛增长,带来城市空间的过度使用,留下了很多粗制滥造的东西;另一方面,人类个体生活条件的改善,使人们对生活品质有了越来越高的要求。这种态势下,也促使城市规划由过去的单一的增速考量转为追求公平和社会综合发展。过去,规划行业主要强调空间技术管控,各要素间基本是平行的、无交集的。转型后,规划行业更需服务于城乡治理、城市运营。大数据时代背景下的城市规划,虽然目前尚且存在众多问题,但是城市已然在由“规画”慢慢转向“规划”。
版权声明:
凡本网注明“来源:中国城市规划网”的所有作品,均为本网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中国城市规划网”。违反上述声明者,本网将追究其相关法律责任。授权事宜请邮件至www@planning.org.cn,中国城市规划网保留最终解释权。
凡本网注明“来源:XXX(非中国城市规划网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。