关于GIS、地理学、大数据,你必须要知道的

2017年01月08日 09:55  点击:[]

【新课程!城市大数据实操攻略】12月11日北京开营,火热报名中!面向城市研究和规划工作者的个性化定制课程,从大数据基础、互联网大数据、轨迹大数据、大数据可视化、Python、机器学习、到 R,城市数据师需要具备的一切技能都在此!(点击看详情)


派姐(城市数据派创始人)

很荣幸城市数据派作为2016第13届中国地理信息科学理论与方法年会(GIS年会)的官方合作媒体。感谢深圳大学,2016第13届中国地理信息科学理论与方法年会 授权【城市数据派www.udparty.com】发布以下内容。


来自北京大学刘瑜老师是2016年度国家杰出青年科学基金的获奖人,作为本次GIS年会的开场嘉宾之一,刘老师对地理学和地理信息科学做了一番深入系统的思考,从理论起源、现实应用,到大数据,特别值得GISer们细细品读!



我的报告题目是《关于地理学与地理信息科学的一点思考》。这个题目有一个缘起,我入北京大学后发现是地理系,就在思考地理学是干什么的,地理学应该做些什么东西。这个困惑一直是伴随着学习和工作,研究。这些年我作为一个旁观者发觉GIS这个学科是感受到一点压力,有的说法是从业界看来说GIS存在IT化的问题,我也看到一些从事GIS的学者都转到了遥感领域,好像GIS不太好做。那么我们GIS能做些什么东西?我自己的思考认为GIS是大有可为的,更多的应该和地理学结合起来,我们应思考地理学的基础问题使学科基础变得更强,这样GIS才能做大。


我的汇报从四个方面来展开:

首先是我对GIS和地理学的一点看法;

第二个是对于基本地理规律的GIS实现;

第三个是考虑到人文要素分析的GIS实现;

最后是大数据带来的机遇的思考。


这是GIS的定义。那么关于GIS一直有两个看法,一个工具集,ArcGIS提供了很多的分析方法,解决很多问题。另外更高大上的说法是Goodchild在1992年所提出的一门学科:地理信息科学。


对于地理信息科学有很多的定义,我特别喜欢的是 D.Mark 的一个定义,他说GIS是在地理信息系统的语境下,研究地理学的基本概念以及使用。这里有2个相关的论断,第一个是我的博导杨芙清的观点:软件是固化的思想。把这个观点引申到GIS,做为一个软件系统,在固化一些思想,固化什么思想呢?就是地理学里面的思想,形成的概念、准则、定律,通过形式化的方式在GIS里面加以体现。


另外一个更直接的论断就是遥感所的承继成教授的说法:GIS就是地理学。他和地理学是密不可分的。


下面是我对两位前辈的一个诠释:GIS超脱人文和自然地理学,实际上是对现实世界的抽象,比人文地理学和自然地理学更抽象一个层面,是地理学的形式化。


如果GIS要作为地理学的基本概念的话,需要研究什么问题?首先要思考,为什么会有地理学?有一个被大家所接受的,就是地理环境存在异质性,如果地理环境都是一样的,那地理学就不复存在了。最早提出这个观点的是德国学赫特纳,提出从空间差异的角度提出地理学存在的必要性。他的思想后来被美国地理学家哈特向进一步发挥,最近的一个观点就是宋长青老师在地理学的研究范式里指出地理经验科学研究范式的内在假设是地理空间绝对的差异性,是地理分异的基础,也是地理学科存在的必要条件。


地理异质性来考虑的话,是不是只有异质性就足够了?古代的地理学确实在做这样的事情,中国的西方的都在描述不同地方的地理环境差异,是描述性的地理科学,对于描述空间分异是足够了。但是作为现代科学,只是描述足够了吗?作为一个现代学科是不够的,需要在描述差异性的时候找到规律性



从空间分布形态进而找到格局模式、相互作用、演化过程、驱动机制,进而服务我们的决策过程,这一切形成了地理学研究的一个系列,这个系列的根是什么,就是从形态开始,这里我们先观察到有垂直地带性的分布,然后去探讨规律性,用一个模式去表示。


所有的空间分布都可以用一个场模型去表达。什么是场模型? 时空中的一个点,都可以映射到一个值,右边是一个人口的分布,也是一个场模型,这些场模型都有特定的空间分布形态,有空间异质性的存在,更重要的我们发现还有规律在起作用,就是空间的自相关,就是第一定律所描述的地理学本质特征。



基于这样的特征才有可能发现规律和模式,否则就像左图,如果我们地理学像这样完全随机的高斯噪声,找不到规律,幸运的是没有地理想象像左边或右边这样分布的,他用一个简单的方程简单的函数就能把一个地理想象描述出来。我们的地理想象实际都处于这两者之间,这样一方面要刻画局部的异质性,另一方面要找到全局的规律性,这也是我们GIS的使命


所以我认为GIS作为一个工具,恰恰体现了可以同时表述空间的异质性,比如说通过空间数据库,北京人口上海人口多少,表达了空间分异,另外有一系列的共性的分析法则,体现地理学的基本规律,所以我认为GIS体现了地理学的异质和统一的完美的结合。


回到地理学的定律上来讲,大家知道在物理学上有很多漂亮的定律,但在地理学上定律很少,大家都耳熟能详的有拓普雷的第一定律,中间Goodchild的观点我觉得特别好,他认为所谓的第一定律更应该是第二定律,第一定律是空间分异,分异是绝对的,在分异的基础上我们再看相似,这恰恰是第二定律表述的内容。


地理学家的观点是,承认异质性的存在,但不放弃对于规律性的追求,作为科学工作者要探求尽可能简单的法则来描述世界,如果我们能建立规律就是在一个地方的经验能应用到其他地方去,这样地理学研究就会有价值。


这里我们看到一个折中,可能无法用一个函数很好的去拟合,但是在局部能找到规律性。比如中间这段能用一个线性的函数去描述他,这个也是可以接受的,放弃全局的规律性,求其次找局部的。


有一个体现折中的很好的工具,就是GWR:不再全局试图建立一个拟合的形式,在不同的地方用不同的系数解释因变量,这样体现的局部的异质性和全局的规律性。


这样的表达形式是不是好的呢?这涉及到我们做地学建模的另外一个问题,就是说我们在建立一个模型的时候的目的是什么。这里我举个简单的例子,橙色方块的分布,可以建立两种方式的拟合,一种像左边这样,一种像右边这样,那么左边的拟合度很好,但是是过拟合了,扩展能力差,不容易预测,右边的拟合度不太高,但是可扩展性很好。


很多时候根据不同的目的,采用不同的模型。我想表达的观点是有可能的话采用越少的参数越好


刚才讲所有的分布都可以表达为一个场的模型,体现了一个空间的分异,这种分异有局部的相似性,人们在这个分异的基础上进行认知和加工,形成了地理的对象和概念。比如说左边是一个DEM的场,在这个上进行观察,提取一些概念如山谷、山脊、山峰,概括总结地理对象,这些地理对象本身存在含糊性,这种含糊性的由来是概念的不确定性造成的。


另外一个关于地理现象的分布,正如像Tobler第一定律所陈术的,相似性是随着距离的增加而衰减的。这个图反应了欧洲的物种的基因的相似度和距离之间的关系,明显看到一个衰减的形式。问题是我们在从空间的分异中提取对象时,是不是衰减越慢的话对象的尺度会越大?我们的结论是支持他的。


比如说我们看到空间的对象有不同的尺度,为什么会出现不同对象的尺度特征?恰恰是由于空间分布随着距离衰减的函数所造成的,可以考察空间分异的格局来研究探讨对象的尺度。


那么尺度效应还体现在另外一个方面,就是说我们观察到的模式是严重依赖于这个尺度的。比如这四个点,随着不同的观察距离会有不同的结论,第二定律就是描述了尺度对于我们观察模式的影响。



对以上内容简单总结下:

GIS作为地理学学科概念的形式化,需要考虑哪些问题?首先要从地理分布的异质性入手,然后在异质性的基础上寻求全局规律性之间找到一种均衡。在这个过程中要着重处理尺度效应,距离衰减的影响。同时地理学需要人的参与,这里引用一些观点比如人地关系传统。另外在美国的一个地理教育年会,提出的5个核心概念里面,有三个概念是与人有关的。也就是说地理学研究要把人放进去,要对人进行建模。


那么人在地理环境中扮演了什么样的角色?我们认为有两个角色,一个是观察者和感知者的角色,每个人在现实的世界中去生活,形成了对世界的认识;另外人在现实世界中活动移动,受到现实世界的约束,就形成了特点的结构


基于这两点,可以考察人的空间行为的异质性。比如说最上面这个图是大数据做的,人在不同的地方感受是不一样的,另外在不同地方行动和活动的特征也存在差别,所以人的是空间行为和地理环境之间形成了耦合的关系


这个例子体现人的空间分异和地理环境异质性之间的耦合关系。这是在北五环以外一个著名的蚁族村,左边的遥感影像是这样的,旁边的高速过去就是一个别墅区,这里清晰的看到人文要素的分异和空间自相关的特征,我们利用大数据可以看到这种差异的存在,在这个狭小的范围内居住了9万刚毕业的大学生,如何去了解、刻画、帮助改善他们的生活?我觉得地理学者可以在这里面做一些工作。


另外一个就是空间交互。我个人认为空间交互是人文地理学研究的特定现象。空间交互就是两个地点之间人流物流货流信息流产生的一个联系。比如像北京和深圳,一天的航空客流可以有很强的联系,但是对于自然地理要素,没有任何一种自然地理要素,在如此大的空间尺度上,如此小的时间跨度上,能够建立联系。这种交互是人文地理学研究的更重要的议题。


那么空间交互同样存在距离的衰减。经典的模型就是重力模型:越远的地方交互会越弱,越近的地方交互越强。在个体层面也存在着地理交互的影响,人的移动规律也受到距离衰减的影响。


可以分别基于相似性和交互的强度,对空间进行区划,交互相似差异之间存在什么关系呢?一个基本观点是空间差异带来交互,现代社会由于ICT和通讯技术的发展,使我们交互加强了,一定程度上在消除这种差异,恰恰是人文地理学研究的一个很重要的议题。

第三个观点,交互和差异之间的关系我们认为不同地方由于属性的差异,交互特征也会不一样。对于一个地理单元来说,承担的功能不一样,和其他地理单元之间的联系也会不一样。


最后我想谈下大数据,大数据为地理学提供了对于个体人的行为的观察,比如可以知道人的活动分布,人的出行分布,用人的行为数据去反演背后的地理环境特征等。


所以我们提出了社会感知的概念,社会感知是尽管每个人的行为是随机的,但是海量的行为有一定的规律性,这种规律性和背后的地理环境是密切相关的;通过揭示规律性去探讨地理环境的特征和演化,这种特征与人文社会经济的更有关系;Romete Sensing 更揭示自然地理环境特征,Socail Sensing 研究人文地理要素。


基于社会感知的研究框架,可以基于人的行为去探讨地理环境的特征,所以说大数据揭开了一条从人到地的路径,通过人的活动分布曲线,去看看和城市用地的关系。


另外在全国尺度上,可以利用不同类型的大数据,这里用到了夜光灯光的数据和微博的数据做了一个合成,全国人的迁移情况是怎么样的,每个城市群的腹地是怎样的,可以更宏观的理解地理空间。


在大数据的支持下,要从人地时三个视角去进行研究,有助于揭示人文地理学的基本理论。同样,可以引入复杂性科学的方法,理解复杂的人文地理学演化过程。


上一条:江西两院院士最全收录,看看哪些院士和你是老乡!(值得收藏) 下一条:国家职业资格目录清单公示!(含最全名单)

关闭

版权所有:九江学院旅游与地理学院 联系电话:8311117
学校地址:江西省九江市前进东路551号 邮政编码:332005
技术支持:九江学院信息技术中心 Copyright 2012