当前位置:首页 > 其他范文 > 专题范文 > 基于大数据的城市居民职住锚点计算方法研究:居民数据
 

基于大数据的城市居民职住锚点计算方法研究:居民数据

发布时间:2019-07-24 09:31:11 影响了:

2017年第1期 / 西部人居环境学刊 / 031

DOI: 10.13791/j.cnki.hsfwest.20170105

高硕, 王铭扬, 鲁旭, 等. 基于大数据的城市居民职住锚点计算方法研究[J]. 西部人居环境学刊, 2017, 32(01): 31-37.

基于大数据的城市居民职住锚点计算方法研究

Research on Residence-and-Work Anchor Points Algorithm with Big Data in Urban Research

高 硕 王铭扬 鲁 旭 茅明睿 GAO Shuo, WANG Mingyang, LU Xu, MAO Mingrui

摘 要 居住和就业是两个重要的居民时空行为要素,通勤行为规律能够直接反映城市空间结构特征,而大数据的发展对城市职住通勤研究提供了新的数据源与方法论。本文通过比较分析各个居民职住锚点计算方法,针对网络位置大数据提出基于密度的聚类算法;并以北京市东部及北三县地区为例进行案例分析。结论发现:基于密度的聚类算法速度快、准确度高,适合网络大数据在城市研究中的应用。

关键词 城市;大数据;锚点;算法;职住;通勤

Abstract: Residence and work are two of the most important time and space behavior elements for citizens. To a great extent, commuting pattern reflects spatial structure of a city. Nowadays, the development of information and communication techniques provides new data sources and methodology for urban studies. This paper introduces former algorithms for calculating residence-and-work anchor points, and puts forward a new clustering algorithm for internet LBS data based on DBSCAN. A case with the data produced by this new algorithm, commuting patterns of eastern Beijing and Beisanxian, was introduced afterwards. In conclusion, it’s found that the new algorithm for residence-and-work anchor points has satisfactory speed and accuracy, and is suitable for the application of LBS data in urban researches.

Keywords: Urban; Big Data; Anchor Points; Algorithm; Residence-and-Work; Commute

0 引 言

随着近年来城市经济的发展,城市的物质环境和空间结构都经历着巨大演变[1],城市研究领域内新手段新方法层出不穷。在对城市空间结构的研究中,学者开始更多地从人类空间行为的视角来解读城市空间格局[2-3];并从制度变化的视角来挖掘空间转型背后的深层机制[4]。居住和就业是两个重要的居民时空行为要素。城市居民的通勤行为是指居民离开居住地前往工作地的出行。它受城市中居住与就业空间分布方式的影响,发生于工作人口中。城市研究中,提取居住与就业锚点可以描述居民的时空行为,统计空间单元的通勤属性,并由此反映城市的空间结构[5-7]。

与此同时,通信技术的发展使得大数据越来越多的被用于城市研究中。基于大数据的职住研究有比传统的问卷调查方式成本低、定位与时间精度高、覆盖人群广,善于描绘居民时空行为等优点。基于大数据的城市居民职住锚点计算,是大数据视角下城市研究的重要

中图分类号 U491;TU984.113文献标识码 B

文 章 编 号 2095-6304(2017)01-0031-07

组成部分。

目前在城市研究中应用的大数据以手机信令数据(包括手机通话基站、手机信令位置两部分)、公交IC卡数据及互联网LBS数据为主。学术界已有使用手机信令数据与公交IC卡数据进行职住锚点计算的研究探索。手机信令数据计算锚点的算法为:转换个体活动序列、识别基站位置、使用Voronoi多边形与随机点生成法模拟职住锚点[8]。公交IC卡的数据处理中,则可以利用首次刷卡识别居住锚点、停留时长识别就业锚点[9]。由于互联网LBS数据具有时间不连续、规律性不强等特点,其应用基本仅限于瞬时人流的描述,很少将其用于反映居住、工作行为,也缺乏对锚点算法的研究。本文将讨论手机信令数据、公交IC卡数据的锚点算法,并在此基础上研究适用于互联网LBS数据的锚点算法。

作者简介高 硕:北京城市象限科技有限公司,助理工程

师,gaos@urbanxyz.com

王铭扬:北京师范大学物理系,访问学者鲁 旭:北京城市象限科技有限公司,高级工程师茅明睿:北京城市象限科技有限公司,高级工程师

ISSUE 1 FEB. 2017 / JOURNAL OF HUMAN SETTLEMENTS IN WEST CHINA / 032

1 基于大数据的锚点计算研究

1.1 已有算法

目前基于大数据的锚点计算方法,按照数据类型的不同主要分为公交刷卡[9]与手机定位的数据。其中,手机定位数据由运营商保存,分为两种[1]。

一、手机通话位置数据。此类数据保存的时间段较长。然而由于个体使用手机通话的情景不同,是不规则稀疏采样的数据,可能出现定位次数非常稀疏,居住工作时段通话较少,通话位置在通勤途中等会导致误差的情况。

二、手机跟踪定位数据。此类数据是规则连续采样的,此类数据可以完整

地保存个体时空行为的轨迹,是理想的城市居民行为特征研究的数据源。然而手机跟踪定位数据保存的时间较短,一般只有几天,在数据处理时可能会导致误差[10-11]。

因此,基于手机定位的锚点计算方法又分为基于通话基站[12-14]与基于手机信令位置[13]的两种方法。1.1.1 基于手机通话基站

基于不规则稀疏采样的手机通话数据计算职住锚点的算法包含三步。

第一步,将个体的通话记录转换为个体活动序列。许宇使用“活动地点—活动时间”数据模型(Activity-Location Time, LT),处理手机通话位置数据,L代表数据活动的基站位置,T代表活动时间[1]。

第二步,识别居住与工作时间用户通话使用的基站位置。首先设置工作时段与夜间睡眠时段,许宇等设置工作时段09:00~18:00,夜间睡眠时段为00:00~06:00。然后选取两个时段内定位次数超过阈值的基站,许宇等设为工作阈值6小时居住阈值4小时。

第三步,模拟职住地位置。使用Voronoi多边形表示基站服务范围,结合范围内用地性质结构,使用随机点模拟法生成职住地的坐标。1.1.2 基于手机信令位置

基于规则连续采样的手机信令数据计算职住锚点的算法与手机通话数据类似,包含三步。

首先,从规则定位数据中提取出个体活动序列。其次,利用聚类分析识别职住地对应的基站位置。最后利用Voronoi多边形与范围内用地性质结构,模拟职住地位置。

聚类分析又称群分析,是利用数学工具对数据进行定量分类。聚类分析由若干模式组成,模式是一个向量,或多维空间的一个点。在空间锚点计算中,模式是由经纬度组成的二维向量。聚类分析的结果则是将这些“点”分成不同“簇”,并且尽可能地将相似性较大的“点”归为一簇,即我们需要的市民行为中“锚点”模式。聚类分析的算法可以分为划分法、层次法、基于密度的方法、基于网格的方法和基于模型的方法。各个学者在锚点算法研究中采用了不同的聚类分析,如Miguel通过PAM(A partitioning around medoids algorithm)聚类,许宇通过设定定位次数阈值聚类,Isaacman [15]等运用回归结合聚类算法。

1.1.3 公交IC卡数据识别

公交IC卡的数据分为一日刷卡数据和一周刷卡数据两种,可采用不同的锚点计算方式。

在 2005年调查中,99.5%居民的首次出行的出发地点是居住地。因此,基于一日刷卡记录,首次刷卡的站点可视为用户的居住锚点。而识别就业锚点的方法是:持卡人不是学生,在某个地点停留超过6小时,则此地视为该用户的就业锚点。

基于一周刷卡记录,首先按照一日刷卡记录的方式识别每日职住锚点。然后通过设置阈值(龙瀛等设为500 m [9])进行聚类,得出该用户多个居住(或就业)锚点,选取定位次数最多的视为居住(或就业)锚点。1.2 数据介绍

本研究所使用的数据源自腾云天下有限公司(TalkingData,以下简称TD)。北京腾云天下科技有限公司成立于2011年9月,是中国最大的独立第三方移动数据服务平台。腾云天下数据的数据量约为全国每天数十亿条;累计用户14亿个,目前每日活跃用户约为2.5亿个,每月活跃用户约为6.5

亿个。该数据采集自以智能手机为主的带有定位功能的智能终端,数据结构包括用户设备的唯一识别码信息(ID)、定位经纬度、定位时间(精确到毫秒);部分定位数据含有用户手机型号(与价格、操作系统类型)、来源应用程序。另外,腾云天下通过对用户行为进行画像,提供年龄、性别、婚姻、车辆拥有情况等标签。1.3 锚点算法

腾云天下的互联网LB S定位数据来源于GPS,比起精确到基站的手机信令数据位置精度较高。而TD 数据来源于手机A PP,由于用户活跃程度不同、手机A PP 使用情景不同,导致数据定位频次非常不连续且不均匀。夜间睡眠时段APP活跃程度普遍较低,需要扩展睡眠时段的定义范围。工作时段由于外出、交通等原因也有可能导致定位点不在就业地。因此,我们需要针对互联网LBS数据研究更合适的锚点算法。

经过多种方法对比,我们决定采用聚类分析确定锚点的方法。将LBS数据中,用户定位的经度与纬度看做两个维度,那么我们需要找出在特定时间(如居住地定义为21点至次日7点、工作地定义为工作日的10点至17点)定位次数最多的簇,并将簇的核心对象定义为锚点。并对各种聚类算法的分类效果进行了对比[16](图1)。

我们随机提取了一个用户在2015年10月的所有数据,根据定义的规则过滤出工作时段与夜间睡眠时段的定位点(图2),然后采用K-means和基于密度的两种聚类分析方法进行分析,并对比其结果。1.3.1 K-means聚类

我们选取了P y t h o n 程序包中K-means++的算法进行锚点计算。首先,需要确定分组个数(K值)。尝试各种K值,比较数据处理用时和轮廓系数等指标。轮廓系数是评价聚类效果的指标,结合了内聚度和分离度两种因素,结果越接近于1,表示聚类效果越好。选定用户工作时间定位点的聚类效果如下表所示:最后一列为轮廓系数,当K>2时轮廓系数均高于0.9,表示聚类效果很好;而K=3时用时最短,因此我们选取3作为分组个数(表1)。

2017年第1期 / 西部人居环境学刊 / 033

锚点算法的研究探讨。因此,本章介绍了基于手机通话基站、手机信令位置,以及公交IC卡数据的锚点算法,继而介绍了针对LBS定位数据的锚点算法探索。

本文以随机抽取的某用户定位点为例,展示了K-means与DBSCAN两种聚类算法的锚点计算结果。图6显示了某用户夜间睡眠时段定位点与工作时段定位点,两者均有两簇较为密集的聚集处(如圆圈所示)。

图3显示了使用K-means算法聚类出的居住与就业锚点。居住锚点1相对于聚集点

图1 各聚类算法对比

Fig.1 a comparison of different clustering algorithms

群有少量偏移,居住锚点2与就业锚点1相对聚集点群重心有较大偏移;就业锚点2则出现较大误差,没有位于上方的聚集点群,而是位于另一个更低级的聚集点群。这种偏移可能是由于噪声点(定位距离实际锚点位置较远的点)对组群中心点的计算造成的影响。

图5显示了使用基于DBSCAN算法聚类出的居住与就业锚点。四个就业锚点均位于聚集的点簇中,位置准确偏移量少,分级清晰正确。

综上,基于DBSCAN的聚类算法要明显优于传统聚类算法(如K-means),其优势表现在以下两方面:一、基于DBSCAN的聚类算法运算时耗较小。基于DBSCAN的聚类算法不需要输入分组个数(K值),K-means 算法中计算确定K值的过程需要多重迭代,在处理大批量数据时需要花费较长时间。二、基于DBSCAN的聚类算法运算结果准确。

基于DBSCAN的聚类算法可以识

接下来设定K=3,对所有工作时段定位点进行分组并求各个分组的中心点。在三个中心点中,按照组内定位点数量排序,取最高者作为第一就业锚点,第二位作为第二就业锚点。将同样的步骤用于所有夜间睡眠时段,计算出第一与第二居住锚点。图3展示了使用K-means算法聚类的锚点结果。

1.3.2 基于密度的聚类

DB S C A N (Densit y-Ba sed S pat ia l Clustering of Applications with Noise)是基于密度的聚类算法,相比于其他聚类算法,DBSCAN具有以下明显优势:不需要提前输入聚类簇的数量;适合锚点计算中有多个居住地(或工作地)的情况;可以发现任意形状的簇类;可以识别噪声点。

DB S C A N基本的输入参数有两个:

一、E邻域。给定对象半径为Ε内的区域。在锚点计算中,半径为E的范围内定位点可以视为一簇,即一个锚点。二、核心对象。核心对象(或阈值)代表最少出现次数。在锚点计算中,若一簇里面定位点天数超过该阈值,则该簇可以称为锚点(图4)。

另外,我们在DBSCAN的基础上增加了限定条件,即定位点的时间跨度要超过某阈值,保障“居住”或“工作”的行为是长期的,不是由短时间行为(如出差)产生。图5展示了使用基于DBSCAN算法聚类的锚点结果。

1.4 讨论:锚点算法对比

由于本研究所使用的数据为腾云天下有限公司收集的基于互联网的移动智能终端定位数据,而目前缺乏针对LBS定位数据

图2 某用户夜间睡眠时段定位点与工作时段定位点

Fig.2 locations of a certain user at sleeping and working hours

图3 使用K-means算法聚类的锚点结果

Fig.3 cluster results of algorithm by K-means

ISSUE 1 FEB. 2017 / JOURNAL OF HUMAN SETTLEMENTS IN WEST CHINA /

034

表1 某用户工作时间定位点在不同K值下的聚类效果

Tab.1 clustering results with different k for the working anchor point of a user

我们要对城市进行空间单元划分。划分主要参照北京市交通分析小区(TAZ);另

校正等级指数11111111

校正互信息11111111

轮廓系数0.8850.9140.9390.9440.9510.9610.970.943

效度量数11111111

分组个数(k值)23456789

用时/s0.02300.02100.02400.02700.03100.03500.04000.0420

聚类内的平方和00000000

同质性11111111

完备性11111111

外,对于面积过大的交通小区以及北京之外的区域,以道路为界进行划分。最终得到研究区域内的空间单元如图7所示。

我们将每个用户居住与就业锚点间的距离定义为通勤距离。然后将用户属性在空间单元上进行统计,得出单元属性,如居住人口数量及密度、就业岗位数量及密度、通勤距离平均值、中位数、离散系数等等。2.3 通勤指标分析2.3.1 职住平衡

空间单元内的职住平衡,可以通过区域内居住、就业锚点数量及居民的时空行为特征,即职住比、内部通勤比、内向通勤比等指标反映出来

2.3.1.1 职住比

职住比是城市中某个空间单元内,就业岗位数量与居住人口数量的比值。职住比越大,表示该空间单元的功能越偏向于就业;职住比越小,则该空间单元的功能越偏向于居住。由于城市居民中含有儿童、老年人等非就业人口,一般来说职住比数值小于1,越接近1,该地区职住越平衡。

如区县级职住比空间分布(图8)所示,朝阳区的职住比等级达到北京市核心区水平,职住较为平衡;通州区与大厂县为第二级别;三河市职住比水平最低;而香河县城的职住比也处于第一梯队,原因可能是其居住人口相对较少,就业岗位绝对

图4 基于DBSCAN的锚点算法流程图

Fig.4 a flow chart of residence-and-work anchor points clustering algorithm based on DBSCAN

别噪声点,而K-means算法无法识别,从而在中心点计算中产生了位置偏移;且由于锚点重要性(如第一、第二居住地的判别)是由族群中定位点数量决定的,导致锚点重要性顺序可能受到噪声点的干扰。

理的职住数据是否适用于城市规划案例,我们选取了北京东部及周边地区——包括朝阳区,通州区,廊坊市三河市、香河县、大厂县(下文简称“北三县”)——作为研究区域,通过2015年末的LBS大数据计算城市居民职住锚点,研究其通勤行为,反映北京市东部地区与北京市中心的联系,并以此探究北京城市结构。2.2 数据处理

为了将用户数据联系到城市空间上,

2 锚点算法检验——以北京东部

为例的通勤分析

2.1 研究区域

为了研究基于密度聚类的锚点算法处

图5 使用基于DBSCAN算法聚类的锚点结果

Fig.5 cluster results of algorithm based on DBSCAN

图6 某用户夜间睡眠时段定位点与工作时段定位点

Fig.6 locations of a certain user at sleeping and working hours

图7 TAZ级空间单元划分示意图

Fig.7 spatial units on TAZ level

数量虽然不多,其职住比数量也比较高。由TAZ级职住比的空间分布(图9)可以看出,每个区县内TAZ级空间单元职住比分布比较多样化。朝阳区内职住比较高的区域分布在四环内、望京部分区域、奥运村部分区域及一号线沿线。通州区内,新城区域反而职住比较低,可能由于现状居住人口较多,就业岗位较为缺乏。相比之下,北三县的部分区域职住比较高,推测是镇中心就业岗位较为密集的地区(如三河市齐心庄镇、香河县淑阳镇等)。

2.3.1.2 内部通勤比

内部通勤比是某空间单元内居住于此且就业于此的人口数量与居住于此的所有通勤人口数量的比值,在一定程度上反映了该区域职住平衡的程度。

区县级内部通勤比空间分布如图10所示:通州区、三河市内部通勤比较低,说明该区域内通勤人口中有较大部分流出到其他区域就业;朝阳区、大厂县内部通勤比中等;香河县内部通勤比相对较高,该区域内通勤人口大部分都在其中就业。TAZ级内部通勤比空间分布如图11所示:朝阳区中北

图10 区县级内部通勤比分布图

Fig.10 distribution of inner commuting ratio on

district level

图8 区县级职住比分布图

Fig.8 distribution of work-home ratio on district level

部、通州新城范围内有较多内部通勤比较低的单元;而北三县部分区域内有内部通勤比较高的单元,是表现出职住较为平衡的区县镇中心。

2.3.1.3 内向通勤比

内向通勤比是空间单元内就业于此但不居住于此的人口、数量与就业于此的所有人口数量的比值,在一定程度上表示空间单元内就业岗位数量吸引其他区域通勤人口的能力。

区县级内向通勤比空间分布如图12所示:朝阳区处于与北京市核心区相同的级别,吸引外来通勤人口的能力较强;通州区、大厂县的吸引能力次之;三河市、香河县吸引外来通勤人口的能力较弱。与以上的内部通勤比、职住比等分析结果结合,我们发现香河县的就业岗位多由香河县居民持有,吸引外来通勤与输出劳动力的现象都较少。TAZ级内向通勤比(图13)显示:朝阳区大部分空间单元、通州区少数单元吸引外来通勤人口的能力较强,北三县区域内极少有内向通勤比较高的单元。

以上三个指标显示,朝阳区在三个区

图11 TAZ级内部通勤比分布图

Fig.11 distribution of inner commuting ratio on

TAZ level

2017年第1期 / 西部人居环境学刊 / 035

图9 TAZ级职住比分布图

Fig.9

distribution of work-home ratio on TAZ level

域中相对而言职住更均衡,就业岗位吸引外来通勤人口更强;通州区、三河市与大厂县就业人口流出该区域的情况明显,就业岗位吸引外来通勤人口更弱;香河县职住较为均衡,通勤人口流入或流出的现象均不明显。本研究使用的职住锚点算法准确反映了通州区、朝阳区及北三县的职住平衡现状,并能够在各种空间精度上展现城市异质性。2.3.2 通勤距离

TAZ级空间单元平均通勤距离分布图显示(图14),研究范围大致分为四个圈层:朝阳区五环内平均通勤距离处于第二级,五环外平均通勤距离处于第三级,通州区内大部分单元平均通勤距离处于第四级,而北三县几乎一半单元平均通勤距离处于最高级。其中,通州区中部部分单元平均通勤距离较低,而北三县部分地区平均通勤距离处于最低级,是职住较为平衡的地区。图15为TAZ级通勤距离中位数的空间分布,基本符合平均通勤距离展现出的现象。

图16为朝阳区、通州区与北三县三个区域内TAZ级空间单元的通勤距离中位数与距天安门距离的散点图。

如果将北京市

图12 区县级内向通勤比分布图

Fig.12 distribution of to-in commuting ratio on

district level

ISSUE 1 FEB. 2017 / JOURNAL OF HUMAN SETTLEMENTS IN WEST CHINA / 036

图13 TAZ级内向通勤比分布图

Fig.13 distribution of to-in commuting ratio on

TAZ level

看做以天安门广场为中心的单中心结构,根据通勤属性反映城市空间结构的理论,城市中的单元距离天安门越远,则“郊区化”属性越强,居民通勤距离也越长。图16显示,朝阳区与通州区大致显示出正相关的趋势。而北三县有部分单元处于正相关的态势中,部分单元虽然距天安门较为遥远,但通勤距离相对而言比较近。

通过对通勤距离的分析,我们发现朝阳区、通州区的大部分地区基本处于北京市单中心结构的影响范围中,通州新城东部部分地区有发展成为次中心的潜力;北三县部分地区(特别是三河市)处于北京市单中心结构的影响范围中,而部分地区相对而言独立于北京市中心影响范围。2.4 讨论:算法检验结果2.4.1 实用性检验

本文以北京东部的通勤分析为例,在规划案例中实践了基于LBS数据的锚点计算结果。以职住比、内部通勤比、内向通勤比、外向通勤比、通勤距离等指标,反映北京东部地区的职住平衡现状及通勤距离分

图16 通勤距离中位数与空间单元至天安门距离

散点图

Fig.16 scatter plot of median commuting distance and

distance between spatial unit and Tiananmen

图14 TAZ级平均通勤距离分布图

图15 TAZ级通勤距离中位数分布图

Fig.14 distribution of average commuting distance

Fig.15 distribution of median commuting distance

on TAZ level

on TAZ level

布。相对于上位规划资料、人口普查等传统查数据的比值应该在一个常数附近波动。规划数据,LBS数据的锚点计算结果有以本文将统计结果绘制成散点图并进行回下几点优势:一、收集自智能终端,直接反归分析。另外,由于LBS数据收集自智能终映人的行为,更为准确地表达市民的微观端,与经济水平、人口密度密切相关,因此选择;二、相对于规划人口资料、人口普查本文将空间单元按照夜间灯光占比分为建数据,LBS数据具有可批量处理、更新时成区与非建成区两部分进行统计。

间短、更新成本低的特点;三、LBS数据计图17显示以北京市各街乡办为空间单算出的锚点数据以经纬度为单位,可以从元,基于LBS数据的居住锚点与六普的常住多种尺度的空间单元进行统计,形成了多指人口数据的统计结果[17]。两种来源的数据标、多精度的数据特征。而人口普查数据基本呈线性相关关系,建成区R2为0.9,非空间单元固定,且人口普查、经济普查及各建成区R2为0.85。

年份的普查之间空间单元不统一,难以更图18显示以北京市各街乡办为空间单深层次的数据挖掘。

元,基于LBS数据的就业锚点与三经普的综合来看,基于LBS数据的锚点算法就业岗位数据的统计结果[18]。两种来源的实用性较强,适合用于城市规划案例。数据线性相关关系较强,建成区R2为0.6,2.4.2 准确性检验

非建成区R2为0.61。

将来源不同的数据分析结果进行对综上,基于LBS数据的锚点计算结果比,是分析数据可靠性程度的有效方法。与基于普查的锚点统计结果线性相关性较本文选取基于2015年末的锚点计算数据,强,可信度高,适用于各类统计分析。

与北京市2010年第六次人口普查、2012年第三次经济普查数据,以街乡办为空间单3 结 论

元进行统计分析对比。假设TD的LBS数据是均匀抽样的样本,则LBS数据与人口普

城市中居民的居住与工作行为是描绘

图17 建成区、非建成区单元与六普数据线性回归图

Fig.17 scatter plot and linear regression of LBS

residence data and the 6th population census on built and non-built units

图18 建成区、非建成区单元与三经普数据线性回归图

Fig.18 Scatter plot and linear regression of LBS employ data and the 3th economy census on built and non-built units

城市生活的重要要素。居住与工作人口数[3] 刘志林, 张艳, 柴彦威. 中国大城市职住分

量,职住比,通勤流入流出行为,通勤的时离现象及其特征——以北京市为例[J]. 城间、方式、流向等指标可以生动准确地描市发展研究, 2009(09): 110-117.

述城市居民职住行为。本文总结了基于大[4] CHAI Y W, ZHOU S Y, CAI Y L. Recent

数据的职住锚点计算方法,针对定位频次progress of human geography in China: 不平均、手机app应用场景多样化、适合基Retrospect and prospect[J]. Japanese 于智能终端的网络位置大数据,创新性地Journal of Human Geography, 2001, 提出了基于密度的聚类算法。

59(06): 2-22.

该职住锚点算法发展自基于密度的聚[5] 张艳, 柴彦威. 基于居住区比较的北京城市

类算法DBSCAN,探测点群密度较大的区通勤研究[J]. 地理研究, 2009(05): 1327-域,并提取该点群中心点。使用者输入夜间1340.

睡眠时段(或工作时段)的原始定位点,定[6] 孟斌. 北京城市居民职住分离的空间组织

义E邻域、距离阈值与定位时间阈值三个特征[J]. 地理学报, 2009, 64(12): 1457-参数,算法会聚类出居住(或就业)锚点,1466.

选取点群密度最高的两个作为第一、第二[7] 周江评, 陈晓键, 黄伟, 等. 中国中西部大城

居住地(或就业地)。

市的职住平衡与通勤效率——以西安为本文提出的职住锚点算法基于LBS定例[C]//2013年国外城市规划学术委员会及位数据的数据源,反映市民长期职住行为。《国际城市规划》杂志编委会年会论文与空间单元进行联系,能够计算居住与工集, 2013: 199-216.

作人口数量,职住比,内部、内向、外向通勤[8] 许宁. 基于手机定位数据的居民职住地分

比,通勤距离等指标。在城市规划管理案例布特征研究[D]. 长沙: 中南大学, 2014.中,可以在城市新城规划、旧城改造、城市[9] 龙瀛, 张宇, 崔承印. 利用公交刷卡数据分

更新等领域得到应用。本文通过对北京东析北京职住关系和通勤出行[J]. 地理学部及北三县地区各项通勤指标的展示分析,报, 2012(10): 1339-1352.

得出科学合理的结论;通过与六普及三经[10] 柴彦威, 赵莹, 马修军, 等. 基于移动定位

普的对比,发现基本呈现线性相关关系。因的行为数据采集与地理应用研究[J]. 地此该锚点计算方法同时具有实用性及准确域研究与开发, 2010(06): 1-7.

性,适用于城市研究各项工作。[11] 吴亦政. 基于手机定位信息和出行调查的

动态OD 获取方法[D]. 北京: 北京交通大参考文献

学, 2014.

[1] 汪光焘. 1990年代北京郊区化的最新发

[12] YUAN Y H, RAUBAL M, LIU Y.

展趋势及其对策[J]. 城市规划, 2004, Correlating mobile phone usage and 28(03): 13-29.

travel behavior-A case study of Harbin, [2] 刘望保, 闫小培, 方远平, 等. 广州市过剩通

China[J]. Computers, Environment and 勤的相关特征及其形成机制[J]. 地理学Urban Systems, 2012(36): 118-130.报, 2008, 63(10): 1085-1096.

[13] ZANG H, BOLOT J. Anonymization

2017年第1期 / 西部人居环境学刊 / 037

of location data does not work: A large-scale measurement study[C]// P r o c e e d i ngs of t h e 17t h a n nu a l international conference on Mobile computing and networking, 2011.[14] FRIAS-MARTINEZ V, SOGUERO C,

FRIAS-MARTINEZ E. Estimation

o f u r b a n c o m m u t i n g p a t t e r n s using cellphone network data[C]// Proceedings of the ACM SIGKDD International Workshop on Urban Computing, 2012.

[15] ISAACMAN S, BECKER R, CACERE

SR. Identifying important places in people ’s lives from cellular network data[C]// International Conference on Pervasive Computing, Springer Berlin Heidelberg, 2011.

[16] Scikit Learn. Scikit learn documen-tation[EB/OL]. [2017-02-10]. https://s c i k it-le a r n.org /sta ble /modu le s /clustering.html.

[17] 北京市2010年第六次全国人口普查主要

数据公报[J]. 数据, 2011(06): 66-67.[18] 北京市第三次全国经济普查领导小组

办公室北京市统计局国家统计局北京调查总队. 北京市第三次全国经济普查主要数据公报[N]. 北京日报, 2014-12-22(06).图表来源

图1:FRIAS-MARTINEZ V, SOGUERO C, FRIAS-MARTINEZ E. Estimation of urban commuting patterns using cellphone network data[C]// Proceedings of the ACM SIGKDD International Workshop on Urban Computing, 2012.图2-18:作者绘制表1:作者绘制

收稿日期:

2016-12-22(编辑:

申钰文)

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3