基于点模式分析的POI数据挖掘与可视化-以厦门市为例
摘要:这篇文章描述了基于点模式分析的POI数据的数据挖掘与可视化方法。这些方法可以用到很多领域,特别是城市规划中。本文以2015年厦门市高德地图的兴趣点(Points of Interest)数据为例,采用点模式分析方法对POI数据的分析与可视化方法进行了探索,得出了四种交互地图:点数据交互图、点密度交互图、点聚类交互图、孤立点交互图。研究表明:(1)点数据交互图很好地进行了POI数据的可视化表达。(2)点密度交互图可以显示各类POI数据的热点活动分布。(3)点聚类交互图可以很好地反映POI数据的聚类分布特征(4)孤立点交互图揭示了数以万计的POI数据中的若干离群点。 关键词:点模式分析;兴趣点数据;数据挖掘;数据可视化;空间分析;点密度分析;点聚类;孤立点分析
国内当前缺乏具有针对性的POI数据专业化分析方法。 研究POI数据的数据挖掘与可视化方法很有必要。 本文是对POI数据的数据挖掘与可视化表达的专业化探索。 本研究从点模式分析出发,运用多种数据挖掘方法、空间分析工具及可视化表达方法,拟探索出一系列POI数据的数据挖掘与可视化表达方法。
数据挖掘是从海量数据中提取有用的信息。本文所用工具包括ARCGIS、leaflet、openstreetmap 、R。数据分析过程基本全部采用编程算法实现,每个交互地图的代码行为300-500左右。因此,本文研究方法较难用文字概括,研究步骤如下:
数据分类
散点图
点数据交互图
点密度分析
点聚类分析
孤立点分析
根据国家标准《城市用地分类与规划建设用地标准》将2015年厦门市的高德地图POI数据分为七类,分类结果如图1所示。 X轴为原始POI数据类别,Y轴为根据《城市用地分类与规划建设用地标准》划分后的POI数据类别。填充值为布尔值1和0,用来判断X,Y轴的POI原始数据类别是否属于Y轴相应的数据类别。图例:1表示“属于”,0表示“不属于”。
图1:兴趣点数据的城市规划建设用地分类图
厦门市POI数据的散点图如图2所示。 在图2中,我们可以看出POI数据的大致分布趋势。然而,除此之外,我们很难再从散点图上获取其他信息。
图2:兴趣点数据散点图
空间中心:在指定空间范围内某一类POI数据的坐标均值。空间中心的横坐标=该类POI数据横坐标之和/该类POI数据总个数,空间中心的纵坐标=该类POI数据纵坐标之和/该类POI数据总个数。应用见图3。 空间紧凑度:某空间范围内存在某类POI数据,则空间紧凑度计算公式:sqrt((POI数据横坐标离差平方和 + 横坐标离差平方和) /该类 POI数据总个数)。
通过交互地图进行POI数据的可视化,结果如图3所示。
图3 点数据交互图
将厦门市矢量地图转化为1677个样方的栅格数据,对每个样方分别进行各类POI数据个数计数,并经过数据处理得到各类POI数据的点密度结果图。如图4所示。
图4 点密度交互图
通过编程算法,进行各类POI数据的点聚类分析,并得到点聚类交互图,如图5所示。
图5 点聚类交互图
分析步骤: 1) 计算出各类POI数据中每类POI数据中每个数据点到其他所有点的距离。 2) 在第一步的基础上筛选出每个点最近的邻居,以及他们的距离di。 3) 在第二步的基础上,找出距离最大的10对点。并匹配他们的坐标与数据名称。 4) 用第三步所得数据孤立点交互图。结果如图6所示。其中,黑色点为孤立点,白色点为孤立点的邻居,两者之间连线为他们的距离。 5) 鼠标分别悬于黑色点、白色点及两者之间连线上,查看变化。
图6 孤立点交互图