教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 论文> 其他论文> 聚类分析在城市轨道交通车站分类中的应用

聚类分析在城市轨道交通车站分类中的应用

上传者:网友
|
翻新时间:2013-12-17

聚类分析在城市轨道交通车站分类中的应用

摘要:聚类 分析 作为数据挖掘的一项功能,已被 应用 到许多领域,像模式识别、数据分析、图像处理和市场分析等,并且已经取得很好的效果。然而其应用在 交通 领域车站 研究 上的确很少。对聚类分析在城市轨道交通车站分类中的应用进行研究,展示数据挖掘在交通领域的应用,重点介绍层次聚类法的应用,并对相关算法进行比较,最后对该应用提出展望。

关键词:聚类分析;数据挖掘;轨道交通;车站分类

聚类分析是数据挖掘中一个很活跃的研究领域,用来帮助分析数据的分布、了解各数据类的特征、确定所感兴趣的数据类,以便作进一步分析。数据挖掘的根本在于统计学,统计 方法 中多元数据分析的3大方法之一的聚类分析,则是数据挖掘采用的核心技术。聚类分析基于“物以类聚”的朴素思想,根据事物的特征对其进行聚类或分类。本文对数据挖掘领域的聚类分析在城市轨道交通车站分类中的应用进行研究,展示数据挖掘在城市交通领域的应用。

1聚类分析概述

1.1聚类定义及标准

聚类就是将数据分组成多个类或簇,同一个簇中的对象之间具有较高的相似度。与分类不同的是,在进行聚类分析前不知道要把数据分成几组,也不知道怎么分,是基于“没有先验知识”。

评判聚类算法好坏的标准:能够适用于大数据量;能应付不同的数据类型;能够发现不同类型的聚类;使对专业知识的要求降到最低;能应付脏数据;对于数据不同的顺序不敏感;模型可解释,可使用等。

1.2数据挖掘领域中聚类算法的分类

聚类算法大体可以划分为以下几类[1]:划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法。

1.2.1划分方法

给定一个包含n个数据对象或元组的数据库,一个划分方法构建数据的c个划分,每个划分表示一个簇,且c≤n。通常会采用一个划分准则(经常称为相似度函数),例如距离,以便在同一个簇中的对象是“相似的”,而在不同簇中的对象是“相异的”。

1.2.2层次方法

层次方法对给定数据对象集合进行层次的分解。根据层次分解是自底向上还是自顶向下形成,层次聚类的方法可以进一步分为凝聚的和分裂的。

1.2.3基于密度的方法

为了发现任意形状的聚类结果,主要思想是:只要临近区域的密度超过某个阈值,就继续聚类。

1.2.4基于网格的方法

采用一个多分辨率的网格数据结构。把对象空间量化为有限数目的单元,形成一个网格结构。所有的聚类操作都在这个网格结构上进行。

1.2.5基于模型的方法

为每个簇假定了一个模型,寻找数据对给定模型的最佳拟合。基于模型的算法通过构建反映数据点空间分布的密度函数来定位聚类。

1.3聚类分析的步骤

在实际应用聚类分析中,可以根据有无领域知识参与将整个过程分解为3个环节[2],图1是整个过程的流程图。

2聚类分析在交通领域的应用

聚类分析的方法在交通领域得到了较为广泛的应用。聚类分析在交通领域的主要应用有:对城市交通流量和流向的两步聚类分析,应用于城市交通走廊规划;对城市交叉口的相关关系进行聚类分析,其研究成果可用于交通管理和交通流预测;高速公路规划方案的设计与评价过程中,广泛地应用了聚类分析方法;应用模糊聚类分析方法对鞍山市城市交通环境进行了分析评价;在公路网建设项目投资决策研究中应用聚类分析 计算 项目的紧迫度;建立了一种运输车辆调度聚类分析模型,适用于运输 企业 的计划作业;在道路交通事故多发点鉴定方法上采用聚类分析方法[3]。

3城市轨道交通车站聚类分析研究

3.1城市轨道交通车站分类 问题 的提出 轨道交通发挥作用是通过乘客“到达车站”来实现的,因此,对于轨道交通车站及周边交通方式的设置有着重要意义,车站分类问题研究也是首先要解决的问题。然而,现有城市轨道交通车站分类没有统一的方法,大都依靠经验,采用人为的划分方式。这样,不但效率不高,而且精确度不高,不能很好地反映客观情况。采用数据挖掘领域的聚类分析方法可以很好地解决这个问题。

为了研究北京市城市轨道交通车站的分类,相关部门进行了交通调查,得到了各个车站的各种接驳交通方式的构成比例,本次研究都以此调查数据为基础。

3.2分析流程3.3聚类因子的确定 根据聚类因子选择的原则,选择应有较强的代表性,能较好地反映轨道交通车站的功能特点。

根据交通调查的数据,以及处理数据的可行性,在本研究中,聚类因子选择步行方式的构成比例、自行车的构成比例、公交车的构成比例、出租车的构成比例和其它方式构成比例5种聚类因子。

交通方式构成比例计算式:Pi=Ti /S

(1)

(1)中,Pi代表一定车站某种出行方式的比例,Ti代表一定车站某种出行方式人数,S代表一定车站所有出行方式的总人数。表1是部分车站聚类因子的计算结果。

3.4聚类分析

3.4.1聚类分析的算法选择

聚类分析的5大类算法中,基于密度的方法将簇视为数据空间中被低密度区域分割开的高密度对象区域,适合用来过滤掉噪声和发现任意形状的簇;基于网格的方法,基于网格的聚类方法适合处理高维数据集;基于模型的算法通过构建反映数据点空间分布的密度函数来定位聚类。此次分析中,采用的原始数据是调查的轨道交通车站采用不同方式出行的人数,目标是要通过轨道交通车站的分类以帮助实际的轨道交通车站的规划、建设、运营和管理。

因此采用 应用 广泛的层次聚类法和K-Means算法,对两种算法 分析 出来的结果进行比较。许多软件,比如SAS和SPSS 等都包含相应模块[4]。K-Means算法是一种快速聚类分析 方法 ,执行效率较高,适用的样本数据量比较大,根据经验,样本数据量一般不低于100个,而本次 研究 设计的样本数据量不大,并且处理时间绝对不是处理这类 问题 首要考虑的问题,因此,可以考虑先选用层次聚类法。它提供了聚类分析功能,可以对多种数据类型进行样本或变量的聚类分析。

层次聚类有两种类型,分别是Q型聚类和R型聚类。Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来。R型聚类是对变量进行聚类,它适用具有相似性的变量聚集在一起,差异性大的变量分离开来,可在相似变量中选择少数具有代表性的变量参与分析,实现减少变量个数,达到变量降维目的。本研究是对各个车站进行聚类,采用的是样本聚集,因此使用的是Q型聚类。

层次聚类的聚类方式又分为凝聚方式和分解方式。它们分别根据层次分解是自底向上还是自顶向下形成的。这两种方式没有本质上的区别,SPSS中的层次聚类采用的是凝聚方式。

3.4.2凝聚方式聚类 计算 步骤

(1)每个车站个体自成一类,按照某种方法度量所有个体间的亲疏程度,将其中最“亲密”的车站个体聚成一小类,形成n-1个类。

个体间亲密程度的度量有很多计算方法,由于本例是定距变量类型,采用欧式距离计算方法来计算个体间亲密程度的度量,其计算公式如下:

(2)再次度量剩余个体和小类间的亲密程度,并将当前最亲密的个体或小类再聚成一类,这里就采用组间平均链锁距离方法来计算。组间平均链锁距离是该个体与小类中每个个体距离的平均值。

(3)重复

(2)的过程,不断将所有个体和小类聚集成越来越大的类,直到所有个体聚集到一起,形成一个大类为止。

3.4.3聚类结果及分析

通过SPSS软件,得出结果。图2是所得结果的聚类谱系图。

同时,通过对应分析,也发现,第1类车站处与轨道线路垂直的道路系统较好,公交车多,公交服务较好;第2类车站处多为商业繁华地段,或者所处地区靠近居住小区,客观上使步行的乘客较多。

根据聚类分析的结论,也提醒相关的规划与管理部门,在建设与运营管理的时候,理清各个车站的特征与功能,并提供相应的基础设施保障,为乘客提供更好的服务,方便居民的出行,充分发挥轨道交通的功能,提高城市公共交通方式的分担率。

3.4.4 K-Means与层次聚类算法的比较

采用K-Means算法,设定聚簇为3类,表2展现了聚类的结果。由于K-Means算法,是要事先设定分为几类,因此,得出的结果都是每一个车站属于第几类,这样就没有层次聚类分层的效果好。本例中,采用层次聚类法可清楚看出它分为两个大类,而如果采用K-Means算法,设定分为3类,就看不到预期的效果了。由此可见,选择合适的算法,对聚类分析是非常重要的。

4结束语

本文在轨道交通车站的分类研究方面作了一番探讨,应用了数据挖掘的聚类分析技术,并借助了分析软件来实现。 目前 对现有轨道交通车站分类的方法主要是根据经验等来进行的,如按规模分类等。应用聚类方法来进行分析,可大大提高效率。本文以北京轨道交通车站为例,数据量不大,这里只是提供一个展示的窗口,然而对于交通信息中一些海量的数据,应用数据挖掘来解决问题将是一种效率好,精确度高的途径,有利于决策者的决策。

为了更好地给轨道交通车站分类,加强聚类分析因子的研究是基础性工作,并最终 影响 车站的分类结果,进而影响运营管理部门的决策与管理,因此,对于实际的应用来说,还应加强聚类因子分析与研究工作。从充分挖掘轨道交通的作用,提高运营、组织和管理水平的角度来讲,分析的因子更主要是车站的相关硬件设施因素,比如车站处与轨道线路垂直的道路系统、轨道车站处普通公交车站的设置与其运营的线路布设及走向、相关的自行车停车设施、小汽车停车场,还有周围相关的用地特征,比如商业、居住等。据此分析,聚类分析可以得出更有价值的信息,更有利于车站的运营和管理。

参考 文献 :[2]卜东波.聚类/分类 理论 研究及其在文本挖掘中的应用[D].北京: 中国 科学 院,2000.

[3]杨新苗.城市公交 发展 技术保障体系关键技术研究 [D].南京:东南大学,2000.

[4]薛薇.SPSS统计分析方法及应用[M].北京: 电子 工业出版社,2004.

下载文档

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

网友最新关注

那件事想起来就害怕
那一刻,我的心情无比激动
家长会
挨打
《路灯》读后感
那件事真有趣
最难忘的经历
特殊的端午节
我渴望得到父母的理解
见证辉煌
我不能忘却的事
错事
家长会
细小的英雄——蚂蚁
老师,您辛苦了
2012年大一学生入党志愿书范文
2012年10月优秀团员入党志愿书
2012年入党志愿书范文
最新入党志愿书范文
最新大学生入党志愿书模板
2012年12月入党志愿书
高校大学生入党志愿书
12月末入党志愿书
大一学生入党志愿书范文
11月入党志愿书范文
普通群众入党志愿书模板
2012年年终入党志愿书
教你填写《入党志愿书》
2012年10月团员入党志愿书
2012年10月最新大学生入党志愿书范文
试析对提高“国培计划”实施水平的几点建议
试论林励儒的师范生教育实习思想及其当代价值
试析毛泽东的人格魅力及其对当代大学生教育的启示
关于高职酒店管理专业工学结合人才培养策略
简析美国高校心理健康教育的经验与启示
试论社会实践是提高大学生就业能力的重要途径
试析当代大学生意志品质的特点及培养策略
简论高职院校英语教学存在的问题及对策
文学欣赏的心理结构分析
试论教育管理对大学生个性发展支撑效能的研究
《文心雕龙.熔裁》与宣传报道写作的炼意与炼辞
浅析爱情小说《追魂》
试析案例教学法在心理健康教育课教学中的应用
浅析《边城》人性美
宽进严出:论重构中国特色MPA教育新体系
《比尾巴》教学案例
《比尾巴》课件说明
《比尾巴》教学片断与评析
《比尾巴》教学实录及点评
《比尾巴》教学实录及反思
《比尾巴》教学案例及反思
《比尾巴》教学思路
《比尾巴》教学案例
《比尾巴》教学片断与思考
鼓励孩子的求异思维 体现语文课堂的人文性──《比尾巴》教学案例及反思
创设有趣的场景 感受阅读的乐趣──《比尾巴》教学案例及点评
《比尾巴》教学片断与反思
如何利用网络优势激发学生探求新知的兴趣──《比尾巴》课例研讨
《比尾巴》教学评论
《比尾巴》教学案例及评析