基于SOM网络的城市分类探讨及实证分析
摘要:科学的城市分类不仅便于我们对各个城市的发展进行评估,并且为我们制定城市的发展决策提供了依据。而基于人工神经网络(ANN)的自组织特征映射网络(SOM)具有强大的聚类功能。文章探讨了SOM网络在城市分类方面的应用,并利用MATLAB软件,对山东省各地级市城市进行了实证分析,从而指出了SOM网络在城市分类方面的优缺点及意义。
关键词:人工神经网络;SOM;城市分类
一、引言
城市分类不仅便于我们对各个城市的发展进行评估,并且为我们制定城市的发展决策提供了依据。然而,如何能够进行科学的城市分类一直备受关注。而基于近些年来人工神经网络的飞速发展,它帮助我们解决了许多棘手的难题,其中的自组织特征映射网络(SOM)具有强大的聚类功能,利用它可以帮助我们根据各个城市的特点从而进行科学分类,为加速我国城市的发展和城镇化建设有着重要的意义。2005年吴聘奇、黄民生利用SOM网络对福建省城市进行了职能分类,同年,刘耀彬、宋学锋又基于SOM人工神经网络对长江三角洲地区城市职能分类做了研究。从而可见,基于人工神经网络的自组织特征映射网络(SOM)在城市的分类问题确实可以发挥强大的作用。
评价一个城市的各个行业的发展,有许多指标。其中行业就业人口是评价一个城市该行业的发展的基础指标。本文对山东地区城市的分类实证分析中,对各个城市的各行业就业人口数量进行了采集,其中包括农林牧渔业,采矿业,制造业,电力、煤气及水的生产和供应业,建筑业,交通运输、仓储和邮政业,信息传输、计算机服务和软件业,批发和零售业,房地产业,住宿和餐饮业,金融业,租赁和商务服务业,水利、环境和公共设施管理业,居民服务和其他服务业,教育,科学研究、技术服务和地质勘查业,卫生、社会保障和社会福利业,文化、体育和娱乐业,公共管理和社会组织等19个行业的从业人员数。然后,通过MATLAB软件进行编程构建,成功地将山东省的17个城市进行了分类,从而说明了SOM网络在城市分类方面的确有优于其他传统方法的优点。
二、SOM网络的基本原理
(一)SOM网络简介
自组织特征映射网络也称Kohonen 网络,或者称为Self - Orgnizing Feature Map( SOM) 网络,它是由芬兰学者Teuvo Kohonen于1981年提出的。该网络是一个由全连接的神经元阵列组成的无教师自组织、自学习网络。Kohonen认为,处于空间中不同区域的神经元有不同的分工,当一个神经网络接受外界输入模式时,将会分成不同的反应区域,各区域对输入模式具有不同的响应特征。
SOM网络的一个典型特征就是可以在一维或二维的处理单元阵列上,形成输入信号的特征拓扑分布,因此SOM网络具有抽取输入信号模式特征的能力。SOM网络一般只包含有一维阵列和二维阵列,但也可以推广到多维处理单元阵列中去。
(二)SOM网络学习算法
1、初始化。对N个输入神经元到输出神经元的连接权值赋予较小的权值。选取输出神经元j个“邻接神经元”的集合Sj。其中Sj(0),表示时刻t=0的神经元j的“邻接神经元”的集合,Sj(t)表示时刻t的“邻接神经元”的集合。区域Sj(t)随着时间的增长而不断缩小。
2、提供新的输入模式X。
4、给出一个周围的邻域Sk(t)。
7、提供新的学习样本来重复上述学习过程。
三、基于SOM网络的城市分类实证分析
城市分类可以便于我们了解各个城市的发展状况,从而为我们制订城市的发展决策提供依据。现在人工神经网络已经得到了很大的发展,它为我们研究此类问题提供了一种新的工具和思路。所以基于这个问题,我们尝试利用SOM网络来进行城市分类。SOM网络是一种具有聚类功能的神经网络,并且它是无教师训练方式,我们只需要采集输入样本,而不必如入目标值就可以得到我们想要的结果,可见SOM网络使用也十分方便。
(一)网络样本设计
从山东省统计局网站,我们得到了山东省17个地级市城市的样本。从中我们看出,原始指标数据波动较大,而一般来说,神经元的输出函数在0-1之间最为灵敏,为了提高训练的效率,所以要把数据进行归一化处理。归一化处理方法为:找出每个指标数据中的最大和最小值,利用(x-min)/(max-min)公式把所有数据归一化为0到1之间的数。
(二)网络设计
本文利用MATLAB R2008进行编程构建。确定网络的输入模式为:
Pk=(P1k,P2k,…pkn) ,k=1,2,…17,n=19
即一共有17组城市样本向量,每个样本中包括19个元素。
1、首先利用函数newsom创建一个SOM网络。根据实际情况本文创建网络的竞争层分别选用3、4、5、6层的结构。然后经过实验,分别观察其性能,从而选取分类效果最好的一组。
2、利用函数train和仿真函数sim对网络进行训练并仿真。仿真的步数大小同样影响网络的聚类性能,这里我们设置步数为1000。
最后经过分类结果如表1所示。
(三)实验结果分析
最后经过分析筛选,发现当这17个城市被划分为6类时和现实情况较为符合。分类情况如表2所示。
第一类:从表中看出,济南和青岛被归为了一类,并且在分类数为3、4、5、6时,济南和青岛都被列为了一类。从表中我们可以看到济南、青岛在各方面都优于其他城市,尤其是制造业、教育、以及公共管理和社会组织方面。济南是山东省省会,是全省、文化、经济,金融,教育中心,也是国家批准的沿海开放城市和十五个副省级城市之一。青岛是全国70个大中城市之一,全国五个计划单列市之一。工业有纺织、机车车辆、机械、化学、石油化工、钢铁、橡胶、家用电器、啤酒、卷烟等。有驰名中外的青岛啤酒、海尔集团、海信集团等大企业集团。并且,二者都有丰富的教育资源,全省大多高校均聚集在此。
第二类:淄博、泰安、德州、聊城在发展方面,各个方面较为均衡,没有特别显著的特点。四者的制造业、建筑业和教育大约位于全省中间地位。
第三类:枣庄、东营属特殊职能类型城市。两个城市相对其他城市来说,采矿业较为发达。枣庄境内已探明地下矿藏36种:煤、铁、铜、铝、金、银、锶(天青石)、石膏、萤石、水泥原料灰岩等。其中煤、石膏地质储量为15.4亿吨和4.1亿吨。而东营又称“石油之城”,丰富的石油、天然气资源。但是,两个城市的制造业相对薄弱,其他产业大约处于平均水平。
第四类:烟台在此被单独分成了一类,其具有自身的特色,并且发展潜力巨大。烟台的制造业和交通运输业位于全省前列。烟台的工业主要以造船、轻纺、机械、建材、电子、冶金、医药等行业为主,并且还有张裕葡萄酒、三环锁等烟台的传统产品。近年来,锦纶、白卡纸、电子网目板等技术水平较高的项目相继投产。烟台在地理位置上东连,西接潍坊,西南与毗邻,北濒、,与对峙,并与隔海相望,共同形成拱卫首都的海上门户。所以,烟台的交通运输业较为发达。另外,烟台的招远金矿为烟台采矿业也提供了大量了就业机会。
第五类:潍坊、临沂、济宁和菏泽在教育和公共管理和社会组织方面处于全省前列地位,其他方面稍稍逊色一些。
第六类:威海、日照、莱芜、滨州这四个城市各个方面表现均不太突出,但是,这些城市的发展潜力很大。威海、日照属沿海城市,交通便利,可以重点发展交通运输业。莱芜、滨州虽地处内陆,但也可依附内陆的经济中心——济南来发挥特色经济。
四、结论
通过本文的研究,可以看出利用SOM网络基本可以完成城市的分类研究,并且可以调整分类类别,来满足不同的需要。但是,SOM的分类还不够精确,这主要是采集数据的不完备性。因为信息的不完全,使SOM的聚类功能并未发挥极致。但是,利用SOM网络,操作过程较传统方法方便很多,只需收集数据,将其输入网络,网络就能自行进行学习、训练,并且是无教师学习方式,不必输入目标值,这些优点都是许多其他方法不能比拟的,相信随着采集数据的完备性和精确性,这种方法在城市分类方面可以得到广泛的应用和推广。
参考文献:
1、神经网络理论与MATLAB R2007实现[M].电子工业出版社,2008.
2、吴聘奇,黄民生.SOM网络在福建省城市职能分类中的应用[J].经济地理,2005(1).