用户名: 密码: 验证码:
基于K均值聚类的改进算法研究
详细信息    查看全文 | 下载全文 | 推荐本文 |
  • 作者:江京亚郭庆胜孙雅庚陈旺
  • 会议时间:2014-10-11
  • 关键词:数据挖掘 ; K均值聚类法 ; 改进算法 ; 稳定性
  • 作者单位:江京亚,孙雅庚,陈旺(武汉大学资源与环境科学学院,武汉,430079)郭庆胜(武汉大学资源与环境科学学院,武汉,430079;武汉大学测绘遥感信息工程国家重点实验室,武汉,430079)
  • 母体文献:中国地理信息科学2014学术年会论文集
  • 会议名称:中国地理信息科学2014学术年会
  • 会议地点:徐州
  • 主办单位:中国地理信息产业协会理论与方法工作委员会
  • 语种:chi
  • 分类号:TP3;P23
摘要
在如今信息爆炸的现代社会,怎样从浩瀚的数据海洋中提取有用的信息,挖掘出数据背后隐藏的深层信息和知识一直是众多学者研究的一个热点.数据挖掘正是力求解决这个问题的一门新兴技术.聚类分析是数据挖掘中的一种有效方法,把具有相似性质的对象归为一类,不同性质的对象归为不同类别,从而发现或预测用户感兴趣的信息. 为提高算法的精度和效率,本文引进4-dist图来对数据进行预处理,在初始类中心的选取和噪声点的辨别两个问题上提出改进。本文利用生成的四个不同类型的数据集和863项目“大数据地理信息时序分析和变化特征提取”的一部分数据,进行了多次K均值聚类的改进算法和传统的K均值聚类算法的对比实验。实验证明了改进后聚类算法的迭代次数少,聚类稳定,所得结果理想。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700