用户名: 密码: 验证码:
面向新浪微博签到数据的时空热点事件识别方法
详细信息    查看全文 | 下载全文 | 推荐本文 |
  • 作者:万幼周成虎裴韬
  • 会议时间:2014-10-11
  • 关键词:时空热点事件 ; 特征识别 ; 文本聚类法 ; 微博平台 ; 签到数据
  • 作者单位:万幼(武汉大学资源与环境科学学院,武汉,430079)周成虎,裴韬(中国科学院地理科学与资源研究所,资源与环境信息系统国家重点实验室,北京,100101)
  • 母体文献:中国地理信息科学2014学术年会论文集
  • 会议名称:中国地理信息科学2014学术年会
  • 会议地点:徐州
  • 主办单位:中国地理信息产业协会理论与方法工作委员会
  • 语种:chi
  • 分类号:TP3;TP2
摘要
时空热点事件可定义为一定数量的人群在特定的时间和地点共同参与的事情.这里的人群数量反映的了事件的热度、流行度.参与的人越多,事件越热门.而特定的时间和地点则表征了热点事件的时空特征.实时的跟踪人群的活动轨迹,并获取人群的活动内容是当前大数据分析的一个重要内容.然而,如何及时准确的获取人群的位置信息、活动内容,并从中有效的提取有价值的信息,是一个研究难点. 本文研究了面向新浪微博签到数据的时空热点事件实时识别方法。通过统计新浪微博用户在同一位置、不同时间签到人数的历史数值,定义了一种基于中位数统计指标的时空热点事件的定量化判别方法。同时,针对己识别出的时空热点事件所发生区域内的微博签到数据,设计了基于密度的文本聚类方法,可以有效的去除噪声数据,并将热点事件的主题内容提取出来。最后,将热点事件的主题内容与事件发生区域相结合,以地图可视化的形式展示时空热点事件。通过实验证实了本文方法能有效的去除微博签到数据中的噪声,并准确提取出各地铁站点区域内发生的多个时空热点事件。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700