用户名: 密码: 验证码:
基于网络搜索指数和EMD-ARIMA-BP组合模型的游客量预测——以张家界为例
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:On the Prediction of Tourist Volume Based on Network Search Index and EMD-ARIMA-BP Combination Model:A Case Study of Zhangjiajie
  • 作者:陆利军
  • 英文作者:LU Lijun;College of Tourism,Central South University of Forestry and Technology;College of Economics and Management,Hunan Institute of Technology;Hunan Human Settlement Environment Research Base,Hunan Institute of Technology;
  • 关键词:网络搜索指数 ; ARIMA模型 ; EMD算法 ; BP神经网络 ; 游客量预测
  • 英文关键词:network search index;;ARIMA model;;EMD algorithm;;BP neural network;;prediction of tourist volume
  • 中文刊名:JSDX
  • 英文刊名:Journal of Jishou University(Social Sciences)
  • 机构:中南林业科技大学旅游学院;湖南工学院经济与管理学院;湖南工学院湖南省人居环境学研究基地;
  • 出版日期:2019-01-31 11:32
  • 出版单位:吉首大学学报(社会科学版)
  • 年:2019
  • 期:v.40;No.183
  • 基金:国家自然科学基金项目(61772192);; 湖南省人居环境学研究基地开放基金项目(RJ18K03);; 湖南省高等学校科学研究项目(14C0308)
  • 语种:中文;
  • 页:JSDX201901017
  • 页数:13
  • CN:01
  • ISSN:43-1069/C
  • 分类号:143-155
摘要
科学的客流量预测有利于完善旅游安全预警体系和优化旅游资源配置体系。为进一步提高游客量预测的准确度,提出一种基于网络搜索指数的EMD-ARIMA-BP组合模型,以探究互联网时代旅游消费者出行行为规律。该模型首先对网络搜索行为数据进行指数合成,其次利用EMD算法对游客量和网络搜索数据进行去噪处理,最后将ARIMA模型和BP神经网络进行组合,对游客量进行预测。实证分析以张家界为例。研究发现:(1)运用网络搜索数据预测旅游消费者出行行为切实可行,接近于实时的网络数据可以大幅提升预测的时效性;(2)经过EMD去噪算法对游客量与网络搜索行为数据进行去噪处理后,游客量的预测精度有较大程度提高;(3)基于网络搜索指数和EMD-ARIMA-BP组合模型的预测误差显著低于ARIMA模型和BP神经网络等基准模型。
        Scientific prediction of tourist volume is helpful to perfect the early warning system of tourism security and optimize the allocation system of tourism resources.In order to further improve the accuracy of tourist volume prediction,a combination model of EMD-ARIMA-BP neural network based on web search index is proposed to explore the new rules of travel behavior of tourism consumers in the Internet age.The model firstly synthesizes the web search behavior data exponentially,using the EMD algorithm to deal with the noise of the visitor volume and the web search behavior data,combining the econometric prediction model and the BP neural network model to predict tourist volume.The empirical analysis takes the prediction of tourist volume in Zhangjiajie as an example.The results are as follows:(1)it is feasible to predict the travel behavior of tourism consumers by using web search behavior data,and real-time network data can greatly improve the timeliness of prediction;(2)after de-noising the data of tourist volume and web search behavior with EMD de-noising method,the prediction accuracy of tourist volume is improved to a great extent;(3)the prediction error based on the combination of network search index and EMD-ARIMA-BP neural network model is significantly lower than the three benchmark models of ARIMA time series,econometric prediction model and BP neural network.
引文
[1]国家发展和改革委员会.2017年中国居民消费发展报告[R].北京:人民出版社,2018:3-5.
    [2]Haiyan Song,Gang Li,Tourism demand modeling and forecasting—A review of recent research[J].Tourism Management,2008(2):203-220.
    [3]李丹,赵媛.对中国国际入境旅游市场的滚动样本预测——基于季节效应ARIMA模型[J].经济问题,2008(6):124-126.
    [4]刘霁雯,梁峰,向华.基于GARCH族模型的中国旅游酒店板块指数收益率波动分析[J].统计与信息论坛,2010(4):63-68.
    [5]吴良平,张健,王汝辉.基于SARIMA模型的汶川大地震对四川省旅游业影响研究[J].旅游论坛,2012(3):56-60;86.
    [6]杜勇宏,王汝芳.季节时间序列理论发展综述[J].技术经济与管理研究,2009(6):3-9.
    [7]周成,冯学钢.上海入境旅游市场的季节特征、波动周期与发展趋势——基于X-12-ARIMA和HP滤波法[J].旅游科学,2016(6):39-53.
    [8]王领,苟晓敏.中国游客赴日旅游消费的影响因素研究——基于X12-ARIMA模型的分析[J].山东财经大学学报,2018(2):86-95;104.
    [9]吴良平,张健.中国入境客流区域集散的结构差异与转移规律研究[J].旅游科学,2017(6):14-29.
    [10]魏瑾瑞,崔浩萌.基于网络搜索行为数据的区域旅游指数及其微观动态:以西安为例[J].系统科学与数学,2018(2):177-194.
    [11]李维维,马晓龙.国内旅游经济周期与宏观经济周期同步吗?——基于MS-VAR模型时变特征的验证[J].旅游学刊,2017(11):49-59.
    [12]古冰.基于投入产出法及ANN模型的文化产业和旅游产业融合分析[J].商业经济研究,2017(18):170-173.
    [13]陈荣,梁昌勇,谢福伟,等.基于自适应GA-SVR的旅游景区日客流量预测[J].中国管理科学,2012(S1):61-66.
    [14]邓祖涛,陆玉麒.BP神经网络在我国入境旅游人数预测中的应用[J].旅游科学,2006(4):49-53.
    [15]Bates J M,Granger C W J.The combination of forecasts[J].Journal of the Operational Research Society,1969,20(4):451-468.
    [16]谈正达,唐琳,胡海鸥.我国国际资本流动与货币冲销的有效性研究:1999—2010[J].国际金融研究,2011(12):29-37.
    [17]王国新,杨晓娜.基于AIDS模型的入境旅游者消费结构和消费选择分析——以杭州市为例[J].旅游论坛,2014(6):23-31.
    [18]雷可为,陈瑛.基于BP神经网络和ARIMA组合模型的中国入境游客量预测[J].旅游学刊,2007(4):20-25.
    [19]梁昌勇,马银超,陈荣,等.基于SVR-ARMA组合模型的日旅游需求预测[J].管理工程学报,2015(1):122-127.
    [20]Pan B,MacLaurin T,Crotts J C.Travel blogs and the implications for destination marketing[J].Journal of Travel Research,2007,46(1):35-45.
    [21]Ginsberg J,Mohebbi M H,Patel R S,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009,457(7232):1012.
    [22]张崇,吕本富,彭赓,等.网络搜索行为数据与CPI的相关性研究[J].管理科学学报,2012(7):50-59,70.
    [23]刘颖,吕本富,彭赓.网络搜索对股票市场的预测能力:理论分析与实证检验[J].经济管理,2011(1):172-180.
    [24]张捷,刘泽华,解杼,等.中文旅游网站的空间类型及发展战略研究[J].地理科学,2004(4):493-499.
    [25]孙烨,张宏磊,刘培学,等.基于旅游者网络关注度的旅游景区日游客量预测研究——以不同客户端百度指数为例[J].人文地理,2017(3):152-160.
    [26]Smeral E.Tourism Forecasting Performance Considering the Instability of Demand Elasticities[J].Journal of Travel Research,2017,56(7):913-926.
    [27]Li X,Pan B,Law R,et al.Forecasting tourism demand with composite search index[J].Tourism management,2017,59:57-66.
    [28]董现垒,Bollen Johan,胡蓓蓓.基于网络搜索行为数据的中国消费者信心指数的测算[J].统计与决策,2016(5):9-13.
    [29]孙毅,吕本富,陈航,等.基于网络搜索行为的消费者信心指数构建及应用研究[J].管理评论,2014(10):117-125.
    [30]刘涛雄,徐晓飞.互联网搜索行为能帮助我们预测宏观经济吗?[J].经济研究,2015(12):68-83.
    [31]Song H,Witt S F,Jensen T C.Tourism Forecasting:Accuracy of Alternative Econometric Models[J].International Journal of Forecasting,2003,19(1):123-141.
    [32]Athanasopoulos G,Song H,Sun J A.Bagging in Tourism Demand Modeling and Forecasting[J].Journal of Travel Research,2018,57(1):52-68.
    [33]马丽君,孙根年,王洁洁.基于本底趋势线与小波函数的中国旅游成长及多周期分析[J].旅游科学,2009(6):21-27.
    [34]陈玲玲,杨慧.我国入境旅游客源与旅游外汇收入的多尺度对比研究——EMD方法的新应用[J].地域研究与开发,2011(6):94-97.
    [35]李晓炫,吕本富,曾鹏志,等.基于网络搜索和CLSIEMD-BP的旅游客流量预测研究[J].系统工程理论与实践,2017(1):106-118.
    [36]蔡跃洲,张钧南.信息通信技术对中国经济增长的替代效应与渗透效应[J].经济研究,2015(12):100-114.
    [37]Witt S F,Moutinho L,Huarng K H,et al.Tourism demand modelling and forecasting[M]∥CABI Publishing,Strategic management in tourism,2018:45-72.
    [38]Ye Q,Song H,Li T,et al.Tourism Management Perspectives[J].Tourism Management,2018,26:89-96.
    [39]黄炜,孟霏,徐月明.游客环境态度对其环境行为影响的实证研究——以世界自然遗产地张家界武陵源风景区为例[J].吉首大学学报(社会科学版),2016(5):101-108.
    [40]任乐,崔东佳.基于网络搜索行为数据的国内旅游客流量预测研究——以北京市国内旅游客流量为例[J].经济问题探索,2014(4):67-73.
    [41]卢洪涛.面向信息分析与预测的网络搜索关键词集中度和相关度研究[D].武汉:武汉大学,2013.
    [42]黄先开,张丽峰,丁于思.百度指数与旅游景区游客量的关系及预测研究——以北京故宫为例[J].旅游学刊,2013(11):93-100.
    [43]马丽君,郭留留.基于网络关注度的北京市居民对5A级景区旅游需求时空特征分析[J].干旱区资源与环境,2017(10):203-208.
    [44]麻学锋,杨雪.张家界旅游产品开发的空间演化与乡村振兴分析[J].吉首大学学报(社会科学版),2018(3):48-58.
    (1)通过国内外研究旅游预测常用方法模型对比发现,国内使用灰色系统理论(GST或GS)方法较多,但该方法在国外的类似研究中应用甚少。有学者将这一现象出现的原因归为:近年来,我国旅游产业发展迅猛,但与旅游产业相关的统计数据却仍有很多是空白或较为笼统。而灰色预测方法则更加擅长解决“样本量小、信息贫乏、确定性低”问题。
    (1)因本文仅涉及国内游客量预测研究,根据Statcounter中的搜索引擎市场占有率排行榜(中国)历史统计数据,百度搜索在2011.01—2018.03的平均市场占有率达到了70.05%。因此,考虑覆盖面和网民使用率,论文选择使用百度搜索引擎提供的关键词百度指数搜索引擎使用率作为基础统计数据。此外,有学者运用I网络=I百度/R百度使用率公式对关键词的百度搜索指数进行修正以弥补关键词的百度搜索指数因百度搜索使用率的不断变化而无法全面反映关键词的网络搜索变化趋势的不足。本文经过测算认为,百度使用率的变化对关键词的网络搜索变化趋势的影响并不大,故未对关键词的百度搜索指数进行修正。
    (2)因张家界统计信息网发布的数据最小粒度为月,故本文以月为周期进行统计。
    (1)百度搜索指数分为PC网络搜索指数、移动网络搜索指数和整体(PC端+移动端)网络搜索指数。综合PC网络搜索指数的先行性优势和移动网络搜索指数发布时间(2011年1月开始发布)与本文数据需求(自2010年8月开始搜集)考虑,本文的网络搜索指数特指PC网络搜索指数,不包括移动网络搜索指数
    (2)谷歌搜索提供的趋势数据(Google Trends)针对特定关键词查询数量生成査询指数,将特定关键词网络搜索量与同一时段内最高网络搜索量比较,得出该词的相对搜索量,而百度指数反映的是通过百度进行搜索的关键词的绝对搜索量。且,谷歌趋势数据可以直接下载,百度指数只是在统计图中提供了动态数据,本文采用webdriver模拟用户登录,获取百度指数图片,再基于tesseract训练的指数识别程序得到具体百度指数数值。
    (3)本文对运用范围选词法选定的7个关键词相互之间进行了相关性检验,发现,上述7个搜索关键词之间均存在强相关性(皮尔森相关系数大于0.8),故采用合成网络搜索指数方法以消除数据间的共线性,提高模型的预测效果。
    (1)阈值的确定对于预测结果和噪声都有很大的影响,阈值过低会导致条件过于放松,从而降低搜索指数与游客量的相关性并包含过多的噪声干扰;而阈值过高则会导致关键词过于节俭,从而遗漏掉影响游客量的重要影响因素。此外,网络搜索关键词必须要有先行性,只有具有先行性的搜索词才具有预测能力。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700