基于多元索引后继树的时间序列数据流挖掘
详细信息 本馆镜像全文    |  推荐本文 | | 获取馆网全文
摘要
本文以地电前兆观测数据流为研究对象,提出了一种新颖的基于多元索引后继树的时间序列数据流挖掘模型。该模型的主要特点是使用一种新颖的位置索引方法,通过一遍扫描创建描述一个序列的所有元素的绝对位置的多元索引后继树,使用索引匹配方法以模式增长的方式生成频繁模式。理论分析与实验表明,该方法简单、高效,具有很好的实用价值。同时,通过对大量持续的地电前兆观测数据流进行分析处理,挖掘隐藏在其中的反映地电参数正常变化规律及趋势的频繁模式,为发现地电前兆异常识别提供依据,从而辅助进行地震预报。
Studying the geoelectric precursory data streams,a new time-series data stream data model based on the Sequence Multi-Index Successive Trees(SMIST) is put forward,which uses index to create SMIST through scanning the sequence by one time,and then uses index matching and pattern growth to generate frequent patterns.The results in both theory analyses and experiments show that this algorithm is so simple and direct,efficient,and has a practical value.In order to discover the hidden regularity of the geoelectric knowledge,a large number of geoelectric precursory data streams are processed and analyzed.The newly-found regular patterns and the trend of geoelectric parameters can provide a basis for detecting abnormal precursors,which can be used in earthquake prediction.
引文
[1]刘学军,徐宏炳,董逸生,等.挖掘数据流中的频繁模式[J].计算机研究与发展,2005,42(2):2192-2198.
    [2]Gi mmella C,Han J,Pei J,et al.Mining Frequent PatternsinData Streams at Multiple Ti me Granularities[M]∥KarguptaH,Joshi A,Sivaknrnar K,eds.Next Generation Data Min-ing.Cam-bridge Massachusetts:MIT Press,2003.
    [3]Chang J H,Lee WS.Finding Recent Frequent Itemsets A-daptively over Online Data Streams[C]∥Proc of the 9thACMSIGIaDDInt’l Conf on Knowledge Discovery and DataMining,2003:487-492.
    [4]解用明,韩和平,高登平,等.大地电场日变化[J].山西地震,2006(3):1-4.
    [5]冯文超,吴绍春,王炜.基于IRST的并行时序模式挖掘算法[J].计算机工程应用研究,2007,24(12):137-140.
    [6]胡晓琳,陈晓云.基于符号化表示的时间序列频繁子序列挖掘[J].计算机工程,2008,34(10):61-63.
    [7]曾海泉,胡运发,周永康,等.基于互关联后继树的时序模式挖掘[J].模式识别与人工智能,2003,16(3):299-305.

版权所有:© 2023 中国地质图书馆 中国地质调查局地学文献中心