用户名: 密码: 验证码:
一种基于后缀树的中文网页层次聚类方法
详细信息   全文下载|推荐本文 |
  • 出版年:2006
  • 作者:史庆伟;赵政;朝柯
  • 单位1:天津大学计算机学院
  • 单位2:辽宁工程技术大学软件学院
  • 出生年:1973
  • 学历:博士研究生
  • 语种:中文
  • 作者关键词:Web挖掘;层次聚类;Web;搜索;后缀树
  • 起始页:890
  • 总页数:3
  • 经费资助:国家自然科学基金资助项目(90604013)
  • 刊名:辽宁工程技术大学学报
  • 是否内版:否
  • 刊频:双月刊
  • 创刊时间:1979
  • 主管单位:辽宁省教育厅
  • 主办单位:辽宁工程技术大学
  • 主编:邵良杉
  • 地址:辽宁省阜新市
  • 邮编:123000
  • 卷:25
  • 期:6
  • 期刊索取号:P720.66 573
  • 数据库收录:全国中文核心期刊;辽宁省一级期刊;美国《工程索引》(Ei)收录源期刊;美国《化学文摘》(CA)收录源期刊;俄罗斯《文摘杂志》(AJ)收录源期刊;美国《剑桥科学文摘:材料科学》(CSA:MS)收录源期刊;荷兰《BibliographicDatabases》收录源期刊;美国《剑桥科学文摘:固体与超导(CSA:SSSA》收录源期刊
  • 核心期刊:全国中文核心期刊
摘要
为了便于用户浏览搜索引摮产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。实验结果表明:STCC算法与STC算法相比,聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700