用户名: 密码: 验证码:
注疏文献的结构化知识表示
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
在当今这个信息时代,众多传统学科与计算机科学结合到一起,产生了一些新的研究理论和方法。注疏文献在阅读古书、整理古籍、编纂辞书、了解古代社会与文化等多个方面具有广泛的应用价值,但在注疏文献中存在一些问题,比如:注疏文献是半结构化形式的、注疏文献中“解释类成分”和“被释成分”使用了形式上相同但实质上有所区别的同一种语言、注疏文献中没有明确地标示出和原典之间在句子层次上的对应关系等。这些问题给人们利用计算机分析和处理注疏文献带来不便。
     因此,我们认为有必要深入分析注疏文献的知识结构,采用新的知识表示方法来表示其中的知识,把注疏文献由半结构化形式转化为结构化形式,把注疏文献中知识点之间的隐性联系转化为显性联系,使得注疏文献既便于计算机处理,又便于人们阅读和研究。
     本文深入分析了各种知识表示方法和注疏文献的传统知识结构,提出以结构化知识表示为重点的研究目标,设计了基于本体和XML的知识表示方案。按照此方案,我们构建了训诂学初始本体,以形式化方式表示训诂学领域中的概念及其相互关系;然后根据注疏文献的知识结构特点,再参照训诂学初始本体,定义了表示注疏文献知识结构的XML架构;接下来,探索注疏文献知识结构的自动转化方法;最后,利用结构化表示的知识对《十三经注疏》进行引文分析。本文的创新点有以下三个方面:
     (1)提出了一种本体建模的新方法,并且利用该方法构建了训诂学初始本体。本方法强调对学科的传统知识组织模型做深入分析,通过传统知识组织模型与本体模型之间的转化提高本体建模的效率。
     (2)定义了表示注疏文献和经典古籍知识结构的XML架构。该架构是在分析注疏文献的外部关联事物、内部体例结构和知识单元的基础上,参照训诂学初始本体定义的。
     (3)研究了注疏文献知识结构的转化方法。我们采用计算语言学方法,利用注疏文献的半结构化特征编写规则,设计了多个算法和实验,取得较好的效果,这项研究能够显著提高注疏文献知识结构转化工作的效率。
     注疏文献经过结构化知识表示后,具有更大的应用价值,能够应用于多个研究领域。我们可以把它应用于检索系统中,作为检索系统的语料资源,还可应用于知识聚类、古籍文献研究和教学等领域。本文重点介绍了利用训诂学初始本体和结构化的注疏文献解决引文分析中的难点,实现了对《十三经注疏》中各部注疏文献之间的耦合分析,以及被引文献的同被引分析。
In this age of information, many traditional disciplines and computer science have combined to give birth to some new theories and methods. Commentary literatures have a wide range of application in reading ancient literatures, sorting ancient books, compiling dictionaries, understanding ancient society and culture, and so on. However, there are some problems in commentary literatures. For example:commentary literatures are semi-structural form, and in commentary literatures,"interpretive components" and "be interpreted ingredients" used the same language, but they have different essential. And correspondence relation between commentary literatures and their original books were not marked out explicitly on the sentence level. So, researchers have inconvenience when they use computers to analyze commentary literatures.
     Therefore, we think it is necessary to analyze knowledge structure of commentary literatures in depth, and represent knowledge structure of commentary literatures in a new knowledge representation mode. People should transform commentary literatures from semi-structural into structural, from invisible link into explicit link, and make commentary literatures not only facilitate for computer processing, and easier for people to read and study.
     This paper analyzed all kinds of knowledge representation methods and traditional knowledge structure of commentary literatures. We proposed an expression goal to focus on structural knowledge representation, and designed a knowledge representation project based on ontology and XML. According to this project, we constructed an exegetics initial ontology. The exegetics ontology is a formal description of the concepts and their relationship in exegetics. Then, according to knowledge structure of commentary literatures, and referring to the exegetics ontology, we defined the XML Schema to express the knowledge structure of commentary literatures. Next, we studied the automatic transform method of the knowledge structure of commentary literatures. Finally, we used structural knowledge to analyze the citation of Note of Thirteen Classics. This article has the following three innovations:
     First, this paper proposed a new method of ontology modeling, and used the method to construct exegetics ontology model. This method emphasizes the important role of domain experts in discipline ontology modeling process. And this method can improve efficiency of ontology modeling by transforming traditional knowledge organization model to ontology model.
     Next, this paper defined the XML Schemas to express the knowledge structures of commentary literatures and classical ancient books. The XML Schemas were defined based on the external related things, internal structure and knowledge unit of commentary literatures, and referring to the exegetics ontology.
     Then, we studied the conversion method of knowledge structure of commentary literatures. We use computational linguistics method to formulate rules according to semi-structural feature of commentary literatures, and designed several algorithms and experiments. The result of experiments showed the method was feasible. This study can improve the efficiency of structure transformation of commentary literatures significantly.
     Commentary literatures have greater value after structural knowledge representation. They can be used in many research fields. We can apply commentary literatures in retrieval system, as the corpus resource of the system, also apply in the field of knowledge clusters, and ancient literature research and teaching, and so on. we solved the difficulties in the citation analysis using the exegetics ontology and structural commentary literatures, achieved the coupling analysis between commentary literatures in Note of Thirteen Classics, and cited analysis about literatures those were cited.
引文
① 蒋永福、李景正:《论知识组织方法》,《中国图书馆学报》2001年第1期。
    ② 姜永常:《基于知识网络的动态知识构建:空间透视与机理分析》,《中国图书馆学报》2010年第4期。
    ③ 常娥、黄建年、侯汉清:《古籍智能整理与开发系统构建研究》,《情报资料工作》2009年第4期。
    ① 毛建军:《古籍数字化理论与实践》,北京:航空工业出版社,2009年,第8页。
    ② 徐清、石向实、王唯:《古籍数字化资源的深度开发》,《图书情报工作》2007年第3期。
    ③ 王立清:《中文古籍数字化研究》,北京:国家图书馆出版社,2011年,第25页。
    ① 胡佳佳:《(说文解字>语料库的XML标注设计》,《社会科学论坛》2011年第7期。
    ② 戴维民:《语义网信息组织技术与方法》,上海:学林出版社,2008年,第13页。
    ① 尉迟治平:《汉语信息处理和计算机辅助汉语史研究》,《语言研究》2004年第3期。
    ② 马创新、陈小荷:《基于XML的<论语)与其注疏文献对齐语料库的知识表示》,《图书情报知识》2013年第1期。
    ③ 姚伯岳、张丽娟、于义芳等:《古籍元数据标准的设计及其系统实现》,《大学图书馆学报》2003年第1期。
    ④ 山川、罗晨光:《XML著录古籍元数据初探》,《图书馆工作与研究》2007年第6期。
    ⑤ 吴琴霞、刘永革:《基于XML/Schema甲骨文语料库语料标注的研究》,《科学技术与工程》2009年第17期。
    ⑥ 石民、李斌、陈小荷:《基于CRF的先秦汉语分词标注一体化研究》,《中文信息学报》2010年第2期。
    ⑦ 常娥、侯汉清、曹玲:《古籍自动校勘的研究和实现》,《中文信息学报》2007年第2期。
    ① 于丽丽、丁德鑫、曲维光等:《基于条件随机场的古汉语词义消歧研究》,《微电子学与计算机》2009年第10期。
    ② 段磊、韩芳、宋继华:《古汉语双字词自动获取方法的比较与分析》,《中文信息学报》2012年第4期。
    ③ 马创新、陈小荷、曲维光等:《(论语)与其注疏文献对齐语料库的构建》,《现代教育技术》2012年第7期。
    ④ 徐润华、陈小荷:《一种利用注疏的<左传)分词新方法》,《中文信息学报》2012年第2期。
    ⑤ 罗晨光、山川、王珊:《基于本体的古籍知识库建设初探》,《现代图书情报技术》2007年第4期。
    ⑥ 谷建军:《基于叙词表的中医古籍文献领域本体建模方法研究》,博士学位论文,中国中医科学院,2006年,第55页。
    ① 蒋永福、李景正:《论知识组织方法》,《中国图书馆学报》2001年第1期。
    ② Schubert P, Lincke D, Schmid B. A global knowledge medium as a virtual community:The NetAcademy concept[C]//Proceedings of the 4th Americas Conference on Information Systems. Baltimore,1998:618-620.
    ② 危辉,何新贵:《表象式直接知识表示》,《计算机学报》2001年第8期。
    ④ Dretske F, Knowledge and the flow of information, Cambridge:MIT Press,1981, p.48.
    ③ 张一兵:《波兰尼与他的(个人知识)》,《哲学动态》1990年第4期。
    ④ 林东清:《知识管理理论与实务》,北京:电子工业出版社,2005年,第26页。
    ⑦ 柯平:《知识管理学》,北京:科学出版社,2007年,第57页。
    ⑧ 斯滕伯格:《成功智力》,上海:华东师范大学出版社,1999年,第233页。
    ① 王珏、袁小红、石纯一等:《关于知识表示的讨论》,《计算机学报》1995年第3期。
    ② 徐宝祥、叶培华:《知识表示的方法研究》,《情报科学》2007年第5期。
    ① 史忠植、杨至成、方健梅:《知识工程》,《计算机学报》1986年第4期。
    ② 危辉、何新贵:《表象式直接知识表示》,《计算机学报》2001年第8期。
    ① 冯志勇、李文杰、李晓红:《本体论工程及其应用》,北京:清华大学出版社,2007年,第12-13,35-47页。
    ② Winston p H, Artificial intelligence, New York:Addison-Wesley,1992, pp.19-38.
    ② 何绍华、王非:《知识表示规范比较研究》,《情报理论与实践》2007年第1期。
    ③ 刘建炜、燕路峰:《知识表示方法比较》,《计算机系统应用》2010年第3期。
    ④ 何绍华、王非:《知识表示规范比较研究》,《情报理论与实践》2007年第1期。
    ① 马创新、陈小荷、曲维光:《经典古籍注疏文献的知识网络研究与设计》,《图书情报工作》2013年第9期。
    ② 蒋永福、李景正:《论知识组织方法》,《中国图书馆学报》2001年第1期。
    ① 周大璞:《训诂学初稿》,武汉:武汉大学出版社,2011年,第14,300-354页。
    ② 杨端志:《训诂学》,山东:山东文艺出版社,1985年,第24-30页。
    ③ 杨端志:《训诂学》,山东:山东文艺出版社,1985年,第25页。
    ① 陈世铙:《从(经籍(?)诂)到(故训汇纂)》,《中国典籍与文化》1996年第4期。
    ① 于亭:《谈(故训汇纂)对<经籍纂诂)资料的扩展》,《中国典籍与文化》2001年第4期。
    ② 周大璞:《训诂学初稿》,武汉:武汉大学出版社,2011年,第14,300-354页。
    ③ 许威汉:《训诂学读本》,上海:上海交通大学出版社,2010年,第48-84页。
    ① [魏]何晏注,[宋]邢昺疏,《十三经注疏》整理委员会整理,李学勤主编,北京大学出版社1999年版。
    ② 此处以及下面三段中的省略号为本文作者所添加,表示在此处省略了原书中的部分文字。
    ① [魏]何晏注,[宋]邢昺疏,《十三经注疏》整理委员会整理,李学勤主编:《十三经注疏·论语注疏》,北 京:北京大学出版社,1999年,第44页.
    ① 许威汉:《训诂学读本》,上海:上海交通大学出版社,2010年,第48-84页。
    ① 马费成:《在数字环境下实现知识的组织和提供》,《郑州大学学报》(哲学社会科学版)2005年第1期。
    ② 王子舟、王碧滢:《知识的基本组分——文献单元和知识单元》,《中国图书馆学报》2003年第1期。
    ③ 赵红州:《论知识单元的智荷及其表示方法》,《知识工程》1991年第3期。
    ④ 徐荣生:《知识单元初论》,《图书馆杂志》2001年第7期。
    ⑤ 杨思洛、王皓、文庭孝:《基于引文分析的图书影响力研究:以图书情报领域为例》,《情报资料工作》2010年第1期。
    ① 王珏、袁小红、石纯一等:《关于知识表示的讨论》,《计算机学报》1995年第3期。
    ② 董慧、徐雷:《基于本体知识表示的历史领域专家系统模型》,《现代图书情报技术》2010年第7/8期。
    ③ 饶元、冯博琴:《基于本体的XML知识表示方法研究》,《微电子学与计算机》2004年第9期。
    ④ 蒋云良:《知识表示综述》,《湖州师专学报》1995年第5期。
    ① 刘升平、林作铨、梅婧等:《一种XML的模型论语义》,《软件学报》2006年第5期。
    ② 何继媛、窦永香、刘东苏:《大众标注系统中基于本体的语义检索研究综述》,《现代图书情报技术》2011年第3期。
    ③ 金燕、陈玉:《基于本体的标签控制方法研究》,《图书馆理论与实践》2010年第7期。
    ① Gruber T R, "A Translation Approach to Portable Ontology Specifications," Knowledge Acquisition,1993, 5(2),pp.199-220.
    ② 周大璞:《训诂学初稿》,武汉:武汉大学出版社,2011年,第14页。
    ③ 王宁:《训诂学原理》,北京:中国国际广播出版社,1996年,第2页。
    ① Gruber T R. A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993, 5(2):199-220.
    ② Guarino, Nicola. Semantic Matching:Formal Ontological Distinction for information Organization, Extraction, and Integration. In:Pazienza M T, eds. Information Extraction:A Multidisciplinary Approach to an Emerging Information Technology, Springer Verlag,1997.139-170.
    ③ 李景:《本体理论在文献检索系统中的应用研究》,北京:北京图书馆出版社,2005年,第10,183-228,111-112页。
    ④ 何克清、何扬帆、梁鹏:《本体元建模理论与方法及其应用》,北京:科学出版社,2008年,第15页。
    ① Grigoris Antoniou and Frank van Harmelen《语义网基础教程》,陈小平等译,北京:机械工业出版社,2008年,第110页。
    ② 顾曰国、张永伟:《静态图像库的信息检索与知识本体》,《当代语言学》2013年第2期。
    ③ Horrorks I, Patel-Schneider P F,"Reducing OWL entailment to description logic satisfiability," Journal of Web Semantics,2004, 1(4),pp.345-357.
    ① 李善平、尹奇铧、胡玉杰等:《本体论研究综述》,《计算机研究与发展》2004年第7期。
    ② Baader F and Calvanese D, The Description Logic Handbook:Theory, Implementation and Applications, London:Cambridge University Press,2003, pp.47-100.
    ③ Peter D. Karp and Thomas R. Gruber(1995). A generic Knowledgebase Access Protocol. Proceedings of the International Joint Conferences on Artificial Intelligence, Montreal,1995. An ontology-based knowledge sharing API for AI people.
    ① 李景:《本体理论在文献检索系统中的应用研究》,北京:北京图书馆出版社,2005年,第10,183-228,111-112页。
    ① 戴维民:《语义网信息组织技术与方法》,上海:学林出版社,2008年,第13,160页。
    ② 钟秀琴、符红光、余莉等:《基于本体的几何学知识获取及知识表示》,《计算机学报》2010年第1期。
    ① 李景:《本体理论在文献检索系统中的应用研究》,北京:北京图书馆出版社,2005年,第10,183-228,111-112页。
    ② 杜小勇、马文峰、武文娟:《学科领域本体的构建与进化——以经济学领域本体为例》,《现代图书情报技术》2007年第3期。
    ③ 夏立新、韩永青、张进:《基于本体的情报检索学科知识组织体系构建》,《现代图书情报技术》2008年第12期。
    ④ 高颖、曹存根、眭跃飞:《音乐领域本体的建立和分析》,《计算机科学》2004年第1期。
    ⑤ 蒋永福、付小红:《知识组织论:图书情报学的理论基础》,《图书馆建设》2000年第4期。
    ⑥ 潘颖、王天江、蒋雪玲:《基于本体的学科知识建模》,《计算机应用与软件》2008年第1期。
    ① 位传海、范太华:《基于本体的学习资源语义检索系统研究与设计》,《电化教育研究》2012年第2期。
    ① 冯志勇、李文杰、李晓红:《本体论工程及其应用》,北京:清华大学出版社,2007年,第12-13,35-47页。
    ② 李景:《本体理论在文献检索系统中的应用研究》,北京:北京图书馆出版社,2005年,第10,183-228,111-112页。
    ① 王宁:《训诂学原理》,北京:中国国际广播出版社,1996年,第2页。
    ② 许威汉:《训诂学读本》,上海:上海交通大学出版社,2010年,第48-84页。
    ③ 周大璞:《训诂学初稿》,武汉:武汉大学出版社,2011年,第14,300-354页。
    ④ 方一新:《训诂学概论》,南京:江苏教育出版社,2008年,第1-275页。
    ⑤ 白兆麟:《新著训诂学引论》,上海:上海辞书出版社,2005年,第1-337页。
    ⑥ 冯浩菲:《中国训诂学》,济南:山东大学出版社,1997年,第1-613页。
    ① 《中国语言学大辞典》编委会:《中国语言学大辞典》,南昌:江西教育出版社,1991年,第173页。
    ① 刘光蓉:《“C程序设计”课程内容本体构建》,《电化教育研究》2008年第12期。
    ① 马文峰、杜小勇:《领域本体进化研究》,《图书情报工作》2006年第6期。
    ① 毕强、杨达、刘甲学:《超文本信息组织技术》,北京:科学技术文献出版社,2004年,第169页。
    ① Priscilla Waalmsley:《XML模式权威教程》,陈维军、乔平安、英宇译,北京:清华大学出版社,2003年,第1页。
    ① 魏慧斌:《基于XML的古籍信息标注》,《汕头大学学报》(人文社会科学版)2006年第5期。
    ② 胡佳佳:《<说文解字)语料库的XML标注设计》,《社会科学论坛》2011年第7期。
    ③ 山川、罗晨光:《XML著录古籍元数据初探》,《图书馆工作与研究》2007年第6期。
    ④ 刘升平、林作铨、梅婧等:《一种XML的模型论语义》,《软件学报》2006年第5期。
    ⑤ 王浩然、徐建良、张巍:《一种XML元数据的自动语义标注方法》,《计算机科学》2008年第4期。
    ① 马坚、楼宇波、张亮:《基于本体的XML Schema生成方法》,《计算机工程与应用》2003年第11期。
    ② Erdmann M, Studer R, "How to structure and access XML documents with ontologies," Data and Knowledge Engineering,2001,36(3),pp.317-335.
    ③ Amann B, Fundulaki I, Scholl M, Beeri C, Vercoustre AM. Mapping XML fragments to community Web ontologies. In:Giansalvatore Mecca, Jerome Simeon. Eds.. Proc. Of the 4th Int'l Workshop on the Web and Databases(WebDB 2001).2001.
    ① 毕强、杨达、刘甲学:《超文本信息组织技术》,北京:科学技术文献出版社,2004年,第169页。
    ① 周武、金远平:《XML数据语义映射方法研究》,《计算机工程与应用》2003年第28期。
    ① 朱熹:《四书章句集注》,曾军整理,长沙:岳麓书社,2007年,第1页。
    ① 宋继华、王宁、胡佳佳:《基于语料库方法的数字化(说文)学研究环境的构建》,《语言文字应用》2007年第1期。
    ① 徐望驾:《(论语义疏)语言研究》,北京:中国社会科学出版社,2006年,第7页。
    ① Altova XMLSpy的官方主页http://www.altova.com/xmlspy.html.
    ① 王莉:《基于XML的学位论文元数据交换标准研究》,《现代图书情报技术》2007年第6期。
    ① Altova XMLSpy的官方主页http:/www.altova.com/xmlspy.html。
    ① William A. Gale, Kenneth W. Church, "A Program for Aligning Sentences in Bilingual Corporal," Computational Linguistics,1993,19(1),pp.75-90.
    ② Moore R C. Fast and Accurate Sentence Alignment of Bilingual Corpora [C]//Proceedings of AMTA. Springer-Verlag,2002:135-144.
    ① Nirenburg S. Two Approaches of Matching in Example-Based Machine Translation, Proc. TMT-93, Kyoto, Japan,1993.
    ② Li S, Zhang J, et al, "Semantic Computation in Chinese Question-Answering System" Journal of Computer Science and Technology,2002,17(6),p.933.
    ③ 杨思春、陈家骏:《中文自动问答中句子相似度计算研究》,《情报学报》2008年第1期。
    ① 董军军:《动态规划算法和贪心算法的比较与分析》,《软件导刊》2008年第2期。
    ① 郭锐、宋继华、廖敏:《基于自动句对齐的相似古文句子检索》,《中文信息学报》2008年第2期
    ① 许威汉:《训诂学读本》,上海:上海交通大学出版社,2010年,第48-84页。
    ② 王宁:《训诂学原理》,北京:中国国际广播出版社,1996年,第2页。
    ① 方一新:《训诂学概论》,南京:江苏教育出版社,2008年,第169页。
    ② Andrew Watt《正则表达式入门经典》,李松峰、李丽译,北京:清华大学出版社,2008年,第156-178页。
    ③ Behrouz A.Forouzan Richard F.Gilberg著,彭松虎译,《UNIX和shell程序设计权威教程》,清华大学出版社,2003年,第309页。
    ① Christopher D. Manning and Hinrich Schutze:《统计自然语言处理基础》,苑春法、李庆中、王昀等译,北京:电子工业出版社,2005年,第335页。
    ① 陈小荷、冯敏萱、徐润华:《先秦文献信息处理》,北京:世界图书出版公司,2013年,第28-49页。
    ② 石民、李斌、陈小荷:《基于CRF的先秦汉语分词标注一体化研究》,《中文信息学报》2010年第2期。
    ① 李运景:《基于引文分析可视化的知识图谱构建研究》,南京:东南大学出版社,2009年,第9页。
    ② 罗式胜:《文献计量学概论》,广州:中山大学出版社,1994年,第9页,
    ① 庞龙、张培富、杨立英:《引文分析方法在国内外应用的比较研究》,《山西大学学报》(哲学社会科学版)2006年第3期。
    ② 尤金·加菲尔德:《引言索引法的理论及应用》,侯汉清等译,北京:北京图书馆出版社,2004年,第30-123页。
    ③ Kessler, M. M, "Bibliographic Coupling Between Scientific Papers," American Documentation, 1963,14,pp.10-25.
    ④ Small, H. G, "Co-Citation in the Scientific Literature:A New Measure of the Relationship Between Two Documents" Journal of the American Society for Information Science,1973,24,pp.265-269.
    ① Narin, F. Carpenter, M. and Berlt, N. C, "Inter-relationships of Scientific Journals," Journal of the American Society for Information Science,1972,23,pp.323-331.
    ② Small, H. G and Griffith, B. C, "The Structure of Scientific Literature,1:Identifying and Graphing Specialties,"Science Studies,1974,4,pp.17-40.
    ③ Lin, N, "Stratification of the Formal communication System in American Sociology," American Sociologist, 1974,9,pp.199-206.
    ④ Small, H. G. Mapping the Specialty Structure of the Social Sciences Using the Social Sciences Citation Index. Unpublished report of a study for the National Science Foundation,1975.
    ⑤ 苏新宁:《我国人文社会科学图书被引概况分析:基于CSSCI数据库》,《东岳论丛》2009年第3期。
    ⑥ 杨思洛、王皓、文庭孝:《基于引文分析的图书影响力研究:以图书情报领域为例》,《情报资料工作》2010年第1期。
    ⑦ 刘晓霞:《基于引文分析的核心书目测定研究》,《图书馆建设》2013年第9期。
    ⑧ 祝清松、冷伏海:《引文内容分析方法研究综述》,《情报资料工作》2013年第5期。
    ⑨ Pham S B, Hoffmann A. A new approach for Scientific citation classification using cue phrases[C]. Proceedings of Australian Joint Conference in Artificial Intelligence,2003:759-771.
    ⑩ Shotton D. CiTO, "the Citation Typing Ontology, and its use for annotation of reference lists and visualization of citation networks," Journal of Biomedical Semantics,2010,1:S6.
    ① 李长玲、翟雪梅:《基于PageRank的引文分析方法探讨》,《信息系统》2007年第1期。
    ② Ding Ying, Liu Xiaozhong, Guo Chun, et al, "The distribution of references across texts:Some implications for citation analysis," lournal of Informetrics,2013,7(3),pp.583-592.
    ② 胡志刚、陈超美、刘则渊、侯海燕:《从基于引文到基于引用—一种统计引文总被引次数的新方法》,《图书情报工作》2013年第21期。
    ④ 班吉庆:《刘宝楠(论语正义)征引(说文)略论》,《扬州大学学报》(人文社会科学版)2001年第6期。
    ⑤ 马萃泽:《(五经正义)引(说文)考》,《吉林师范大学学报》(人文社会科学版)2005年第5期
    ⑥ 张靖伟:《(尚书正义>引书考》,硕士学位论文,上海社会科学院,2011年,第3页。
    ① 唐明贵:《论语学史》,北京:中国社会科学出版社,2009年,第3-9,185页。
    ① 唐明贵:《论语学史》,北京:中国社会科学出版社,2009年,第185,305页。
    ① 李隆基注,邢昺疏,邓洪波整理,钱逊审定,《十三经注疏·孝经注疏》,北京:北京大学出版社,1999年,第5页.
    1、Andrew Watt:《正则表达式入门经典》,李松峰、李丽译,北京:清华大学出版社,2008年,第156-178页。
    2、Baader F and Calvanese D, The Description Logic Handbook:Theory, Implementation and Applications, London:Cambridge University Press,2003, pp.47-100.
    3、Behrouz A. Forouzan Richard F. Gilberg:((UNIX和shell程序设计权威教程》,彭松虎译,北京:清华大学出版社,2003年,第309页。
    4、Christopher D. Manning and Hinrich Schutze:《统计自然语言处理基础》,苑春法、李庆中、王昀等译,北京:电子工业出版社,2005年,第335页。
    5、Dretske F:Knowledge and the flow of information, Cambridge:MIT Press,1981, p.48.
    6、Grigoris Antoniou and Frank van Harmelen:《语义网基础教程》,陈小平等译,北京:机械工业出版社,2008年,第110页。
    7、Priscilla Walmsley:《XML模式权威教程》,陈维军、乔平安、英宇译,北京:清华大学出版社,2003年,第1页。
    8、Tiwana A:《知识管理十步走》,北京:电子工业出版社,2004年,第39页。
    9、Winston p H:Artificial intelligence, New York:Addison-Wesley,1992, pp.19-38.
    10、敖志刚:《人工智能及专家系统》,北京:机械工业出版社,2010年,第24-30页。
    11、白兆麟:《新著训诂学引论》,上海:上海辞书出版社,2005年,第1-337页。
    12、毕强、杨达、刘甲学:《超文本信息组织技术》,北京:科学技术文献出版社,2004年,第169页。
    13、陈小荷、冯敏萱、徐润华:《先秦文献信息处理》,北京:世界图书出版公司,2013年,第28-49页。
    14、陈小荷:《现代汉语自动分析Visual C++实现》,北京:北京语言大学出版社,2000年,第79-91页。
    15、戴维民:《语义网信息组织技术与方法》,上海:学林出版社,2008年,第13,160页。
    16、董慧:《本体与数字图书馆》,武汉:武汉大学出版社,2008年,第146-159页。
    17、方一新:《训诂学概论》,南京:江苏教育出版社,2008年,第1-275页。
    18、冯浩菲:《中国训诂学》,济南:山东大学出版社,1997年,第1-613页。
    19、冯志勇、李文杰、李晓红:《本体论工程及其应用》,北京:清华大学出版社,2007年,第12-13,35-47页。
    20、郭在贻:《训诂学》,北京:中华书局,2005年,第70-79页。
    21、何克清、何扬帆、梁鹏:《本体元建模理论与方法及其应用》,北京:科学出版社,2008年,第15页。
    22、柯平:《知识管理学》,北京:科学出版社,2007年,第57页。
    23、李景:《本体理论在文献检索系统中的应用研究》,北京:北京图书馆出版社,2005年,第10,183-228,111-112页。
    24、李运景:《基于引文分析可视化的知识图谱构建研究》,南京:东南大学出版社,2009年,第9页。
    25、廉师友:《人工智能技术导论》,西安:西安电子科技大学出版社,2002年,第136页。
    26、林东清:《知识管理理论与实务》,北京:电子工业出版社,2005年,第26页。
    27、罗式胜:《文献计量学概论》,广州:中山大学出版社,1994年,第9页。
    28、毛建军:《古籍数字化理论与实践》,北京:航空工业出版社,2009年,第8页。
    29、钱宗武:《今文尚书语言研究》,长沙:岳麓书社,1996年,第56-68页。
    30、曲维光:《现代汉语词语级歧义自动消解研究》,北京:科学出版社,2008年,第53-68页。
    31、斯滕伯格:《成功智力》,上海:华东师范大学出版社,1999年,第233页。
    32、唐明贵:《论语学史》,北京:中国社会科学出版社,2009年,第3-9,185,305页。
    33、王力:《古代汉语》,北京:中华书局,1962年,第541页。
    34、王立清:《中文古籍数字化研究》,北京:国家图书馆出版社,2011年,第25页。
    35、王宁:《训诂学原理》,北京:中国国际广播出版社,1996年,第2页。
    36、吴泉源、刘江宁:《人工智能与专家系统》,国防科技大学出版社,1999年,第56页。
    37、徐望驾:《<论语义疏>语言研究》,北京:中国社会科学出版社,2006年,第7页。
    38、许威汉:《训诂学读本》,上海:上海交通大学出版社,2010年,第48-84页。
    39、杨端志:《训诂学》,山东:山东文艺出版社,1985年,第25页。
    40、尤金·加菲尔德:《引言索引法的理论及应用》,侯汉清等译,北京:北京图书馆出版社,2004年,第30-123页。
    41、张双棣:《古代汉语知识教程》,北京:北京大学出版社,2002年,第46页。
    42、周秉钧:《古代汉语纲要》,长沙:湖南人民出版社,1981年,第263页。
    43、周大璞:《训诂学初稿》,武汉:武汉大学出版社,2011年,第14,300-354页。
    44、朱熹:《四书章句集注》,曾军整理,长沙:岳麓书社,2007年,第1页。
    1、Ding Ying, Liu Xiaozhong, Guo Chun, et al, " The distribution of references across texts:Some implications for citation analysis," Journal of Informetrics,2013,7(3),pp.583-592.
    2、Erdmann M, Studer R, "How to structure and access XML documents with ontologies," Data and Knowledge Engineering,2001,36(3),pp.317-335.
    3、Gruber T R, "A Translation Approach to Portable Ontology Specifications," Knowledge Acquisition,1993,5(2),pp.199-220.
    4、Horrorks I, Patel-Schneider P F, "Reducing OWL entailment to description logic satisfiability," Journal of Web Semantics,2004, 1(4),pp.345-357.
    5、Kessler, M. M, " Bibliographic Coupling Between Scientific Papers," American Documentation,1963,14,pp.10-25.
    6、Li S, Zhang J, et al, "Semantic Computation in Chinese Question-Answering System," Journal of Computer Science and Technology,2002,17(6),p.933.
    7、Lin, N, " Stratification of the Formal communication System in American Sociology," American Sociologist,1974,9,pp.199-206.
    8、Narin, F., Carpenter, M. and Berlt, N. C, "Inter-relationships of Scientific Journals," Journal of the American Society for Information Science,1972,23,pp.323-331.
    9、Shotton D. CiTO, "the Citation Typing Ontology, and its use for annotation of reference lists and visualization of citation networks," Journal of Biomedical Semantics,2010,1:S6.
    10、Small, H. G, " Co-Citation in the Scientific Literature:A New Measure of the Relationship Between Two Documents," Journal of the American Society for Information Science, 1973,24,pp.265-269.
    11、Small, H. G. and Griffith, B. C, " The Structure of Scientific Literature,1:Identifying and Graphing Specialties," Science Studies,1974,4,pp.17-40.
    12、William A. Gale, Kenneth W. Church, "A Program for Aligning Sentences in Bilingual Corporal," Computational Linguistics,1993,19(1),pp.75-90.
    13、班吉庆:《刘宝楠(论语正义>征引(说文>略论》,《扬州大学学报》(人文社会科学版)2001年第6期。
    14、常娥、侯汉清、曹玲:《古籍自动校勘的研究和实现》,《中文信息学报》2007年第2期。
    15、常娥、黄建年、侯汉清:《古籍智能整理与开发系统构建研究》,《情报资料工作》2009年第4期。
    16、陈世铙:《从<经籍纂诂)到<故训汇纂)》,《中国典籍与文化》1996年第4期。
    17、丁溪源、黄河燕、张海军、王树梅:《基于大规模语料划分的频繁模式查找算法》,《计算机科学》2012年第3期。
    18、董慧、徐雷:《基于本体知识表示的历史领域专家系统模型》,《现代图书情报技术》2010年第7/8期。
    19、董军军:《动态规划算法和贪心算法的比较与分析》,《软件导刊》2008年第2期。
    20、杜小勇、马文峰、武文娟:《学科领域本体的构建与进化——以经济学领域本体为例》《现代图书情报技术》2007年第3期。
    21、段磊、韩芳、宋继华:《古汉语双字词自动获取方法的比较与分析》,《中文信息学报》2012年第4期。
    22、高颖、曹存根、眭跃飞:《音乐领域本体的建立和分析》,《计算机科学》2004年第1期。
    23、顾曰国、张永伟:《静态图像库的信息检索与知识本体》,《当代语言学》2013年第2期。
    24、郭锐、宋继华、廖敏:《基于自动句对齐的相似古文句子检索》,《中文信息学报》2008年第2期。
    25、郭永辉、杨红卫、马芳、王炳锡:《基于粗糙集的基本名词短语识别》,《中文信息学报》2009年第3期。
    26、何继媛、窦永香、刘东苏:《大众标注系统中基于本体的语义检索研究综述》,《现代图书情报技术》2011年第3期。
    27、何绍华、王非:《知识表示规范比较研究》,《情报理论与实践》2007年第1期。
    28、胡佳佳:《(说文解字>语料库的XML标注设计》,《社会科学论坛》2011年第7期。
    29、胡志刚、陈超美、刘则渊、侯海燕:《从基于引文到基于引用—一种统计引文总被引次数的新方法》,《图书情报工作》2013年第21期。
    30、姜继红:《都柏林核心元数据及其在数字图书馆中的应用》,《现代情报》2003年第3期。
    31、姜永常:《基于知识网络的动态知识构建:空间透视与机理分析》,《中国图书馆学报》2010年第4期。
    32、蒋永福、付小红:《知识组织论:图书情报学的理论基础》,《图书馆建设》2000年第4期。
    33、蒋永福、李景正:《论知识组织方法》,《中国图书馆学报》2001年第1期。
    34、蒋云良:《知识表示综述》,《湖州师专学报》1995年第5期。
    35、金澎、吴云芳、俞士汶:《词义标注语料库建设综述》,《中文信息学报》2008年第3期。
    36、金燕、陈玉:《基于本体的标签控制方法研究》,《图书馆理论与实践》2010年第7期。
    37、李长玲、翟雪梅:《基于PageRank的引文分析方法探讨》,《信息系统》2007年第1期。
    38、李善平、尹奇铧、胡玉杰等:《本体论研究综述》,《计算机研究与发展》2004年第7期。
    39、刘光蓉:《“c程序设计”课程内容本体构建》,《电化教育研究》2008年第12期。
    40、刘建炜、燕路峰:《知识表示方法比较》,《计算机系统应用》2010年第3期。
    41、刘升平、林作铨、梅婧等:《一种XML的模型论语义》,《软件学报》2006年第5期。
    42、刘晓霞:《基于引文分析的核心书目测定研究》,《图书馆建设》2013年第9期。
    43、卢烈红:《古今字与同源字、假借字、通假字、异体字的关系》,《语文知识》2007年第1期。
    44、鲁松、白硕、黄雄:《基于向量空间模型的无导词义消解》,《软件学报》2001年第6期。
    45、罗晨光、山川、王珊:《基于本体的古籍知识库建设初探》,《现代图书情报技术》2007年第4期。
    46、马创新、陈小荷、曲维光:《经典古籍注疏文献的知识网络研究与设计》,《图书情报工作》2013年第9期。
    47、马创新、陈小荷、曲维光等:《(论语>与其注疏文献对齐语料库的构建》,《现代教育技术》2012年第7期。
    48、马创新、陈小荷:《基于XML的(论语)与其注疏文献对齐语料库的知识表示》,《图书情报知识》2013年第1期。
    49、马创新:《WEB文献资料采集系统》,《计算机系统应用》2012年第7期。
    50、马创新:《用VC++编程实现Web文本资料的抓取》,《电脑编程技巧与维护》2012年第7期。
    51、马萃泽:《(五经正义>引<说文>考》,《吉林师范大学学报》(人文社会科学版)2005年第5期。
    52、马费成:《在数字环境下实现知识的组织和提供》,《郑州大学学报》(哲学社会科学版)2005年第1期。
    53、马坚、楼宇波、张亮:《基于本体的XML Schema生成方法》,《计算机工程与应用》2003年第11期。
    54、马文峰、杜小勇:《领域本体进化研究》,《图书情报工作》2006年第6期。
    55、马英新:《浅析古今字、异体字、通假字的定义及区分》,《语文学刊》2008年第9期。
    56、聂中庆、李定:《郭店楚简(老子)通假字研究》,《语言研究》2005年第2期。
    57、聂中庆:《郭店楚简(老子)古今字、同源字研究》,《阴山学刊》2003年第6期。
    58、潘颖、王天江、蒋雪玲:《基于本体的学科知识建模》,《计算机应用与软件》2008年第1期。
    59、庞龙、张培富、杨立英:《引文分析方法在国内外应用的比较研究》,《山西大学学报》(哲学社会科学版)2006年第3期。
    60、饶元、冯博琴:《基于本体的XML知识表示方法研究》,《微电子学与计算机》2004年第9期。
    61、山川、罗晨光:《XML著录古籍元数据初探》,《图书馆工作与研究》2007年第6期。
    62、石民、李斌、陈小荷:《基于CRF的先秦汉语分词标注一体化研究》,《中文信息学报》2010年第2期。
    63、史忠植、杨至成、方健梅:《知识工程》,《计算机学报》1986年第4期。
    64、宋继华、王宁、胡佳佳:《基于语料库方法的数字化<说文)学研究环境的构建》,《语言文字应用》2007年第1期。
    65、苏新宁:《我国人文社会科学图书被引概况分析:基于CSSCI数据库》,《东岳论丛》2009 年第3期。
    66、王浩然、徐建良、张巍:《一种XML元数据的自动语义标注方法》,《计算机科学》2008年第4期。
    67、王珏、袁小红、石纯一等:《关于知识表示的讨论》,《计算机学报》1995年第3期。
    68、王莉:《基于XML的学位论文元数据交换标准研究》,《现代图书情报技术》2007年第6期。
    69、王子舟、王碧滢:《知识的基本组分——文献单元和知识单元》,《中国图书馆学报》2003年第1期。
    70、危辉、何新贵:《表象式直接知识表示》,《计算机学报》2001年第8期。
    71、位传海、范太华:《基于本体的学习资源语义检索系统研究与设计》,《电化教育研究》2012年第2期。
    72、尉迟治平:《汉语信息处理和计算机辅助汉语史研究》,《语言研究》2004年第3期。
    73、魏慧斌:《基于XML的古籍信息标注》,《汕头大学学报》(人文社会科学版)2006年第5期。
    74、文庭孝、罗贤春、刘晓英等:《知识单元研究述评》,《中国图书馆学报》2011年第5期。
    75、吴琴霞、刘永革:《基于XML/Schema甲骨文语料库语料标注的研究》,《科学技术与工程》2009年第17期。
    76、吴云芳、王淼、金澎等:《多分类器集成的汉语词义消歧研究》,《计算机研究与发展》2008年第8期。
    77、夏立新、韩永青、张进:《基于本体的情报检索学科知识组织体系构建》,《现代图书情报技术》2008年第12期。
    78、熊静:《元数据在汉语文古籍数字化中的应用》,《图书与情报》2010年第1期。
    79、徐宝祥、叶培华:《知识表示的方法研究》,《情报科学》2007年第5期。
    80、徐清、石向实、王唯:《古籍数字化资源的深度开发》,《图书情报工作》2007年第3期。
    81、徐荣生:《知识单元初论》,《图书馆杂志》2001年第7期。
    82、徐润华、陈小荷:《一种利用注疏的(左传)分词新方法》,《中文信息学报》2012年第2期。
    83、许华:《试论古今字与通假字的易混原因及区分方法》,《吉林省教育学院学报》2007年第11期。
    84、杨思春、陈家骏:《中文自动问答中句子相似度计算研究》,《情报学报》2008年第1期。
    85、杨思洛、王皓、文庭孝:《基于引文分析的图书影响力研究:以图书情报领域为例》,《情报资料工作》2010年第1期。
    86、杨志保、胡久清:《论知识表示方法》,《计算机科学》1984年第4期。
    87、姚伯岳、张丽娟、于义芳等:《古籍元数据标准的设计及其系统实现》,《大学图书馆学 报》2003年第1期。
    88、于丽丽、丁德鑫、曲维光等:《基于条件随机场的古汉语词义消歧研究》,《微电子学与计算机》2009年第10期。
    89、于亭:《谈(故训汇纂)对(经籍(?)诂)资料的扩展》,《中国典籍与文化》2001年第4期。
    90、于新、吴健、洪锦玲:《基于词典的汉藏句子对齐研究与实现》,《中文信息学报》2011年第4期。
    91、曾新红:《XML在数字图书馆相关技术中的研究动态》,《现代图书情报技术》2004年第5期。
    92、张一兵:《波兰尼与他的(个人知识)》,《哲学动态》1990年第4期。
    93、张瑜、孟宪学、苏晓路:《网络标注的主要方法概述》,《图书情报工作》2008年第1期。
    94、赵红州:《论知识单元的智荷及其表示方法》,《知识工程》1991年第3期。
    95、钟秀琴、符红光、佘莉等:《基于本体的几何学知识获取及知识表示》,《计算机学报》2010年第1期。
    96、周武、金远平:《XML数据语义映射方法研究》,《计算机工程与应用》2003年第28期。
    97、祝清松、冷伏海:《引文内容分析方法研究综述》,《情报资料工作》2013年第5期。
    1、Amann B, Fundulaki I, Scholl M, Beeri C, Vercoustre AM. Mapping XML fragments to community Web ontologies. In:Giansalvatore Mecca, Jerome Simeon. Eds.. Proc. Of the 4th Int'l Workshop on the Web and Databases(WebDB 2001).2001.
    2、Guarino, Nicola. Semantic Matching:Formal Ontological Distinction for information Organization, Extraction, and Integration. In:Pazienza M T, eds. Information Extraction:A Multidisciplinary Approach to an Emerging Information Technology, Springer Verlag,1997. 139-170.
    3、Ma X. Champollion. A Robust Parallel Text Sentence Aligner[C]//Proceedings of LREC-2006: Fifth International Conference on Language Resources and Evaluation,2006:489-492
    4、Moore R C. Fast and Accurate Sentence Alignment of Bilingual Corpora [C]//Proceedings of AMTA. Springer-Verlag,2002:135-144.
    5、Nirenburg S. Two Approaches of Matching in Example-Based Machine Translation, Proc. TMT-93, Kyoto, Japan,1993.
    6、Peter D. Karp and Thomas R. Gruber (1995). A generic Knowledgebase Access Protocol. Proceedings of the International Joint Conferences on Artificial Intelligence, Montreal,1995. An ontology-based knowledge sharing API for AI people.
    7、Pham S B, Hoffmann A. A new approach for Scientific citation classification using cue phrases[C]. Proceedings of Australian Joint Conference in Artificial Intelligence,2003:759-771.
    8、Schubert P, Lincke D, Schmid B. A global knowledge medium as a virtual community:The NetAcademy concept[C]//Proceedings of the 4th Americas Conference on Information Systems. Baltimore,1998:618-620.
    9、Small, H. G. Mapping the Specialty Structure of the Social Sciences Using the Social Sciences Citation Index. Unpublished report of a study for the National Science Foundation,1975.
    1、BorstW N. Construction of Engineering Ontologies for Knowledge Sharing and Reuse[D], Enschede:University of Twente,1997.
    2、程月:《现代汉语动宾搭配多角度考察及其自动识别》,硕士论文,南京师范大学,2008年,第47页。
    3、谷建军:《基于叙词表的中医古籍文献领域本体建模方法研究》,博士学位论文,中国中医科学院,2006年,第55页。
    4、李斌:《现代汉语动宾搭配的语义分析和计算》,博士学位论文,南京师范大学,2009年,第29页。
    5、卢俊之:《基于语法功能匹配的句法分析算法》,博士学位论文,南京师范大学,2008年,第51页。
    6、曲维光:《现代汉语词语组配和语境计算》,博士学位论文,南京师范大学,2005年,第66页。
    7、徐艳华:《现代汉语实词语法功能考察及词类体系重构》,博士学位论文,南京师范大学,2006年,第78页。
    8、詹卫东:《面向中文信息处理的现代汉语短语结构规则研究》,博士学位论文,北京大学,1999年,第79页。
    9、张靖伟:《(尚书正义)引书考》,硕士学位论文,上海社会科学院,2011年,第3页。
    10、周强:《汉语语料库的短语自动划分和标注研究》,博士学位论文,北京大学,1996年,第66页。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700