用户名: 密码: 验证码:
档案管理数字化系统的研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着社会的快速发展,人们对信息的要求越来越高了。作为重要信息资源之一的档案正面临着全球信息化浪潮的巨大冲击,原有的手工管理档案的方式已经不能满足人们对档案高效管理和利用的需求了。如何借助于先进的信息技术,将档案管理从手工方式向数字化方式转变已经成为人们关心和研究的热点问题。
    本文以重庆市北碚区档案局进行档案管理数字化应用为依托,借助先进的计算机技术、通信技术、网络技术、数据库技术以及多媒体技术,设计并开发了一套通用的档案管理数字化系统。系统采用客户/浏览器/服务器的拓扑结构,具有跨平台的特点。这样系统可以根据应用的要求部署在不同的服务器上,并且用户在任何地方都可以通过网络对系统进行访问。
    文中在调查现有档案管理方式和工作过程的基础上,采用结构化设计方法进行档案管理数字化系统的系统设计,包括系统的拓扑结构设计、功能设计以及数据库设计。在系统中,拟定将纸质档案数字化为数字图像。文中详细讨论了档案数字化系统,将档案分类进行录入,并根据不同类型的档案设计了相应的扫描仪和数码相机的多线程录入系统。为了得到高质量的数字档案图像,需要将现有的数字图像处理技术应用到文档图像处理上来。文中讨论在档案数字化过程中所涉及到的文档图像处理技术,重点介绍了全局二值化与局部二值化相结合的二值化方法,基于游长平滑处理的文档图像倾斜校正算法,以及基于组件搜索的文档图像版面分析。文中还就系统实现过程中所用到跨平台技术、分布式计算、软件系统设计模式等软件实现技术进行了讨论。本文采用软件工程的原理和方法对系统的设计和开发的全过程进行控制,这样大大提高了软件的质量,降低了软件的开发费用。最后,文中还就软件成熟度模型以及软件开发过程标准化进行了讨论。
With the rapid development of the society, people require more accurate and faster information. As one of the important information resources, archives are threatened by the global information waves. People need the effective management and utilization on the archives, but the old way cannot meet the need anymore. How to change the old manual way to the digital one becomes the hot point.
    Based on archive management digitalization engineering of the Beibei district of Chongqing, a universal archive management digitalization system is developed by making full use of the information technologies including computer technology, communication technology, network technology, database technology and multimedia technology. The system uses the topo of client/browser/server and can run on multiple platforms. Therefore the system can be deployed in the variable server and the user can access it everywhere through the Intranet or Internet.
    After investigation on the original way of the archive management and working flow, the archive management digitalization system is structurally designed including the topo design, function design and database design. In the system, the papery archive is transferred into digital document image. The paper particularly discusses the archive digitalization sub-system in which the archives are input by its classification. Accordingly, the universal scanner input system and digital camera multithreads collecting system are developed to fix the variable classifications. In order to get the better document images, in the paper, the digital image processing technology is also introduced to the system. The binary method, which combines the global method and local method, is discussed. Furthermore, the skew detect based on run length- smoothing is explained in the paper. At the same time, the layout analysis based on components search is introduced. In the paper, all the technologies that is applied in the system are presented including the muti-platform, distributed computing and software design pattern. The theories and methods of the software engineering are applied to improve the quality of the software and to reduce the developing expenses. Lastly, the paper discusses the software capability maturity model.
引文
档案资料
    [1] 项文新.数字化时代的档案计算机管理.档案学通讯.2000.No.4:26-29
    [2] 王鹰.档案资料数字化管理解决方案.档案学研究.1999.No.2:55-56
    [3] 黄锐,韩萍等.一套简便的图像数字化及计算机档案管理系统.临床放射学杂志.2000.Vol.19(11):743
    [4] 邓清文.档案管理数字化.电脑知识与技术.2001-5:38-39
    [5] 张海藩.软件工程导论. 北京.清华大学出版社.1987.06
    [6] 王立福.软件工程.北京.北京大学出版社.1997.5
    [7] 斯蒂尔.基于项目的软件工程.北京.机械工业出版社.2002.6
    [8] 张克东.软件工程与软件测试自动化教程.北京.电子工业出版社.2002.2
    [9] 胡贵平.GIS应用系统结构模式探讨.地质科技管理.1999.No.5.46-49
    [10] 张丽,张艳.从CS到BS,再到三层(多层)结构——论体系结构的发展.
     河南师范大学学报(自然科学版).2002-8.Vol.30(3)
    [11] 王亚杰. 基于CS和BS的信息系统开发与研究.沈阳大学学报.
     2002-6.Vol.14(2):15-16
    [12] 黄朝辉.基于CS和BS结构的高校图书馆管理系统.松辽学刊(自然科学版).
     2002-8.No.3: 98-100
    [13] 贾智平,吴修国等.基于CS与BS结合模式的企业MIS结构探讨.
     微机发展.2001.No.3:17-19
    [14] 栗松涛,李春文等.一种新的BS系统权限控制方法.计算机工程与应用.
     2002.No.1:99-101,235
    [15] 陈迎霞.医院信息系统从CS结构到BS结构的拓展.西北国防医学杂志.
     2000-6.Vol 21(2):147-148
    [16] 郑成增,陈志锋.基于BS模式的WEB数据库技术研究.山西大学学报(自然科学版).Vol 23(3).221-224
    [17] 卡斯尔.曼.数字图像处理.北京.电子工业出版社.2001.1
    [18] 周新伦.数字图像处理.北京.国防工业出版社.1986.06
    [19] 何斌.Visual C++数字图像处理.北京.人民邮电出版社.2001.4
    [20] 王煦法.C语言图像处理程序设计.合肥.中国科学技术大学出版.1994.1
    [21] 张雅兰.图像的二值化处理.广西工学院学报.2002-3.Vol.13(1):32-33,55
    [22] 黄琼,高国安等.机械图纸的动态二值化技术.哈尔滨工业大学学报.1996-8.Vol.28(4):88-91
    [23] 聂焱,卢凌等.文本图像识别及二值化的研究. 交通与计算机.1996-10.Vol.14(5):1-5
    [24] 王强,马利庄. 图像二值化时图像特征的保留.计算机辅助设计与图形学学
    
    报.2000-10.Vol.12(10):746-750
    [25] 叶芗芸,戚飞虎等.文本图像的快速二值化方法.红外与毫米波学.1997-10.Vol.16(5):344-350
    [26] 丁震,胡钟山等.一种基于模糊聚类的快速二值化方法.计算机学报.1998-8.Vol.21(增刊):31-334
    [27] 方敏,徐俊艳等. 一种新的文本图像二值化方法.合肥工业大学学报(自然科学版).2001-4.Vol.24(2):166-169
    [28] 吴冰,秦志远.自动确定图像二值化最佳阈值的新方法. 测绘学院学报.2001-12.Vol.18(4):283-286
    [29] 赵雪松,陈淑珍. 综合全局二值化与边缘检测的图像分割方法.计算机辅助设计与图形学学报.2001-2.Vol.13(2):118-121
    [30] Francis H. Y. Chan, F. K. Lam, and Hui Zhu .Adaptive Thresholding by Variational Method.IEEE Transactions On Image Processing.1998-3.Vol.7(3):468-473
    [31] Trier,D. and T.Taxt.Evaluation of binarization methods for document Images. IEEE Transactions on Pattern Analysis and Machine Intelligence.1995.Vol.17(3):312-15.
    [32] Trier,O.D. and A.Jain. Goal-directed evaluation of binarization methods.IEEE Transactions on Pattern Analysis and Machine Intelligence.1995.Vol.17(12): 1191-1201
    [33] Ostu N. A threshold selection method from gray-level histogram.IEEE Transactions on System,Man,and Cybernetics.Vol.9(1):62-66
    [34] Bernsen J.Dynamic Thresholding of Grey-level Images.Proceedings 8th International Conference on Pattern Recognition,Paris,1251-1255(1986)
    [35] 瞿洋,杨利平.Hough变换OCR图象倾斜矫正方法.中国图象图形学报.2001-2.Vol.6A(2):178-181
    [36] 张昆,顾国庆.二值图像的一种倾斜调整算法.计算机与现代化.1999.No.2:24-27
    [37] 明德烈,柳健等.小角度倾斜图像的快速检测和校正方法.华中理工大学学报.2000-5.Vol.28(5):66-68
    [38] 潘武模,焦扬等.Hough变换在中文名片图像倾斜校正中的应用.中文信息学报.Vol.15(3):50-56
    [39] 吴涛,贺汉根.一种快速的文本倾斜检测方法.计算机工程与应用.2002.No.5:113-115
    [40] W. Postl. Detection of Linear oblique structures and skew scan in digitized documents. In Proc. of the 8th International Conference on Pattern Recognition. Paris, France, 1986. 687-689
    [41] H.S.Baird. The Skew Angle Of Printed Documents, Procedings of theSPSE Fortieth International Symposium on Hybird Imaging Systems,New York, 1987, 21-24
    [42] X.Jiang, H.Bunke,D.W.Kljajo. Skew Detection of Document Images by Focused Nearest-Neighbor Clustering. Proceedings of the Fifth International Conference on Document
    
    Analysis and Recognition. Bangalore, 1999 629-632
    [43] L O'Gorman.The Document Spectrum for Page Layout Analysis. IEEE Transactions on PAMI, 1993,15(11):1162-1173
    [44] D. X. Le and G. Thoma.Document Skew Angle Detection Algorithm.Proc. 1993 SPIE Symposium on Aerospace and Remote Sensing Visual Information Processing II, Orlando, FL. April 14-16, 1993. Vol.1961:251-262.
    [45] M. D. Garris.Correlated run length algorithm (CURL) for detecting form structures within digitized documents.Proc.Third Annual Symposium on Document Analysis and Information Retrieval.pp. 413-424, Las Vegas, Apr. 1994.
    [46] S. C. Hinds, J. L. Fisher and D. P. D'Amato. A Document Skew Detection Method Using Run-Length Encoding and the Hough Transform.10th International Conference on Pattern Recognition.1990.Vol.1:464-468
    [47] 钟玉琢.机器人视觉技术.北京. 国防工业出版社.1994-11.
    [48] 费业泰.误差理论与数据处理.北京.机械工业出版社.1999-5
    [49] Kasturi, R., L. O'Gorman, and V. Govindaraju. Document Image Analysis: A Primer. Sadhana, Special Issue on Document Processing.2002-2.Vol.27(1):3-22
    [50] 田学东,郭宝兰.基于组合特征的中文版面分析方法. 1999-9中文信息学报.Vol.13(4):22-28
    [51] 陈明,丁晓青等.复杂中文报纸的版面分析、理解和重构.清华大学学报(自然科学版) .2001.Vol.41(1):29-32
    [52] 刘定强等.基于组件的中文版面分析.中文信息学报.2000.Vol.14(2):8-13
    [53] 张利,朱颖.版面分割中游程平滑后的图文特征分类.中国图象图形学报.1998-10.Vol.3(10):827-831
    [54] 张利,朱颖等.基于游程平滑算法的英文版面分割.电子学报.1999-7.Vol.27(7):102-104
    [55] 姜哲,马少平等.大型中文古籍《四库全书》自动版面分析系统.中文信息学报.2000.Vol.14(2):14-20
    [56] 刘飞,罗予频.基于数学形态学的自适应文字版面分析方法.中文信息学 报.2001.Vol.16(2):54-59
    [57] Wang Haiqin and Dai Ruwei.Document Analysis by Crosscount Approach. J. of Comput. Sci. & Technol. Jan.1998 Vol.13(1):32-40
    [58] 杨波 基于内容的文档图象压缩方法研究. 博士学位论文. 重庆:重庆大学,2002
    [59] 米亚纳. BORLAND C++BUILDER 编程指南.北京.电子工业出版社.1998.11
    [60] 刘华. Borland C++Builder程序设计.北京.清华大学出版社,2000.12
    [61] 卡尔佛特. Borland C++ Builder应用开发大全.北京.清华大学出版社.1999.6
    [62] 清宏计算机工作室. C++Builder多媒体开发.北京.机械工业出版社.1999.12
    
    
    [63] 童韬,陆宗骐.C++Builder环境下调色板的使用. 现代计算机.2001-4.No.113:51-53
    [64] 黄新宇.C++BUILDER中对JPEG图像文件的存取.现代计算机.2001-2.No.108:70-72
    [65] 尹东. 图象处理新技术在科技档案中的应用.计算机工程.1999-1.Vol.25(1):79-80
    [66] 潘瑜.数据加密的密码体制与DES算法.山东科学.1994-3.Vol7(1):5-9
    [67] 徐洁磐.数据库系统原理.上海.上海科学技术文献出版社.1997-7
    [68] 罗晓沛.数据库技术(高级).北京.清华大学出版社.1999-9
    [69] 刘启原,刘怡.数据库与信息系统的安全.北京.科学出版社.2000-1
    [70] 朱金钧.ORACLE关系数据库及其应用.北京.电子工业出版社.1996-1
    [71] 高奇.Oracle 8完全参考手册. 北京.机械工业出版社.1998-8
    [72] 李炽明,莫倩等.基于Java技术的Web环境下分布式数据库互操作性的实现.
     计算机系统应用.1998.No.12:26-29
    [73] 阿姆斯特朗.JBuilder 2实用大全.北京.水利水电版.1999.5
    [74] 刘德意.Java 编程指南,北京:清华大学出版社.1997.2
    [75] 丁锂. Java语言SQL接口,北京:清华大学出版社.1997.4
    [76] Ken Nordby.What are Enterprise JavaBeans components.IBM.June 2000 James W. Cooper.Using JDBC to Create Database Objects.IBM T.J. Watson Research Center.May,1998
    [77] 麦特纳. J2EE平台上的EJB组件开发.北京.机械工业出版社.2001.8
    [78] 蒙森-哈费尔.Enterprise JAVABEANSTM.中国电力版.2001.3
    [79] 杨艳,李建伟.JDBC的动态SQL语句在浏览器服务器模式中的应用.沈阳电力高等专科学校.1999.10.Vol.1 No.4.29-30
    [80] 胡泳. JDBC在BS体系中的应用及其安全通信.计算机系统应用.1999.No.5:44-46
    [81] 武苍林,王嘉祯等.JDBC在Web数据库中的应用.计算机应用.1998-10.Vol.18(10):35-36
    [82] 张雪芹,顾春华等.基于JDBC的Web数据库应用实现.计算机应用研究.1999.No.9:57-59
    [83] 叶菁.用JAVA和动态HTML技术开发WEB应用.计算机时代.1999.No.3:35-37
    [84] 许幼鸣,徐锦等.基于设计模式的软件重用.计算机工程.1999-3.Vol.23(3):13-14,36
    [85] Malcolm Davis.Struts, an open-source MVC implementation.IBM. February 2001Naveen Balani.Web services architecture using MVC style. IBM Syntel India Ltd.February 2002.
    [86] 龚永生.当前流行的J2EE WEB应用架构分析.IBM.2002-7
    [87] 张砚秋,陈川等.基于MVC设计模式构筑JSP/Servlet+EJB的Web应用.计算机工程.2001-9.Vol.27(11):71-73
    [88] 冯锡炜,崔雅娟等.应用MVC模式开发商务网站的研究.石油化工高等学校学报.
     2002-9.Vol.15(3):64-67
    [89] 邓贵仕,易峰等.支持Multi-interface的MVC设计模式研究.计算机应用.2002.Vol.22(6):8-10
    [90] 邓玉龙. MVC设计模式在电子商务系统中的研究与应用.南京邮电学院学
    
    报.2002-7.Vol.22(2):80-82
    [91] 马良荔,刘孟仁.软件工程能力成熟度模型研究. 计算机应用研究.1998.No.6:8-11
    [92] 付卫红,蔡淮等.浅析软件能力成熟度模型. 计算机工程与应用.2001.No.11:95:99
    [93] 曹钢.软件生产能力成熟模型及与ISO9001的比较.中国标准化.2000.No.10:45-47
    [94] 邵培南,曹淑青. CMM成熟度等级关键过程域的实现途径.计算机工程.2000.No.12:80-83
    [95] 李怀璋等.基于B/S结构的质量管理系统的研究.微电子学与计算机.2001.No.4:57-59
    [96] 杨波,叶俊勇等."高校网上录取数据录入管理系统的开发".重庆大学学报,2000 (6)。
    [97] 彭健,汪同庆等,"基于OCR的文档数字化及管理系统",重庆大学学报,2002(3)。
    [98] 杨波,彭健等. 枪号识别系统设计. 重庆大学学报. 2001 (5)。
    [99] 杨波.基于内容的文档图象压缩方法研究.博士学位论文.重庆:重庆大学2002。
    [100] 刘建胜.文档图象版面理解研究.博士学位论文.重庆:重庆大学2002。
    [101] 何天文.微机指纹识别技术的研究. 硕士学位论文.重庆:重庆大学2002。
    [102] 叶俊勇,汪同庆等.软件开发的质量保证体系.计算机与现代化.2002.No.6:1-5
    [103] 杨波,叶俊勇等.低对比度图像的自适应阈值化算法.传感器技术.2002.Vol.21.No.6:34-36
    [104] 刘建胜,汪同庆等.基于边框线的版面分析方法应用于选票处理 .计算机工程与应用.2002.No.11:248-249,256
    [105] 刘建胜,汪同庆等.一种单色表格快速版面分析方法.计算机程.2002.Vol.28.No.11:212-214

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700