当前位置:首页 > 读后感 > [高校数字图书馆信息数字化建设中的问题及对策] 数字图书馆的信息资源数字化
 

[高校数字图书馆信息数字化建设中的问题及对策] 数字图书馆的信息资源数字化

发布时间:2019-02-23 04:46:52 影响了:

  摘要:数字图书馆是一个将信息资源以数字化方式存贮并通过网络提供即时服务的信息系统,因而信息资源数字化是实现数字图书馆的根本条件。从数字图书馆中信息资源数字化的涵义出发,探讨了信息数字化的关键技术,并从内容建设、知识产权、技术应用和标准与规范4个方面分析了我国数字图书馆信息数字化中存在的主要问题,同时提出了相应的对策和建议。
  关键词:数字图书馆;信息数字化;存储技术;发展对策
  中图分类号:G203 文献标识码:C 文章编号:0439-8114(2011)09-1942-03
  
  The Problems and Countermeasures of Information Digitization Construction of the Digital Library in the College
  
  LU Xian-feng
  (The Library of Huanggang Normal University, Huanggang 438000,Hubei,China)
  
  Abstract: A digital library was an information system which saved information resources by digitalization and offered immediate service by internet. Therefore, the digitalization of information resources was a basic requirement for the realization of a digital library. Initially the concept of digitization of information was disscussed, the key technology of it was explored, the main problems nowadays which involved the construction of content, intellectural property rights, technology application and standards were analyzed, and some countermeasures and suggestions for those problems were put forward too.
  Key words: digital library;digitization of information;storage technology;strategy of development
  信息数字化作为数字图书馆的内容建设,是数字图书馆正常运转的关键步骤。但目前我国信息数字化中由于种种原因还存在许多问题,如重复建设、知识产权、技术应用和标准与规范等问题,这些都严重阻碍了我国数字图书馆的健康发展。因此,我国在实施信息数字化建设过程中,不仅需要更新观念、统筹建设,还要规范标准、加强立法、提高馆员素质,更要加强适合我国国情的技术创新。为此,我们需要不断地总结经验,探索新的开发技术和工作方式,逐步将我国宝贵的传统文化遗产加以数字化,进而开发出具有中国特色的数字化产品。
  1数字图书馆中的信息数字化
  1.1信息数字化的内涵
  从社会信息化环境来说,数字图书馆是运用计算机技术、网络技术、通信技术等多种信息技术,对不同载体和类型的信息资源进行搜集、选择和规范化处理,使之以数字化的方式存储,建立分布式的馆藏信息资源库和虚拟信息资源库,并通过网络向世界各地用户提供无时空限制服务的信息系统。数字图书馆的主要职能是搜集、保存和传递数字化信息,可以称之为数字化信息的存储和传递中心,因而信息数字化建设无论从质量还是从数量上都是数字图书馆发展的关键环节。
  1.2信息数字化的关键技术
  信息数字化技术包括数字化信息的生成技术、存储技术和压缩技术等,其关键技术是数字化信息的生成技术和存储技术。
  1)数字化信息的生成技术包括有键盘录入和非键盘录入两种方式,目前使用较多的数字化信息的生成技术主要是第二种方式。键盘录入是一种手工转换的文本模式;非键盘录入包括手写识别技术、印刷文稿扫描识别技术、语音识别技术。在信息数字化实际工作中,我国许多数字图书馆都采用两者相结合的方式来规避键盘录入的较高错误率和扫描方式对硬件的较高要求,也就是采用超星公司开发的数字化技术加上便携式文件格式(PDF)和超文本标记语言(HTML)格式。
  2)数字化信息的存储技术包括直接存储技术和网络存储技术。直接存储技术是目前大多数数字图书馆的数据存贮技术,主要包括光盘塔技术、磁盘阵列技术和磁带库技术;网络存储技术是海量数据信息存储的实现方式,包括直接附加存储(DAS)、网络附加存储(NAS)、存储区域网络(SAN)、小型计算机系统接口(iSCSI)技术和内容寻址存储(CAS)[1]。
  2信息数字化中存在的主要问题
  虽然我国数字图书馆建设中的信息数字化工作取得了一定的进步,但由于观念和技术的落后,信息数字化建设整体上呈现出数字信息资源重复建设严重、版权保护立法不健全、缺乏有力的技术支撑、标准和规范化建设滞后等问题[2]。
  2.1重复建设问题
  由于国内各地区、各系统以及各馆之间无一个权威的协调机构,也无规划布局和分工实施计划,数字图书馆建设缺乏全局性的统一规划和政府权威部门的协调,相当多的所谓数字图书馆建设仍处于各自为政、贪大求全和相对分散的无序状态,信息资源重复现象的问题严重。近年来,我国各级政府投入数字化建设的资金总额已达36亿元,在政府资金的大力支持下,各级各类数字图书馆都在进行数字信息资源建设,甚至引进CNKI等数据库,这种现象在各大高校数字图书馆的信息数字化中也非常普遍,在相当广的范围内存在着潜在的数字信息资源重复建设问题。
  2.2知识产权问题
  数字图书馆中信息数字化所涉及的知识产权问题包括信息来源的著作权尊重和数字化信息建成后自身著作权的保护。随着数字图书馆的开通,数据库的利用将越来越广泛,由此产生的知识产权问题就不可避免,其中争论的焦点是关于网络作品的制作、传播和使用的版权保护问题,让一些数字图书馆在实践中遭遇法律尴尬。著作权人公开指责图书馆界滥用权利,严重损害了著作权人的利益;出版界也有人认为文献信息的数字化是复制出版界的出版物,在网上出现了成千上万的复制本、使出版界的经济利益受到损害;而图书馆界则认为信息获取的主动权完全掌握在版权人手里,这样会严重地影响知识的创造和传播。因而制定网上数字化文献的著作权法律法规已成当务之急。
  2.3技术应用问题
  随着电子出版物的收藏和网络数字化资源的采集,图书馆越来越多的信息一入馆就是数字化的,而对于未数字化的传统馆藏,进行数字化转化所使用的技术主要是光学字符识别(OCR)扫描录入方式。一般的OCR录入系统能够实现对各种现代书籍、简繁体书籍、报刊杂志、公文档案的录入识别,且识别率高,还能实现各种校对,然而,对于馆藏文献的数字化而言,由于汉字的复杂性,OCR对各类中文文献的识别远难于对英文和数字的识别,特别对含有繁体手写汉字的古籍文献、简繁混排的中文文献、专业性强的中文文献以及难于机检的汉字文献。OCR技术目前还存在很大的误识率和拒识率,为此,需要对OCR系统进行深入的研究和改进,提高其应用的全面性,并要引入中文校对、录入质量控制等技术,从而加强其管理功能。
  2.4标准与规范问题
  目前,在信息数字化标准规范方面存在的问题主要有:①缺乏对标准规范重要性的认识;②缺乏普遍接受和广泛应用的关键标准规范;③缺乏对标准规范建设的系统化把握;④缺乏对标准规范的开放描述和开放应用;⑤缺乏开放、联合、共享的标准规范建设与应用机制,例如图书馆在信息资源建设过程中所采用的软件系统差异很大,如ILAS系统、图书馆集成系统等,其标准和格式都不一致,导致开发的数据库不能兼容,检索界面不一,检索途径也不同,检索语言也无统一的规范控制,无法在网上实现资源共享。
  3信息数字化发展对策
  3.1加强特色数字馆藏建设
  只有具有特色的数据才能赢得较高的网络访问频率,才具有资源共享的价值,也是各大数字图书馆以最小投入换取最大效益的文献信息共享模式。因此,在进行本馆的信息数字化建设时,除了需要全面考虑文献价值、用户需求、载体形态、技术可行性和著作版权等一般因素外,还需要科学而系统地考虑馆藏内容、馆藏特色,尤其是馆藏结构和馆藏级别。馆藏级别一般可以划分为永久保存级、服务级、镜像级和链接级4个基本层次。永久保存级馆藏是指具有确定的保存价值和用途,并具有惟一性的特色文献;服务级馆藏是指十分有用和必须的虚拟馆藏;镜像级馆藏是指其他数字图书馆馆藏的拷贝,与永久保存级相同的是它们都是现实馆藏,与之不同的是它缺乏惟一性;链接级馆藏则是贮存于其他数字图书馆中的数字化信息资源,其内容较为广泛,与服务级馆藏相比,它与用户的相关性要低一些。只有通过这些特色数字馆藏的建设,才能真正优化馆藏文献的结构,加快馆藏信息利用,最大限度地避免重复建设,从而提高整个社会文献资源的保障水平和信息资源的开发利用效率。
  3.2从信息源头加快信息数字化建设
  文献信息资源的源头在出版社和出版商,每年都有数以万计的文献资源被出版系统数字化,这个资源如能加以利用,将是一笔巨大的财富。据2001年统计,全国530家出版社的图书总量是154 526 种[3],一年的文献资源总量就相当于一个中型图书馆文献资源的全部馆藏总量,而且还在逐年递增。如果把信息数字化的生产重任交给出版商,将会带来很大的经济效益和社会效益:一方面可以大量减少信息资源重复数字化带来的人力、物力、财力的浪费;另一方面,信息资源数据库的建设者可以通过与出版社合作取得授权来解决信息资源建设、传播中的知识产权问题,既能保护作者的知识产权,又能照顾到出版商利益,同时还能让各类文化、科技的文明成果纳入数字图书馆,使其能为更多的人服务,创造出更大的价值。
  3.3开发和利用先进技术
  无论是从数字图书馆建设,还是从作为其一部分的文献信息数字化技术来说,技术问题仍然是制约着信息资源共享的主要问题。数字图书馆是采用现代高新技术的系统工程,不仅需要立项研究开发新的应用技术,而且还需要各种高新技术成果的及时转化和应用。目前,信息资源数字化的关键技术在发达国家已趋于成熟,国外的数字图书馆工程为国内提供了可借鉴的经验,加强技术研发工作可以从以下几个方面进行:①从中国数字图书馆建设项目的实际出发,组织专人对信息数字化关键技术进行跟踪、研究、攻关;②借鉴引进适合国情的国外先进技术和先进产品;③集成和采用以国家“863”计划为代表的国内已有的科技成果;④开发适合我们自己的先进技术,如电子信息处理技术、指引库技术、语音识别技术及信息媒介技术,同时规范有关技术标准[4]。
  3.4促进信息数字化建设的规范化和标准化
  信息数字化涉及文献描述、组织和检索多个方面,要使工作顺利进行,各个数字图书馆之间要能够共建共享信息资源,就必须统一标准,加强兼容性。因此,图书馆数字化建设要走资源共享的道路,必须打破各自为政的局面,各图书馆文献分类编目不统一,对资源共享造成很大的障碍,在书目数据方面,数据不标准就不能保证用户从各个角度迅速、准确地检索资料。因此必须有一个数字图书馆全国中心,建立和健全全国数字图书馆使用的各种标准规范,协调规范资源库建设,解决信息数字化建设的标准化问题。根据标准,再由地区内、地区间各馆合作建库或由地区文献信息中心统一建库,各馆录用,最终达到全国的标准化。
  3.5提高馆员的信息处理技术与研究人员的素质
  随着信息资源概念的发展,文献信息数量和类型的增加,信息工作方式和手段的改进,图书馆的工作对象已不再局限于对传统纸质文献和某些缩微资料或视听资料的一般性收集、整理、组织、管理等工作,数字图书馆面临更多的信息载体和信息服务方式。例如,各种电子图书、网络信息资源、CD-ROM和其他电子资料已成为数字图书馆采访和处理的主要对象,这对于长期熟悉纸质文献的传统图书馆员来说就是一个巨大的挑战,同时,数字图书馆还会带来一系列需要解决的新问题,如知识产权归属品种和复本的比例、购书经费的分配等。在书刊分类和编目工作上,馆员的技术性处理工作会迅速减少,但会被赋予需要更多知识的技能才能完成的新任务。也就是说,他们可能参与更多的信息技术工作、文献信息研究和用户研究工作。总之,现在图书馆工作者应当是信息专家和信息工程师,是信息系统的设计者,也是信息用户的导航者。鉴于此,在提升数字图书馆馆员的素质上,一方面可以通过吸收一批计算机、通讯、外语方面有特长的人才充实图书馆人员队伍;另一方面应加强在职人员的培训,提高其计算机、英语和专业综合技能与素质,及时调整和优化他们的知识结构,以适应信息资源数字化建设的要求。
  参考文献:
  [1] 陈柯明.谈网络环境下数字图书馆信息存储技术应用发展[J].图书馆界,2004,6(2):20-21.
  [2] 梁 平.我国数字图书馆建设中的几个问题[J].中华医学图书情报杂志,2004,13(3):13-14.
  [3] 杨晓农.我国文献信息数字化技术的发展[J].中国信息导报,2004(5):32-33.
  [4] 杨慕莲.论加强数字图书馆建设的几点措施[J].图书馆学刊,2005(1):55-56.

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3