当前位置:首页 > 申请书大全 > [元数据检索按图索骥]元数据检索
 

[元数据检索按图索骥]元数据检索

发布时间:2019-03-12 04:09:33 影响了:

  (徐枫宦茂盛)元数据检索服务是信息资源目录对外服务的主要环节之一,可以根据检索得到的元数据对信息资源评价。   元数据检索是信息资源目录提供元数据服务的重要方式。一般来说,信息资源目录服务其核心内容就是元数据检索服务,因此,信息资源目录的本质就是基于描述信息资源的元数据库提供元数据的检索服务,使用者可以根据检索得到的元数据进行信息资源的发现和评价。元数据检索服务是信息资源目录对外服务的主要环节之一。
  从逻辑上,信息资源目录分为三层: 元数据库层、元数据检索服务层以及元数据展现层。元数据检索服务是信息资源目录中承上启下的重要环节。一方面,它向元数据库提交查询请求,并对元数据库反馈回来的查询结果进行语义方面的处理; 另一方面,它接收表现层(例如网页程序)发出查询请求,并按照一定的格式进行元数据查询结果的输出。
  元数据检索服务与元数据库以及元数据检索服务的分离对于建立基于服务架构的信息资源目录是非常必要的,基于元数据检索服务独立性,信息资源目录的提供者可以方便地构建物理集中式信息资源目录或者逻辑集中式信息资源目录。对用表现层的信息资源目录查询系统来说,只需要和中心点的元数据检索服务代理网关交互就可以访问所有分布部署的元数据库,而不需要掌握所有节点的元数据检索服务信息。
  
  元数据检索的标准
  
  最早对元数据检索进行标准化工作的是美国国家标准化组织(NISO)。起先,由NISO中负责图书馆网络应用的工作组编写了初步的抽象信息检索规范Z39.50。Z39.50协议的全称是“信息检索(Z39.50): 应用服务定义与协议规范。”Z39.50是为促进计算机网络互连操作而建立的一个标准。该协议遵从ISO所定义的OSI模型中所引用的其他有关的网络标准。Z39.50所定义的协议作用于OSI模型中的应用层,其所关注的问题主要是围绕在通过互联网对数据库中的信息的搜索和提取。Z39.50协议描述了信息提取应用服务并给出明确的应用服务协议规范。该协议规范了网络交互过程中的信息控制、信息交换规则和对协议的实现的一致性要求,但是不对基于该协议的计算机应用系统的具体实现进行任何描述和限制。在模式上,该协议基于面向连接的程序对程序通信,而不是一种基于终端或其他物理媒体的数据交换。
  
  5种典型操作
  
  Z39.50协议中定义8种类型操作,分别是初始化(Init)、检索(Search)、提取(Present)、删除(Delete)、扫描(Scan)、排序(Sort)、资源报告(Resource-report)和扩展服务(Extended-services)。其中典型的操作包括:
  1. 初始化操作: 初始化操作的作用是建立一个关联(即进行检索和提取元数据的关联)。在初始化请求中,起始端向目标端发出建立关联所需的各种初始化参数的建议。目标端根据自身的具体实现以及起始端的参数建议确定最终建立连接时所使用的各项参数,并在初始化响应中传递给起始端。
  2. 检索操作: 检索的作用是起始端可以通过该服务请求检索目标端系统(元数据系统)中的元数据库,并得到与检索结果有关的信息。起始端通过检索请求要求目标端(元数据系统)将检索语句应用于指定的若干个数据库,从中检索并标识出匹配的记录。目标端在检索之后创建一个结果集,记录所有匹配的记录,用于处理后续的提取请求。
  3. 提取操作: Z39.50协议检索操作是根据用户的检索要求查找数据库记录,将符合要求的标识记录下来生成结果集,检索操作就结束了。而根据用户要求,将某条或某些条记录提取并返回用户,这一操作是提取操作。元数据提取操作就是起始端发送提取请求,目标端从结果集中提取并返回若干元数据记录。
  4. 解释(资源报告)操作: 解释功能的作用是从目标端获得与其实现细节的有关信息,包括可用的数据库、目标端支持的属性集、数据库模式、元素集、记录语法等。为支持解释功能,目标端需要建立和维护一个专门的解释数据库。起始端可以像对一般数据库一样对解释数据库进行检索和提取数据的操作。
  5. 关闭操作: 关闭操作的作用是关闭当前所有处于活动状态的操作,以及当前的Z关联。起始端和目标端都可以在关联建立后的任意时刻请求启动该服务。无论起始端或者是目标端,一旦发出关闭请求,就可以认为当前所有的活动操作以及当前的关联(元数据检索和提取连接)都将被中断,在等待关闭响应期间,所有其他的请求和响应都应被忽略。
  
  核心内容
  
  元数据检索协议的实现一般涉及四个方面的核心内容: 即通信协议、元数据检索相关操作、元数据检索语法、结果集格式。
  通信协议是元数据检索协议实现最先考虑的内容。针对元数据检索一般都通过网络进行。早期的元数据检索协议的实现大都基于局域网采用TCP/IP协议进行实现,后来,随着互联网的兴起,逐渐过渡到采用HTTP作为主要的网络通信协议,最近,随着WEBSERVICE概念的提出,基于SOAP协议进行元数据检索的网络传输协议也进行了相关的研究和探索。在Z39.50协议中定义了若干元数据检索的相关操作,早期制定这些操作针对图书馆业务的特征非常明显。
  元数据检索语法是所有Z39.50协议变种根据实际需要进行确定的一项重要内容,一般采用逆波兰方式进行查询语法的构建。当前,在结果集格式上一般XML作为主要的编码形式,主要是因为XML不仅使用层次型元数据记录的自身特点,同时从计算机系统实现的角度,它非常适合在异构系统之间进行信息交换。
  
  链接
  所需要的技术
  目前,完全意义上的全自动信息资源分类非常难于实现,对信息资源的分类多采用计算机辅助方式进行分类。计算机辅助进行信息资源分类有两种模式: 第一种,预先设定信息资源分类信息,该模式适用于同种类型的信息资源元数据采集时采用; 第二种,采用系统根据预先设置的规则进行初步判断,提供初步的信息资源分类建议,再由人工进行干预判定,最后确定信息资源的分类。
  根据不同的需求,分类软件系统模块的粒度也不尽相同。包括: (1)独立的信息资源分类转化模块。根据不同的信息资源分类转换需求,提供不同信息资源分类体系之间的类目映射和转换工具,方便进行元数据中分类信息的重新赋值。(2)信息资源分类组件。该组件封装分类体系判断的逻辑,提供各种灵活的操作接口,可直接集成到各种元数据著录工具中,在进行元数据分类信息著录时被调用。

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3