当前位置:首页 > 发言稿 > 分布式数据库特点_浅议分布式数据库的特点\结构与设计
 

分布式数据库特点_浅议分布式数据库的特点\结构与设计

发布时间:2019-02-21 04:04:56 影响了:

  摘要:分布式数据库系统的应用,对于满足当前社会信息共享提供了更完善的解决方案,是加强我国信息化建设的有效工具之一。本文着重阐述了分布式数据库的特征和模式结构,同时也厘清了其设计思路。
  关键词:分布式数据库 设计 系统
  
  随着计算机技术的飞速发展及其在各行各业的广泛应用,各种数据、资料早已经成为稀缺的资源,而在社会节奏不断加快的今天,各企事业单位的资源利用效率显得越来越重要,于是数据库系统成为促进信息流通、构建核心能力的关键所在。由于数据库技术在各个领域中的应用不断深入,当前用户期望出现能够处理数据信息存储地域分散的新型数据库系统。伴随着计算机网络的逐渐成熟和数据库技术的不断完善,分布式数据库系统以“计算机网络”加上“数据库系统”的方式,既能克服数据资料物理上的分散性,又能对数据进行全局共享和集中管理。
  1 分布式数据库系统的概念
   分布式数据库系统就是数据信息在实际空间中分开保存,但从数理应用逻辑上却体现出集中、统一的数据库系统,其控制机制具有集中与自制相结合的特点,数据具有相对独立性、适当冗余性、管理分布性等特点。该系统不强调系统的集中控制,而长于节点的自治能力,并且数据能够做到分布透明。
  
  2 分布式数据库系统的特征
  2.1数据存储分散
   分布式数据库系统与集中式数据库系统最大的不同就在于其中的数据信息不是存储在某一个数据节点中,而是分散存储于多个站点,这些节点由Internet和/或Intranet相连接,形成一个虚拟的统一数据库,同时这种数据的分散存储并不影响数据用户的操作和使用。
  2.2逻辑应用整体统一
   分布式数据库系统中的数据物理上是分散存储在各个站点中,但从逻辑角度来衡量,这些分散的数据却又呈一个虚拟的整体,被所有用户共享使用,并由分布式数据库系统统一管理、集中控制,同时这种“分布”对用户来说是透明的。这也是分布式数据库与分散式数据库的最大区别。
  2.3节点自治性强
   分布式数据库系统中各节点上的数据信息由本地的分布式数据库管理系统所管理,具有较强的自治处理能力,用以完成本站点的局部应用,这也是分布式数据库系统与多处理机系统的区别。
   根据上述特性,分布式数据库系统能够做到数据分布透明(也称为数据分布独立),控制机制集中与自治相结合,允许存在数据适当冗余,以及分布进行事物的执行和管理。
  
  3分布式数据库系统的模式结构
  可以把分布式数据库理解为基于Internet和/或Intranet连接的多个集中式数据库的逻辑集合。由此可知,分布式数据库的模式结构既保留了集中式数据库模式结构的特点,又比集中式数据库模式结构更为复杂、更适用于现代应用。
  如图1.1所示,分布式数据库模式结构划分为四层:第一,全局外层,即全局外模式;第二,全局概念层,包括全局概念模式、分片模式和分配模式;第三,局部概念层,即局部概念模式;第四,局部内层,即局部内模式。分布式数据库中,这四层模式之间的转换,是由全局数据库管理系统和局部数据库管理系统提供的多次映像来实现的。其中,几个不同模式的概念阐述如下:
  第一,全局外模式。全局外模式即全局应用的用户视图,也叫做全局视图。分布式数据库中,全局视图的数据可以理解为,其并非来自于某个或某几个特定节点,而是从一个逻辑数据集合中取得,这个逻辑上的数据集合由各节点中的局部数据库所组成。也就是说,全局外模式是全局概念模式的子集,表示全局应用所涉及的数据库部分。
  第二,全局概念模式。全局概念模式被用来定义分布式数据库中全局逻辑结构数据特性,而定义全局模式中的数据结构应考虑定义其它各层映像时的方便性,因此大多采用关系型数据模型。
  第三,分片模式。由于分布式数据库的数据可按集中、重复、分割和混合方式分布,分片模式用于说明如何放置数据库数据的每个特殊部分。分布式数据库可划分逻辑片,逻辑片可以是数据项分割,也可是数据值分割,或是上述两种的混合。逻辑片可以任意定义,但它们是相关的,它们组成不相交或不重迭的数据库子集。分片模式定义片段、片段与概念模式之间的映射。
  第四,分配模式。分配模式定义片段存放的结点,一个片段在物理上可分布到不同结点存储,数据分布模式提供的信息,可以将一个全局查询分解为若干子查询,每一子查询所访问的数据属于同一节点的局部数据库。所以,分布式数据库系统中所增加的模式和相应的映射使分布式数据库系统具有分布透明性。
  第五,局部概念模式。局部概念模式在大多数情况下可以理解为全局概念模式的子集,在某一个节点上的局部概念模式是该节点上所有全部关系模式在其物理映像的集合。全局概念模式与特定节点无关,而局部概念模式则隶属于某个或某些个节点。
   第六,局部内模式。局部内模式是分布式数据库中关于物理数据库的描述,其描述的内容不仅涉及某一节点的数据信息,还包括全局数据在这一节点的存储信息。
  
  4 分布式数据库系统的设计
  4.1设计目标
   (1)数据库系统在应用中,为了提高效率都会尽可能减少站点之间的通信次数和数据传数量。因此,在分布式数据库设计中,一个主要目标就是使得数据和应用实现最大程度的本地化。
   (2)分布式数据系统允许存在适当的数据冗余,使得其在数据信息利用效率和便捷性等方面优于非分布式数据库系统。也就是说,在分布式数据库系统中,为了提高系统的便利性、并发性和可获得性,复制了某些数据的副本。但另一方面,冗余数据意味着,可能存在数据不一致的问题,为减少各节点同步更新的各种成本,需要控制数据副本的数量。所以,分布式数据库系统需要在设计时考虑数据冗余的最优程度。
   (3)分布式数据库系统把工作负荷分散于其网络中的各个节点上,目的就是充分利用各个节点计算机的资源,以提高应用执行和数据传输的并行程度,进而增强整个系统的应用性能。因此,必须以最合理地发挥各个节点的运算存储资源为目标,优化工作负荷分配。
   (4)数据库的分布安排还要考虑各节点的存储能力,因为在数据网络中既有专门用于存储数据的节点,也可能有不能进行大规模存储的节点,所以必须考虑各节点可用存储空间的条件,必须以合理分配有限的空间资源为设计目标。
  4.2数据的分段设计
  分段设计的基本目的是产生一个对全局数据合适的划分方案,基本的分段方法有水平分段和垂直分段两种:水平分段是对全局关系执行“选择”操作,把具有相同性质的元组进行分组,构成若干个不相交的子集;垂直分段是通过“投影”操作把一个全局关系的属性分成若干组。
  4.3数据的分配设计
   数据分配是要通过复制某些数据信息的副本,分散到数据网络中的各个节点,以提高整个数据库系统的可利用能力,缩短局部应用的响应时间,减少系统内数据通信频次和数据量。进行数据分配设计一般需要应考虑局部处理能力,尽可能减少远程访问次数;力争使各节点的运算和传输负载均匀化,提高整个数据库系统的并行处理能力;同时尽量提高数据检索时的可靠性,减少因数据更新不同步造成数据过时情况,并且还要追求系统的运行效率,使系统的管理和存储代价最小化。
  
  5结语
  分布式数据库系统是现代计算机网络应用中的一个重要组成部分,需要对各种形式的数据进行分类、组织、编码、存储、检索和维护。其目的是借助网络技术充分利用有限的节点物理资源,更大程度的满足人们共享数据、应用信息的需求,最终实现对人们利用有价值的数据信息作为行动和决策的依据学,提升人们的工作效率。
  
  参考文献:
  [1] 邵佩英.分布式数据库系统及其应用[M].北京:科学出版社,2000:7.
   [2] 杨晶,刘天时,马刚.分布式数据库数据分片与分配[J].现代电子技术,2006,(18):119-121.
   [3] 宁华华,王慧.分布式数据库的复制和分片[J].电脑知识与技术,2009, 5(19):5088-5089.
   [4] 肖凌,刘继红,姚建初.分布式数据库系统的研究与应用[J].计算机工程,2001,27(01):33-35.
   [5] 陈眠,喻丹丹,涂国庆.分布式数据库系统中数据一致性维护方法研究[J].国防科技大学学报,2002,23(03):76-80.
   [6] 吴艳丽,吴业福,郝晓静.分布式多数据库系统数据一致性的设计与实现[J].交通与计算机,2005,23(5):88-90.
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3