虚拟化技术在数字图书馆中的应用探讨 国外数字图书馆技术方面
摘 要:本文详细介绍了虚拟化技术、虚拟化软件平台以及VMware软件在某高校数字图书馆中的具体应用,并提出了实施虚拟化应注意的一些问题。 关键词:虚拟化;服务器;数字图书馆
中图分类号:TP393 文献标识码:A 文章编号:1673-8454(2012)01-0085-02
随着数字图书馆的不断发展,馆藏的数字资源及各种应用越来越多,图书馆用于支持这些应用的服务器数量大规模增长,配套设备也相应增加。以某馆为例:服务器从2002年的6台发展到现在的30多台,中心机房的机架、电源、UPS及精密空调都进行了两次改建和扩容。如何对这些快速增长的服务器进行有效地管理,提高其利用率,保证其为用户提供稳定、高效的服务成为数字图书馆建设中需要考虑的一个重要问题。传统模式下,一台服务器只运行一种应用,大部分的服务器利用率都很低,只有20%~30%,如果把几种应用程序装在同一台服务器上,又可能会造成系统或软件冲突,因此需要一种新的技术来整合资源,提高服务器的利用率,在这种情况下,服务器虚拟化技术的出现为这个问题提供了很好的解决办法,他能提高服务器的利用率,缩短系统安装配置的时间,为用户提供高可靠性、高可用性、易于管理和维护的访问服务。
一、虚拟化技术
1.虚拟化概述
虚拟化是指从逻辑角度而不是物理角度来对资源进行配置,是从单一的逻辑角度来看待不同的物理资源的方法。一台物理机上运行多个虚拟机,共享这一台物理机的硬件资源,虚拟机相互隔离,在同一物理机上运行不同的操作系统和应用程序。[1]目前,常用的虚拟化软件有VMware、微软Hyper-V、Xen Server等。由于VMware支持主流操作系统,因此得到IBM、DELL、HP等服务器硬件厂商的广泛支持,应用最为广泛。
2.VMware服务器虚拟化软件
VMware公司创建于1998年,在1999年发布它的第一套产品VMware Workstation,并于2001年发布VMware ESX Server 和 GSX Server进入企业服务器的市场。2006年,发布业界首套套完整的虚拟架构套件VMware Infrastructure 3,包含ESX Server、VirtualCenter、Vmotion、DRS、VMware HA等组件。[2]2009年,推出业界首款云计算操作系统VMware vSphere 4,实现了集中管理、自动负载平衡、业务连续性、电源管理等功能,较之上一代的VMware Infrastructure 3提高了三成以上的整合率,可以节省50%的存储成本和20%的电力。VMware vSphere 4包含以下核心组件:
VMware ESX/ESXi:一个在物理服务器上运行的虚拟化层,它将处理器、内存、存储器和资源虚拟化为多个虚拟机。
VMware vCenter Server:配置和管理虚拟化环境的中央点。提供配置、访问控制、性能监视等服务。
VMware vSphere Client:一个管理接口,允许用户从任何PC远程连接到VMware vCenter Server和ESX/ ESXi。
VMware vMotion:可以将一个运行的虚拟机从一台物理服务器实时迁移到另一台物理服务器,保持零停机、连续服务。
VMware HA:如果服务器出现故障,受影响的虚拟机会在其他服务器上重新启动运行。
VMware DRS:资源的动态负载均衡。不间断地监控各虚拟机利用率,并根据业务需要在虚拟机之间以智能方式分配可用资源。
二、VMware虚拟化技术在数字图书馆中的应用
某高校图书馆现有HP、DELL等品牌的服务器30余台,存储为大恒的光纤存储,总计80TB。数字化应用主要有汇文管理系统、清华同方CNKI、维普数据库、万方数据库、超星数字图书馆、方正Apabi、读秀、人大报刊、知识视界、网上报告厅等。在未采取虚拟化方案前,都是“一台服务器,一种应用”的模式,大部分的服务器利用率都很低,只有20%~30%,该馆决定采用VMware vSphere虚拟化方案来提高服务器利用效率。
1.数字化应用的选择
该图书馆在实施虚拟化方案时考虑在安全的前提下,统一规划,逐步实施,先对一些非核心的业务以及对服务器资源占用小的数字化应用进行虚拟化。经过分析并结合服务器运行情况,初步拟定对以下应用进行虚拟化整合:超星数字图书馆、方正Apabi电子图书、人大报刊、国研网、全国报刊索引、FTP等。
2.服务器虚拟化方案
该图书馆使用两台DELL PowerEdge R710作为物理服务器,在两台物理服务器上各自安装VMware vSphere的ESX Server组件,生成六台虚拟服务器,根据各种数字化应用的需求对每台虚拟服务器所需的硬件资源,如CPU、内存、存储空间等进行划分,在每台虚拟服务器上再安装操作系统、运行数字化应用。具体虚拟化整合如表所示。
为了实现对VMware ESX 主机及其虚拟机的集中管理,需要在单独的一台服务器上安装VMware vCenter,VMware vCenter负责全系统的管理、控制,如实时迁移、自动负载平衡、硬件故障防护,以及虚拟机备份和恢复功能。最后在PC机上安装VMware vSphere Client,供管理员和用户从PC远程连接到VMware vCenter来管理和维护虚拟机。
3.应用效果
通过服务器虚拟化整合后,取得了如下效果:
(1)物理服务器的利用率明显提高,从原来的20%~30%提高到现在的60%~80%,充分利用了物理服务器的硬件资源。
(2)通过虚拟化整合后,减少了物理服务器的数量,从原来所需要的6台减少到2台,既节省了经费,又降低了能耗,节约了空间。
(3)采用虚拟化平台后,各数字化应用可以被快速地架设、备份和恢复。通过虚拟机模板安装的方式,虚拟机无需一个个单独安装,只需要一个模板就可以将虚拟机在几分钟内安装或恢复完毕。
(4)提高了安全性。虚拟架构通过减少物理网络连接的数量,降低了通过物理网络进行攻击的潜在风险,提高了安全性。
(5)下一步,如果安装VMware HA可以实现数字化应用的高可用性,在检测到某台物理服务器故障时,无需手动干预即可自动重新启动其他物理服务器上的虚拟机,保护应用程序不受操作系统故障的影响;如果安装VMware DRS 结合VMware Vmotion可以自动监测物理服务器资源(CPU、内存)使用负载,动态地迁移虚拟机到负载较轻的(物理服务器)EXS主机上,使各物理服务器的硬件资源使用平衡。[3]
三、实施虚拟化技术应注意的一些问题
1.实施虚拟化之前应做好详细计划方案
首先要确定哪些应用实施虚拟化,并充分地与数据库商沟通,了解它们是否支持虚拟化架构,对那些需要USB加密的数据库,虚拟机可能无法支持;其次,并不是所有的服务器都要虚拟化,如果服务器的CPU、内存利用率超过70%,就没有必要再做虚拟化;最后,对于核心业务系统,建议暂不实施虚拟化。
2.合理选择配置硬件
虚拟化平台将多个虚拟机整合到一台物理服务器上运行,对服务器的CPU、内存要求较高,并且物理服务器的硬件故障会导致多个虚拟机上的应用系统停止运行,因此我们要选择品牌好、配置高的服务器。另外,网络和存储也很重要,因为虚拟机的高可用性(HA)和动态迁移(Vmotion)都需要高速的网络和高性能的共享存储,存储最好选择采用光纤通道技术的存储区域网络(SAN)。[4]
3.加强虚拟机的管理
虚拟化架构将一台物理服务器划分为多台虚拟服务器,使得虚拟化平台系统的维护变得非常复杂,需要加强对虚拟机的管理,并提高维护人员的技术水平。
参考文献:
[1]王炜.VMware在图书馆数据中的管理中的应用[J].晋图学刊,2008(5).
[2]吴乾清.基于VMware的数字图书馆服务器虚拟化研究与应用[J].科技情报开发与经济,2010(21).
[3]崔滨.虚拟化技术在数字图书馆中的应用[J].科技咨询,2009(19).
[4]徐燕宾.关于数字图书馆应用服务器虚拟化技术的研究[J],太原城市职业技术学院学报,2010(7).
(编辑:金冉)
