(3)数字图书馆的海量存储问题 数字图书馆意味着海量数据,大量的全文书刊所占的存储空间非常大,一个中等规模的数字图书馆的数据量就会达到TB级。数字图书馆源源不断地产生数字化信息,数据量总是在不断地增长,某些时候还会产生突发性增长,如多媒体应用和网络应用就产生了这种突发性增长。对于大部分应用,CPU和网络的速度达到某个值就满足了要求,但对存储容量的需求却是没有止境的,因为永远都有新的数据产生。因此,数字图书馆的存储空间日趋紧张。 目前图书馆均采用以通用服务器为中心的传统网络结构模式(DAS模式,直连存储模式),各种外部设备都挂接在通用服务器上。由于通用服务器CPU只能将其20%~30%的系统资源用于I/O服务,因而当并发访问的用户数量增多时,必然会造成I/O堵塞,严重影响服务器和整个网络的性能,有时甚至会使服务器因不堪重负而中断服务,导致整个网络系统崩溃。为了提高网络的数据传输速度,用户不得不配置价格昂贵的高档服务器或工作站,因此增加了建设成本,造成了不必要的浪费。 综上所述,数字图书馆需要一种大容量、性能高、扩展性好、廉价、可兼容各种系统平台的海量存储系统。寻求一种经济高效的数据存储方案正是目前数字化图书馆建设的当务之急,而NAS就提供了非常好的应用方案,基于NAS的海量存储系统能有效地满足数字图书馆对存储系统的诸多要求。 2NAS技术及其分析 (1)NAS的系统构成与工作原理 NAS(NetworkAttachedStorage)的含义是网络 WAN)上,功能上完全独立于网络服务器。客户机对存储设备的访问不再需要通过网络服务器转发,而是直接进行数据存取。网络服务器仅起控制管理的作用,可将网络服务器从繁重的I/O负载中解脱出来,因而具有更快的响应速度和更宽的数据带宽,便于实现海量数据的网络共享。 NAS存储系统是使用TCP/IP协议的以太网文件服务器,包括存储设备和集成的服务器。存储设备可以是磁盘、磁盘阵列、光盘和磁带,用于存储数据。集成的服务器经优化设计,实现文件存取及管理功能。 (2)NAS的特性分析 ①易于安装和部署 NAS产品即插即用,将NAS设备连接到交换机上,分配一个IP地址即可完成安装。NAS设备的物理位置可根据需要来确定,一般将其放置在访问频率最高的地方,以进一步缩短访问时间并提高网络吞吐量。 ②方便使用和管理 不需安装任何额外软件,NAS服务器的设置、升级及管理均可通过Web浏览器远程实现,增加和移除NAS设备不会中断网络的运行。 ③整体性能高 无需应用服务器的干预,NAS设备允许用户在网络上存取数据。这样可减少CPU的开销,能够显著改善网络的性能。 ④跨平台使用 基于TCP/IP的数据传输使NAS可以支持多种网络文件系统,如NFS、CIFS、NCP和AFP等。NAS独立于操作系统平台,可支持Windows、Unix、Mac、Linux和NetWare等,不同操作系统平台的文件可以共享。 ⑤提高数据可用性 NAS的数据可用性体现在:采用磁盘阵列技术,NAS可保证硬件设备和数据的安全与完整;通 过网络共享数据,即使相应的应用服务器不再工作是扫描版或PDF格式,以文件形式来组织,而且全了,仍然可以读取数据;采用嵌入式操作系统,具有文书刊期刊的数量庞大,因此数据量非常大,导致很强的稳定性和可靠性;网络管理员可方便地设置存储空间日趋紧张。 用户或用户组对NAS服务器的访问权限。 按目前常用的PDF文件格式计算,估算一所 ⑥性能价格比高 NAS为访问和共享大量文件系统数据的企业环境提供了一个性能价格比优异的解决方案。NAS是精简型服务器,硬件只需CPU、内存、硬盘、网卡和简易主板等;在软件方面,作业系统是精简型系统,有些甚至是免费的Linux,因此在成本方面比普通服务器便宜很多,而作为专用存储服务器的性能则更高。 3基于NAS的海量存储系统设计 (1)需求分析 ①数字图书馆信息系统分析 |
核心期刊网(www.hexinqk.com)秉承“诚以为基,信以为本”的宗旨,为广大学者老师提供投稿辅导、写作指导、核心期刊推荐等服务。 核心期刊网专业期刊发表机构,为学术研究工作者解决北大核心、CSSCI核心、统计源核心、EI核心等投稿辅导咨询与写作指导的问题。 投稿辅导咨询电话:18915033935 投稿辅导客服QQ: 投稿辅导投稿邮箱:1003158336@qq.com |