IP+SAN技术四篇

2024-07-12

IP+SAN技术 篇1

关键词:服务器集群,SAN架构,数据存储

0 引言

随着高校信息化水平的快速发展, 高校网络数据中心的数据存储量急剧膨胀, 海量数据的存取要求数据中心具有更高的数据吞吐量、更快的I/O传输速率和更高的安全性能。在传统的信息化建设中, 普遍将应用集中配置在一台服务器上, 这种做法存在巨大的潜在威胁, 主要表现在可用性不高, 负载不能动态平衡, 数据服务丢失可能性增大, 维护和扩展存在困难等等。而采用服务器集群技术, 可提高访问数据库的效率、提高可靠性和抗灾难性。另一方面, 传统的以服务器为中心的分散式存储系统在管理方式、容量和扩展性以及数据保护方面, 也很难支持数据中心急速增长的信息服务需求。

针对上述问题, 在本文所讨论的高校综合信息系统建设中, 拟采用基于HP刀片服务器平台。刀片服务器是指在标准高度的机架式机箱内可插装多个卡式的服务器单元, 实现高可用和高密度, 它们可以通过“板载”硬盘启动自己的操作系统, 类似于一个个独立的服务器, 在这种模式下, 每一块母板运行自己的系统, 服务于指定的不同用户群。而在集群模式下, 所有的母板可以连接起来提供高速的网络环境, 并同时共享资源, 为相同的用户群服务。再结合基于IP的存储区域网络 (Storag Area Network, 简称SAN) , 可以为高校综合信息系统建设提供更加高效、先进和易于维护和扩展方案。

1 服务器集群工作原理

服务器集群是一组协同工作并运行集群服务的独立服务器, 一个服务器集群包含多台拥有共享数据存储空间的服务器, 各服务器之间通过内部局域网进行通信, 当其中一台服务器发生故障时, 它所运行的应用程序将由其它的服务器自动接管。在大多数情况下, 集群中所有的计算机都拥有一个共同的名称, 集群系统内任意一台服务器都可被所有的网络用户访问。

在服务器集群系统中, 每一台服务器都可承担部分计算任务, 并且由于集群了多台服务器的性能, 因此, 整体系统的计算能力将得到提高。同时, 每台服务器还能承担一定的容错任务, 当其中某台服务器出现故障时, 系统可以在专用软件的支持下将这台服务器与系统隔离, 并通过各服务器之间的负载转移机制实现新的负载平衡, 同时向系统管理员发出报警信号。

2 服务器集群的优势

数字化校园建设中, 服务器环境中的主要技术和产品要考虑实用、可靠、经济、安全以及可扩展、可维护等问题。针对以上需求, 服务器集群主要优势在于可以提供更高的可用性、更方便的可管理性以及更经济高效的可伸缩性。

2.1 关键应用获得高可用性

服务器群集为应用程序部署提供了一个高可用性平台。它可使应用程序在由于维护而产生的停机期间以及由于故障而产生的意外停机期间继续保持运行。使用服务器群集, 可以对整个群集内的操作系统和应用程序软件进行升级, 而不用关闭应用程序。

2.2 集中和方便的可管理性

使用服务器群集, 管理员可以快速检查所有群集资源的状态, 并将工作负载转移给群集中的其他服务器。对服务器上的文件更易于升级、维护和访问, 这很大程度简化了设备的连接和管理。

2.3 系统完备的可伸缩性

可分区的应用程序可以分布到群集的各个服务器中, 从而可以利用其余的CPU和内存来解决问题。随着问题规模的增大, 可以将其他服务器添加到群集中。分区应用程序可以将数据或功能分割成多个独立单元的应用程序。再利用集群管理软件, 刀片服务器群可以轻松扩展。

3 SAN架构的优势

SAN的主要特点是把大容量存储设备组成一个存储局域网, 实现服务器与存储设备间的高速连接。存储设备之间的数据交换不占用局域网的带宽, 这将大大提高服务器和存储设备间的数据传输效率。

根据高校综合信息管理系统的应用特点和不断发展的存储需求, SAN技术是高校系统存储解决方案的最优选择。

3.1 高可用性

SAN技术可以为主机与后备服务器之间提供设备状态和网络通信等信息, 并允许在替换和备份服务器之间共享关键存储设备。除了在存储阵列和其他设备中提供高可用性外, SAN允许在冗余的多主机间提供多个冗余的通信路径, 这样大大提高了关键任务系统的可靠性。

3.2 高数据可靠性和安全性

建立虚拟专用网络可以提高数据的安全性。在SAN中也可以通过建立双机容错、多机集群、RAID校验、RAID设备镜像、负载均衡等措施, 进一步保证数据的安全性和作业的连续性。

3.3 易扩展性和兼容性

SAN本身就是一种网络, 该网络中存储设备的数量和容量及服务器主机的数目不再受到限制, 一台主机可以管理和使用多个存储设备, 一个存储设备也可以被多个主机所管理。另外, 在SAN网络中, 除支持RAID设备外, 还支持JBOD、磁带存储、光盘柜存储等多种设备, 从而确保设备的兼容性和投资的有效性。

3.4 集中管理、共享存储

通过使用SAN架构, 巨大的、集中的磁盘存储池可以被多个主机所共享, 如需要, 还可以从共用的存储池分配新的卷。这样极大提高了存储资源的利用率。

4 基于SAN架构的存储系统地设计

针对高校综合信息系统网络应用, SAN存储应包括四大类组件:计算机网络、中央服务器、FC网络、存储设备。

其中FC网络拓扑结构有三种基本形式:点对点、仲裁环路和交换Fabric。每种拓扑结构都有其应用针对性, 并且这些拓扑结构能够组成特别适应特殊需求的SAN系统。

点对点结构只能使用两台设备, 基本上是一台服务器直接和光纤存储设备相连, 或者两台服务器形成双机和一台光纤存储设备相连。仲裁环路结构适用于设备连接比较多的场合, 但是因为同一时刻只有一台设备能进行仲裁, 严重地限制了带宽, 因此不予采用。

交换Fabric结构允许按需扩展SAN系统, 在系统中可动态地加入和移除设备而对其他节点没有任何影响。这是Fabric拓扑结构对于仲裁环路的独特优势, 仲裁环路在增加和减少节点时都要求对整个系统重新初始化。在Fabric结构中必须使用交换机, 交换机使用它的硬件电路来路由节点间的路径, 从而能更高效地利用带宽。以这种方式许多使用全部带宽的传输过程可瞬时完成。

SAN的组件和设备有:

(1) 线缆与介质

SAN网络中的线缆和介质直接关系到SAN的扩展性和功能性, 其介质主要分为:铜芯电缆、多模光纤、单模光纤。在高校网络应用中主要采用多模光缆作为传输介质, 相应地接头主要采用SC和SFP两种, 在2Gb/s的传输系统中, 主要采用SFP接头。

(2) 集线器

在光纤通道中, 集线器是连接不同端口的最为基础的电子连接部件, 它只应用于FC仲裁环路的配置结构。其作用就是连接线缆端口, 并形成简单电子环路。

(3) 交换机

光纤交换机是光纤网络中使用的主要设备, 它不再使用光纤环路连接方式, 而使用光纤网络路由直接连接方式。前者使用光纤环路连接所有设备, 信号的传输也经过所有节点, 是一种共享带宽的方式。后者使用路由软件直接连接, 可以独享光纤的所有带宽。光纤交换机在SAN存储架构中的地位要高于SAN中其他设备。

(4) 存储设备

它是光纤网络中的一个重要环节, 提供了整个SAN网络都可以访问的共享存储资源, 是SAN网络的核心。

(5) 路由器

在光纤通道中, 路由器的作用与网络环境中路由器的作用是不同的, 它可以将光纤通道的帧转换成其他传送方式。最常用的路由器是在原有的SC-SI连接中进行转换。光纤通道路由器一端接入Fabric, 另一端是SCSI总线, 可以支持任何类型的并行SCSI设备。

5 结束语

综上所述, 服务器集群技术能为数字化校园建设提供高可用性、高可管理性和高伸缩性能的选择, IP-SAN技术则能满足网络应用不断发展的存储需求。从局部应用来看, 文中提出的这种综合集群技术、IP-SAN技术以及网络通信技术的存储架构, 能很好满足高校综合信息管理系统运行架构和数据存储的实际需求, 是一种安全、高效的系统数据存储架构。

参考文献

[1]闫斌, 徐红兵, 周小佳, 等.高可用性集群数据库服务器研究与实现[J].计算机应用研究, 2005 (12) :261-263.

[2]马子彦, 张勇敏.基于RAID的双机集群系统应用研究[J].计算机应用研究, 2007 (7) :98-99.

[3]申红芳, 罗四维, 赵宏, 等.集群计算系统的模型结构[J].计算机应用研究, 2004, 21 (2) :52-54.

[4]曾碧卿, 陈志刚.服务器集群系统研究[J].计算机应用研究, 2004, 21 (3) :186-187.

[5]赵聪等.一种新型的共享存储网络构架[J].计算机应用研究, 2003, 20 (8) :106-107.

[6]冷冕冕, 孙少斌.服务器集群技术在数字化校园中的应用[J].计算机与信息技术, 2008 (5) :93-95.

[7]姚世勇, 徐爱萍.Web Server集群技术[J].武汉大学学报:信息科学版, 2003 (4) :123-126.

[8]High Availability Cluster Multi-Processing for AIX:Concepts and Fa-cilities Guide version 5.2 (DN:SC23-4864-03) [EB/OL].[2004].http:∥www-1.ibm.com/servers/eser ver/pseries/library/hacmp_docs.ht-ml, 2004.

IP+SAN技术 篇2

随着计算机技术和存储技术的飞速发展,军事、气象、石油等高性能运算领域技术得以迅速发展,其数据量也呈几何级数增长,计算机的存储能力,必须适应大规模数据存储和高速数据传输的严峻挑战。对于传统的DAS(Direct Attached Storage) 直连方式存储和SCSI(Small Computer System Interface)存储已经无法满足海量数据的需要,新一代存储设备,SAN(存储域网络)[1,2]架构光纤存储系统,开始越来越多应用于高性能运算领域。但是,对一个数据处理中心而言,不同类型、不同厂家、不同时期的SAN存储系统,各自技术差异较大,难以实现存储资源共享和负载均衡[3,4]。目前的高端SAN存储系统,具有高性能、高可靠性、高可用性、高稳定性、集中统一管理等特点。应用这些技术特点,把多套SAN存储系统进行整合,是一项技术难题,国内外同行业用户都在积极地探索和研究中。

目前,本文例举的处理中心配置了HP XP24000,HDS AMS1000,HP EVA6100,SUN STK-FLX280,IBM FAStT700等7套SAN架构异种光纤存储系统,磁盘存储总容量560TB。这些存储系统分别于不同时期购进,存储技术、I/O带宽、数据读写速度差异较大,而且分布在不同PC集群计算机上,相互分立,无法实现存储资源共享和负载均衡,很大程度影响存储系统的性能。

通过对高端SAN存储系统虚拟整合技术研究[5],利用HP XP24000高端SAN存储系统的外部存储功能[6],使用存储网络整合、Zoning整合、逻辑卷映射整合、外挂存储整合等技术,将不同类型的中低端存储设备实现虚拟化集中管理,对异构的存储环境进行整合,构建大规模SAN存储中心,使其形成统一完整的存储池,最大限度地发挥存储资源的利用率,提高存储系统的整体运行性能,整个存储环境对业务完全透明,实现对存储资源统一管理、按需分配、灵活访问,保证有限的存储资源得到合理和高效的利用。

本文着重阐述了高端SAN存储系统虚拟整合其它存储设备的技术原理和实施方案。

1 HP XP24000高端SAN存储系统技术优势[7]

HP XP24000是HP公司高端SAN存储系统的代表产品。它提供了业界最优的I/O吞吐率(350万IOPS,Cache命中率达100%)。内部采用交叉交换结构(Crossbar Switch),内部连接带宽106.4GB/s。同时数据连接和内部控制连接完全分开,保证了数据信息和控制信息的传输不互相干扰。其最重要的结构创新是采用纵横交换设备代替了传统的总线连接。其技术优势从高可用、可靠性,可扩展性,易管理性,系统安全性等方面全面考虑。

1.1 高可用性和高可靠性

高可用性和高可靠性是整个存储系统设计的基本出发点。HP XP24000系列存储系统可以确保99.999%的高可用性和高可靠性,也就是年平均非计划性宕机时间不超过5分钟。在其整体结构设计中,充分考虑了系统的自身特性,采用100%的冗余体系结构,消除系统中所有的单点故障,充分保证用户数据的高可用性和高可靠性。

1.2 可扩展性

存储系统的高可扩展性对于业务快速增长的行业是十分重要的,主要体现在I/O、系统容量等方面的扩展能力。用户数据可能随时增加,系统必须能够满足用户对存储空间的各种要求。良好的扩展能力为今后系统的平滑升级和能力提升预留了广泛的空间;同时也最大限度地保护用户的现有投资。而且由于整个存储系统网络是按照开放的存储局域网的架构设计,通过光纤交换机连接所有设备(包括服务器节点和存储节点)。所以从理论上来说,系统可以像网络一样自由在线扩展,充分满足存储容量迅速增长的需要。

1.3 易管理性

HP XP24000存储系统主要采用Web界面管理软件Remote Web Console,提供图形化的存储管理界面,方便用户的操作,系统管理员可以方便,直观地监控所有设备的状态,快速及时地隔离出问题的设备,并采取相应步骤进行诊断。同时Remote Web Console可以显示监控存储系统所有部件状态,磁盘空间使用情况,并可将系统信息自动传输到网络管理平台OpenView中,可以使用户统一管理存储网络设备和XP存储设备。

1.4 系统安全性

关键数据的安全性对于最终用户来讲是至关重要的。如何防止操作员误操作而引起的数据损坏,黑客恶意攻击,未授权用户访问,都是在制订存储数据安全策略时所需要考虑的重要方面,用户在SAN环境下应使用一个绝对可靠的安全管理器,以防止数据的非法访问,达到光纤通道或存储区域网(SAN)环境中最大的数据安全性和完整性。HP Security Manager软件可以对用户的数据提供可靠的保障,它可以和光纤交换机的分区(Zoning)功能相结合,控制不同主机对不同LUN的访问,可以在阵列内设置LUN许可,以保护敏感的数据,使用户可以方便地控制服务器主机对LUN的访问,只允许经授权的服务器对某些磁盘区域进行操作,而屏蔽其他主机对这些磁盘单元的读写访问。这样可以有效地保护系统各个用户和应用的安全性及相对独立性。

2 高端SAN存储系统虚拟整合技术

处理中心拥有IBM 512、HP 512、IBM 128等3套PC集群计算机用于地震资料处理,CPU总数2526个,总核数达6432个,双精度浮点运算速度共达到58.2万亿次/秒。各套集群系统分别独立地配置了HP XP24000(2套)、HDS AMS1000(2套)、HP EVA6100、SUN STK-FLX280、IBM FAStT700等7套SAN架构光纤存储系统,总容量为560TB。

2.1 高端SAN存储网络整合技术

在3套PC集群计算机的各个I/O节点上,分别配置2块HBA光纤通道接口卡,与7套SAN存储系统所有主控制器接口,分别连接到2台64端口HP SW4900光纤交换机、4台32端口HP SW4100光纤交换机、2台32端口Brocade SW4100光纤交换机,构建成为一套全4Gb带宽、完全冗余、多通道的大规模SAN光纤存储区域网[8]。SAN存储系统网络整合拓扑如图1所示。技术方案如下。

(1)采用2台64端口的HP SW4900高端光纤交换机作为SAN存储区域网的核心交换设备,与4台32端口HP SW4100光纤交换机和2台32端口Brocade SW4100光纤交换机级联,构建一个大规模SAN存储网络。

(2)2台64端口HP SW4900高端光纤交换机分别连接HP XP24000(200TB)的主控制器接口和24台I/O节点的HBA光纤通道接口。

(3)2台32端口HP SW4100光纤交换机分别连接HP XP24000(100TB)的主控制器接口、8台I/O节点的HBA光纤通道接口。

(4)2台32端口Brocade SW4100光纤交换机分别连接HDS AMS1000(215TB)的主控制器接口和20台I/O节点的HBA光纤通道接口[9]。

(5)2台32端口HP SW4100光纤交换机分别连接HP XP24000(200TB)的连接外挂存储主控制器接口、HP EVA6100的控制器接口、SUN STK-FLX280的控制器接口、IBM FAStT700的控制器接口和10台I/O节点的HBA光纤通道接口。

(6)HP EVA6100、SUN STK-FLX280、IBM FAStT700等3套SAN存储系统与HP XP24000(200TB)的外挂存储控制器接口连在一起,成为HP XP24000的外挂存储设备。

2.2 高端SAN存储Zoning整合技术[10,11]

Zoning整合技术是在光纤交换机上实现的功能。通过在SAN存储网络光纤交换机上进行Zone配置,可以将连接在SAN网络中的设备,逻辑上划分为不同的区域,使各区域的设备相互间不能访问,网络中的主机和设备间相互隔离。Zoning分区是SAN存储网络的一种分区方式,通过Zoning分区,可以进行资源的负载平衡分配,同时也可以帮助计算机系统管理员对访问服务器数据的用户进行权限分配。

根据处理中心SAN存储系统虚拟整合的需求,在2台互相冗余的64端口的HP SW4900高端光纤交换机开发统一的Zone程序文件,并且在SAN存储网络的其它光纤交换机上使能该程序文件,使SAN存储网络中的Zone程序文件统一,从而实现处理中心机房的任何一台I/O节点都能管理任何SAN存储设备中的文件系统。统一的Zone程序文件应包括以下5部分Zone分区。

(1)IBM 512 节点PC集群I/O节点与2套HP XP24000存储系统划分的Zone。

(2)HP 512 节点PC集群I/O节点与2套HDS AMS1000存储系统划分的Zone。

(3)IBM 512节点PC集群I/O节点识别2套HDS AMS1000存储系统和IBM FAStT700、SUN STK-FLX280、HP EVA6100等3套外挂存储系统划分的Zone。

(4)HP 512节点PC集群I/O节点识别2套HP XP24000存储系统和3套外挂存储系统划分的Zone。

(5)IBM 128节点PC集群I/O节点识别2套HP XP24000存储系统和2套HDS AMS1000存储系统划分的Zone。

2.3 高端SAN存储逻辑卷映射整合技术[12]

在SAN存储系统中,逻辑卷映射技术要与光纤交换机上的Zoning功能结合使用,目的是通过系统配置和程序开发,使不同的I/O节点能访问到不同的逻辑卷。逻辑卷映射是存储系统的逻辑卷与I/O节点的HBA光纤通道接口(主机接口)进行绑定,服务器连接不同的主机接口所能访问的逻辑卷也不同。当一个存储系统同时为多个应用系统提供数据存储服务,且不同应用系统的I/O节点分别处于不同的物理地址时,需要将不同的逻辑卷与不同的主机接口绑定,不同的主机接口与不同的光纤交换机或者不同的Zoning分区连接,从而实现不同的I/O节点能够访问不同的存储系统。在处理中心7套SAN存储系统的整合中,通过对每套PC集群存储管理软件逻辑卷映射技术的开发,使所有I/O节点不仅能识别本存储系统的逻辑卷,还要识别其它存储系统的逻辑卷,实现全部I/O节点能够映射识别到SAN存储网络的全部逻辑卷设备,从而实现7套SAN存储系统区域网整合。

2.4 高端SAN存储外挂管理整合技术[13,14,15]

本文利用HP XP24000高端SAN存储系统的外部存储功能,对IBM FAStT700、SUN STK-FLX280、HP EVA6100等不同类型的中、低端存储设备实现虚拟化管理,成为高端存储的外挂设备,虚拟化的外挂设备相当于HP XP24000高端存储系统的一个内部逻辑磁盘设备,由HP XP24000存储系统进行统一管理,最大限度地发挥原有中、低端存储资源的再利用能力。同时,虚拟整合后的存储系统能够较大地提高原有存储的整体运行性能,对用户使用完全透明,并且能够根据不同应用业务的特点和需求,进行灵活分配存储系统、存储容量等各种资源,确保关键业务的高效运行。

为了使处理中心7套存储系统形成统一的存储池,在经过以上硬件架构整合的基础上,在HP XP24000高端存储系统的管理软件上进行技术开发,实现存储资源的统一调度和管理,保证所有存储系统的性能提高。主要技术步骤如下。

(1)登录至HP XP2400存储系统管理操作界面,选择“外部存储管理”,进入编程模式。

(2)选择“端口扫描”, 定义连接外挂存储的端口,进行外挂存储的搜索,包括HP EVA6100、SUN STK-FLX280和IBM FAStT700等3套外挂存储。

(3)选中搜索出来的设备,再逐一对应选中其外挂的端口,将所有的HBA光纤通道接口的WWN(World Wide Name,全球唯一名字)加入到外挂配置中。

(4)检查每个外挂逻辑卷是否都有完全的端口来访问,并将这些外挂的逻辑卷,映射到HP XP24000的控制端口上。

(5)选择“分区定义”菜单,依次在HP XP24000存储系统的控制器缓存(128GB)创建三个缓存分区,并调整缓存分区大小分别为两个4GB和一个8GB。

(6)把创建的三个缓存分区分别增加到3套外挂存储原有的缓存分区中, HP EVA6100 的控制器缓存大小由4GB调整为12GB,SUN STK-FLX280和IBM FAStT700 控制器缓存大小由2GB调整为6GB。

(7)更新并保存控制器中的配置程序文件,确保修改生效。

通过以上存储系统配置和程序开发,IBM FAStT700,SUN STK-FLX280,HP EVA6100等3套SAN存储系统通过HP XP24000高端存储实现统一虚拟化管理,共享HP XP24000存储系统的控制器缓存资源,可以大幅度提高3套外挂存储系统的数据读写速度,用户可以在HP XP24000存储系统和3套外挂存储系统之间灵活访问。

至此,处理中心的7套SAN存储系统之间实现互联、整合,3套PC集群访问SAN存储系统上的地震数据,既可以通过TCP/IP网络实现,也可以通过SAN存储网络实现,不仅缓解了服务器网络和存储网络的数据传输压力,还能够提高地震数据读写速度,提高7套SAN存储系统的整体性能和使用效率。

3 SAN存储系统虚拟整合前后性能对比测试

本文对虚拟整合后的3套中低端SAN存储系统进行性能对比测试,分别在I/O节点和计算节点的操作系统下执行以下测试命令:

dd if=/dev/zero of=/fsname/`hostname` bs=10k count=1024000

SAN存储系统虚拟整合前后性能对比结果如表1所示。通过测试案例可看出,虚拟整合后的中低端SAN存储系统性能有较大提高。

4 结束语

通过高端SAN存储系统虚拟整合技术的研究,把IBM FAStT700、SUN STK-FLX280、HP EVA6100、HDS AMS1000等多套相互分立的存储系统整合成为一个多通道、双链路、双冗余、负载均衡和统一共享的超大规模存储系统,取得的主要成果包括:

(1)中、低端外部存储设备可以共享HP XP24000高端存储设备的性能,提高了中、低端设备的可靠性和数据读写、传输速率。

(2)通过提高原有中、低端存储设备性能,降低总体建设成本,保护原有存储设备的投资。

(3)利用高端存储设备的高级数据管理功能, 实现HP XP24000存储系统内部和外部存储间数据透明地拷贝和迁移,大大简化数据存储管理的复杂性,降低管理成本。

(4)支持分层存储,根据业务需求配置不同性能的存储设备,从而降低总的系统成本。

(5)通过与HP XP24000磁盘阵列的分区功能相结合,可以将整合的外部存储系统划分到特定的分区中,便于管理,并且可以根据应用的需要灵活地将外部存储整合进(或拆分出)HP XP24000存储系统。

目前,该项技术在国内石油勘探行业属首创,技术先进,实用性强,可以在各个地震资料处理等高性能运算领域进行推广和应用,具有一定的指导和借鉴作用。

摘要:随着计算机存储技术的飞速发展,高端SAN存储系统越来越多应用于高性能运算领域。通过存储网络整合、zoning整合、逻辑卷映射整合、外挂存储整合等技术,基于高端SAN存储系统,整合中低端系统,使其共享I/O通道带宽和缓存资源,实现多套SAN存储资源共享,提高存储系统整体性能。对保护设备投资,最大限度地发挥存储效率有着重要作用。

IP+SAN技术 篇3

关键词:图书馆;存储;SAN;IP SAN;iSCSI

中图分类号:G250.76文献标识码:A文章编号:1673—8454(2012)17—0084—03

存储从最初服务器的内置设备,到独立于主机之外,组建单独的存储网络,专注于数据的管理,促成“数据计算和数据管理”的分离,实现了一步步飞越。目前存储系统已经成为了一个与网络系统、服务器系统并列的重要IT子系统。随着图书馆数字化进程的开始,越来越多的电子文献资源被不断引进,而且图书馆一直在致力于自主数字资源的开发,传统的纸质以及音像资源现在也越来越多地实现数字化。而这一切使得图书馆的数据量越来越大,海量存储也对图书馆的存储管理提出了严格的要求。如何建立一个安全高效、管理方便且具有较强扩展能力的存储系统,摆在了图书馆技术管理人员面前。

一、图书馆存储的一般要求

1.安全性

图书馆所有的数据包括核心数据全部在存储系统中,必然对存储的安全性有很高的要求,为了核心数据的安全,同时需要建立数据灾备、容灾系统进行配合,以提高数据安全性。

2.稳定性

图书馆的业务系统要能承受大量的应用需求并且具有良好的反应速度,而图书馆的数据具有较高I/O要求,电子资源服务要求一周7×24小时提供不间断服务,需要一个成熟稳定、故障率低的存储系统。

3.可扩展性

图书馆每年会购买大量的电子资源,目前的数据量是以TB的倍数在增长,数据的急速膨胀对存储的可扩展性有一定的要求,这种扩展并不是简单的容量扩展,同时应该包括数据处理能力、数据交换带宽和数据管理能力的扩展。

4.兼容性

目前应用系统对数据的使用方式,仍以文件系统、数据库系统为主要手段。存储系统要适应各种主机系统的数据I/O要求,就必须能够兼容各种操作系统和文件系统、数据库系统等各种传统数据管理手段。

5.可管理性

支持各种主流的管理协议和管理架构,能够与网络、计算等各种设备进行统一管理和集中管理。

6.较高的性价比

应综合考虑存储的预算、价格、性能以及可扩展性、后期扩展成本等各方面因素选择适合于本馆的存储产品。

二、目前的存储形式及各自的优缺点

1.DAS(Direct Attached Storage,直接附加存储)

DAS指将存储设备直接连接到服务器上。上个世纪80年代,DAS是主要的存储方式。它的特点是初始费用比较低,配置简单。目前DAS依然被广泛地应用在小型存储应用上。与此同时,DAS也暴露出它的缺点,对于多个服务器或多台PC的环境,每台PC或服务器单独拥有自己的存储磁盘,容量的再分配困难;对于整个环境下的存储系统管理,工作繁琐而重复,没有集中管理解决方案,整体管理成本较高。[1]

2.NAS(Network Attached Storage)

NAS是一种专业的网络文件存储及文件备份设备。通常是集成了处理器的磁盘柜,可以看做是一种专门优化了的文件服务器加上大容量存储,连接到TCP/IP网络(LAN或WAN),通过文件存取协议存取数据。[2] NAS的优点是易于安装,即插即用。NAS设备的物理位置可灵活安排,易于维护,可扩展性强,并且NAS是多平台支持。NAS的缺点是由于采取文件请求的方式,相比块请求的设备性能差,而且占用应用网络带宽。NAS系统的文件传输采用的文件协议不适用于某些数据库。

3.SAN(Storage Area Network)

SAN是一个由存储设备和存储构件组成的网络,所有的通信都在一个与应用网络隔离的单独网络上完成,被用来集中和共享存储资源。

SAN主要有以下优点:(1)存储与服务器之间可以远距离连接;(2)高可靠性和高性能;(3)多个服务器和存储之间可以任意连接,支持异构平台;(4)集中的存储设备代替了多个独立的存储,支持存储容量共享;(5)SAN易于扩展存储容量;(6)可以通过软件集中管理和控制SAN上的存储设备,提供数据共享;(7)SAN不但提供了对数据设备的高性能连接,还增加了对存储的冗余连接功能,提供了高可用群集系统的支持。SAN的缺点是成本较高,并且对管理人员也有一定的技术要求。

我们看到,DAS不适用于数字图书馆的大容量存储集中管理的要求,而NAS可以完成大容量存储管理,但它以文件协议传输数据,占用网络带宽,性能较差,所以不适用于图书馆环境的快速I/O要求和以数据库为主的业务应用。比较而言 SAN具有传输速率高、数据吞吐量大、容错能力强、稳定性高、可以集中管理、可以自由扩展容量的特点,无疑是数字化图书馆的最佳选择。

三、SAN技术的选择

1.SAN分类

SAN分为基于FC协议的FC SAN ,以及以iSCSI协议为主的IP SAN (以下称为iSCSI SAN)。下面我们分别来了解一下这两种SAN。

(1)FC SAN:在最初的时候,存储都是在服务器内部,基于SCSI协议,通过SCSI线与主机相连,而随着存储设备的不断扩大,存储逐渐从主机内部移动到了主机外部,有自己的磁盘柜以及电源供应。这时的SCSI协议,就显露出连接设备少,连接距离短,主机共享性低等一系列问题,当时的以太网带宽只有10Mb,无法提供高速传输数据能力。于是1988年能提供1Gb串行网络访问能力的光纤通道协议(Fibre Channel,简称FC)面世,于上世纪90年代末开始大规模应用。早期的SAN都是搭建在光纤通上的,所以SAN曾经成为光纤存储网络的代名词,而且随着基于IP的SAN的出现,这类SAN又被加了一个前缀,称为“FC SAN”。目前 FC SAN已经发展到8Gb。

在FC SAN中,主机要安装一块光纤HBA(主机总线适配器)卡,再通过光纤线连接到光纤交换机相应的端口中,形成FC SAN的交换结构。

FC SAN结合了高速度和低延迟的特点,并且具有强大的扩展能力,可以通过强大的交换机系统给数百台设备提供快速连接。FC SAN也是一种非常可靠的SAN 技术,HBA和交换机的性能非常强大,设备故障率非常低。FC SAN 结构允许多重连接线路和冗余线路,如果某个硬件出现故障或电缆出现问题,可以找到一条新的通道,这样传输转换到另外一个通道,可以保持存储和应用程序之间的连接,直到故障排除。另外,多重连接可以进行合并,以获得更好的带宽。例如,将两个2Gb 的连接进行合并,可以有效地达到一个 4Gb 数据带宽的性能。这种多重或冗余连接的可行性,能够在 SAN 系统卸载流量时,均衡负载,并且能够动态地调整繁忙通道利用较少使用的通道进行传输。

在安全方面,严格来说FC是一个运行在二层的协议,安全性不是太高,但由于FC SAN与以太网不能兼容,基本是一个隔绝的物理LAN上运行,所以安全问题不是很突出。

由于历史原因,虽然FC协议的技术标准确实存在,但各家厂商却有不同的解释。导致FC SAN产品的标准混乱,不同厂商的FC SAN产品都无法兼容,较差的兼容性也给统一管理带来了困难,各家FC标准的不开放性也使FC SAN的应用越来越窄。

(2)iSCSI SAN:FC SAN费用昂贵,构造复杂,许多小型单位常常因为预算的原因无法部署。而在FC SAN盛行的十年间,开放的以太网从最初的100Mb发展到10Gb,提高了100倍,而同时期,FC协议标准只从1Gb发展到8Gb,只提高了8倍。以太网成本低廉,传播广泛,是数据传输的良好载体,于是IBM、Cisco共同发起了iSCSI(Internet SCSI)技术标准。 2003年2月11日,IETF(Internet Engineering Task Force,互联网工程任务组)通过了iSCSI标准,iSCSI终于得到IETF认可。iSCSI的问世也预示着平民化的SAN时代的到来。

iSCSI是建立在TCP/IP协议之上的传输协议,他将SCSI命令封装在TCP/IP包里并在IP网络内传输,理论上是没有距离限制的。iSCSI集成了SCSI和IP两种非常成熟的协议。SCSI协议技术是被磁盘、磁带等设备广泛采用的存储标准,从1986年诞生起到现在仍然保持着良好的发展势头;TCP/IP协议在网络方面是最通用、最成熟的协议,而且IP协议的基础建设非常完善。

iSCSI SAN 的主要优点在于简洁、成本低廉、使用范围广泛。光纤通道技术非常昂贵,需要专业技术人员才能正确安装和配置,而 iSCSI SAN 只需利用普通的以太网卡和交换机就能实现,这些设备能够轻易买到。因此,获取、扩展和更新以太网 LAN 的费用都相对较低。以太网已经成功地在家庭和小公司中设立、使用,用户也非常了解以太网的设置和配置,其使用范围就会更加广泛。

目前iSCSI SAN与服务器连接有三种形式:①iSCSI HBA卡实现方式,在这种方式下,所有的TCP/IP包和iSCSI报文的处理全在HBA卡内完成,不占用主机资源;②硬件TOE(TCP/IP卸载引擎)卡实现方式,在这种方式下所有的TCP/IP包的处理由TOE完成,iSCSI层的功能由主机完成,占用一小部分主机资源,网络性能得到了保证;③软件Initiator实现方式,软件Initiator在服务中模拟出一个iSCSI HBA卡来完成TCP/IP报文和iSCSI报文的转换,只需要以太网卡即可连接存储,微软公司更是在Windows 2003 Server及以后的操作系统中内置了对iSCSI的支持。软件Initiator要占用所装服务器的一定资源,比较适合于非核心业务使用,而高端核心业务,则可以使用TOE卡或HBA卡来获得更好的性能。

以前一般认为iSCSI SAN存储性能不如FC SAN,但事实是iSCSI SAN的性能非常出色。根据DELL实验室的测试数据,在相同的数据流量下,使用HBA卡的10Gb iSCSI SAN在协议效率、吞吐量、CPU利用率方面都毫不逊色于FC,甚至有些已经超过FC。而在1Gb环境下,采用普通千兆网卡两块进行绑定后,在全双工交换机上也能实现数据传输最大速率在 190~195MB/s,足够满足日常应用,应用成本也不高。[4][5]

iSCSI采用先进的身份验证技术,设置安全措施,例如用CHAP(挑战握手验证协议)来防止未经授权的访问,只允许可信赖的节点访问;用IPSec(Internet Protocol Security,互联网协议安全性)来防止侦听,保证数据传输中的安全。iSCSI安全措施也可以通过存储网络和应用网络进行物理隔离得以实现,但更多的情况下,我们可以在VLAN(虚拟LAN)中运行iSCSI SAN实现隔离,这在现有以太网络上也很容易实现。

iSCSI建立在SCSI和TCP/IP两个非常成熟的开放协议标准上,没有兼容性和统一管理上的困难。

2.两种协议的比较

通过以上讨论,我们看到FC SAN 与iSCSI SAN除了具有SAN的普通特点外,互相之间也有一些区别。

(1)从性能上来讲:在以太网1Gb时代时,FC是拥有性能上的优势的。而目前以太网达到10Gb后,FC SAN相比iSCSI SAN并没有明显优势可言。我们放眼看去,以太网带宽的提升速度远远超过光纤通道带宽的提升速度,目前16Gb的FC标准还在讨论中,以太网40Gb和100Gb的标准已经制定,而且40Gb的以太网交换机已经出现,IEEE(美国电气和电子工程师协会)已经开始开发100GB以上以太网标准。应该说随着以太网带宽的提升,FC SAN曾经有的高性能优势将被iSCSI SAN远远抛离。

(2)从管理上来说:iSCSI管理难度小,有以太网管理经验即可。FC则对管理人员有一定的技术能力要求,一般需培训专门的人员。

(3)从成本来说:FC SAN是高于iSCSI SAN,因为FC SAN环境的建设要购买光纤交换机,每台服务器均需配备光纤HBA卡,光纤交换机上的光纤适配器还要另外购买,代价昂贵。而iSCSI则最低只需要以太网交换机及以太网卡即可.其详细对比如表所示。

综合上述比较,笔者认为iSCSI SAN架构存储具有保证性能下的成本最小化,可以使用现有的IP网络,本身包含容灾功能,安全性能出色,可以远距离传输等优势,具有最大的发展潜力,是我们建设数字化图书馆的首选存储架构。

四、附记

近日厂商已经开始推出FCoE(Fibre Channel over Ethernet,光纤通道以太网)协议的存储产品,利用以太网来传输光纤通道协议。由于FCoE的标准尚未最终通过,对于它的稳定性、系统成熟性还未有定论,所以我们暂时不会考虑FCoE架构的存储产品。

参考文献:

[1]袁贵娟.IP SAN存储技术在数字图书馆中的应用[J].图书馆学刊,2008(2):136—138.

[2]乐昱.基于IP SAN的数字图书馆存储研究与探讨[J].现代情报,2010,30(12):81—83.

[3]存储在线[DB/OL].http://www.dostor.com.2011—04—01.

[4]Comparing Performance Between iSCSI, FCoE, and FC[DB/OL].http://www.delltechcenter.com/page/Comparing+Performance+Between+iSCSI,+FCoE,+and+FC.2011—04—01.

[5]刘文续,FC—SAN与IP—SAN非编制作网络之我见[J].中国有线电视,2011(2):172—174.

存储区域网络SAN技术完全详解 篇4

存储区域网络(SAN)是一种高速网络或子网络,提供在计算机与存储系统之间的数据传输,存储设备是指一张或多张用以存储计算机数据的磁盘设备。一个 SAN 网络由负责网络连接的通信结构、负责组织连接的管理层、存储部件以及计算机系统构成,从而保证数据传输的安全性和力度。

典型的 SAN 是一个企业整个计算机网络资源的一部分,

通常 SAN 与其它计算资源紧密集群来实现远程备份和档案存储过程。SAN 支持磁盘镜像技术(disk mirroring)、备份与恢复(backup and restore)、档案数据的存档和检索、存储设备间的数据迁移以及网络中不同服务器间的数据共享等功能。此外 SAN 还可以用于合并子网和网络附接存储(NAS:network-attached storage)系统。

当前常见的可使用 SAN 技术,诸如 IBM 的光纤 SCON,它是 FICON 的增强结构,或者说是一种更新的光纤信道技术。另外存储区域网络中也运用到高速以太网协议。SCSI 和 iSCSI 是目前使用较为广泛的两种存储区域网络协议。

上一篇:异构传感器数据融合下一篇:人行道施工技术