某电力集团公司同城灾备项目

发布日期:2015-08-07 10:33:00浏览量: 字号: [
]
  • 一、行业

        电力能源行业
  • 二、项目概览

        随着业务的不断发展,在信息化建设方面,为了保证关键系统高性能,关键服务不停顿,关键数据不丢失,集团公司结合现有机房设备及专线链路资源,决定先建设西安同城灾备数据中心,进行数据的同步或异步复制,同时选用性能较低的小型机及PC服务器进行验证,实现数据中心在西安本地容灾。
        未来会在距西安500公里以上的区域建立远程异地容灾数据中心,结合运营商专线链路的建设,实现双活数据中心,保障当西安本地发生地域性灾难时,企业核心业务不停顿。从而实现真正的两地三中心的典型容灾架构。
\
  • 三、客户需求

        p  数据灾备:根据集团公司要求,在西安本地建立同城异地灾备中心。建立数据中心与灾备中心的数据复制关系,实现数据灾备。
       p  存储整合:根据集团公司创建同城灾备的战略目标,利用SVC存储虚拟化技术对现有的业务系统进行资源整合,提高新旧设备有效利用率。
       p  灾备演练:演练数据可以使用RemoteMirror数据复制的target卷,也可以通过flashcopy target卷用于演练数据,同时生成规范化知识文档。

  • 四、技术难点

  • 4.1异构存储的难题

        容灾系统对企业是非常重要的,然而,企业内部的存储设备多种多样:不同的品牌,不同型号的异构存储设备造成数据的“SAN 孤岛”问题,例如 IBM、EMC、SUN、HP、HDS、Dell 等不同厂商的存储设备无法“兼容”。异构存储设备给容灾系统的建设带来隐患,在企业容灾系统建立时主要面临的以下挑战:
        1)   数据被分离在不同 SAN 孤岛,各种异构存储设备不“兼容”;孤岛,各种异构存储设备不“兼容”;
        2)   各种异构存储智能程度不同,无法实现跨异构存储设备的数据传输和共享;
        3)   由于各异构存储上的数据无法共享导致分散在各个设备上的整体容灾不易实现;
        4)   各个存储厂商容灾软件各不相同,无法通用;
        5)   每个存储系统单独管理接口,造成管理的复杂性;
        6)   某台存储设备故障,造成重要业务数据的丢失;

  • 4.2故障恢复能力的难题

        1)   远程容灾带宽分析
基于客户的现状,如果要规划一个远程的容灾系统,主备中心之间的数据链路带宽如何设定。
        2)   容灾性能影响性分析
一旦实施部署本地或远程容灾保护后,生产环境的性能一定会下降,那么性能下降多少,是否仍然可以满足业务的要求。
        3)   容灾数据恢复规划设计
异步复制的RPO丢失数据,如何在备中心恢复(数据追补方式)。
        4)   广域网容灾链路规划设计
在发生数据中心级或城域级灾难时,保证广域网链路能切换到容灾数据中心。

  • 4.3资源利用的难题

        如何在保证灾备的同时合理利用已有设备,最大化保护投资,也是容灾方案需要认真思考的问题。
        1)   资源互用或设备利旧设计
当前已有资源是否可被再利用,如何最大限度的保护已有投资
        2)   SAN 网络设计,整合实施
当前已有资源是否可被再利用,如何最大限度的保护已有投资
 
  • 五、解决方案

  • 5.1建设思路

        基于用户业务系统现状,针对本次同城灾备建设采取以下建设方案:
Ø  采用成熟、可靠的技术实现两中心的容灾建设,并且考虑未来的扩展
Ø  通过新增的服务器和存储设备提升核心生产系统的性能及尽量进行原有资源利用
Ø  改造整合SAN网络,消除数据孤岛,夯实云化数据中心必备基础,简化灾备系统建设复杂度,降低灾备系统运行维护风险
Ø  通过存储虚拟化设备构建生产中心和同城中心的存储资源池架构,资源共享,提升资源使用效率和灵活动态扩展能力,简化吉祥坊wellbet手机管理复杂度
Ø  通过存储设备的数据复制技术实现同城容灾中心与生产中心的数据级灾备
Ø  通过存储快照功能,可以实现并在第二中心地可查询,可验证,并综合考虑成本,降低总体资源投入
Ø  通过快照(flash copy)功能进行逻辑错误保护,也可以通过其他连续数据保护(CDP)软件实现
Ø  开发制定灾难恢复计划(DRP),制定灾难恢复人员组织架构,应急流程和恢复步骤在灾难发生时,确保能够及时准确的有步骤应对,实现预定的业务恢复时间,容灾方案测试验证方案评估报告,桌面演练计划,现场演练计划,桌面演练实施报告,现场演练桌面计划
Ø  现有架构和系统建设为后续私有云平台和双活中心建设打下基础

  • 5.2方案设计

  • 5.2.1同城数据复制

        采用VDisk Mirror + Remote Mirror实现容灾达到主数据中心的存储高可用(HA)及主数据中心与容灾数据中心异步数据复制;
        生产数据中心配置:
Ø  通过裸光纤与主数据中心相连接;
Ø  采用较少服务器作为数据或应用服务器;
Ø  采用存储设备容灾数据;
Ø  采用光纤交换机冗余线路连接服务器与存储用于数据传输;
        容灾数据中心配置:
实现容灾时,为了做到主数据中心异构存储的数据容灾,在容灾数据中心:
Ø  利用Remote Mirror通过裸光纤,将数据从主数据中心复制至容灾数据中心;
Ø  此复制技术占用主机设备的系统资源极小;
Ø  利用数据传输网络,数据同步复制,实现数据高可用性,在本地除了VDisk Mirror实现了存储高可用外,还确保异地灾备端始终有一份可用的数据;

  • 5.2.2存储优化与利旧

        为避免设备级单点故障可能带来的业务中断或数据丢失,采用双机双存储架构进行部署。而双存储平台既要满足数据的冗余镜像存储,又要满足所承载核心应用的业务连续性。
        基于IBM SVC的存储虚拟化具有通用性强、实施简单的特点,透明的将客户原有多品牌、多型号存储智能加入。该方案中SAN Volume Controller 是整个SAN 网络的控制器,在SAN的分区上,逻辑上主要划分为Host Zone和Disk Zone,从而解除主机与存储设备的紧密耦合。它将整个SAN中的存储设备整合成一个巨大的存储池,可以充分利用所有的存储资源并按业务的需求分配存储空间、性能和功能。因此,通过SVC可以很方便的将目前的存储设备进行整合,建立统一的灾备管理和资源分配平台,可以按照应用/业务不断变化的需求来动态配置存储。从而实现对两台磁盘阵列(支持异构)之间的数据镜像和高可用管理。采用IBM SVC实现双磁盘阵列的高可靠性和高可用性还可以保障业务系统的可扩展性,它不需要根据服务器的数量单独购买许可,便于业务规模的扩展,节省了投资。

  • 六、方案优势

Ø 企业级解决方案,满足未来3-5年的使用需要
Ø 方案技术成熟可靠,管理维护简单
Ø 优势资源用于生产,提升现有生产业务系统的性能
Ø 动态弹性的基础平台资源池架构,简化管理,提升资源使用效率
Ø 端到端的本地高可用架构提升生产业务的连续服务能力
Ø 原有的SAN交换机和存储等利旧,做到原有投资保护
Ø 可视化的图形管理界面可对容灾配置,,切换等安全便捷管理
Ø 可平滑过渡到更高级别的2地3中心容灾架构

  • 七、涉及技术范围

ü  POWERVM实施
ü  Vmware实施
ü  VDisk Mirror + Remote Mirror实现容灾
ü  SVC虚拟化存储整合
ü  NBU 备份软件实施
ü  NIM SERVER备份恢复
ü  TPC软件实施