|
|
51CTO旗下网站
|
|
移动端

灾难恢复站点的作用和应用

灾难恢复(DR)站点是建设在企业总部之外的数据中心设施。它的目的是使企业系统在电力中断、网络攻击、网络故障、自然灾害、意外停机、破坏或其他导致主要位置瘫痪的事件中保持运行。

作者:Drew Robb来源:企业网D1Net|2019-05-30 11:14

尽管企业目前在云平台中大量存储数据,但灾难恢复站点仍然是许多公司满足数据存储要求的重要组成部分。

灾难恢复(DR)站点是建设在企业总部之外的数据中心设施。它的目的是使企业系统在电力中断、网络攻击、网络故障、自然灾害、意外停机、破坏或其他导致主要位置瘫痪的事件中保持运行。

根据灾难恢复站点的类型以及它们使用的灾难恢复服务,灾难恢复站点设施可能会立即联机运行,或者可能会有短时间或长时间的延迟。所选灾难恢复站点的类型取决于企业的需求和财务资源。

灾难恢复站点的重要性是什么?

灾难恢复站点可确保企业的业务无论发生任何事故或灾难都可以继续运营。它们还可以用作从主站点复制数据的方法,以确保最小的数据丢失。灾难恢复站点极大地降低了组织的风险,并消除了破坏性数据丢失事件或可能使组织业务瘫痪的停机时间的可能性。

对于任务关键型操作,恢复点目标(RPO)的时间通常不到15分钟,恢复时间目标(RTO)不到一小时。换句话说,如果发生事故,灾难恢复站点将在一小时内运行,或者丢失少于15分钟的数据。

在当前的灾难场景中,网络攻击和勒索软件已成为一种现实的新威胁,导致严重的中断。因此,现代灾难恢复站点必须满足这种可能性,并确保生产和恢复从网络访问的角度进行逻辑分离,同时具有多个数据快照以实现网络恢复。这也是确保恢复技术包括自动化和协调以提供最小的停机时间和恢复时间目标(RTO)的关键。

灾难恢复站点使用远程访问安全网关作为主备份和灾难恢复备份站点之间的桥梁。

灾难恢复站点的类型

选择何种类型的灾难恢复站点归结为所需的恢复点目标(RPO)和恢复时间目标(RTO),也就是说,可以接受多少停机时间和数据丢失。

热站点

这是目标环境已经启动并运行的位置,可以通过故障转移立即激活。还有高可用性体系结构选项,企业可以在群集或负载平衡设置中拥有多个节点。在这些情况下,单个节点的中断不会影响可用性。实质上,企业将激活生产环境的两个或更多实例,因此会产生大量成本。然后,任何运营热门网站的人都会将IT成本增加两倍或更多倍。

冷站点

这是一个目标灾难恢复环境,需要在启动恢复过程后激活。基础设施存在但需要启动并全面启动。此环境有时可用于开发/测试,并可在需要时重新用于灾难恢复。因此,冷站点的成本要低得多。

暖站点

暖站点处在热站点和冷站点之间,是指企业可以在待机状态下使用计算功能的站点,该计算功能可以轻松地连接到恢复的(或已经复制的)数据。其成本介于冷热站点之间。

此外,其他因素也可能发挥作用。例如数据保护策略的类型。也就是说,压缩数据和需要补充的备份与复制数据中已有的数据相比,可以简单地安装到企业的计算机上。恢复自动化/编排软件会影响恢复的速度和成本。

灾难恢复成本

关键任务系统通常需要具有高可用性架构的热站点,并且具有接近零的恢复点目标(RPO)/恢复时间目标(RTO)。但是,业务关键型系统越来越多地使用灾难恢复即服务(DRaaS)的云计算恢复技术,这些技术通过不到15分钟的恢复点目标(RPO)和不到1小时的恢复时间目标(RTO)复制数据和协调恢复。不太重要的系统可以依赖具有基于备份的保护的冷站点架构,通常提供大约24小时的恢复点目标(RPO)和几天的恢复时间目标(RTO)。

StorageIO Group分析师Greg Schulz说,“成本和功能根据企业对恢复点目标(RPO)和恢复时间目标(RTO)的需求而有所不同。还要记住企业的应用程序和数据需要(并且可以承受)。不仅要考虑成本,还要考虑应用程序和数据可用、可访问和可用的价值和业务效益。”

底线:恢复点目标(RPO)和恢复时间目标(RTO)越好,成本越高。在某些组织中,其优先级用于降低成本。某些核心应用程序和功能被分配高恢复时间目标(RTO)/恢复点目标(RPO),而常规功能的恢复周期较慢。

位置的重要性

企业在地下室或附近建立灾难恢复站点并不是一种好方法。发生主要位置灾害事件也可能影响次要位置。因此,最佳做法是将备用设施建设在30英里以上的距离。而有些人认为30英里的距离太少。

“站点之间至少需要200英里的距离,最好是在单独的电网上,并有单独和冗余的电网接入。”Commvault公司首席战略官Chris Vanwagoner说。

灾难恢复站点的位置取决于以下因素:

  • 接入电网
  • 网络连接
  • 洪泛区
  • 龙卷风
  • 其他恶劣天气模式

例如,如果主站点可能遭受洪水或地震,那么灾难恢复站点应该位于不会遭受这些灾害的地方。同样,灾难恢复站点的电力应用来自不同的电网,并位于另一个运营商的网络上。否则,它将容易受到主站点造成停机的相同故障的影响。

灾难恢复站点的大小应适当,以处理预期的工作负载。组织的主要IT系统旨在满足日常业务活动的需求。如果灾难恢复(DR)/业务连续性计划(BC)计划必须确保整个组织的全面运营能力,则需要正确确定灾难恢复站点的规模和配置。然而,经常会有财务方面的考虑。

许多灾难恢复站点的大小都是为了最小化功能。它们只是为了维持关键系统的运行,但在试图支持日常业务运营的压力下会崩溃。

灾难恢复站点所有权也会有所不同。有时,企业的灾难恢复站点可能是自已构建的,有可能由另一家公司托管。还有一些共址部署的设施来处理多个组织的灾难恢复需求。无论灾难恢复站点以何种方式运行,其快速恢复、提供故障转移的功能并使组织能够恢复处理。

“拥有自己的设施与使用他人的共址部署、托管或云平台相比,归根结底是出于财务、安全和控制方面的考虑。”Schulz说。

内部站点与外部站点

一些组织具有运营其自己的灾难恢复站点的财务手段、人力资源和/或监管要求。这些内部站点的投资成本通常很昂贵,但在某些业务中,由于停机可能导致的潜在损失要大得多,因此其成本高昂是合理的。

例如,在某些金融机构中,停机一天的时间可能是热站点的年度维护成本。还有一些行业是企业内部管理的灾难恢复站点,由合规性法规强制执行。

不过,对于大多数组织来说,外部站点仍然是最佳选择。将灾难恢复功能转移到数据中心服务的专业提供商、云计算提供商或托管提供商的成本通常要低得多。对于一些组织来说,内部资源不足以运行内部操作的站点。外部站点可以是全套服务或部分服务,也可以只是租用的场所,用于部署在发生灾难时组织可以使用的设备。

云存储越来越多地为灾难恢复提供了一种可扩展且经济高效的方法。由于云平台由许多地理位置分散的物理位置组成,因此有些人可以使用这些特性以降低成本,实现有效的灾难恢复站点计划。

但是,那些选择这条路线的组织会被警告要密切关注应用程序的兼容性。“云平台无法运行当今数据中心的所有内容,如大型机和某些应用程序。”VanWagoner说。

【编辑推荐】

  1. 关于“灾难恢复即服务”选型的十个提示
  2. 图文简述DAS、NAS、SAN的不同应用场景
  3. 基于Redis+MySQL+MongoDB存储架构应用
  4. Node.js 应用故障排查手册 —— 冗余配置传递引发的内存溢出
  5. 云计算时代,为何灾难恢复不是以前的样子
【责任编辑:武晓燕 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

Spring Boot 爬虫搜索轻松游

Spring Boot 爬虫搜索轻松游

全栈式开发之旅
共4章 | 美码师

75人订阅学习

Linux性能调优攻略

Linux性能调优攻略

性能调优规范
共15章 | 南非蚂蚁

203人订阅学习

VMware vSphere虚拟化常见故障

VMware vSphere虚拟化常见故障

搞定vSphere虚拟化
共18章 | 王春海

83人订阅学习

读 书 +更多

敏捷Acegi、CAS:构建安全的Java系统

本书是关于Acegi、CAS的权威教程,是Java/Java EE安全性开发者的必备参考书。无论是Java EE安全性编程模型的背景和基础知识,还是Acegi、CA...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客