谨防云中断,如何设计数据中心冗余?

发布者:上海IT外包来源:http://www.lanmon.net点击数:1228

许多公共云提供商经常不可避免地在日常运营中遇到灾难性中断,IT经理必须从云平台的失败和教训中吸取教训并将其应用到内部基础架构中。
云平台(尤其是大型公共云平台)具有多级冗余,但它们都不能防止意外停机。云计算平台(如数据中心)存在导致停机的问题。
数据中心的冗余
组织内部实施的硬件故障和软件错误是不可避免的,但公共云为IT经理提供了解决这些问题的方法。公共云具有可用性集合,冗余数据中心,可用区域和云区域,允许管理员在发生中断时更好地规划业务操作。这些策略很重要,但管理员必须设计可靠的应用程序以利用公共云冗余。
组织IT资产的灵活性更多地取决于应用程序而不是基础架构,这种想法不同于传统的思维方式。在过去的二十年中,管理员通过备份,复制和其他基于架构的技术保持了弹性。但对于大多数公共云平台而言,此策略已不再有效。
近年来,云计算提供商的承受能力超过了他们的承受能力。当来自云提供商的云服务中断时,业内的提供商和用户似乎正在学习如何为本地云设计冗余,并且管理员希望将这些课程应用于传统虚拟化数据中心的冗余。 。
重新思考数据中心的冗余
对于大多数传统组织而言,一些基本服务旨在避免停机。服务设计(例如网络时间协议和网络路由)通常非常冗余。但是,仅仅因为系统必须是冗余的并不意味着它的配置已做好充分准备以利用自然冗余。

一些基本服务没有高可用性选项。 IT部门几乎总是面临必须解决的技术债务,这需要支持那些效果不佳的遗留系统。例如,遗留应用程序的某些身份验证系统只能存在于服务器上,这限制了数据中心的冗余。


经理们不应该将所有鸡蛋放在一个篮子里。对于大多数传统实现,最好在数据中心内使用冗余硬件。管理员可以通过使用不共享系统的冗余虚拟化群集来进一步采用此策略,类似于可以提供多个可用区域的云计算提供商。这允许应用程序依赖数据中心的更高级别的冗余,但仅当商业要求保证在此级别的冗余保护时。当在云平台和数据中心之间并行实施这些策略时,通过采用类似的传统基础设施来使用公共云提供商(例如可用区)的概念可能是有用的。这个术语使开发人员更容易理解基础架构概念,因为他们可能熟悉类似的云概念。
云计算的冗余并不完美,停机中断提供了经验教训
高度冗余的系统不能免受性能下降的影响。在最近的公共云中断事件中,您的目录服务无法使服务从一个区域运行到另一个区域。重新调整流量的能力超过其他地区,这使得服务不能令人满意。
当管理员设计数据中心冗余时,他们必须在服务中断时计划负载。管理员可以使用两台服务器来支持数据中心冗余,但其中一台服务器可能无法处理整个负载。关键是设计满足正常和异常条件的商业需求的系统。
许多组织认为,如果配置正确,将在服务中断期间发现其他情况。 Netflix的Chaos Monkey系统被称为模拟中断事件,而经验教训是,如果管理人员不练习如何处理实际的中断,他们将永远不会知道IT系统将如何反应。虽然没有系统是孤岛,但每个应用程序和服务都具有依赖性,这使得测试更加复杂。
在私有数据中心和公共云中,由于停机造成的中断并不少见,但在数据中心内,管理员通常需要了解并了解系统内部的工作方式。当云提供商的服务中断时,您可能会觉得没有学到关于停机时间的课程,但事实并非如此。虽然公共云提供商使用与传统数据中心不同的工具和方法,但是有关创建和调整冗余的经验教训很常见。
IT外包
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部