缓解打击或如何为云灾难恢复准备基础设施

nusaiba129 · Post by **nusaiba129** » Mon Feb 17, 2025 5:45 am

有一个与 GitHub 相关的引人注目的例子。几年前，一次维护工作导致美国东海岸网络枢纽与其主要美国西海岸数据中心之间的连接中断。它在不到一分钟的时间内恢复了连接，然而，这个看似很小的事故导致了 24 小时以上的服务降级。

因此，使用这些数据中心的人被切断了连接，无法留下任何评论。如果你的系统需要持续的DevOps 活动，并且有持续的 CI/CD 管道和需要定期更新（比如每天 2-3 次）的服务，那么这一点至关重要。想象一下，如果你经营一家大型企业，尤其是保险、金融或石油和天然气行业的企业，这些问题可能会带来多大的损失。

这就是为什么不应忽视灾难恢复配置的原因。但这里一切都取决拉脱维亚电报号码于问题的类型。如果只是连接问题，你只需要花点心思重新同步基础设施即可。

但如果是自然灾害，那就只能采取恢复整个基础设施的措施了。正如你所理解的，这个问题的规模要严重得多。

最好制定基于云的灾难恢复计划，以防万一出现问题。以下是我们可以为您提供的建议。

如何为云灾难恢复准备基础设施基础设施复制是最安全的方法
复制是我们想提到的云灾难恢复最佳实践中的第一点。为了完全保护自己免受任何类型的灾难，除了在不同的地理位置创建应用程序之外，没有其他同样可靠的方法。如果您的基础设施部署在伦敦的数据中心，那么火灾或洪水蔓延到存储复制数据的维也纳的可能性就很小。

因此，如果您拥有一个不容丢失的关键基础设施，那么最好投资复制，而不是承受后果。是的，这很昂贵、费力且费时，但如果发生什么事情，您也不会无可挽回地失去它。