微软Azure昨天出现全球性宕机事件 持续将近2个小时-冯金伟博客园

  现在微软官方发布声明,表示本次出现全球性宕机问题是由于“名称服务器授权”问题所导致的。微软解释道:“工程师确认是由于影响 DNS 解析的名称服务器授权调整影响底层 root,并影响下游对计算,存储,应用服务,AAD 和 SQL 数据库服务。在将旧 DNS 系统迁移到 Azure DNS 期间,Microsoft 服务的某些域未正确更新。在此事件期间,没有客户 DNS 记录受到影响,并且整个事件期间 Azure DNS 的可用性保持在 100%。该问题仅影响 Microsoft 服务的记录。”

  根据公司的声明,尽管工程师在几个小时内确定并解决了该问题,但是一些访问具有错误配置的域的系统存储了该信息,从而导致更长的恢复时间,直到错误的缓存过期。也就是说,微软仍在调查这个问题,并承诺将在 72 小时内发布详细的根本原因分析(RCA)。

  这不是 Azure 第一次受到全球中断的打击; 2016 年,全球 DNS 中断影响了许多基于 Azure 的服务,包括 SQL 数据库,应用服务/ Web 应用,API 管理,服务总线,HDInsight,媒体服务和 Visual Studio 团队服务。今年早些时候,由于类似的中断,许多 Office 365 用户无法访问其邮箱。