现在看来,互联网的很大一部分都在挣扎,包括Slack、Imgur、Epic游戏商店等等。互联网的很大一部分都依赖于亚马逊网络服务,也就是AWS,当他们面临问题时,整个互联网也会出现问题。如果你在你喜欢的一些网站上遇到问题,你绝对不是一个人。其他受影响的网站包括Coinbase、Hulu和Udemy,仅举几例。
用户报告最近在Down Detector上激增。起初,亚马逊在其AWS状态页面上说,它正在调查其USE1-AZ4可用区的 “EC2启动失败和网络连接问题增加”。
“我们正在调查US-EAST-1地区的一个可用性区域(USE1-AZ4)的实例的EC2启动失败和网络连接问题增加。US-EAST-1区域内的其他可用区没有受到这个问题的影响。”
然而,从那时起,该公司已确认在USE1-AZ4可用区发生了停电。
“我们可以确认,在美国东部-1地区的一个可用区(USE1-AZ4)内的一个数据中心发生了电力损失。这正在影响受影响的可用性区域内属于受影响数据中心的EC2实例的可用性和连接性。在受影响的可用性区域内,我们还遇到了RunInstance API错误率升高的问题。受影响的可用性区域内的其他数据中心或US-EAST-1区域内的其他可用性区域的连接和电源不受这个问题的影响,但我们建议如果你能做到的话,可以远离受影响的可用性区域(USE1-AZ4)。我们将继续努力解决这个问题,恢复受影响数据中心的电力。
像这样的停电是非常罕见的,很少有持续超过一个小时的。虽然我们最近看到了一些更重要的停电事件,如Facebook,甚至上周亚马逊也发生了停电事件。正如亚马逊所指出的,该公司目前正在努力恢复数据中心的电力,如果可能的话,企业应该尽量远离受影响的可用区域。
更新:亚马逊说它现在已经恢复了大部分实例和网络设备的电源
在北京时间5:18,亚马逊确认它恢复了大多数实例和网络设备的电力。
“我们在恢复US-EAST-1地区受影响的可用性区域(USE1-AZ4)内的受影响数据中心的电力方面继续取得进展。我们现在已经恢复了受影响数据中心内大多数实例和网络设备的电力,并开始看到一些早期恢复的迹象。在受影响的可用性区域内遇到连接或实例可用性问题的客户,随着受影响数据中心的电力恢复,应该开始看到一些进展。RunInstances API错误率正在恢复到正常水平,我们正在努力恢复受影响的EC2实例和EBS卷。虽然我们预计在未来一小时内会有持续的改善,但我们仍然建议离开可用区如果可以的话,这样问题可以减轻。”
更新2:亚马逊表示,所有实例和网络设备的电源已经恢复了
“我们现在已经恢复了受影响的数据中心内所有实例和网络设备的供电,并且看到受影响的可用性区域内的大多数EC2实例和EBS卷正在恢复。受影响可用区的网络连接也已恢复到正常水平。虽然所有的服务都开始看到有意义的恢复,但在受影响的数据中心内托管终端的服务,如单AZ RDS数据库,ElastiCache等。- 这些服务可能已经受到影响,但现在已经开始看到恢复。鉴于恢复的水平,如果你还没有从受影响的可用区逃离,你应该在这个阶段开始看到恢复。”