Fastly的一次重大故障导致大部分互联网瘫痪,这被归咎于一个有效的客户配置变更引发的软件错误。
6月8日的故障导致Amazon.com、Twitch、Reddit、英国政府的网站组合以及一大堆其他网站和服务瘫痪。
Fastly表示,它在一分钟内发现了这个问题,并在49分钟内恢复了95%的网络。然而,一些客户由于起源负载的增加和较低的缓存命中率,体验到了更长的中断时间。
内容交付网络Fastly在公司的数据中心和终端用户之间运行边缘云,减少延迟,阻止DDoS攻击,并帮助他们处理流量高峰。
内容停机网络
看来Fastly无意中在其系统中引入了一个诱杀装置,因为它部署了一个可由破坏者禁用的软件版本。工程和基础设施高级副总裁尼克-罗克韦尔在一篇解释文章中说:”5月12日,我们开始进行软件部署,却引入了一个在特定情况下可由特定客户配置触发的错误。
“6月8日早些时候,一位客户推送了一个有效的配置变更,其中包括触发该错误的特定设置,这导致我们85%的网络返回错误。”
停电开始于9:47 UTC,服务从10:36开始恢复。在12:35时,它被完全恢复,到17:25时,开始进行对该错误的修复。
罗克韦尔说:”我们正在对这次事件中我们所遵循的流程和做法进行全面的事后分析。”
“我们将弄清楚为什么我们在软件质量保证和测试过程中没有发现这个错误。”
他补充说,该公司 “应该预见到 “这个问题,并向Fastly客户道歉。
然而,投资者似乎并不为之所动。如果有的话,它产生了相反的效果,公司股价飙升–也许是因为这次故障引起的关注,或者是因为它揭示了Fastly有多少客户。甚至其竞争对手亚马逊也是Fastly的客户,它有自己的CloudFront CDN。
在撰写本报告时,股价已上涨约10%,使其估值略低于6亿美元。在与故障相关的股价飙升之前,该公司的股价一直在稳步下降,今年迄今已下跌42%。
部分下跌是由于投资者对成长型股票的普遍情绪降温,但由于该公司5月份宣布其首席财务官离职这种情况不断加剧。