本周一凌晨,全球最大雲服務供應商之一 Amazon Web Services(AWS)發生嚴重故障。
成千上萬家網站、應用程序及服務出現中斷或訪問延遲。
圖源reuters 版權屬於原作者
故障起始於10月20日美東時間凌晨(約 3:00 AM ET)左右,AWS 的 US-EAST-1
區域首先報告「顯著的錯誤率和延遲」現象。
AWS 為全球一些最大的組織提供幕後雲計算基礎設施。
在多個小時內,受影響的服務遍布遊戲、電商、金融、通訊、智能家居等領域。
圖源reuters 版權屬於原作者
Snapchat、Facebook 和 Fortnite 在內的多個熱門網站和應用程序都受到了影響。
銀行、加密貨幣交易所 Coinbase 和人工智慧公司
Perplexity也報告了問題,美國航空公司達美航空和聯合航空也出現了同樣的問題。
由於網站無法正常運作,Flickr、PlayStation 和Amazon等企業被迫顯示「404 錯誤」通知和致歉信息。
一些銀行的用戶被告知需要稍後重試,因為無法處理任何請求。
圖源reuters 版權屬於原作者
其客戶包括政府部門、大學和企業,其中還包括新聞媒體美聯社等。
多家航空公司(如 United Airlines 和 Delta Air Lines)報告其app和網站
在此次AWS故障中受到影響,乘客無法順利在線值機或查看預訂信息。
還有網友在社交媒體發帖表示,自己的航班已經降落卻無法停靠,只能在跑道上等待。
故障波及超千家公司,僅在中斷髮生的前兩個小時內,美國就提交了超過一百萬份報告,而英國在同一時間段內提交了超過 40 萬份報告。
圖源reuters 版權屬於原作者
互聯網性能監控公司 Catchpoint 的首席執行官 Mehdi Daoudi 估計,AWS
服務中斷造成的總財務影響將達到數十億美元。
AWS 隨後在其狀態更新中稱,問題源於其 「網路系統」 出現異常,從而引發連鎖反應。
AWS 在更新中說明,此次故障並非黑客攻擊,而是內部監控系統出現故障,致使其「系統」失效,影響多個服務啟動與負載均衡。
後續 AWS 表示「已全面緩解底層DNS問題,大部分服務恢復正常」但仍有部分服務遲緩或功能受限。
一畝三分地網站也有網友技術性的討論原因⬇️
圖源一畝三分地APP 版權屬於原作者
故障發生約三小時後,亞馬遜網路服務 (AWS) 表示已開始恢復,但部分用戶仍存在問題。
網路安全專家 Mike Chapple 表示,「緩慢而坎坷的恢復過程」是「完全正常的」。
他說,隨著工程師們對雲計算基礎設施進行修復,這一過程可能會引發較小的中斷。