繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

3 人團隊忙不過來造成存儲硬件燒燬,微軟承認旗下 Azure 園區「人力安排不足」

2023-09-05 13:36

IT之家 9 月 5 日消息,微軟旗下 Azure 澳大利亞數據中心園區上周經歷了一次大規模故障,數據中心的電力供應能力下降導致兩個數據大廳的冷卻設備斷電,由於員工人數「不足」難以應對,最終導致部分存儲硬件被燒燬,包括澳大利亞昆士蘭銀行和捷星航空在內的大型企業客户服務完全中斷。

本文引用地址:

▲ 捷星航空當時發佈的服務中斷報告

▲ 捷星航空當時發佈的服務中斷報告

微軟承認現場沒有足夠的工作人員,而且其應急程序也沒有考慮到問題的規模,在事故發生時,數據中心只安排了 3 名工作人員,他們都相當盡責地 「執行了記錄在案的應急操作程序 (EOP),但最終沒取得有成功」。

▲ 圖源 微軟針對事件發佈的報告(PIR)

▲ 圖源 微軟針對事件發佈的報告(PIR)

IT之家經過查詢得知,兩個受影響數據大廳的冷卻能力 「由七個冷卻器組成,其中五個冷卻器處於運行狀態,兩個冷卻器處於備用狀態(N+2)」。電源下陷(電壓驟降)導致五個運行中的冷卻器出現故障。

微軟聲稱,「園區因人員配備不足從而導致了這次事故,在‘更好地瞭解根本問題並採取適當的緩解措施’之前,工作人員安排數量目前從 3 人臨時增至 7 人。」,微軟還將調整相關應急預案和日常工作流程,降低此類事件再次發生的可能性。

▲ 圖源 微軟針對事件發佈的報告(PIR)

▲ 圖源 微軟針對事件發佈的報告(PIR)

據悉,這次事故影響了使用 Azure 的七家大型企業客户,其中五家為「標準」級別,兩家為「高級」級別,微軟表示,裝載有企業客户存儲內容的硬件「因數據大廳温度過高而損壞」,除了企業客户重大損失外,該數據中心旗下託管的 25 萬多個 SQL 數據庫也發生了故障,根據微軟 PIR 報告,當下相關數據恢復工作已經大致完成。

▲ 圖源 微軟針對事件發佈的報告(PIR)

▲ 圖源 微軟針對事件發佈的報告(PIR)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。