繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

亞馬遜雲科技宣佈Amazon EC2 P5e實例正式可用

2024-09-18 14:11

亞馬遜雲科技宣佈由英偉達H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)實例現已正式可用。亞馬遜雲科技是首個將英偉達H200GPU用於生產環境的領先雲提供商。與基於英偉達H100 GPU的Amazon EC2 P5實例相比,Amazon EC2 P5e實例GPU內存容量提升1.7倍,GPU內存寬帶提升1.5倍。Amazon EC2 P5e非常適用於複雜的大型語言模型(LLM)和多模態基礎模型(FM)的訓練、微調和推理,用於支持最苛刻和計算密集型的生成式AI應用,如問答、代碼生成、視頻和圖像生成、語音識別等。

Amazon EC2 P5e實例提供8個英偉達H200 GPU,具有1128GB高帶寬GPU內存,同時提供第三代AMD EPYC處理器,2TB系統內存和30TB本地NVMe存儲。Amazon EC2 P5e實例還提供3200Gbps的聚合網絡帶寬並支持GPUDirect RDMA,從而能夠繞過CPU進行節點間通信,實現更低的延迟和高效的橫向擴展性能。Amazon EC2 P5e實例具有的更高的內存帶寬、更大的GPU內存容量和對更大的batch sizes的支持,從而顯著提升客户工作負載的性能、降低成本並簡化運營。

Amazon EC2 P5e實例現已可通過Amazon EC2 Capacity Block for ML工具訪問並在美國東部(俄亥俄州)區域正式可用。

此外,亞馬遜雲科技還宣佈將推出Amazon EC2 P5en實例,通過將英偉達H200 GPU與定製的第四代英特爾Xeon可擴展處理器相結合支持PCle Gen5,將提供高達四倍的CPU和GPU之間的帶寬,降低網絡延迟,進一步提高工作負載性能。

(9007273)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。