今天,Amazon Web Services, Inc. (AWS) 宣布全面推出由 GPU 驅動的全新 Amazon Elastic Compute Cloud (Amazon EC2) 實例,即 G4 實例。 這個新實例旨在加速機器學習 (ML) 推理,同時為應用程序提供業界最具成本效益的 ML 推理。 新實例還非常適合以經濟高效的方式處理圖形密集型工作負載,非常適合構建和運行圖形密集型應用程序,例如遠程圖形工作站、視頻轉碼、逼真設計和雲端遊戲流.
今天,Amazon Web Services, Inc. (AWS) 宣布全面推出由 GPU 驅動的全新 Amazon Elastic Compute Cloud (Amazon EC2) 實例,即 G4 實例。 這個新實例旨在加速機器學習 (ML) 推理,同時為應用程序提供業界最具成本效益的 ML 推理。 新實例還非常適合以經濟高效的方式處理圖形密集型工作負載,非常適合構建和運行圖形密集型應用程序,例如遠程圖形工作站、視頻轉碼、逼真設計和雲端遊戲流.
AWS 聲明 ML 涉及兩個需要計算的過程——訓練和推理。 訓練需要使用標記數據來創建能夠進行預測的模型,這是一項需要強大處理器和高速網絡的計算密集型任務。 推理是使用經過訓練的機器學習模型進行預測的過程,這通常需要同時處理大量小型計算作業。 這項工作非常適合 NVIDIA 強大的 GPU。 AWS 對 ML 實例並不陌生,兩年前首次推出 P3 實例。 雖然這是一大步,但推理佔據了 ML 工作負載的大部分運營成本。
為了解決這個問題,AWS 發布了新的 G4 實例,它利用最新一代 NVIDIA T4 GPU、定制的第二代英特爾至強可擴展 (Cascade Lake) 處理器、高達 2 Gbps 的網絡吞吐量和高達 100TB 的本地 NVMe 存儲,以為機器學習推理提供最具成本效益的 GPU 實例。 新的 G1.8 實例可以提供高達 4 TFLOPs 的混合精度性能,非常適合推理。 G65 還可以經濟高效地用於對訓練時間不太敏感的小規模和入門級機器學習訓練工作。 對於圖形密集型工作負載,與上一代 G4 實例相比,新實例的圖形性能提高了 1.8 倍,視頻轉碼能力提高了 2 倍。
庫存情況
G4 實例可作為按需實例、預留實例或 Spot 實例購買。