À propos Entreprise Instances AWS EC2 Trn1 désormais disponibles

Instances AWS EC2 Trn1 désormais disponibles

by Lyle Smith
Instance AWS Trn1 - mise à l'échelle ultracluster

Amazon Web Services (AWS) a annoncé la disponibilité générale des instances AWS EC2 Trn1. Propulsées par des puces Trainium conçues par AWS, les instances Trn1 sont spécifiquement conçues pour la formation haute performance des modèles d'apprentissage automatique (dans le cloud), Amazon indiquant une réduction de 50 % des économies de « coût de formation » par rapport à un GPU similaire. instances basées sur .

Amazon Web Services (AWS) a annoncé la disponibilité générale des instances AWS EC2 Trn1. Propulsées par des puces Trainium conçues par AWS, les instances Trn1 sont spécifiquement conçues pour la formation haute performance des modèles d'apprentissage automatique (dans le cloud), Amazon indiquant une réduction de 50 % des économies de « coût de formation » par rapport à un GPU similaire. instances basées sur .

AWS EC2 Trn1 - mise à l'échelle ultracluster

Les instances AWS EC2 Trn1 fournissent le temps le plus rapide pour former des modèles de machine learning populaires sur AWS. Cela permet à leurs clients de réduire les temps de formation, d'itérer rapidement sur des modèles pour augmenter la précision et d'améliorer la productivité globale pour des charges de travail telles que le traitement du langage naturel, la reconnaissance de la parole et des images, la recherche sémantique, les moteurs de recommandation, la détection des fraudes et les prévisions.

Les instances Trn1 sont également très flexibles en ce qui concerne la tarification, car il n'y a pas d'engagement minimum ni de frais initiaux. Les clients ne doivent également payer que la quantité de calcul qu'ils utilisent.

Tailles et spécifications des instances AWS EC2 Trn1

Nom de l'instance vCPU Puces AWS Trainium Mémoire de l'accélérateur NeuroneLink Mémoire d'instance Mise en réseau d'instances Stockage d'instance locale
trn1.2xlarge 8 1 32 GB N/D 32 GB Jusqu'à 12.5 Gbit / s 1x 500 Go NVMe
trn1.32xlarge 128 16 512 GB Appareils 512 GB 800 Gbps 4x 2 To NVMe

Auparavant, même si les entreprises exploitaient les instances accélérées les plus rapides disponibles, la formation de modèles d'apprentissage automatique plus complexes était encore à la fois excessivement coûteuse et chronophage. Avec les nouvelles instances AWS EC2 Trn1, Amazon indique qu'ils offrent les meilleures performances de prix et la formation de modèle d'apprentissage automatique la plus rapide sur AWS.

Les autres caractéristiques notables sont les suivantes :

  • Ceux qui cherchent à démarrer sans modifier de manière significative le code peuvent utiliser AWS Neuron, le kit de développement logiciel (SDK) pour les instances Trn1. Il est également intégré dans des frameworks populaires pour l'apprentissage automatique comme PyTorch et TensorFlow.
  • Les instances Trn1 comportent jusqu'à 16 accélérateurs AWS Trainium spécialement conçus pour déployer des modèles d'apprentissage en profondeur.
  • Pour améliorer l'efficacité, Trn1 est la première instance Amazon EC2 à offrir jusqu'à 800 Gbps de bande passante réseau via le 2nd-gen Interface réseau AWS Elastic Fabric Adapter (EFA).
  • Pour accélérer la formation, les instances Trn1 utilisent également NeuronLink, une interconnexion intra-instance à haut débit.

Amazon EC2 UltraClusters

Les clients peuvent déployer des instances Trn1 dans Amazon EC2 UltraClusters (composés de dizaines de milliers d'accélérateurs Trainium) pour former rapidement les modèles d'apprentissage en profondeur les plus complexes, même ceux comportant des billions de paramètres. Avec EC2 UltraClusters, les organisations ont la possibilité de faire évoluer la formation des modèles d'apprentissage automatique avec jusqu'à 30,000 XNUMX accélérateurs Trainium interconnectés avec le réseau EFA à l'échelle du pétabit. Amazon indique que ces organisations auront donc accès à la demande à des performances de classe superinformatique, ce qui peut réduire considérablement le temps de formation qui prend généralement des mois à quelques jours seulement.

Chaque instance AWS EC2 Trn1 prend en charge jusqu'à 8 To de stockage SSD NVMe local rapide, tandis qu'AWS Trainium prend en charge un large éventail de types de données (FP32, TF32, BF16, FP16 et FP8 configurable). Il prend également en charge l'arrondi stochastique, une méthode basée sur la probabilité, pour permettre des performances élevées et une plus grande précision. De plus, AWS Trainium prend en charge les formes de tenseurs dynamiques et les opérateurs personnalisés, ce qui favorise une infrastructure flexible conçue pour s'adapter en fonction des besoins de formation des clients.

Système AWS Nitro

Les instances Trn1 sont construites sur le système AWS Nitro, un ensemble d'innovations matérielles et logicielles conçues par AWS qui rationalisent la fourniture d'une mutualisation isolée, d'un réseau privé et d'un stockage local rapide. Afin de fournir les performances nécessaires, le système Nitro décharge les fonctions de virtualisation, de stockage et de mise en réseau du processeur vers du matériel et des logiciels dédiés.

Disponibilité des instances AWS EC2 Trn1

Les instances AWS Trn1 peuvent désormais être achetées en tant qu'instances à la demande (avec plans d'économies), instances réservées ou instances ponctuelles. Actuellement, ils sont disponibles dans USA Est (Virginie du Nord) et USA Ouest (Oregon), avec une disponibilité bientôt étendue dans d'autres régions AWS.

Ils seront également disponibles via les autres services AWS suivants :

  • Amazon Sage Maker
  • Service Amazon Elastic Kubernetes (Amazon EKS)
  • Amazon Elastic Container Service (Amazon ECS)
  • Lot AWS

Instances AWS Trn1

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS