ホーム Enterpriseクラウド OVHcloud US GPU サーバーのレビュー

OVHcloud US GPU サーバーのレビュー

by ジョーダン・ラナス
OVHcloud データセンター

進化を続ける人工知能 (AI) 開発の状況において、クラウド トレーニングは AI モデルの作成、洗練、展開の方法に革命をもたらしました。リモート クラウド インフラストラクチャを使用して AI モデルをトレーニングする方法であるクラウド トレーニングは、AI 開発をスケーラビリティ、効率、アクセシビリティの新しい領域に推進する多くの利点をもたらします。

進化を続ける人工知能 (AI) 開発の状況において、クラウド トレーニングは AI モデルの作成、洗練、展開の方法に革命をもたらしました。リモート クラウド インフラストラクチャを使用して AI モデルをトレーニングする方法であるクラウド トレーニングは、AI 開発をスケーラビリティ、効率、アクセシビリティの新しい領域に推進する多くの利点をもたらします。

クラウド コンピューティングの力を活用することで、組織や開発者は、AI トレーニング プロセスを合理化し、これまで達成できなかった方法でイノベーションを加速するさまざまなメリットを引き出すことができます。簡単なスケーラビリティから特殊なハードウェアの利用まで、クラウド トレーニングにより、AI 実践者は複雑な課題に機敏に対処し、モデルの可能性を最大限に活用できるようになります。

OVHcloud US GPU サーバーのロゴ

OVHcloud US とは何ですか?

あまり知られた名前ではありませんが、OVH グループの米国拠点である OVHcloud US は、ベア メタル サーバー、ホスト型プライベート クラウド、およびハイブリッド クラウド ソリューションを提供しています。同社のソリューションは、ビデオ ゲーム専用サーバーから、大企業向けのオーダーメイドのホスト型プライベート クラウド サービスまで、あらゆるものをカバーしています。このレビューでは、同社のパブリック クラウド コンピューティング サービス、特に NVIDIA Tesla V100S GPU を搭載した GPU クラウドについて調査します。これらの GPU インスタンスは、必須の機械学習、生成 AI、特定の AI モデルのトレーニングなど、並列処理の恩恵を受けるあらゆる用途向けに設計されています。

今日見ていきたい重要なことの 1 つは、クラウドベースの GPU 処理とオンプレミス ソリューションの利点です。確かにどちらにも議論の余地はありますが、OVHcloud US は、たとえそれが個人またはビジネスの AI への取り組みを開始するためだけであっても、クラウドに移行するためのいくつかの説得力のある理由を提供します。

主なセールスポイントは間違いなく価格です。 0.88 GB の VRAM、100 個の仮想コア、32 GB のメモリを搭載した 14 台の Tesla V45S が XNUMX 時間あたり XNUMX ドルから始まるため、オンプレミス ソリューションのコストに近づく前に、数千時間のサイクルを使用することが可能です。さらに、AI モデルの時折の再トレーニングなどのために、既存の社内 GPU マシンをクラウドベースのインスタンスで補完することで、費用対効果も得られます。

OVHcloud US GPU サービスは次のインスタンスに分類されます。

名前 メモリ 仮想コア GPU Storage 公共のネットワーク 私設ネットワーク 料金/時間
t2-45 45 GB 14 テスラ V100S 32GB 400 GB SSD 2 Gbps 4 Gbps $2.191
t2-90 90 GB 28 2x テスラ V100S 32 GB 800 GB SSD 4 Gbps 4 Gbps $4.38
t2-180 180 GB 56 4x テスラ V100S 32 GB 50 GB SSD + 2 TB NVMe 10 Gbps 4 Gbps $8.763
t2-le-45 45 GB 14 テスラ V100S 32GB 300 GB SSD 2 Gbps 4 Gbps $0.88
t2-le-90* 90 GB 30 テスラ V100S 32GB 500 GB SSD 4 Gbps 4 Gbps $1.76
t2-le-180* 180 GB 60 テスラ V100S 32GB 500 GB SSD 10 Gbps 4 Gbps $3.53

*新しくリリースされました

OVHcloud US GPU サーバー ハードウェア

OVHcloud US が提供するハードウェア オプションを詳しく見てみましょう。 GPU インスタンスの中核となるのは、100 GB の HBM32 メモリを備えたコンピューティング用に最適化された GPU である NVIDIA Tesla V2S です。新しい Tesla A100 が主にこれらの GPU に取って代わりましたが、V100S は依然として優れたパフォーマンスと価値を提供します。

これらのインスタンスの最も重要な点は、クラウドベースであるため、オンサイトにあるシステムを拘束せず、「設定したらあとは忘れる」ワークフローにとって理想的なソリューションとなることです。これらの GPU は、仮想化レイヤーを使用せずに PCI パススルー経由でインスタンスに直接配信され、各カードを作業専用に使用できるようになります。
OVHcloud US GPU サーバー GPU の詳細CPU 側では、どの特定の SKU を入手できるかは明記されていませんが、すべてのコアで少なくとも 2.2 GHz が保証されており、これはほとんどのアプリケーションにとって十分な速度です。私たちの特定のインスタンスでは、6226 スレッドのうち 14 スレッドが利用可能な Intel Xeon Gold 32R があると報告されました。仮想コア数の範囲は 14 ~ 56 です。

OVHcloud US は、ユースケースで必要な場合に、より高速な CPU を備えたさまざまなオプションを提供します。メモリのオプションは 45 GB から最大 180 GB まであり、GPU を中心としたほとんどのワークフローには十分です。同じ考え方がストレージにも当てはまり、300GB から最大 2TB の専用 NVMe ドライブまでの容量を備えています。

OVHcloud US GPU サーバー – 人気の AI ユースケース

開発

インスタンスのスピンアップと実行は十分に高速かつ安価であるため、OVHcloud はカジュアルな開発者でもまともな GPU を使って遊ぶことができるという説得力のある主張をしています。理論的には、すべてのトレーニング データをローカルで作成し、選択したクラウド データ プロバイダーにロードし、インスタンスを起動して、オンラインで利用可能なさまざまなモデルのトレーニング/微調整を開始できます。

このシナリオの厳密なテストを通じて、私たちはさまざまな洗練された機能を開発しました。 ラマ Alpaca コードと Huggingface 変換された重みを利用してフレーバーを作成します。これらのフレーバーは、デバイス上でシームレスに準備し、Google ドライブに簡単にアップロードし、インスタンスに簡単にダウンロードして、専門的に微調整することができます。現在、私たちは手持ちの 32 GB の VRAM 内に収まるようにパラメータの低いモデルを使用していますが、それでも、RTX8000 のような同等のカードを購入してホームラボに放り込むよりもはるかに管理しやすいオプションでした。

中小企業はこの戦略を利用して、ハードウェアや多額の予算の承認を待つことなく、開発者やチームが今すぐ GPU コンピューティングにアクセスできるようにすることができます。

推論

V100S は、メモリに収まる LLM を推論するための優れた GPU です。推論時間は ChatGPT などのサービスで得られるものとは異なりますが、そのトレードオフには独自のプライベート モデルを実行するという特典が伴います。いつものように、24 時間年中無休の稼働時間でクラウド サービスを実行するにはコストがかかりますが、オンプレミスで実行するために必要なインフラストラクチャに近づくには、現在の 7 時間あたり 0.88 ドルでインスタンスを実行すると何か月もかかるでしょう。

画像認識

画像からデータを抽出して分類したり、要素を識別したり、より充実したドキュメントを作成したりすることは、多くの業界の要件です。 Caffe2 のようなフレームワークと Tesla V100S GPU を組み合わせることで、医療画像、ソーシャル ネットワーク、公的保護、セキュリティがより利用しやすくなります。

状況分析

場合によっては、さまざまで予測不可能な状況に直面して適切な対応が期待される場合、リアルタイム分析が必要になります。たとえば、この技術は自動運転車やインターネット ネットワークのトラフィック分析に使用されます。ここでディープラーニングが登場し、トレーニングを通じて独立して学習するニューラルネットワークを形成します。

人的交流

かつて、人々は機械とコミュニケーションすることを学びました。私たちは今、機械が人とコミュニケーションすることを学ぶ時代にいます。音声認識であっても、音声やビデオによる感情認識であっても、TensorFlow などのツールはこれらのインタラクションの限界を押し広げ、多くの新しい用途を開拓します。

実践的な印象

OVHcloud Linux ディストリビューションの選択

OVHcloud US ポータルは直感的に操作でき、セットアップも簡単でした。アカウントを作成し、支払い方法を追加し、いくつかの SSH キーを作成し、インスタンスを選択し、Red Bull を取得して、新しい GPU ボックスに SSH 接続します。ここでは Ubuntu Server を使用しましたが、Fedora、Arch、Debian CenOS、AlmaLinux、Rocky などの Linux バージョンとフレーバーでは他のオプションも利用できます。

Docker などのアプリを含むさまざまな OS イメージをインストールするオプションもあります。

OVHcloud Unix 選択リスト

OVHcloud US GPU サーバーを実際に使ってみると、そのエクスペリエンスが信じられないほどユーザー フレンドリーで応答性が高いことがわかりました。インスタンスのセットアップは簡単で、GPU リソースへのアクセスは事実上シームレスでした。複雑な機械学習モデルをテストする場合でも、大規模なデータ処理タスクを処理する場合でも、OVHcloud US の GPU インスタンスは驚くべきパフォーマンスを実証しました。

さらに、リソースを柔軟に拡張できるため、特定のニーズに合わせて環境をカスタマイズすることができました。ユーザー インターフェイスから基盤となるハードウェアに至るまで、すべてがスムーズで効率的なワークフローを促進するように設計されています。さまざまな人気の AI フレームワークのサポートと NVIDIA Tesla V100S GPU のパワーの組み合わせにより、実験、モデルのトレーニング、推論が可能になっただけでなく、非常に効果的なものになりました。

これらのクラウドベースのソリューションで社内リソースを強化できるため、OVHcloud US は、AI の最初の一歩を踏み出す初心者と、信頼性が高くコスト効率の高いソリューションを求める熟練の専門家の両方にとって魅力的な選択肢であることがわかりました。

CPU 割り当てパフォーマンスと V100 実装をテストするために、いくつかのベンチマークを実行しました。最初に Blender-CLI ベンチマークを使用し、次にお気に入りの CPU ベンチである y-cruncher を使用しました。

GPUモンスター 1112.95022
GPU ジャンクショップ 754.813874
GPU教室 603.196188
CPUモンスター 113.467036
CPUジャンクショップ 62.223543
CPU教室 50.618349
y-クランチャー 1b
40.867 seconds
y-クランチャー 2.5b
113.142 seconds

t2-45le インスタンスはテストの結果、仕様と一致する結果をもたらし、パフォーマンス メトリクスに驚くべき点が見られませんでした。 V100 が搭載されているため、集中的な推論タスクを処理でき、パフォーマンスとコストの両方の観点からクラウドベースのトレーニング操作を効果的にサポートできることは明らかです。

閉じた思考

エンタープライズ IT のあらゆるものと同様に、長所と短所があります。クラウドトレーニングAIにも同じことが当てはまります。 OVHcloud US GPU サーバーを使用したクラウド トレーニングは、スケーラビリティ、コスト効率、開発の加速を実現し、イノベーションと実験への扉を開きます。特殊なハードウェア、グローバルなアクセス性、シームレスなコラボレーションにより、クラウドベースの AI は画期的な発見を可能にします。

OVHcloud データセンター

OVHcloud データセンター

これらの利点は、データ セキュリティの懸念とネットワークの安定性という現実と並行して存在します。潜在的に急峻な学習曲線に対処するため、AI のクラウド トレーニングは慎重な側面を持って取り組む必要があり、組織に固有のニーズと優先事項に沿った戦略的な方針を立てるよう警告します。

ここでは特定の GPU サーバーについてのみ触れましたが、OVHcloud US には包括的なサービス セットがあります。全体的にサポートはフレンドリーで、最初のサインアップ後にサポートが必要かどうかを確認するためにフォローアップしてくれました。ポータルは直感的で使いやすく、理解しやすく、システムは期待どおりに動作しました。唯一の欠点はリージョンが不足していることかもしれませんが、コストとシンプルさを考えると、それは簡単に見落とされます。 OVHcloud US は確かな推奨を得ており、研究室の外で、または仕事を遂行するために追加の馬力を少し借りる必要がある将来のプロジェクトのための潜在的なクラウド プロバイダーとして私たちの懐に入るつもりです。

この動的な状況を乗り越えるには、バランスの取れた視点で AI のクラウド トレーニングにアプローチし、課題に現実的に対処しながら機会を活用することが不可欠です。創意工夫と実用性を特徴とする卓越した AI への道のりは、これらの長所と短所の複雑な相互作用を理解し、前者を活用しながら後者を軽減する戦略を立てることによって形成されます。

OVHcloud 米国

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード