NVMe SSD はデータセンターを引き継ぎ、ミッションクリティカルなアプリケーションにとって頼りになるテクノロジーとしての地位を急速に固めています。 NVMe インターフェイスにより、フラッシュを自由に実行でき、SATA および SAS インターフェイスの従来のボトルネックを回避できます。ただし、フラッシュ フラッドゲートを削除すると、従来の HBA/RAID カード サーバー レイアウトでは簡単に解決できないアーキテクチャ上の新たな課題が生じます。 Intel は、サーバー内の NVMe SSD を管理するための簡素化されたソリューションでこの問題に対処しました。 CPU 上の仮想 RAID (略して Intel VROC) では、基本的に SSD が CPU に直接アクセスできるようになり、HBA の必要性が完全になくなります。これにより、サーバー内の NVMe SSD を最大限に活用するために必要なデータ パスとコンポーネントの両方が大幅に簡素化されます。エンタープライズ グレードの RAID に加えて、Intel VROC には、起動前 RAID 管理、ホットプラグ サポート、LED 管理など、企業が要求する予想される保守性が含まれています。
NVMe SSD はデータセンターを引き継ぎ、ミッションクリティカルなアプリケーションにとって頼りになるテクノロジーとしての地位を急速に固めています。 NVMe インターフェイスにより、フラッシュを自由に実行でき、SATA および SAS インターフェイスの従来のボトルネックを回避できます。ただし、フラッシュ フラッドゲートを削除すると、従来の HBA/RAID カード サーバー レイアウトでは簡単に解決できないアーキテクチャ上の新たな課題が生じます。 Intel は、サーバー内の NVMe SSD を管理するための簡素化されたソリューションでこの問題に対処しました。 CPU 上の仮想 RAID (略して Intel VROC) では、基本的に SSD が CPU に直接アクセスできるようになり、HBA の必要性が完全になくなります。これにより、サーバー内の NVMe SSD を最大限に活用するために必要なデータ パスとコンポーネントの両方が大幅に簡素化されます。エンタープライズ グレードの RAID に加えて、Intel VROC には、起動前 RAID 管理、ホットプラグ サポート、LED 管理など、企業が要求する予想される保守性が含まれています。
インテル VROC をより深く理解するには、インテル ボリューム管理デバイス (インテル VMD) と呼ばれる別のテクノロジーを理解することが重要です。最新のインテル Xeon スケーラブル プロセッサーと互換性のあるインテル VMD は、CPU PCIe ルート コンプレックス内の統合コントローラーです。最終的な結果として、Intel VMD は、接続された NVMe SSD に対して多かれ少なかれ仮想 HBA を有効にします。 Intel VMD は、信頼性を犠牲にすることなく簡素化された重要なドライブ保守機能を提供するため、これは重要です。 Intel VMD のおかげで、サービスを中断したり再起動したりすることなく、NVMe SSD をホットスワップできます。 Intel VMD は、PCIe バスの挿入および取り外しイベントを RAID ストレージ対応ドライバーにリダイレクトし、これらのイベントを処理し、自動再構築を開始します。障害が発生した場合には、どのドライブを取り外せばよいかを把握することも重要ですが、数十、数百のドライブがあり、ベンダーのドライブ ベイのラベル付け方法が一貫していないデータ センターでは、これが難しい場合があります。 Intel VMD は、SATA および SAS ドライブが長年使用してきたドライブ ライト仕様に準拠した NVMe LED 管理をサポートしているため、必要なときに SSD を簡単に識別して保守できるようになります。 Intel VMD は業界でも広くサポートされており、たとえば VMware は、vSAN での NVMe SSD の管理のサポートを含む VMware ESXi 6.7 リリースで Intel VMD NVMe ドライバーをネイティブにサポートしています。
Intel VROC は Intel VMD 上に構築されており、NVMe SSD RAID を実現します。現在、12 つの Xeon スケーラブル CPU で最大 6 台の NVMe 直接接続ドライブと最大 24 台の RAID アレイをサポートできます。デュアルプロセス システムはそれぞれ 12 と 48 をサポートします。ただし、CPU はスイッチを利用して、システム内で最大 XNUMX 台の SSD をサポートできます。 Intel VROC は、NVMe ドライブではこれまで実現が困難であったデータ ボリュームとブート ボリュームをサポートします。 RAID 設定は BIOS または CLI を介して構成でき、インテルは RESTful エージェントを介してローカルまたはリモートでの管理をサポートします。
Intel VROC は物理キーとして販売されます。 0 つの SKU が利用可能です。標準では、サードパーティ製 SSD をサポートする RAID 1/10/3 をサポートします。プレミアム ライセンスでは、RAID5 のサポートが追加されます。 Intel SSD のみのライセンスもあります。これは、名前が示すように、Intel ドライブのみをサポートしますが、あらゆる RAID オプションを提供します。
ライセンス、NVMe SSD、Xeon スケーラブル CPU に加えて、互換性のあるサーバーが必要です。 Intel VROC は広くサポートされていますが、一部のサーバー ベンダーは、この最新の代替手段よりもドライブの管理に独自のカードベースのテクノロジーを優先しています。このレビューでは、ストレージ サーバー製品群全体で Intel VROC をサポートする EchoStreams と提携しました。
このような小さな箱の場合、 EchoStreams FlacheSAN1N10U-D5 非常に柔軟です。この構成では、サーバーにはツイン Intel 8180M CPU、64GB RAM、および 2 つの XNUMXTB が装備されています。 インテル DC P4510 NVMe SSD。このサーバーには 16 つの x3.0 PCIe 160 スロットがあり、ユーザーは最大 10TB の NVMe フラッシュ (16x 100TB SSD) と XNUMX つの XNUMXGbps イーサネット NIC による内部ストレージ容量の可能性を最大限に活用できます。
シャーシ設計により、両方の CPU、NVMe SSD、送信 NIC 間の対称レイアウトも可能になります。ホワイトボックス製品として、シャーシはエンド ユーザー向けにカスタマイズすることもでき、15mm および 7mm U.2 などの他の SSD サイズ、内蔵 M.2 SSD および Intel Optane をサポートします。最後に、サーバーはデュアル 850 W AC 電源装置を使用して構成することも、48VDC 高効率電源装置をサポートするようにセットアップすることもできます。私たちの構成にハイエンドの Intel CPU が含まれていることを考えると、より大きな電源が役に立ちました。
FlacheSAN1N10U-D5 が価値を追加できる場所に注目すると、EchoStreams は主な使用例としてコンテンツ配信ネットワーク (CDN) を指摘しています。現在、顧客はこれらのノードをデータセンターまたはエッジロケーションのキャッシングデバイスとして使用し、人気のコンテンツをエンドユーザーに配信しています。また、計算能力とストレージ スループットが複雑な問題を解決する上で重要な利点となる HPC および研究用途にこのプラットフォームを活用している大学もいくつかあります。これらのシナリオを超えて、このサーバーはメディアやエンターテイメントのポストプロダクション ワークフローにも適しており、NVMe ストレージや高速ネットワーキングのメリットを享受できるソフトウェア デファインド ストレージ製品との組み合わせにも適しています。
EchoStreams FlacheSAN1N10U-UN 仕様
フォームファクター | 1U |
CPU | デュアルソケット LGA3647 Intel Xeon スケーラブルプロセッサをサポート |
チップセット | Intel C622 |
RAM | DDR4 最大 1.5TB RDIMM/RDIMM/LRDIMM 2666/2400 MHz |
DIMMスロット | 最大16 |
ドライブベイ |
|
I / Oインタフェース |
|
拡張スロット |
|
バックプレーン | 5 x 2 ベイ NVMe バックプレーン |
サポートされるOS |
|
出力 |
|
物理的な |
|
環境 |
|
,war
使いやすさと展開
マザーボードには Intel VROC を設定するための派手な GUI はありませんが、確かにユーザーフレンドリーです。コンソールから mdadm コマンドを使用することに慣れている IT 管理者にとって、インテル VROC はバックエンド作業の多くを自動化し、セットアップを簡素化します。追加機能は満載ではありませんが、ほとんどの IT プロフェッショナルにとって使用するのは難しくありません。 BIOS 画面から、ユーザーは使用可能な物理ディスクを確認しながら RAID ボリュームを設定できます。
次に、ボリュームに名前を付け (この場合は volume0)、RAID レベルを選択して、両方の Intel VMD コントローラーにまたがる RAID を有効にします。
RAID が設定されると、RAID ボリュームの削除や起動可能にするなどのボリューム アクションを確認できます。
最後に、ユーザーは非 RAID へのリセットやディスクから RAID データの削除などのディスク操作を実行できます。
CentOS 7.4 環境でシステムが稼働すると、RAID ボリュームの構成の準備が整い、待機状態になります。 RAID5/10 ボリュームの場合は、バックグラウンド初期化の進行状況を mdstat で監視することも、必要に応じて RAID グループ全体を手動で変更することもできます。 BIOS レベルのセットアップにより、RAID を立ち上げて実行するための作業の大部分が軽減されますが、追加レベルのカスタマイズを必要とするユーザーがそれを削除したり交換したりすることはありません。
パフォーマンス
VDBench ワークロード分析
ストレージ アレイのベンチマークに関しては、アプリケーション テストが最適であり、合成テストは 2 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。これらのワークロードは、「4 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。
プロフィール:
- 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% iorate
- 4K ランダム書き込み: 100% 書き込み、64 スレッド、0 ~ 120% iorate
- 64K シーケンシャル読み取り: 100% 読み取り、16 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、8 スレッド、0 ~ 120% iorate
- 合成データベース: SQL および Oracle
- VDI フル クローンおよびリンク クローン トレース
この一連の VDBench テストでは、通常のテストを実行しますが、1 つのデバイス (SSD、サーバー、アレイなど) の代わりに、両方の CPU でバランスのとれた複数の構成を実行します。
- JBOD に 8 ドライブ
- RAID0 内の XNUMX 台の SSD からなる XNUMX つのグループ
- RAID5 内の XNUMX 台の SSD からなる XNUMX つのグループ
- RAID10 の XNUMX 台の SSD からなる XNUMX つのグループ
以下に示すデータは、各構成で使用される 8 台の SSD の合計です。このデータは、インテル VROC がサポートするさまざまな構成でこのプラットフォームがどのような機能を備えているかを強調することを目的としています。パリティの計算と更新が複雑なため、このレビュー全体を通じて RAID5 の方が書き込みパフォーマンスが低く、RAID レベルの比較に基づいて予想されることに注意してください。
4K ピークのランダム パフォーマンスでは、すべての RAID グループの遅延を 1 ミリ秒未満に抑えることができました (実際、すべてのグループは 210 μ秒未満でした)。すべてのグループは 2.5 万から 3 万 IOPS で終了し、最高のパフォーマンスは JBOD グループの 2,944,335 IOPS、レイテンシー 163μs でした。
4K ランダム書き込みでは、異なる RAID グループと同様の統一性が見られませんでした。 RAID5 グループのパフォーマンスは最も低く、ピーク値は 21,921 IOPS、遅延は 936.7 ミリ秒でした。他の RAID グループのパフォーマンスは向上し、RAID0 グループのピークは 1,879,180 IOPS、遅延は 1.35 ミリ秒でした。
シーケンシャルワークロードに切り替えると、64K 読み取りでは、すべての RAID グループがミリ秒未満のレイテンシで強力にスタートし、JBOD のみが 1K IOPS または 330GB/s 付近で 22ms を超え、わずか 363,203 のレイテンシで 22.7 IOPS または 1.4GB/s でピークに達することが示されました。 MS。
再び書き込みを行うと、RAID グループが分割され、パフォーマンスが大きく異なります。再び、RAID5 グループは 25 ミリ秒のレイテンシで 4.3 IOPS 付近で減り、RAID0 は 124,104 μs のレイテンシで 958 IOPS に達しました。
次は SQL ワークロードです。すべての RAID グループの遅延パフォーマンスは、約 1.4 万 IOPS までミリ秒未満でした。ここでは、RAID5 グループの遅延が急増し、パフォーマンスが低下しました。他の 1 つのグループは、すべて 2 万 IOPS を突破するまで、0 ミリ秒未満で継続しました。最高の数値は再び RAID2,519,727 グループに与えられ、1.45 ミリ秒の遅延で XNUMX IOPS のピーク パフォーマンスを実現しました。
SQL 90-10 では、RAID5 グループのレイテンシ プロファイルが向上し、ピークは 302μs でしたが、そのピーク パフォーマンスは 436,439 IOPS にすぎませんでした。他のグループは、1.5ms を切る前に 1 万 IOPS を超え、JBOD グループと RAID10 グループの両方がその直後にピークに達しました。 RAID0 グループのピークは 2,135,362 IOPS、遅延は 1.54 ミリ秒でした。
SQL 80-20 では、RAID5 グループのレイテンシはミリ秒未満で、他のグループと比較してパフォーマンスは低く、345 μs ~ 212,980 IOPS でした。他のグループは 1ms 未満で 1 万 IOPS を超え、JBOD と RAID10 はその直後に再びピークに達し、RAID0 は 1,753,622ms の遅延で 1.7 IOPS でピークに達しました。
Oracle ベンチマークでは、当然のことながら、上記と同様の順位が得られました。 RAID5 グループは、最初に 61,695 IOPS でピークに達し、遅延は 153μs でした。他のドライブは 780 ミリ秒未満で合計約 1 IOPS に到達し、RAID10 がそれを超えてピークに達し (遅延 954,567 ミリ秒で 2.63 IOPS)、続いて JBOD (遅延 1,274,172 ミリ秒でピーク 4.2 IOPS) になりました。最後に、RAID0 グループは、最大 1,472,338 IOPS、遅延 2.18 ミリ秒を実現しました。
Oracle 90-10 では、RAID5 グループの最初のピークが 406,693 IOPS、遅延が 255μs でした。他のグループのレイテンシは 1.5 万 IOPS を超えるまでミリ秒未満で、これまで見てきたのと同じようにピークに達しました。RAID10、JBOD、および RAID0 では、2,110,799 IOPS でトップの座にあり、レイテンシは 1.55 ミリ秒でした。
Oracle 80-20 の場合、RAID5 グループのピークは 213,479 IOPS、遅延は 327μs でした。他のグループは 1 万 IOPS を超えてピークに達しましたが、RAID0 では 1.65 ミリ秒未満で 1 万 IOPS に達し、1,757,722 ミリ秒の遅延で 1.63 IOPS に達しました。
次に、VDI クローン テスト (完全およびリンク) に切り替えました。ここでは、引き続き、RAID5、RAID10、JBOD、および RAID0 のさまざまな RAID グループの配置の同じパターンが見られます。 VDI フル クローン ブートの場合、RAID5 グループは 288,613 IOPS でピークに達し、遅延は 182μs でした。他のグループはミリ秒未満のレイテンシーで約 1.2 万 IOPS に達しましたが、最初に RAID10 グループが 1,217,620 ミリ秒のレイテンシーで 2.65 IOPS に達し、続いて JBOD グループが 1,314,075 ミリ秒のレイテンシーで 4.19 IOPS、次に RAID0 グループが 1,400,765 IOPS でした。レイテンシーは2.22ミリ秒です。
VDI FC 初期ログインでは、RAID5 グループの実行時間は非常に短く、ピークは 13,296 IOPS、遅延は 286μs でした。他のドライブは、175ms を切る前に 1K IOPS に達しました。 RAID0 グループは、ミリ秒未満のレイテンシーで 390 IOPS に達し、レイテンシー 429,692 ミリ秒で 4.98 IOPS に達しました。
VDI FC 月曜日のログインでは、RAID5 グループは 15μs で 262K IOPS に達しました。他の RAID グループは 150K を超えましたが、RAID1 グループと JBOD ではそれぞれ 10 ミリ秒と 12.8 ミリ秒というかなり高い遅延が発生し、11.7 ミリ秒を割りましたが、パフォーマンスは 234,431 IOPS と 341,483 IOPS という印象的なものでした。 RAID0 グループは、435,641 IOPS と 5.67 ミリ秒の遅延で全体的に最高のパフォーマンスを示しました。
VDI リンク クローン テストに切り替えると、ブート内のすべてのグループでパフォーマンスが大幅に向上しており、RAID5 グループはピーク 543,680 IOPS および遅延 407 μs、RAID10 はピーク 782,224 で遅延 4.76 ミリ秒、JBOD はピーク 822,555 IOPS で遅延 11.52 ミリ秒でした。 RAID0 は 820,998 IOPS でピークに達し、遅延は 4.39 ミリ秒です。
VDI LC 初期ログインでは、RAID10,998 の 312 IOPS (遅延 5μs) から、RAID276,814 の 7.88 IOPS (遅延 0ms) までのピーク パフォーマンスが見られます。
最後に、VDI LC Monday Login では、RAID5 (11,591μs で 315 IOPS) が最初に終了し、次に RAID10 (ピーク時 155ms で約 1.2 IOPS)、次に JBOD (238ms ピークで約 15.8 IOPS)、そして最後に RAID0 ( 279,332 ミリ秒で 8.06 IOPS)。
結論
この 1U EchoStreams プラットフォームでの Intel VROC のパフォーマンスを調べるには、それぞれが 8 個の Intel P4510 NVMe SSD からの集約データを使用する 0 つの異なるテスト グループを調べました。 RAID5 がグループの「勝者」であると宣言するのは簡単ですが、それは RAID の仕組みによる予想された理由によるものです。パフォーマンス結果をボトムアップで見ると、冒頭で述べたように、RAID10 にはパリティ計算によるデータ冗長性のペナルティが大きく、それがデータに明確に反映されています。 RAID5 はミラーリングを使用するため、冗長性のペナルティがはるかに低くなり、結果は RAID0 に比べて大きく進歩します。このグループの後には、総合的なパススルー パフォーマンスを備えた JBOD が続きます。 RAIDXNUMX はパフォーマンスのみを重視し、データ ストライピングを通じて連携して動作するドライブを活用するため、この数字をリードしていますが、データの復元力は犠牲になっています。 RAID 機能の観点から見ると、すべてのデータは、インテル VROC が適切に実装されており、適切に設計されたプラットフォーム上で一貫した期待どおりの結果が得られるという事実を裏付けています。
すべての結果を詳細に検討する代わりに (64 つのグループを使用すると、合計 4 個の結果が生成されます)、いくつかのハイライトを見ていきます。 3K テストでは、JBOD グループは読み取りのミリ秒未満の遅延で 0 万 IOPS にほぼ達し、RAID1.9 はわずか 1.35 ミリ秒の遅延で 64 万 IOPS に達しました。 22.7K シーケンシャルでは、読み取り 7.8GB/秒、書き込み 2.5GB/秒という高い数値が確認されました。 SQL テストでは、遅延が 2.1 ミリ秒未満で、90 万 IOPS、10 ~ 1.75 で 80 万 IOPS、20 ~ 1.7 で 1.47 万 IOPS が発生しました。 Oracle では、遅延が 2.1 ミリ秒以下で、90 万 IOPS、10 ~ 1.76 年で 80 万 IOPS、20 ~ 2.18 年で 1.4 万 IOPS を達成しました。 VDI テストでは、FC ブートで 430 万 IOPS、FC 初期ログインで 436 IOPS、VDI FC 月曜日ログインで 821 IOPS、LC ブートで 277 IOPS、LC 初期ログインで 279 IOPS、LC 月曜日ログインで XNUMX IOPS を示しました。
最終的に、Intel VROC が EchoStreams などのシステム ベンダーに提供するのは、NVMe SSD で RAID を提供する簡素化された方法です。その結果、EchoStreams は、複雑さとコストを軽減しながら、優れたスループットとレイテンシーを実現できます。さらに、Intel VMD の追加機能のおかげで、EchoStreams の顧客は、NVMe SSD ホット スワップ、NVMe ドライブ ライト サポート、プリブート構成によるブート可能 RAID などの機能により、システムの保守性が向上します。前述したように、ユースケースはさまざまですが、広く利用可能な最速のストレージおよびネットワーキング インターフェイス全体でエンタープライズ グレードの RAID のメリットを享受できる CDN やその他の企業にとっては、大きな可能性があることは明らかです。
EchoStreams FlacheSAN1N10U-D5 製品ページ
StorageReview ニュースレターにサインアップする