Kingstonの新製品DC3000MEは、U.2 2.5インチフォームファクターを採用した、同社最新のエンタープライズグレードNVMe SSDです。データセンターおよびサーバークラスのワークロード向けに設計されています。PCIe 5.0 x4インターフェースを搭載し、高帯域幅のスループットと3D eTLC NANDを組み合わせることで、堅牢な信頼性と容量拡張を実現します。3.84TB、7.68TB、15.36TBの構成で提供されるこのドライブは、ハイパースケールインフラストラクチャ、AIおよびHPCクラスター、クラウドサービス、トランザクションシステムなど、高負荷環境向けに設計されています。
キングストン DC3000ME パフォーマンスプロファイル
DC3000MEは、すべての容量モデルで同一のシーケンシャルリード性能を維持しており、各SKUとも最大14,000MB/秒を実現しています。この速度は、選択した容量に関わらず、高速データアクセスに大きく依存するワークロードに最適です。ただし、シーケンシャルライト速度はモデルによって大きく異なります。3.84TBモデルは5,800MB/秒に制限されていますが、7.68TBモデルでは10,000MB/秒まで大幅に向上しています。15.36TBモデルは9,700MB/秒と、わずかに遅れをとっています。
ランダムパフォーマンスを見ると、7.68TBモデルが最速で、最大読み取りIOPSは2.8万IOPS、書き込みIOPSは500,000万IOPSに達します。これは、読み取りIOPSが3.84万IOPSに制限されている15.36TBモデルと2.7TBモデルの両方を上回っています。書き込み性能は、3.84TBモデルが300,000万IOPSにとどまり、15.36TBモデルが400,000万IOPSに達します。7.68TBモデルは、高負荷で要求の厳しいタスクの処理能力において、最も優れています。
容量あたりのパフォーマンスの観点から見ると、7.68TBモデルはスループットとIOPSのバランスが最も優れており、ログ記録、OLTPデータベース、アクティブAIモデルのトレーニングなど、書き込み負荷の高いアプリケーションに最適です。3.84TBモデルは、容量を重視せず、読み取り中心のワークロードや混合ワークロードに適していると考えられます。また、15.36TBモデルは、ピーク書き込みIOPSを犠牲にして、物理ストレージ密度を優先しています。
キングストン DC3000ME エンタープライズ機能
DC3000MEには、実稼働システムに不可欠なエンタープライズグレードの便利な機能が搭載されています。突然の停電時にデータを保護するための電源喪失保護(PLP)機能も搭載されています。また、TCG Opal対応のAES-256暗号化も搭載しており、保存データのセキュリティを確保します。DC3000MEは最大128個のネームスペースをサポートしており、仮想化やコンテナ化のユースケースで特に役立ちます。このレベルのネームスペースサポートは、高度なU.2 SSDに匹敵し、特に大規模な仮想化環境で役立ちます。Kingstonは、ドライブの健全性、メディアの摩耗、動作温度を追跡するためのテレメトリツールも内蔵しており、管理者は長期的な信頼性を可視化できます。
消費電力は、アイドル時の8Wからフル書き込み時の最大24Wまでの範囲で、これは高負荷時の高密度U.2 SSDとしては標準的な値です。Kingstonは最大読み取り電力を8.2Wと規定しており、これはアイドル時の数値とほぼ一致し、読み取り負荷の高いワークロードでも電力消費量が小さいことを示しています。耐久性はエンタープライズ向けドライブに期待される水準で、7,008年間にわたり28,032日XNUMX回のフル書き込みをサポートします。これは容量に応じてXNUMXTBWからXNUMXTBWに相当します。
Kingston DC3000ME には、XNUMX 万時間の MTBF 定格と Kingston の XNUMX 年間限定保証が付帯し、無料のテクニカル サポートも付いています。
キングストン DC3000ME 仕様
| 製品仕様 | Details |
| フォームファクター | U.2、2.5インチ×15mm |
| インタフェース | PCIe NVMe Gen5 x4(Gen4との下位互換性あり) |
| キャパシティ | 3.84TB、7.68TB、15.36TB |
| NANDタイプ | 3D eTLC NAND |
| シーケンシャル読み取り/書き込み (MB/秒) | 3.84TB – 14,000 / 5,800 7.68TB – 14,000 / 10,000 15.36TB – 14,000 / 9,700 |
| ランダム読み取り/書き込み IOPS (4K) | 3.84TB – 2,700,000 / 300,000 7.68TB – 2,800,000 / 500,000 15.36TB – 2,700,000 / 400,000 |
| レイテンシQoS(99%) | 読み取り: <10µs、書き込み: <70µs |
| 静的および動的ウェアレベリング | あり |
| 電力損失保護 | はい(パワーキャップ) |
| Encryption | TCG Opal 2.0、AES 256ビット暗号化 |
| 名前空間の管理 | 最大128の名前空間をサポート |
| エンタープライズ診断 | テレメトリ、メディアの摩耗、温度、健全性など。 |
| 耐久性(TBW / DWPD、5年) | 3.84TB – 7,008 TBW、1 DWPD 7.68TB – 14,016 TBW、1 DWPD 15.36TB – 28,032 TBW、1 DWPD |
| 消費電力 | アイドル時: 8W、最大読み取り時: 8.2W、最大書き込み時: 24W |
| 使用温度 | 0 ℃〜70 ℃ |
| 寸法 | 100.50mmのx 69.8mmのx 14.8mm |
| 重量 | 3.84 TB〜146.2 g 7.68 TB〜151.3 g 15.36 TB〜152.3 g |
| 振動(非動作時) | 10G ピーク (10 ~ 1000Hz) |
| MTBF | 2百万時間 |
| 保証とサポート | 5 年間の限定保証と無料の技術サポート |
キングストン DC3000ME パフォーマンステスト
ドライブテストプラットフォーム
このレビューでは、すべてのワークロードのテストプラットフォームとして、Ubuntu 760 LTSを搭載したDell PowerEdge R22.04.02を使用しています。 シリアルケーブル Gen5 JBOFU.2、E1.S、E3.S、M.2 SSDとの幅広い互換性を備えています。システム構成は以下の通りです。
-
-
- 2 x Intel Xeon Gold 6430 (32 コア、2.1GHz)
- 16 x 64GB DDR5-4400
- 480GB デル ボス SSD
- シリアルケーブル Gen5 JBOF
-
ドライブの比較
CDNパフォーマンス
現実的な混合コンテンツCDNワークロードをシミュレートするため、SSDは、コンテンツ負荷の高いエッジサーバーのI/Oパターンを再現するように設計された多段階のベンチマークシーケンスにかけられました。テスト手順では、大小さまざまなブロックサイズ、ランダムおよびシーケンシャルな操作への分散、そしてさまざまな同時実行レベルが網羅されています。
メインのパフォーマンステストの前に、各SSDは100MBブロックを使用した1%シーケンシャルライトパスでデバイス全体の書き込みを完了しました。このプロセスでは同期I/Oとキュー深度128が使用され、98.51つのジョブを同時に実行できました。このフェーズにより、ドライブは実際の使用状況を反映した定常状態になります。シーケンシャルフィルの後、重み付けブロックサイズ分割(ブロックサイズ/パーセンテージ)を用いた128回目の8時間ランダム書き込み飽和ステージが実行されました。このステージでは、XNUMXKB転送(XNUMX%)を強く優先し、その後XNUMXKB未満のブロックからXNUMXKBまでの転送をわずかに増加させました。このステップは、分散キャッシュ環境でよく見られる断片化された不均一な書き込みパターンをエミュレートします。
メインのテストスイートは、スケールされたランダム読み取りおよび書き込み操作に焦点を当て、キュー深度とジョブの同時実行数を変化させた際のドライブの動作を測定しました。各テストは300分間(XNUMX秒)実行され、その後XNUMX分間のアイドル期間が設けられ、内部回復メカニズムによってパフォーマンス指標が安定しました。
- 128K(98.51%)を優先する固定ブロックサイズ配分で実行し、残りの1.49%の操作は64Kから8Kまでの小さな転送サイズで構成されました。各構成は、1、2、4の同時ジョブ数、キュー深度1、2、4、8、16、32で変化させ、典型的なエッジ書き込み環境におけるスループットのスケーラビリティとレイテンシをプロファイリングしました。
- CDNコンテンツ取得を模倣した、非常に混合されたブロックサイズプロファイルが使用されました。128KB(83.21%)の主要コンポーネントから始まり、30KBから4KBまでの124以上の小さなブロックサイズがロングテールで続き、それぞれが分数頻度で表現されています。この分布は、ビデオセグメントの取得、サムネイルへのアクセス、メタデータの検索中に発生する多様なリクエストパターンを反映しています。これらのテストは、ジョブ数とキューの深さのマトリックス全体にわたって実行されました。
この事前調整、飽和、および混合サイズのランダム化アクセス テストの組み合わせは、帯域幅が広く、高度に並列化されたシナリオでの応答性と効率性を重視しながら、SSD が持続的な CDN のような環境をどのように処理するかを明らかにするように設計されています。
CDN ワークロード読み取り 1
CDNワークロードの読み取りテスト(1ジョブ)において、Kingston DC3000MEはキュー深度の増加に伴って効率的にスケーリングする安定したパフォーマンスを発揮しました。QD1では940MB/秒の速度を達成し、SanDisk SN861より約26%遅れをとりました。しかし、キュー深度が増加するにつれてDC3000MEはその差を縮め、Gen5ドライブのいくつかを上回りました。QD4では、Kingston DC3000MEは3,390MB/秒を達成しました。これはMicron 42より約9550%高速、Pascari X40Pより200%高速、Solidigm PS25より約1010%高速ですが、SanDisk SN861より約2.6%遅れています。 QD16では、DC3000MEは9,645MB/秒を達成し、Solidigm PS1010を約13%、Micron 9550を約20%上回りました。最大テスト深度であるQD32では、Kingstonは14,131MB/秒のスループットを達成し、Micron 9550とほぼ同等の性能を達成しました。また、Solidigm PS1010を約15%、SanDisk SN861を約10%上回りました。
CDN ワークロード読み取り 2
2ジョブCDN読み取りワークロードでは、Kingston DC3000MEは再びすべてのキュー深度で強力なパフォーマンスを維持しました。QD1では1,854MB/秒を記録しました。これは、Micron 9550(1,548MB/秒)を20%、Pascari X200P(1,519MB/秒)を22%、Solidigm PS1010(2,011MB/秒)を約8%上回りましたが、SanDisk SN861(2,487MB/秒)には34%遅れをとりました。
QD4では、キングストンは6,335MB/秒を記録しました。これは、Micron(5,337MB/秒)、Pascari(5,249MB/秒)、Solidigm(5,609MB/秒)よりも明らかに優れた結果でした。しかし、6,996MB/秒でトップの座を獲得したSanDiskには及ばず、まだ及ばない結果でした。
QD16では、キングストンは14,131MB/秒を記録し、この時点でトップに立った。最終テストポイントであるQD32では、わずかに速度が向上し14,336MB/秒となった。パスカリ(15,257MB/秒)とマイクロン(15,052MB/秒)にそれぞれ約6%と5%の差をつけられたものの、サンディスク(13,619MB/秒)とソリダイム(13,721MB/秒)に対しては依然として確固たるリードを維持している。
CDN ワークロード読み取り 4
3000つのジョブがアクティブな状態でも、Kingston DC1MEはCDNの読み取り性能において健闘しました。QD3,639では9550MB/秒を記録し、Micron 3,070(200MB/秒)やPascari X2,982P(22MB/秒)を上回りましたが、この層でトップの861MB/秒を記録したSanDisk SN4,443には4%の差がありました。QD10,854では15MB/秒を記録し、Micron(9,427MB/秒)より20%、Pascari(9,070MB/秒)より9,627%、Solidigm(11,161MB/秒)よりわずかに上回りました。しかし、SanDiskのXNUMXMB/秒には依然として及ばない結果となりました。
QD8では、Kingstonのスループットは13,926MB/秒を記録し、Micronとほぼ同等で、SanDisk(13,619MB/秒)やSolidigm(12,800MB/秒)とほぼ同等でした。QD16とQD32では、Kingstonのスループットは14,131~14,233MB/秒で横ばいとなり、MicronとPascari(どちらも約15,052~15,257MB/秒)よりわずかに遅れをとりましたが、SanDisk(13,619MB/秒)やSolidigm(13,721MB/秒)よりは依然として大きく上回っています。
CDN ワークロード書き込み 1
CDN書き込みワークロード(1ジョブ)において、Kingston DC3000MEはキュー深度に関わらず安定したスケーリングを示しました。QD1では2,118MB/秒を記録し、これはMicron 9550(2,004MB/秒)、Pascari X200P(1,885MB/秒)、Solidigm PS1010(1,718MB/秒)よりも高速でしたが、SanDisk SN861(2,164MB/秒)にはわずかに遅れをとりました。QD4では4,318MB/秒を記録し、これはSolidigm(55MB/秒)より2,789%、Pascari(26MB/秒)より3,437%高速でしたが、Micron(10MB/秒)より4,807%、SanDisk(19MB/秒)より5,353%遅い結果となりました。
QD16では5,880MB/秒を記録し、Pascari(4,921MB/秒)を20%上回り、Solidigm(2,664MB/秒)の11倍以上となりましたが、Micron(6,686MB/秒)には15%、SanDisk(6,939MB/秒)には32%遅れをとりました。QD5,987では、Kingstonは5,913MB/秒を記録し、Pascari(7,422MB/秒)に近づきましたが、Micron(7,521MB/秒)とSanDisk(20MB/秒)にはそれぞれ約25%とXNUMX%遅れをとりました。
CDN ワークロード書き込み 2
2ジョブのCDN書き込みワークロードにおいて、Kingston DC3000MEは安定したパフォーマンスを示しましたが、Gen5エンタープライズクラスの最速SSDには概ね及ばず、QD1では2,651MB/秒を記録しました。これはMicron 9550(2,813MB/秒)とPascari X200P(2,762MB/秒)をわずかに下回り、SanDisk SN33(861MB/秒)より約3,972%遅い結果となりました。
キュー深度が増加するにつれて、DC3000MEはペースを維持しました。QD4では4,807MB/秒に達しました。これはMicron 23(9550MB/秒)より約5,902%遅く、SanDisk SN13(861MB/秒)より5,508%遅いものでしたが、Solidigm PS1010(3,154MB/秒)よりは上回っていました。
QD16では、キングストンは5,772MB/秒を記録しました。これは、Micron(7,896MB/秒)やSanDisk(6,709MB/秒)には及ばないものの、Solidigm PS1010(3,820MB/秒)やPascari X200P(5,417MB/秒)といった下位製品よりも優れた性能を維持しています。QD32では、DC3000MEは5,870MB/秒を記録しました。これは、Micron 32(9550MB/秒)より約8,670%、SanDisk SN22(861MB/秒)より7,537%低い数値ですが、Solidigm PS1010(2,817MB/秒)やPascari(4,585MB/秒)よりは依然として優れています。
CDN ワークロード書き込み 4
4ジョブのCDN書き込みワークロードにおいて、Kingston DC3000MEはすべてのキュー深度で安定したパフォーマンスを発揮しましたが、Gen5ドライブの上位1社には概ね及ばず、QD2,202では200MB/秒を記録しました。これは、Pascari X2,845P (9550MB/秒)、Micron 2,703 (861MB/秒)、SanDisk SN3,544 (1010MB/秒) に劣るものの、Solidigm PS2,020 (2MB/秒) を上回りました。QD3,165では4,863MB/秒を記録しましたが、これもSanDisk (4,457MB/秒) とMicron (2,872MB/秒) に及ばず、Solidigm (XNUMXMB/秒) との差は縮まりました。
中程度のキュー深度では、Kingston DC3000MEはQD3,647で4MB/秒、QD4,410で8MB/秒を達成しました。これは良好なスケーリングを示しましたが、両方のテストポイントでMicronドライブ(5,539MB/秒と6,478MB/秒)とSanDiskドライブ(5,177MB/秒と5,575MB/秒)に遅れをとりました。QD16では、Kingstonは4,865MB/秒を達成しました。これはQD8よりもわずかに向上しましたが、SanDiskドライブ(6,011MB/秒)とMicronドライブ(7,474MB/秒)には依然として遅れをとりました。QD32では、DC3000MEは最高速度5,307MB/秒に達し、Solidigm(3,894MB/秒)を大きく上回りましたが、Micron(7,941MB/秒)とSanDisk(7,212MB/秒)には大きく遅れをとりました。パフォーマンスのリーダーではありませんが、Kingston ドライブは一貫したスケーリングと効率を維持しました。
DLIO チェックポイント ベンチマーク
AIトレーニング環境におけるSSDの実世界パフォーマンスを評価するために、DLIO(Data and Learning Input/Output)ベンチマークツールを使用しました。アルゴンヌ国立研究所が開発したDLIOは、ディープラーニングワークロードのI/Oパターンをテストするために特別に設計されています。ストレージシステムがチェックポイント、データの取り込み、モデルトレーニングといった課題にどのように対処するかについての洞察を提供します。下のグラフは、両方のドライブが36のチェックポイントにわたってプロセスをどのように処理するかを示しています。機械学習モデルのトレーニングでは、モデルの状態を定期的に保存し、中断や停電時の進行状況の損失を防ぐために、チェックポイントが不可欠です。このストレージ需要には、特に持続的または集中的なワークロードにおいて、堅牢なパフォーマンスが求められます。2.0年13月2024日リリースのDLIOベンチマークバージョンXNUMXを使用しました。
ベンチマークが現実世界のシナリオを反映したものであることを確認するため、LLAMA 3.1 405B モデルアーキテクチャに基づいてテストを実施しました。モデルパラメータ、オプティマイザーの状態、およびレイヤーの状態を取得するために、torch.save() を用いたチェックポイント処理を実装しました。このセットアップでは、4GPU システムをシミュレートし、2 ウェイテンソル並列処理と 1,636 ウェイパイプライン並列処理を XNUMX つの GPU に分散させたハイブリッド並列処理戦略を実装しました。この構成では、チェックポイントのサイズは XNUMXGB となり、これは現代の大規模言語モデルのトレーニング要件にほぼ相当します。
DLIO平均パス結果では、Kingston DC3000ME 7.68TBは上位候補にわずかに遅れを取り、465.04ドライブ構成のドライブの中では中位に位置しました。チェックポイントの平均時間は、584.38回目のパスで590.30秒、200回目のパスで7.68秒、674.48回目のパスで3秒でした。3000回のパス全てで最速タイムを記録したPascari X9550P 7.68TB(1010回目のパスで7.68秒)よりも一貫して高速でしたが、Kingston DC565MEはMicron XNUMX XNUMXTBとSolidigm PSXNUMX XNUMXTBには遅れをとりました。両製品とも最終パスではXNUMX秒未満でした。
下のグラフに示すように、Kingston DC3000MEは好調なスタートを切り、序盤のチェックポイントタイムは上位の競合製品とほぼ互角でした。チェックポイント1では469.27秒を記録し、Micron 9550の464.01秒にわずかに遅れ、Pascari X200Pの472.65秒を上回りました。チェックポイント2から4までは461.92秒から465.44秒の間で安定したタイムを維持し、Micron 9550とSolidigm PS1010(いずれも453秒から465秒台)とほぼ互角のタイムをキープしました。
テストの中盤(チェックポイント5~8)では、Kingston DC3000MEのチェックポイントタイムが急上昇し、チェックポイント613.01では7秒を記録しました。これはMicron 9550(570.42秒)やSanDisk SN861 7.68TB(559.56秒)よりも速いタイムでしたが、同じインターバルで最高200秒を記録したPascari X694.38Pと比べると依然として大幅に改善しています。テスト終盤では、Kingston DC3000MEのタイムはやや安定し、チェックポイント571.36では12秒で終了しました。これはMicron 28より約9550秒遅いタイムでしたが、200秒で終了したPascari X689.68Pを上回りました。全体的に、Kingston DC3000ME 7.68TB は、チェックポイントのワークロード全体にわたって一貫したパフォーマンスを示し、競争力の範囲内に留まり、中間に位置しました。
FIOパフォーマンスベンチマーク
各SSDのストレージパフォーマンスを業界標準の指標に基づいて測定するために、FIOを活用しています。各ドライブは同一のテストプロセスでテストされます。このプロセスには、シーケンシャルライトワークロードでドライブを2回フルフィルする前処理ステップと、その後の定常パフォーマンス測定が含まれます。測定対象のワークロードの種類が変化するたびに、新しい転送サイズで前処理フィルを再度実行します。
このセクションでは、次の FIO ベンチマークに焦点を当てます。
- 128Kシーケンシャル
- 64Kランダム
- 16Kランダム
- 4Kランダム
大容量QLC SSDは大容量転送向けに設計されているため、書き込み速度テストは16Kランダムアクセスに限定されます。4Kについては、16Kワークロードのプリフィル状態を利用して、4Kランダムアクセス読み取りパフォーマンスのみを測定します。
128K シーケンシャル前提条件 (IODepth 256 / NumJobs 1)
この高キュー深度のプレコンディショニングテストにおいて、Kingston DC3000MEは8,944.9秒間の実行中、1,000MB/秒の安定した書き込み帯域幅を維持しました(ただし、テストは800秒を少し過ぎたあたりで終了しました)。最速ではありませんが(ピーク時9550GB/秒に達したMicron 10.3よりわずかに遅れています)、Kingston DC3000MEは変動が最小限で安定したスループットを示しました。
128K シーケンシャル前提条件レイテンシ (IODepth 256 / NumJobs 1)
128K シーケンシャル書き込み前提条件レイテンシ テストでは、Kingston DC3000ME は平均レイテンシ 3.577 ミリ秒 (変動は最小限で、時間の経過とともに安定) を示し、Micron ドライブに次ぐ XNUMX 位となりました。
128K シーケンシャル書き込み (IODepth 16 / NumJobs 1)
128Kシーケンシャル書き込みテストでは、Kingston DC3000MEは8,477.4MB/秒を記録し、グループトップの9550MB/秒を記録したMicron 10,354.6に僅差で並びました。Kingston DC3000MEはPascari X200Pを上回り、Solidigm PS1010とSanDisk SN861(いずれも7,100MB/秒前後)に対しても確固たるリードを維持しました。Kingstonのパフォーマンスは、速度と安定性の優れたバランスを示しています。
128K シーケンシャル書き込みレイテンシ (IODepth 16 / NumJobs 1)
128Kシーケンシャル書き込みレイテンシテストでは、Kingston DC3000MEは平均レイテンシ235.6µsという堅実な結果を達成しました。これは、それぞれ861µsと1010µsを記録したSanDisk SN280.7とSolidigm PS280.3を上回っています。9550µsでトップだったMicron 192.9には及ばないものの、Kingston DC3000MEは競争力を維持しており、200µsでPascari X238.6Pをわずかに上回りました。
128K シーケンシャル読み取り (IODepth 64 / NumJobs 1)
128Kシーケンシャルリードテスト(キュー深度64、ジョブ3000つ)において、Kingston DC13,513.8MEは200MB/秒を達成しました。これはテスト対象ドライブの中では14,242.1位にランクインしますが、それでも高いスループット(実使用環境における差異は最小限)を示しました。Pascari X5.1P(1010MB/秒)には約14,163.3%、Solidigm PS4.6(9550MB/秒)には14,050.1%、Micron 3.8(861MB/秒)には約12,631.2%の差がありました。また、3000MB/秒と低速だったSanDisk SNXNUMXを大きく上回りました。それでも、Kingston DCXNUMXMEの結果は良好で、テスト対象ドライブの中でも上位のドライブとの差は最小限に抑えられています。
128K シーケンシャル読み取りレイテンシ (IODepth 64 / NumJobs 1)
レイテンシに関しては、Kingston DC3000MEの平均レイテンシは591.6µsで、グループ内で中間的な位置を占めました。この結果は、Micron 5.4(9550µs)よりも569.0%高く、Solidigm PS5.4(1010µs)よりも564.5%低いものでした。Pascari X200Pは561.4µsでわずかにリードし、SanDisk SN861は633.0µsで最遅となりました。結果として、Kingston DC3000MEは、高キュー深度の読み取り条件下でも比較的低いレイテンシを維持しました。
64Kランダム書き込み
64Kランダム書き込みテストにおいて、Kingston DC3000MEは、様々なキュー深度とスレッドの組み合わせにおいて一貫して高いパフォーマンスを発揮し、6,649(IO深度)/32(ジョブ数)構成では最高8MB/秒を記録しました。この結果は、すべてのワークロードとテストポイントの中でも最高水準です。
チャート全体を通して、Kingston DC3000MEは4,000~5,000MB/秒の安定した帯域幅を維持し、特に32/4(5,380MB/秒)や16/8(5,017MB/秒)といった中~高同時実行設定で優れたパフォーマンスを示しました。1/4や2/4といった低負荷環境でも、4200MB/秒以上のパフォーマンスを維持しました。他のドライブと比較して、Kingston DC3000MEはほとんどのテストポイントでグループトップまたは上位付近を維持し、高いピークスループットとテスト全体を通して一貫したパフォーマンスを提供しました。
64Kランダム書き込みレイテンシ
64Kランダム書き込みレイテンシテストにおいて、Kingston DC3000MEは、ほとんどのキュー深度とジョブの組み合わせにおいて一貫して低い応答時間を実現し、高負荷時でも優れた書き込み効率を示しました。例:
- 4/1では49µsを示しました
- 8/1では、レイテンシは102µsと低く抑えられました。
- 16/4では1,486µsを計測した。
- そして、テストされた最高負荷である32/8では、2,402µsに達しました。
これらの結果は、Kingston DC3000ME が予想どおりに拡張され、他のドライブ、特に Pascari および Solidigm ドライブで見られる深刻なレイテンシ スパイクを回避したことを示しています。これらのドライブでは、3,000~6,000µs を超えると不規則なジャンプが発生します (最も顕著なのは 16/8)。
64Kランダム読み取り
64Kランダム読み取りテストでは、Kingston DC3000MEはIOdepth/NumJobsマトリックス全体にわたって強力かつ安定したパフォーマンスを発揮し、テスト終了時には僅差で13,515位につけました。ピーク帯域幅は32/4で16MB/秒に達し、4/13,482(32MB/秒)および8/13,512(1MB/秒)でも同様に高いスループットを示し、高負荷の並列読み取りワークロード下でも優れたスケーラビリティを示しました。4/2や2/3000といった低負荷時には、Kingston DC2,298MEはそれぞれ2,234MB/秒とXNUMXMB/秒を記録しました。
64Kランダム読み取りレイテンシ
Kingston DC3000ME 64Kのレイテンシは、すべてのテストポイントで比較的低い値を維持しました。すべてのドライブのパフォーマンスはほぼ同等でしたが、SanDisk SN861はテスト終了時に他のすべてのテスト対象ドライブよりも顕著に高いピーク値を記録しました。1/2でKingston DC3000MEは106µsを記録し、108/1で4µs、131/8で1µs、133/4で4µs、177/8で4µsと続きました。同時実行数が増えると、305/16で4µs、174/32で1µs、301/32で2µsと増加し、1,184/32では8µsのピーク値を記録し、他のドライブと同程度となりました。全体的に、キングストン DC3000ME のレイテンシ プロファイルは、ジッターや異常値のスパイクを最小限に抑えながら、トップ パフォーマンスに近いものとなりました (これはテストされたすべてのドライブに当てはまります)。
16Kランダム書き込み
16Kランダム書き込みテストでは、Kingston DC3000MEはキュー深度とスレッド数の全範囲において強力な帯域幅を提供し、競合ドライブの中で427,592位につけました。32/16構成では最高338,521 IOPSを記録しました。その他の高パフォーマンスポイントとしては、32/8構成で251,428 IOPS、16/4構成で226,606 IOPS、1/8構成で2 IOPSが挙げられ、いずれもさまざまな並列負荷において優れたコントローラ効率を示しました。16/1構成や4/218,300構成といった中程度の負荷構成でも、ドライブはそれぞれ204,867 IOPSと3000 IOPSを達成しました。全体的に、Kingston DC160,000ME は、テスト マトリックス全体で一貫して XNUMX を超える IOPS を達成し (いくつかの領域を除く)、このワークロードで最もバランスの取れたドライブの XNUMX つとなりました。
16Kランダム書き込みレイテンシ
Kingston DC3000ME 16K書き込みレイテンシ性能は非常に安定しており、リーダーボードのトップでテストを終えました(Pascariドライブはわずかに遅れをとりました)。Kingston DC3000MEのハイライトは、14/1で1µs、18/2で1µs、19/1で4µs、29/1で2µsでした。負荷が増加すると、Kingstonは強力なレイテンシプロファイルを維持し、126/8で4µs、146/2で16µs、254/16で4µs、575/16で8µsを記録しました。最も負荷の高い32/16構成でも、レイテンシは1,197µsに抑えられました。
16Kランダム読み取り
16Kランダムリード条件では、Kingston DC3000MEは8/8に達するまで一貫して優れたパフォーマンスを示しましたが、そこからわずかに遅れを取り始めました。ピークIOPSは、QD800で648,686ジョブ、32K弱(641)を記録し、続いてQD4で16ジョブ、623K IOPS、QD16で3000ジョブ、XNUMXK IOPSを記録しました。残念ながら、Kingston DCXNUMXMEはSanDiskドライブと同様に、リーダーボードの下位に近い位置でテストを終えました。
16Kランダム読み取りレイテンシ
ピークスループット(QD8/8)では、Kingston DC3000MEのレイテンシはわずか99µsで、ほとんどの構成において狭い低レイテンシ帯域内に留まりましたが、QD16/8あたりでレイテンシが低下し始めました。レイテンシが最も良好だったのはQD1/4(74µs)で、低~中程度のキュー深度では80µsを下回る結果もいくつか見られました。QD32/16のような高負荷時には、Kingston DC3000MEは826µsを記録し、これは他のテスト対象ドライブ(SanDiskを除く)よりも大幅に高い値でした。
4Kランダム読み取り
4Kランダム読み取りテストでは、Kingston DC3000MEはテスト範囲全体にわたって優れたスケーリングを示し、1,957.92/16構成で16K IOPSのピークパフォーマンスを記録しました。1,923.42/32構成では8K IOPS、1,361.32/8構成では16K IOPS、1326.03/16構成では8K IOPSと高いスループットを維持し、SolidigmやMicronと並んでリーダーボードのトップに君臨し続けました。
4Kランダム読み取りレイテンシ
Kingston DC3000MEは、4Kランダム読み取りテスト全体を通して低レイテンシを維持し、60/1構成では1µsからスタートしました。1/4ではわずかに改善して61µsとなり、1/8では63µsで安定しました。同時実行数が増えるにつれて、Kingston DC3000MEのレイテンシは予想通りに増加し、66/2では4µs、67/2では16µs、71/4では4µs、80/8では4µsとなりました。より高負荷な構成では、レイテンシはわずかに上昇し、94/16では4µs、99/16では8µs、135/32では8µs、そして266/32ではピーク時に16µsとなりました。
4Kランダム書き込み
4Kランダム書き込みでは、Kingston DC3000MEは979,636/32で最大16 IOPS、979.173/32で最大8 IOPSという強力なパフォーマンスを示しました。これは、ピーク時に200万IOPSを超えたトップクラスのPascari X1.6Pを大きく下回る結果となりました。とはいえ、Kingston DC3000MEはミッドレンジの負荷においても、879/8で16K IOPS、944/16で16K IOPS、745/16で4K IOPSというまずまずの数値を記録しました。
4Kランダム書き込みレイテンシ
ランダム書き込みレイテンシにおいて、Kingston DC3000MEは11/1スレッドで1µsから始まり、20/50スレッドに達するまで8~8µs程度で推移し、261/32スレッドでは8µs、522/32スレッドでは16µsまで上昇しました。レイテンシは最速ではありませんが、Kingston DC3000MEは予測可能な適度なレイテンシを維持しており、SolidigmやPasarciなどのドライブで見られるようなスパイク(16スレッドを超えると大きな変動が見られる)は発生しませんでした。
GPUダイレクトストレージ
このテストベンチで実施したテストの 1 つは、Magnum IO GPU Direct Storage (GDS) テストでした。GDS は NVIDIA が開発した機能で、NVMe ドライブやその他の高速ストレージ デバイスに保存されているデータにアクセスするときに GPU が CPU をバイパスできるようにします。GDS は、CPU とシステム メモリを介してデータをルーティングする代わりに、GPU とストレージ デバイス間の直接通信を可能にし、レイテンシを大幅に削減し、データ スループットを向上させます。
GPUダイレクトストレージの仕組み
従来、GPU が NVMe ドライブに保存されたデータを処理する場合、データは GPU に到達する前にまず CPU とシステム メモリを通過する必要があります。このプロセスでは、CPU が仲介役となり、遅延が増加し、貴重なシステム リソースが消費されるため、ボトルネックが発生します。GPU ダイレクト ストレージは、GPU が PCIe バスを介してストレージ デバイスから直接データにアクセスできるようにすることで、この非効率性を解消します。この直接パスにより、データ移動に関連するオーバーヘッドが削減され、より高速で効率的なデータ転送が可能になります。
AI ワークロード、特にディープラーニングを伴うワークロードは、非常にデータ集約的です。大規模なニューラル ネットワークのトレーニングにはテラバイト単位のデータ処理が必要であり、データ転送の遅延は GPU を十分に活用できず、トレーニング時間が長くなる可能性があります。GPU ダイレクト ストレージは、データが可能な限り迅速に GPU に配信され、アイドル時間を最小限に抑え、計算効率を最大化することで、この課題に対処します。
さらに、GDS は、ビデオ処理、自然言語処理、リアルタイム推論など、大規模なデータセットのストリーミングを伴うワークロードに特に役立ちます。CPU への依存度を下げることで、GDS はデータの移動を高速化し、CPU リソースを他のタスクに解放して、システム全体のパフォーマンスをさらに向上させます。
読み取りスループット
GDSIOシーケンシャルリードテストにおいて、Kingston DC3000MEは16K、128K、1MBのブロックサイズにおいて、一貫して効率的なスループットスケーリングを示しました。ただし、パフォーマンスの傾向は転送サイズによって若干異なります。16Kブロックでは、スレッド数の増加に伴いスループットは着実に向上し、3000スレッドで3.70GiB/秒のピークに達した後、32スレッドで3.41GiB/秒まで徐々に低下しました。128K転送では、128スレッドで5.88GiB/秒という最高の結果を達成し、16スレッドまでそのレベルを維持しましたが、32スレッドで約5.35GiB/秒まで低下しました。 128MB のサイズでは、Kingston DC1ME のスループットは早くも横ばいとなり、3000 スレッドで 6.54 GiB/s を達成し、16 スレッドでは 5.91 GiB/s まで緩やかに低下しました。
レイテンシを読む
レイテンシに関しては、DC3000MEは予測通りのスケーリングを示しました(これはテストしたすべてのドライブに当てはまります)。スレッド数が少ないほど、すべてのブロックサイズで応答時間が短くなり、スレッド数が増えるにつれてレイテンシが増加しました。16Kでは、レイテンシは504µsから始まり、582スレッドになると徐々に128µsに増加しました。128Kでは、Kingston DC3000MEのレイテンシは2,60µsから始まり、最大スレッド数では3,228µsに増加しました。1MBブロックでは、ペイロードの増大によりレイテンシの上昇幅が大きくなり、2,609スレッドでは2,703µsから始まり、128スレッドではXNUMXµsに増加しました。
書き込みスループット
読み取り操作では、16Kブロックの平均レイテンシは、単一スレッドで2,247µsから始まり、504スレッドでは128µsに減少し、同時実行時の効率的なスケーリングを示しました。128Kブロックサイズでは、レイテンシは4,035µsから始まり、2,601スレッドでは128µsまで徐々に減少しました。1Mブロックでは、Kingston DC3000MEのレイテンシが全体的に最も低く、単一スレッドでは2,609µsから始まり、2,500スレッドでも2,700~128µsの範囲に留まり、大規模なシーケンシャル読み取りにおいて安定した応答性を示しました。
ライトレイテンシ
平均レイテンシはスレッド数1~16の範囲で比較的安定しており、12,234~14,247µs程度で推移しました。32スレッドではレイテンシはわずかに増加して15,559µsとなり、20,944スレッドでは64µsにまで上昇しました。128スレッドでは顕著なスパイクが発生し、Kingston DC3000MEのレイテンシは28,725µsにまで跳ね上がり、以前のXNUMX倍以上にまで増加しました。
結論
Kingston DC3000MEは、信頼性、安定したパフォーマンス、そして堅牢なエンタープライズ機能が重要な要件となる、主流のエンタープライズおよびデータセンター環境向けの実用的なソリューションとして位置付けられています。このドライブは、システムインテグレーター、付加価値再販業者(VAR)、そして中小企業(SMB)および中堅・中小企業環境においてインフラを構築・管理するITチームのニーズに応えます。U.2フォームファクターとPCIe Gen5サポートにより、幅広い互換性と将来を見据えた帯域幅を実現し、チャネル主導の導入に最適な製品です。
パフォーマンスの観点から見ると、DC3000MEは幅広いワークロードにおいて競争力のあるスループットと効率性を提供します。その強みは、安定したシーケンシャルリード、優れた書き込み一貫性、そして混合ワークロードおよびランダムワークロードにおける一貫したレイテンシスケーリングにあります。一部の高負荷CDNやチェックポイントベンチマークでは、MicronやSanDiskなどのGen5上位製品に時折劣るものの、特に持続的な混合負荷シナリオや中程度の同時実行性においては、依然として競争力を維持しています。
総じて、DC3000MEは汎用エンタープライズワークロードに最適で、高度にカスタマイズされたOEMソリューションに依存せずに高性能ストレージを導入したい組織のニーズを満たします。VARやシステムビルダーは、特に実用的なインフラストラクチャ導入において、コスト、パフォーマンス、拡張性のバランスを重視する際に、DCXNUMXMEのメリットを大いに実感できるでしょう。


CDN ワークロード読み取り 2
4Kランダム読み取りレイテンシ

Amazon