Lenovo ThinkSystem SR665 は、機能が豊富で、 第2世代AMD EPYC エンドツーエンドの PCIe Gen2 サポートをサポートするデュアルソケット 4U サーバー。小型の 1U 兄弟と同様に、 SR635、Gen4 U.2 NVMe SSD など、幅広いストレージ構成オプションもサポートしています。 AMD EPYC サーバーであることには、通常、より高いパフォーマンス、より高速な RAM、より多くの DIMM、PCIe Gen4 のサポートなど、いくつかの利点があります。このサーバーは、推論、仮想化、VDI、HPC、ハイパーコンバージド インフラストラクチャに最適です。
Lenovo ThinkSystem SR665 は、機能が豊富で、 第2世代AMD EPYC エンドツーエンドの PCIe Gen2 サポートをサポートするデュアルソケット 4U サーバー。小型の 1U 兄弟と同様に、 SR635、Gen4 U.2 NVMe SSD など、幅広いストレージ構成オプションもサポートしています。 AMD EPYC サーバーであることには、通常、より高いパフォーマンス、より高速な RAM、より多くの DIMM、PCIe Gen4 のサポートなど、いくつかの利点があります。このサーバーは、推論、仮想化、VDI、HPC、ハイパーコンバージド インフラストラクチャに最適です。
AMD EPYC 7002 は、競合他社に比べていくつかの利点をもたらします。すぐに、より多くのコアとスレッドがあり、より高いパフォーマンスをもたらす傾向があります。これらは、より高速でより多くの DRAM をサポートし、PCIe Gen4 テクノロジー (この場合はエンドツーエンド) をサポートするため、パフォーマンスが大幅に向上します。高いコア数は、特定のライセンス モデルのコスト削減にも役立ち、単一の CPU を備えたデュアル ソケット システムまたは 665 つの CPU を備えたクアッド ソケット プラットフォームのパフォーマンスを向上させます。 SRXNUMX は上記のすべてを最大限に活用しています。
具体的には、Lenovo ThinkSystem SR665 は、最大 64 コアおよび 128 スレッドの CPU をサポートし、最大 3.7 GHz のコア速度を実現します。メモリに関しては、SR665 は最大 32 個の TruDDR4 メモリ DIMM をサポートし、8 個のメモリ チャネルとチャネルあたり 2 個の DIMM をサポートします。チャネルごとに 1 つの DIMM (合計 8 つの DIMM) が取り付けられている場合、メモリは最大 3200 MHz で動作します。チャネルごとに 2 つの DIMM (合計 32 枚の DIMM) を搭載し、メモリは最大 2933 MHz で動作します。サーバーは最大 4TB の DRAM をサポートできます。 GPU の場合、SR665 は最大 3 つのダブルワイド GPU または 8 つのシングルワイド GPU をサポートできます。
Lenovo ThinkSystem SR665 サーバーでは、ストレージ、特にストレージの構成可能性が非常に興味深いです。 Lenovo によると、このサーバーは、サーバーの前面、中央、背面に 28 の異なるドライブ ベイ構成を提供し、サーバーの背面に 5 つの異なるスロット構成を提供します。
2.5 インチ ドライブの場合、サーバーはフロント、ミッド、リアの組み合わせで最大 40 台をサポートできます。このサーバーは、PCIe レーンのオーバーサブスクリプションなしで最大 16 個の NMVe SSD をサポートし、32:1 オーバーサブスクリプションの場合は最大 2 個の NMVe SSD をサポートします。逆に、SR665 は最大 20 台の 3.5 インチ ドライブをサポートし、最大のストレージ容量を実現できます。 M.2 の場合、サーバーはブートまたはデータ ストレージ用に RAID1 で XNUMX つまたは XNUMX つのドライブをサポートします。
SR665 は管理のために、次の組み合わせを使用します。 レノボ XClarity 管理、ThinkShield セキュリティ機能、および Lenovo サービス。その目的は、強力でシンプルかつ安全な管理を提供することです。もう少し詳しく知りたい人のために、上にリンクされている XClarity についてかなり深く掘り下げました。
レノボ ThinkSystem SR665 仕様
フォームファクター | 2Uラックサーバー |
プロセッサ | 最大 2 つの AMD EPYC 7002 世代プロセッサ、最大 64C、280W |
メモリ | 32x DDR4 メモリスロット。 4GB RDIMM を使用すると最大 128TB。 1MHzで最大3200DPC、2MHzで3200DPC |
ドライブベイ | 最大 20 台の 3.5 インチ ドライブまたは 40 台の 2.5 インチ ドライブ。 32:1 接続で最大 2 台の NVMe ドライブ |
拡張スロット | 最大 8x PCIe 4.0 スロット、1x OCP 3.0 アダプター スロット |
GPU | 最大 8 個のシングル幅 GPU または 3 個のダブル幅 GPU |
ネットワーク·インタフェース | OCP 3.0メザナアダプタ、PCIeアダプタ |
出力 | デュアル冗長 PSU (最大 1800W Platinum) |
ポート | 前面: USB 1 x 3.0、USB 1 x 2.0、VGA x 1 (オプション) 背面: USB 3 x 3.1、シリアル ポート x 1 (オプション)、RJ-1 (管理) x 45 |
システム管理 | Lenovo XClarity コントローラー |
OSサポート | Microsoft Windows Server、SUSE Linux Enterprise Server、Red Hat Enterprise Linux、VMware ESXi |
限定保証 | 1 年および 3 年の顧客交換可能ユニットおよびオンサイト サービス、翌営業日 9×5、オプションのサービス アップグレード |
レノボ シンクシステム SR665 設計と構築
Lenovo ThinkSystem SR665 は、すべての ThinkSystem ポートフォリオまたは Lenovo 全般と同じ全体的な外観を備えた 2U サーバーで、主に黒に赤のハイライトが施されています。サーバーの前面には 24 個のドライブ ベイがあります。左側には外部診断ポートとオプションの VGA ポートがあります。右側には 3.1 つの USB XNUMX ポート、XXC ポート、電源ボタン、およびインジケーターライトがあります。
デバイスの背面は、上部全体で最大 8 つの PCIe スロットをサポートします。下部には、OCP 3.0 スロット、エラー LED、管理イーサネット ポート、ロケーター LED、XCC 管理ポート、ビデオ ポート、さらに 1 つの Gen3.1 USB XNUMX ポート、NMI、および XNUMX つのホットスワップ可能な PSU があります。
ボンネットの下には、2 つの CPU と RAM DIMM を覆うエアフロー カバーが見えます。それらの前にはファンがあり、その後ろには PCIe スロットのライザーがあります。 M.XNUMX ブート カードと RAID カードの電源バックアップはカバーの上部に取り付けられます。
エア バッフルに取り付けられた M.2 ブート モジュールは、優先度の低いタスクにプライマリ ストレージ ベイを消費することなく、システム ストレージ用の高速フラッシュ ストレージを提供します。
レノボ ThinkSystem SR665 のパフォーマンス
Lenovo ThinkSystem SR665 構成:
- 2×AMD EPYC 7742
- CPUあたり512GB、256GB
- VDbench パフォーマンス ストレージ: 8 x 3.84Tb Micron 9300 (Gen3) または 8 x 3.84TB SK hynix PE8010 (Gen4)
- SQL Server および Sysbench ストレージ: 8 x 3.84Tb Micron 9300 (Gen3)
- CentOS 8(2004)
- ESXi 6.7u3
SQLサーバーのパフォーマンス
StorageReview の Microsoft SQL Server OLTP テスト プロトコルは、複雑なアプリケーション環境で見られるアクティビティをシミュレートするオンライン トランザクション処理ベンチマークである、トランザクション処理パフォーマンス評議会のベンチマーク C (TPC-C) の現在のドラフトを採用しています。 TPC-C ベンチマークは、データベース環境におけるストレージ インフラストラクチャのパフォーマンスの強みとボトルネックを測定するのに、合成パフォーマンス ベンチマークよりも近くなります。
各 SQL Server VM は 100 つの vDisk で構成されています。ブート用の 500 GB ボリュームと、データベースとログ ファイル用の 16 GB のボリュームです。システム リソースの観点から、各 VM に 64 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。以前にテストした Sysbench ワークロードはストレージ I/O と容量の両方でプラットフォームを飽和させましたが、SQL テストではレイテンシ パフォーマンスを調べます。
このテストでは、Windows Server 2014 R2012 ゲスト VM 上で実行されている SQL Server 2 を使用し、Dell の Benchmark Factory for Databases を負荷としています。このベンチマークの従来の使用法は、ローカル ストレージまたは共有ストレージ上の大規模な 3,000 スケールのデータベースをテストすることでしたが、このイテレーションでは、1,500 つの XNUMX スケールのデータベースをサーバー全体に均等に分散することに焦点を当てています。
SQL Server テスト構成 (VM ごと)
- Windows Serverの2012 R2
- ストレージ フットプリント: 600GB 割り当て、500GB 使用
- SQL Serverの2014
-
- データベースのサイズ: 1,500 スケール
- 仮想クライアント負荷: 15,000
- RAMバッファ: 48GB
- テスト時間: 3 時間
- 2.5時間のプレコンディショニング
- 30 分のサンプル期間
SQL Server の平均レイテンシーについては、SR665 は、合計で平均 1 ミリ秒、個々の VM がそれぞれ 1 ミリ秒で、このワークロードを問題なく最大化できました。
Sysbench MySQL のパフォーマンス
最初のローカル ストレージ アプリケーション ベンチマークは、SysBench 経由で測定された Percona MySQL OLTP データベースで構成されています。このテストでは、平均 TPS (99 秒あたりのトランザクション数)、平均レイテンシ、平均 XNUMX パーセンタイル レイテンシも測定します。
各 Sysbench VM は 92 つの vDisk で構成されています。447 つはブート用 (~270 GB)、16 つは事前構築済みデータベース (~60 GB)、XNUMX 番目はテスト対象データベース用 (XNUMX GB) です。システム リソースの観点から、各 VM に XNUMX 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。
Sysbench テスト構成 (VM ごと)
- CentOS 6.3 64 ビット
- Percona XtraDB 5.5.30-rel30.1
-
- データベーステーブル: 100
- データベースのサイズ: 10,000,000
- データベーススレッド: 32
- RAMバッファ: 24GB
- テスト時間: 3 時間
- 2 スレッドのプリコンディショニングに 32 時間
- 1時間 32スレッド
Sysbench OLTP では、合計スコアは 17,238VM で 8 TPS、32,649VM で 16 TPS でした。
Sysbench の平均レイテンシでは、合計スコアは 14.85 VM で 8 ミリ秒、15.68 VM で 16 ミリ秒でした。
最悪のシナリオの遅延 (99 パーセンタイル) では、SR665 の合計スコアは 30.27 VM で 8 ミリ秒、30.12 VM で 16 ミリ秒でした。
VDBench ワークロード分析
ストレージ アレイのベンチマークに関しては、アプリケーション テストが最適であり、合成テストは 2 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。
これらのワークロードは、「4 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。
プロフィール:
- 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% の読み取り
- 4K ランダム書き込み: 100% 書き込み、64 スレッド、0 ~ 120% の書き込み
- 64K シーケンシャル読み取り: 100% 読み取り、16 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、8 スレッド、0 ~ 120% iorate
- 合成データベース: SQL および Oracle
- VDI フル クローンおよびリンク クローン トレース
ここでは、PCIe Gen3 ドライブと Gen4 ドライブを比較しました。 マイクロン9300 vs SKハイニックス PE8010。どちらのドライブが優れているかを確認するのではなく、サーバー内で各タイプのテクノロジがどのように動作するかを確認する必要があります。以下に見えるのは、SR9300 AnyBay スロットに装着されている 665 つの Micron XNUMX NVMe SSD です。参考用にハード ドライブが上にあります。
ランダム 4K 読み取りでは、SK Hynix Gen665 ドライブを搭載した Lenovo ThinkSystem SR4 は 75.9µs のレイテンシと 412,428 IOPS で開始し、その後 3,851,738 IOPS と 170.2µs のレイテンシでピークに達しました。 Micron 9300 Gen3 ドライブのピーク時は 4,076,949 IOPS でしたが、遅延は 197.2μs と高かったです。
4K ランダム書き込みでは、SR4 で Gen665 ドライブのパフォーマンスが劇的に向上し、約 100 万 IOPS までは 2.6 μs 未満に留まり、その後 2,898,564 μs のレイテンシーで 154.4 IOPS のピークに達しました。 Gen3 ドライブでは、約 1.2μs で約 200 万 IOPS のピークに達し、その後、一部が低下しました。
64K シーケンシャル作業に切り替えると、Gen4 ドライブは 521,788μs の遅延で 32.6 IOPS、つまり 366.1GB/s に達しました。 Gen3 ドライブは、425,209μs の遅延で 26.6 IOPS、つまり 545GB/s でピークに達しました。
SR64 の 665K 書き込みでは、Gen4 ドライブのピークは 213,099 IOPS または 13.3GB/秒、遅延 442.1μs でしたが、その後、若干低下しました。 Gen3 ドライブは、約 123μs の遅延で約 7K IOPS または 460GB/s でピークに達し、その後、一部が低下しました。
次のテスト セットは、SQL ワークロード、SQL、SQL 90-10、および SQL 80-20 です。 SQL から始まって、SK hynix Gen4 ドライブは約 100 万 IOPS まで 1.75µs 未満に留まり、その後わずか 2,111,582µs の遅延で 113.6 IOPS のピークに達しました。 Gen3 のピークは 1,602,112 IOPS、遅延は 153.4μs でした。
SQL 90-10 では、Gen4 ドライブが再び起動し、今度は約 100 万 IOPS を超えるまで 1.2 μs 未満に留まりました。ドライブは、1,769,165 IOPS でピークに達し、遅延は 130.7μs になり、その後わずかに低下しました。 Gen3 SSD も、ピーク 1,441,311 IOPS、レイテンシー 156.8μs と良好な結果をもたらしました。
SQL 80-20 では、SR4 の Gen665 ドライブのピーク値は 1,657,107 IOPS、遅延は 141.9µs でした。 Gen3 ドライブは、1,246,384μs の遅延で 168.9 IOPS のピークに達することができました。
次に、Oracle ワークロード、Oracle、Oracle 90-10、Oracle 80-20 です。 Oracle から始めて、Gen665 SSD を搭載した Lenovo ThinkSystem SR4 は 100μs 未満で起動し、約 900K IOPS を突破するまでその状態を維持しました。ドライブは 1,484,001 IOPS に達し、遅延は 154.4μs に達しました。 Gen3 ドライブの場合、サーバーは 1,140,743,178.8 IOPS のピーク パフォーマンスと XNUMXμs の遅延を実現しました。
Oracle 90-10 の場合、Gen4 ドライブは 1,511,538μs の遅延で 110.5 IOPS のピークを達成しました。 Gen3 ドライブも同様に好調で、ピーク時の IOPS は 1,231,073、遅延は 134.8μs でした。
Oracle 80-20 では、Gen4 ドライブのピーク パフォーマンスは 1,369,215 IOPS、遅延は 117.7μs でした。 Gen3 SSD は 1,089,788 IOPS と 141.6µs のレイテンシを達成しました。
次に、VDI クローン テスト (完全およびリンク) に切り替えました。 VDI フル クローン (FC) ブートの場合、SR665 上の SK hynix ドライブは、100K IOPS まで 700µs 未満のレイテンシ パフォーマンスで始まり、1,379,893 IOPS および 174.6µs のレイテンシでピークに達しました。 Micron Gen3 ドライブは、1,185,395 IOPS と 198.1µs の遅延でピークに達し、その後、一部が低下しました。
VDI FC 初期ログインでは、4 世代の PCIe SSD の間にかなりの違いがあることがわかります。 Gen100 は、約 400K IOPS まで 636,576µs 未満のレイテンシーで始まり、268.3µs のレイテンシーで 3 IOPS に達しました。 Gen324,073 のピークは 356 IOPS、遅延は XNUMXμs でした。
VDI FC Monday Login では、再び大きな差が見られ、Gen4 ドライブはレイテンシ 526,115 μs でピーク 179.5 IOPS、Gen3 ドライブはレイテンシ 293,012 μs でピーク 235.5 IOPS でした。
VDI リンク クローン (LC) ブートに切り替えると、Gen665 ドライブを搭載した SR4 は 684,910μs のレイテンシーで 149.6 IOPS のピークに達しました。 Gen3 は、538,330μs のレイテンシーで 189 IOPS のピークに達します。
VDI LC の初期ログインでも、4 世代間の大きな差が見られ、Gen288,211 はピーク 156、遅延 3 μs、Gen161,852 はピーク 227.8 IOPS、遅延 XNUMX μs でした。
最後に、VDI LC Monday Login では、Gen4 ドライブが 386,865 IOPS、遅延 237μs のピークに達し、Gen3 ドライブが 181,515 IOPS、遅延 309.3μs に達することが確認されました。
まとめ:
Lenovo ThinkSystem SR665 は、2 つの AMD EPYC Gen2 CPU を搭載して利用できる 4U サーバーです。 AMD EPYC ベースのサーバーであることにより、ストレージ、GPU、FPGA で PCIe Gen64 テクノロジを使用できることや、より高速な RAM など、いくつかの利点が得られます。ハードウェアの観点から見ると、このサーバーは最大 128 つの AMD EPYC CPU を収容でき、最大 3.7 コアと 4 スレッドをサポートし、コア速度は最大 3200 GHz、最大 9 TB の RAM (速度は最大 XNUMX MHz)、拡張用スロットが XNUMX つあります。 。
SR665 には多くのストレージ構成機能もあります。このサーバーにはフロント、ミッド、リアのドライブ ベイ機能があり、最大 40 台の 2.5 インチ ドライブをサポートできます。サーバーは NVMe および SATA ドライブをサポートします。 XClarity を管理に活用する SR665 は、推論、仮想化、VDI、HPC、およびハイパーコンバージド インフラストラクチャのユースケースを対象としています。
パフォーマンスをテストするために、アプリケーション ワークロード分析と VDBench の両方を実行しました。アプリケーション ワークロード分析では、SQL Server の平均待機時間と Sysbench テストを実行しました。 SQL Server の平均レイテンシでは、SR665 の合計レイテンシは 1ms でした。 Sysbench では 8VM と 16VM を実行しました。 OLTP では、合計スコアは 17,238VM で 8 TPS、32,649VM で 16、平均遅延は 14.85VM で 8 ミリ秒、15.68VM で 16 ミリ秒、最悪のシナリオの遅延は 30.27VM で 8 ミリ秒、30.12VM で 16 ミリ秒でした。
Lenovo ThinkSystem SR665 は、PCIe Gen3 デバイスと Gen4 デバイスの両方を利用できます。これは、環境に SR665 を導入しようとしているユーザーがどちらかを使用できることを意味します。サーバーがどのように動作するかを全体的に把握するために、両方のタイプのストレージを設置してテストしました。明確にしておきますが、これは「どちらが優れているか」というタイプのテストではありません。 Gen4 ストレージはまだ製品が飽和していませんが、通常、ほぼすべてのケースで Gen3 よりも高速です。したがって、ほとんどの場合、Gen4 の方が高速になります。ただし、両方のドライブをテストすると、ユーザーはどのタイプのストレージを利用することを選択した場合に何が起こるかを知ることができます。たとえば、現在 Gen3 を使用している場合は何が起こるかがわかり、将来 Gen4 に変更する場合には何が起こるかがわかります。結果はそうなるはずです。
パフォーマンスのセクションに入る前に、SR665 で可能なことの表面をなぞっただけであることに注意することが重要です。 16 ベイ構成があり、8 台の NVMe デバイスのみをサポートします。 Lenovo は、最大 16 の NVMe ベイを含む、多くの構成オプションを提供しています。したがって、さらに高い可能性を得るために、このサーバーの仕様を、私たちが確認できた以上にさらに詳細に設定することができます。
4K 読み取りでは、Gen4 のピークが 3.9 万 IOPS に達し、Gen3 が 4.1 万 IOPS に達しました。Gen4 がレイテンシーの 14% 削減でリードしており、4K 書き込みのピークは、Gen2.9 で 4 万 IOPS、Gen1.2 で 3 万 IOPS でした。 、シーケンシャル作業では、Gen32.6 で 4GB/s、26.6K 読み取りで 64GB/s の書き込みが最高となり、64K 書き込みでのピークは Gen13.3 で 4GB/s、Gen7 で 3GB/s でした。次のテストは SQL、SQL 90-10、および SQL 80-20 で、サーバーは SQL 2.1-4 で Gen1.6 で 3 万 IOPS、Gen1.8 で 4 万 IOPS、Gen1.4 で 3 万 IOPS、Gen90 で 10 万 IOPS を示しました。 SQL 80-20 は、Gen1.7 で 4 万 IOPS、Gen1.2 で 3 万 IOPS に達しました。
次のテスト バッチは Oracle、Oracle 90-10、Oracle 80-20 で、S665 は Gen1.5 で 4 万 IOPS、Gen1.1 で 3 万 IOPS に達しました。Oracle 90-10 では Gen1.5 で 4 万 IOPS、Gen1.2 で 3 万 IOPS を達成しました。 、Oracle 1.4-4 の場合、Gen1.1 では 3 万 IOPS、Gen80 では 20 万 IOPS です。 4 万 IOPS の壁が破られたことを確認した最後のテストは、Gen1.4 (3 万 IOPS) と Gen1.2 (XNUMX 万 IOPS) の両方を備えた VDI FC ブートでした。
Lenovo ThinkSystem SR665 は、AMD EPYC CPU のパフォーマンス能力を最大限に引き出す、高度に構成可能な 2U サーバーです。ユーザーは PCIe Gen3 または Gen4 のどちらを搭載していても、その機能に感銘を受けるでしょう。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード