Accueil ConsommateurSSD clientPremier aperçu du contrôleur SSD Phison E28 : des vitesses Gen5 exceptionnelles et une gestion de l'alimentation améliorée

Premier aperçu du contrôleur SSD Phison E28 : des vitesses Gen5 exceptionnelles et une gestion de l'alimentation améliorée

by Lyle Smith

Les premiers tests du contrôleur SSD Phison E28 mettent en évidence des vitesses PCIe Gen5 impressionnantes, des IOPS aléatoires exceptionnelles et une efficacité énergétique améliorée.

Le nouveau contrôleur PS5028-E28 (« E28 ») de Phison est la plateforme SSD client PCIe Gen5 de deuxième génération de l'entreprise, conçue pour exploiter au maximum les performances de l'interface x32 à 4 GT/s. Fabriqué en 6 nm, le E28 associe la mémoire NAND KIOXIA BiCS8 (jusqu'à 2,400 XNUMX MT/s par canal) à une architecture trois cœurs intégrant deux processeurs Phison CoX dédiés à la gestion de la mémoire flash et à la qualité de service.

Marque Phison PS5028-E28

L'échantillon dont nous disposons est un modèle préliminaire. Phison nous a fourni un disque dur de référence exécutant une version bêta avancée du firmware, proche de la production. D'après notre expérience, les disques durs avec un firmware initial fonctionnent déjà à quelques pour cent de leur vitesse finale ; cependant, nous pouvons encore nous attendre à une légère amélioration une fois que Phison aura peaufiné les paramètres de ramasse-miettes et de limitation thermique. L'objectif de Phison est de nous fournir un élément concret à tester pendant qu'ils finalisent et peaufinent tout. Par conséquent, nous traitons cet article comme un résumé. premier coup d'oeil plutôt qu’un verdict complet.

Performances potentielles et efficacité énergétique du Phison PS5028-E28

Phison annonce des vitesses de pointe impressionnantes de 14.9 Go/s en lecture et 14 Go/s en écriture, avec des performances aléatoires atteignant jusqu'à 2.6 millions d'IOPS en lecture et 3.0 millions d'IOPS en écriture. Les capacités s'étendront à 1 To, 2 To et 4 To dans le format M.2 2280 simple face habituel. Le contrôleur prend en charge l'ensemble des fonctionnalités NVMe 2.0, ainsi qu'une granularité de l'état d'alimentation jusqu'à un état de veille L1.2 inférieur à 5 mW.

L'an dernier Génération 4 E26 Les processeurs E12 ont atteint des vitesses de lecture maximales d'environ 11 Go/s, des vitesses d'écriture de 1.5 Go/s et 2.0 à 12 millions d'IOPS en 5 nm. Le passage de Phison à la Gen6 via un procédé 28 nm, un parallélisme de canal plus large et une logique d'état d'alimentation repensée permettent à l'E25 d'offrir des vitesses séquentielles supérieures d'environ 30 à 50 % et des performances d'E/S aléatoires jusqu'à 28 % supérieures, tout en réduisant la consommation d'énergie en mode actif et inactif. Selon les tests internes de Phison, l'E2508 surpasse le SMXNUMX en termes d'efficacité énergétique, ce qui pourrait s'avérer crucial pour les environnements soumis à des contraintes thermiques, comme les ordinateurs de bureau ou portables compacts.

Emplacement M.28 installé sur Phison E2

Bien que nous n'ayons pas validé ces chiffres de manière indépendante lors de nos tests de consommation, Phison a partagé des données internes comparant sa conception de référence E28 à ce qu'elle appelle le « concurrent S » (probablement le SM2508 de SMI). D'après les graphiques de Phison, l'E28 consomme sensiblement moins d'énergie, que ce soit lors de charges de travail séquentielles ou aléatoires. Par exemple, lors de lectures et d'écritures séquentielles soutenues à QD8/T1, Phison constate un gain de consommation d'environ 1 watt par rapport au contrôleur concurrent.

Des marges similaires sont également observées dans des charges de travail QD32/T16 aléatoires, l'E28 conservant une puissance inférieure dans tous les domaines. Phison vise à combler l'écart d'efficacité qui s'est creusé lors de l'essor du SM2508, et au vu de ses chiffres, il semble réaliser des progrès significatifs.

Les ordinateurs portables grand public devraient bénéficier de ces améliorations en matière d'efficacité énergétique. Phison affirme qu'environ la moitié des ordinateurs portables commercialisés cette année seront équipés d'un emplacement compatible Gen5, même si la plupart des constructeurs utilisent encore des disques Gen4 pour maîtriser les coûts et la gestion thermique. La consommation au repos de l'E28 étant inférieure à 5 mW en L1.2, il semble enfin possible d'intégrer un véritable disque dur de 14 Go/s aux stations de travail mobiles sans solliciter la batterie.

Conception de référence du Phision E28

Globalement, le E28 est doté d'une configuration SSD Gen5 hautes performances, optimisée pour la bande passante et l'efficacité thermique. Comme vous pouvez le voir ci-dessous, un contrôleur Gen5 construit sur un nœud 6 nm est associé à un module DRAM SK hynix (H5AG46C8Y8R), essentiel au maintien de performances constantes sous charge, notamment avec des charges de travail de grande capacité ou à forte charge aléatoire.

Phison E28 arrière

À côté de la DRAM se trouvent deux boîtiers flash NAND étiquetés « TBi08G1BSA2 », chacun contenant une puce NAND KIOXIA BiCS1 TLC de 8 To, pour un total de 2 To. Ces puces peuvent atteindre des vitesses de 2400 5 MT/s. La configuration PCB simple face rend le lecteur idéal pour les systèmes à espace restreint, tels que les ordinateurs portables et les ordinateurs de bureau compacts. Phison a également indiqué que les prochaines versions prendront en charge la technologie LPDDRXNUMX, ce qui contribuera à réduire encore la consommation d'énergie. Cette configuration améliore également la gestion thermique en permettant des solutions de refroidissement passives ou actives plus efficaces.

Famille Phision E28

Phison positionne également l'E28 comme une famille de contrôleurs plutôt que comme un simple composant client. Parallèlement à la version grand public que nous testons, un E28 DC Une variante est en cours de développement pour les charges de travail d'entreprise, tandis qu'un modèle d'IA E28 intégrera des hooks d'inférence embarqués pour le framework aiDAPTIV+ de Phison. Ce modèle est similaire à la manière dont E26 a intégré l'E26-DC et a finalement alimenté quelques cartes accélératrices d'IA. Cependant, le plafond plus élevé de l'E28 devrait offrir aux concepteurs de systèmes une plus grande marge de manœuvre pour les scénarios d'E/S mixtes et soutenus.

Cela étant dit, nous allons maintenant soumettre l'E28 à notre série complète de tests de performance réels pour voir comment il se comporte.

Spécifications préliminaires du Phison PS5028-E28 « E28 »

Spécifications Détails
Capacités* 1 To (1,000 2 Go), 2,000 To (4 4,000 Go), XNUMX To (XNUMX XNUMX Go)
Facteur de forme M.2 2280-S3-M – module simple face
Contrôleur et processus Phison PS5028-E28 (6 nm, 3 cœurs + 2 coprocesseurs CoX)
NAND flash KIOXIA BiCS8 TLC ; Basculement 5.2 à 2400 2 MT/s ; jusqu'à 308 boîtiers BGA32 (XNUMX CE)
Interface / Protocole PCIe 5.0 × 4, NVMe 2.0 (rétrocompatible avec Gen4/3/2/1)
Performances séquentielles
  • 1 To – 14,900 13,500 Mo/s / XNUMX XNUMX Mo/s (lecture/écriture)
  • 2 To – 14,900 14,000 Mo/s / XNUMX XNUMX Mo/s (lecture/écriture)
  • 4 To – 14,900 14,000 Mo/s / XNUMX XNUMX Mo/s (lecture/écriture)
Performances aléatoires (4 Ko, QD 128)
  • 1 To – 1.3 M / 2.8 M IOPS (lecture/écriture)
  • 2 To – 2.5 M / 3.0 M IOPS (lecture/écriture)
  • 4 B – 2.6 M / 3.0 M IOPS (lecture/écriture)
Fiabilité MTBF 1.5 M heures | UBER < 1 × 1016
Température de fonctionnement 0 °C – 70 °C (entraînement) | –40 °C – 85 °C (stockage)
Gestion de l'énergie PS0-PS4, APST, ASPM, PCIe L1.2
Inactif (L1.2) < 5 mW | Consommation active – À déterminer
Fonctionnalités d'intégrité des données LDPC + RAID ECC, SRAM ECC, SmartRefresh, protection de chemin de bout en bout
Sécurité TCG Pyrite 1.0, NVMe sanitization, mise à jour du firmware signée
Autres caractéristiques Nivellement d'usure dynamique, gestion des blocs défectueux, SMART, TRIM, limitation thermique

Performances du Phison PS5028-E28

Comparables

Avant de plonger dans les benchmarks, voici une liste de disques Gen5 comparables testés aux côtés d'une conception de référence Phison PS2-E5028 (E28) de 28 To, ainsi que de quelques SSD Gen4 :

Nous avons soumis ces disques à divers tests afin d'évaluer leurs performances en conditions réelles et synthétiques. Parmi ces tests, on compte les temps de chargement LLM pour mesurer leur rapidité de traitement des modèles d'IA volumineux, les tests DirectStorage pour évaluer la rapidité de chargement des ressources et de traitement des données de jeu, et les tests Blackmagic Design pour évaluer les vitesses de lecture et d'écriture pour le montage vidéo haute résolution. Nous utiliserons également PCMark 10 pour évaluer la réactivité globale du système, 3DMark Storage pour tester les performances de jeu, et les tests FIO pour mesurer les vitesses de lecture/écriture séquentielles et aléatoires maximales sous charges de travail élevées.

Voici le banc d'essai haute performance que nous avons utilisé pour l'analyse comparative :

  • CPU: AMD Ryzen 7 9800X3D
  • Carte mère : Asus ROG Crosshair X870E Hero
  • RAM : G.SKILL Trident Z5 Royal Series DDR5-6000 (2 x 16 Go)
  • GPU: NVIDIA GeForce RTX 4090
  • Système d'exploitation : Windows 11 Pro, Ubuntu 24.10 Desktop

Performance synthétique de pointe

Le test FIO est un outil d'analyse comparative flexible et puissant utilisé pour mesurer les performances des périphériques de stockage, notamment les SSD et les disques durs. Il évalue des paramètres tels que la bande passante, les IOPS (opérations d'entrée/sortie par seconde) et la latence sous différentes charges de travail, comme les opérations de lecture/écriture séquentielles et aléatoires. Ce test permet d'évaluer les performances de pointe des systèmes de stockage, ce qui le rend utile pour comparer différents périphériques ou configurations. Nous avons mesuré les performances de pointe en rafale pour ce test, en limitant la charge de travail à une empreinte de 10 Go sur les deux SSD.

Globalement, le SSD de référence Phison E28 affiche des performances impressionnantes lors de nos tests synthétiques FIO, notamment sous charges de travail aléatoires. Si son débit séquentiel atteint un solide 14,000 8100 Mo/s en lecture et en écriture (légèrement en retrait par rapport aux modèles les plus performants comme le SN5 et le Renegade G4), il se distingue en opérations aléatoires 2.559K. Il a atteint 3.288 millions d'IOPS en lecture aléatoire, et XNUMX millions d'IOPS en écriture aléatoire, surpassant largement tous ses concurrents. La latence reste compétitive sur tous les plans, notamment sous des charges d'écriture importantes, où elle est même inférieure à sa latence de lecture. Globalement, cet échantillon de référence suggère que le contrôleur nouvelle génération de Phison constituera une amélioration significative pour tout SSD une fois commercialisé.

Test FIO (un débit MB/s/IOPS plus élevé est meilleur) Lecture séquentielle 128K (1T/64Q) Écriture séquentielle 128 Ko (1T/64Q) Lecture 4K aléatoire (16T/32Q) Écriture 4K aléatoire (16T/32Q)
SanDisk SN8100 15,000 0.56 Mo/s (latence moyenne de XNUMX ms) 14,100 0.59 Mo/s (latence moyenne de XNUMX ms) 2.312 M IOPS (latence moyenne de 0.22 ms) 2.144 M IOPS (latence moyenne de 0.24 ms)
Kingston Fury Renegade G5 14,600 0.57 Mo/s (latence moyenne de XNUMX ms) 14,100 0.59 Mo/s (latence moyenne de XNUMX ms) 2.028 M IOPS (latence moyenne de 0.25 ms) 2.028 M IOPS (latence moyenne de 0.25 ms)
Samsung 9100 Pro 14,600 0.57 Mo/s (latence moyenne de XNUMX ms) 13,300 0.63 Mo/s (latence moyenne de XNUMX ms) 2.734 M IOPS (latence moyenne de 0.18 ms) 2.734 M IOPS (latence moyenne de 0.19 ms)
SK hynix Platine P51 14,500 0.58 Mo/s (latence moyenne de XNUMX ms) 13,500 0.62 Mo/s (latence moyenne de XNUMX ms) 2.369 M IOPS (latence moyenne de 0.22 ms) 2.669 M IOPS (latence moyenne de 0.19 ms)
Crucial T705 14,400 0.58 Mo/s (latence moyenne de XNUMX ms) 12,300 0.68 Mo/s (latence moyenne de XNUMX ms) 1.585 M IOPS (latence moyenne de 0.32 ms) 2.703 M IOPS (latence moyenne de 0.19 ms)
Phison PS5028-E28 14,000 0.60 Mo/s (latence moyenne de XNUMX ms) 14,000 0.57 Mo/s (latence moyenne de XNUMX ms) 2.559 M IOPS (latence moyenne de 0.32 ms) 3.288 M IOPS (latence moyenne de 0.32 ms)
Lexar Professional NM1090 PRO 13,800 0.61 Go/s (latence moyenne de XNUMX ms) 13,600 0.62 Mo/s (latence moyenne de XNUMX ms) 2.073 M IOPS (latence moyenne de 0.32 ms) 2.215 M IOPS (latence moyenne de 0.23 ms)
PNY CS2150 10,400 0.80 Go/s (latence moyenne de XNUMX ms) 8,801 0.95 Mo/s (latence moyenne de XNUMX ms) 1.379 M IOPS (latence moyenne de 0.371 ms) 1.623 IOPS (latence moyenne de 0.32 ms)
P510 Crucial 8,835 0.90 Mio/s (latence moyenne de XNUMX ms) 9,961 0.80 Mo/s (latence moyenne de XNUMX ms) 1.163 M IOPS (latence moyenne de 0.44 ms) 1.196 M IOPS (latence moyenne de 0.51 ms)
Samsung 990 Pro 7,483 1.12 Mo/s (latence moyenne de XNUMX ms) 7,197 1.16 Mo/s (latence moyenne de XNUMX ms) 1.400 M IOPS (latence moyenne de 0.36 ms) 1.403 M IOPS (latence moyenne de 0.36 ms)
WD SN850X 2 To 6,632 0.76 Mo/s (latence moyenne de XNUMX ms) 7,235 0.92 Mo/s (latence moyenne de XNUMX ms) 1.2 M IOPS (latence moyenne de 0.43 ms) 825 0.62 IOPS (latence moyenne de XNUMX ms)

Temps de chargement moyen du LLM

Le test de temps de chargement moyen des LLM a évalué les temps de chargement de trois LLM différents : DeepSeek R1 7B, Meta Llama 3.2 11B et DeepSeek R1 32B. Chaque modèle a été testé 10 fois et le temps de chargement moyen a été calculé. Ce test mesure la capacité du lecteur à charger rapidement des modèles de langage volumineux (LLM) en mémoire. Les temps de chargement des LLM sont essentiels pour les tâches liées à l'IA, notamment pour l'inférence en temps réel et le traitement de vastes ensembles de données. Un chargement plus rapide permet au modèle de traiter rapidement les données, améliorant ainsi la réactivité de l'IA et réduisant les temps d'attente.

Ici, le Phison E28 se maintient parmi les meilleurs. Le chargement de DeepSeek R1 7B n'a pris que 2.57 secondes en moyenne, suivi de Meta Llama 3.2 11B en 3.64 secondes, et du plus grand modèle, DeepSeek R1 32B, en 4.34 secondes. Bien qu'il ne soit pas le plus rapide au classement général (ce titre revient aux SK hynix P51 et SN8100), le E28 se classe parmi les meilleurs. Ces résultats indiquent que le E28 peut certainement gérer les tâches exigeantes en IA sans latence.

Temps de chargement moyen du LLM (plus c'est bas, mieux c'est) DeepSeek R1 7 milliard Meta Llama 3.2 11B Vision DeepSeek R1 32 milliard
SK hynix Platine P51 2.5481s 3.5809s 4.1790s
SanDisk SN8100 2.5702s 3.5856s 4.2870s
Phison PS5028-E28 2.5730s 3.6380s 4.3407s
Samsung 9100 Pro 4 To 2.6173s 3.6017s 4.3735s
PNY CS2150 2.8107s 3.6820s 4.8962s
Crucial T705 2 To 2.8758s 3.6312s 5.1080s
Samsung 990 Pro 2 To 2.8758s 3.6312s 5.1080s
Crucial P510 1 To 2.8817s 3.6631s 5.0594s
WD SN850X 2 To 3.0082s 3.6543s 5.4844s
Kingston Fury Renegade G5 3.1843s 4.8009s 4.6523s
Lexar Professional NM1090 PRO 3.2135s 4.9504s 7.2108s

Stockage direct 3DMark

Le test de fonctionnalité 3DMark DirectStorage évalue la manière dont DirectStorage de Microsoft optimise le chargement des ressources de jeu sur les SSD PCIe. En réduisant la charge du processeur et en améliorant les vitesses de transfert de données, DirectStorage améliore les temps de chargement, en particulier lorsqu'il est associé à la compression GDeflate et à BypassIO de Windows 11. Ce test isole les performances de stockage pour mettre en évidence les améliorations potentielles de la bande passante lorsque DirectStorage est activé.

Ici, le SSD de référence Phison E28 affiche un débit solide et constant dans toutes les catégories. Avec 26.22 Go/s pour les transferts de fichiers compressés (GDeflate), il talonne de près le SK hynix P51 et rivalise avec d'autres disques haut de gamme comme le SN8100. Ses performances restent solides, même pour les transferts non compressés, affichant 10.89 Go/s avec DirectStorage activé et 7.46 Go/s avec DirectStorage désactivé. Le débit de décompression GDeflate était particulièrement élevé, à 65.58 Go/s, ce qui signifie que le E28 est bien équipé pour gérer les futures charges de travail de jeu et les titres gourmands en streaming. Cependant, les disques haut de gamme ont des marges très faibles.

Stockage direct 3DMark (Go/s, plus c'est mieux) Stockage vers VRAM (compression GDeflate) Stockage sur VRAM (DirectStorage activé, non compressé) Stockage sur VRAM (DirectStorage désactivé, non compressé) Stockage vers RAM (DirectStorage activé, non compressé) Stockage vers la RAM (DirectStorage désactivé, non compressé) Bande passante de décompression GDeflate
SK hynix Platine P51 26.32 11.20 7.75 12.85 9.46 64.68
Phison PS5028-E28 26.22 10.89 7.46 11.15 9.86 65.58
SanDisk SN8100 26.11 12.94 7.63 12.94 9.78 64.51
Crucial T705 2 To 25.75 10.71 8.79 12.03 8.83 66.36
Lexar Professional NM1090 PRO 24.03 11.23 7.57 12.18 8.72 63.15
Samsung 9100 Pro 4 To 23.77 11.26 8.92 11.62 9.48 66.61
Kingston Fury Renegade G5 23.29 10.03 7.44 11.81 9.63 65.79
PNY CS2150 19.49 8.60 6.98 9.22 7.70 62.43
WD SN850X 2 To 15.28 11.11 8.93 6.78 6.27 64.96
Samsung 990 Pro 2 To 14.18 11.28 8.84 6.57 6.20 65.71
Crucial P510 1 To 19.63 8.33 6.92 9.06 7.49 66.22

Test de vitesse du disque Blackmagic

Le test de vitesse du disque Blackmagic évalue les vitesses de lecture et d'écriture d'un disque, en évaluant ses performances, en particulier pour les tâches de montage vidéo. Il aide les utilisateurs à s'assurer que leur stockage est suffisamment rapide pour le contenu haute résolution, comme la vidéo 4K ou 8K.

Le SSD de référence Phison E28 s'est hissé en tête du classement, affichant des vitesses de lecture de 11,216 10,571 Mo/s et d'écriture de 8100 5 Mo/s. Il s'agit d'une nette avance en lecture sur ses concurrents les plus proches, notamment le SanDisk SN4 et le Kingston Fury Renegade G8. Ces résultats indiquent que le contrôleur est déjà bien optimisé pour les applications vidéo à haut débit, comme le montage vidéo XNUMXK/XNUMXK ou la lecture de séquences brutes.

Test du Phison E28 Blackmagic

Voici notre classement actuel des vitesses de disque Blackmagic :

Vitesse du disque Blackmagic (Mo/s, plus c'est élevé, mieux c'est) Lire Mo/s Écrire Mo/s
Phison PS5028-E28 11,216.1 10,570.7
SanDisk SN8100 10,005.2 10,581.0
Kingston Fury Renegade G5 9,665.0 10,831.0
Samsung 9100 Pro 4 To 9,542.3 9,907.9
SK hynix Platine P51 9,241.0 9,109.0
Lexar Professional NM1090 PRO 9,149.2 10,466.6
Crucial T705 2 To 8,464.2 10,256.4
Crucial P510 1 To 7,853.9 7,939.6
PNY CS2150 6,625.5 7,299.5
WD SN850X 2 To 5,862.6 5,894.8
Samsung 990 Pro 2 To 5,769.5 5,842.9

Stockage PCMark10

Les benchmarks de stockage PCMark 10 évaluent les performances de stockage en conditions réelles à l'aide de traces applicatives. Ils testent les disques système et de données, en mesurant la bande passante, les temps d'accès et la cohérence sous charge. Ces benchmarks offrent des informations pratiques allant au-delà des tests synthétiques, permettant aux utilisateurs de comparer efficacement les solutions de stockage modernes.

Le SSD de référence Phison PS5028-E28 a de nouveau pris la tête avec un score impressionnant de 9,347 1,333, surpassant tous les autres disques de notre comparatif. Bénéficiant d'une bande passante de 16 28 Mo/s et d'un temps d'accès moyen très faible de 5 µs, le EXNUMX affiche une excellente réactivité dans les charges de travail applicatives réelles. Cela est de bon augure pour l'avenir du contrôleur dans les futurs SSD GenXNUMX grand public et OEM.

Lecteur de données PCMark 10 (plus c'est élevé, mieux c'est) Note globale
Phison PS5028-E28 9,347
Crucial T705 2 To 8,783
SK hynix Platine P51 8,665
SanDisk SN8100 8,644
Lexar Professional NM1090 PRO 8,247
Kingston Fury Renegade G5 8,062
Samsung 9100 Pro 4 To 7,552
Samsung 990 Pro 2 To 7,173
Crucial P310 2 To 6,436
PNY CS2150 6,070
WD SN850X 2 To 4,988

Stockage 3DMark

Le benchmark de stockage 3DMark teste les performances de jeu de votre SSD en mesurant des tâches telles que le chargement, la sauvegarde de la progression, l'installation de fichiers et l'enregistrement des parties. Il évalue la capacité de votre stockage à gérer les activités de jeu réelles et prend en charge les dernières technologies de stockage pour des analyses de performances précises.

Le Phison PS5028-E28 a réalisé des performances exceptionnelles, obtenant un score de 5,879 8100, juste derrière le SanDisk SN28. Cela place le E5 largement devant plusieurs concurrents Gen28 haut de gamme, avec plusieurs centaines de points d'avance. Cette excellente performance du EXNUMX indique qu'il est parfaitement adapté aux charges de travail de jeu, notamment celles qui exploitent la technologie DirectStorage de Microsoft.

Benchmark Storage (plus c'est élevé, mieux c'est) Note globale
SanDisk SN8100 6,047
Phison PS5028-E28 5,879
Kingston Fury Renegade G5 5,670
Crucial T705 2 To 5,100
SK hynix Platine P51 5,082
Lexar Professional NM1090 PRO 4,828
Samsung 9100 Pro 4 To 4,779
Crucial P510 1 To 4,148
PNY CS2150 4,193
Samsung 990 Pro 2 To 4,128
WD SN850X 2 To 3,962
Crucial P310 2 To 3,848

Stockage direct du GPU

L'un des tests que nous avons menés sur ce banc d'essai était le test Magnum IO GPU Direct Storage (GDS). GDS est une fonctionnalité développée par NVIDIA qui permet aux GPU de contourner le CPU lors de l'accès aux données stockées sur des disques NVMe ou d'autres périphériques de stockage haute vitesse. Au lieu de faire transiter les données par le CPU et la mémoire système, GDS permet une communication directe entre le GPU et le périphérique de stockage, réduisant ainsi considérablement la latence et améliorant le débit.

Comment fonctionne le stockage direct GPU

Traditionnellement, lorsqu'un GPU traite des données stockées sur un disque NVMe, les données doivent d'abord transiter par le processeur et la mémoire système avant d'atteindre le GPU. Ce processus introduit des goulots d'étranglement, car le processeur devient un intermédiaire, ce qui ajoute de la latence et consomme de précieuses ressources système. Le stockage direct GPU élimine cette inefficacité en permettant au GPU d'accéder directement aux données depuis le périphérique de stockage via le bus PCIe. Ce chemin direct réduit la surcharge associée au déplacement des données, permettant des transferts de données plus rapides et plus efficaces.

Les charges de travail de l’IA, en particulier celles impliquant l’apprentissage profond, sont très gourmandes en données. La formation de grands réseaux neuronaux nécessite le traitement de téraoctets de données, et tout retard dans le transfert de données peut entraîner une sous-utilisation des GPU et des temps de formation plus longs. Le stockage direct GPU relève ce défi en garantissant que les données sont transmises au GPU le plus rapidement possible, en minimisant les temps d’inactivité et en maximisant l’efficacité de calcul.

En outre, GDS est particulièrement utile pour les charges de travail impliquant la diffusion de grands ensembles de données, comme le traitement vidéo, le traitement du langage naturel ou l'inférence en temps réel. En réduisant la dépendance au processeur, GDS accélère le déplacement des données et libère les ressources du processeur pour d'autres tâches, améliorant ainsi encore les performances globales du système.

Résultats

Lors de notre test de stockage direct GPU (GDS), le disque de référence Phison PS5028-E28 a obtenu des résultats très compétitifs. Avec une taille de bloc de 16 Ko et une profondeur de file d'attente de 128, il atteint des vitesses de 3.7 Gio/s en lecture et de 2.4 Gio/s en écriture, comparables aux meilleurs disques de ce segment, comme le Kingston Renegade G5. La latence est également excellente : 0.519 ms en lecture et 0.824 ms en écriture, soit respectivement 245.1 Ko et 154.7 Ko d'IOPS.

Au niveau des blocs de 128 Ko, l'E28 conserve une position solide, atteignant 5.9 Gio/s en lecture comme en écriture, avec des latences légèrement supérieures à 2.6 ms, ce qui représente environ 48,000 5 IOPS. Ces résultats le placent au niveau des disques Gen8100 haut de gamme, tels que le SanDisk SN5 et le Kingston GXNUMX, mais avec une latence en écriture légèrement supérieure à la plupart.

Les performances restent impressionnantes même avec une taille de bloc exigeante de 1 M, où l'E28 atteint 6.4 Gio/s en lecture et 6.2 Gio/s en écriture. La latence à ce niveau avoisine les 20 ms, avec des IOPS de 6.5 6.4 et 28 XNUMX, là encore parmi les plus élevées de sa catégorie. Globalement, l'EXNUMX rivalise avec les leaders en matière de débit et excelle également dans le maintien d'une faible latence et d'IOPS élevés sur différentes tailles de blocs, ce qui en fait un choix judicieux pour les systèmes compatibles GDS qui privilégient la vitesse et la cohérence.

Voici un aperçu complet :

Graphique GDSIO (tailles moyennes des blocs 16 128, 1 XNUMX et XNUMX M) (Taille de bloc de 16 Ko, profondeur d'E/S de 128) Lecture moyenne (Taille de bloc de 16 Ko, profondeur d'E/S de 128) Écriture moyenne (Taille de bloc de 128 Ko, profondeur d'E/S de 128) Lecture moyenne (Taille de bloc de 128 Ko, profondeur d'E/S de 128) Écriture moyenne (Taille de bloc de 1 M, profondeur d'E/S de 128) Lecture moyenne (Taille de bloc de 1 M, profondeur d'E/S de 128) Écriture moyenne
Phison PS5028-E28 3.7 Gio/s (0.519 ms)
IOPS : 245.1 K
2.4 Gio/s (0.824 ms) IOPS : 154.7 K 5.9 Gio/s (2.647 ms) IOPS : 48.2 K 5.9 Gio/s (2.650 ms)
IOPS : 48.31 K
6.4 Gio/s (19.650 ms)
IOPS : 6.5 K
6.2 Gio/s (20.033 ms) IOPS : 6.4 K
Kingston Fury Renegade G5 3.7 Gio/s (0.526 ms) IOPS : 242.1 K 2.4 Gio/s (0.824 ms) IOPS : 154.7 K 5.9 Gio/s (2.704 ms) IOPS : 48.5 K 5.8 Gio/s (0.564 ms) IOPS : 47.3 K 6.5 Gio/s (19.356 ms) IOPS : 6.6 K 6.3 Gio/s (19.690 ms) IOPS : 6.5 K
Lexar Professional NM1090 PRO 3.6 Gio/s (0.533 ms) IOPS : 238.7 K 2.3 Gio/s (0.845 ms) IOPS : 150.8 K 5.9 Gio/s (2.639 ms) IOPS : 48.4 K 4.2 Gio/s (3.714 ms) IOPS : 34.4 K 6.5 Gio/s (19.274 ms) IOPS : 6.6 K 6.2 Gio/s (20.127 ms) IOPS : 6.4 K
SanDisk SN8100 3.4 Gio/s (0.564 ms) IOPS : 225.9 K 2.1 Gio/s (0.907 ms) IOPS : 140.6 K 5.9 Gio/s (2.626 ms) IOPS : 48.7 K 5.8 Gio/s (2.668 ms) IOPS : 47.9 K 6.5 Gio/s (19.264 ms) IOPS : 6.6 K 5.9 Gio/s (21.063 ms) IOPS : 6.1 K
Samsung 9100 Pro 4 To 3.4 Gio/s (0.565 ms) IOPS : 226.4 K 2.3 Gio/s (0.839 ms) IOPS : 161.7 K 5.2 Gio/s (3.001 ms) IOPS : 44.9 K 5.9 Gio/s (2.662 ms) IOPS : 47.3 K 6.3 Gio/s (19.877 ms) IOPS : 6.4 K 6.1 Gio/s (20.579 ms) IOPS : 6.2 K
Crucial T705 2 To 3.3 Gio/s (0.587 ms) IOPS : 217.0 K 2.3 Gio/s (0.836 ms) IOPS : 152.6 K 5.5 Gio/s (2.863 ms) IOPS : 44.7 K 5.6 Gio/s (2.799 ms) IOPS : 45.7 K 6.0 Gio/s (20.738 ms) IOPS : 6.2 K 6.0 Gio/s (20.855 ms) IOPS : 6.1 K
SK hynix Platine P51 3.1 Gio/s (0.634 ms) IOPS : 200.9 K 1.5 Gio/s (1.314 ms) IOPS : 97.2 K 5.6 Gio/s (2.781 ms) IOPS : 46.0 K 3.9 Gio/s (4.014 ms) IOPS : 31.9 K 6.2 Gio/s (20.126ms) IOPS : 6.4 K 4.2 Gio/s (29.576 ms) IOPS : 4.3 K
Samsung 990 Pro 2 To 2.7 Gio/s (0.731 ms) IOPS : 174.4 K 2.2 Gio/s (0.903 ms) IOPS : 141.2 K 4.0 Gio/s (3.944 ms) IOPS : 32.4 K 4.1 Gio/s (3.849 ms) IOPS : 33.2 K 3.9 Gio/s (32.415 ms) IOPS : 3.9 K 4.2 Gio/s (29.520 ms) IOPS : 4.3 K
PNY CS2150 2.5 Gio/s (0.779 ms) IOPS : 163.5 K 1.8 Gio/s (1.107 ms) IOPS : 115.3 K 4.5 Gio/s (3.473 ms) IOPS : 36.8 K 4.7 Gio/s (3.357 ms) IOPS : 38.1 K 4.6 Gio/s (27.157 ms) IOPS : 174.4 K 4.9 Gio/s (25.682 ms) IOPS : 5.0 XNUMX
P510 Crucial 2.3 Gio/s (0.837 ms) IOPS : 152.2 K 2.3 Gio/s (0.842 ms) IOPS : 151.5 K 4.5 Gio/s (3.450 ms) IOPS : 37.1 K 4.8 Gio/s (3.262 ms) IOPS : 39.2 K 4.8 Gio/s (26.2181 ms) IOPS : 4.9 K 5.0 Gio/s (25.121 ms) IOPS : 5.1 K
WDSN850X 2.3 Gio/s (0.736 ms) IOPS : 173.2 K 2.0 Gio/s (0.989 ms) IOPS : 129.0 K 4.1 Gio/s (3.878 ms) IOPS : 33.3 K 4.0 Gio/s (3.958 ms) IOPS : 33.0 K 4.4 Gio/s (30.501 ms) IOPS : 4.5 K 4.1 Gio/s (30.782 ms) IOPS : 4.2 K

Conclusion

Le Phison PS5028-E28 est un excellent choix pour les contrôleurs SSD Gen5, ciblant les charges de travail exigeant une faible latence et un débit élevé, comme le montage vidéo, l'inférence d'IA ou les jeux haute performance. Lors de nos tests approfondis, le SSD équipé du processeur E28 a constamment maintenu des performances comparables, voire supérieures, à celles des disques Gen5 haut de gamme, notamment pour les charges de travail séquentielles et aléatoires 4K. Ses IOPS en écriture aléatoire atteignent un niveau inégalé de 3.29 millions, et sa latence en lecture surpasse souvent celle de concurrents comme le SN8100 et le Renegade G5, démontrant ainsi l'étendue des améliorations apportées par Phison.

Phison E28

Bien sûr, nous avons testé un disque de référence exécutant une version préliminaire du firmware ; nous nous attendons donc à quelques ajustements finaux avant sa commercialisation (ce qui pourrait se traduire par des performances encore meilleures). Cependant, dès maintenant, l'E28 s'avère être un digne successeur de l'E26 et un concurrent légitime du SM2508 de Silicon Motion. Avec une excellente cohérence entre les tailles de blocs, des temps de chargement rapides pour les charges de travail LLM et DirectStorage, et la prise en charge des futures variantes axées sur l'IA, l'E28 offre à Phison la plateforme nécessaire pour rester compétitif lors de la prochaine phase d'adoption du stockage Gen5.

Ce contrôleur semble également très économe en énergie, un facteur essentiel dans les environnements mobiles et soumis à des contraintes thermiques. Bien que nous n'ayons pas vérifié de manière indépendante les données de consommation internes de Phison, les économies annoncées, pouvant atteindre un watt, lors de charges de travail exigeantes, suggèrent une avancée significative par rapport aux modèles Gen5 précédents. Grâce à sa faible consommation au repos (< 5 mW en L1.2), le E28 s'annonce comme une option haute performance rare, sans limitation ni surchauffe dans les systèmes plus fins. Néanmoins, nous sommes impatients de voir les performances de ce contrôleur une fois qu'il sera disponible dans les SSD grand public entièrement optimisés.

S'engager avec StorageReview

Bulletin d'information (en anglais) |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS