En tidig recension av Phison E28 SSD-kontrollern lyfter fram imponerande PCIe Gen5-hastigheter, exceptionella slumpmässiga IOPS och förbättrad energieffektivitet.
Phisons nya PS5028-E28 (”E28”)-kontroller är företagets andra generationens PCIe Gen5-klient-SSD-plattform, utformad för att utvinna varenda liten prestanda från 32 GT/s x4-gränssnittet. E6 är byggd på en 28nm-process och parar ihop KIOXIA BiCS8 NAND (upp till 2,400 XNUMX MT/s per kanal) med en trekärnig arkitektur som har två dedikerade Phison CoX-processorer som hanterar flashhantering och QoS.
Exempelmodellen vi har är en förhandsvisningsmodell. Phison skickade oss en referensdisk med sen betaversion av firmware som är "nära produktion". Baserat på erfarenhet körs tidiga firmware-diskar redan inom några procent av sina slutliga hastigheter; vi kan dock fortfarande förvänta oss en liten ökning när Phison finjusterar inställningarna för skräpinsamling och termisk strypning. Phisons mål är att ge oss något konkret att testa medan de slutför och justerar allt. Därför behandlar vi den här artikeln som en första titt snarare än en fullständig dom.
Phison PS5028-E28 Potentiell prestanda och energieffektivitet
Phison citerar imponerande topphastigheter på 14.9 GB/s läsning och 14 GB/s skrivning, med slumpmässig prestanda upp till 2.6 miljoner läs-IOPS och 3.0 miljoner skriv-IOPS. Kapaciteten kommer att spänna över 1 TB, 2 TB och 4 TB i det välbekanta enkelsidiga M.2 2280-formfaktorn, och styrenheten stöder hela NVMe 2.0-funktionsuppsättningen, plus granularitet i strömförbrukning ner till ett L1.2-viloläge på under 5 mW.
Förra årets Gen4 E26 uppnådde maximala läshastigheter på cirka 12 GB/s, skrivhastigheter på 11 GB/s och 1.5 miljoner till 2.0 miljoner IOPS på en 12nm-process. Phisons övergång till Gen5 via en 6nm-process, bredare kanalparallellism och omarbetad strömförsörjningslogik gör det möjligt för E28 att leverera ungefär 25–30 % högre sekventiella hastigheter och upp till 50 % bättre prestanda för slumpmässig I/O, samtidigt som den minskar både aktiv och inaktiv strömförbrukning. Enligt Phisons interna riktmärken överträffar E28 SM2508 i energieffektivitet, vilket kan vara avgörande för termiskt begränsade miljöer som kompakta stationära eller bärbara datorer.
Även om vi inte oberoende validerade dessa siffror i våra effekttester, har Phison delat interna data som jämför deras E28-referensdesign med vad de kallar "Konkurrent S" (möjligen SMI:s SM2508). Enligt Phisons diagram drar E28 mätbart mindre ström under både sekventiella och slumpmässiga arbetsbelastningar. Till exempel, vid sekventiell ihållande läsning och skrivning vid QD8/T1, rapporterar Phison en strömförbrukningsfördel på ungefär 1 watt jämfört med konkurrerande styrenheter.
Liknande marginaler observeras även i slumpmässiga QD32/T16-arbetsbelastningar, där E28 bibehåller lägre effekt över hela linjen. Phison siktar på att minska effektivitetsgapet som bildades under SM2508:s uppgång, och baserat på deras siffror verkar de göra betydande framsteg.
Klientbärbara datorer kommer att dra nytta av dessa förbättringar i energieffektivitet. Phison uppger att ungefär hälften av alla bärbara datorer som levereras i år kommer att ha en Gen5-kompatibel kortplats, trots att de flesta OEM-tillverkare fortfarande använder Gen4-hårddiskar för att hantera kostnader och värmehantering. Eftersom E28:s viloläge är specificerad till under 5 mW i L1.2, ser det äntligen ut som möjligt att placera en riktig 14 GB/s-hårddisk i mobila arbetsstationer utan att belasta batteriet.
Phision E28 Referensdesign Bygg
Sammantaget har E28 en typisk högpresterande Gen5 SSD-konstruktion, optimerad för bandbredd och termisk effektivitet. Som du kan se nedan är en Gen5-kontroller byggd på en 6nm-nod parad med en enda SK hynix DRAM-modul (H5AG46C8Y8R), vilket är avgörande för att upprätthålla jämn prestanda under belastning, särskilt med högkapacitets- eller slumpmässigt tunga arbetsbelastningar.
Bredvid DRAM-minnet finns två NAND-flashpaket märkta 'TBi08G1BSA2', vardera innehållande en 1TB KIOXIA BiCS8 TLC NAND-chip, för totalt 2TB. Dessa chips kan köras med hastigheter upp till 2400 MT/s. Den enkelsidiga PCB-layouten gör att enheten passar bra för system med begränsat utrymme, såsom bärbara datorer och kompakta stationära datorer. Phison har också indikerat att kommande designer kommer att stödja LPDDR5, vilket kommer att bidra till att ytterligare minska strömförbrukningen. Denna layout gynnar också värmehanteringen genom att möjliggöra mer effektiva passiva eller aktiva kyllösningar.
Phision E28-familjen
Phison positionerar också E28 som en familj av styrenheter snarare än en enda klientdel. Vid sidan av konsumentenheten vi testar, en E28 DC En variant är under utveckling för företagsarbetsbelastningar, medan en E28 AI-modell kommer att integrera inbyggda inferenskrokar för Phisons aiDAPTIV+-ramverk. Detta liknar hur E26 lade till E26-DC och så småningom drev några AI-acceleratorkort; E28:s högre maximum bör dock ge systembyggare mer utrymme för ihållande scenarier med blandade IO.
Med allt detta sagt ska vi nu testa E28 genom hela vår uppsättning verkliga riktmärken för att se hur den presterar.
Phison PS5028-E28 “E28” Förhandsversionsspecifikationer
Specifikation | Detalj |
Kapacitet* | 1 TB (1,000 2 GB), 2,000 TB (4 4,000 GB), XNUMX TB (XNUMX XNUMX GB) |
Formfaktor | M.2 2280-S3-M – enkelsidig modul |
Controller och process | Phison PS5028-E28 (6 nm, 3-kärnig + 2 CoX-medprocessorer) |
NAND Flash | KIOXIA BiCS8 TLC; Toggle 5.2 @ 2400 MT/s; upp till 2 × BGA308-paket (32 CE) |
Gränssnitt / Protokoll | PCIe 5.0 ×4, NVMe 2.0 (bakåtkompatibel med Gen4/3/2/1) |
Sekventiell prestanda |
|
Slumpmässig prestanda (4 KB, QD 128) |
|
Pålitlighet | MTBF 1.5 miljoner timmar | UBER < 1 × 1016 |
drifttemperatur | 0 °C – 70 °C (drift) | –40 °C – 85 °C (förvaring) |
Power Management | PS0–PS4, APST, ASPM, PCIe L1.2 Tomgång (L1.2) < 5 mW | Aktiv förbrukning – ännu ej fastställd |
Funktioner för dataintegritet | LDPC + RAID ECC, SRAM ECC, SmartRefresh, End-to-End-sökvägsskydd |
Säkerhet | TCG Pyrite 1.0, NVMe-sanering, signerad firmwareuppdatering |
Övriga funktioner | Dynamisk slitageutjämning, hantering av dåliga blockeringar, SMART, TRIM, termisk strypning |
Phison PS5028-E28 Prestanda
Jämförbara
Innan vi går in på riktmärkena, här är en lista över jämförbara Gen5-hårddiskar som testats tillsammans med en 2TB Phison PS5028-E28 (E28) referensdesign, tillsammans med några Gen4 SSD-diskar:
- PNY CS2150
- Lexar Professional NM1090 PRO
- SK hynix Platinum P51
- Kingston FURY Renegade G5
- SanDisk WD_BLACK SN8100
- Avgörande T705
- Avgörande P510
- Samsung 9100 Pro
- Samsung 990 Pro (PCIe Gen4)
- WD SN850X (PCIe Gen4)
Vi har utsatt dessa hårddiskar för olika tester för att utvärdera deras prestanda i verkligheten och syntetiskt. Detta inkluderar LLM-laddningstider för att mäta hur snabbt de hanterar stora AI-modeller, DirectStorage-tester för att bedöma hur snabbt de laddar spelresurser och bearbetar data i spelet, och Blackmagic Design-tester för att utvärdera läs- och skrivhastigheter för högupplöst videoredigering. Vi kommer också att köra PCMark 10 för att mäta systemets övergripande respons, 3DMark Storage för att testa spelprestanda och FIO-tester för att mäta maximala sekventiella och slumpmässiga läs-/skrivhastigheter under tunga arbetsbelastningar.
Här är den högpresterande testriggen vi använde för benchmarking:
- CPU: AMD Ryzen 7 9800X3D
- Moderkort: Asus ROG Crosshair X870E Hero
- RAM: G.SKILL Trident Z5 Royal-serien DDR5-6000 (2x16GB)
- GPU: NVIDIA GeForce RTX 4090
- Operativsystem: Windows 11 Pro, Ubuntu 24.10 Desktop
Peak syntetisk prestanda
FIO-testet är ett flexibelt och kraftfullt benchmarkingverktyg som används för att mäta prestanda hos lagringsenheter, inklusive SSD:er och hårddiskar. Den utvärderar mätvärden som bandbredd, IOPS (Input/Output Operations Per Second) och latens under olika arbetsbelastningar, som sekventiella och slumpmässiga läs-/skrivoperationer. Detta test hjälper till att bedöma toppprestanda för lagringssystem, vilket gör det användbart för att jämföra olika enheter eller konfigurationer. Vi mätte peak burst-prestanda för detta test, vilket begränsade arbetsbelastningen till ett 10 GB fotavtryck på båda SSD:erna.
Sammantaget levererar Phison E28 referens-SSD imponerande prestandaresultat i våra syntetiska FIO-tester, särskilt när det gäller slumpmässiga arbetsbelastningar. Medan dess sekventiella dataflöde når starka 14,000 8100 MB/s för både läsning och skrivning (något bakom toppresterande enheter som SN5 och Renegade G4), sticker den ut i slumpmässiga 2.559K-operationer. Här uppnådde den 3.288 miljoner IOPS i slumpmässiga läsningar, med imponerande XNUMX miljoner IOPS i slumpmässiga skrivningar, där den senare lätt överträffar alla konkurrenter. Latensen förblir konkurrenskraftig över hela linjen, särskilt under skrivtunga belastningar, där den faktiskt sjunker under sin läslatens. Sammantaget tyder detta referensexempel på att Phisons nästa generations styrenhet kommer att vara en betydande förbättring av vilken SSD som helst när den når detaljhandelsmarknaden.
FIO-test (högre MB/s/IOPS är bättre) | Sekventiell 128K Read (1T/64Q) | Sekventiell 128K Write (1T/64Q) | Slumpmässig 4K-läsning (16T/32Q) | Slumpmässig 4K-skrivning (16T/32Q) |
SanDisk SN8100 | 15,000 0.56 MB/s (XNUMX ms genomsnittlig latens) | 14,100 0.59 MB/s (XNUMX ms genomsnittlig latens) | 2.312M IOPS (0.22ms genomsnittlig latens) | 2.144M IOPS (0.24ms genomsnittlig latens) |
Kingston FURY Renegade G5 | 14,600 0.57 MB/s (XNUMX ms genomsnittlig latens) | 14,100 0.59 MB/s (XNUMX ms genomsnittlig latens) | 2.028M IOPS (0.25ms genomsnittlig latens) | 2.028M IOPS (0.25ms genomsnittlig latens) |
Samsung 9100 Pro | 14,600 0.57 MB/s (XNUMX ms genomsnittlig latens) | 13,300 0.63 MB/s (XNUMX ms genomsnittlig latens) | 2.734M IOPS (0.18ms genomsnittlig latens) | 2.734M IOPS (0.19ms genomsnittlig latens) |
SK hynix Platinum P51 | 14,500 0.58 MB/s (XNUMX ms genomsnittlig latens) | 13,500 0.62 MB/s (XNUMX ms genomsnittlig latens) | 2.369M IOPS (0.22ms genomsnittlig latens) | 2.669M IOPS (0.19ms genomsnittlig latens) |
Avgörande T705 | 14,400 0.58 MB/s (XNUMX ms genomsnittlig latens) | 12,300 0.68 MB/s (XNUMX ms genomsnittlig latens) | 1.585M IOPS (0.32ms genomsnittlig latens) | 2.703M IOPS (0.19ms genomsnittlig latens) |
Phison PS5028-E28 | 14,000 0.60 MB/s (XNUMX ms genomsnittlig latens) | 14,000 0.57 MB/s (XNUMX ms genomsnittlig latens) | 2.559M IOPS (0.32ms genomsnittlig latens) | 3.288M IOPS (0.32ms genomsnittlig latens) |
Lexar Professional NM1090 PRO | 13,800 0.61 GB/s (XNUMX ms genomsnittlig latens) | 13,600 0.62 MB/s (XNUMX ms genomsnittlig latens) | 2.073M IOPS (0.32ms genomsnittlig latens) | 2.215M IOPS (0.23ms genomsnittlig latens) |
PNY CS2150 | 10,400 0.80 GB/s (XNUMX ms genomsnittlig latens) | 8,801 0.95 MB/s (XNUMX ms genomsnittlig latens) | 1.379 miljoner IOPS (0.371 ms genomsnittlig latens) | 1.623 IOPS (0.32 ms genomsnittlig latens) |
Avgörande P510 | 8,835 0.90 MiB/s (XNUMX ms genomsnittlig latens) | 9,961 0.80 MB/s (XNUMX ms genomsnittlig latens) | 1.163M IOPS (0.44ms genomsnittlig latens) | 1.196M IOPS (0.51ms genomsnittlig latens) |
Samsung 990 Pro | 7,483 1.12 MB/s (XNUMX ms genomsnittlig latens) | 7,197 1.16 MB/s (XNUMX ms genomsnittlig latens) | 1.400M IOPS (0.36ms genomsnittlig latens) | 1.403M IOPS (0.36ms genomsnittlig latens) |
WD SN850X 2TB | 6,632 0.76 MB/s (XNUMX ms genomsnittlig latens) | 7,235 0.92 MB/s (XNUMX ms genomsnittlig latens) | 1.2M IOPS (0.43ms genomsnittlig latens) | 825K IOPS (0.62ms genomsnittlig latens) |
Genomsnittlig LLM-laddningstid
Testet Average LLM Load Time utvärderade laddningstiderna för tre olika LLM:er: DeepSeek R1 7B, Meta Llama 3.2 11B och DeepSeek R1 32B. Varje modell testades 10 gånger och den genomsnittliga laddningstiden beräknades. Detta test mäter hårddiskens förmåga att snabbt ladda stora språkmodeller (LLM) till minnet. LLM-laddningstider är avgörande för AI-relaterade uppgifter, särskilt för realtidsinferens och omfattande datamängdbearbetning. Snabbare laddning gör det möjligt för modellen att bearbeta data snabbt, vilket förbättrar AI-responsen och minskar väntetiden.
Här håller Phison E28 sin plats bland toppresterande. Det tog bara 1 sekunder i genomsnitt att ladda DeepSeek R7 2.57B, medan Meta Llama 3.2 11B följde på 3.64 sekunder, och den största modellen, DeepSeek R1 32B, som slutförde den på 4.34 sekunder. Även om den inte var snabbast totalt sett (den titeln går till SK hynix P51 och SN8100), hamnar E28 i den övre nivån. Dessa resultat indikerar att E28:s förmåga definitivt kan hantera AI-tunga uppgifter utan lagg.
Genomsnittlig LLM-laddningstid (lägre är bättre) | DeepSeek R1 7B | Meta Llama 3.2 11B Vision | DeepSeek R1 32B |
SK hynix Platinum P51 | 2.5481s | 3.5809s | 4.1790s |
SanDisk SN8100 | 2.5702s | 3.5856s | 4.2870s |
Phison PS5028-E28 | 2.5730s | 3.6380s | 4.3407s |
Samsung 9100 Pro 4 TB | 2.6173s | 3.6017s | 4.3735s |
PNY CS2150 | 2.8107s | 3.6820s | 4.8962s |
Crucial T705 2TB | 2.8758s | 3.6312s | 5.1080s |
Samsung 990 Pro 2 TB | 2.8758s | 3.6312s | 5.1080s |
Avgörande P510 1TB | 2.8817s | 3.6631s | 5.0594s |
WD SN850X 2TB | 3.0082s | 3.6543s | 5.4844s |
Kingston FURY Renegade G5 | 3.1843s | 4.8009s | 4.6523s |
Lexar Professional NM1090 PRO | 3.2135s | 4.9504s | 7.2108s |
3DMark Direct Storage
3DMark DirectStorage Feature Test utvärderar hur Microsofts DirectStorage optimerar laddning av speltillgångar på PCIe SSD:er. Genom att minska CPU-overhead och förbättra dataöverföringshastigheterna förbättrar DirectStorage laddningstiderna, särskilt när den är ihopkopplad med GDeflate-komprimering och Windows 11:s BypassIO. Detta test isolerar lagringsprestanda för att belysa de potentiella bandbreddsförbättringarna när DirectStorage är aktiverat.
Här visar Phison E28 referens-SSD:n stark och konsekvent dataöverföring i alla kategorier. Med 26.22 GB/s för komprimerade dataöverföringar (GDeflate) ligger den nära SK hynix P51 och matchar andra toppklassiga hårddiskar som SN8100. Dess prestanda förblir solid, även under okomprimerade överföringar, med 10.89 GB/s med DirectStorage aktiverat och 7.46 GB/s med det inaktiverat. GDeflate-dekompressionsdataöverföringen var särskilt stark på 65.58 GB/s, vilket innebär att E28 är väl rustad för att hantera framtida spelbelastningar och streamingintensiva titlar. I slutändan har dock de få bästa hårddiskarna mycket snäva marginaler.
3DMark Direct Storage (GB/s, högre desto bättre) | Lagring till VRAM (GDeflate Compression) | Lagring till VRAM (DirectStorage på, okomprimerad) | Lagring till VRAM (DirectStorage av, okomprimerad) | Lagring till RAM (DirectStorage på, okomprimerat) | Lagring till RAM (DirectStorage av, okomprimerat) | GDeflate dekompressionsbandbredd |
SK hynix Platinum P51 | 26.32 | 11.20 | 7.75 | 12.85 | 9.46 | 64.68 |
Phison PS5028-E28 | 26.22 | 10.89 | 7.46 | 11.15 | 9.86 | 65.58 |
SanDisk SN8100 | 26.11 | 12.94 | 7.63 | 12.94 | 9.78 | 64.51 |
Crucial T705 2TB | 25.75 | 10.71 | 8.79 | 12.03 | 8.83 | 66.36 |
Lexar Professional NM1090 PRO | 24.03 | 11.23 | 7.57 | 12.18 | 8.72 | 63.15 |
Samsung 9100 Pro 4 TB | 23.77 | 11.26 | 8.92 | 11.62 | 9.48 | 66.61 |
Kingston FURY Renegade G5 | 23.29 | 10.03 | 7.44 | 11.81 | 9.63 | 65.79 |
PNY CS2150 | 19.49 | 8.60 | 6.98 | 9.22 | 7.70 | 62.43 |
WD SN850X 2TB | 15.28 | 11.11 | 8.93 | 6.78 | 6.27 | 64.96 |
Samsung 990 Pro 2 TB | 14.18 | 11.28 | 8.84 | 6.57 | 6.20 | 65.71 |
Avgörande P510 1TB | 19.63 | 8.33 | 6.92 | 9.06 | 7.49 | 66.22 |
Blackmagic Disk Speed Test
Blackmagic Disk Speed Test jämför en enhets läs- och skrivhastigheter och uppskattar dess prestanda, speciellt för videoredigeringsuppgifter. Det hjälper användare att säkerställa att deras lagring är tillräckligt snabb för högupplöst innehåll, som 4K- eller 8K-video.
Referens-SSD:n Phison E28 hamnade högst upp på listan med 11,216 10,571 MB/s läshastighet och 8100 5 MB/s skrivhastighet. Detta markerar en tydlig ledning i läshastigheter jämfört med sina närmaste konkurrenter, inklusive SanDisk SN4 och Kingston Fury Renegade G8. Dessa resultat indikerar att styrenheten redan är väloptimerad för videoarbetsbelastningar med hög bandbredd, såsom XNUMXK/XNUMXK-videoredigering eller uppspelning av råmaterial.
Här är vår nuvarande topplista över Blackmagic-diskhastigheter:
Blackmagic-diskhastighet (MB/s, högre desto bättre) | Läs MB/s | Skriv MB/s |
Phison PS5028-E28 | 11,216.1 | 10,570.7 |
SanDisk SN8100 | 10,005.2 | 10,581.0 |
Kingston FURY Renegade G5 | 9,665.0 | 10,831.0 |
Samsung 9100 Pro 4 TB | 9,542.3 | 9,907.9 |
SK hynix Platinum P51 | 9,241.0 | 9,109.0 |
Lexar Professional NM1090 PRO | 9,149.2 | 10,466.6 |
Crucial T705 2TB | 8,464.2 | 10,256.4 |
Avgörande P510 1TB | 7,853.9 | 7,939.6 |
PNY CS2150 | 6,625.5 | 7,299.5 |
WD SN850X 2TB | 5,862.6 | 5,894.8 |
Samsung 990 Pro 2 TB | 5,769.5 | 5,842.9 |
PCMark10-lagring
PCMark 10 Storage Benchmarks utvärderar verklig lagringsprestanda med hjälp av applikationsbaserade spårningar. De testar system- och dataenheter, mäter bandbredd, åtkomsttider och konsistens under belastning. Dessa riktmärken erbjuder praktiska insikter utöver syntetiska tester, vilket gör det möjligt för användare att effektivt jämföra moderna lagringslösningar.
Phison PS5028-E28 referens-SSD tog återigen topplaceringen med ett imponerande betyg på 9,347 1,333, vilket överträffade alla andra hårddiskar i vår jämförelsepool. Med en bandbredd på 16 28 MB/s och en mycket låg genomsnittlig åtkomsttid på 5 µs, visar EXNUMX stark respons i verkliga applikationsbelastningar. Detta bådar gott för kontrollerns framtid i kommande GenXNUMX-konsument- och OEM-SSD:er.
PCMark 10 Data Drive (högre är bättre) | Totala poängen |
Phison PS5028-E28 | 9,347 |
Crucial T705 2TB | 8,783 |
SK hynix Platinum P51 | 8,665 |
SanDisk SN8100 | 8,644 |
Lexar Professional NM1090 PRO | 8,247 |
Kingston FURY Renegade G5 | 8,062 |
Samsung 9100 Pro 4 TB | 7,552 |
Samsung 990 Pro 2 TB | 7,173 |
Avgörande P310 2TB | 6,436 |
PNY CS2150 | 6,070 |
WD SN850X 2TB | 4,988 |
3DMark-lagring
3DMark Storage Benchmark testar din SSD:s spelprestanda genom att mäta uppgifter som att ladda spel, spara framsteg, installera spelfiler och spela in spel. Den utvärderar hur väl din lagring hanterar spelaktiviteter i den verkliga världen och stöder den senaste lagringstekniken för exakta prestandainsikter.
Phison PS5028-E28 presterade exceptionellt bra och uppnådde en poäng på 5,879 8100, vilket var näst bäst efter SanDisk SN28. Detta placerar E5 bekvämt före flera avancerade Gen28-utmanare med flera hundra poäng. EXNUMX:s starka resultat här indikerar att den är väl lämpad för spelbelastningar, särskilt de som utnyttjar Microsofts DirectStorage-teknik.
3DMark Storage benchmark (högre är bättre) | Totala poängen |
SanDisk SN8100 | 6,047 |
Phison PS5028-E28 | 5,879 |
Kingston FURY Renegade G5 | 5,670 |
Crucial T705 2TB | 5,100 |
SK hynix Platinum P51 | 5,082 |
Lexar Professional NM1090 PRO | 4,828 |
Samsung 9100 Pro 4 TB | 4,779 |
Avgörande P510 1TB | 4,148 |
PNY CS2150 | 4,193 |
Samsung 990 Pro 2 TB | 4,128 |
WD SN850X 2TB | 3,962 |
Avgörande P310 2TB | 3,848 |
GPU direkt lagring
Ett av testerna vi genomförde på denna testbänk var Magnum IO GPU Direct Storage (GDS)-testet. GDS är en funktion utvecklad av NVIDIA som gör att GPU:er kan kringgå CPU:n när de kommer åt data lagrade på NVMe-enheter eller andra höghastighetslagringsenheter. Istället för att dirigera data genom processorn och systemminnet, möjliggör GDS direkt kommunikation mellan GPU:n och lagringsenheten, vilket avsevärt minskar latensen och förbättrar datagenomströmningen.
Hur GPU Direct Storage fungerar
Traditionellt, när en GPU bearbetar data lagrad på en NVMe-enhet, måste data först färdas genom CPU:n och systemminnet innan de når GPU:n. Denna process introducerar flaskhalsar, eftersom CPU:n blir en mellanhand, lägger till latens och förbrukar värdefulla systemresurser. GPU Direct Storage eliminerar denna ineffektivitet genom att göra det möjligt för GPU:n att komma åt data direkt från lagringsenheten via PCIe-bussen. Denna direkta väg minskar de omkostnader som är förknippade med datarörelser, vilket möjliggör snabbare och mer effektiva dataöverföringar.
AI-arbetsbelastningar, särskilt de som involverar djupinlärning, är mycket dataintensiva. Att träna stora neurala nätverk kräver bearbetning av terabyte med data, och varje fördröjning i dataöverföringen kan leda till underutnyttjade GPU:er och längre träningstider. GPU Direct Storage hanterar denna utmaning genom att säkerställa att data levereras till GPU:n så snabbt som möjligt, vilket minimerar vilotiden och maximerar beräkningseffektiviteten.
Dessutom är GDS särskilt fördelaktigt för arbetsbelastningar som involverar streaming av stora datamängder, såsom videobearbetning, naturlig språkbehandling eller realtidsinferens. Genom att minska beroendet av CPU:n påskyndar GDS datarörelsen och frigör CPU-resurser för andra uppgifter, vilket ytterligare förbättrar den övergripande systemets prestanda.
Resultat
I vårt GPU Direct Storage (GDS)-testresultat visade Phison PS5028-E28-referensdisken mycket konkurrenskraftiga resultat. Med en blockstorlek på 16K och ett ködjup på 128 uppnår den 3.7 GiB/s läshastighet och 2.4 GiB/s skrivhastighet, vilket matchar de bästa diskarna i detta segment, såsom Kingston Renegade G5. Latensen är också stabil på 0.519 ms för läsning och 0.824 ms för skrivning, vilket motsvarar 245.1K respektive 154.7K IOPS.
På 128K-blocknivån har E28 en stark position och uppnår 5.9 GiB/s i både läsning och skrivning, med latenser strax över 2.6 ms, vilket ger ~48,000 5 IOPS. Dessa resultat placerar den i linje med toppklassiga Gen8100-diskar, som SanDisk SN5 och Kingston GXNUMX, men med något bättre skrivlatens än de flesta.
Prestandan är fortsatt imponerande även vid den krävande blockstorleken på 1 MB, där E28 uppnår 6.4 GiB/s läsningar och 6.2 GiB/s skrivningar. Latensen i denna nivå ligger nära 20 ms, med IOPS vid 6.5K och 6.4K, återigen bland de högsta i klassen. Sammantaget matchar E28 inte bara ledarna i dataflöde utan utmärker sig också i att bibehålla låg latens och hög IOPS över olika blockstorlekar, vilket gör den till ett solidt val för GDS-aktiverade system som prioriterar hastighet och konsekvens.
Här är en fullständig sammanfattning:
GDSIO-diagram (16K,128K,1M blockstorleksmedelvärden) | (16K blockstorlek 128 IO-djup) Genomsnittlig avläsning | (16K blockstorlek 128 IO-djup) Genomsnittlig skrivning | (128K blockstorlek 128 IO-djup) Genomsnittlig avläsning | (128K blockstorlek 128 IO-djup) Genomsnittlig skrivning | (1M blockstorlek 128 IO-djup) Genomsnittlig avläsning | (1M blockstorlek 128 IO-djup) Genomsnittlig skrivning |
Phison PS5028-E28 | 3.7 GiB/s (0.519 ms) IOPS: 245.1K |
2.4 GiB/s (0.824 ms) IOPS: 154.7K | 5.9 GiB/s (2.647 ms) IOPS: 48.2K | 5.9 GiB/s (2.650 ms) IOPS: 48.31K |
6.4 GiB/s (19.650 ms) IOPS: 6.5K |
6.2 GiB/s (20.033 ms) IOPS: 6.4K |
Kingston FURY Renegade G5 | 3.7 GiB/s (0.526 ms) IOPS: 242.1K | 2.4 GiB/s (0.824 ms) IOPS: 154.7K | 5.9 GiB/s (2.704 ms) IOPS: 48.5K | 5.8 GiB/s (0.564 ms) IOPS: 47.3K | 6.5 GiB/s (19.356 ms) IOPS: 6.6K | 6.3 GiB/s (19.690 ms) IOPS: 6.5K |
Lexar Professional NM1090 PRO | 3.6 GiB/s (0.533 ms) IOPS: 238.7K | 2.3 GiB/s (0.845 ms) IOPS: 150.8K | 5.9 GiB/s (2.639 ms) IOPS: 48.4K | 4.2 GiB/s (3.714 ms) IOPS: 34.4K | 6.5 GiB/s (19.274 ms) IOPS: 6.6K | 6.2 GiB/s (20.127 ms) IOPS: 6.4K |
SanDisk SN8100 | 3.4 GiB/s (0.564 ms) IOPS: 225.9K | 2.1 GiB/s (0.907 ms) IOPS: 140.6K | 5.9 GiB/s (2.626 ms) IOPS: 48.7K | 5.8 GiB/s (2.668 ms) IOPS: 47.9K | 6.5 GiB/s (19.264 ms) IOPS: 6.6K | 5.9 GiB/s (21.063 ms) IOPS: 6.1K |
Samsung 9100 Pro 4 TB | 3.4 GiB/s (0.565 ms) IOPS: 226.4K | 2.3 GiB/s (0.839 ms) IOPS: 161.7K | 5.2 GiB/s (3.001 ms) IOPS: 44.9K | 5.9 GiB/s (2.662 ms) IOPS: 47.3K | 6.3 GiB/s (19.877 ms) IOPS: 6.4K | 6.1 GiB/s (20.579 ms) IOPS: 6.2K |
Crucial T705 2TB | 3.3 GiB/s (0.587 ms) IOPS: 217.0K | 2.3 GiB/s (0.836 ms) IOPS: 152.6K | 5.5 GiB/s (2.863 ms) IOPS: 44.7K | 5.6 GiB/s (2.799 ms) IOPS: 45.7K | 6.0 GiB/s (20.738 ms) IOPS: 6.2K | 6.0 GiB/s (20.855 ms) IOPS: 6.1K |
SK hynix Platinum P51 | 3.1 GiB/s (0.634 ms) IOPS: 200.9K | 1.5 GiB/s (1.314 ms) IOPS: 97.2K | 5.6 GiB/s (2.781 ms) IOPS: 46.0K | 3.9 GiB/s (4.014 ms) IOPS: 31.9K | 6.2 GiB/s (20.126ms) IOPS: 6.4K | 4.2 GiB/s (29.576 ms) IOPS: 4.3K |
Samsung 990 Pro 2 TB | 2.7 GiB/s (0.731 ms) IOPS: 174.4K | 2.2 GiB/s (0.903 ms) IOPS: 141.2K | 4.0 GiB/s (3.944 ms) IOPS: 32.4K | 4.1 GiB/s (3.849 ms) IOPS: 33.2K | 3.9 GiB/s (32.415 ms) IOPS: 3.9K | 4.2 GiB/s (29.520 ms) IOPS: 4.3K |
PNY CS2150 | 2.5 GiB/s (0.779 ms) IOPS: 163.5K | 1.8 GiB/s (1.107 ms) IOPS: 115.3K | 4.5 GiB/s (3.473 ms) IOPS: 36.8K | 4.7 GiB/s (3.357 ms) IOPS: 38.1K | 4.6 GiB/s (27.157 ms) IOPS: 174.4K | 4.9 GiB/s (25.682 ms) IOPS: 5.0K |
Avgörande P510 | 2.3 GiB/s (0.837 ms) IOPS: 152.2K | 2.3 GiB/s (0.842 ms) IOPS: 151.5K | 4.5 GiB/s (3.450 ms) IOPS: 37.1K | 4.8 GiB/s (3.262 ms) IOPS: 39.2K | 4.8 GiB/s (26.2181 ms) IOPS: 4.9K | 5.0 GiB/s (25.121 ms) IOPS: 5.1K |
WD SN850X | 2.3 GiB/s (0.736 ms) IOPS: 173.2K | 2.0 GiB/s (0.989 ms) IOPS: 129.0K | 4.1 GiB/s (3.878 ms) IOPS: 33.3K | 4.0 GiB/s (3.958 ms) IOPS: 33.0K | 4.4 GiB/s (30.501 ms) IOPS: 4.5K | 4.1 GiB/s (30.782 ms) IOPS: 4.2K |
Slutsats
Phison PS5028-E28 är ett säkert insteg i Gen5 SSD-kontrollerarenan, riktat mot arbetsbelastningar som kräver låg latens och hög dataflöde, såsom videoredigering, AI-inferens eller högpresterande spel. Under våra omfattande tester bibehöll den E28-drivna SSD:n konsekvent prestandaparitet med, eller till och med överträffade, den hos toppklassiga Gen5-diskar, särskilt i sekventiella och slumpmässiga 4K-arbetsbelastningar. Det är slumpmässiga skriv-IOPS som nådde oöverträffade 3.29 miljoner, och dess läslatens överträffar ofta konkurrenter som SN8100 och Renegade G5, vilket visar hur mycket finjustering Phison har gjort under huven.
Naturligtvis testade vi en referensdisk som körde förhandsversion av firmware, så vi förväntar oss några sista justeringar innan den når butikshyllorna (vilket kan resultera i ännu bättre prestanda). Men även nu visar sig E28 vara en värdig efterträdare till E26 och en legitim rival till Silicon Motions SM2508. Med utmärkt konsekvens över blockstorlekar, snabba laddningstider i LLM- och DirectStorage-arbetsbelastningar och stöd för kommande AI-centrerade varianter, ger E28 Phison den plattform de behöver för att förbli konkurrenskraftiga genom nästa fas av Gen5-lagringsimplementering.
Den här kontrollern verkar också vara mycket energieffektiv, vilket är en kritisk faktor i mobila och termiskt begränsade miljöer. Även om vi inte oberoende verifierade Phisons interna effektdata, tyder de påstådda besparingarna på upp till en watt under krävande arbetsbelastningar på en betydande förbättring jämfört med tidigare Gen5-designer. Kombinerat med dess låga tomgångsförbrukning (<5 mW i L1.2) ser E28 ut att bli ett sällsynt högpresterande alternativ som inte stryper eller överhettas i tunnare system. Ändå är vi ivriga att se hur den här kontrollern presterar när den börjar levereras inuti helt optimerade SSD-diskar för återförsäljare.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde