Wir haben den Dezimalstellenrekord für log(2) in nur 3 Stunden auf 42.7 Billionen Stellen verdoppelt, was einer Effizienzsteigerung um etwa das 50-fache in 3 Jahren entspricht.
Das Folgende stammt von Jorge Zuniga, einem unabhängigen Bauingenieur, der sich auf die Suche nach mathematischen Rezepten konzentriert. Jorge hat mit Jordan daran gearbeitet, Server und Speicher in unserem Labor zu nutzen, um grundlegende Fortschritte in der Mathematik zu erzielen. Wir waren begeistert, gemeinsam mit Jorge an dieser Recherche teilnehmen zu dürfen, und unser kleines Teaser-Social-Media-Video von vor ein paar Wochen erhielt enorme Unterstützung.
Sieh diesen Beitrag auf Instagram
Seit diesem Video haben wir weiterhin mit Jorge zusammengearbeitet, um Modelle auf Workstations zu testen und sie dann vollständig auf den Workstations auszuführen Supermicro E1.S-Server, gefüllt mit KIOXIA XD7P E1.S SSDs. Die Dichte der Plattform und die Möglichkeit, so viele Laufwerke nahe an der CPU unterzubringen, machen sie zu einer großartigen Plattform für diese Art der Mathematikforschung.
Wir sind stolz, Jorges Erkenntnisse hier präsentieren zu können. – Brian Beeler
Die Qualitätskontrolle durch Stresstests stellt eine sinnvolle Strategie zur Bestimmung der tatsächlichen Kapazität einer bestimmten Hardwareeinrichtung dar. Die Berechnung von Zahlen ist eine weit verbreitete Praxis zur Umsetzung dieser Richtlinien. Insbesondere wenn Sie die tatsächliche Leistung Ihres Systems in professioneller Qualität bewerten möchten, stehen mehrere Tools zur Verfügung, um genaue Ergebnisse zu liefern.
Einer davon wurde in Österreich entwickelt und ist einer meiner Favoriten Matthias Zroneks BenchMate, das mehrere anspruchsvolle Stresstests für SSDs, Speicher, GPUs und CPUs enthält. Andere Hochleistungsrechnerpakete, wie z. B. GPUPI von Zronek, berechnen die Konstante π mithilfe der GPU. Die Berechnung der Dezimalstellen von π ist ein standardmäßiger und allgemeiner Test, der häufig in der wissenschaftlichen Fachpresse und einigen sozialen Netzwerken mit Schwerpunkt Mathematik aufgetaucht ist, wenn der Rekord bekannter Dezimalstellen gebrochen wurde. Heute, Es sind 100 Billionen Dezimalstellen (10^14) von π bekannt.
In BenchMate gibt es auch Alex Yees Y-Cruncher, eine Plattform, die die CPU-Multicore-Berechnung vieler mathematischer Konstanten, einschließlich π, mit extrem hoher Präzision ermöglicht und eine große Anzahl von Dezimalstellen liefert, die nur durch die Kapazität des Systems begrenzt ist. In diesem Fall können verschiedene Strategien verfolgt werden, z. B. die Wahl einer Konstante und die Belastung des Systems durch die Aufzeichnung der dafür benötigten Zeit, um eine ausreichend große Anzahl von Dezimalstellen zu berechnen. Dies bietet eine hervorragende Möglichkeit, die Leistung verschiedener isolierter Setups einzustufen und zu vergleichen.
Wenn genügend installierte Kapazität vorhanden ist, kann außerdem ein System-Setup durchgeführt werden, um die bekannte Anzahl von Dezimalstellen einer bestimmten Konstante aufzubrechen – eine Herausforderung, die StorageReview mit großem Erfolg annimmt. Wie berichtet in der Dezember Hinweis zum Jahr 2023: Ich habe mit dem StorageReview-Team zusammengearbeitet, um die bekannte Anzahl von Dezimalstellen für mehrere mathematische Konstanten zu verbessern. Es ist uns nicht nur gelungen, diese Rekorde zu brechen, sondern wir haben es auch in kürzester Zeit geschafft. Historisch gesehen war es normal, dass dafür Wochen oder Monate benötigt wurden. In Zusammenarbeit mit StorageReview haben wir dies für alle Konstanten in nur wenigen Stunden und in einigen Fällen durch eine Verdoppelung der Anzahl bekannter Dezimalstellen erreicht. Die bei StorageReview verfügbare Technologie hat Zeitverkürzungen um Größenordnungen ermöglicht. Eine Zusammenfassung dieser Ergebnisse und deren Details finden Sie hier hier.
Rekordergebnisse von y-cruncher. Eine vollständige Liste der von Y-Cruncher aufgestellten Rekorde finden Sie unter Zahlenwelt.
Dieser Hinweis bezieht sich genau auf diese Ergebnisse. Um eine Nachkommastellenaufzeichnung zu erreichen, muss in drei Ebenen vorgegangen werden.
Von unten beginnend ist die dritte oder letzte Ebene das Hardware-Setup; Dies bedeutet eine robuste SSD-Installation, leistungsstarke RAM-Kapazität und eine hochmoderne Multicore-CPU. Viele dieser Details und das verwendete Setup können online eingesehen werden hier.
Die zweite oder Zwischenschicht umfasst die Software, dh Y-Cruncher, die die Verbindung zwischen der ersten und der letzten Schicht darstellt. Um die Leistung zu steigern, verwaltet y-cruncher je nach Typ der Multicore-CPU im System unterschiedliche ausführbare Atomdateien. Das richtige ausführende Atom wird zum Zeitpunkt der Ausführung automatisch ausgewählt. Mit dem Tischtester kann der Benutzer eine Konstante auswählen und den entsprechenden Algorithmus anwenden. Dieser Algorithmus kann entweder direkt in das System integriert werden oder, falls nicht, verwendet er benutzerdefinierte Konfigurationsdateien für die Implementierung. Einzelheiten zur Implementierung und Verwendung von Y-Cruncher finden Sie unter Zahlenwelt. Die y-cruncher-Software befindet sich ständig in der Entwicklung und surft auf der Welle neuer Hardware-Technologien.
Die erste oder anfängliche Ebene ist der Algorithmus bzw. die mathematische Formel, die zur Berechnung der Konstante implementiert wird, die als Eingabe für y-cruncher dient. Jede Konstante kann durch eine unendliche Anzahl von Formeln dargestellt werden, von denen fast alle eine schlechte Leistung aufweisen, da viele mathematische Operationen nur wenige korrekte Ziffern liefern können.
Auf der anderen Seite befindet sich die Kategorie der effizienten Formeln. Davon sticht die hypergeometrische Reihe hervor. Innerhalb dieser Reihe gibt es eine Handvoll, die sich zum Brechen von Rekorden eignen, da sie in relativ kurzer Zeit viele Dezimalstellen liefern können. Tatsächlich ist die primäre Formel zur Berechnung von π, bekannt als Chudnovsky-Algorithmus, eine der hypergeometrischen Formeln.
In enger Zusammenarbeit mit dem StorageReview-Team haben wir uns auch der Herausforderung gestellt, nach diesen Formeln zu suchen, d. h. auf der ersten Ebene zu agieren, um eine sehr effiziente hypergeometrische Reihe zu erhalten, die es ermöglicht, die schnellste bekannte Formel zu finden. Wie wird das erreicht? Um verteiltes Computing anzuwenden, ist ein Multicore-Setup erforderlich, hoffentlich mit möglichst vielen physischen Kernen, da der Prozess sehr CPU-intensiv ist, aber leicht parallelisiert werden kann, was zu einer erheblichen Verkürzung der Rechenzeiten führt. Wenn die neue Formel erfolgreich ist, wird sie verwendet, um den Rekord an bekannten Dezimalstellen für diese Konstante zu brechen.
Wir verwendeten einen AMD Thearipper PRO 64WX mit 5995 Kernen, erstellten Codeskripte auf PARI-GP, einer Plattform für Zahlentheorie der Universität Bordeaux (Frankreich), und implementierten einen Suchalgorithmus. Das Ziel besteht darin, einen Satz von 64-Bit-Ganzzahlen zu identifizieren, die, wenn sie in die Parameter einer bestimmten hypergeometrischen Reihe mit einer bekannten festen Struktur eingefügt werden, die gesuchte Konstante ergeben. Dazu wird der LLL-Algorithmus – ein interner Teil von PARI GP – verwendet, der nach ganzzahligen linearen Beziehungen zwischen Gleitkommawerten mit mehreren Genauigkeiten sucht. Weitere mathematische Details finden Sie auf mathoverflow.net.
Wir begannen zunächst mit der Konstante ζ(5) = 1.036927755143 … da es keine sehr effiziente bekannte Formel gibt, die sich jedoch als sehr schwer zu fassen herausstellte. Wir konnten über die einzigartige hypergeometrische Reihe hinaus keine bekannte Formel finden, die übrigens nicht schnell genug ist. Nach ein paar erfolglosen Wochen wechselten wir zu einer hypergeometrischen Reihe für Logarithmen.
In diesem Fall hatten wir Erfolg, wir konnten die schnellsten bekannten Algorithmen für die Grundkonstanten log(2), log(3) und log(5) finden, wie hier beschrieben Blog.
Log(2) Formelsuche. Alle 64 physischen Kerne sind ausgelastet.
Bildschirmaufnahme. Schnellste gefundene Log(2)-Serie.
Log(2) StorageReview G2-Formel gefunden
Nachdem wir die Formeln entdeckt hatten, bereiteten wir die Skripte für Y-Cruncher vor. Jordan Ranous von Storagereview hat die Installation so konzipiert, dass sie die Anzahl der bekannten Dezimalstellen übertrifft. In diesem Fall ein Setup basierend auf 2x Intel Xeon Platinum 8460H und 512 GB SK Hynix RAM.
Dieses Setup verdoppelte den Dezimalstellenrekord für log(2) in nur 3 Stunden auf 42.7 Billionen Stellen. Ein zweiter neuer Algorithmus – die G2-Formel unten, die ebenfalls im StorageReview Lab zu finden ist – wurde zur Überprüfung der Dezimalstellen angewendet, was 58.3 Stunden Wandzeit in Anspruch nahm. Es ist zu beachten, dass der vorherige Rekord von 2021 98.9 bzw. 61.7 Tage für die Berechnung und Überprüfung von 1.5 Billionen Dezimalstellen benötigte. Dies bedeutet eine Effizienzsteigerung um etwa das 50-fache in 3 Jahren.
Wir konnten alle erforderlichen Schritte durchführen, um brauchbare Ergebnisse zu erzielen. Mit einer speziell zugeschnittenen Installation wurde eine neue Formel für eine mathematische Konstante, log(2), entdeckt. Diese Formel wurde dann auf ein maßgeschneidertes Setup angewendet, um den Rekord für die Anzahl der für diese bestimmte Konstante bekannten Dezimalstellen zu brechen.
Mit den StorageReview-Einrichtungen ist es möglich, den gesamten Prozess der Vorbereitung von Prüfstandstests auf der Grundlage numerischer Berechnungen abzudecken, die ein System großen Belastungen aussetzen. Bei diesen Experimenten wurden SSD, RAM und CPU erfolgreich auf die Probe gestellt.
– Jorge Zuniga
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed