Welche Rolle spielt ECC bei unified RAM?

sandreas

Enthusiast
Thread Starter
Mitglied seit
16.03.2011
Beiträge
2.409
Hallo zusammen,

ich bin großer ECC-RAM Befürworter und möchte für mein Homelab eigentlich immer ECC-RAM Systeme betreiben (auch nicht diese DDR5 Pseudo "On-Die ECC", was kein richtiges ECC ist). Nun kommen nach und nach die vollintegrierten Systeme (z.B. der Framework Desktop) mit dem Ryzen AI Max 395+, die statt RAM-Riegeln verlöteten "unified" Speicher haben, um den Speicher auch für die GPU zur Verfügung zustellen - z.B. kann man damit größere LLMs laden)...

Grundsätzlich besteht natürlich das Problem, dass die Systeme nicht aufrüstbar sind, wobei ich sagen würde, dass man mit 128GB recht lange für ein Homelab gut aufgestellt sein sollte. Weiterer Vorteil dieser Systeme ist die gute Leistung im Verhältnis zum Stromverbrauch - aber es geht mir nicht mal so sehr um die Eignung als Homelab-System, sondern um folgende Frage:

Wie sieht es denn hier mit der Fehlerkontrolle im Speicher aus? Ist das überhaupt vorgesehen und wenn ja ist das mit ECC vergleichbar - oder ist das aufgrund der hohen Integration vielleicht gar nicht mehr nötig?

Gruß
sandreas
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Falls du irgendwas testen moechtest, ich hab so ne Maschine auf Win11.
Zur eigentlichen Frage kann ich leider nich helfen. Interessiert mich aber auch.
Das Ding duerfte jedoch kein ECC haben und somit fuer mich uninteressant fuers Homelab. Nutze das nur als Client-mopped.
 
Falls du irgendwas testen moechtest, ich hab so ne Maschine auf Win11.
Nee, es geht mehr um die Theorie... ECC unified RAM ist vermutlich nirgendwo verfügbar, die Frage ist, ob es technisch überhaupt notwendig ist, den Unified RAM mit einer Fehlerkorrektur auszustatten, wenn aufgrund der Architektur keine erforderlich wäre...
 
Wie sieht es denn hier mit der Fehlerkontrolle im Speicher aus? Ist das überhaupt vorgesehen und wenn ja ist das mit ECC vergleichbar - oder ist das aufgrund der hohen Integration vielleicht gar nicht mehr nötig?
Klar isses das, diese "Pro" GPUs haben ja auch oft ECC.
Insofern ist das hier wohl auch ein Thema irgendwo.

Imho ist das halt Richtung Consumer ausgerichtet, ECC war ja noch nie ein großes Thema obwohls eigentlich technisch kein großes Thema wäre. War immer so ne künstliche Beschränkung um verschiedene Produktgruppen zu schaffen.

Ich würde sowas halt nicht unbedingt als "All in One" Maschine betreiben, sondern das zusätzlich zur AiO NAS-Hypervisor Maschine ins Netz hängen... bzw. vllt. den Hypervisor drauf laufen lassen und das NAS extra machen.
Im Homelab ist das ECC ja am ehesten im NAS wichtig, meine ich.


Unified oder nicht, Speicherfehler sind hier und dort blöd, insofern wird dort ECC ebenso ein Thema sein.
 
Im Homelab ist das ECC ja am ehesten im NAS wichtig, meine ich.
Richtig, allerdings spielt das bei mir eine untergeordnete Rolle, weil ich kaum Speicherbedarf habe. Ich hatte mir überlegt, so ne Kiste zuzulegen, 2x4TB SSD mit ZFS RAID1 reinzutun und dann noch n boot-drive für Proxmox.

Danke für den Beitrag, der klärt das Thema eigentlich recht gut auf. Zuverlässige Quellen hast du dazu aber auch keine oder?

Irgendwie hat da wohl noch niemand so richtig drüber nachgedacht, diesen ALLES-für-die-GPU Hype mal in Frage zu stellen, wobei ich unified Memory langfristig schon sinnvoll finde, je nach Anwendung.
 
Ne, hab ich mir selber zusammen gereimt.
Irgendwie hat da wohl noch niemand so richtig drüber nachgedacht, diesen ALLES-für-die-GPU Hype mal in Frage zu stellen, wobei ich unified Memory langfristig schon sinnvoll finde, je nach Anwendung.
Naja, gibts sicher auch mit ECC, ich trau mich wetten, das kauft und bezahlt jemand. Halt nicht am Endkundenmarkt.

Unified ist so ne Sache, du brauchst halt die Bandbreite. Eigentlich in großer Menge (zu) teuer... unflexibel weils nah dran sein muss blabla. Ist halt ne zweischneidige Sache.
 
diesen ALLES-für-die-GPU Hype mal in Frage zu stellen
Gehort zwar nicht direkt zum Thread und zur urspruenglichen Fragestellung, jedoch denke ich dass man damit absolut richtig faehrt.
GPUs sind mittlerweile deutlich flexibler geworden als 'damals'. Man kann darauf super gut rechnen/crunchen etc. Und die Kerne gibts im Vergleich zu den CPU Kernen quasi fuer umme.
P/L ist einfach deutlich besser als auf CPUs wenn man darauf parallelen Kram abarbeiten moechte. Je mehr und schnellerer Speicher zur Verfuegung steht, desto mehr profitiert die GPU logischerweise.
 
Offenbar gibts den AMD eh mit ECC als "PRO" Version...
1-bit ECC wirkt mehr schlecht als recht. 2-bit ECC funktioiert.
Keine Ahnung, was sind 64 + 8 = 72 bit ECC denn?
 
Keine Ahnung, was sind 64 + 8 = 72 bit ECC denn?
72 Bit Gesamtbreite (64 Daten + 8 ECC bits) ist üblicherweise Type "1-bit ECC" (evtl. sogar mit Option auf zusätzlich eingebaute verbesserte ECC-Fähigkeiten).

Nachfolgende Tools liefern euch eine für die meisten Standard-Zwecke ausreichende Information retour, in welchem prinzipiellen Fehlerkorrektur-Modus euer Speicher arbeitet. Tabelle Rückgabewerte siehe z.B. unter https://learn.microsoft.com/en-us/windows/win32/cimwin32prov/win32-physicalmemoryarray

(Linux) dmidecode -t memory | grep -i 'Error'
(Win 10) wmic MemPhysical get MemoryErrorCorrection
(Win 11)
(Beginn des Zitats von https://www.heise.de/select/ct/2025/3/2429613034849357243)
Get-CimInstance Win32_PhysicalMemoryArray | Select MemoryErrorCorrection.
Das Kommando gibt bei korrekter Funktion von Multi-Bit ECC schnörkellos die Ziffer 6 für MemoryErrorCorrection aus. Das ist zum Beispiel auf AMD-Ryzen-Plattformen der Fall. Bei einigen Xeon-Systemen erscheint der Wert 5 für Single-Bit ECC. Ist der Speicherschutz nicht aktiv, wie es bei den meisten Systemen der Fall ist, gibt der Aufruf die Ziffer 3 zurück.
(Zitat von Heise.de Ende)

ValueMeaning
0 (0x0)Reserved
1 (0x1)Other
2 (0x2)Unknown
3 (0x3)None
4 (0x4)Parity
5 (0x5)Single-bit ECC
6 (0x6)Multi-bit ECC
7 (0x7)CRC


1-bit ECC wirkt mehr schlecht als recht. 2-bit ECC funktioiert.
Technisch richtig, aber als generelle Aussage ohne exakten Kontextbezug zumeist mehr verwirrend als (LuXXer)Lösungen findend.
Die Breite der Fehlerkorrektur-Daten, immer in Verbindung mit einem Fehlerkorrekturverfahren, senkt die relative Fehlerwahrscheinlichkeit.

Vereinfacht ausgedrückt wäre mMn. nachfolgende generelle Aussage bei PC-Systemen treffender:
Fehlerkorrektur
keine ECC Funtionalitätmehr schlecht als recht (dz. geeignet für nicht relevante Dinge wie z.B. Gaming, typischerweise kurze Laufzeiten <24h )
1-bit ECCgut für längere Laufzeiten wie bei NAS, Homelabs, Standard-Server
1-bit ECC mit verbesserter/erweiterter ECC-Fähigkeit/Algorithmusnochmals Verbesserung ggü. vorher, gut für längere Laufzeiten wie bei NAS, Homelabs, Standard-Server.
2-bit ECC / n-bit ECC / n-ComputerStandard bei "mission critical" oder sicherheitskritischen Systemen.
Poste dein System im LuXX (wenn Du darfst), du hast vermutlich ein sehr präsentables hochwertiges Workstation-, Server-, Hochverfügbarkeits-, Mainframe-, o.ä. System.
Falls Ihr einen Supercomputer besitzt ... bitte adoptiert mich !

Je nach techn. Notwendigkeit sind manchmal verbesserte ECC-Fähigkeiten, Fehrfach-Bitfehler Erkennung/Korrektur schon aber auch in relativ normale Hardware/Subsystemen drinnen.
Jeder beliebige Fehlerkorrektur-Modus ist in der Regel besser als keiner.
Ich glaube auf manchen MB mit ECC-Funktionalität lässt sich in der Tiefe des BIOS auch der zu verwendende ECC-Algorithmus auswählen (daneben waren informativ die verschiedenen (bit)Breiten von Daten- und ECC angegeben) ... zumindest bilde ich mir ein, dies so sogar auf einem meiner Consumer-Mainboard BIOSe (reguläre BIOS-Version) gesehen zu haben.

P.S: Ich hatte seit DDR2-800 Zeiten in meinen PC's immer nur ECC-RAM (mit Standard JEDEC settings) im Einsatz und bis jetzt keinen Systemabsturz an dem der DRAM Schuld gewesen wäre.
 
Zuletzt bearbeitet:
Ich hab mir vor fuenf Jahren das erste Mal den "Luxus" von ECC im Desktop gegoennt und werde es in Zukunft bestimmt nicht mehr ohne machen ;) Mein Speicher laeuft gegenueber dem Datenblatt mit einigen hundert MHz mehr Takt (das merkt man auf Zen3 bei vielen Workloads deutlich, und auch die iGPU ist damit mess- und merkbar schneller), und nicht zuletzt wohl auch deswegen ist das hier das Ergebnis von knapp 60 Monaten quasi taeglicher Nutzung:

Code:
$ sudo ras-mc-ctl --summary
Memory controller events summary:
        Corrected on DIMM Label(s): 'mc#0csrow#0channel#0' location: 0:0:0:-1 errors: 10
        Corrected on DIMM Label(s): 'mc#0csrow#0channel#1' location: 0:0:1:-1 errors: 44

Da mich die Strix Halo APUs auch sehr interessieren als potenzielle Nachfolger meines Ryzen 5 Pro 5650G (notwendiger Formfaktor: ITX am Schreibtisch) hat mich kuerzlich diese Entdeckung hier positiv aufgeschreckt: https://geizhals.eu/hp-z2-mini-g1a-workstation-v199547.html

Insbesondere das "guenstige" 128GB-RAM-Modell mit laut Geizhals 128GB LPDDR5X-7467 ECC (nicht erweiterbar) wartet eigentlich nur darauf, dass ich eine Ausrede vor mir selber finden kann, es zu kaufen...

:banana:
 
Insbesondere das "guenstige" 128GB-RAM-Modell mit laut Geizhals 128GB LPDDR5X-7467 ECC (nicht erweiterbar) wartet eigentlich nur darauf, dass ich eine Ausrede vor mir selber finden kann, es zu kaufen...
Interessant. Insbesondere da bei frameworks Desktop nix davon steht:


Es scheint also doch eine Frage des Systems zu sein, ob ECC dabei ist oder nicht. Wobei ich bei Framework vielleicht einfach mal anfrage, das kann nix schaden. Kann mir aber kaum vorstellen, das daher die knapp 500 Euro Preisdifferenz kommen
 
Perplexity listet mir das als Unterschiede auf.


Merkmal
Ryzen AI Max+ PRO 395
Ryzen AI Max+ 395
ZielgruppeWorkstation/ProfessionellConsumer/Standard
Kerne/Threads16C / 32T16C / 32T
Grund-/Boost-Takt3,0 GHz / 5,1 GHz3,0 GHz / 5,1 GHz
L3-Cache64 MB64 MB
Fertigung4 nm4 nm
Integrierte GPURadeon 8060S, 40 CUsRadeon 8060S, 40 CUs
Max. Speicher128 GB LPDDR5X-8000128 GB LPDDR5X-8000
ECC-SpeicherunterstützungJaNein
Management-FeaturesJa (z.B. AMD PRO Manageability)Nein
Security-FeaturesAMD Secure Processor, Device Guard, AMD-ViEingeschränkt/Nein
VPro/Workstation SupportJaNein
Preis / PositionierungHöher, auf Business ausgelegtEtwas günstiger, Consumer
Durchaus interessante Unterschiede.
 
Perplexity listet mir das als Unterschiede auf.



ECC-Speicherunterstützung
Ryzen AI Max+ PRO 395
Ja
Ryzen AI Max+ 395
Nein

Na dann fängt AMD die Kacke mit dem künstlichen ECC deaktivieren bei kleineren Modellen jetzt auch an. Was für eine Farce... aber vielen Dank für die Hinweise, damit dürfte wohl klar sein, dass Unified Speicher grundsätzlich auch MIT und OHNE ECC geht und worauf man achten muss.

Die

HP Z2 Mini G1a​

Workstation ist wirklich interessant, ich wüsste gerne, was die an Strom im Idle verbraucht. Für Interessenten gibts das ganze auch noch als unbezahlbaren Laptop:


Verglichen mit dem Mac Studio mit 128GB aber ein Schnapper ;)
 
Zuletzt bearbeitet:
Bei den -G CPUs hat AMD das eh schon immer gemacht..

Wie viel von dem RAM kann man als VRAM verwenden?
 
Für Interessenten gibts das ganze auch noch als unbezahlbaren Laptop
Streng genommen finde ich das Gesamtpaket gar nicht so absurd ueberteuert.
Das Geraet an sich ist ordentlich. Gehaeuse + Materialien sind gut. Tastatur sowieso. Display = 2,8k OLED mit 120Hz.
Die APU steckt locker aktuelle Games weg und kann auch große LLMs verarbeiten weil man genug VRAM zur Verfuegung hat.
Im Grunde konkurriert das Ding mit Mid/High End Gaming Laptops. Allerdings bei nur ~1,5kg Gewicht und deutlich kompakterem Design.
Dafuer finde ich den Preis noch 'akzeptabel'.
 
Haja, 3,7k mit ECC 128gb, dem Max+Pro?
Die 1tb SSD ist wieder so ein Joke, hoffentlich verlötet (nicht)?

PS: 96/128gb sind für die GPU möglich lt. HP Homepage.

Wenn man sich ansieht, was es bei Apple gibt oder an Gaming-Laptops für das Geld... dann passt das eigentlich schon.


Für mich persönlich wär ein 14" nix ohne Dock, würd den kaum Solo verwenden, aber ich bin ohnehin kein Laptop-Typ.
 
PS: 96/128gb sind für die GPU möglich lt. HP Homepage.
Das ist auch so ein Punkt, worauf man achten muss. Bei einem Video wurde zu einem Gerät erwähnt, dass dieses es 50:50 aufteilt - allerdings wurde nicht darauf eingegangen, ob man das im UEFI umstellen kann..

Je nach Anspruch sollte man als auf eine Pro-CPU achten und genau recherchieren, wie es mit dem RAM aussieht.

Ich hatte ursprünglich ein Framework Desktop Mainboard im Blick, da ich das in ein eigenes 19 Zoll Gehäuse einbauen kann, und sich zu der restlichen HW gesellen darf - in einer einheitlichen sauberen Optik was meine Server betrifft ^^
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh