Es könnte ein Daten-Kohärenz-Problem sein. Die Caches der Kerne (L1D, L2, L3) müssen synchron gehalten werden. Ändert ein Kern gemeinsam genutzte Daten, müssen die anderen Kerne anhalten, bis die aktuellen Änderungen eingetroffen sind. Für diesen Mechanismus gibt es spezielle Kohärenz-Protokolle zwischen den Kernen und in Mehr-Sockelsystemen auch den einzelnen CPUs. Je länger und langsamer die Kommunikationswege zwischen den Caches, desto mehr Zeit geht dafür drauf.
Auf einem monolithischen Quad-Core laufen manche Dinge wesentlich schneller, als in einem NUMA-System mit deutlich mehr Rohleistung. Bei anandtech ist ein Artikel dazu erschienen:
AnandTech | Westmere-EP to Sandy Bridge-EP: The Scientist Potential Upgrade
Auf einem monolithischen Quad-Core laufen manche Dinge wesentlich schneller, als in einem NUMA-System mit deutlich mehr Rohleistung. Bei anandtech ist ein Artikel dazu erschienen:
AnandTech | Westmere-EP to Sandy Bridge-EP: The Scientist Potential Upgrade