Bau des Jahrzehnts. Erkundung der AMD Bulldozer-Prozessorarchitektur

Wie Sie wissen, hält Intel seit mehr als fünf Jahren an der „Tick-Tock“-Entwicklungsstrategie fest und ändert den technologischen Produktionsprozess in ungeraden Jahren und die Mikroarchitektur in geraden Jahren. AMD verfolgt eine völlig andere Politik und verbessert seine Modelle, sobald neue Technologien verfügbar werden. So führte das Unternehmen vor fast vier Jahren das letzte Mikroarchitektur-Update durch und veröffentlichte die Phenom-CPU auf K10, die seitdem drei technische Prozesse beherrscht – 65 nm für Agena, 45 nm für Deneb und 32 nm für Llano. Dennoch erschöpft sich früher oder später das Potenzial jeder Entwicklung und die Notwendigkeit einer radikalen Erneuerung braut sich zusammen.

Und im Gegensatz zu Intel, das seine Mikroarchitektur systematisch alle zwei Jahre auffrischt, zieht es AMD vor, dies etwas seltener zu tun, dafür aber mehr Änderungen und Verbesserungen vorzunehmen. Tatsächlich gab es seit dem Erscheinen der ersten Athlons auf Basis des K7 nur zwei seiner Updates, aber bedeutende und radikale: K8, das 2003 eingeführt wurde und die Grundlage für Athlon 64 wurde, und der bereits erwähnte K10 die Familien Phenom und Athlon II. Ja, später erhöhte das Unternehmen Frequenzen, Caches und die Anzahl der Kerne in seinen Produkten, veränderte technologische Prozesse, aber ihre Struktur, die die Basis und das „Herz“ ganzer CPU-Familien ist, blieb unerschütterlich.

Ein bisschen Theorie

Die neue Bulldozer-Mikroarchitektur, die in AMD FX-Prozessoren debütiert, unterscheidet sich erheblich von der vorherigen - K10 - und passt außerdem nicht in die Strategie früherer Updates, als Ingenieure versuchten, ihre Mängel zu beheben und ihre Vorteile hervorzuheben. Wenn Sie sich K10 ansehen, können Sie die Umrisse und die allgemeine Topologie von K8 und K7 darin sehen, und wenn Sie dasselbe mit Sandy Bridge tun, können Sie eine Reihe von Merkmalen des vorherigen Nehalem und Conroe in letzterem erkennen.

Und wenn Sie Bulldozer nehmen, fällt Ihnen sofort auf, dass es sich tatsächlich sowohl von K10 als auch von anderen x86-kompatiblen Mikroarchitekturen komplett unterscheidet. Vor dem Hintergrund seiner Vorgänger sieht die Neuheit nicht weniger ungewöhnlich aus als ein Flugzeug gegen einen Hubschrauber. Betrachten wir es genauer, aber ich werde sofort reservieren, dass ich versuchen werde, das Wesen und die Art der Änderungen zu erklären, ohne in den technischen Dschungel und die Feinheiten zu geraten, da es für die Mehrheit langweilig und uninteressant ist, und für diejenigen, die es tun brauchen, wissen sie bereits, wo sie die Informationen finden können, an denen sie interessiert sind.

Der Hauptunterschied zwischen Bulldozer und anderen aktuellen Prozessor-Mikroarchitekturen liegt im Layout der x86-Kerne, die sich nun paarweise in einem "Modul" befinden und sich andere Ressourcen teilen - eine echte Recheneinheit (FPU), einen Second-Level-Cache (L2) und das sogenannte "Front-End", letzteres wird weiter unten besprochen. Damit ist jedes Modul der neuen Mikroarchitektur etwas zwischen einer herkömmlichen Dual-Core-CPU und einem Prozessorkern mit Hyper-Threading.

In gewisser Weise ist dies sogar eine Weiterentwicklung der Idee des Hyper-Threading, aber im Gegensatz dazu, wo zwei Threads die gleiche Menge an Hardware-Ressourcen „aufteilen“, ist im „Bulldozer“ ein Modul, von dem sich zwei Threads einen Teil teilen die Ressourcen, und einige werden zur alleinigen Verwendung erhalten, aber die Balance richtig gewählt, alle "schweren" und "teuren" (aus Sicht des Transistorbudgets) Blöcke werden auf zwei Kerne verteilt, und die x86-Kerne selbst werden dupliziert , da nur etwa 12% der Gesamtzahl der Transistoren im Modul für jeden von ihnen ausgegeben werden.

Aus Sicht der Durchführung von Integer- und Adressoperationen stellt jedes Modul zwei vollwertige und unabhängige Kerne dar, zwischen denen FPU-Ressourcen während realer Berechnungen aufgeteilt werden. Dieselben Kerne dienen tatsächlich der FPU, indem sie ihr Anweisungen zur Ausführung, zum Laden und Entladen von Daten, zum Speichern und Verlassen von MOPs senden, da sie Rechenthreads, Out-of-Order-Ausführungsmechanismen und Datencaches der ersten Ebene ( L1D) sind beigefügt.

Offensichtlich liegt der Hauptvorteil dieses Schemas gegenüber einem einzelnen Kern in der erhöhten Leistung unter Multi-Thread-Lasten, insbesondere bei Betonung ganzzahliger Berechnungen. Versuchen wir, die Hauptblöcke von Bulldozer genauer zu betrachten.

Frontend

Tatsächlich ist das "Front-End" ein Satz logischer Geräte, die die Vorbereitung von Anweisungen zur Ausführung auf Computergeräten bereitstellen. Es enthält Verzweigungsvorhersageblöcke, deren Genauigkeit beeinflusst, wie oft die CPU im Leerlauf ist, während sie auf die Übertragung der erforderlichen Daten aus RAM oder Caches wartet, den First-Level-Anweisungs-Cache (L1I) und einen Decoder, der x86-Anweisungen „übersetzt“. verständlich für Betätigungsgeräte, die Ansicht ist MOPs.

Die Änderungen, die sich auf diese Blöcke ausgewirkt haben, sind mehrdeutig. Einerseits hat sich die Genauigkeit der Übergangsvorhersagen erhöht. Beim Decodieren aus dem Cache werden Daten in Blöcken von 32 Bytes gelesen, wie beim K10, was gut ist und doppelt so viel wie Sandy Bridge. Befehle werden jetzt in vier Kanälen statt in drei wie beim K7-K10 verarbeitet. Und dies ist eine der wichtigsten und lang erwarteten Verbesserungen in der Mikroarchitektur. Aber AMD hat erst jetzt einen 4-Kanal-Decoder eingeführt, während Intel ihn vor fünf Jahren in Conroe (Core2) hatte. Gleichzeitig hat der Instruktions-Cache tatsächlich die gleiche Größe und Assoziativität (64 KB, 2-Wege) wie in K10, wo er seit K7 unverändert migriert ist.

Vergessen Sie auch nicht, dass jetzt sowohl der Befehlscache als auch der Decoder nicht von einem, sondern von zwei Threads benötigt werden, sodass ihre Fähigkeiten bei einer intensiven Multithread-Last bedingt halbiert werden können. Zusammenfassend lässt sich sagen, dass das neue „Frontend“ teils besser, teils schlechter aussieht als seine Vorgänger und je nach Aufgabenstellung seine Stärken und Schwächen ausspielen wird.

X86-Kern

Diese Blöcke, in der Menge von zwei Stück pro Modul, sind genau das Unterscheidungsmerkmal von Bulldozer "a und ermöglichen es einem Modul, zwei Befehlsströme zu verarbeiten. Tatsächlich konzentrieren sie die wichtigsten x86-Kerngeräte mit einem Befehl außerhalb der Reihenfolge Ausführungsmechanismus (Out-of-Order Execution), nämlich der Puffer der vom Decoder empfangenen MOPs (Sheduler), die Vorrichtung zum Zurückziehen der ausgeführten Befehle (Retire), die ganzzahligen Ausführungseinheiten selbst und die Adresserzeugungsvorrichtungen (ALU und AGU ), zwei Stück pro x86-Core, sowie den Datencache der ersten Ebene (L1D) und Load Unload Unit (LSU).

In vielerlei Hinsicht ähnelt der Bulldozer x86-Kern dem K10-Integer-Block, aber es gibt eine Reihe auffälliger und mehrdeutiger Änderungen: Erstens wurde die Anzahl der ALUs und AGUs im Vergleich zu K10 von drei auf zwei reduziert. Dies ist ein Rückgang der theoretischen Spitzenleistung um das Eineinhalbfache, andererseits ist es praktisch unmöglich, sie in der Praxis herauszudrücken, sodass der Verlust nicht groß ist, obwohl es einen gibt. Zweitens ist der Datencache vier geworden Mal kleiner als die von K10, 16 KB statt 64 KB, aber seine Assoziativität ist von zwei Pfaden auf vier gewachsen. Man kann es also einen berechtigten Tausch von Volumen gegen Geschwindigkeit nennen.

Nun, LSU ist in allem besser geworden, sowohl die nominelle als auch die effektive Pufferkapazität hat sich deutlich erhöht, und die Bittiefe von Schreibvorgängen wurde verdoppelt.

FPU

Vielleicht einer der wichtigsten Blöcke des Prozessors - der Block der realen Berechnungen - ist, wie Sie sich vorstellen können, für die Ausführung von Gleitkommaoperationen sowie für die Ausführung von SSE-Befehlssätzen aller Versionen, AVX, FMA und einzelner Befehle verantwortlich. Tatsächlich ist die Bulldozer-FPU die bisher leistungsstärkste und funktionalste, und dank ihr hofft AMD zum großen Teil, konkurrierende Intel-Lösungen auf Basis der Sandy-Bridge-Mikroarchitektur zu schlagen.

Der FPU Bulldozer basiert auf zwei FMAC-Geräten mit jeweils 128 Bit. Im Gegensatz zu K10, wo verschiedene Geräte für Addition und Multiplikation zuständig waren, sind diese universell und in der Lage, die gesamte Palette der unterstützten Befehle auszuführen. Wir können sagen, dass AMD von einem asymmetrischen Schema von FPU-Aktuatoren zu einem symmetrischen übergegangen ist. Im Fall der gemeinsamen Nutzung von Ressourcen zwischen zwei x86-Kernen kann jeder mit seinem eigenen FMAC-Gerät arbeiten.

Die einzige Ausnahme ist die Ausführung von AVX-Befehlen mit einer Kapazität von 256 Bit, in diesem Fall führen beide Computergeräte diese Operation als eine Einheit aus. Darüber hinaus ist anzumerken, dass, wenn bei AVX-Operationen mit einer Kapazität von 256 Bit die Leistung pro Zyklus der FPU Sandy Bridge entspricht, die Ausführungsrate bei einer Verringerung der Kapazität von AVX-Operationen auf 128 Bit diese übersteigt um zwei mal.

Neben der Geschwindigkeit ist es wichtig, sich an die Funktionalität zu erinnern. Wie bereits erwähnt, unterstützt der Bulldozer "ein Block realer Berechnungen FMA-Befehle (Fused Multiply-Add - Combined Multiplication-Addition) der Form A \u003d B x C + D. Außerdem wird das Multiplikationsergebnis vor der Addition nicht gerundet, was wirkt sich positiv auf die Genauigkeit der Berechnungen aus.Im Allgemeinen können wir sagen, dass die FPU in jeder Hinsicht besser ist als in früheren AMD-Mikroarchitekturen, und die Ingenieure können stolz auf ihre Arbeit sein.

Caches und Northbridge

Auch das Cache-Subsystem hat im Vergleich zu K10 einige wichtige Änderungen erfahren. Wie bereits erwähnt, tauschte der Datencache der ersten Ebene (L1D) das Volumen gegen die Assoziativität aus, und der Befehlscache (L1I) blieb praktisch unverändert. Der Second-Level-Cache (L2), der zuvor nur von einem Kern verwendet wurde, wird jetzt von den beiden x86-Kernen des Moduls geteilt. Außerdem ist der L2-Cache im Vergleich zum K10 von 512 KB auf 2 MB gewachsen. Das Assoziativitätsniveau blieb das gleiche, 16-Wege.

Das bedeutet, dass die Bulldozer-Mikroarchitektur-CPU mit acht Kernen und vier Modulen vier L2-Caches mit einer Gesamtkapazität von 8 MB verwendet. Aber höchstwahrscheinlich hinterließen das Volumenwachstum und die Notwendigkeit, Ressourcen zwischen den beiden Kernen zu teilen, auch einen negativen Einfluss auf die Zugriffszeit auf den Second-Level-Cache. Der L3-Cache und der Speichercontroller arbeiten wie der K10 mit ihrer eigenen Frequenz, die niedriger ist als die Frequenzen der Module. Bei den angekündigten Prozessoren sind es je nach Modell 2-2,2 GHz. Das ist weniger als bei Sandy Bridge, wo der integrierte Speichercontroller und der L3-Cache mit der Kernfrequenz arbeiten. Die L3-Cachegröße von Bulldozer beträgt jetzt 8 MB, und seine Assoziativität ist 64-fach, was ein Drittel mehr ist als die von Deneb (6 MB bzw. 48-fach).

Es sei auch daran erinnert, dass der Cache AMD-Prozessoren organisiert nach dem sogenannten exklusiven Schema, wenn Daten in Caches verschiedener Ebenen nicht dupliziert werden und das Gesamtvolumen aller von ihnen als effektiv angesehen werden kann. Zusammenfassend möchte ich sagen, dass die Änderungen in L1 und L2 signifikant, aber mehrdeutig sind, und L3 wie eine logische Weiterentwicklung der K10-Entwicklungen aussieht.

Der Speichercontroller der AMD FX-CPU hat keine wesentlichen Änderungen erfahren, er ist immer noch zweikanalig, und die nominell unterstützte Frequenz von DDR3-Speichermodulen wurde auf 1866 MHz erhöht.

TurboCore 2.0

Die Auto-Overclocking-Technologie, die in den AMD Phenom II X6-Modellen eingeführt wurde, wurde erheblich verbessert und ähnelt in vielerlei Hinsicht der in der Sandy Bridge-Reihe verwendeten. Der Prozessor verfügt über einen speziellen Block, der den aktuellen CPU-Verbrauch und die Kernlast überwacht und basierend auf diesen Informationen die Frequenz der Modulkerne ändert. Wenn der CPU-Verbrauch die TDP nicht überschreitet, können die Frequenzen aller Kerne um einen bestimmten Wert über die Basisfrequenzen ansteigen.

Beim AMD FX-8150 beispielsweise steigt die Frequenz von den standardmäßigen 3,6 GHz auf 3,9 GHz für alle acht Kerne. Und wenn der Prozessorverbrauch unter TDP liegt und einige der Kerne im Leerlauf sind, dann können die Frequenzen der belasteten Kerne sogar noch höher steigen, bis zu 4,2 GHz im Fall des AMD FX-8150. Fairerweise sei daran erinnert, dass in AMD Llano eine ähnliche Technologie verwendet wird, die nicht nur den Verbrauch von CPU-Kernen, sondern auch des integrierten Grafikprozessors berücksichtigt.

Theorie - Fazit

Was lässt sich zusammenfassend über die neue Mikroarchitektur sagen? Wie oben gezeigt wurde, gibt es viele Veränderungen, alle sind tiefgreifend und zweideutig. Es besteht kein Zweifel, dass Bulldozer die neue Mikroarchitektur von AMD ist. Das bedeutet aber auch, dass es sich auch sehr zweideutig zeigen kann und an manchen Stellen etwas weniger Leistung als beim K10 zeigt, an manchen Stellen sogar deutlich mehr.

Dennoch steht die AMD-Neuentwicklung in Sachen Unterstützung moderner Befehlssätze und automatischer Overclocking-Technologien, Fokus auf Multi-Threaded-Workload, der Konkurrenz Sandy Bridge in nichts nach und sieht in manchen Fällen sogar noch profitabler aus. Und obwohl es auffällt, dass der Bulldozer eine Reihe von Schwächen hat, können diese in Zukunft leicht behoben werden.

Dies dürfte die Grundlage der Unternehmensstrategie für die kommenden Jahre sein. Bulldozer kann als Investition in seine Zukunft angesehen werden, es ist das Skelett der nächsten Mikroarchitekturen, die „Fleisch“ wachsen und Leistungssteigerungen bringen werden. Nach aktueller Planung wird AMD die Mikroarchitektur seiner Prozessoren jährlich und nicht alle paar Jahre aktualisieren, was mit einer Leistungssteigerung von 10-15 % und einer Steigerung der Energieeffizienz zukünftiger Lösungen reagieren soll.

Separat möchte ich den Moment bezüglich der Verteilung von Rechenthreads auf die Kerne erwähnen. Windows 7 in seiner jetzigen Form ist nicht für Prozessoren mit der Bulldozer-Mikroarchitektur optimiert und kann Threads nicht korrekt verteilen, was in einigen Fällen zu Leistungseinbußen führt, da die CPU keine Clock-Boost-Technologien verwenden kann oder abhängige Rechenthreads über L3 kommunizieren. und kein schnelles L2 mehr, da sie an die Kerne verschiedener Module gebunden waren.

AMD gibt in seinen Materialien an, dass der Windows 8-Scheduler bereits weiß, wie man korrekt mit Bulldozer zusammenarbeitet, und der Leistungsvorteil gegenüber Windows 7 in einigen Fällen bis zu 10 % erreichen kann, was, wie Sie sehen, sehr viel ist. Möglicherweise veröffentlicht Microsoft jedoch einen Patch für die "Sieben", der diesem beliebten Betriebssystem beibringt, Threads für neue AMD-Prozessoren richtig zu verteilen.

Jetzt ist es an der Zeit, die Theorie zu beenden und zu sehen, wie das neue AMD-Flaggschiff in der Praxis überzeugen kann.

Testwerkzeuge und Methodik

Die Geschwindigkeit des Prozessor-Chipsatz-Speicher-Bündels wurde von den folgenden Anwendungen bewertet:

  • Cinebench 10;
  • Cinebench 11.5;
  • POV-Strahl Alle CPU-Gesamtsekunden;
  • TrueCrypt Serpent-Twofish-AES;
  • wPrime 2.00;
  • x264 v3(veraltete Version, ohne aggressive Optimierungen für Multithreading);
  • x264 v4(neue Version, gut optimiert für Multithreading mit neuen Codecs);
  • WinRAR;
  • Photoshop CS5 x64(Anwendung einer Folge von mehreren Dutzend Filtern);
  • Autodesk Revit Architecture 2012(Visualisierung einer 3D-Zeichnung eines Hauses).

Prüfstand

Mehrere Systeme nahmen an Tests mit einer breiten Palette von Komponenten, einschließlich Motherboards, teil. Die folgende Tabelle ermöglicht es Ihnen, sich mit der vollständigen Beschreibung der Stände sowie den Betriebsarten der Konfigurationen vertraut zu machen.

mütterlich
Zahlen
NBChipsatzFrequenz
Erinnerung
Menge
Kerne
Frequenz
Reifen
FaktorTurboProzessorname
/Modus
ASUS Crosshair V 2200 FX990 1333 8 200 21 4200MHzFX8150
3600MHz
MSI 990FXA-GD80 2000 FX990 1333 6 200 16.5-18.5 3700 MHzPhänomen II 1100
3300 MHz
MSI 990FXA-GD80 2000 FX990 1333 4 200 18.5 - Phänomen II 980
3700MHz
MSI 990FXA-GD80 2000 FX990 1333 4 200 15.5 - Athlon II 645
3100MHz
MSI A75MA-G55 - A75 1333 4 100 29 - A8 3850
2900 MHz
MSI A75MA-G55 - A75 1333 4 100 24-27 2700MHzA8 3800
2400MHz
MSI A75MA-G55 - A75 1333 4 100 26 - A6 3650
2600MHz
MSI A75MA-G55 - A75 1333 3 100 21-24 2400MHzA6 3500
2100 MHz
MSI A75MA-G55 - A75 1333 2 100 27 - A4 3400
2700MHz
MSI Z68A-GD80 - Z68 1333 4 100 34-38 3800 MHzi7 2600K
3400 MHz
MSI Z68A-GD80 - Z68 1333 4 100 33-37 3700 MHzi5 2500
3300 MHz
MSI Z68A-GD80 - Z68 1333 4 100 31-34 3400 MHzi5 2400
3100MHz
Asus P6X58D 2667 X58 1333 4 133 23 3060MHzi7 930
2800 MHz
MSI Z68A-GD80 - Z68 1333 2 100 31 - i3 2100
3100MHz
ASUS Crosshair V 2200 FX990 1866 8 200 21 4200MHzFX8150
3600 MHz 1866
MSI A75MA-G55 - A75 1866 4 100 29 - A8 3850
2900 MHz 1866
MSI A75MA-G55 - A75 1866 4 100 24-27 2700MHzA8 3800
2400 MHz 1866
MSI A75MA-G55 - A75 1866 4 100 26 - A6 3650
2600 MHz 1866
MSI A75MA-G55 - A75 1866 3 100 21-24 2400MHzA6 3500
2100 MHz 1866
MSI A75MA-G55 - A75 1866 2 100 27 - A4 3400
2700 MHz 1866
MSI Z68A-GD80 - Z68 1866 4 100 34-38 3800 MHzi7 2600K
3400 MHz 1866
MSI Z68A-GD80 - Z68 1866 4 100 33-37 3700 MHzi5 2500
3300 MHz 1866
ASUS Crosshair V 2200 FX990 1866 8 200 22.5 - FX8150
4500MHz
MSI 990FXA-GD80 2380 FX990 1820 6 340 12.5 - Phänomen II 1100
4250MHz
MSI 990FXA-GD80 2400 FX990 1600 6 200 21 - Phänomen II 1100
4200MHz
MSI 990FXA-GD80 2400 FX990 1600 4 200 22.5 - Phänomen II 980
4500MHz
MSI 990FXA-GD80 2240 FX990 1500 4 280 16 - Phänomen II 980
4480MHz
MSI A75MA-G55 - A75 2000 4 150 29 - A8 3850
4350MHz
MSI A75MA-G55 - A75 2040 4 153 27 - A8 3800
4133 MHz
MSI A75MA-G55 - A75 1900 4 142 26 - A6 3650
3700MHz
MSI A75MA-G55 - A75 1900 3 142 24 - A6 3500
3400 MHz
MSI A75MA-G55 - A75 2050 2 154 27 - A4 3400
4160MHz
MSI 990FXA-GD80 2170 FX990 1650 4 310 12 - Athlon II 645
3720 MHz
MSI Z68A-GD80 - Z68 1866 4 100 48 5000 MHzi7 2600K
5000 MHz
MSI Z68A-GD80 - Z68 1866 4 100 45 - i7 2600K
4500MHz
Asus P6X58D 3200 X58 1600 4 200 21 - i7 930
4200MHz

  • Arbeitsspeicher: 8 GB, (2x4). Timings 9-9-9-24-2T, Frequenz von 1333 MHz bis 2050 MHz, je nach Einstellungen und Testbedingungen;
  • Grafikkarte: AMD HD 6790;
  • Festplatte: SSD Crucial M4 128 GB;
  • Netzteil: Tagan TG1100-U95 1100 W;
  • Betriebssystem: Microsoft Windows 7 x64 SP1.

Und drei Testmodi:
1. Nennfrequenzen des Prozessors, Speicher 1333 MHz.
2. Nennfrequenzen des Prozessors, Speicher 1866 MHz.
3. Overclocking, der Speicher läuft je nach Multiplikator mit unterschiedlichen Frequenzen.

Testergebnisse

Als Ausgangspunkt nahmen wir eine Konfiguration bestehend aus einem Motherboard basierend auf dem 990FX-Chipsatz, einer AMD FX 8150-CPU und einem Speicher, der mit einer Frequenz von 1333 MHz mit Timings von 9-9-9-24-2T arbeitet.

Cinebench 10

Einstellungen:

  • Mono-Thread- und Multi-Thread-Test.
  • CPU-Profil.

Punkte

Nennmodus: Leistung 1 CPU | Multi-CPU

Ein Test mit einem und allen Kernen zeigt nicht den besten Stand für einen Einsteiger, der sich fehl am Platz fühlt, wenn die Last nur auf einen Kern fällt. Sobald das Programm alle Kerne nutzt, ändert sich die Situation deutlich und es wird zum direkten Konkurrenten des Intel i5-2500. Allerdings positioniert AMD seine CPU mit dem Index 8150 genau so: Vergleicht man die Leistung des FX mit dem i7-930, kann man sich von der Überlegenheit ersterer gegenüber letzterer überzeugen.

Punkte

Speicher bei 1866 MHz: Leistung 1 CPU | Multi-CPU

Bitte aktivieren Sie JavaScript, um Diagramme anzuzeigen

Übertakteter Speicher hat kaum Auswirkungen auf die Leistung eines modernen AMD-Prozessors, sodass Sie überhaupt nicht zum Laden laufen und Hochfrequenzmodule erwerben müssen.

Punkte

Übertaktung: Leistung 1 CPU | Multi-CPU

Bitte aktivieren Sie JavaScript, um Diagramme anzuzeigen

Der FX 8150 ist immer noch wenig verstanden, und das Übertakten wird von Schwierigkeiten begleitet, das Motherboard und den Prozessor zu verstehen. Aus den Temperaturen ging hervor, dass der Bulldozer mit einer höheren Frequenz arbeiten konnte, aber andere Multiplikatoren schalteten sich nicht ein. Ich glaube, dass die Hersteller das BIOS im Laufe der Zeit mehr als einmal aktualisieren werden, bevor die Freundschaft der Komponenten hergestellt wird. Dennoch sind 4,5 GHz keine schlechte Figur und dank dieser Übertaktung übertrumpft der Neuling im Multi-Threaded-Test souverän fast alle Intel-Prozessoren, mit Ausnahme des übertakteten i7-2600K.

Name1 CPU%xCPU %Durchschnitt
FX8150 3600 MHz 0 0 0
Phänomen II 1100 3300 MHz 2 -9 -4
Phänomen II 980 3700 MHz 5 -26 -11
Athlon II 645 3100 MHz -20 -46 -33
A8 3850 2900 MHz -18 -42 -30
A8 3800 2400 MHz -28 -51 -40
A6 3650 2600 MHz -27 -47 -37
A6 3500 2100MHz -37 -66 -51
A4 3400 2700MHz -28 -72 -50
i7 2600 K 3400 MHz 52 12 32
i5 2500 3300 MHz 49 1 25
i5 2400 3100 MHz 34 -7 14
i7 930 2800MHz 8 -15 -4
i3 2100 3100MHz 23 -46 -11
FX8150 3600 MHz 1866 0 1 0
A8 3850 2900 MHz 1866 -17 -40 -28
A8 3800 2400 MHz 1866 -27 -48 -37
A6 3650 2600 MHz 1866 -24 -46 -35
A6 3500 2100 MHz 1866 -36 -65 -50
A4 3400 2700 MHz 1866 -26 -72 -49
i7 2600 K 3400 MHz 1866 52 16 34
i5 2500 3300MHz 1866 50 1 25
FX8150 4500 MHz 10 23 16
Phänomen II 1100 4250 MHz 20 14 17
Phänomen II 1100 4200 MHz 19 14 16
Phänomen II 980 4500 MHz 27 -11 8
Phänomen II 980 4480 MHz 26 -11 8
A8 3850 4350 MHz 23 -12 6
A8 3800 4133 MHz 17 -17 0
A6 3650 3700 MHz 6 -25 -10
A6 3500 3400 MHz -1 -49 -25
A4 3400 4160 MHz 13 -56 -22
Athlon II 645 3720 MHz -4 -34 -19
i7 2600 K 5000 MHz 106 52 79
i7 2600 K 4500 MHz 83 46 64
i7 930 4200 MHz 49 18 34

Nicht nur Bewunderer der Produkte des Unternehmens, sondern auch viele Anwender, die den IT-Fortschritt verfolgen, haben ehrlich gesagt auf AMD-Prozessoren mit einer grundlegend neuen Bulldozer-Architektur gewartet. AMD hat sich in den letzten Jahren mit interessanten Preis-Leistungs-Lösungen hauptsächlich auf Geräte der Einstiegs- und Mittelklasse konzentriert. Durch die Wiederbelebung der FX-Linie erwartet das Unternehmen offensichtlich, die Aufmerksamkeit anspruchsvollerer Enthusiasten zu erregen, die bereit sind, zu experimentieren und maximale Geschwindigkeiten zu fordern. Wir werden die Möglichkeiten der neuen Familie am Beispiel des weltweit ersten Acht-Kern-Prozessors für Desktops - AMD FX-8150 - untersuchen. Mal sehen, ob der Hersteller die Erwartungen seiner Fans erfüllen kann.

Im Gegensatz zu seinem Hauptkonkurrenten, der es sich leisten kann, dem Pendelprinzip der CPU-Entwicklung zu folgen, Architekturen und technologische Prozesse jedes Jahr zu ändern, gibt AMD keinen bestimmten Zeitrahmen für seine Projekte vor und verlässt sich auf das Marktgespür und das eigene technologische Potenzial. Die Geschichte der Bulldozer-Architektur begann vor langer Zeit. Es sollte bereits 2009 vorgestellt werden, aber aufgrund verschiedener Umstände ist die praktische Umsetzung mutiger technischer Lösungen in Silizium erst jetzt möglich geworden.

Bulldozer für AMD ist ernst und für eine lange Zeit. Diese Mikroarchitektur wird in den nächsten Jahren die Grundlage für zukünftige Prozessoren aus verschiedenen Segmenten werden: Server, Desktop und Mobile. Dies gilt sowohl für diskrete CPUs als auch für Hybrid-CPUs - auch APUs sollen im Laufe der Zeit unter Bulldozer transformiert werden. Nur für kompakte Systeme wird AMD die Chips des sparsamen Bobcat und seiner verbesserten Versionen verwenden. Mit der Ankündigung von Bulldozer beschloss das Unternehmen, die legendäre Serie durch die Einführung von AMD FX-Prozessoren wiederzubeleben, die eine neue Architektur erhielten und mit der fortschrittlichsten 32-Nanometer-Prozesstechnologie hergestellt werden.

Architektonische Besonderheiten

Bulldozer-Chips basieren auf Modulen mit zwei x86-Recheneinheiten. Gleichzeitig sind letztere nicht vollständig autonom - einige Ressourcen sind beiden Kernen gemeinsam. Insbesondere der Prefetcher, der Befehlsdecodierer, die FPU und der L2-Cache. Das monolithische Dual-Core-Modul ermöglicht die gleichzeitige Ausführung von zwei Threads, jedoch mit gewissen Einschränkungen. Nach Berechnungen des Herstellers ist dieser Ansatz durchaus gerechtfertigt und ermöglicht es Ihnen, etwa 80% der Effizienz vollwertiger physischer Kerne zu erreichen. Dies reduziert jedoch die Anzahl der Transistoren und dementsprechend die Fläche des Kristalls und seinen Stromverbrauch erheblich.

Unter Berücksichtigung der neuen Struktur wurde die interne Architektur grundlegend überarbeitet, was eigentlich alle Ausführungseinheiten betraf. Es gibt praktisch keine Ähnlichkeiten mit K10, das für Phenom II- und Athlon II-Chips verwendet wurde. AMD hat die Unterstützung für AVX-, SSE 4.2- und AES-NI-Befehle implementiert und eigene FMA4- und XOP-Sets hinzugefügt.

Wie die Top-Phenom-Prozessoren erhielten die FX-Chips ein dreistufiges Caching-System. Aber auch die Organisation unterscheidet sich deutlich von der seiner Vorgänger. Der L1-Daten-Cache ist von 64 KB auf 16 KB gesunken, gleichzeitig ist sein Durchsatz deutlich gestiegen. L2 von 2 MB wird von beiden Kernen jedes Moduls geteilt. Je nach Anzahl der letzteren kann die Gesamtkapazität des Second-Level-Cache im AMD FX-Prozessor 4 bis 8 MB betragen. Seine Latenz ist leicht erhöht – der Preis für die Optimierung, um mit höheren Frequenzen zu arbeiten. Chips mit Bulldozer-Architektur sind zusätzlich mit einem 8 MB großen L3-Cache ausgestattet. Angesichts des exklusiven Arbeitsschemas ist die Gesamtpuffergröße für Desktop-Modelle ziemlich beeindruckend. Der verbesserte Datenvorabrufalgorithmus lässt hoffen, dass die Geschwindigkeit des Speichersubsystems erhöht wird. Was den Arbeitsspeicher selbst betrifft, unterstützt CPU FX DDR3-1866-Module im Dual-Channel-Modus.

Der AMD FX verwendet einen 32-nm-SOI-Prozess ähnlich der Llano-APU. Die Chips werden in den Anlagen des verbundenen Unternehmens GlobalFoundries hergestellt. Die CPU basiert auf einem Achtkernkristall mit einer Fläche von 315 mm2. Laut Topologie ist der größte Teil davon für Cache-Speicher reserviert, daher ist es nicht verwunderlich, dass die Gesamtzahl der Transistoren in diesem Fall beeindruckende 2 Milliarden beträgt. Zum Vergleich: Der sechskernige Phenom II X6 (Thuban) enthält "nur " 904 Millionen Transistoren, aber aufgrund der -Nanometer-Prozesstechnologie beträgt die Fläche des Kristalls 346 mm2. Angesichts des Flächenunterschieds können wir davon ausgehen, dass die Kosten für FX-Chips niedriger sind als die ihrer Vorgänger. Allerdings ist der Umstieg auf 32 nm für GlobalFoundries nicht einfach. AMD hat bereits Schwierigkeiten bei der Veröffentlichung geeigneter Rohlinge gemeldet, aufgrund derer das Unternehmen die Nachfrage nach Hybrid-Llanos nicht vollständig befriedigen kann. Hoffen wir, dass dies die Verfügbarkeit von FX zum Verkauf in keiner Weise beeinträchtigt und jeder sie kaufen kann.

Für Quad- und Six-Core-Modelle wird derselbe Kristall verwendet, was eine effizientere Nutzung von Chips mit bestimmten Defekten ermöglicht. Inzwischen ist es wahrscheinlich, dass auch voll funktionsfähige Chips mit deaktivierten Modulen für die Produktion von CPU-Daten verwendet werden. Und in diesem Fall können Sie mit der Freischaltung deaktivierter Kerne mit der nächsten Lotterie rechnen. Es wäre eine großartige Möglichkeit, das Interesse an AMD FX-Prozessoren zu wecken.

Prozessorspezifikationen
Modell FX-8150 Phenom II X6 1075T Phänomen II X4 975 Core i7-2600K Core i5-2500K
Code Name Bulldozer Thuban Deneb Sandy Bridge Sandy Bridge
Anzahl Adern/Threads, Stk. 8/8 6/6 4/4 4/8 4/4
Basistaktfrequenz, GHz 3,6 3 3,6 3,4 3,3
Taktfrequenz nach automatischer Beschleunigung, GHz 3,9/4,2 3,5 3,8 3,7
L2/L3-Cachegröße, MB 8/8 6×0,5/6 4×0,5/6 4×0,25/8 4×0,25/6
Produktionstechnologie, nm 32 45 45 32 32
Prozessorsockel AM3+ AM3 AM3 LGA1155 LGA1155
Leistungsaufnahme (TDP), W 125 125 125 95 95
Empfohlener Preis, $ 245 181(162*) 175 (160*) 317 (315*) 216 (225*)
* Laut Hotline.ua-Katalog.

Turbo-Core

Die Turbo-Core-Technologie wurde zuvor von AMD für die Sechskern-APUs Thuban und Llano verwendet. Effektprozessoren haben einen neuen Mechanismus und Algorithmus für diese Funktion. Falls unter Last die Leistungsaufnahme des Chips innerhalb seiner TDP liegt und die Temperatur den eingestellten Wert nicht überschreitet, kann die Frequenz automatisch erhöht werden (100–300 MHz), auch wenn alle Kerne aktiv sind (All Core Boost) . Wenn mindestens die Hälfte der Module im Leerlauf sind, kann AMD FX in den Max Turbo Boost-Modus wechseln, die Versorgungsspannung erhöhen und die Taktfrequenz der Arbeitseinheiten deutlich erhöhen (bis zu 900 MHz).

AMD hat sich auch darum gekümmert, die Effizienz neuer Chips zu verbessern. Angesichts der wachsenden Zahl von Rechenkernen kann man sich nicht nur auf den Effekt einer dünneren Prozesstechnologie verlassen. Wenn beide Prozessorkerne innerhalb desselben Moduls nicht belastet werden und sie in den C6-Energiesparzustand wechseln, ermöglichen Ihnen die Leistungstransistoren, die Stromversorgung von diesem Knoten abzuschalten, wodurch der CPU-Gesamtverbrauch reduziert wird.

Logikunterstützung

Wie die vorherige AMD-Desktop-Plattform der Buscontroller PCI-Express 2.0 blieb das Vorrecht der Northbridge des Chipsatzes und wanderte nicht unter die Prozessorabdeckung. Es ist die Anzahl der unterstützten Leitungen dieser Schnittstelle und folglich die Fähigkeit, Konfigurationen mit mehreren Grafikkarten zu erstellen, die zu den bestimmenden Unterschieden zwischen den neuen Logiksätzen für Zambezi-Chips geworden sind. Der AMD 990FX der Spitzenklasse verfügt über 42 Links mit der Fähigkeit, Grafikanforderungen als 2x16x oder 4x8x zu verknüpfen. Der AMD 990X hat 26 Lanes und erlaubt nur zwei Grafikkarten im CrossFireX- oder SLI-Modus in einer 2x8x-Konfiguration zu koppeln. Nun, AMD 970 bietet sich bei gleicher Anzahl an PCI-E-Links an, sich mit einem Adapter zu begnügen. In allen Fällen wird die Peripherie von der Southbridge SB950 bedient, die keine interessanten Neuerungen bringt: sechs SATA-6-Gbit / s-Ports mit der Möglichkeit, RAID (0,1,5,10) zu erstellen, bis zu 14 USB 2.0-Anschlüsse , Arbeit mit PCI. Leider gibt es im Gegensatz zum AMD A75-Chipsatz für die FM1-Plattform keine Unterstützung für den Hochgeschwindigkeits-USB 3.0-Bus.

AM3+-Plattform

Prozessoren der FX-Serie erfordern ein Motherboard mit Sockel AM3+. Es kann sich entweder um ein Modell handeln, das auf dem „neuen“ AMD 9xx-Chipsatz basiert, oder um ein Produkt mit der Logik früherer Generationen. Die Kompatibilität zu AM3 ist theoretisch möglich, wird aber weder von AMD selbst noch von Mainboard-Herstellern garantiert. Es ist möglich, dass letztere Firmware für ihre Top-Lösungen veröffentlichen, aber das sind eher Einzelfälle. Und selbst in solchen Situationen funktionieren FX-Chips mit reduzierter Turbo Boost- und Cool'n'Quiet-Zustandsschaltgeschwindigkeit. In diesem Fall fallen alle möglichen Probleme mit dem Betrieb des Systems auf die Schultern der Benutzer. Daher muss in diesem Fall nicht mit einem problemlosen Upgrade gerechnet werden.

Boards mit AM3+ sind leicht an der schwarzen Farbe des Prozessorsockels zu erkennen, während der AM3-Anschluss weiß ist. Glücklicherweise hat sich das Design der CO-Befestigungselemente nicht geändert, sodass jeder mit AM2/AM2+/AM3 kompatible Kühler zur Kühlung von AMD FX geeignet ist.

Die Aufstellung

Ergebnisse im 3DMark 11 CPU-Test (Physik).
3DMark Aussichtspunkte
PC Mark 7, Rechentest, Punkte
CineBench 11,5 Punkte
x264 HD-Benchmark 4,0 fps
7-Zip 9,20 MIPS
Far Cry 2, 1920×1080, DX10, hohe Qualität, fps
Hard Reset, 1920×1080, High-Modus, fps
Metro 2033, 1920×1080, DX11, PhysX, hohe Qualität, fps
Colin McRae: DiRT 3, 1920 x 1080, hohe Qualität, fps
Lost Planet 2, 1920×1080, DX11, hohe Qualität, Test B, fps
Crysis 2, 1920×1080, DX9, hohe Qualität, Downtown-Test, fps
Stromverbrauch des Systems, W

Dank des modularen Aufbaus der Prozessoren des Unternehmens ist es einfach, Ihr Lineup zusammenzustellen und Geräte mit einer unterschiedlichen Anzahl von Recheneinheiten und Taktraten anzubieten. Zum Start umfasst die Reihe von Desktop-Chips mit dem Namen Zambezi vier CPUs. Das Flaggschiff ist die Acht-Kern-Lösung FX-8150 mit einer Frequenzformel von 3,6 / 3,9 / 4,2 GHz. 8 MB L2- und L3-Cache sowie eine TDP von 125 Watt. Das Gerät ähnelt dem FX-8120, der einzige Unterschied besteht in der Betriebsfrequenz - 3,1 / 3,4 / 4,0 GHz. Der FX-6100 mit sechs Kernen hat 6 MB L2-Cache und die gleichen 8 MB L3, aber seine TDP beträgt 95 W. Die günstigste Variante mit zwei Modulen und vier Recheneinheiten x86 FX-4100 taktet mit 3,6 / 3,7 / 3,8 GHz, begnügt sich mit 4 MB L2, üppigem L3 (8 MB) und einer TDP von 95 Watt. Was die Kosten der Geräte betrifft, liegen die empfohlenen Großhandelspreise für die aufgeführten Modelle bei 245/205/165/115 USD.

Übertakten

Die Fähigkeit, Prozessoren frei zu übertakten, ist einer der Schlüsselparameter von FX-Chips. AMD legt besonderen Wert auf diese Funktion. Der kostenlose Multiplikator ist für alle Modelle der Linie verfügbar, und die Möglichkeit, ihn zu ändern, ist auf jedem Board mit AM3+ vorhanden.

Die FX-Architektur wurde ursprünglich für hohe Taktraten entwickelt. Handwerker, die mit Behältern mit flüssigem Stickstoff bewaffnet waren, konnten einen Screenshot von CPU-Z in einer Situation machen, in der der Prozessor mit fast 8,5 GHz lief. Gleichzeitig war es jedoch notwendig, nur eines von vier Modulen aktiv zu lassen. Alle acht Kerne mussten mit 8,1 GHz arbeiten. Bisher erreichten nur die leichtesten Versionen von Intel Celeron für LGA775 solche Frequenzen. Jetzt haben Enthusiasten ein viel interessanteres Objekt für Übertaktungsexperimente.

Bei einer Luftkühlung muss man sich mit bescheideneren Ergebnissen begnügen. Als die Versorgungsspannung auf 1,45 V erhöht wurde, arbeitete die CPU stabil mit 4,6 GHz. Vielleicht nicht so beeindruckend, aber das Potenzial ist deutlich besser als bei den 45-nm-Phenom-II-Chips.

Ergebnisse

Die Ergebnisse der Leistungstests werden in den Diagrammen angezeigt. Das Bild ist durchaus indikativ, um sich allgemein eine Meinung über die Möglichkeiten der neuen AMD-Entwicklung zu bilden. Wie erwartet erhielten FX-Prozessoren eine Leistungssteigerung bei Multithread-Aufgaben - Archivierung, HD-Videokodierung, Rendern. Hier kann der Achtkerner durchaus sowohl mit dem Core i5-2500K als auch mit dem teureren Core i7-2600K mithalten. Sobald es jedoch um Anwendungen mit unwichtiger Optimierung zur parallelen Codeausführung geht, verliert AMD FX an Boden – die spezifische Leistung ihrer x86-Blöcke liegt sogar etwas unter der von Produkten mit K10-Architektur. In Spielen, die bestenfalls 3-4 Threads verwenden, haben Intel-Prozessoren einen spürbaren Vorteil. Wenn Sie die maximalen Grafikqualitätseinstellungen verwenden, bei denen die Grafikkarte zum Begrenzer wird, pendelt sich die Leistung der Systeme ein, aber es ist unmöglich, das wahre Potenzial der CPU unter solchen Bedingungen einzuschätzen.

Der Umstieg auf die 32-Nanometer-Prozesstechnologie ermöglichte es vielmehr, den Stromverbrauch bei gesteigerter Leistung auf gleichem Niveau zu halten. Wahrscheinlich war die Priorität in diesem Fall die Leistung und nicht die verbesserte CPU-Effizienz.

Schon den Kosten von AMD FX nach zu urteilen, ist es offensichtlich, dass das Unternehmen zunächst in der mittleren Preisklasse Fuß fassen will und Intel bewusst das Segment der hochpreisigen Lösungen abtritt. In der Liga der „Schwergewichte“ kann der Hersteller unter den aktuellen Bedingungen objektiv nicht adäquat mitspielen. Nachdem man auf Multi-Core-Computing gesetzt hat, ist es sehr problematisch, hervorragende Ergebnisse in schlecht optimierter Software zu erzielen. Gleichzeitig haben wir uns vor nur fünf Jahren ernsthaft gefragt, wer einen Quad-Core-Prozessor auf einem Desktop benötigt und wie man die Ressourcen einer solchen CPU effizient nutzt. Heute ist das alltäglich, und die Vorteile von Chips mit so vielen Recheneinheiten stellen sich nicht mehr in Frage. Vielleicht werden Modelle mit acht Kernen einige Zeit später eine ähnliche Anerkennung erhalten.

Zum Glück wird AMD nicht tatenlos zusehen, was mit seinen Prozessoren passiert. Die angekündigten Pläne zur weiteren Entwicklung stimmen zwar zurückhaltend, aber dennoch optimistisch. Das Unternehmen wird die aktuelle Architektur weiterhin aktiv verfeinern und sowohl die Energieeffizienz als auch die CPU-Leistung verbessern, aber diese Raten - 10-15 % pro Jahr - sind nicht sehr beeindruckend. Bei solchen Indikatoren kann man nur dann mit einer radikalen Änderung der Situation rechnen, wenn Intel die Entwicklung seiner Produkte verlangsamt, aber dafür gibt es keine Voraussetzungen - der Tick-Tock-Mechanismus ist noch nicht versagt. Bereits im Frühjahr 2012 werden Ivy-Bridge-Chips vorgestellt, die in 22-Nanometer-Technologie und mit 3D-Transistoren hergestellt werden.

Die abschließende Bewertung der betrachteten Architektur und des darauf basierenden AMD FX-8150-Prozessors fällt zwiespältig aus, was bereits darauf hindeutet, dass die Revolution nicht stattgefunden hat. Zumindest in diesem Stadium ist es für den Endbenutzer unsichtbar. Bei gut parallelisierten Anwendungen findet ein qualitativer Leistungssprung statt, während es bei Single-Thread-Aufgaben keinen gravierenden Anstieg gibt. Die hohen Erwartungen an den Bulldozer wurden nur teilweise erfüllt. AMD hat noch viel Arbeit vor sich, um interessante Lösungen anzubieten und sich einen Platz in den Herzen anspruchsvoller Enthusiasten zu erkämpfen.

Bulldozer ist der Codename für AMD64-Prozessoren, die mit 32-nm-Technologie hergestellt werden und hauptsächlich auf Serverplattformen und Hochleistungs-PCs ausgerichtet sind.

Innovationen
Bulldozer-Prozessoren haben im Gegensatz zu AMD K8 und AMD K10 der vorherigen Generation eine völlig andere Kernarchitektur in ihrem Arsenal. Ein kurzer Blick auf den Zambezi-Die für einen 8-Kern-Prozessor macht oft den Fehler, visuell nur vier Kerne zu identifizieren. Tatsächlich sind dies Rechenmodule. AMD-Ingenieure platzierten x86-Prozessorkerne paarweise in einem Modul. Es stellt sich also heraus, dass Acht-Kern-Prozessoren mit vier Modulen ausgestattet sind, Sechs-Kern-Prozessoren bereits drei Module in ihrem Arsenal haben und Quad-Core-Prozessoren jeweils nur zwei. Der Vorteil einer solchen Lösung besteht darin, die Leistung des Prozessors unter Multithread-Workloads zu steigern.

Zusätzlich zu den Standardfunktionen alter AMD-Prozessoren wurden neue hinzugefügt: SSE4.1, SSE4.2, CVT16, AVX, XOP und FMAC. Die AMD Fusion-Technologie ist ebenfalls implementiert - eine Kombination aus einem Grafikkern und einem zentralen Prozessor, ein Analogon der Sandy Bridge-Technologie.

AMD Bulldozer-Prozessoren unterstützen jetzt die neue Version der AMD Direct Connect-Technologie (beseitigt die Mängel einiger Architekturen beim Datenaustausch) sowie jeweils vier HyperTransport 3.1-Kanäle pro Prozessor. Die AMD G3MX Speichererweiterungstechnologie bietet die Möglichkeit, die Prozessorbandbreite erheblich zu erhöhen.

Darüber hinaus sollten wir die volle Unterstützung für DDR3-Speicher mit einer Frequenz von 1866 MHz und einen deutlich erhöhten L3-Cache auf 8 MB beachten.

Auch der Energiemanagementmechanismus hat sich stark verändert. Eine gewisse Rolle spielte hier die 32-nm-Prozesstechnologie, dank der die Nennspannung 1,4 V nicht überschreitet, vor allem aber aufgrund des verbesserten Taktfrequenz-Einstellmechanismus - das thermische Paket überschreitet 125 W nicht.

Wenn bei früheren Modellen von Phenom II X6-Prozessoren die Last nicht mehr als 3 Threads betrug, erhöhte sich die Frequenz von 3 aktiven Kernen um 400 MHz. Bulldozer sind mit einem flexibleren Geschwindigkeitsregelmechanismus ausgestattet. Im Leerlauf kann der Power Saver Manager das Modul zusammen mit dem L2-Cache-Speicherarray abschalten. Somit wird eine Verringerung der Wärmeerzeugung erreicht. Gleichzeitig kann die Taktfrequenz der beteiligten Rechenmodule bei Bedarf erhöht werden, im aktivierten Max-Turbo-Modus beträgt die Steigerung bis zu -900 MHz. Bei annähernd gleicher Belastung aller Rechenmodule ist die Frequenzerhöhung innerhalb von 300 MHz möglich. Die neuen Bulldozer-Prozessoren unterstützen die Turbo Core 2-Technologie, ein Analogon von Intel Turbo Boost (Erhöhung der Prozessorfrequenz von nominal 3,5 auf 4,2 GHz), was sich positiv auf die Leistung auswirkt. Turbo Core ist aktiv, bis die Leistungsaufnahme des Prozessors die eingestellte TPD-Grenze (Thermal Package) überschreitet. Aus diesem Grund verliert bei den neuen AMD FX-Prozessoren ein Begriff wie „Standardtakt“ seine allgemein akzeptierte Bedeutung.

Was das Overclocking-Potenzial betrifft, so war es übrigens der AMD FX-8150 Prozessor, der auf 8,429 GHz übertaktet wurde, was derzeit absoluter Rekord ist.

Leider ist der Windows-Prozessplaner derzeit nicht vollständig für AMD FX-CPUs optimiert. Es besteht eine hohe Wahrscheinlichkeit, dass zwei Threads desselben Programms von zwei verschiedenen Modulen verarbeitet werden. Dadurch können Sie den Max Turbo-Modus nicht verwenden, oder Sie müssen Daten in den Cache-Speicher des gewünschten Moduls neu laden, was der Fall ist wirken sich letztendlich auf die Leistung aus.

Den Informationen zufolge wird der Taskplaner in Windows 8 die Funktionen der Bulldozer-Architektur berücksichtigen, wodurch das volle Potenzial von Turbo Core genutzt werden kann. Nun, Benutzer von Windows 7 und XP sollten auf ein Update hoffen, das möglicherweise von Microsoft veröffentlicht wird, oder AMD-Programmierer werden einige „magische“ Treiber veröffentlichen.

Wir führen keine Tests von AMD FX Bulldozer-Prozessoren (Bulldozer) durch - es gibt bereits eine große Anzahl davon im Internet, und der Artikel zielt eher darauf ab, diese Linie kennenzulernen und ihre Funktionen aufzudecken, als Testergebnisse zu erhalten.

Aus den zahlreichen Grafiken und Benchmarks kann man sich also ein Bild machen. Das Spitzenmodell FX-8150 im Vergleich zum Core i5 2500k:

Verliert bei Tests, die Single-Threaded-Loading erzeugen (der Phenom II K10 umgeht das übrigens auch hier);

Siegt mehrheitlich in Multi-Thread-Tests, bei denen die Last gleichmäßig auf alle 8 Kerne verteilt wird;

Die Unterstützung für kryptografische AES-NI-Anweisungen ermöglicht es Ihnen, dem Core I7 2600K näher zu kommen;

Leider sind auch die 3D-Testergebnisse enttäuschend, der FX-8150 hinkt seinen Konkurrenten hinterher;

In Spielen ist der AMD FX-8150 Prozessor dem Core i5 2500k unterlegen, auch in solchen Spielen, in denen die Auslastung aller Prozessorkerne deklariert ist.

AMD FX Bulldozer Prozessoren sind zwar leistungsmäßig ihren Konkurrenten unterlegen, haben aber gutes Potenzial für die Zukunft. Das Problem ist nicht, dass die AMD-Ingenieure ihr Ziel nicht erreicht haben. Die Grundlage für die hohe Leistungsfähigkeit von Prozessoren auf Basis der neuen Mikroarchitektur sollte durch eine größere Anzahl von Kernen mit höheren Frequenzen realisiert werden. Doch bei der Umsetzung der Bulldozer-Idee in Feuerstein traten Schwierigkeiten auf und die AMD FX-CPUs, die mit ausreichender Taktfrequenz das Licht der Welt erblickten, funktionierten nicht. Dies führte zu einer geringen Anzahl von Anweisungen, die von jedem einzelnen Kern ausgeführt wurden, was wiederum die Leistung im Allgemeinen verringerte. Auch die verbauten 8 Kerne des AMD FX-8150 konnten diesen negativen Effekt nicht kompensieren.

Dies erklärt, dass sich der achtkernige AMD FX-8150 bei Multi-Threaded-Last auf dem Niveau eines 4-Core-Prozessors von Intel Core i5 entpuppt und bei Single-Threaded-Last sehr mittelmäßige Ergebnisse zeigt.

Doch AMD arbeitet an den Bugs und schon bald soll die zweite Generation der Piledriver-Bulldozer erscheinen, was auf ein erfolgreicheres Produkt hoffen lässt. Nach Angaben von AMD-Mitarbeitern wird die neue Generation von Prozessoren eine um 40-50% höhere Leistung im Vergleich zum FX-8150 haben, und die „Standardfrequenz“ wird 30-mal höher sein als die aktuelle.

Was den Kauf eines Bulldozer-Prozessors für Spiele betrifft, so sieht diese Entscheidung vor dem Hintergrund der fehlenden Überlegenheit gegenüber Intel-Prozessoren und angesichts der Preispolitik von AMD nicht sehr gut aus.

Für Multithread-Aufgaben mit schmalem Profil: Videoverarbeitung, Rendern usw. AMD Bulldozer wäre eine gute Lösung.

Vor genau einem Jahr haben wir über die neue Prozessor-Mikroarchitektur von AMD, bekannt als Bulldozer, geschrieben. Und jetzt, ein Jahr später, am 12. Oktober, kündigte AMD endlich die AMD FX-Prozessorfamilie auf Basis der Bulldozer-Architektur an. Außerdem hatten wir die Gelegenheit, einen der Acht-Kern-Prozessoren der AMD FX-Familie zu testen – den AMD FX-8100-Prozessor. Werfen wir also einen genaueren Blick auf die neuen AMD-Prozessoren.

Allgemeine Information

In der offiziellen Pressemitteilung von AMD zur Veröffentlichung von AMD FX-Prozessoren wird darauf hingewiesen, dass es sich um eine Familie von vollständig freigeschalteten und anpassbaren Desktop-Prozessoren handelt, die die neue Multi-Core-Architektur von AMD (Codename Bulldozer) verwenden.

Die AMD FX-Familie umfasst sowohl Prozessormodelle mit acht Kernen (FX-8000-Serie), sechs (FX-6000-Serie) als auch Quad-Core-Prozessoren (FX-4000-Serie). Alle AMD FX Prozessoren haben einen AMD AM3+ Prozessorsockel.

AMD FX-Prozessoren, die auf der Bulldozer-Mikroarchitektur basieren, sind die ersten AMD-Prozessoren, die mit der 32-nm-Prozesstechnologie gebaut werden.

Wie Sie wissen, plant AMD die Veröffentlichung von drei Prozessorserien auf Basis der Bulldozer-Mikroarchitektur mit den Codenamen Interlagos, Valencia und Zambezi. Die Interlagos- und Valencia-Prozessoren sind Server-Prozessoren, während der Zambezi-Prozessor auf den Desktop-Markt ausgerichtet ist. In diesem Artikel werden wir uns die Zambezi-Prozessoren genauer ansehen.

Wie aus der Pressemitteilung des Unternehmens hervorgeht, ist einer der Hauptvorteile der neuen AMD Zambezi-Prozessoren ihre unglaubliche Übertaktungsfähigkeit. Dies wird insbesondere durch den kürzlich aufgestellten Weltrekord für das Übertakten des AMD FX-Prozessors mit acht Kernen, der in das Guinness-Buch der Rekorde aufgenommen wurde, und den Titel "Hochfrequenz-Computerprozessor" belegt. Dass die Overclocking-Fähigkeiten des Prozessors für den Anwender extrem wichtig sind, steht eigentlich außer Frage. Trotzdem ist es etwas seltsam, dies aus den Lippen von AMD-Vertretern zu hören. Immerhin, als AMD-Prozessoren offensichtliche Probleme mit der Taktfrequenz hatten, erklärten Vertreter dieser Firma auf allen Pressekonferenzen, dass die Taktfrequenz nicht die Hauptsache sei und die Prozessorleistung von ganz anderen Parametern bestimmt werde.

Die Politik der Doppelmoral ist jedoch nicht nur für AMD charakteristisch – sie ist eine Art Symbol Amerikas. Doch kritisieren wir nicht die amerikanische Moral, sondern schauen uns AMD FX Prozessoren genauer an.

Laut der offiziellen Pressemitteilung stellte AMD insgesamt vier Modelle von AMD FX-Prozessoren vor: FX-8150 und FX-8120 mit acht Kernen, FX-6100 mit sechs Kernen und FX-4100 mit vier Kernen ( Tab. eines). Ein weiterer Achtkern-Prozessor, FX-8100, ist jedoch bereits im Angebot, und bald wird das Unternehmen auch die Quad-Core-Prozessoren FX-B4150 und FX-4170 ankündigen.

Alle Prozessoren der AMD FX-Serie unterstützen AMD Turbo Core, eine Technologie, die die Leistung dynamisch auf der Ebene der Prozessorkerne optimiert. Es ist ein vereinfachtes Analogon der Intel Tubo Boost-Technologie, die in modernen Intel-Prozessoren verwendet wird. Warum sprechen wir über ein vereinfachtes Analogon dieser Technologie? Tatsache ist, dass die AMD Turbo Core-Technologie drei Betriebsmodi des Prozessors impliziert: bei der Nennfrequenz, im Turbo Core-Modus und im MAX Turbo-Modus. Im Turbo-Core-Modus ist es möglich, die Taktfrequenz für alle Prozessorkerne gleichzeitig um mehrere Stufen zu erhöhen, jedoch nur, wenn dies die TDP des Prozessors nicht überschreitet. MAX Turbo ist ein Modus, in dem die Taktrate nur der Hälfte der Prozessorkerne um mehrere Stufen erhöht wird, während die andere Hälfte der Kerne deaktiviert wird (in den C6-Modus wechselt). Auch hier ist der MAX-Turbo-Modus nur möglich, wenn die Leistungsaufnahme des Prozessors seine TDP nicht überschreitet.

Es ist klar, dass Single-Thread-Anwendungen oder Anwendungen, die nicht alle Prozessorkerne laden können, vom MAX Turbo-Modus profitieren können, während der Turbo Core-Modus für gut parallele Anwendungen geeignet ist, die alle Prozessorkerne laden.

Bei Quad-Core-Intel-Core-Prozessoren der 2. Generation mit Tubo-Boost-Technologie ist der dynamische Übertaktungsmodus der Prozessorkerne intelligenter. Werden beispielsweise alle vier Prozessorkerne belastet, so kann innerhalb der gegebenen TDP der Multiplikator um eine bestimmte Anzahl von Schritten erhöht werden. Wenn drei Prozessorkerne belastet werden, kann die Anzahl der Schritte, um die der Multiplikator erhöht wird, größer sein. Wenn nur zwei Prozessorkerne belastet werden, wird die Anzahl der Schritte, um die der Multiplikator zunimmt, in ähnlicher Weise noch höher, und die maximale Frequenz wird erreicht, wenn nur ein Prozessorkern belastet wird.

Darüber hinaus kann das BIOS den Tubo-Boost-Modus konfigurieren, also die maximalen Multiplikatoren für vier, drei, zwei und einen aktiven Kern festlegen. Sie können auch die TDP des Prozessors einstellen, innerhalb derer der Tubo-Boost-Modus implementiert werden kann.

Bei AMD-Prozessoren sind die Möglichkeiten zur dynamischen Übertaktung deutlich bescheidener. Gleichzeitig stellen wir fairerweise fest, dass der AMD Turbo Core-Modus, wie das gesamte System als Ganzes, mit dem proprietären AMD OverDrive-Dienstprogramm, das AMD FX-Prozessoren unterstützt, über einen weiten Bereich konfiguriert werden kann.

Alle Prozessoren der AMD FX-Familie sind mit einem 8 MB L3-Cache ausgestattet und verfügen über einen integrierten DDR3-1866-Speichercontroller (und darunter). Darüber hinaus gibt es in der AMD FX-Prozessorfamilie einen 1 MB L2-Cache pro Kern. Dementsprechend beträgt die Gesamtgröße des L2-Cache bei Prozessoren mit acht Kernen 8 MB und bei Prozessoren mit vier Kernen 4 MB.

AMD Bulldozer-Prozessorkern

Wir haben vor genau einem Jahr im Artikel "AMD Bulldozer Processor Microarchitecture" (ComputerPress Nr. 11'2010) ausführlich über die Features der AMD Bulldozer Mikroarchitektur geschrieben, und deshalb werden wir uns nicht wiederholen und noch einmal ins Detail gehen - wir werden es nur tun erinnern an die wichtigsten Aspekte der AMD Bulldozer Mikroarchitektur.

Apropos Multi-Core-Prozessoren auf Basis der AMD Bulldoze-Mikroarchitektur: Es ist sehr wichtig zu betonen, dass der Kern in der AMD Bulldozer-Mikroarchitektur und Prozessorkerne in anderen Mikroarchitekturen nicht dasselbe sind. Daher ist es nicht ganz richtig, beispielsweise AMD FX (Zambezi) Prozessoren mit Intel Cote i3/i5/i7 (Sandy Bridge) Prozessoren nach der Anzahl der Kerne zu vergleichen. Tatsache ist, dass AMD-Prozessoren auf Basis der AMD-Bulldozer-Mikroarchitektur für eine modulare Architektur sorgen. Jedes Modul selbst (in AMD-Terminologie) ist Dual-Core. Beispielsweise enthält ein Zambezi-Prozessor mit acht Kernen vier Dual-Core-Module (Abbildung 1).

Reis. 1. Blockdiagramm eines Zambezi-Prozessors mit acht Kernen

Was das Unternehmen in diesem Fall als Kern bezeichnet, entspricht jedoch nicht einem echten Prozessorkern. Eigentlich liegt hier der ganze Trick in der Terminologie. Ein Modul, in dem sich zwei Kerne befinden, könnte durchaus als Kern bezeichnet werden, und die Kerne selbst könnten als Computational Integer Clusters bezeichnet werden. Das heißt, unserer Meinung nach ist es richtiger, nicht von einem Modul mit zwei Kernen zu sprechen, sondern von einem Kern mit zwei rechnerischen Integer-Clustern. Natürlich wird jedes solche Modul im Prozessor vom Betriebssystem als zwei separate Kerne wahrgenommen, aber schließlich wird jeder Kern eines Intel-Prozessors mit Hyper-Threading-Technologie vom Betriebssystem als zwei separate Kerne wahrgenommen, und wir sind es die Rede ist von einem Kern, der gleichzeitig zwei Threads verarbeiten kann.

Lassen wir jedoch die Besonderheiten der Terminologie. Dabei ist vor allem zu bedenken, dass es sich bei einem AMD-Modul nicht um echte zwei Kerne handelt, sondern um eine Art Lösung, die zwei Threads gleichzeitig verarbeiten kann. Darüber hinaus übertrifft ein solches Dual-Core-AMD-Modul in Bezug auf die Effizienz einen einzelnen Intel-Core mit Hyper-Threading-Unterstützung, ist jedoch in Bezug auf die Dual-Thread-Verarbeitungseffizienz zwei separaten echten Kernen unterlegen.

Lassen Sie uns nun sehen, warum Sie kein Gleichheitszeichen zwischen Dual-Core-AMD-Modulen und zwei echten Kernen setzen können.

Zunächst einmal werden in jedem AMD-Pseudo-Dual-Core-Modul einige der Ressourcen zwischen beiden Pseudo-Cores geteilt. Insbesondere werden im AMD-Modul der Präprozessor, der für das Abrufen von Anweisungen aus dem L1I-Anweisungscache, ihre Dekodierung und Beförderung zu Ausführungseinheiten verantwortlich ist, sowie der L1I-Anweisungscache und der L2-Cache von beiden Pseudokernen gemeinsam genutzt (Abb. 2). . Außerdem verfügen die Pseudo-Kernel des AMD-Dual-Core-Moduls selbst nur über Integer-Execution-Pipelines und verwenden für die Arbeit mit echten Daten einen auf Modulebene gemeinsam genutzten FP-Cluster. Dies erinnert an die Zeit, als die x86-CPU mit einem x87-Coprozessor erweitert wurde, um Gleitkommaarithmetik durchzuführen. Und obwohl AMD selbst diesen FP-Ausführungscluster nicht als Coprozessor bezeichnet, handelt es sich tatsächlich um einen Coprozessor, der von zwei Kernen gemeinsam genutzt wird und nur Ganzzahloperationen ausführen kann.

Reis. 2. Blockschaltbild des Dual-Core-Moduls
in der Mikroarchitektur des AMD Bulldozer-Prozessors

Wenn jedes Prozessormodul in der AMD Bulldozer-Mikroarchitektur über einen gemeinsam genutzten L2-Cache zwischen zwei Kernen verfügt, wird der L3-Cache von allen Prozessormodulen gemeinsam genutzt.

Chipsätze der AMD 9-Serie

Lange vor der Ankündigung der Zambezi-Prozessoren hat AMD die Chipsätze der AMD 9-Serie angekündigt, die zwar mit allen AMD-Prozessoren mit Sockel AM3+ kompatibel sind, sich aber speziell auf die neuen AMD FX-Prozessoren konzentrieren.

Die Chipsätze der AMD 9-Serie bilden die Basis für die als AMD Scorpius bekannte Plattform. Zusätzlich zu den Chipsätzen der AMD 9-Serie basiert die AMD Scorpius-Plattform auf dem Zambezi-Prozessor sowie der diskreten Grafikkarte der AMD Radeon HD 6000-Serie.

Die Chipsätze der AMD 9-Serie unterstützen sowohl den neuen AMD Sockel AM3+ als auch den alten Sockel AM3. Das heißt, Motherboards auf Basis des Chipsatzes der AMD 9-Serie sind nicht nur mit den neuen Zambezi-Prozessoren kompatibel, sondern auch mit Prozessoren der Vorgängergeneration der Phenom-II-Familie mit AMD-Sockel AM3-Sockel.

Bis zu einem gewissen Grad sind die Chipsätze der AMD 9er-Serie eine Verbesserung gegenüber den Chipsätzen der AMD 8er-Serie und bieten mehr Funktionen. Denken Sie daran, dass die neuen Zambezi-Prozessoren mit Sockel AM3 + theoretisch mit Chipsätzen der AMD 8-Serie kompatibel sind, in diesem Fall jedoch nicht alle Funktionalität Zambezi-Prozessoren können implementiert werden.

AMD 990FX (Chip-Codename RD990), AMD 990X (Chip-Codename RD990) und AMD 970 (Chip-Codename RD970) sind derzeit die 9. Serie von AMD-Chipsätzen. Alle drei Chipsätze unterstützen den neuen 942-Pin-Sockel AM3+ und basieren auf dem 65-nm-Prozess. Alle Chipsätze der AMD 9-Serie verfügen über eine IOMMU (Input/Output Memory Management Unit) für I/O-Operationen.

Genauso wie die traditionelle Prozessor-Memory-Management-Unit (MMU), die vom Prozessor gesehene virtuelle Adressen in physische Adressen übersetzt, übersetzt die IOMMU von der Hardware gesehene virtuelle Adressen in physische Adressen.

Die Chipsätze der AMD 9-Serie sind über den herkömmlichen HyperTransport-Bus mit dem Prozessor verbunden. Gleichzeitig unterstützen alle Chipsätze den HyperTransport 3.1 Bus mit einer Bandbreite von bis zu 6,4 GT/s.

Das Topmodell AMD 990FX unterstützt 42 PCI-Express-2.0-Lanes, die sich wie folgt verteilen: 32 PCI-Express-2.0-Lanes können zu zwei PCI-Express-2.0-x16-Ports oder vier PCI-Express-2.0-x8-Ports gruppiert werden, die restlichen zehn Lanes zu einem PCI-Port Express 2.0 x4 und sechs PCI Express 2.0 x1-Ports oder können von auf dem Board integrierten Controllern verwendet werden.

Natürlich unterstützen Motherboards, die auf dem Top-End-Chipsatz AMD 990FX basieren, die CrossFireX-Technologie zum Kombinieren diskreter Grafikkarten im Modus von zwei oder vier PCI Express x16-Steckplätzen.

Der AMD 990X Chipsatz unterscheidet sich vom AMD 990FX lediglich in der Anzahl der unterstützten PCI Express 2.0 Lanes. Dieser Chipsatz bietet 26 PCI Express 2.0-Lanes, aber nur 16 PCI Express 2.0-Lanes können verwendet werden, um einen PCI Express 2.0 x16-Port oder zwei PCI Express 2.0 x8-Ports zu organisieren. Die verbleibenden PCI-Express-2.0-Lanes können in einen PCI-Express-2.0-x4-Port und sechs PCI-Express-2.0-x1-Ports gruppiert oder von auf dem Board integrierten Controllern verwendet werden. Der AMD 990X-Chipsatz unterstützt wie sein älterer Bruder AMD 990FX die CrossFireX-Technologie im Modus von zwei PCI-Express-x16-Steckplätzen.

Boards, die auf dem Junior-Chipsatz AMD 970 basieren, können nur einen PCI Express 2.0 x16-Steckplatz haben und unterstützen die CrossFireX-Technologie nicht.

Tatsächlich ist die Funktionalität der AMD 990FX-, 990X- und 970-Chips, die die Northbridges der entsprechenden Chipsätze sind, nur durch ihre Unterstützung für PCI Express 2.0-Lanes begrenzt. Alle anderen Funktionen des Chipsatzes sind in der Southbridge konzentriert. Die Nord- und Südbrücke verwenden den A-Link Express III-Bus mit einer Bandbreite von 4 GB/s (entspricht der Bandbreite des PCI-Express 2.0 x4-Busses).

Theoretisch sind die Northbridges AMD 990FX, 990X und 970 mit den Southbridges SB710, SB750, SB810, SB850, SB920 und SB950 kompatibel. Die Südbrücken SB710, SB750, SB810 und SB850 sind nicht neu und werden schon lange verwendet. Die Brücken SB920 und SB950 sind jedoch speziell für Chipsätze der AMD 9-Serie konzipiert.

Die Southbridges SB920 und SB950 unterstützen bis zu 14 USB 2.0-Ports, einen PCI-Bus und sechs SATA 6 Gb/s (SATA III)-Ports. Die SB950-Bridge unterstützt die RAID-Level 0, 1, 5 und 10, während das SB920 nur die RAID-Level 0, 1 und 10 unterstützt. Ein weiterer Unterschied zwischen den SB920- und SB950-Bridges besteht darin, dass die SB950-Bridge vier PCI Express 2.0 x1-Lanes unterstützt. , und die SB920-Brücke besteht nur aus zwei solchen Linien.

Selbstverständlich unterstützen die Bridges SB920 und SB950 HD Audio und Gigabit Ethernet.

Beachten Sie, dass der Stromverbrauch der SB920- und SB950-Chips 5 W beträgt; Der Stromverbrauch der AMD 990FX Northbridge beträgt 19,6 W, der AMD 990X Northbridge 14 W und der AMD 970 Northbridge 13,6 W.

Das GIGABYTE GA-990FXA-UD7 Board basiert auf dem neuen Top-Chipsatz AMD 990FX gekoppelt mit der Southbridge AMD SB950. Es hat einen ATX-Formfaktor (30,5 x 26,3 cm) und kann zum Erstellen von Gaming- und Hochleistungscomputern verwendet werden. Das Board ist für AMD FX (Zambezi) Prozessoren mit AM3+ Sockel ausgelegt, ist aber auch mit AMD Phenom II und Athlon II Prozessorfamilien mit AM3 Sockel kompatibel.

Das Board bietet vier DIMM-Steckplätze zum Installieren von Speichermodulen, wodurch Sie bis zu zwei DDR3-Speichermodule auf jedem der beiden Speicherkanäle installieren können. Insgesamt unterstützt das Board bis zu 32 GB Speicher (Chipsatzspezifikation), optimal ist es, zwei oder vier Speichermodule damit zu verwenden. Beachten Sie, dass das Board im normalen Modus DDR3-1866-, DDR3-1600-, DDR3-1333- und DDR3-1066-Speicher und im übertakteten Modus auch DDR3-2000-Speicher unterstützt.

Um Grafikkarten und andere Erweiterungskarten zu installieren, verfügt das GIGABYTE GA-990FXA-UD7 über sechs Steckplätze mit dem Formfaktor PCI Express 2.0 x16, aber natürlich arbeiten nicht alle mit x16-Geschwindigkeit.

Der AMD 990FX-Chipsatz (Northbridge) unterstützt 42 PCI-Express-2.0-Lanes, die wie folgt verteilt sind: 32 PCI-Express-2.0-Lanes können in zwei PCI-Express-2.0-x16-Ports oder vier PCI-Express-2.0-x8-Ports gruppiert werden. Die restlichen zehn Leitungen können in PCI-Express-2.0-x4- und PCI-Express-2.0-x1-Ports gruppiert oder von auf der Platine integrierten Controllern verwendet werden.

Tatsächlich werden auf dem GIGABYTE GA-990FXA-UD7-Board 32 vom Chipsatz unterstützte PCI Express 2.0-Leitungen verwendet, um vier Steckplätze mit dem Formfaktor PCI Express 2.0 x16 zu organisieren. Wenn nur zwei dieser Steckplätze verwendet werden, arbeiten sie außerdem mit x16-Geschwindigkeit, und wenn alle vier oder drei Ports gleichzeitig verwendet werden, wechseln sie in den x8-Geschwindigkeitsmodus.

Zwei weitere PCI-Express-2.0-x16-Ports arbeiten immer im x4-Geschwindigkeitsmodus. Somit werden insgesamt 40 PCI-Express-2.0-Lanes, die von der AMD 990FX Northbridge unterstützt werden, verwendet, um sechs Steckplätze mit dem PCI-Express-2.0-x16-Formfaktor zu organisieren.

Selbstverständlich unterstützt das GA-990FXA-UD7-Board von GIGABYTE die CrossFireX-Technologie zum Kombinieren diskreter Grafikkarten im Modus von zwei, drei oder vier PCI-Express-x16-Steckplätzen sowie die NVIDIA-SLI-Technologie.

Neben den genannten Steckplätzen im PCI-Express-2.0-x16-Formfaktor verfügt das Board über einen herkömmlichen PCI-Steckplatz, der auf einem PCI-Bus implementiert ist, der von der AMD SB950 South Bridge unterstützt wird. Der PCI-Bus wird auch vom VIA VT6308 FireWire-Controller verwendet, der dem Benutzer zwei IEEE-1394a-Ports zur Verfügung stellt, von denen einer auf die Rückseite des Boards gebracht wird und der andere auf die Rückseite des PCs gebracht werden kann Anschließen des entsprechenden Chips an den Anschluss auf der Platine.

Verbinden Festplatte Das GIGABYTE GA-990FXA-UD7 Board hat acht interne und zwei externe SATA-Ports.

Erstens gibt es sechs SATA-6-Gb/s-Ports, die über den in die Southbridge integrierten AMD SB950-SATA-Controller implementiert werden. Diese Ports unterstützen die RAID-Level 0, 1, 10 und 5.

Zweitens integriert das Board zwei Dual-Port-SATA-6-Gbit / s-Controller Marvell 88SE9172, von denen einer zwei interne SATA-6-Gbit / s-Ports mit der Fähigkeit implementiert, RAID-Arrays der Ebenen 0 und 1 zu organisieren, und über den anderen - zwei externe Ports eSATA 6 Gb / s (einer davon gemeinsam mit USB). Beachten Sie, dass einer der Marvell 88SE9128-Controller die PCI Express 2.0-Reihe verwendet, die von der AMD 990FX Northbridge unterstützt wird, und der andere die PCI Express 2.0-Reihe, die von der AMD SB950 Southbridge unterstützt wird (die AMD SB950 Southbridge unterstützt insgesamt vier PCI Express 2.0-Lanes). .

Um eine Vielzahl von Peripheriegeräten anzuschließen, verfügt das GIGABYTE GA-990FXA-UD7 Board über 18 USB-Ports. Die AMD SB950 Southbridge bietet 14 herkömmliche USB 2.0-Anschlüsse (die SB950 Southbridge unterstützt bis zu 14 USB 2.0-Anschlüsse), von denen acht (einschließlich des eSATA/USB-Combo-Anschlusses) auf die Rückseite des Boards geführt werden und weitere sechs Anschlüsse dies können zur Rückseite des PCs geführt werden, indem die entsprechenden Stecker mit den Anschlüssen auf der Platine verbunden werden.

Darüber hinaus sind zwei Etron EJ168 Dual-Port USB 3.0 Controller auf dem Board integriert, zwei Ports werden auf die Rückseite des Boards geführt und zwei weitere können auf die Rückseite des PCs gebracht werden, indem der entsprechende Chip mit dem Anschluss verbunden wird auf der Tafel.

Beachten Sie, dass einer der Etron EJ168-Controller die PCI Express 2.0-Lane verwendet, die von der AMD 990FX Northbridge unterstützt wird, und der andere die PCI Express 2.0-Lane, die von der AMD SB950 Southbridge unterstützt wird.

Das Audio-Subsystem dieses Motherboards basiert auf dem Audio-Codec Realtek ALC889 HD. Dementsprechend befinden sich auf der Rückseite des Mainboards sechs Miniklinken-Audioanschlüsse sowie koaxiale und optische SPDIF-Anschlüsse (Ausgänge).

Das Board integriert einen Realtek RTL8111E Gigabit-Netzwerkcontroller, der eine PCI Express 2.0-Lane belegt, die von der AMD SB950 South Bridge unterstützt wird.

Wenn wir die Anzahl der auf dem GIGABYTE GA-990FXA-UD7-Board integrierten Controller zählen, die den PCI Express 2.0-Bus verwenden, stellt sich heraus, dass es insgesamt fünf davon sind. Tatsächlich wird der PCI Express 2.0-Bus von zwei Marvell 88SE9172-Controllern, zwei Etron EJ168-Controllern und einem Realtek RTL8111E-Controller mit Strom versorgt. Gleichzeitig werden von den vier PCI Express 2.0-Lanes, die von der AMD SB950 South Bridge unterstützt werden, drei verwendet, und von den zehn verbleibenden PCI Express-Lanes in der AMD 990FX North Bridge - alle zehn (zwei PCI Express 2.0 x4-Steckplätze und zwei Controller).

Das Kühlsystem des GIGABYTE GA-990FXA-UD7 Boards besteht aus drei Radiatoren, die durch eine Heatpipe miteinander verbunden sind. Ein Kühlkörper deckt die MOSFETs ab, die sich in der Nähe des CPU-Sockels befinden, ein weiterer ist auf der Northbridge des AMD 990FX installiert, und der dritte deckt die Southbridge des AMD SB950 ab.

Beachten Sie auch, dass die Platine über zwei vierpolige und zwei dreipolige Anschlüsse zum Anschließen von Lüftern verfügt.

Das GA-990FXA-UD7-Board von GIGABYTE verwendet einen 10-Phasen-CPU-Spannungsregler (8+2), der auf dem Intersil ISL6330-Steuercontroller und der DrMOS-Technologie basiert, wenn ein Paar MOSFET-Transistoren und ein Treiberchip für diese Transistoren in einem DrMOS integriert sind SiC769CD-Chip.

AMD FX-8100 Prozessorleistung

Zum Abschluss unseres Tests präsentieren wir die Testergebnisse des Achtkernprozessors AMD FX-8100. Der Prozessor ist natürlich kein Top-End, aber durchaus geeignet, um sich ein Bild von der Leistungsfähigkeit von AMD FX Prozessoren zu machen.

Um den AMD FX-8100 Prozessor zu testen, haben wir den Ständer mit der folgenden Konfiguration verwendet:

  • Hauptplatine - GIGABYTE GA-990FXA-UD7;
  • Chipsatz - AMD 990FX + SB950;
  • Videotreiber - ForceWare 280.26
  • Speicher - DDR3-1333;
  • Speichergröße - 4 GB;
  • Festplatte - WD1002FBYS;

Zum Testen haben wir unser neues Testskript ComputerPress Benchmark Script v.10.0 verwendet, detaillierte Beschreibung die in dieser Ausgabe des Magazins zu finden sind.

Neben dem AMD FX-8100 Prozessor haben wir Intel Core i7-2600K, Intel Core i5-2500K und Intel Core i5-2400 Prozessoren getestet. Sie technische Eigenschaften vorgestellt in Tab. 2.

Um Intel-Prozessoren zu testen, haben wir den Ständer mit der folgenden Konfiguration verwendet:

  • Hauptplatine - FOXCONN Z68A-A;
  • Chipsatz - Intel Z68 Express;
  • Grafikkarte - NVIDIA GeForce GTX 590;
  • Videotreiber - ForceWare 280.26;
  • Speicher - DDR3-1333;
  • Speichergröße - 4 GB;
  • Speicherbetriebsmodus - Dual-Channel;
  • Festplatte - WD1002FBYS;
  • Betriebssystem - Windows 7 Ultimate (64-Bit).

Fazit

Preislich dürfte der AMD FX-8100 Prozessor etwas teurer als der Intel Core i5-2400 Prozessor und etwas günstiger als der Intel Core i5-2500K Prozessor sein, daher ist der Vergleich mit diesen Prozessoren durchaus angebracht.

Außerdem erinnern wir daran, dass wir ein ASUS G53SX-Laptop mit einem Intel Core i7-2630QM-Prozessor (Basistaktrate 2 GHz; maximale Taktrate im Turbo-Boost-Modus 2,9 GHz) in Verbindung mit dem Intel HM65 Express-Chipsatz als Referenzsystem verwendet haben unserem Test. , 8 GB DDR3-1333 Arbeitsspeicher sowie eine NVIDIA GeForce GTX 560M diskrete Grafikkarte und eine HITACHI HTS547564A9E384 (640 GB) Festplatte.

Wenn Sie sich also die Testergebnisse des AMD FX-8100-Prozessors mit acht Kernen ansehen, können Sie nur eine Schlussfolgerung ziehen: Es hat nicht funktioniert ( Tab. 3). Nun, AMD ist es nicht gelungen, einen leistungsstarken, wettbewerbsfähigen Prozessor herzustellen. Acht AMD-Pseudokerne verlieren direkt gegen vier echte Intel-Kerne. Und es stellt sich heraus, dass ein Desktop-PC, der mit einer leistungsstarken Grafikkarte und einem achtkernigen AMD FX-8100-Prozessor ausgestattet ist, tatsächlich 16 % schwächer ist als ein Laptop, der auf einem vierkernigen Intel-Prozessor basiert. Wahrscheinlich sind Kommentare in diesem Fall einfach bedeutungslos.

Wenn wir den AMD FX-8100-Prozessor mit den Prozessoren der Sandy-Bridge-Familie vergleichen, stellt sich die Situation wie folgt dar. Die Leistung ist dem Intel Core i7-2600K-Prozessor um bis zu 54 % unterlegen, und Intel-Prozessoren Core i5-2500K und Intel Core i5-2400 – 46 % bzw. 37 %.

Generell hat AMD einen ziemlich seltsamen Trend: Das Unternehmen schafft es, jeden nächsten Prozessor ein wenig schlechter zu machen als den vorherigen. Die Frage ist nur, wer solche Prozessoren braucht.

Die AMD Bulldozer-Mikroarchitektur hat sich also nicht selbst gerechtfertigt. Und das Traurigste ist, dass es sich bereits zum Zeitpunkt seiner Veröffentlichung als nicht wettbewerbsfähig herausgestellt hat und in den nächsten Jahren die Basis für AMD-Prozessoren werden wird. Nun, wir können nur bedauern, dass uns das Vergnügen genommen wurde, ein spannendes Duell zwischen Intel und AMD zu sehen.

mob_info