Processorer Recensioner - Publicerad 2011-10-12 06:01 Skriven av Jacob Hugosson, Anton Karmehed
Vad AMD har att frambringa är någonting helt nytt på konsumentmarknaden, men inte minst x86-marknaden. Det är inte ofta AMD pratar om kärnor när de ska beskriva Bulldozer, utan de pratar om moduler. Eller som vi ser att de beskriver det i bilden ovan, ett monolitiskt tvåkärnigt block som stödjer två exekveringstrådar. Det ska enligt AMD ge bättre skalbarhet än när två trådar delar resurserna i en kärna (SMT, Intel Hyper-threading), högre prestanda i flertrådad användning utan några större kompromisser på entrådad prestanda. Men en annan fördel ska vara, att när bara en tråd används i en modul har den full tillgång till alla resurser.
Här har vi AMD:s nästa generations processor, baserad på Bulldozer-arkitekturen. Som vi ser så kommer processorn med fyra Bulldozer-moduler, och det betyder alltså att den har totalt åtta kärnor eftersom varje modul innehåller två kärnor. Man kommer även att avvika något från tidigare då man ska använda samma kärna till konsument, och servervarianter av processorn något man inte gjort med Phenom II, respektive Opteron-serien. Men kärnan kommer ändå ha olika beteckning beroende på vilken marknad den ska företräda. För konsumentmarknaden Zambezi, och för servermarknaden Valencia och Interlagos.
Nu ser vi vad som mer fyller ut kretsytan mer än bara processorns moduler. Varje modul med 2 MB L2 cache-minne vardera, totalt 8 MB L2 cache-minne för hela processorn. Den får även totalt 8 MB L3 cache-minne som kan användas av samtliga moduler. Kretsen har fyra HyperTransport-länkar på 16-bitar för kommunikation mellan flera olika processorer, och moderkortets styrkretsar. Konsumentversionen kommer dock bara ha en av dem aktiverade då de andra är överflödiga.
Processorn kommer ha en integrerad nordbrygga (PCI Express sitter fortfarande på en separat nordbrygga på moderkortet). Till skillnad från Phenom II, stödjer Bulldozer bara DDR3 och AMD räknar med att den nya arkitekturen ska ha 50% högre bandbredd än tidigare. Bulldozer får två 72-bit minneskontrollers (detta när ECC är aktiverat, annars är det två 64-bit) precis som Phenom II-familjen.
Med allt det ovan så får vi en ny processorkrets från AMD, som utan tvekan får ses som den mest avancerade från företaget hittills. Zambezi som konsumentversionen kallas, blir hela 315 mm² och kommer med inget mindre än två miljarder transistorer. Det var en siffra som tog oss på sängen, då det utan tvekan är det största antalet transistorer i en konsumentprocessor någonsin. Llano kommer inte långt ifrån med sina 1,45 miljarder men då har vi ändå en stor grafikkrets där också.
| Egenskap | Kärnor | L2 cache | L3 cache | Teknik | Transistorer | Kretsarea |
| Zambezi | 8 | 4 x 2 MB | 8 MB | 32nm SOI/HKMG |
~2 000 milj. | 315 mm² |
| Thuban | 6 | 6 x 512 KB | 6 MB | 45nm SOI/HKMG |
904 milj. | 346 mm² |
| Llano Wintercreek | 2 | 2 x 1 MB | - | 32nm SOI/HKMG |
758 milj. | ? |
| Llano Beavercreek | 4 | 4 x 1 MB | - | 32nm SOI/HKMG |
1 450 milj. | 228 mm² |
| Sandy Bridge-E | 6 | 6 x 256 KB | 15 MB | 32nm Bulk/HKMG |
? | 400 mm² |
| Westmere | 6 | 6 x 256 KB | 12 MB | 32nm Bulk/HKMG |
1 170 milj. | 240 mm² |
| Sandy Bridge | 4 | 4 x 256 KB | 8 MB | 32nm Bulk/HKMG |
995 milj. | 216 mm² |
| Sandy Bridge | 2 | 2 x 256 KB | 4 MB | 32nm Bulk/HKMG |
624 milj. | 149 mm² |
| Regor | 2 | 2 x 1 MB | - | 45nm SOI |
234 milj. | 117 mm² |
| Propus | 4 | 4 x 512 KB | - | 45nm SOI |
300 milj. | 169 mm² |
| Deneb | 4 | 4 x 512 KB | 6 MB | 45nm SOI |
758 milj. | 258 mm² |
| Penryn | 2 | 6 MB | - | 45nm Bulk/HKMG |
410 milj. | 107 mm² |
| Bloomfield | 4 | 4 x 256 KB | 8 MB | 45nm Bulk/HKMG |
731 milj. | 263 mm² |
| Lynnfield | 4 | 4 x 256 KB | 8 MB | 45nm Bulk/HKMG |
774 milj. | 296 mm² |
| Westmere | 2 | 2 x 256 KB | 4 MB | 32nm Bulk/HKMG |
383 milj. | 81 mm² |
Vi måste säga att det är enimponerande mängd transistorer. Det här är en åttakärnig processor, utan PCI Express eller grafikkrets integrerad. Det kan jämföras mot Sandy Bridge som kommer med fyra kärnor, integrerad grafik och PCI Express-banor som ligger på 995 miljoner transistorer med kretsyta 216 mm². AMD:s tidigare flaggskepp, Phenom II X6 "Thuban" som kommer med 904 miljoner transistorer och 6 kärnor på en något större kretsyta på 346 mm².
![]()
Det är även en imponerande mängd transistorer vi ser på en tillverkningsprocess på 32nm i förhållande till kretsstorleken. Det här är ett bevis på GlobalFoundries idag världsledande 32nm-teknik med ett Gate-first-utförande som gör att man sparar 10-20% kretsyta mot Gate-last som i princip hela omvärlden annars kör med. Tillsammans med SOI och HKMG låter det som ett vinnande recept för AMD, speciellt då de använt en mer än dubbelt så hög transistorbudget än med Thuban.
Arkitekturen i sig ska även ha ett modulärt designfokus. Vad det innebär är att AMD på kortare tid än med en icke-modulär arkitektur kan göra nya kretsar baserade på Bulldozer. Anser AMD att de behöver fler kärnor för att konkurrera mot Intel ska det alltså inte vara några större problem att leverera det. Eller om de vill använda Bulldozer i en helt annan produktkategori som deras APU:er, ska det även vara lätt att klistra in den där. Ingenting är problemfritt inom halvledarindustrin, men ett modulärt designval gör det helt mycket enklare.
AMD:s designval är någonting helt nytt på x86-marknaden och det ska bli intressant att se på slutresultatet i våra tester. Men vi tänkte gå in mer i detalj vilka resurser som är delade i processorn.
Sida 3 av 32