Nordichardware Logo

Glömt användarnamn

Test: AMD Radeon HD 6970/HD 6950 - Nya prestandakort - Cayman snålar på beräkningsenheter

Om vi ser till AMD:s närmaste historia, även NVIDIA:s för den delen, innebär en ny grafikkortsgeneration i regel att man utökar antalet beräkningsenheter. Desto fler beräkningsenheter, desto högre prestandapotential brukar det heta. I AMD:s fall pratar vi primärt om deras så kallade streamprocessorer, de beräkningsenheter som sköter merparten av jobbet i grafikkretsarna.

Med Cayman har AMD vänt på klacken och Radeon HD 6900-serien skiljer sig betydligt mer mot tidigare generationer än exempelvis mellanklasserien Radeon HD 6800.

hd6900sum

Färre streamprocessorer - högre prestanda?

Under lång tid har AMD använt sig av en så kallad VLIW5-arkitektur (Very long instruction word). Detta betyder att varje streamprocessorenhet (SPU) kunnat utföra 5 separata instruktioner samtidigt med fem separata streamkärnor. Med Cayman har AMD valt att plocka bort en av streamprocessorerna och istället satsat på fyra SPs med likvärdig funktionalitet - en så kallad VLIW4 arkitektur.

SPU
AMD Cypress VLIW5 design vs. AMD Cayman VLIW4 design

Detta kan tyckas som ett sällsynt dumt drag då man på det stora hela drar ner på den potentiella beräkningskraften per streamprocessorenhet, men AMD menar att man i de flesta tester kommer att tjäna prestanda. Detta på grund av att man nu gör det lättare för program- och spelkod att utnyttja beräkningsenheterna i deras grafikkretsar. AMD menar att man sett 10% bättre prestanda vid samma kretsyta som med deras tidigare VLIW5-lösningar.

Den funktionalitet som tidigare fanns i AMD:s så kallade T-unit har spridits över de kvarvarande streamprocessorerna och precisionen ska enligt tillverkaren ökat.

Slutsatsen AMD dragit är att deras tusentals streamprocessorer (Cypress har idag flest med 1 600 st.) är mycket kraftfulla när de utnyttjas till fullo. Men trots år av optimering och erfarenhet har det visat sig att det är väldigt sällan alla dessa streamprocessorer utnyttjas till fullo. Detta kan exempelvis jämföras med med NVIDIA och deras Fermi-arkitektur där man har 512 st. CUDA-kärnor i sitt flaggskepp. Dessa beräkningsenheter är förvisso betydligt kraftfullare än AMD:s SP-kärnor, men trots att AMD ofta kan prata om imponerande teoretisk beräkningskraft har NVIDIA fortfarande den kraftfullaste grafikkretsen på marknaden - men även den som kräver klart flest transistorer och energi.

Eller för den delen CPU-marknaden där man har problem att utnyttja 4-6 kärnor då all kod ska brytas upp i delar för att exekveras samtidigt på varsin beräkningsenhet. Potentialen i parallell beräkningskraft är enorma, men att praktiskt utnyttja den är betydligt svårare.

Effektivare idag, ännu effektivare på sikt

AMD och mjukvaruutvecklare har i många år utvecklat applikationer och spel för att på bästa sätt dra nytta av den breda parallella GPU-design man använt sig av. Även om man genom att gå till en VLIW4 design redan idag ska ha lyckats effektivisera sin arkitektur och prestanda var AMD tydliga med att optimeringen för den nya arkitekturen är långt ifrån färdig. Man kan välja att se det negativt som i att Cayman idag inte når sin fulla potential, eller så kan man se det positivt och se fram emot kontinuerliga prestandaförbättringar i takt med att optimeringen förbättras.

Intressant är dock att AMD står fast vid sin VLIW5-design för sina mellanklass och budgetmodeller - Radeon HD 6800 och neråt. Exakt varför man gjort på detta sättet är oklart, men om inte Southern Islands blir en helt ny arkitektur är vi ganska övertygade om att AMD med 28nm tekniken går över helt till en VLIW4-design, även för mellanklass och budget.

Nu är det dags att kika närmare på hur AMD:s designbeslut påverkar Cayman i sin helhet.

Sida 4 av 26

Skriv en kommentar


FORM_CAPTCHA
Byt kod

Våra köprekommendationer











Undersökning

Vad har du för internetanslutning hemma?







Resultat
Prenumerera pâ vârt nyhetsbrev
RSS Feed