Delat cacheminne, förlängd Pipeline och utökad Power-gating

11 5
15 16

Förutom en flyttalsenhet som gått upp i vikt så är den stora nyheten det nya L2-cacheminnet. Jaguar är designad för att vara en fyrkärnig arkitektur där varje kärna har fått 512 kilobyte L2-cacheminne vilket är förhållandevis lite, men en nödvändig kompromiss för att inte överskrida strömbudgeten men även att begränsa kretsytan som processorkärnorna kommer ta upp. L2-cacheminnet förblir även 16-vägs associativ likt Bobcat. Det finns ett stort men – en ny bussenhet binder samman cacheminnet så att det delas mellan alla processorkärnor.

Vad det här innebär i praktiken är att tre kärnor kan stängas av helt, medan en ensam kärna har tillgång till totalt 2 megabyte L2-cacheminne. Resultatet av detta blir bättre prestanda i dåligt trådade applikationer, som fortfarande är väldigt vanligt bland konsumentapplikationer. Bussenheten körs i samma klockfrekvens som processorkärnorna, men den kan klocka ned sig själva till hälften när processorkärnorna inte kräver en snabb tillgång av datan i cacheminnet.

12

Jaguars Pipeline är ett steg längre än Bobcat vilket ger ett marginellt försämrat IPC-värde, men det vägs upp av de andra optimeringarna i arkitekturen. Fördelen är att AMD räknar med en klockfrekvens som blir minst 10 procent högre än den Bobcat är kapabel till. Latenserna för cacheminnet ligger kvar på samma nivå som tidigare, vilket är 3 klockcykler för L1-cacheminnet och 17-clockcykler för L2-cacheminnet.

Jaguar effektivare på att stänga av oanvända logik

I jakten på maximal strömeffektivitet och längre batteritid har på senare år en teknik som kallas för Power-gating börjat användas. Tidigare försökte man köra kretsar i så låga klockfrekvenser som möjligt när de inte användes. Problemet var att de drog fortfarande ström och strömläckaget blev ett växande problem vid mindre tillverkningsnoder.

Med Power-gating kan transistorer som inte behövs i en krets stängs av helt genom att få sitt strömflöde strypt. Det går även att stänga av individuell logik i en processorkärna, medan annan logik i samma kärna utför beräkningar. Tekniken är svår att implementera och resulterar i en något högre kretsyta, men ger en hög utdelning om det görs på rätt sätt.

17 18

I Bobcat-arkitekturen kunde 91,8 procent av kärnan stängas av helt, men det här innebar att 8,2 procent fortfarande låg och drog ström i onödan. Med Jaguar ligger siffran på det klart bättre 98,8 procent vilket betyder att endast 1,2 procent drar och läcker ström. Även när applikationer körs så klarar Jaguar av att stänga av en större del av processorkärnan än vad Bobcat-arkitekturen klarade av.

Subscribe
Notifiera vid
18 Comments
äldsta
senaste flest röster
Inline Feedbacks
View all comments
Sebbe
Sebbe
11 Årtal sedan

Låter intressant, har man samma på värstingprocessorerna och grafikkorten så komer väl AMD tillbaka till fight dom egentligen hade tänkt med Bulldozer och FX.

-Boris-
-Boris-
11 Årtal sedan

Vill se benchmarks mot K8, Phenom II och Piledriver vid samma frekvens sedan när den släpps. 🙂

-Boris-
-Boris-
11 Årtal sedan

[quote name=”Jacob Hugosson”][quote name=”-Boris-”]Vill se benchmarks mot K8, Phenom II och Piledriver vid samma frekvens sedan när den släpps. :)[/quote]Det ska vi nog kunna lösa :-)[/quote] Låter bra det. 🙂 Har du grejerna hemma vore det grymt uppskattat med en Brazos vs K8, P-II och BD redan innan Jaguar kommer. ;)Men förstår att det är mycket jobb.Förutsatt att alla siffror stämmer så borde ju Jaguar vara ikapp K8. Men det är väl lite väl optimistiskt. 😉 EDIT:Hittade detta:http://www.anandtech.com/show/4023/the-brazos-performance-preview-amd-e350-benchmarked/3 Brazos står ju sig riktigt bra mot K8! Med tanke på IPC skillnader så borde ju en Jaguar X4 vara ikapp tidiga… Läs hela »

-Boris-
-Boris-
11 Årtal sedan

[quote name=”Jacob Hugosson”]Jag har ingenting hemma, alla testsystem är i vårt huvudkontor tyvärr. Men Jaguar kommer inte lanseras än på länge så det borde gå att lösa 🙂 Bobcat ska vara byggd ”från scratch” och Jaguar bygger på Bobcat. Jag tror aldrig AMD gått ut med att Bobcat är baserad på någon tidigare arkitektur. De har säkert tagit inspiration från annat håll, som den nya divideraren i Jaguar de saxat direkt från Llano.[/quote] Men arkitekturer helt från scratch är extremt ovanligt och jag tror inte AMD gjort någon sådant någonsin. BD delar grund med Phenom II, även om den är… Läs hela »

-Boris-
-Boris-
11 Årtal sedan

[quote name=”Jacob Hugosson”]Därför jag skrev ”från scratch”, AMD har ingenting sagt offentligt om Bobcat bygger på någon tidigare arkitektur 😛 De har säkert tagit många block och inspiration från tidigare arkitekturer, precis som både AMD, Intel och alla andra gör.[/quote]

Tror inte det är ett pussel med en liten bit här och en liten bit där, jag tror att grunden och större delen kommer från en enda tidigare arkitektur, och det luktar K6 med ny FPU och modernare front end tycker jag allt.

-Boris-
-Boris-
11 Årtal sedan

[quote name=”Jacob Hugosson”]Spekulera kan man alltid göra :-)[/quote]

Det är det som är halva (eller hela) nöjet med det här intresset. 😀

Swedish Berserk
Swedish Berserk
11 Årtal sedan

Jättebra artikel Jacob! 🙂 Jaguar låter som en riktigt intressant produkt. Prestandan borde bli riktigt bra också.

robjoh
robjoh
11 Årtal sedan

Någon med mer kunskap än mig som kan förklara:

”Bobcat är dock inte kapabel till att köras i höga klockfrekvenser på grund av begränsningar i arkitekturen, vilket har gjort att den högst klockade varianten E-1800 ligger på 1,7 gigahertz.”

Vad är det som ställer till med problem? Trodde jag hade sett folk överklocka de där sakerna.

Tempel
Tempel
11 Årtal sedan

Tester och framförallt förbrukningssiffror. Har ju en Brazos 2.0 och den rullar på fint men man gör ju inget riktigt tungt på den så det vore kul att få se lite tester på vad den klarar både i spelväg och i annat och gärna mot äldre plattformar.

-Boris-
-Boris-
11 Årtal sedan

Vill förtydliga Jacobs förklaring med att syntetiserade designer innebär att en superdator sitter och planerar kretsarnas banor och utformning efter direktiven som AMDs ingenjörer ger.AMDs ingenjörer sätter ihop en teoretisk krets med transistorer som ska kopplas ihop på speciella sätt enligt ett kopplingsschema, men hur ledningarna dras rent fysiskt bestäms av en dator sedan. Att låta ingenjörer utforma saker för hand kan ge högre frekvenser, men är mycket dyrt.Att AMD utvecklat metoder för att syntetisera innebär att de mycket snabbare kan stoppa in förbättringar och nya tekniker i sina processorer. Så i längden borde det inte bara vara billigare, utan… Läs hela »

robjoh
robjoh
11 Årtal sedan

Vill tacka Jacob och Boris för förtydligandet.

al0be
al0be
11 Årtal sedan

jag skulle bara vilja tilägga att e2 1800 är inte amds snabbaste brazos 2.0, Utan snarare e2 2000 som rullar i 1.75 ghz