Dubblerad flyttalsenhet, delat L2-cacheminne

6
7 8

Jaguar behåller en instruktionscache (L1 Icache) på 32 kilobyte, men har fått en ny så kallad loop buffer på 4 gånger 32 byte. Den här finns till för att kunna buffra små bitar kod i väntan på att den behövs, för att på så vis spara ström istället för att behöva hämta datan från det större 32 kilobytes cacheminnet. Prefetchern har också förbättrats för att snabbare kunna hämta data från cacheminnet, för att på så vis öka arkitekturens IPC-värde (instruktioner per klockcykel/Instructions Per Clock). Jaguars Decode-enhet har fått ett extra steg i pipelinen vilket ofta associeras med sämre prestanda, men detta är en kompromiss för att istället kunna ge arkitekturen en högre klockpotential mot Bobcat.

Arkitekturens beräkningsenhet för heltalsuträkningar lämnas till stora delar oförändrad, men en ny dividerare som AMD ska ha tagit direkt ur Llano-arkitekturen ska påskynda uträkningar av just dividering tvåfaldigt. Jaguar har även fått mer OoO-resurser (Out of Order), vilket till stora delar kommer från att schemaläggaren blivit större än i Bobcat.

9 10

Flyttalsenheten har däremot fått sig ett rejält ansiktslyft och dubblerats från 64-bit till 128-bit. Enheten klarar av fyra singelprecisions-multipliceringar och fyra adderingar per klockcykel, medan den i dubbelprecisionsberäkningar begränsas till en multiplicering och två adderingar per klockcykel. När det kommer till flyttalsberäkningar kommer Jaguar bli en massiv förbättring per kärna mot det vi ser i Bobcat, inte minst då artkitekturen är byggd för att husera det dubbla antalet kärnor – mer om det om det lite längre fram.

Bobcat hade stöd för ett oväntat högt antal instruktioner och AMD har sett till att Jaguar kommer leva upp till detta. Jaguar får tilläggen SSE4.1, SSE4.2, AES, CLMUL, MOVBE, XSAVE/XSAVEOPT, F16C, BMI1 och slutligen även AVX. Jaguar kommer endast med en flyttalsenhet på 128-bit, men AVX kräver 256-bit. För att stödja AVX kommer flyttalsenheten att ”dubbelpumpas” när det behövs, vilket bör innebära att flyttalsenheten kommer arbeta i den dubbla klockfrekvensen mot övriga kärnan när AVX används. Att dubbelpumpa flyttalsenheten är ingen nyhet i Jaguar, då Bobcat fick göra just det för att kunna utföra 128-bit SSE-instruktioner med sin 64-bit flyttalsenhet.

18
Leave a Reply

Please Login to comment
18 Comment threads
0 Thread replies
0 Followers
 
Most reacted comment
Hottest comment thread
7 Comment authors
Jacob Hugossonal0berobjoh-Boris-Tempel Recent comment authors
  Subscribe  
senaste äldsta flest röster
Notifiera vid
Sebbe
Medlem
Sebbe

Låter intressant, har man samma på värstingprocessorerna och grafikkorten så komer väl AMD tillbaka till fight dom egentligen hade tänkt med Bulldozer och FX.

-Boris-
Medlem
-Boris-

Vill se benchmarks mot K8, Phenom II och Piledriver vid samma frekvens sedan när den släpps. 🙂

-Boris-
Medlem
-Boris-

[quote name=”Jacob Hugosson”][quote name=”-Boris-”]Vill se benchmarks mot K8, Phenom II och Piledriver vid samma frekvens sedan när den släpps. :)[/quote]Det ska vi nog kunna lösa :-)[/quote] Låter bra det. 🙂 Har du grejerna hemma vore det grymt uppskattat med en Brazos vs K8, P-II och BD redan innan Jaguar kommer. ;)Men förstår att det är mycket jobb.Förutsatt att alla siffror stämmer så borde ju Jaguar vara ikapp K8. Men det är väl lite väl optimistiskt. 😉 EDIT:Hittade detta:http://www.anandtech.com/show/4023/the-brazos-performance-preview-amd-e350-benchmarked/3 Brazos står ju sig riktigt bra mot K8! Med tanke på IPC skillnader så borde ju en Jaguar X4 vara ikapp tidiga… Läs hela »

-Boris-
Medlem
-Boris-

[quote name=”Jacob Hugosson”]Jag har ingenting hemma, alla testsystem är i vårt huvudkontor tyvärr. Men Jaguar kommer inte lanseras än på länge så det borde gå att lösa 🙂 Bobcat ska vara byggd ”från scratch” och Jaguar bygger på Bobcat. Jag tror aldrig AMD gått ut med att Bobcat är baserad på någon tidigare arkitektur. De har säkert tagit inspiration från annat håll, som den nya divideraren i Jaguar de saxat direkt från Llano.[/quote] Men arkitekturer helt från scratch är extremt ovanligt och jag tror inte AMD gjort någon sådant någonsin. BD delar grund med Phenom II, även om den är… Läs hela »

-Boris-
Medlem
-Boris-

[quote name=”Jacob Hugosson”]Därför jag skrev ”från scratch”, AMD har ingenting sagt offentligt om Bobcat bygger på någon tidigare arkitektur 😛 De har säkert tagit många block och inspiration från tidigare arkitekturer, precis som både AMD, Intel och alla andra gör.[/quote]

Tror inte det är ett pussel med en liten bit här och en liten bit där, jag tror att grunden och större delen kommer från en enda tidigare arkitektur, och det luktar K6 med ny FPU och modernare front end tycker jag allt.

-Boris-
Medlem
-Boris-

[quote name=”Jacob Hugosson”]Spekulera kan man alltid göra :-)[/quote]

Det är det som är halva (eller hela) nöjet med det här intresset. 😀

Svensken
Medlem
Svensken

Jättebra artikel Jacob! 🙂 Jaguar låter som en riktigt intressant produkt. Prestandan borde bli riktigt bra också.

robjoh
Gäst
robjoh

Någon med mer kunskap än mig som kan förklara:

”Bobcat är dock inte kapabel till att köras i höga klockfrekvenser på grund av begränsningar i arkitekturen, vilket har gjort att den högst klockade varianten E-1800 ligger på 1,7 gigahertz.”

Vad är det som ställer till med problem? Trodde jag hade sett folk överklocka de där sakerna.

Tempel
Medlem
Tempel

Tester och framförallt förbrukningssiffror. Har ju en Brazos 2.0 och den rullar på fint men man gör ju inget riktigt tungt på den så det vore kul att få se lite tester på vad den klarar både i spelväg och i annat och gärna mot äldre plattformar.

-Boris-
Medlem
-Boris-

Vill förtydliga Jacobs förklaring med att syntetiserade designer innebär att en superdator sitter och planerar kretsarnas banor och utformning efter direktiven som AMDs ingenjörer ger.AMDs ingenjörer sätter ihop en teoretisk krets med transistorer som ska kopplas ihop på speciella sätt enligt ett kopplingsschema, men hur ledningarna dras rent fysiskt bestäms av en dator sedan. Att låta ingenjörer utforma saker för hand kan ge högre frekvenser, men är mycket dyrt.Att AMD utvecklat metoder för att syntetisera innebär att de mycket snabbare kan stoppa in förbättringar och nya tekniker i sina processorer. Så i längden borde det inte bara vara billigare, utan… Läs hela »

robjoh
Gäst
robjoh

Vill tacka Jacob och Boris för förtydligandet.

al0be
Medlem
al0be

jag skulle bara vilja tilägga att e2 1800 är inte amds snabbaste brazos 2.0, Utan snarare e2 2000 som rullar i 1.75 ghz