Bulldozers återkomst: Piledriver

Bulldozer var en efterlängtad arkitektur, AMD skulle komma tillbaka och konkurrera med Intel i det högre segmentet. För första gången på över tio år introducerade AMD en arkitektur som var helt ny från grunden och med GlobalFoundries då världsledande tillverkningsteknik hade företaget en ärlig chans att på allvar visa Intel vart skåpet skulle stå. AMD tog dock en onödigt stor risk, som de tidigare uttalat sig om att de aldrig skulle göra: de introducerade den nya arkitekturen, på en aldrig tidigare använd tillverkningsteknik.

AMD kunde inte nå de klockfrekvenser de hade hoppats på, då strömförbrukningen skenade iväg mot aldrig tidigare skådade höjder på konsumentmarknaden när de siktade för högt. Företaget hade inte heller haft möjligheten att korrigera alla fel som är bundna att existera med en arkitektur som är helt ny från grunden. Lanseringen sköts fram flera gånger och att de hade problem blev allt mer tydliga. GlobalFoundries ville påbörja massproduktion på den nya tillverkningstekniken, investerare och klienter började tappa tålamodet. AMD tvingades in i ett hörn och en situation de inte kunde ta sig ur.

De tvingades till slut skeppa Bulldozer, den design som borde varit både revolutionerande och banbrytande mottogs av många arga miner och krossade förhoppningar. Inte minst vi på NordicHardware såg inget annat val än att med stor sorg i hjärtat ge den nya toppmodellen den första Kalkon-utmärkelsen i vår historia. Nu återvänder Bulldozer i ny skepnad, denna gången med namnet Piledriver och det är denna arkitektur vi återfinner i Trinity.

Piledriver – vad Bulldozer borde varit?

Bulldozer var den första helt nya arkitekturen från AMD på över tio år, kombinerat med en ny obeprövad tillverkningsteknik fick vi hittar dagens FX-serie. Piledriver kommer inte med flera stora förändringar, och i väldigt grova drag är det fortfarande samma Bulldozer-arkitektur det handlar om. Vad de har gjort är istället att finputsa Bulldozer, med många små ändringar och justeringar som ska resultera i högre prestanda.

Piledriver

AMD har lämnat enheterna som utför beräkningar i heltal och flyttal till största del orörda, vilket kanske låter konstigt men det var inte här problemen i Bulldozers design ligger. All kringliggande logik har förbättrats, som processorns Frontend, Prefetcher och schemaläggare. Processorns L1 TLB-cache för virtuell adressering har blivit större, och dess L2-cache som många misstänkte var ett av de stora problemen i Bulldozer ska ha fått ökad effektivitet. Att all kringliggande logik förbättrats bör resultera i förbättrad IPC (Instructions Per Cycle/Clock), men även att processorn utför mindre arbete i onödan och därmed blir mer strömeffektiv.

Förutom prestandaförbättringar har de sänkt strömläckaget i Piledriver jämfört mot Bulldozer. Det här ska ge Piledriver ökad potential i klockfrekvenser. För stationära Trinity vi testar idag uppgår klockfrekvensen till hela 4,2 gigahertz med den inbyggda turbofunktionen, medan basfrekvensen ligger på 3,8 gigahertz. När vi tittar på Vishera – den åttakärniga processor som ersätter dagens FX-serie, ska det vara en arkitektur på ”över 4,0 GHz”.

För de som är intresserade av en djupare genomgång av arkitekturen och Bulldozers design, rekommenderar vi vår recension av FX-8150 från hösten förra året:

Steamroller blir den första stora revisionen av Bulldozer

Medan Piledriver kommer med många välbehövliga förbättringar och blir strömeffektivare än Bulldozer, så är det Steamroller som blir den första stora revisionen av arkitekturen. Steamroller kommer att användas i företagets tredje generation APU:er som går under kodnamnet Kaveri.

Med Steamroller handlar det om att förbättra den enkeltrådade prestandan i artiketuren. Beräkningsenheterna lämnas till stora delar helt oförändrade – flyttalsenheten krymper faktiskt AMD, men de tar endast bort onödigt bagage så prestandasförlusten ska vara lika med noll. Arkitekturens Frontend optimeras på de flesta punkterna, Decode-enheten har fortfarande en bredd på fyra instruktioner vardera men nu får varje kärna i en modul en Decode vardera, en ökning på 100 procent från Bulldozer och Piledriver som vi ska titta närmare på idag. Det är detta som ska bidra till den största prestandaförbättringen mot idag.

Företagets nya CTO (Chief Technology Officer) Mark Papermaster, med en imponerande meritlista från bland annat IBM och Apple, har i ett tidigare uttalande till TechReport erkänt att AMD måste få ut högre prestanda ur sina processorer. Högre prestandaförbättringar än de 10 – 15 procent AMD pratat om årligen kommer behövas och medan han inte ville gå in på detaljer sade han: ”We need more than that. We’ll get more.”

Sedan Hot Chips-konferenser vet vi att enligt simuleringar AMD gjort av arkitekturen Steamroller, ska den klara av 30 procent fler instruktioner per klockcykel i jämförelse med Piledriver och leverera upp till 15 procent högre prestanda per watt. Om AMD klarar av att leva upp till det här löftet återstår att se, men det kommer behövas om företaget hoppas ha en chans att konkurrera mot Intel i prestandasegmentet igen. För den som vill läsa mer om Steamroller, rekommenderas vår teknikartikel om ämnet:

42
Leave a Reply

avatar
42 Comment threads
0 Thread replies
0 Followers
 
Most reacted comment
Hottest comment thread
18 Comment authors
Laglord3nAnton KarmehedxemacsJacob Hugossonmcnaldo Recent comment authors
  Subscribe  
senaste äldsta flest röster
Notifiera vid
SebbesApa
Medlem
SebbesApa

Med tanke på Trinitys låga strömförbrukning i idle och OK prestanda, så ser jag faktiskt att den skulle passa rätt bra för desktops i kommuner ex…

Anton Karmehed
Admin

[quote name=”SebbesApa”]Med tanke på Trinitys låga strömförbrukning i idle och OK prestanda, så ser jag faktiskt att den skulle passa rätt bra för desktops i kommuner ex…[/quote]
Ja där skulle den mycket väl kunna fungera. Min tanke var också att Trinity hade varit perfekt för Hem-PC konceptet. En tillräckligt kompetent CPU för att driva en familjedator samt en GPU som gjort det möjligt för barn och ungdomar att spela lite spel. Allt för en riktigt rimlig peng.
Synd bara att Hem-PC reformen gick i graven för ett par år sedan. 😛

Tord Nilsson
Medlem
Tord Nilsson

Varför skriver ni på svengelska? ”Testsystem och metod current position”

Anton Karmehed
Admin

[quote name=”Viking1962″]Varför skriver ni på svengelska? ”Testsystem och metod current position”[/quote]
Det är inte vi som skriver, det är vårt underliggande webbsystem som av någon underlig anledning försöker berätta för dig vilken sida du är på ”current position”. Men ska se till att få det löst!

Tempel
Medlem
Tempel

Med tanke på antalet Sata, stöd för Raid 5 så är ju A85 en plattform för en nas deluxe, får man titta på vilka trinitys som drar riktigt lite kräm 😀

Svensken
Medlem
Svensken

Bra recension!

Ser riktigt bra ut! Hade varit något att ersätta Athlon II X4 620 – ATI HD4770 kombon man har i sin arbetsdator. Då kunde man använt den integrerade grafiken den ligger i en väldigt hög klass. 🙂

-Tjalve-
Gäst
-Tjalve-

[quote name=”Tempel”]Med tanke på antalet Sata, stöd för Raid 5 så är ju A85 en plattform för en nas deluxe, får man titta på vilka trinitys som drar riktigt lite kräm :D[/quote]

Nu har ju jag en förkärlek för lagring, men jag håler med om att detta är ytterst intressant. 8st SATA 6Gbps är ju grymt. Om vi får se det på Uppföljaren till Brazos så är jag såld!

Marquzz
Medlem
Marquzz

Känns inte som om denna hör hemma på desktop riktigt, inte ens i enklare arbetsdatorer, då känns den lite väl dyr och man kan lika gärna köra på nån s1155 Celeron eller Pentium. Däremot i bärbara så vore den ju toppen! Låg strömförbrukning och stöd för 3 skärmar och bra integrerad grafik, ge mig! Stör mig på att min nya fina i7 baserade laptop från Dell inte har stöd för 3 skärmar då jag verkligen skulle vilja ha det på jobbet. Dessutom så skulle inte lite kraftfullare grafik skada när man är på konferens så man kan spela lite. Hade… Läs hela »

robjoh
Gäst
robjoh

Först och främst tack för en bra artikel.

Sedan:
Ni nämner att grafiken är starkt beroende på bandbredden på minnet. Provade ni endast 1600 MHz eller körde ni även 1866MHz? Blev osäker på vad som gällde då ni nämnde 1866MHz några gånger men testhårdvaran hade 1600MHz.

Ni nämner att det inoffeciella stödet är 2400 MHz. Finns det någon chans att ni skulle kunna göra ett senare test och se vad det innebär?

Marcus Heinemo
Medlem

Idle W imponerar men load var mindre kul läsning. 147W med endast belastning på cpu blir på tok för mycket när grafiken får börja jobba, för en pico-psu det vill säga. Mina planer på en minimal spelburk blir nog inte förverkligad med trinity. Undrar om inte nedvoltad ivy bridge med lågprofil 6670 är ett bättre val.

Anton Karmehed
Admin

[quote name=”robjoh”]Först och främst tack för en bra artikel. Sedan:Ni nämner att grafiken är starkt beroende på bandbredden på minnet. Provade ni endast 1600 MHz eller körde ni även 1866MHz? Blev osäker på vad som gällde då ni nämnde 1866MHz några gånger men testhårdvaran hade 1600MHz. Ni nämner att det inoffeciella stödet är 2400 MHz. Finns det någon chans att ni skulle kunna göra ett senare test och se vad det innebär?[/quote]Tanken var att kunna köra skalningstester med olika minnesfrekvenser. Precis som vi gjorde med Llano. Tyvärr hade vi inga riktigt vassa DDR3-minnen i testlabbet och tidsbegränsningen var för stor.… Läs hela »

PsynoKhi0
Medlem
PsynoKhi0

Bra artikel, objektiva slutsatser 🙂

Känner ni till några mjukvaruuppdateringar på gång som skulle passa modularkitekturen bättre/använda grafikdelen mera (GPGPU)?

robjoh
Gäst
robjoh

[quote name=”Anton Karmehed”]
Tanken var att kunna köra skalningstester med olika minnesfrekvenser. Precis som vi gjorde med Llano. Tyvärr hade vi inga riktigt vassa DDR3-minnen i testlabbet och tidsbegränsningen var för stor. Men jag skulle kunna köra några snabba kompletterande tester på 1333, 1600, 1866 i alla fall.
[/quote]

Det hade uppskattats! Hade varit intressant att se hur mycket minnet begränsar grafiken.

drizzit
Medlem
drizzit

Ser ut att passa utmärkt till en hemma dator ala HTPC/surfa i soffan/spela lite lättare spel.

Har redan en HTPC med den gamla A6-3500 i som redan den gör ett strålande jobb som detta (dock med betoning på ”lättare” spel) men A10an ser riktigt trevlig ut som en eventuell ersättare.

Robin Larsson
Medlem
Robin Larsson

Hade varit kul med en standoff mot FX-8150 med avstängda kärnor och samma klockfrekvens för att redovisa procentuella förbättringar.

Annars fint skrivet med väl utvalda och genomtänkta ord.

Robin Larsson
Medlem
Robin Larsson

Med krympt teknik inför Steamroller, hade varit ballt ifall de klämde in en HD7750/-70 och kanske en Tri-fire stöd med 2xHD7770+APU.

Borde inte vara helt omöjligt.

Laglord3n
Gäst
Laglord3n

[quote name=”-Tjalve-”][quote name=”Tempel”]Med tanke på antalet Sata, stöd för Raid 5 så är ju A85 en plattform för en nas deluxe, får man titta på vilka trinitys som drar riktigt lite kräm :D[/quote] Nu har ju jag en förkärlek för lagring, men jag håler med om att detta är ytterst intressant. 8st SATA 6Gbps är ju grymt. Om vi får se det på Uppföljaren till Brazos så är jag såld![/quote] Mmm, nja… du kanske får 8 st SATA 6Gbps portar direkt från chipsettet på mdermodemet, men frågan är om du får 8 st BRA SATA 6Gbps portar. Intels ICH-kontrollers är… Läs hela »

Robin Larsson
Medlem
Robin Larsson

[quote name=”Jacob Hugosson”][quote name=”Oldvikingschool”]Med krympt teknik inför Steamroller, hade varit ballt ifall de klämde in en HD7750/-70 och kanske en Tri-fire stöd med 2xHD7770+APU.

Borde inte vara helt omöjligt.[/quote]
8 Compute Units, dvs. 512 Radeon-kärnor som finns i HD 7750 är redan bekräftat sedan Analyst Day tidigare i år 🙂 Klockfrekvenserna måste ligga på ~900 megahertz om de ska uppnå sitt utlovad GFLOPS-värde. Så den stora frågan är egentligen hur stor begränsning minnesbandbredden kommer bli.[/quote]

Skulle då inte vilja ha en prestandaförbättring utan bara att apun eliminerar microstuttering. Bara det hade varit attraktivt för mig.

Mikael
Medlem
Mikael

Wow. Ni har alltså utvecklat en särskild testmetod för att testa processorer med inbyggd grafik och kommit fram till att ni på 16 egentliga testsidor ska använda totalt en (1) sida för APU-test och en sida för att testa gpgpu-prestanda, fast utan att faktiskt testa gpgpu-prestandan. Samtidigt använder ni 14 (15 om man räknar sidan där ni skulle ha tittat på gpgpu-prestanda) till att gå igenom processordelen. Jag hade sett fram emot den här recensionen, men är inte så imponerad av genomförandet. När ni ändå lägger ner så mycket tid på att testa hade det inte varit bättre med lite… Läs hela »

robjoh
Gäst
robjoh

[quote name=”Jacob Hugosson”] Så den stora frågan är egentligen hur stor begränsning minnesbandbredden kommer bli.[/quote]

En fråga om minnesbandbredd. Skalar den automatiskt med hastigheten eller finns det andra flaskhalsar?

Exempelvis, om vi går från 1600->2400MHz innebär det att bandbredden ökar med 50%?

Sedan kommer nästa fråga: Det verkar vara mer regel än undantag att grafikkort som får DDR3 istället för GDDR5 gör mycket dåligt ifrån sig. Exempelvis Nvidia GT640 DDR3 ansågs prestera mycket sämre än möjligt pga minnesvalet. Hur mycket bandbredd kan DDR3 teoretiskt ge?

Frågan är alltså hur mycket snabbare grafik kan introduceras innan minner kommer bli för stor flaskhals?

Anton Karmehed
Admin

[quote name=”mcnaldo”]Wow. Ni har alltså utvecklat en särskild testmetod för att testa processorer med inbyggd grafik och kommit fram till att ni på 16 egentliga testsidor ska använda totalt en (1) sida för APU-test och en sida för att testa gpgpu-prestanda, fast utan att faktiskt testa gpgpu-prestandan. Samtidigt använder ni 14 (15 om man räknar sidan där ni skulle ha tittat på gpgpu-prestanda) till att gå igenom processordelen. Jag hade sett fram emot den här recensionen, men är inte så imponerad av genomförandet. När ni ändå lägger ner så mycket tid på att testa hade det inte varit bättre med… Läs hela »

Mikael
Medlem
Mikael

[quote name=”Anton Karmehed”]Detta är ingen ny testsvit för CPU:er, den är fortfarande under utveckling och kommer förhoppningsvis i höst.Däremot är denna artikeln mer skruvad mot CPU-tester än vad vi hade tänkt oss. Det handlar dock mer om en presentationsfråga än något annat.Tanken var att köra testerna med HD6970 på en sida och istället bryta upp IGP-testerna på enskilda sidor. Men det blev en äldre mall vi använde oss av, därför att det SER ut att vara mer fokus på tester med externt grafikkort än med integrerat.Vi skulle också kunna bryta loss Dual Graphics testerna på flera sidor för att få… Läs hela »

Dravond
Medlem
Dravond

[quote name=”Laglord3n”][quote name=”-Tjalve-”][quote name=”Tempel”]Med tanke på antalet Sata, stöd för Raid 5 så är ju A85 en plattform för en nas deluxe, får man titta på vilka trinitys som drar riktigt lite kräm :D[/quote] Nu har ju jag en förkärlek för lagring, men jag håler med om att detta är ytterst intressant. 8st SATA 6Gbps är ju grymt. Om vi får se det på Uppföljaren till Brazos så är jag såld![/quote] Mmm, nja… du kanske får 8 st SATA 6Gbps portar direkt från chipsettet på mdermodemet, men frågan är om du får 8 st BRA SATA 6Gbps portar. Intels ICH-kontrollers… Läs hela »

Morkul
Medlem
Morkul

[quote name=”SebbesApa”]Med tanke på Trinitys låga strömförbrukning i idle och OK prestanda, så ser jag faktiskt att den skulle passa rätt bra för desktops i kommuner ex…[/quote]

Va? Desktop för te.x kommuner så passar ju I3 bättre då den har betydligt lägre strömförbrukning.

Man kan fråga sig va NH har gjort under sin idle mätning av processerna för de är extremt höga över lag. Min NAS som är en I3 2120, samma som i testet, drar 29W i idle.

Edit: 29W mätt ifrån vägguttag.

Morkul
Medlem
Morkul

Varför står inte nätagget specificerat under Testsystem?

Med tanke på vilka siffror som redovisas på samtliga CPUs så känns det som att det är helt osertifierat agg som inte är speciellt bra.

robjoh
Gäst
robjoh

[quote name=”Jacob Hugosson”]Sådär, nu har vi lagt till frekvensskalning med snabbare minnen! Kontentan är enkel, det är en dödssynd att inte använda snabba minnen med Trinity: https://www.nordichardware.se/test-lab-cpu-chipset/46657-amd-trinity-a10-5800k-grafikprestanda-fuer-alles.html?start=21#content%5B/quote%5D

Vill tacka så mycket för uppdateringen. Det var intressant läsning. Känns verkligen som att gpun är begränsad av bandbredden. Ska bli kul att se hur AMD löser den frågan till nästa generation APU.

-Tjalve-
Gäst
-Tjalve-

[quote name=”Dravond”][quote name=”Laglord3n”][quote name=”-Tjalve-”][quote name=”Tempel”]Med tanke på antalet Sata, stöd för Raid 5 så är ju A85 en plattform för en nas deluxe, får man titta på vilka trinitys som drar riktigt lite kräm :D[/quote] Nu har ju jag en förkärlek för lagring, men jag håler med om att detta är ytterst intressant. 8st SATA 6Gbps är ju grymt. Om vi får se det på Uppföljaren till Brazos så är jag såld![/quote] Mmm, nja… du kanske får 8 st SATA 6Gbps portar direkt från chipsettet på mdermodemet, men frågan är om du får 8 st BRA SATA 6Gbps portar. Intels… Läs hela »

Marcus Heinemo
Medlem

[quote name=”Morkul”]Varför står inte nätagget specificerat under Testsystem?

Med tanke på vilka siffror som redovisas på samtliga CPUs så känns det som att det är helt osertifierat agg som inte är speciellt bra.[/quote]

Bra tanke. Tror att det är AX1200 som använts, men Anton är den som kan svara på det. Ett 1200W agg som belastas med så lite som 100-150W (~10% av kapacitet) ger mycket riktigt en dålig verkningsgrad och onödigt hög effektförbrukning vid väggen.

Mikael
Medlem
Mikael

[quote name=”Jacob Hugosson”]Faktum är att andelen som faktiskt tittar igenom varje sida i recensionen är en minoritet. Nästan alla tar sig direkt till sammanfattningen, där har vi varit tydliga med vilka Trinity passar och hur den upplevs att använda. I mina ögon kan vi inte vara mycket tydligare än vad vi varit, genom i princip hela recensionen har vi haft konsumentmålgrupper åtanke. Ser vi till dom användare som tar sig tiden att läsa igenom varje sida (stort tack till er som faktiskt gör det!), så är dem med största sannolikhet tillräckligt insatta/kunniga att ta med priset i beräkningarna och veta… Läs hela »

Morkul
Medlem
Morkul

[quote name=”Calathea”][quote name=”Morkul”]Varför står inte nätagget specificerat under Testsystem? Med tanke på vilka siffror som redovisas på samtliga CPUs så känns det som att det är helt osertifierat agg som inte är speciellt bra.[/quote] Bra tanke. Tror att det är AX1200 som använts, men Anton är den som kan svara på det. Ett 1200W agg som belastas med så lite som 100-150W (~10% av kapacitet) ger mycket riktigt en dålig verkningsgrad och onödigt hög effektförbrukning vid väggen.[/quote] Att använda så pass kraftigt nätagg är inte bara dumt sätt ur verkningsgrads-synpunkt. Beroende på bland annat på hur pass varmt agget är… Läs hela »

Morkul
Medlem
Morkul

[quote name=”mcnaldo”]Jag kan inte se att ni går igenom hur Trinity upplevs att använda. Det enda ni säger är att den presterar bra mot i3-2100, men antagligen kommer få stryk av i3-3xxx. Det jag hade velat se var en beskrivning av hur det upplevs att använda den jämfört mot t.ex. i7-3770k eller i7-2700k vid dagligt användande utan diskret GPU. Upplevs den betydligt långsammare i officeprogram, photoshop, browsers, etc. eller hjälper den allt vanligare GPU-accelereringen av program till att få Trinity att upplevas snabbare? Vilka vardagsprogram funkar Trinity bra i och vilka funkar den dåligt i? Av de program ni använder… Läs hela »

Mikael
Medlem
Mikael

[quote name=”Jacob Hugosson”]Som sagt, du är välkommen att komma med förslag på vilket test vi ska använda som representerar det här. Verkligheten är att inga siffrar kan beskriva hur någonting [i]”känns att använda”[/i], det måste vara subjektivt. Utan en subjektiv bedömning är siffror bara siffror som betyder olika saker för alla. Vi skrev vilka målgrupper Trinity passar, exakt samma sak som det du efterfrågar enligt mig. [b]Kort svar[/b]: man märker ingen skillnad på olika processorer idag vid så kallat vardagsbruk. Jämförelsen med Core i7-3770K och A10-5800K, är alltså exakt densamma som Intel X mot AMD Y ett antal generationer tillbaka… Läs hela »

Fredrik
Medlem
Fredrik

Trevlig artikel. Layoutmässigt skulle man önska sig att artikel index motsvarade sidnumret. Kanske ta bort framsidan från artikel index och ha den som sidnummer 0? Varför testades Mafia II (ihop med ett 6970) på Low Details 0xAA 0xAF, medans de övriga titlarna testades i Ultra, max details och liknande? Känns mer som ett test av grafikkortet (6970) än CPUerna. Sen undrar jag om valet av upplösning 1366×768 för testerna av IGPn. Visst, hos Webhallen som annonserar här så erbjuds visserligen en monitor med den upplösningen för 849:-, men samtidigt finns det en 1920×1080 21.5″ monitor för 990:-. Såvida de extra… Läs hela »

Anton Karmehed
Admin

[quote name=”Morkul”]Att använda så pass kraftigt nätagg är inte bara dumt sätt ur verkningsgrads-synpunkt. Beroende på bland annat på hur pass varmt agget är på varierar verkningsgraden kraftigt vid så låg belastning. Det betyder att värme som eventuellt har blivit kvar efter att ni har testat med tung last kommer att påverka testerna med låg belastning. Till och med ventilationen i rummet kan i detta fall vara av betydelse då rummet under dagen kanske har blivit varmare vilket förändrar effektiviteten. Men även era tester under maximal belastning blir helt fel med ett så pass kraftigt nätagg! Till och mer ännu… Läs hela »

Laglord3n
Gäst
Laglord3n

[quote name=”-Tjalve-”]Om jag skulle göra ett sådant test så tar jag gärna emot förlag på vad ni vill se i en sådan artikel. Det ligger dock en stund fram i tiden då jag sitter upptagen med en stor SSD-roundup just nu.[/quote] Det tycker jag helt klart vore väldigt intressant. Vad man ska testa? I princip exakt samma testmetodologi som du använder för SSD-erna, fast istället för att variera olika SSDer så varierar man chipset/moderkort istället bara. Så man tar den snabbaste SSDn, eller kanske en som är väldigt vanligt (typ Intel, Samsung) och sen testar man den på två eller… Läs hela »