ARTIKEL  Under Intel Developer Forum har nu världens största processortillverkare släppt fulla detaljer kring sin nya mikroarkitektur Sandy Bridge. Den osedvanligt avlånga processorkärnan har nu avslöjat sina inre hemligheter som en ny grafikdel, en flexibel ring-databuss och integrerad videokodningskrets med imponerande kapacitet.

2011 kommer att handla nästan enbart om Sandy Bridge för Intel. Den nya processorarkitekturen ställer in siktet på mellanklassmarknaden och vi har redan läst det mest om den nya processorn, inte minst de första detaljerade prestandatesterna som även avslöjade vilken revolution Intel lyckats med när det gäller prestandan på sin integrerade grafikdel.

Under IDF 2010 har nu Intel öppnat på locket för även de tekniska detaljerna kring processorarkitekturen och även om man inte gjort all dokumentation tillgänglig har man avslöjat mycket mer kring kretsens uppbyggnad.

sb.arch

Som tidigare nämnt har Intel tryckt in merparten av de prestandakomponenter man hittar i en dator idag, direkt i processorkretsen. Sandy Bridge huserar inte bara upp till fyra processorkärnor, vi hittar även en integrerad grafikkrets, mediaprocessor, minneskontroller samt en så kallad ring-buss som låter alla komponenter i kretsen tala med varandra och hämta data från det delade L3-cacheminnet.

Intel har nu avslöjat vilka interna förändringar man gjort med Sandy Bridge-arkitekturen jämfört med Nehalem och utan tvekan är det en hel del som skiljer på det stora hela. Intel har piffat upp processorns pre-fetch delar och med bland annat fysiska register och stöd för 256-bits AVX instruktioner effektiviserat exekveringen av kod på det stora hela, något som ökar IPC-prestandan (Instruction per clock) med i runda slängar 10-30%.


En av nyckelkomponenterna i Sandy Bridge ser ut att bli den så kallade ringbussen. Något som kan liknas vid en motorväg för data med dedikerade avfarter för alla prestandakomponenter i kretsen. I centrum av ringbussen hittar vi en stor L3-cache som alltså delas av inte bara CPU-kärnorna utan även av grafikkretsen samt den nya mediaprocessorn.

cpu.gpu.old

Intel Clarkdale
cpu.gpu.new

Intel Sandy Bridge

L3-cachens storlek varierar mellan de olika processormodellerna, men det faktum att den numera arbetar i samma klockfrekvens som CPU borgar för riktigt fin prestanda när data kan hämtas direkt från bussen. Intel hävdar att deras nya grafikkrets tack vare detta kan ge 4-5 gånger högre prestanda än deras tidigare konstruktion där man på transistornivå separerat GPU från CPU och cacheminnet.

Intels System Agent, ett nytt ord för nordbrygga, har sin egen väg till ringbussen och här hittar vi allt från den tvåkanaliga DDR3-minneskontrollern samt 16 PCIe 2.0 kanaler, DMI samt integrerat stöd för Display Port.

sboverview

Intel har även avslöjat lite mer detaljer kring sin integrerade grafikkrets.


Intel har för första gången bakat in en GPU i samma kiselkrets som CPU. Hur man kopplat grafikkretsen till cacheminnet och övriga delar i processorn har vi redan sett, men extra intressant är det också att veta mer om vad kretsen betår av. Trots en betydligt effektivare 32nm teknik har Intel lbehållt antalt exekveringsenheter (EUs) till maximalt 12 stycken, men trots detta säger de första prestandatesterna att grafikprestandan mer eller mindre fördubblats jämfört med Clarkdale.

grafik
Intels egna uppskattningar för grafikprestanda från 2007 har överskridits dramatiskt.

Intels mobila Sandy Bridge-processorer blir alla utrustade med 12 stycken EUs, medan de stationära processorerna även kan bestyckas med 6 stycken. Om kostnad eller marknadsinriktning dikterar detta återstår att se.

Den stora skillnaden är utan tvekan att GPU numera hittas integrerad direkt i själva kiselkretsen och således har direktkontakt med cacheminne och minneskontrollern i processorn. Vilket tillsammans med optimeringar av EU-enheterna samt flera register ska enligt Intel ge just dubbelt så hög exekvering av instruktioner än de EU-enheter som används i dagens Intel HD grafikkrets.

Effektivare Turbo-teknik för både CPU och GPU

Intel fortsätter att propagera för sin Turbo-teknik som i realtid och helt automatiskt kan ändra klockfrekvenser och spänningar på kretsens olika komponenter. Med Sandy Bridge ökar man fokus på Turbo där både CPU och GPU får sin egen separata Turbo-funktion och en betydligt aggressivare sådan. Inte bara med flera högre turbo-lägen utan även genom att effektivare utnyttja hur transistorerna arbetar i en krets.

cpu.turbo
CPU Turbo, oberoende av grafikkretsen

Tanken med en Turbo-funktion är att låta processorn arbeta inom sitt givna TDP-värde (Thermal design power) och med sin nya arkitektur tar Intel tekniken till en ny nivå. Man förlitar sig på det faktum att en processor vid längre tids vila eller mindre belastning tar längre tid på sig att nå sitt maximala TDP-värde. Detta sker nämligen inte ögonblickligen utan kretsen har en uppvärmningsperiod på upp till 25 sekunder, under vilken perid processorns Turbo-funktion kan öka klockfrekvenserna en bra bit över det faktiska TDP-värdet, och genom att övervaka processorns effektutveckling låta klockfrekvensen falla tillbaka till standardfrekvensen kontinuerligt, allt eftersom effektutvecklingen ökar.

Även grafikkretsen i Sandy Bridge har en egen Turbo-funktion och den är helt separat från CPU-delens Turbo. Vilket betyder att man vid endast CPU-krävande applikationer istället kan sänka strömförbrukningen och klockfrekvenserna på en vilande GPU, och givetvis tvärtom.

gpu.turbo
GPU Turbo, oberoende av processorn

Intels Dadi Perlmutter poängterade tydligt att Intels mer dynamiska arkitektur är en av de stora nyheterna med Sandy Bridge, något som vi helt klart ser som en positiv utveckling.


Intel kommer med Sandy Bridge dra undan mattan för större delen av den budgetinriktade grafikkortsmarknaden. Den integrerade grafikkretsen är så pass kraftfull att både AMD och NVIDIA får svårt att sälja sina billigaste diskreta grafikkort.

Som om inte detta vore nog har Intel integrerat en mediaprocessor i sin nya arkitektur. Dess uppgift är att hantera allt videomaterial som processorn stöter på, vare sig det handlar om uppspelning eller omkodning.

media.engine

Intel har kort och gott dedikerat en del av Sandy Bridge-kretsen för videohantering. Istället för att som idag låta grafikkretsens EU-enheter sköta en del av uppspelningen ska den dedikerade mediaprocessorn sköta jobbet helt själv. Något som enligt tillverkaren själv ger mycket bättre prestanda och märkbart lägre strömförbrukning.

Under Intel Developer Forum 2010 visade Intel upp en demonstration av sin mediaprocessor där man tog ett videoklipp med 1080p upplösning och 30Mbps och omkodade detta till ett iPhone format om 640×360 pixlar. Jämförelsen gjordes mot en Core i7-processor och medan mediaprocessorn var klar hade Core i7-processorn hunnit till ungefär 10%.

videoomkodning
Intel visar upp fördelarna med video-omkodning i Sandy Bridge

Med denna prestanda skulle det ta ungefär 3,5 minut att koda om en 60 minuter lång 1080p-videofil till ett format som passar sin mobiltelefon eller andra enheter. Detta alltså i en vanlig processor som lär dyka upp i merparten av alla bärbara datorer under 2011. Vilket är i paritet vad NVIDIA och för den delen AMD presterar med sina dedikerade grafikkretsar.

Man visade även upp hur mediaprocessorn väldigt effektivt accelererade datorn vid fotoredigering med HDR-effekter. Vilket visar att det inte bara handlar om rörliga bilder.

Med rätt mjukvarustöd kan Intel förändra marknaden för video-omkodning och bildredigering där externa grafikkort istället för revolutionerande fördelar numera bara bidrar till marginellt bättre prestanda.


Vi har rapporterat om Sandy Bridge under hela året och långt innan Intel nu presenterade de tekniska detaljerna kring processorn har vi blivit bjudna på de första prestandatesterna och en komplett lista över de tjugotal Sandy Bridge-processorer som väntas lanseras på marknaden i början av januari 2011.

Den stora skillnaden är att vi nu har en bättre förståelse för hur Intel arbetat med sin nya processorarkitektur och även om vi inte kan dra allt för stora växlar på plattformens framgång förrän den väl lanseras är det inte särskilt svårt att se vilka delar som kommer att bli mest intressanta.

Sandy Bridge kommer som brukligt att ge Intel en prestandavinst på mellan 10-25% i ren CPU-prestanda mot deras förra generations mikroarkitektur, i detta fall Nehalem. De riktigt stora prestandaskillnaderna kommer vi istället att se inom grafik och multimediaapplikationer där Intels nya integrerade GPU och mediaprocessor ser ut att förändra förutsättningarna inte bara för konsumenter och våra datorer, utan även flera andra kretstillverkare på PC-marknaden.

Som tidigare avslöjats kommer Intel att lansera Sandy Bridge som sin andra generations Core-processorer och dagens produktserier, Core i3, Core i5 samt Core i7 kommer att leva kvar.

core

Om vi ska vända på steken och istället fokusera på vad vi fortfarande söker svar på så är det förutom slutgiltiga prestandaresultat även vad Sandy Bridge kommer att betyda för entusiaster och överklockare. Vi har tidigare rapporterat om hur Sandy Bridge kommer att integrera den så kallade BCLK-klockgeneratorn i sin 6-serie av styrkretsar. Något som ser ut att minimera möjligheten för överklockning med hjälp av olika busshastigheter då klockgeneratorn helt enkelt påverkar för många övriga komponenter. Intel kommer att motverka detta genom att göra det möjligt för konsumenter att ändra multipliern på sina processorer, helt fritt i fallet av entusiastmodellerna i K-serien, eller med vissa begränsningar i övriga modeller.

Intel har de senaste åren blivit betydligt mer öppen för överklockning, men med Sandy Bridge verkar man gå åt motsatt håll. Vi kan med största säkerhet säga att moderkort kommer få en mindre viktig roll vid överklockning av Sandy Bridge, men förhoppningsvis kan Intel få till en lösning som inte helt dödar motivationen för överklockare och entusiaster.

Vi kommer att ta en rejäl djupdykning i Intels nya Sandy Bridge-arkitektur när vi börjar närma oss den slutgiltiga lanseringen av Intels nya processorfamilj, men vi har sagt det tidigare och vi säger det igen, 2011 blir ett mycket intressant år för PC-marknaden.

Sandy Bridge-processorer för desktopmarknaden

Modell
Kärnor / Trådar
Klockf. / Turbo
L3-Cache
GPU-klock/ Turbo
TDP
Core i7-2600K
4 / 8
3,4 / 3,8 GHz
8 MB
850 / 1.350 MHz
95 W
Core i7-2600
4 / 8
3,4 / 3,8 GHz
8 MB
850 / 1.350 MHz
95 W
Core i7-2600S
4 / 8
2,8 / 3,8 GHz
8 MB
850 / 1.100 MHz
65 W
Core i5-2500K
4 / 4
3,3 / 3,7 GHz
6 MB
850 / 1.100 MHz
95 W
Core i5-2500
4 / 4
3,3 / 3,7 GHz
6 MB
850 / 1.100 MHz
95 W
Core i5-2500S
4 / 4
2,7 / 3,7 GHz
6 MB
850 / 1.100 MHz
65 W
Core i5-2500T
4 / 4
2,3 / 3,3 GHz
6 MB
650 / 1.250 MHz
45 W
Core i5-2400
4 / 4
3,1 / 3,4 GHz
6 MB
850 / 1.100 MHz
95 W
Core i5-2400S
4 / 4
2,5 / 3,3 GHz
6 MB
850 / 1.100 MHz
65 W
Core i5-2390T
2 / 4
2,7 / 3,5 GHz
3 MB
650 / 1.100 MHz
35 W
Core i3-2120
2 / 4
3,3 / – GHz
3 MB
850 / 1.100 MHz
65 W
Core i3-2100
2 / 4
3,1 / – GHz
3 MB
850 / 1.100 MHz
65 W
Core i3-2100T
2 / 4
2,5 / – GHz
3 MB
650 / 1.100 MHz
35 W

 

Sandy Bridge-processorer för den mobila marknaden

Modell
Kärnor /Trådar
Klockf. / Turbo
L3-Cache
TDP
Core i7-2920XM
4 / 8
2,5 / 3,5 GHz
8 MB
55 W
Core i7-2820QM
4 / 8
2,3 / 3,4 GHz
8 MB
45 W
Core i7-2720QM
4 / 8
2,2 / 3,3 GHz
6 MB
45 W
Core i7-2620M
2 / 4
2,7 / 3,4 GHz
4 MB
35 W
Core i5-2540M
2 / 4
2,6 / 3,3 GHz
3 MB
35 W
Core i5-2520M
2 / 4
2,5 / 3,2 GHz
3 MB
35 W

9
Leave a Reply

Please Login to comment
9 Comment threads
0 Thread replies
0 Followers
 
Most reacted comment
Hottest comment thread
5 Comment authors
Anton KarmehedLaglordenMcKinleyTempelSwedish Berserk Recent comment authors
  Subscribe  
senaste äldsta flest röster
Notifiera vid
Svensken
Medlem
Svensken

Trevligt med kvälls läsning! 🙂 Ja Sandy Bridge ser imponerande ut AMD kommer få nått att bita i. Speciellt avkodningen var imponerande tycker jag. Sen att man har lyckats höja klock för klock prestandan ytterligare gör inte saken sämre. Sen är ju frågan hur mycket dyrare K processorerna kommer att bli. Idags läget är de väl ca 500 kronor dyrare jämfört med en som har låst multipel.

Sen kan jag inte sluta att fundera över Lianos GPU prestanda. Om SB kan avkoda såhär bra torde ju Liano vara ännu snabbare även om den kommer att ha en svagare CPU.

McKinley
Medlem
McKinley

Så om detta bara är mainstream, hur kommer då sanna high-end prestandan att vara när Gulftown processorer verkligen blir mer tillgängliga för oss dödliga?
Undrar egentligen om Intel hade kunnat släppa Core i9 eller om man bara håller tillbaks p.g.a. bristen på riktig konkurrens?

Tempel
Medlem
Tempel

Intel har väl velat separera highend från mainstream så räkna med servplattformar och priser därefter om du vill ha den extrema prestandan.

McKinley
Medlem
McKinley

@Anton
Det blir nog bara Extreme varianten och servermarknaden som får åtta kärnor medan ”vanliga” high-end får nöja sig med sex kärnor.

Det är definitivt läge att uppgradera moderkortet och processorn då man förmodligen kommer att köra på LGA 2011 genom hela 2012 och en bit in på 2013 också.

Laglorden
Medlem
Laglorden

Ah, väldigt intressant och bra skrivet. Thanx. Ja, vi får se och jag har fått nåt nytt vänta på i min stora pc-refresh-total-ombyggnad-som-aldrig-kommer 😀

Januari 2011 alltså.