Testsystem och metod

De resultat som samlas in till Svenska CPU-guiden kommer från tester utförda i Nordichardwares testlabb på våra fyra dedikerade CPU-testsystem. Förutom hårdvaran som sitter i våra testsystem är de även utrustade med en mängd testprogram som används för att bedöma processorns prestanda samt en wattmätare från Wattsup som mäter den effektförbrukning som sker i systemet för att detta sedan ska kunna jämföras med resultat från andra processorer eller klockfrekvenser.testbed 3

Testsystem
Moderkort Intel LGA-1151 (Xeon): Asus E3 Pro Gaming V5
Intel LGA-1151 (Core): Asus Z170 Deluxe
Intel LGA-1150: Asus Z97-A
Intel LGA-1155 – Asus Maximus VI Gene
Intel LGA-2011-3: Asus X99 Deluxe
Intel LGA-2011: ASUS P9X79 PRO
AMD AM3+: Asrock 990FX Killer
AMD FM2: Gigabyte G1.Sniper A88X
Minne Intel LGA-1151: Corisair Vengeance LPX 2x8GB moduler @1,2V
Intel LGA-2011-3: Corsair Vengeance LPX 4x4GB moduler @1,2V
Intel LGA-1150: Corsair Vengeance 2x8GB moduler @1,65V
Intel LGA-2011: Team Vulcan 2x4B moduler @1,65V
AMD AM3+: Corsair Vengeance 2x8GB moduler @1,65V
AMD FM2: Corsair Vengeance 2x8GB moduler @1,65V
Lagring Corsair Force LX 256GB
Grafikkort Gigabyte Geforce GTX 970 G1 Gaming 4GB
Nätaggregat Corsair HX1000i
Kylare Noctua NH-C14
Chassi Cooler Master Lab
Operativsystem Windows 8.1

Målet är att alla testsystem ska ha så homogen hårdvara som möjligt, så alla komponenter som är plattformsoberoende är samma för alla system. Alla testsystem använder digitala HX1000i-nätaggregat från Corsair, som även har bidragit med minnesmoduler för både DDR4 och DDR3, samt SSD-enheter ur Force LX-serien på 256 gigabyte. Att samma lagring används är viktigt för att inte en eventuell överföringsflaskhals ska påverka resultaten.

Varje testsystem använder ett Geforce GTX 970 G1 Gaming från Gigabyte för de tester som inte involverar en eventuell integrerad grafikkrets. Vi använder ett modernt och kraftfullt grafikkort just för att grafikkretsen inte ska riskera att bli en flaskhals i de mer grafiktunga testerna.

Processorerna ur Xeon E3v5-familjen testas med ett E3 Pro Gaming V5-moderkort från Asus.

Minneskonfiguration

DDR4 mountedMinnesmodulerna har behövt variera mellan plattformarna i viss mån, men de kriterier vi har haft när vi valt och konfigurerat minnet för respektive testsystem är följande:

  • Alla system ska ha totalt 16 gigabyte arbetsminne.
  • Alla system ska ha en modul per minneskanal.
  • Varje processor ska köra den högsta minnesfrekvensen som det finns officiellt stöd för.

Tar vi AMD A10-7870K som exempel så har den två minneskanaler som klarar av DDR3-minne i upp till 2 133 megahertz. Med en modul per kanal innebär det dubbla moduler på 8 gigabyte styck som körs i den frekvensen. För Intel Core i7-4930K gäller istället fyra DDR4-kanaler, så här används fyra moduler på 4 gigabyte styck.

Prestandatester

En CPU skiljer sig från en GPU just i att den är så pass flexibel, och därför finns det också flera olika typer av belastningar och sysslor som är intressanta att testa. Vi har använt en utförlig testsvit med nästan 20 prestandatester för att få en så komplett bild som möjligt av hur en processor presterar i olika situationer. Här nedanför följer en komplett lista på alla prestandatester vi använder i Svenska CPU-guiden i nuläget.

CPU-centrerade tester

Namn Flertrådat Körs i klockfrekvens Beskrivning
7-Zip Ja Standard
2,9 GHz
Belastar genom att komrimera och dekomprimera en referensfil.
Cinebench R15 Två tester, enkel- och flertrådat Standard
2,9 GHz
Syntetiskt test för 3D-rendering
Mozilla Kraken Nej Standard
2,9 GHz
Webbläsarbaserat Javascript-test som körs i Google Chrome.
Java Sunspider Ja Standard Webbläsarbaserat och flertrådat Javascript-test som körs i Google Chrome.
Blender Ja Standard 3D-modelleringsprogram som renderar ett referensprojekt.
Handbrake Ja Standard Videokonvertering till H.265.
X264 Ja Standard Videokonvertering till H.264.
POV-ray Ja Standard 3D-renderingstest med raytracing.
Euler3D Ja Standard Syntetiskt test för 3D-rendering.

Testerna i tabellen här ovanför lägger huvudsakligen sin belastning på själva CPU-kärnorna i processorn snarare än grafikkretsen. Det gör dem särskilt användbara för att jämföra CPU-arkitekturer och för att jämföra modeller som har integrerad grafik med modeller som inte har det.

GPGPU-tester

Namn OpenCL Körs i klockfrekvens Beskrivning
Adobe Media Encoder CC 2015 Ja Standard Belastar hela systemet, både grafik och CPU, genom att rendera ett videoprojekt i 4K-upplösning.
AIDA64 Engineer Ja Standard Utför syntetiska GPGPU-beräkningar med OpenCL, mer specifikt flyttalsoperationer med enkel- respektive dubbelprecision (”Julia” respektive ”Mandel”).
PCMark 8 Ja Standard Syntetiskt test som belastar hela systemet med både grafik- och CPU-beräkningar samt GPGPU.

Testerna här ovanför fyller två syften: dels belastar de hela systemet för att ge en bild av hur hela processorn, med både grafikkrets och CPU-kärnor, presterar, och dels låter de oss ringa in hur bra en eventuell integrerad grafikkrets är på att utföra generella beräkningar som inte nödvändigtvis är just grafikorienterade. När vi använder samma grafikkrets till alla processorer (det vill säga när vi använder diskret grafik) blir GPGPU-delen av prestandan samma för alla, och på så sätt kan testerna även användas som helt CPU-orienterade tester i och med att det är just CPU-delen som kommer variera.

Speltester

Namn API Upplösning Körs i klockfrekvens Lanseringsår
Alien Isolation DirectX 11 1 920 x 1 080
1 280 x 720
Standard 2014
Battlefield 4 DirectX 11
(Mantle-stöd finns)
1 920 x 1 080
1 280 x 720
Standard
2,9 GHz
2013
Civilization: Beyond Earth DirectX 11 1 920 x 1 080
1 280 x 720
Standard 2014
Grand Theft Auto V DirectX 11 1 920 x 1 080
1 280 x 720
Standard
2,9 GHz
2015 (PC)
The Elder Scrolls V: Skyrim DirectX 9/10 1 920 x 1 080
1 280 x 720
Standard
2,9 GHz
2011

Speltesterna fyller egentligen samma funktion som GPGPU-testerna, men med en lite mer praktisk infallsvinkel. Vi använder de här testerna dels för att ge siffror som är enklare att relatera till som konsument (ungefär hur hög bildfrekvens du kan vänta dig med integrerad respektive diskret grafik) och dels som ett verktyg för att ge en jämn belastning över hela systemet som inte nödvändigtvis pressar CPU-kärnorna till max.

Integrerad och/eller diskret grafik

Gemensamt för alla processorer är testerna som körs med ett diskret grafikkort (Geforce GTX 970), vare sig själva testerna är grafikorienterade eller inte. På så sätt kan processorer utan integrerad grafik jämföras med modeller med integrerad grafik, samtidigt som vi får en bild av hur processorerna faktiskt hanterar grafikrenderingar, vilket bland annat beror på PCI Express-funktionaliteten hos varje CPU.

GTX 970 mount

De processorer som har en inbyggd grafikkrets testas dessutom utan diskret grafikkort, och i det fallet kör vi främst tester som på ett eller annat sätt påverkas av grafikprestandan. Det innefattar dels spel, men även program och tester som kan använda grafikprocessorn för generella beräkningar, det vill säga GPGPU. De tre mest nämnvärda GPGPU-testerna är AIDA64 (som testar olika typer av GPGPU-belastningar individuellt), PCMark 8 (som ger en bild av övergripande systemprestanda med GPGPU aktiverat) samt Adobe Media Encoder (som ger ett exempel på applicerad GPGPU för tung videokodning).

Enkel- eller flertrådat

Vissa av våra tester kan använda alla av en processors tillgängliga trådar medan andra bara kan dra nytta av en. Det är viktigt att ha med båda dessa testtyper för att få en hel bild av hur processorn presterar; en processor med väldigt många trådar kanske är kraftfull vid en typ av syssla, men kan inte de individuella trådarna hänga med på egen hand kommer prestandan bli bristande vid andra sysslor som inte är lika väloptimerade för parallellism.

Att kunna skilja på tester för en eller flera trådar är även viktigt för att kunna undersöka hur många instruktioner per klockcykel (IPC) en processor eller arkitektur klarar av. När det är IPC för hela processorn som ska undersökas är det viktigt att alla processorns resurser kommer till nytta, varpå ett flertrådat test som Handbrake (videokonvertering) eller Euler3D (syntetisk 3D-rendering) kommer väl till pass. När vi istället vill gå in på djupet och granska hur mycket av prestandan som hänger på själva arkitekturen, när mängden kärnor inte längre är en faktor, så är det ett enkeltrådat test som Cinebench ST eller eller Mozilla Kraken vi vill ha.

Prestanda vid samma klockfrekvens

Som vi nämnde i stycket ovanför så är det i många fall intressant att undersöka en processors IPC, men man får inte en ordentlig bild av det värdet när olika processorer körs i olika klockfrekvenser. Olika arkitekturer klarar av olika mängd instruktioner per klockcykel, så om vi ska kunna jämföra processorer med olika arkitekturer mot varandra och kunna jämföra hur mycket prestanda du faktiskt får ut vid en given klockfrekvens måste vi först se till att processorerna körs i matchande frekvens så att vi kan stryka klockfrekvensen helt som variabel.

I vårt fall kör vi en uppsättning processorer i 2,9 gigahertz, som är en frekvens vald för att kunna nås av merparten av moderna processorer. Vi har dock inte testat alla processorer i den klockfrekvensen, av flera anledningar. Dels ger det ingen ny information att testa två processorer ur samma serier som endast skiljer sig till klockfrekvensen på det här sättet – det är i praktiken samma processor, och resultatet kommer bli identiskt. Det är först när andra specifikationer skiljer sig, såsom arkitektur, tillverkningsteknik, cacheminne eller mängd kärnor eller trådar, som det blir intressant att jämföra processorerna vid matchande klockfrekvens. Ett annat kriterium är att processorn har upplåst multiplikator för att det ens ska gå att justera frekvensen tillräckligt mycket.

Effektförbrukning

Strömförbrukning är en komplicerad aspekt av att testa processorer, då det inte finns något sätt att direkt mäta förbrukningen från enbart processorn. Istället mäter vi förbrukningen från hela systemet och håller så många komponenter som möjligt identiska mellan systemen för att i möjligaste mån se till att den skillnad i förbrukning som finns mellan systemen beror just på processorn och ingenting annat. I och med att olika moderkort hanterar sina spänningar olika kommer det alltid finnas en viss felmarginal, men genom att använda matchande nätaggregat, grafikkort, lagring och andra komponenter håller vi den felmarginalen så liten som möjligt.

Wattsup

Vad vi vill uppnå med effektförbrukningstesterna är dock att analysera inte bara hur mycket ström systemet konsumerar utan hur det gör det. För ändamålet använder vi digitala effektförbrukningsmätare från Watts Up som en gång i sekunden mäter och sparar värdet på effektförbrukningen. Den datan kan sedan användas till flera intressanta analyser.

Dels kan vi räkna ut ett genomsnitt på effektförbrukningen för en given uppgift – på så sätt får du en bild av hur mycket energi som faktiskt kommer gå åt om du kör ett system med en given processor en viss tid. Det är ett användbart värde för att väga förbrukningen hos olika processorer mot varandra när du undrar hur stort avtrycket på elräkningen kommer bli.

Effektivitet

Samtidigt som den genomsnittliga förbrukningen är ett användbart värde så ger det inte hela bilden av hur energieffektiv en processor är. Ta videokonvertering som ett exempel: en processor kanske har en 10 procent högre genomsnittlig effektförbrukning än en konkurrerande processor, men det innebär inte nödvändigtvis att den är mindre energieffektiv, då den kanske blir klar med samma konvertering på 20 procent kortare tid. Hur effektiv en processor är beror på hur mycket beräkningar du får ut ur en given mängd energi.

Genom att logga förbrukningen under hela prestandatestet kan vi räkna ut hur stor mängd energi i Joule som har förbrukats totalt under testtiden. Dividerar vi sedan det med arbetet som har utförts, räknat i bildrutor (konverterade bildrutor vid videokonvertering eller renderade bildrutor för spel) får vi ut ett jämförbart värde för energieffektivitet, mätt i Joule per bildruta.

Vi testar både effektförbrukning och effektivitet med både diskret och integrerad grafik (förutsatt att integrerad grafik finns, annars testar vi endast med diskret) med två olika belastningstyper: grafikrendering i spel och videokonvertering. Grafikrenderingen i spel är viktig för att det ger en blandad belastning av processorn, inte minst när integrerad grafik används. Videokonvertering, vilket vi kör i Handbrake, ringar i sin tur in endast CPU-delen av processorn genom att belasta alla trådar med en känd belastning (mängden bildrutor i ett videoklipp är konstant) men utan att belasta grafikkretsen – på så sätt kan vi jämföra även med processorer utan integrerad grafik.

Stort tack till Corsair, Asus, Gigabyte, Noctua, Watts Up, Netgear och Startech som har bidragit med testhårdvara.

Annons

3
Leave a Reply

Please Login to comment
2 Comment threads
1 Thread replies
3 Followers
 
Most reacted comment
Hottest comment thread
3 Comment authors
S0urcerr0RCarl Holmbergspelgubbe Recent comment authors
  Subscribe  
senaste äldsta flest röster
Notifiera vid
Jakob K
Medlem
Jakob K

Men hallå, självklart blir ni inte begränsade av processorn med ett gtx 970 och 1080p i Battlefield 4. Kom igen nu. Man vill ju se processorns prestanda i spelen, och inte bara att den med stor sannolik inte spelar någon roll för den som vill hålla 60 fps.

S0urcerr0R
Medlem
S0urcerr0R

Tack för ett grymt jämförelse-test! Alltid intressant att få veta hur Xeon-plattformen står sig mot konsument-plattformarna. Slutsatsen jag drar efter denna läsning, är att det enda skälet för mig att eventuellt skaffa en Xeon-plattform skulle vara just för en workstation där felskrivningar/läsningar från minnet absolut inte får förekomma. Tex vid programmering eller tidskrävande 3D-renderingar, där man verkligen vill minimera risken för korrupta kompileringar/renderingar (eller liknande) till näst intill obefintlighet. Givetvis även för servrar eller andra datorer som måste stå på 24/7. Tack igen. 🙂 PS. Det har slinkit in lite fel i rubriksättningarna för testets olika sektioner, där ”GTX970” fått… Läs hela »