Testsystem och testmetod

Resultaten i den här artikeln är insamlade med våra fyra dedikerade CPU-testsystem. Förutom hårdvaran som sitter i våra testsystem är de även utrustade med en mängd testprogram som används för att bedöma processorns prestanda samt en wattmätare från Wattsup som mäter den energiförbrukning som sker i systemet för att detta sedan ska kunna jämföras med resultat från andra processorer eller klockfrekvenser.testbed 3

Testsystem 
ModerkortIntel LGA-1151: MSI Z370 Godlike (Tester) och Asus Z370-F (OC)
Intel LGA-1151: MSI Z270 Gaming Pro Carbon (Tester) och Asus Maximus IX Code (OC)
Intel LGA-1150: Asus Z97-A
Intel LGA-1155 – Asus Maximus VI Gene Intel LGA-2011-3: Asus X99 Deluxe
Intel LGA-2011: ASUS P9X79 PRO
Intel LGA-2011v3: Asus X99 Deluxe
Intel LGA-2066: Asus Prime X299 Deluxe
AMD AM4: MSI X370 Xpower Gaming Titanium (UEFI 1.26)
AMD AM3+: Asrock 990FX Killer
AMD FM2: Gigabyte G1.Sniper A88X
MinneIntel LGA-1151: Corisair Vengeance LPX 2x8GB DDR4-2666 @1,2V (i7, i5) och DDR4-2400 @ 1,2V (i3)
Intel LGA-1151: Corisair Vengeance LPX 2x8GB DDR4-2133 @1,2V
Intel LGA-2011-3: Corsair Vengeance LPX 4x4GB DDR4-2433 @1,2V
Intel LGA-1150: Corsair Vengeance 2x8GB DDR4-2400 @1,65V
Intel LGA-2011: Team Vulcan 4x4GB DDR4-2133 @1,65V
AMD AM4: Geil Evo-X DDR4-2x8GB 3200 @ 1.35V
AMD AM3+: Corsair Vengeance 2x8GB DDR3-1866 @1,65V
AMD FM2: Corsair Vengeance 2x8GB DDR3-2133 @1,65V
LagringCrucial M550 512GB
GrafikkortAsus Geforce GTX 1070 Strix Gaming
NätaggregatCorsair HX1000i
KylareAMD AM4: EKWB Predator 240
Övriga: Noctua NH-C14
ChassiCooler Master Lab
OperativsystemWindows 10 Pro

Målet är att alla testsystem ska ha så homogen hårdvara som möjligt, så alla komponenter som är plattformsoberoende är samma för alla system. Alla testsystem använder digitala HX1000i-nätaggregat från Corsair, som även har bidragit med minnesmoduler för både DDR4 och DDR3. Crucial står för lagringen, i form av M550 512 GB, en per testsystem. Att samma lagring används är viktigt för att inte en eventuell överföringsflaskhals ska påverka resultaten.

Varje testsystem använder ett Geforce GTX 1070 Strix från Asus för de tester som inte involverar en eventuell integrerad grafikkrets. Vi använder ett modernt och kraftfullt grafikkort just för att grafikkretsen inte ska riskera att bli en flaskhals i de mer grafiktunga testerna.

Minneskonfiguration

DDR4 mountedMinnesmodulerna har behövt variera mellan plattformarna i viss mån, men de kriterier vi har haft när vi valt och konfigurerat minnet för respektive testsystem är följande:

  • Alla system ska ha totalt 16 gigabyte arbetsminne.
  • Varje processor ska köra den högsta minnesfrekvensen som det finns officiellt stöd för.

Tar vi AMD A10-7870K som exempel så har den två minneskanaler som klarar av DDR3-minne i upp till 2 133 megahertz. Med en modul per kanal innebär det dubbla moduler på 8 gigabyte styck som körs i den frekvensen. För Intel Core i7-6950X gäller istället fyra DDR4-kanaler, så här används fyra moduler på 4 gigabyte styck som körs i 2 400 megahertz.

Notera att flera minnesmoduler och moderkort ger stöd för att köra högre minneshastigheter än så, men det sker i så fall via överklockning. Den minnesfrekvens vi utgår ifrån är den som specificeras för minneskontrollern i processorn.

Prestandatester

En CPU skiljer sig från en GPU just i att den är så pass flexibel, och därför finns det också flera olika typer av belastningar och sysslor som är intressanta att testa. Vi har använt en utförlig testsvit med nästan 20 prestandatester för att få en så komplett bild som möjligt av hur en processor presterar i olika situationer. Här nedanför följer en komplett lista på alla prestandatester vi använder i Svenska CPU-guiden i nuläget.

CPU-centrerade tester

TestFlertrådatKlockfrekvensBeskrivning
7-ZipJaStandard
2,9 GHz
Komprimering och dekomprimering
Adobe Media Encoder CCJaStandard
2,9 GHz
Omkodning av videofil i 4K-upplösning
Adobe Photoshop CCJaStandardBehandling av en stor bildfil (~20 MP) med applicering av filter.
AIDA64 EngineerJaStandardFlera syntetiska tester som behandlar bland annat minneshastighet, minneslatens, kryptering och flyttalsuträkningar.
BlenderJaStandard
2,9 GHz
3D-modellering: rendering av ett referensprojekt.
CinebenchTre tester: enkel- och flertrådatStandard
2,9 GHz
Syntetiskt 3D-renderingstest.
PCMark 8JaStandardSyntetisk testsvit med fokus på produktivitetstester.
X264 BenchmarkJaStandardVideokonvertering till H.264-format.

Testerna i tabellen här ovanför lägger huvudsakligen sin belastning på själva CPU-kärnorna i processorn snarare än grafikkretsen. Det gör dem särskilt användbara för att jämföra CPU-arkitekturer och för att jämföra modeller som har integrerad grafik med modeller som inte har det.

Speltester

TestAPIUpplösningKlockfrekvens
3DMark Fire StrikeDX11Standard
3DMark Time SpyDX12Standard
Civilization VIDX11/DX121 280 x 720
1 920 x 1 080
Standard
Grand Theft Auto VDX111 280 x 720
1 920 x 1 080
Standard
HitmanDX111 280 x 720
1 920 x 1 080
Standard

Speltesterna fyller egentligen samma funktion som GPGPU-testerna, men med en lite mer praktisk infallsvinkel. Vi använder de här testerna dels för att ge siffror som är enklare att relatera till som konsument (ungefär hur hög bildfrekvens du kan vänta dig med integrerad respektive diskret grafik) och dels som ett verktyg för att ge en jämn belastning över hela systemet som inte nödvändigtvis pressar CPU-kärnorna till max.

Genomsnitt, minimum och 99:e percentilen

En vanlig metod för att analysera spelprestanda är att läsa ut två värden för varje spel: genomsnittlig bildfrekvens och minimum. Genomsnittet ger en bild av ungefär var prestandan kommer ligga merparten av tiden, mätt i bildrutor per sekund (fps). Minimum berättar i sin tur det sämsta värdet som systemet genererar under testrundan.

Hur lågt minimumvärdet är – och hur långt ifrån genomsnittet det ligger – används i regel som ett mått för hur stabil prestandan är, men den modellen har en del problem. Det räcker nämligen med att en enda bildruta tar särskilt lång tid att rendera för att resultatet ska se helt annorlunda ut. Minimumvärdet kan skilja sig markant mellan olika testrundor med samma hårdvara.

En illustration: Varje bildruta är en grön punkt. Genomsnittet är den blå linjen, minimum är den röda linjen och 99:e percentilen den gula linjen. Den 99:e percentilen ligger närmare kurvans nedre del, medan den röda följer en enstaka avstickande datapunkt.

Därför använder vi numera istället värdet på den 99:e percentilen i våra speltester. Vad det innebär är att vi mäter och analyserar samtliga renderade bildrutor under hela testet, och sorterar dem efter renderingstid. Därefter räknar vi bort den hundradel av bildrutorna som tar längst tid att rendera, och därefter räknar vi ut ett nytt minimumvärde. När detta räknas om till fps får vi ett värde över vilket prestandan kommer ligga 99 procent av tiden.

Värdet på den 99:e percentilen säger mer om prestandans stabilitet än ett rent minimumvärde, och håller sig mer konstant mellan testrundor. Fördelen med att spara renderingstiden på samtliga bildrutor innebär även att vi kan utföra mer avancerade analyser i efterhand om vi önskar. Samtidigt ger inte 99:e percentilen hela bilden, men åtminstone en något mer sanningsnära bild om den generella prestandan.

Enkel- eller flertrådat

Vissa av våra tester kan använda alla av en processors tillgängliga trådar medan andra bara kan dra nytta av en. Det är viktigt att ha med båda dessa testtyper för att få en hel bild av hur processorn presterar; en processor med väldigt många trådar kanske är kraftfull vid en typ av syssla, men kan inte de individuella trådarna hänga med på egen hand kommer prestandan bli bristande vid andra sysslor som inte är lika väloptimerade för parallellism.

Att kunna skilja på tester för en eller flera trådar är även viktigt för att kunna undersöka hur många instruktioner per klockcykel (IPC) en processor eller arkitektur klarar av. När det är IPC för hela processorn som ska undersökas är det viktigt att alla processorns resurser kommer till nytta, varpå ett flertrådat test som Handbrake (videokonvertering) eller Euler3D (syntetisk 3D-rendering) kommer väl till pass. När vi istället vill gå in på djupet och granska hur mycket av prestandan som hänger på själva arkitekturen, när mängden kärnor inte längre är en faktor, så är det ett enkeltrådat test som Cinebench ST, Euler3D ST eller eller Mozilla Kraken vi vill ha.

 

Energiförbrukning

Strömförbrukning är en komplicerad aspekt av att testa processorer, då det inte finns något sätt att direkt mäta förbrukningen från enbart processorn. Istället mäter vi förbrukningen från hela systemet och håller så många komponenter som möjligt identiska mellan systemen för att i möjligaste mån se till att den skillnad i förbrukning som finns mellan systemen beror just på processorn och ingenting annat. I och med att olika moderkort hanterar sina spänningar olika kommer det alltid finnas en viss felmarginal, men genom att använda matchande nätaggregat, grafikkort, lagring och andra komponenter håller vi den felmarginalen så liten som möjligt.

WattsupVad vi vill uppnå med energiförbrukningstesterna är dock att analysera inte bara hur mycket ström systemet konsumerar utan hur det gör det. För ändamålet använder vi digitala energiförbrukningsmätare från Watts Up som en gång i sekunden mäter och sparar värdet på energiförbrukningen. Den datan kan sedan användas till flera intressanta analyser.

Dels kan vi räkna ut ett genomsnitt på energiförbrukningen för en given uppgift – på så sätt får du en bild av hur mycket energi som faktiskt kommer gå åt om du kör ett system med en given processor en viss tid. Det är ett användbart värde för att väga förbrukningen hos olika processorer mot varandra när du undrar hur stort avtrycket på elräkningen kommer bli.

Effektivitet

Samtidigt som den genomsnittliga förbrukningen är ett användbart värde så ger det inte hela bilden av hur energieffektiv en processor är. Ta videokonvertering som ett exempel: en processor kanske har en 10 procent högre genomsnittlig energiförbrukning än en konkurrerande processor, men det innebär inte nödvändigtvis att den är mindre energieffektiv, då den kanske blir klar med samma konvertering på 20 procent kortare tid. Hur effektiv en processor är beror på hur mycket beräkningar du får ut ur en given mängd energi.

Genom att logga förbrukningen under hela prestandatestet kan vi räkna ut hur stor mängd energi i Joule som har förbrukats totalt under testtiden. Dividerar vi sedan det med arbetet som har utförts, räknat i bildrutor (konverterade bildrutor vid videokonvertering eller renderade bildrutor för spel) får vi ut ett jämförbart värde för energieffektivitet, mätt i Joule per bildruta.

Vi testar både energiförbrukning och effektivitet med både diskret och integrerad grafik (förutsatt att integrerad grafik finns, annars testar vi endast med diskret) med två olika belastningstyper: grafikrendering i spel och videokonvertering. Grafikrenderingen i spel är viktig för att det ger en blandad belastning av processorn, inte minst när integrerad grafik används. Videokonvertering, vilket vi kör i Handbrake, ringar i sin tur in endast CPU-delen av processorn genom att belasta alla trådar med en känd belastning (mängden bildrutor i ett videoklipp är konstant) men utan att belasta grafikkretsen – på så sätt kan vi jämföra även med processorer utan integrerad grafik.

Stort tack till Corsair, Gigabyte, Asus, MSI, Crucial, Noctua, Watts Up, Netgear och Startech som har bidragit med testhårdvara.

13
Leave a Reply

avatar
7 Comment threads
6 Thread replies
1 Followers
 
Most reacted comment
Hottest comment thread
11 Comment authors
flipdivingAntti OMorkulMMX 166Matte2 Recent comment authors
  Subscribe  
senaste äldsta flest röster
Notifiera vid
Jörgen Rehn
Medlem
Jörgen Rehn

Fina processorer från Intel, tråkigt att de lyckas höja prestandan så markant då det helt plötsligt kom in lite konkurrens i bilden. Ganska tydligt tecken på att Intel valt medvetet att lägga sej på latsidan fram tills nu, denna lansering hade de kunnat gjort mycket tidigare. Vi konsumenter som köpt intels processorer för något år sedan innan Ryzen lanseringen har gjort en dålig affär med facit i handen. Nästa köp blir enkelt, det blir från det röda laget oavsett om Intel då har en liten marginal i prestandavinst eller ej, sättet de beter sej på ser illa ut i mina… Läs hela »

Morkul
Medlem
Morkul

Det kallas för kapitalism! En styrelse utses av ägarna för att tjäna maximalt med pengar, det är vad allting handlar om i dagsläget. Någon som säger att de hellre skulle tjäna mindre än vad de gör, oavsett anledning, ljuger. Det är så hela maskineriet fungerar och kommer vara så ett bra tag framöver.

Du har 100% rätt men är du verkligen överraskad? AMD hade gjord exakt samma sak om de hade varit i Intels position, annars hade VD och styrelse fått gått men omedelbar verkan.

Alling
Medlem
Alling

”Effektförbrukning” är inget ord och måste sluta användas i teknikjournalistiska texter.

jonte
Gäst
jonte

Varför finns det med i ordlistan då? Och varför hänger du upp dig på ett ord i en recension som handlar om processorer?

Morkul
Medlem
Morkul

Du får nog kontakta Svenska akademin och informera dem om att Effektförbrukning inte är ett ord, finns nämligen med i deras ordlista.

MMX 166
Gäst
MMX 166

Mja.
”Hen” är också med i ordlistan. Det gör inte ordet mer språkligt riktigt för det!

Prolessor? Profussor? Tragmatiker?

Det rätta är ju så klart STRÖMFÖRBRUKNING- något som en T eller NV gymnasist (eller bara någon med mer än jordnötter bakom pannbenet) borde veta.

HEN is out of the building

Morkul
Medlem
Morkul

Vad gäller språket, tja det finns många ord som används i olika syften och det är inte alltid det är lätt att veta när var och hur, Men ord som finns med i SAOL är trots allt ord som är korrekt att använda i det Svenska språket. När det kommer till ”STRÖMFÖRBRUKNING” så börjar jag undra vad nu får lära er i skolan nu för tiden.? Du tycks ju vara väl påläst så detta borde inte vara någonting konstig för dig: Effekt =P och P = W/t (watt genom tid) Ström å andra sidan är I i den ack så… Läs hela »

Schlutty
Medlem
Schlutty

Tycker ni glömde ange en negativ sak och det är att denna plattform är mycket kortlivad då Ice Lake kommer redan nästa år, så som konsument kan du ej uppgradera överhuvudtaget. Som plattform är den redan en återvändsgränd.

Matte2
Gäst
Matte2

Det är absolut vettigt att nämna, men för dom flesta kvittar detta. Själv byter jag från 2600K som kom 2011 om jag minns rätt. Denna cpu kommer att hålla såpass länge att det inte kommer vara värt att byta till nästa generation ändå.

För entusiaster vet jag inte heller om det spelar så stor roll, dom vill väl ändå byta allting vid varje nytt släpp 😀

Medlem
Arne Berg

Så länge det inte kommer ddr5 eller pci-e4 så spelar det ingen roll att det ej går att uppgradera man klarar sig ypperligt på en 6700k eller liknande än idag.
Men uppgradering kan man glömma ,men det kan man mer eller mindre med alla system (även amd dom har sagt att även dom skall byta socket när ddr5 eller pci-e 4 kommer så där kan du uppgradera till våren men så e det slut även där )

Medlem

Jag blir bra sugen på att uppgradera från min 4770k. Men tillgängligheten är helt katastrofal. Jag åkte direkt iväg för att köpa/boka ett ex får då till svar att jag var på 307e position i kön. Bokningarna öppnade 2.5h innan jag kom dit xD

Antti O
Gäst
Antti O

Sidan 4 TESTSYSTEM
—————————————
Intel LGA-1151: MSI Z370 Godlike (Tester) och Asus Z370-F (OC)
Intel LGA-1151: MSI Z270 Gaming Pro Carbon (Tester) och Asus Maximus IX Code (OC)
Intel LGA-1150: Asus Z97-A
—————————————-
Jag förstår inte detta riktigt. Får ni inte överklocka med MSI? Skulle vara intressant vilka OC-resultat ni skulle ha fått med MSI Godlike. Varför bytte ni moderkortet vid OC-testet?

Och idag skriver ni:
”Nu är Coffee Lake och den nya 300-seriens moderkort här och MSI Z370 Godlike Gaming har hittat sin väg till testlabbet där det poserar framför vår kamera.”

flipdiving
Medlem
flipdiving

I regularly visit your site and find a lot of interesting information.
Not only good posts but also great comments.
Thank you and look forward to your page growing stronger.
nodejs quiz