Grafikkortstillverkaren Nvidia har skapat sig en stark position på grafikkortsmarknaden med sin hyllade Maxwell-arkitektur men allt är inte guld och gröna skogar. Efter långtgående diskussioner kring prestandaproblem vid hög minnesanvändning på GTX 970 tvingas Nvidia nu backa och revidera specifikationerna för sitt grafikkort.

När Nvidia lanserade Geforce GTX 970 gjorde man klart att grafikkortet precis som sin storebror byggde på en GM204 GPU men med med färre aktiva cuda-kluster. I övrigt skulle Geforce GTX 980 och GTX 970 vara funktionsmässigt identiska med 4 gigabyte GDDR5-grafikminne över en 256 bitars minnesbuss med 64 rasterenheter. Det var den information som förmedlades av Nvidia till media i tekniska dokument och en så kallad reviewers guide som delger skribenter djupare teknisk information om tillverkarens nya grafikkort. Fakta som nu helt enkelt visat sig vara felaktig.

Färre beräkningsenheter är inte problemet

Att stänga av ett eller flera beräkningskluster i grafikkretsarna för att sälja dem på mindre kraftfulla grafikkort är mer regel än undantag för både Nvidia och AMD. I fallet med Maxwell och GM204 har Nvidia valt att skeppa Geforce GTX 980 med 16 aktiva SMM-kluster för totalt 2 048 cuda-processorer. Geforce GTX 970 får nöja sig med 13 stycken SMM-kluster för motsvarande 1 664 cuda-kärnor, något som påverkar beräkningskraften men samtidigt inte ska påverkar minneshanteringen.

I tidigare rapporter har Nvidia samtidigt erkänt att det trots allt finns vissa minnesrelaterade prestandaskillnader mellan Geforce GTX 980 och Geforce GTX 970 – detta till trots att vi inte kunnat se några förklaringar till detta i kretsarnas specifikationer. Nu förklarar Nvidia så i ett nytt uttalande varför så är fallet – specifikationerna för Geforce GTX 970 har varit felaktiga från början.

Nvidia kan nu även stänga av logik för minneshanteringen

Det Nvidia nämligen missade att förmedla är att man med Maxwell inte bara har möjligheten att inaktivera kluster med beräkningsenheter utan även andra delar i sin grafikkrets. Mer specifikt den logik som ansvarar för minneshanteringen i kretsen. Detta gör det möjligt för Nvidia att komma förbi problem med tillverkningsbrister där man med tidigare arkitekturer var tvugna att kassera kretsar med skadad minneslogik kan man med Maxwell helt sonika stänga ner delar av den för att få en fullt fungerande. Fick Nvidia defekter på en av de fyra minnespartionerna som utgjorde Keplers 256-bit minnesgränssnitt var man tvungen att inaktivera hela partionen och således tappa både 16 rasterenheter samt 64-bit av sin minnesbuss. Med Maxwell kan Nvidia istället stänga av separata segment i en skadad minnespartion vilket ökar antalt kretsar som kan användas från företagets tillverkningsfabriker.  Ett fullt förklarligt och smidigt tillvägagångssätt – så länge man är tydliga med när man gör dessa ändringar.

  Geforce GTX 980 Geforce GTX 970 Geforce GTX 970 (Nya)
Arkitektur Maxwell Maxwell Maxwell
Grafikkrets GM204 GM204 GM204
Tillverkningsprocess 28 nm 28 nm 28 nm
Kretsstorlek 398 mm2 398 mm2 398 mm2
Transistorer 5,2 miljarder 5,2 miljarder 5,2 miljarder
Cudakärnor 2 048 st 1 664 st. 1 664 st.
L2 cache 2 MB 2 MB 1,75 MB
Grafikminne 4GB GDDR5 4 GB GDDR5 4 GB GDDR5
Minnesbuss 256 bit 256 bit 256 bit
Klockfrekvens 1 126 MHz bas
1 216 MHz boost
1 050 MHz bas
1 178 MHz boost
1 050 MHz bas
1 178 MHz boost
Minnesfrekvens 1 753 MHz
7 008 MHz effektivt
1 753 MHz
7 008 MHz effektivt
1 753 MHz
7 008 MHz effektivt
Texturenheter 128 st. 104 st. 104 st.
ROPs 64 st. 64 st. 56 st.
Bandbredd 224 GB/s 224,4 GB/s 224,4 GB/s
(3,5GB 196 GB/s – 0,5GB 28 GB/s)

I ett blockdiagram visar nu Nvidia hur man med Geforce GTX 970 stängt av en sektion i fjärde minnespartionen som är dedikerad att hantera de sista 0,5 gigabyte av grafikminne som kortet utrustats med. Genom Nvidias nya tvärbalksdesign betyder inte detta att vi tappar en av kretsens 32-bit minneskontroller men den måste samtidigt dela dataväg med minnespartionens andra minneskontroller och vi tappar samtidigt 8 av de 64 specificerade rasterenheterna.

GM204_arch

196 GB/s eller 28 GB/s i minnesbandbredd

Resultatet blir att Geforce GTX 970 mycket riktigt har hela 4 gigabyte grafikminne att nyttja. Men de sista 512 megabyten blir ganska rejält flaskhalsade med bara 1/8-del av den ursprungliga minnesbandbredden. Så vi de tillfällen ett spel eller en applikation måste hantera data i grafikkortets sista 512 megabyte grafikminne störtdyker bandbredden från till 28 gigabyte per sekund. Den snabbare och större delen av minnet har förfogande över resterande 7/8-minneskontrollers och når en maximal bandbredd på 196 gigabyte per sekund.

Nvidia ser till att grafikkortet alltid addresserar den snabbare 3,5 gigabyte delen av grafikminnet före man vänder sig till den långsammare delen, samtidigt som man i drivrutiner minimerat prestandaproblemen genom att flytta frekvent använd data till den snabbare sektionen av minnet. Nvidias flinka drivrutinsarbete har gjort att vi sällan ser några märkbara prestandaförluster på grund av grafikkortets udda minneshantering men som tidigare rapporter konstaterat finns det tillfällen även i vanliga spel där du kan märka prestandaskillnader på åtminstone några procent – troligtvis ännu mer i specifika fall.970membug

Positivt är att inte heller NordicHardware noterat några kraftiga prestandaproblem vid vanligt användande trots tester i tunga speltitlar som just Call of Duty: Advanced Warfare och Shadow of Mordor.

Ett rent misstag menar Nvidia

Detta hade i sig inte varit något problem om Nvidia varit öppna med begränsningen i GTX 970 från början. Nu har företaget missat eller mörkat en begränsning i grafikkortet som till och med omfattat utskick av felaktiga produktspecifikationer till media och partners.

På kort sikt har Nvidia nu uppdaterat specifikationerna för Geforce GTX 970 där vi nu ser hur grafikkortet har 8 färre rasterenheter samt mindre total L2-cache än vad specifikationsbladet från lanseringsdagen detaljerade. Två skillnader som också särskiljer kortet från storebror Geforce GTX 980 där alla beräkningskluster och minneslogik är intakt.

Nvidia menar att det med Geforce GTX 970 blivit ett olyckligt kommunikationsmisstag där ingenjörer, tekniker och marknadsavdelningen inte fått rätt på all fakta. Det är givetvis omöjligt att veta alldeles säkert vad som ligger bakom missen men att Nvidia med sin vågmästarroll på grafikkortsmarknaden skulle äventyra sitt rykte genom att medvetet mörka begränsningar i sitt nya grafikkort låter varken vettigt eller troligt. Den större frågan är nu hur Nvidia gör med alla de konsumenter som köpt ett Geforce GTX 970-grafikkort efter vad som trots allt varit en felaktig produktspecifikation.

Relaterade artiklar

Annons

3
Leave a Reply

Please Login to comment
3 Comment threads
0 Thread replies
0 Followers
 
Most reacted comment
Hottest comment thread
3 Comment authors
xemacsTellus82S0urcerr0R Recent comment authors
  Subscribe  
senaste äldsta flest röster
Notifiera vid
S0urcerr0R
Medlem
S0urcerr0R

Maxwell är fortfarande den mest moderna arkitekturen, men det här kan ju reta upp många, så ja, man får ju hoppas att Nvidia bjuder GTX970 köpare på nått slags godis. Alternativt kan dom tvingas ta in dessa från kunder som känner sej missnöjda, även om jag personligen inte skulle gråta floder över ett grafikkort med 3.5 GB i full hastighet. Det är ju oxå betryggande att NHW’s tester gick så bra som dom gjorde. Om Nvidia upptäckt detta i tid, borde dom skött det lite smartis och marknadsfört GTX970’n som ett 3.5GB grafikkort plus 512MB dedikerat minne för PhysX/OpenCL (eller… Läs hela »

Tellus82
Medlem
Tellus82

Riktigt grisigt av nVidia, kortet ses fortfarande ha 4GB av spel men drivrutinen ska enligt nVidia hindra i största möjliga mån användning över 3,5GB, bara i extremfall kommer ”hela” minnet användas. 3,5GB med 196GB/s och 0,5GB med 28GB/s Right ingen skillnad alls mot andra grafikkort med samma minnesmängd alltså… eller hur var det nu… Jävligt glad att jag inte skaffade ett 970. Sen ska vi inte tala om deras skadereglering nu där man försöker påvisa så minimal skillnad som möjligt, dom kunde visa upp minimum FPS och renderingstider så hade vi verkligen sett hur ”liten” skillnaden vore i förhållande till… Läs hela »

Fredrik
Medlem
Fredrik

Kommer vi framöver att få se förändringar i sättet grafikkortstester görs för grafikkort ur serier där kärnor är avstängda?