Nvidias presenterar Pascal P100 som världens mest avancerade GPU och levererar i form av grafikkortet Tesla P100 hissnande beräkningskraft med hjälp av 16 nanometer finfet-teknik och HBM2-minne.

Nvidia har under tisdagskvällen presenterat sitt nya flaggskepp från GPU-arkitekturen Pascal och med namnet Pascal GP100 är det inget annat än ett riktigt monster till grafikkrets. Byggd på 16 nanometer finfet-teknik huserar GP100 över 15 miljarder transistorer, närmast en fördubbling mot sin föregångare GM200, samt den nya minnestekniken HBM2. Enligt Nvidia bygger Pascal GP100 kring fyra grundstommar.

  • NVLink™— NVIDIAs nya höghastighetsdatagränssnitt för ökad intern bandbredd och skalbarhet.
  • HBM2— Ny generations minnesteknik för högre minnesbandbredd och stora minnesmängder på liten yta.
  • Unified Memory och Compute Preemption—avsevärt förbättrad programmeringsmodell
  • 16nm FinFET tillverkningsteknik för fler funktioner, högre prestanda och bättre energieffektiviet.

De 15 miljarder transistorerna ger en grafikkrets som trots sin effektiva tillverkningsteknik mäter hela 610 mm², att jämföra med redan mäktiga GM200 i Geforce GTX Titan X och dess 601 mm².

Tesla P100 troligtvis inte värst i Pascal-familjen

Transistorerna används för att bygga en grafikkrets med upp till 60 stycken SM (Streaming Multiprocessors) kluster där det är värt att notera de 56 stycken aktiverade beräkningsklustren i Pascal GP100 – det kan med andra ord komma ännu kraftfullare modeller av Pascal.gp100_SM_diagram

Tesla P100 får med denna konfiguration totalt 3 584 stycken cuda kärnor för hantering av FP32-beräkningar, drygt 500 fler än i GM200. Den största skillnaden i beräkningskapacitet kommer samtidigt vid hantering av FP64-beräkningar där Pascal GP100 har 1 792 cudakärnor mot måttliga 96 cudakärnor i GM200. Detta ger Pascal GP100 en jordskredsseger i tunga FP64-beräkningar där Nvidia ökar beräkningskapaciteten från nesliga 213 Gflops i GM200 till 5 304 Gflops i GP100 – välkomna nyheter för server och arbetsstationmarknaden. Något som samtidigt inte kommer att göra några större skillnader för traditionella konsumenter och spelare.

Nvidia Tesla P100-specifikationer

Specifikationer av Nvidias hittills enda bekräftade Pascal-grafikkort - i jämförelse med sina föregångare.
Tesla ProductsTesla K40Tesla M40Tesla P100
GPUGK110 (Kepler)GM200 (Maxwell)GP100 (Pascal)
SMs152456
TPCs152428
FP32 CUDA-kärnor / SM19212864
FP32 CUDA-kärnor / GPU288030723584
FP64 CUDA-kärnor / SM64432
FP64 CUDA-kärnor / GPU960961792
Basfrekvens745 MHz948 MHz1328 MHz
Boostfrekvens810/875 MHz 1114 MHz1480 MHz
FP32 GFLOPs (Enkel precision)4290680010600
FP64 GFLOPs (Dubbel precision)16802135304[1]
Texturenheter240192224
Minnesgränssnitt384-bit GDDR5384-bit GDDR54096-bit HBM2
MinnesstorlekUp to 12 GBUp to 24 GB16 GB
L2-cache1536 KB3072 KB4096 KB
Register filstorlek / SM256 KB256 KB256 KB
Register filstorlek / GPU3840 KB6144 KB14336 KB
TDP235 Watts250 Watts300 Watts
Transistorer7.1 miljarder8 miljarder15.3 miljarder
GPU kretsstorlek551 mm²601 mm²610 mm²
Tillverkningstenik28-nm28-nm16-nm

Boosfrekvens på hela 1 480 megahertz

Medan Nvidias Pascal GP100 GPU utan tvivel är en GPU skräddarsydd för servrar och avancerade arbetsstationer finns det flera spännande nyheter även för andra användare. Förutom fler cudakärnor ökar Nvidia antalet texturenheter från GM200 samtidigt som klockfrekvenserna är imponerande. Nvidia specificerar en basfrekvens på 1 328 megahertz och en boostfrekvens på hela 1 480 megahertz – smått galna standardfrekvenser möjligjorda av den nya effektivare tillverkningstekniken.

Som om inte de utökade beräkningsenheterna och texturenheterna vore nog har Nvidia kopplat sin GPU till en 4 096-bit minnesbuss och upp till 16 gigabyte HBM2-minne. En konfiguration som kommer att ge en minnesbandbredd på 720 gigabyte per sekund, en tredubbling från Tesla M40.

Nvidia NVLink tar över efter PCI Express 3.0

En nyckelkomponent är samtidigt Nvidias nya datagränssnitt NVLink som används både för att låta en Pascal GPU kommunicera snabbare med systemets CPU men även för att koppla samman flera grafikkretsar i ett och samma system. Nvidia menar att NVLink är 5 till 12 gånger snabbare än PCI Express 3.0 och kommer vara en mycket viktig ingridiens för större datorsystem med flera grafikkretsar sammankopplade. Tillsammans med Nvidias vidareutvecklade unified memory arkitektur låter NVLink systembyggare koppla samman CPU och GPU-kretsar på betydligt effektivare sätt.

Nvidia säger att masstillverkning av Tesla P100 redan är startad och att testexemplar börjat skeppas till partners. De första produkterna med Tesla P100 väntas samtidigt inte presenteras förrän under fjärde kvartalet för att levereras på marknaden under första kvartalet 2017.

Det är fortfarande oklart vilka modeller av Nvidias Pascal GPU som kommer att lanseras för konsumentmarknaden och när detta sker.

Lägsta pris på Prisjakt.nu

2
Leave a Reply

Please Login to comment
2 Comment threads
0 Thread replies
1 Followers
 
Most reacted comment
Hottest comment thread
2 Comment authors
MorkulJanne Nilsson Recent comment authors
  Subscribe  
senaste äldsta flest röster
Notifiera vid
Janne Nilsson
Gäst
Janne Nilsson

fap fap fap fap fap fap fap fap fap Flämt stön! Pust!

Morkul
Medlem
Morkul

Synd att vi inte kommer få officiellt NVLink stöd på X86 plattformen under någon överskådlig framtid. Vet flera kunder som kunde haft nytta av det.