NVIDIA Pascal – Analisi tecnica

Oggi andiamo ad analizzare l’architettura NVIDIA Pascal, ed il funzionamento interno. Nvidia GP100 e GP104 sono prodotte con il nuovo processo produttivo della TSMC. I nuovi 16 nanometri Finfet...
NVIDIA Pascal GTX 1080 & GTX 1070 - Presentazione con Battlefield 5? 1




Oggi andiamo ad analizzare l’architettura NVIDIA Pascal, ed il funzionamento interno.

Nvidia GP100 e GP104 sono prodotte con il nuovo processo produttivo della TSMC. I nuovi 16 nanometri Finfet plus ereditano le ottime prestazioni raggiunte da Maxwell con i favolosi 28 nanometri HP.

Nvidia Pascal GP100

NVIDIA Pascal subentra alla gloriosa Maxwell, chip che a suo tempo migliorò notevolmente l’allora GPU nome in codice Kepler.
pascal gp 100

 

NVIDIA Pascal è la nuova ammiraglia dedicata sia alle prestazioni FP32 (game ed applicazioni professionali) ed alle FP64 (fluidodinamica scienza, meteorologia o qualsiasi applicazione a numeri decimali molto complessi).

Partiamo dal dire che come Maxwell GM200, troviamo sei GPC (Graphics Processing Clusters) , ognuno affiancato ad un rasterizzatore, capace di rasterizzare i triangoli e i 16 pixel.
Dentro il GPC possiamo notare ben 10 SM (stream multiprocessor), per un totale di 640 cuda cores. Ogni SM viene legato ad un’altro SM, tramite un TPC ( fattore che permette di installare il polymorph engine 4, ovvero il motore geometrico di 4° generazione)

Composizione SM

gp100_SM_diagram-624x452

 

La composizione dello stream multiprocessor, vede due blocchi da 48 cuda cores, 2 blocchi da 32 appartengono alla FP32 ed un blocco 1 FP64 da 32 cuda, appartiene ai calcoli precisi FP64.
Ogni blocco viene comandato da uno scheduler ed inviato a processare l’istruzione, affiancato dal Dispacht unit che invia i relativi Load store ed SFU, che gli permettono una semplice esecuzione lineare.
Nella versione compute Pascal GP100 versione Tesla /Titan, ogni cuda core, può avere accesso a ben 1024 registri indipendenti ed ha 256kb di cache registro.

Nvidia Pascal sarà la prima soluzione che integrerà Nvlink, che permetterà di trasferire i dati dalla scheda video, ad un’altra GPU ad una velocità di ben 80 gb/s (20gb/s per 4 linee, come vedete dal grafico).
550x186-equal_images_2016_04_06_Pascal-miracol

Non mancherà il pieno supporto alle nuove memorie HBM2 (adottate già in prima versione dalla Fury di AMD), con trasferimento di 180 gb/s per stack, per un totale di 720 gb/s su 4 stack da 16gb totali.
450x258-equal_images_2016_04_06_P100_SXM2

Infine il chip è capace di elaborare ben 96 rop’s totali e 240 TMU (che si occupano dei texel.

GP104, cosa cambia?

GP104, è la scheda gaming di NVIDIA che equipaggia la GTX 1080.
geforce-gtx-1080-block-diagram-final-56fcca8ee80e6be194c6d3636163f8af8

Come si può vedere dal grafico, il chip è stato decurtato a quattro cluster (GPC), capaci di renderizzare ben 2560 cuda core, 64 rop’s e 160 TMU.
All’interno del TPC possiamo notare i 20 polymorph engine, motori che si occupano del disegno geometrico, e di tessellazione, sia in elaborazione che in culling (eliminazione triangoli nascosti)

Dentro lo stream multiprocessor.
geforce-gtx-1080-sm-diagram-final-4a2cec758ce29cd7a86ab1590cabac99b

Lo SM, è del tutto simile a quello analizzato sul chip finale e completo (Tesla), solo che per lo scarso supporto al computing, lavora a registri dimezzati.
Come è facile notare, sono stati levati gli FP64 per la doppia precisione, inclusi però nel crossbar in 4 moduli, quindi il chip è totalmente rivolto al game..

La GTX 1080 è la prima scheda al mondo ad integrare le memorie Micron GDDR5X. Memorie che grazie al raddoppio del prefetch da 8n a 16n permettono di raddoppiare la banda passante. I primi moduli lavorano a 10gigabit (1250mhz effettivi), su un base volt di 1,35v. e forniscono ben 320 gb/s di banda passante.
GDDR-Speeds-Hi-Res

Categorie
HardwareNewsSpeciali

ARTICOLI CORRELATI