NVIDIA Pascal – Analisi tecnica

NVIDIA Pascal GTX 1080 & GTX 1070 - Presentazione con Battlefield 5? 1
NVIDIA Pascal GTX 1080 & GTX 1070 - Presentazione con Battlefield 5? 1

Oggi andiamo ad analizzare l’architettura NVIDIA Pascal, ed il funzionamento interno.

Nvidia GP100 e GP104 sono prodotte con il nuovo processo produttivo della TSMC. I nuovi 16 nanometri Finfet plus ereditano le ottime prestazioni raggiunte da Maxwell con i favolosi 28 nanometri HP.

Nvidia Pascal GP100

NVIDIA Pascal subentra alla gloriosa Maxwell, chip che a suo tempo migliorò notevolmente l’allora GPU nome in codice Kepler.
pascal gp 100

 

NVIDIA Pascal è la nuova ammiraglia dedicata sia alle prestazioni FP32 (game ed applicazioni professionali) ed alle FP64 (fluidodinamica scienza, meteorologia o qualsiasi applicazione a numeri decimali molto complessi).

Partiamo dal dire che come Maxwell GM200, troviamo sei GPC (Graphics Processing Clusters) , ognuno affiancato ad un rasterizzatore, capace di rasterizzare i triangoli e i 16 pixel.
Dentro il GPC possiamo notare ben 10 SM (stream multiprocessor), per un totale di 640 cuda cores. Ogni SM viene legato ad un’altro SM, tramite un TPC ( fattore che permette di installare il polymorph engine 4, ovvero il motore geometrico di 4° generazione)

Composizione SM

gp100_SM_diagram-624x452

 

La composizione dello stream multiprocessor, vede due blocchi da 48 cuda cores, 2 blocchi da 32 appartengono alla FP32 ed un blocco 1 FP64 da 32 cuda, appartiene ai calcoli precisi FP64.
Ogni blocco viene comandato da uno scheduler ed inviato a processare l’istruzione, affiancato dal Dispacht unit che invia i relativi Load store ed SFU, che gli permettono una semplice esecuzione lineare.
Nella versione compute Pascal GP100 versione Tesla /Titan, ogni cuda core, può avere accesso a ben 1024 registri indipendenti ed ha 256kb di cache registro.

Nvidia Pascal sarà la prima soluzione che integrerà Nvlink, che permetterà di trasferire i dati dalla scheda video, ad un’altra GPU ad una velocità di ben 80 gb/s (20gb/s per 4 linee, come vedete dal grafico).
550x186-equal_images_2016_04_06_Pascal-miracol

Non mancherà il pieno supporto alle nuove memorie HBM2 (adottate già in prima versione dalla Fury di AMD), con trasferimento di 180 gb/s per stack, per un totale di 720 gb/s su 4 stack da 16gb totali.
450x258-equal_images_2016_04_06_P100_SXM2

Infine il chip è capace di elaborare ben 96 rop’s totali e 240 TMU (che si occupano dei texel.

GP104, cosa cambia?

GP104, è la scheda gaming di NVIDIA che equipaggia la GTX 1080.
geforce-gtx-1080-block-diagram-final-56fcca8ee80e6be194c6d3636163f8af8

Come si può vedere dal grafico, il chip è stato decurtato a quattro cluster (GPC), capaci di renderizzare ben 2560 cuda core, 64 rop’s e 160 TMU.
All’interno del TPC possiamo notare i 20 polymorph engine, motori che si occupano del disegno geometrico, e di tessellazione, sia in elaborazione che in culling (eliminazione triangoli nascosti)

Dentro lo stream multiprocessor.
geforce-gtx-1080-sm-diagram-final-4a2cec758ce29cd7a86ab1590cabac99b

Lo SM, è del tutto simile a quello analizzato sul chip finale e completo (Tesla), solo che per lo scarso supporto al computing, lavora a registri dimezzati.
Come è facile notare, sono stati levati gli FP64 per la doppia precisione, inclusi però nel crossbar in 4 moduli, quindi il chip è totalmente rivolto al game..

La GTX 1080 è la prima scheda al mondo ad integrare le memorie Micron GDDR5X. Memorie che grazie al raddoppio del prefetch da 8n a 16n permettono di raddoppiare la banda passante. I primi moduli lavorano a 10gigabit (1250mhz effettivi), su un base volt di 1,35v. e forniscono ben 320 gb/s di banda passante.
GDDR-Speeds-Hi-Res

Mentre sei qui, considera di supportare PC-Gaming.it.Senza il vostro continuo sostegno, semplicemente non potremmo continuare! Puoi trovare ancora più modi per sostenerci in questa pagina dedicata. Grazie!

Potrebbero Interessarti

migliori schede madri z790

Migliori schede madri Intel Z790

Le schede madri Z790 sono state introdotte da Intel nel 2022. Sono progettate per supportare i processori Intel di 13a generazione “Raptor Lake”, tra cui

Lascia un commento