NVIDIA GeForce GTX 1060 anticipazioni tecniche e primi test

Dopo il debutto della Radeon RX 480, c’è molta attesa per la GeForce GTX 1060, ed nVidia cerca ovviamente di dare il massimo in qualsiasi fascia.   Partiamo col dire...
NVIDIA GeForce GTX 1060 anticipazioni tecniche e primi test 8

Dopo il debutto della Radeon RX 480, c’è molta attesa per la GeForce GTX 1060, ed nVidia cerca ovviamente di dare il massimo in qualsiasi fascia.

 

Partiamo col dire che la GTX 1060 beneficerà di tutte le innovazioni portate da Pascal, con l’architettura 16 nanometri plus di TSMC.

Sotto potete notare i 4 GPC (graphics processing cluster) relativi alla potente 1080.

NVIDIA Pascal - Analisi tecnica 5

Nessuna variazione, come potete vedere, legata allo SM. Ogni SM è formato da 4 Warp pool, 4 warp scheduler e 8 dispatch unit, più la relativa cache ed instruction cache.

Ogni warp scheduler, processa 32 cuda cores che possono accedere sino a ben 16,384 istruzioni contemporaneamente. Questo significa che ogni singolo cuda core ha 512 istruzioni a disposizione, in cui scambia i dati dalla cache l1 ed l2.

Non mancano le unità specifiche, come i load store e le sfu che producono i pixel a più cicli di clock.

Ogni warp, viene abbinato a 8 load store ed 8 SFU in un rapporto ottimale di 4:1:1. Non mancano infine le 8 TMU.

NVIDIA Pascal - Analisi tecnica 6

 

Cosa cambia con la 1060?

NVIDIA-GeForce-GTX-1060-Official_GP106-GPU-Block-Diagram-731x900

Come possiamo vedere la riduzione del core per contenere i costi, fa in modo che 2 GPC vengano levato del tutto e di conseguenza la GTX 1060 può lavorare con ben 1280 cuda cores.

Ogni GPC, racchiude come classico ben 5 SMM ed un raster engine, che si occupa principalmente di geometria e geometria da scartare, tramite z-cull.

Nvidia con questa disposizione doveva lavorare su un bus da 128bit, ma tale bus avrebbe limitato le ALU, e gli ingegneri Nvidia hanno ben valutato questo aspetto.

Ogni GPC, è collegato alla memoria tramite 8 rop’s per un totale di 48 rop’s e 512kb di cache l2, 1,5mb totale. Gli ingegneri Nvidia hanno però pensato bene di estendere altri due canali rop’s da 8 pixel ed altri 512kb di cache e collegare un bus molto più ampio da 192bit, che permette un’ampiezza di 192gb/s, senza frenare minimamente le ALU anche in situazioni di forte stress.

La ram ricordiamo essere Samsung, che con il nuovo processo produttivo assicura ben 8ghz, unite ad un’ottima overclockabilità.

La GTX 1070 ricordiamo è composta da 1920 cuda cores, 64 rop’s, 2mb di cache l2 e 8gb di ram a 256 gb/s

I risultati sono sbalorditivi, pur con poche unità di calcolo, la schede riesce non solo a battere la rivale AMD, ma pareggia la ben più massiccia GTX 980.

Caratteristiche tecniche

ridble-nvidia-geforce-gtx-1060-1

 

Primi risultati:

NVIDIA-GeForce-GTX-1060-Performance_DirectX-12-900x547

NVIDIA-GeForce-GTX-1060-Performance_DirectX-11-3-900x541

NVIDIA-GeForce-GTX-1060-Performance_DirectX-11-2-900x565

NVIDIA-GeForce-GTX-1060-Performance_DirectX-11-1-900x581

I risultati sono ben spiegabili.

La scheda boosta, con il base boost a ben 1700mhz e si spinge sino a quasi 1900mhz in boost 3,0, senza perdere un minimo di efficienza.

A tale clock la scheda, data per 4,4 tera flops nominali, raggiunge facilmente i 4,8 tera flops, raggiungendo perfettamente la stessa potenza della GTX 980, pareggiandola in ogni campo, sia TMU, rop’s e in banda grazie alla miglior compressione.

Sebbene non abbiamo ancora testato il modello, possiamo dirvi che tecnicamente, siamo sugli stelli livelli della della GTX 980.

 

Non mancano però le novità, infatti per la 1060 Nvidia ha utilizzato le migliori memorie disponibili sul mercato, le nuove Samsung K4G80325FB-HC25, capaci di operare a ben 8ghz e garantendo ben 192gb/s..

Come molti avranno notato, la banda è scesa per via dei 192bit, ma Nvidia ha pensato bene di implementare la compressione delta color, ora anche in 2:1.

IMG0050475

IMG0050476

Come da immagine la scheda da 192gb/s, riesce a fornire in compressione quasi 250gb/s su giochi come AC, dove una potente 980ti da 2816 cuda cores non satura i 200gb/s.

La scheda finita

NVIDIA-GeForce-GTX-1060-Founders-Edition_1-635x699-1

NVIDIA-GeForce-GTX-1060-Founders-Edition_7-635x311-1

GeForce_GTX_1060_Front_PCB_1467894362-Custom-635x431

Passiamo a parlare di una parte molto dolente, la circuiteria.

Molti spesso si chiedono, se una circuiteria di base sia sufficiente, la risposta è si, e non di poco. Ogni fase, induttore o mosfet, è calibrato per 30Ampere, nella foto vediamo 3 più 1 una fase ram, questo significa ben 90 ampere via GPU e 30 via RAM.

Questo significa che a valori di tensione base, la scheda fornisce ben 100 watt via GPU e sino a 30 via ram, per un totale di ben 130 watt. Gli ingegneri parlano di circa 120 di TDP, quindi i valori teorici sono già sopra le specifiche.

L’overclock, aumenta la tensione ma la circuiteria già a 40 A è in grado di saturare completamente il 6 pin (che può essere impostato ad altri valori) e di conseguenza, anche dandoci dentro, la circuiteria non sarà mai un limite.

Sulla carta possiamo notare i 6GB di ram, collegati su un bus da 192 bit, questo significa che ogni GB di ram è collegato a 32bit per un totale di 6.

 

E’tempo di VR

 

Nvidia Pascal ha integrato nel suo motore (polymorph engine) i Simultaneous multi-multi pojection Engine, ovvero un processo geometrico campionato con 16 proiezioni.

smp-556e30697f060d6a2cb0a1c22f86571b3.jp

 

Il modo corretto di renderizzare per la nostra configurazione sarebbe una proiezione diretta davanti a noi, una seconda proiezione sulla sinistra  e una terza proiezione a destra, orientata in modo simile.

Il problema principale è dato dal fatto che siamo limitati dal FOV.

Con la realtà virtuale, abbiamo due proiezioni (una per occhio), mentre i giochi renderizzano su due schermi distinti, incappando in problemi di visibilità continua.

 

single-pass-stero-202e08178c0bed120035f3

 

Vantaggi?

Invece di calcolare separatamente l’immagine per ciascun occhio, la geometria può essere elaborata solo una volta e poi proiettata direttamente in un singolo passaggio. Il SMPE carica automaticamente tutto questo e divide i triangoli. A seconda della complessità della geometria, vertex shader e tassellatura i guadagni possono essere consistenti.

 

La funzionalità è talmente efficace che permette di dividere ciascun occhio in tanti schermi virtuali, con differenti risoluzioni in virtù della percezione visiva.

Trasformazione finale.

IMG0050481

Primi risultati sui sintetici.

NVIDIA-GeForce-GTX-1060-6-GB-3DMark-Firestrike-Performance-635x448

 

Siamo in trepida attesa di vederla sul campo, per ora, almeno sul lato tecnico la scheda ha tutte le carte per essere una scheda molto veloce.

Le prestazioni sono allineate alla GTX 980, scheda della scorsa generazione ma di ben altra fascia.

Categorie
Speciali
Supportaci

 

ARTICOLI CORRELATI