Dopo aver costruito il chip Tesla GP100 (l’unico chip dotato di doppia precisione a 64 bit nativa), nVidia ha adattato i suoi chip a tutte le fasce, dalla estrema (Pascal Titan X), alta ( GTX 1070-1080), alla mid-performance (1060 in versione da 6gb e 3gb, dove quest’ultima perde anche un SMM).
E’ il turno della fascia bassa e medio bassa, chip piccolo adatto a far breccia sugli utenti che vogliono godersi i giochi in 1080p, ma allo stesso tempo, non temono qualche compromesso a livello visivo (come i filtri antialiasing complessi o effetti post processing molto esosi in potenza computazionale).
Dopo aver visto, recensito e commentato il chip superiore GP106, alias GTX 1060, è il momento del GP107. Nvidia stranamente non ha lanciato il solo GPC (graphics processing cluster), ma ha pensato di creare un doppio GPC, come visto con GP106, ma dotato di meno SMM, per un totale di 768-640 cuda cores, rispettivamente nei modelli 1050Ti e 1050.
Andiamo ad analizzarle da vicino.
GeForce GTX 1050 Ti | GeForce GTX 950 | GeForce GTX 750 Ti | |
---|---|---|---|
GPU | GP107 | GM206 | GM107 |
Streaming Multiprocessor | 6 | 6 | 5 |
CUDA Core | 768 | 768 | 640 |
Freq. GPU (Base/Boost) | 1290/1392 MHz | 1024/1188 MHz | 1020/1085 MHz |
Potenza di calcolo (Base Clock) | 1981 MFLOPS | 1573 MFLOPS | 1305 MFLOPS |
Texture Unit | 48 | 48 | 40 |
Texture Fill Rate | 61.9 GT/s | 49.2 GT/s | 40.8 GT/s |
ROPs | 32 | 32 | 16 |
Cache L2 | 1 MB | 1 MB | 2 MB |
Data rate memoria | 7 Gb/s | 6.6 Gb/s | 5.4 Gb/s |
Bandwidth memoria | 112 GB/s | 106 GB/s | 86.4 GB/s |
Bus memoria | 128-bit | 128-bit | 128-bit |
TDP | 75 W | 90 W | 60 W |
Transistor | 3.3 billion | 2.94 billion | 1.87 billion |
Dimensione die | 135 mm² | 227 mm² | 148 mm² |
[nextpage title=”GTX 1050TI”]
Partiamo subito con illustrarvi la 1050TI, che come vedete sotto è ricalca praticamente la GTX 1060, ma con meno SMM.
Analizzando il chip al completo, possiamo notare i due GPC ed i sei streaming multiprocessor (SMM), capaci di mandare in calcolo ben 768 cuda cores (384 cuda in meno della 1060 da 3gb). Ogni cuda core, tramite il secondo dispacht unit è in grado di accedere a 512 istruzioni contemporanee, senza gravare la cache, favorendo le latenze e contenendo i consumi, visto che il set d’istruzioni permette di sgravare la banda di memoria di 128bit.
In ogni SMM, troviamo collegato un polymorph engine, che tramite i cinque stadi di pipeline (ovvero una catena di montaggio), si occupano della tassellazione e l’ultimo stadio comprende i dati da inviare agli altri tre stadi dei due raster engine, dove si concludono le operazioni per via della Z-cull, uno stadio capace di eliminare del tutto la geometria che non serve più nella scena.
Il collegamento è effettuato tramite quattro canali di memoria da 32 bit, per un totale di 128bit. Ogni canale è collegato tramite 8 rop’s e 256kb di cache l2, in totale quindi 32 rop’s, 1mb cache l2 e ben 4gb di memoria.
Le frequenze di base suggerite sono di 1290mhz in base clock e di 1392mhz in base boost. Ci aspettiamo valori in boost 3 di circa 1600-1650 mhz, valore che amplierà con le versioni customizzate dai vari brand, con TDP maggiorati. Tale parametro è di soli 75 watt, molto simile a quello visto con GM 107, alias GTX 750TI.
Il prezzo suggerito, al cambio è di circa 160 euro.
[nextpage title=”GTX 1050″]
Passiamo ora alla GTX 1050, una scheda leggermente decurtata che si gioca la fascia con la rivale AMD rx 460 ( il più piccolo della fascia Polaris ma molto ben riuscito).
Cosa cambia?
Analizzando il crossbar, possiamo notare che cambia davvero poco, per contenere i prezzi, nVidia ha laserato uno streming multiprocessor (SMM) e di conseguenza i cuda cores totali, passano da 768 a 640 in elaborazione. Purtroppo anche le rop’s ne risentono, infatti rispetto al GP107 full, quando applichiamo filtri MSAA pesanti, 4 rop’s vengono memorizzate ed elaborate al prossimo ciclo.
Il resto è completamente invariato, però notiamo subito i clock più elevati, rispettivamente di 1354 in base clock e 1455 in base boost.
Non cambia neppure sulla memoria, stesso identico collegamento, ma i 4 canali ram sono stati affiancati da 512mb ciascuno, per un totale di 2gb, contro i 4gb della 1050TI base. Naturalmente questo dipenderà principalmente dai partner che possono collegare la scheda a piacimento e dotarle rispettivamente di 2 o 4 gb.
La velocità di memoria è di 7gb/s per entrambe, che garantisce 112 gb/s al secondo, verso il bus a 128bit. Una cifra di ben 25gb/s più elevata rispetto alla 750 ti, ma questo è solo un dato nominale, perchè come tutti i chip Pascal, nVidia ha inserito una compressione ancora più efficiente di Maxwell ( la decompressione ricordiamo è presente solo con la versione 2 di Maxwell, introdotta con GM104, ovvero GTX 970 e 980), capace di mischiare i colori vicini e migliorando la difficile 2:1.
Esempio di compressione.
Guadagni della compressione.
Come illustrato, su alcuni test fatti da nVidia, su giochi come Assassin’s creed syndicate registriamo sino al 28% di miglioramento, un fattore non certo trascurabile, se tali valori praticamente li raddoppiamo nei confronti della prima versione ed erede GM 107.
Non mancano infine la decodifica HEVC fino a 4K60p e la decodifica VP9.
Nel ringraziarvi per la lettura, vi ricordiamo che a breve le schede saranno completamente recensite, con innumerevoli test.
Le GTX 1050 Ti riveleranno delle ottime schede video da utilizzare in una configurazione Pc gaming economica. Come Fps medi dovremmo stare intorno ai 40 per la maggior parte dei giochi se non sbaglio. Confermate?