Indice

Analisi Tecnica

Con la RX 480 AMD immette sul mercato la prima soluzione basata sui 14 nanometri Samsung / GLOBALFOUNDRIES

IMG0051117

IMG0051110

La scheda mantiene tutte le caratteristiche elaborative di Tonga ma le CU sono state portate a (2304 shader) e le TMU passano a 144. Rimane inalterato il rapporto tra ROP e banda, con 32 ROP su un bus di 256bit ma ben più veloce. Le memorie che equipaggia la RX480 sono le potenti ed a bassi timing, samsung K4G80325FB-HC25 8gbps, capaci di 256gb/s di banda passante.

memory_small

Ogni rasterizzer è composto da 9 CU, separato da un ponte per gli export sulle ROP, ogni raster accede a 8 ROP. Sulla cache sono stati utilizzati molti transistor, il tutto per cercare di rendere migliore la parallelizzazione del flusso dati, ora la cache l2 passa da 768KB a 2MB.

Anche Nvidia ha lavorato molto sul rapporto cache, questa ha bisogno di più cicli di accesso ma può contenere molti più dati da caricare all’istante, per fornire sempre più maggiormente gli shader, vista la potenza teorica di ben 5,9 tera flops. Una potenza matematica e teorica in ALU, capace di eguagliare la GTX 1070 di NVIDIA.

Dentro il Compute Engine

polaris-cu-0faffe421ed97c3558bcfd64c68cb35c7

All’interno del compute engine, troviamo lo scheduler che comanda le ALU. Come detto in precedenza, le quattro unità vettoriali, contengono 16 ALU a testa e 256kb di cache per vettore. Internamente possiamo notare i 16 load store, i 16kb di cache l1 e le ben 4 texture unit (TMU), posizionate nello stesso rapporto già visto con Nvidia, ovvero 4 ogni 64 shader o cuda cores.

Schema completo del chip Polaris

Polaris-P10-Die-Shot-pcgh

Lo schema è essenzialmente per utenti particolarmente esperti ed attenti, ma possiamo vedere subito, che il chip è del tutto completo, nessun rebrand con più CU, come avvenne per Tonga.

Possiamo vedere dal grafico 36 CU, 4 a rasterizzatore, e le relative TMU affiancate dalla cache l1, disposta sotto le CU e la corposa cache l2 da ben 2mb con 8 partizioni da 256kb..

Memory Compression

IMG0051113

Notevoli le migliorie anche sul fronte memoria, il 40% sbandierato sia da AMD che Nvidia, non produceva i risultati sperati, tanto che spesso si arrivava a soglie del 17-20-25% massimi. Ora  Polaris è in grado di decomprimere qualsiasi formato, ed in qualsiasi valore, in scala 8:1 / 4:1 / 2:1. Il valore di 2:1 non veniva compresso, saturando porzioni di banda sequenziali, ora con la nuova modalità si riesce a decomprimere qualsiasi formato, raggiungendo il vero valore teorico impostato sia da Nvidia che da AMD.

La Hawaii 290, pur vantando ben 320gb/s non riusciva ad accedere ad oltre 263gb/s, fattore che la rende più sbilanciata rispetto a Polaris, considerando che tale schede ha il doppio delle ROP senza compressione.

Primitive discard

IMG0051129

AMD come sottolineato ha una potenza sulle ALU ben sopra alla rivale Nvidia, ma non integra polymorph engine ogni 128 shader come la rivale, si serve sempre dei raster, da cui elabora solo un triangolo su ogni raster, ma la vera difficoltà è data dall’espulsione dei micro triangoli, fattore che spesso nei giochi come The Witcher, basati su un massiccio uso di tassellazione, o sui bench sintetici heaven benchmark (backface culling), facevano crollare la scheda perchè la pipeline grafica si ingolfava di dati, non eliminando a dovere la geometria già calcolata.

Il PDA, compatibile solo con le GPU Polaris o Vega di prossima generazione, fa in modo che la geometria venga espulsa subito, dopo tutte le operazioni sui vertici senza andare ad intasare i buffer. Siamo certi che questo sarà un bel guadagno nei giochi Gameworks Nvidia.

Valuta