Architettura Tahiti LE
La GPU Tahiti LE è una versione depotenziata di Tahiti PRO (HD 7950), che ha sua volta è una versione depotenziata di Tahiti XT (HD 7970). A differenza dei due chip che equipaggiano le schede della serie HD 7900, Tahiti LE ha un package diverso (come vedremo nell'analisi del PCB) pur essendo costruito sempre con tecnologia produttiva a 28 nanometri. Integra tutti i 4.31 miliardi di transistor, sfrutta l' architettura GCN con organizzazione 1D e garantisce il supporto completo alle APU DirectX 11.1.
(clicca sui pulsanti per vedere le varie declinazioni di Tahiti)
AMD ha disabilitato 8 CU (Compute Unit) abbassando il numero totale a 24, per un complessivo di Stream Processors pari a 1536, con 96 TMUs, 8 Render Bach-ends (32 ROPs). Il memory controller è stato ridotto a 4 unità 2CH da 64-bit ciascuna, con un'interfaccia complessiva ampia 256-bit (contro i 384-bit di Tahiti PRO/XT).
GCN: motore geometrico
Nel front-end troviamo due distinti Geometry Engine inizializzati da un singolo Command Processor. All'interno dei due Geometry Engine è presente un nuovo Tesselator, definito di nona generazione. Tahiti, pur implementato un approccio ai calcoli geometrici simile a Cayman (HD 6970), risulta più performante grazie al maggior quantitativo di cache L2 ed a varie ottimizzazioni sull'off-chip buffering e sul Vertex Assembler. In particolare nelle operazioni di hard-tessellation il nuovo chip distacca sensibilmente quello della generazione precedente.
Il numero di ROPs è invariato rispetto a Cayman, con un'organizzazione a 8 gruppi da 4, ma ora queste possono lavorare in maniera più veloce ed essere sfruttate al meglio grazie alla maggiore banda passante verso le memorie, messa a disposizione dai due moduli 2CH aggiuntivi.
Passando alla parte terminale (back-end) notiamo che la cache L2, condivisa tra le CU, è stata complessivamente raddoppiata (768KB) rispetto a Cayman ed ora scala in maniera indipendente dalle ROPs e dal memory controller, con quest'ultimo che, come abbiamo già detto, ha un'ampiezza complessiva di 256-bit, ottenuti con 8 chip di VRAM GDDR5 a doppia densità (2Gbit).