Arm Cortex-A77: tutto quello che devi sapere

By | Maggio 27, 2019

Insieme al nuovo processore grafico Mali-G77 e al processore per display Mali-D77, Arm ha presentato la sua ultima CPU ad alte prestazioni: Cortex-A77. Come per Cortex-A76 dello scorso anno, Cortex-A77 è progettato per applicazioni di livello premium che richiedono il basso consumo energetico tipico di Arm. Con il Cortex-A77, Arm ha puntato sul massimo incremento delle istruzioni per ciclo / clock (IPC) che poteva gestire su Cortex-A76.



Apple A12 Bionic vs Snapdragon 855: quanto sono diversi

Le frequenze di clock e il consumo energetico sono tutte progettati per rimanere approssimativamente nello stesso ballpark, ma il nuovo core può accelerare più istruzioni contemporaneamente. Per fare questo, Arm ha progettato un nucleo ancora più ampio rispetto allo scorso anno e ha apportato una serie di miglioramenti per mantenere il core della CPU alimentato con cose da fare. Ma prima di arrivare a questo, passiamo alla panoramica di alto livello e ai numeri delle prestazioni.

Prestazioni di Arm-Cortex-A77

Nell’agosto 2018, Arm condivise in modo inusuale una roadmap della CPU fino al 2020. Dal Cortex-A73 del 2016 fino al design “Hercules” del 2020, la società promette un aumento delle prestazioni di elaborazione 2,5 volte maggiore.

Una bella fetta di questa enorme proiezione è stata realizzata con il cambiamento della microarchitettura principale con Cortex-A76, velocità di clock più elevate e moderne, e il passaggio da 16 a 10 e ora 7nm di produzione con 5 nm a seguire. Cortex-A77 offre un ulteriore aumento dell’IPC del 20 percento circa.

Per fare un confronto, Cortex-A76 dello scorso anno ha fornito un incremento del 30-35% rispetto a Cortex-A75. Quest’anno stiamo considerando un guadagno IPC del 20 percento più basso ma ancora significativo tra A77 e A76. Questa è una buona notizia perché significa più prestazioni pur restando vincolati a limiti di potenza e termica simili.

Il compromesso è che l’A77 è circa il 17 percento più grande dell’A76, quindi costerà un po’ di più in termini di silicio. Se si desidera fare un confronto con i leader del desktop, AMD ha gestito un aumento del 15% dell’IPC tra Zen2 e Zen +, mentre l’IPC di Intel è rimasto praticamente statico per anni.

Ovviamente stiamo parlando di segmenti di mercato diversi qui, ma questo dimostra come il team di progettazione della CPU di Arm abbia fatto notevoli progressi con le ultime generazioni.

Potenza bruta per tutti con i nuovi Qualcomm Snapdragon 665, 730 e 730G

Il punto di partenza è che l’A76 ha segnato un importante cambiamento microarchitetturale con enormi miglioramenti delle prestazioni, mentre siamo tornati ai miglioramenti del livello di ottimizzazione con A77.

Cortex-A77 si basa sulla microarchitettura A76

La chiave per capire la differenza tra Cortex-A77 e A76 è capire cosa si intende per un design “più ampio”. In sostanza, stiamo parlando della possibilità di eseguire più istruzioni per ogni ciclo di clock, il che aumenta il throughput del core.

Ci sono due parti importanti per farlo correttamente – aumentando il numero di unità di esecuzione per eseguire l’elaborazione e assicurando che queste unità siano ben nutrite con i dati. Iniziamo con l’ultima parte e concentriamoci sulle parti del predittore di dispatch, cache e branch del SoC.

Il Cortex-A77 vede un aumento del 50% della larghezza di invio, fino a sei istruzioni per ciclo – quattro con A76. Ciò significa che più istruzioni si dirigono verso il core di esecuzione per ogni ciclo di clock per un maggiore potenziale di prestazioni.

Di conseguenza, anche la finestra di esecuzione fuori ordine è più grande, aumentando fino a 160 voci per esporre più parallelismo.

Esiste una nota cache di istruzioni 64K, mentre il Branch Target Buffer (BTB), che contiene gli indirizzi per il predittore del ramo, è il 33 percento più grande di prima per gestire la crescita nelle istruzioni parallele. Niente di strano fin qui, è essenzialmente una versione più ampia del design dell’anno scorso.

Qualcomm Snapdragon 8cx 5G, il primo processore con 5G e 7 nm per PC

L’aggiunta front-end più intrigante è la nuovissima cache MOP da 1,5 K, che memorizza le macro-operazioni (MOP) che vengono reintrodotte dall’unità di decodifica. L’architettura della CPU di Arm decodifica le istruzioni dall’applicazione di un utente in macro operazioni più piccole e poi ulteriormente in micro-op che il core di esecuzione comprende.

Puoi vedere questo nello schema qui sopra nella sezione di decodifica. La cache MOP viene utilizzata per ridurre la penalità del costo dei rami e dei flussi mancanti, man mano che si mantengono le macro-op anziché decodificarli nuovamente e si aumenta il throughput complessivo del core.

I fascicoli dal MOP piuttosto che i-cache bypassano la fase di decodifica, salvando un ciclo. Arm afferma che la cache MOP può raggiungere un tasso di percussione dell’85 percento o superiore su un intervallo di carichi di lavoro, rendendolo un’aggiunta molto utile all’i-cache standard.

Passando alla parte centrale di esecuzione della CPU, notare l’aggiunta di una quarta ALU e della seconda unità Branch. Questo quarto ALU aumenta del 50% la larghezza di banda del numero generale del processore. Questa ALU aggiuntiva è in grado di offrire istruzioni di base ad un ciclo (come ADD e SUB) più operazioni a due cicli come una moltiplicazione.

Due delle altre ALU possono gestire solo le istruzioni di un ciclo di base, mentre l’unità finale è caricata con operazioni matematiche più avanzate come la divisione, l’accumulo multiplo, ecc. La seconda unità di ramo all’interno del core di esecuzione raddoppia il numero di salti simultanei del ramo core può gestire, che è utile nei casi in cui due delle sei istruzioni inviate sono salti derivati. Sembra un po’ strano, ma i test interni di Arm hanno rivelato i vantaggi prestazionali derivanti dall’adozione di questa seconda unità.

La gamma medio-alta ha un nuovo cervello, Qualcomm Snapdragon 712

Altre modifiche al core della CPU includono l’aggiunta di una seconda pipeline di crittografia AES. Le pipeline dell’archivio dati ora dispongono di porte di emissione dedicate per raddoppiare la larghezza di banda dei problemi di memoria. Queste porte erano precedentemente condivise con le ALU, che a volte potevano diventare un collo di bottiglia. C’è anche un perfezionatore di dati di prossima generazione per migliorare l’efficienza energetica e aumentare la larghezza di banda della DRAM di sistema.

Parte di questo sistema in Cortex-A77 presenta anche un nuovo sistema di prefetch “system-aware”. Ciò migliora le prestazioni della memoria in base all’ampia gamma di core count della CPU, capacità cache e latenze e configurazioni del sottosistema di memoria all’interno dei dispositivi finali.



L’hardware dedicato per comunicare con la Dynamic Scheduling Unit (DSU) come parte di un cluster CPU DynamIQ , che monitora l’utilizzo della cache L3 condivisa. Il nucleo presenta i livelli di distanza dinamica e aggressività per ridurre l’utilizzo della cache in situazioni in cui la larghezza di banda L3 è limitata da altri core della CPU. I core ad alte prestazioni come il Cortex-A77 hanno maggiori probabilità di saturare l’accesso DSU alla memoria, mentre è improbabile che si abbiano core di potenza inferiori come l’A55.

Snapdragon 430 vs 625, qual è il migliore Qualcomm?

Ci sono molte piccole modifiche al Cortex-A77 che aggiungono alcune differenze sostanziali al suo predecessore. In poche parole, la nuova cache MOP di A77 combinata con una finestra di istruzioni più ampia e più lunga aiuta a mantenere occupate le unità ALU, Branch e memoria potenziate. Il design della centrale elettrica Cortex-A76 è stato ampliato per migliorare ulteriormente il suo rendimento con A77, senza fare affidamento su velocità di clock più elevate.

Le maggiori prestazioni in termini di prestazioni del Cortex-A77 arrivano sotto forma di matematica. Ciò è confermato dai benchmark interni di Arm, che mostrano un incremento di prestazioni dal 20 al 35 percento rispettivamente nei benchmark integer e in virgola mobile SPEC. I miglioramenti della larghezza di banda della memoria si collocano tra il 15 e il 20 percento, evidenziando ancora una volta che i maggiori guadagni si ottengono sotto forma di numeri crunch.

Complessivamente, questi miglioramenti conferiscono all’A77 una crescita media del 20 percento rispetto alla generazione precedente. Potremmo anche assistere a ulteriori e più marginali guadagni come risultato di processi di produzione 7nm più avanzati entro la fine dell’anno o all’inizio del 2020.

Qualcomm Snapdragon 675 vs Snapdragon 660: qual’è il miglior processore

Fonte: androidauthority

Author: Morgana Presi

Mi chiamo Morgana e non sono una fata. Scrivo di tanto in tanto per Guidesmartphone.net articoli che parlano di tecnologia. Mi piace scrivere di smartphone. Nella vita studio.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.