Escolar Documentos
Profissional Documentos
Cultura Documentos
Jequié – BA
Novembro - 2019
2
De acordo com a sua utilização, o processador Um ponto central para processadores RISC é o
ARM ganhou abrangência e foram desenvolvidas pipeline, as instruções de tamanho fixo, a simplicidade das
extensões para a arquitetura. As principais extensões são: instruções, e o uso de apenas instruções Load/Store para lidar
1) NEON: trata-se de uma unidade SIMD projetada para a com a memória são algumas das características que
série Cortex-A e apresenta 32 registradores de 64 bits, que contribuem para o desempenho e facilidade de construção do
podem ser usados como 16 registradores de 128 bits, pipeline. A arquitetura do pipeline muda de um processador
organizados em vetores e acessados aos pares ARM para outro. [5]
simultaneamente, procedimento ilustrado na figura 8. O
NEON permite executar instruções SIMD de 64 e 128 bits, e 1) Busca de Instruções: A unidade de busca pode ser vista na
acelera operações de manipulação de áudio e vídeo; [5] figura 5. Nos estágios F0, F1 e F2, ocorre a busca de
instruções, começando pela previsão de desvio. Em F0,
calcula-se o endereço da instrução a ser buscada no nível 1 de
memória cache. Em paralelo ao cálculo de endereço, verifica-
se se, na busca da próxima instrução, a previsão de desvio que
deve ser utilizada. Em F2, a instrução obtida é colocada em
uma fila, que pode ter até 12 instruções, e que envia 2
instruções por vez para a unidade de decodificação. É
importante notar que o buffer de instruções contém instruções
cuja execução não é garantida, dada a possibilidade de
desvios, e subsequente esvaziamento do
pipeline. A previsão de desvios é feita com duas estruturas,
Fig. 3. Operação com dados de 128 bits no NEON um buffer de alvos de desvio e um buffer de histórico. [5]
B. ARM9
C. ARM10
A família ARM10 foi desenvolvida antecipando as
necessidades do mercado de dispositivos digitais e multimídia.
A compatibilidade foi mantida com o ARMv5TE e v4T para
facilitar a migração de código. Os aprimoramentos de
desempenho incluem um buffer de gravação aprimorado que
armazena até oito palavras duplas e uma unidade de carga
armazenamento separada. Esses recursos melhoram o Fig. 20. Núcleo ARM1020E
desempenho do código, diminuindo a média de número de
ciclos por instrução do processador e também ajuda quando o
código é altamente dependente de operações de cache. Como 2) Vector Floating Point (VFP10): Muitas aplicações de
um aprimoramento adicional, a arquitetura, os circuitos, o controle em tempo real nos campos industrial e automotivo se
layout e o desligamento controlado por software foram beneficiam do alcance dinâmico e precisão do ponto flutuante
desenvolvidos especificamente para alcançar uma operação de oferecido pelo ARM VFP10. Incorporando o ARM VFP10 em
um design do SoC pode reduzir o tempo de desenvolvimento e
baixa potência em alta performance. [4]
fornecer um desempenho confiável. A capacidade de
processamento do ARM VFP10 também oferece maior
O ARM10E também é a primeira família de
desempenho para aplicativos de imagem, como
processadores projetados com um barramento de dados de 64
dimensionamento, transformações e geração de fontes usadas
bits. Este recurso combina as características de potência e
tamanho de matriz de uma CPU de 32 bits com a largura de na impressão, transformações 3D, FFT e filtragem gráfica. [4]
banda de sistemas de alto desempenho. A interface do co-
processador de 64 bits também permite o aumento do D. ARM AMBA
desempenho de operações de ponto flutuante quando barramento on-chip "Advanced Micro-controller Bus
combinado com o coprocessador Vector Floating Point-10. [4] Architecture" ( Arquitetura avançada de barramento de micro
controladores ) oferece uma especificação aberta e
Características gerais da arquitetura ARM10E: estabelecida que serve como estrutura para projetos de SoC. [4]
Benefícios de uma solução System-on-Chip (SoC):
Suporta conjunto de instruções v5TE; Baixo consumo de energia;
Lógica de debug EmbeddedICERTII; Pequena área de silício;
Totalmente compatível com arquitetura v4T; Baixo custo de produção para grandes quantidades;
Unidade de carga / armazenamento separada; Exemplos que incluem AMBA:
Caminho de 64 bits para registrar banco - carrega o EPXA10 (SoC configurável);
dois registradores simultaneamente;
o EP7209 (MP3);
REFERÊNCIAS