Escolar Documentos
Profissional Documentos
Cultura Documentos
Arquitetura Superecalar e Paralela
Arquitetura Superecalar e Paralela
A POLITECNICA
Discentes: Docente:
Resumo:.......................................................................................................................................................3
Introdução:..................................................................................................................................................4
Paralelismo..................................................................................................................................................5
Paralelismo por CHIP...............................................................................................................................6
Paralelismo a nível de Processador.........................................................................................................7
Paralelismo a nível de instrução (Pipeline)..............................................................................................7
Paralelismo por Software........................................................................................................................7
Pipeline........................................................................................................................................................7
Arquitetura Superescalar.............................................................................................................................8
Conclusão..................................................................................................................................................10
2
Resumo:
Neste presente trabalho faremos uma breve introdução sobre Arquiteturas Superescalares
e paralelas (Paralelismo), falaremos também sobre a Pipeline e como ela funciona e é executada,
o funcionamento e execução de instruções em uma pipeline e processadores superescalares.
3
Introdução:
Desde o início dos tempos o homem vem tentando evoluir, e ao longo dos anos o tempo
se tornou mais e mais valioso, na área de arquitetura de computadores, o tempo de
processamento era o factor mais importante para evolução,
A criação de linguagem de alto nível forneceram um guia para projetar um novo tipo de
arquitetura de processador: computador com conjunto reduzido de instruções (RISC — reduced
instructions set computer).
Mas como dito no início o homem procura sempre mais rapidez menos tempo e com isso
maior processamento, com isso para enfrentar problemas cada vez maiores, os arquitetos de
computadores estão recorrendo cada vez mais a computadores paralelos. Apesar de talvez não
ser possível construir uma máquina com uma única CPU e um tempo de ciclo de 0,001 ns, pode
ser perfeitamente viável produzir uma com 1.000 CPUs com um tempo de ciclo de 1 ns cada.
Embora esse último use CPUs mais lentas do que o primeiro, sua capacidade total de
computação é teoricamente a mesma. E aí onde entra a arquitetura paralela ou mais
comummente cahmado Paralelismo.
4
Paralelismo
O Paralelismo pode ser introduzido em vários níveis. No nível mais baixo, ele pode ser
adicionado ao chip da CPU, por pipeline e projetos superescalares com várias unidades
funcionais. Também pode ser adicionado por meio de palavras de instrução muito longas com
paralelismo implícito. Características especiais podem ser adicionadas à CPU para permitir que
ela manipule múltiplos threads de controle ao mesmo tempo. Por fim, várias CPUs podem ser
reunidas no mesmo chip. Juntas, essas características podem equivaler, talvez, a um fator de 10
vezes em desempenho em relação a projetos puramente sequenciais.
No caso de funções especializadas, o fator de ganho também pode ser de, talvez, 5 a 10.
Contudo, para conseguir um fator de cem, de mil, ou de milhão, é necessário replicar CPUs
inteiras e fazer que todas elas funcionem juntas com eficiência. Essa ideia leva a grandes
multiprocessadores e multicomputadores (computadores em cluster). Nem é preciso dizer que
interligar milhares de processadores em um grande sistema gera seus próprios problemas, que
precisam ser resolvidos.
Por fim, agora é possível envolver organizações inteiras pela Internet e formar grades de
computação fracamente acopladas. Esses sistemas estão apenas começando a surgir, mas têm um
potencial interessante para o futuro.
5
As CPUs Fracamente acopladas – devido a distância entre CPUs. É o caso de
computação em grid onde temos vários computadores independentes que são interligados
por uma ou mais redes e que trabalham colaborativamente para atender a um
processamento específico.
6
Paralelismo a nível de Processador
Esse tipo de paralelismo é uma técnica que busca o ganho de desempenho associando
duas ou mais CPUs organizados para executar uma determinada tarefa. São usadas as seguintes
técnicas:
Pipeline
7
Em resumo, é o processo pelo qual uma instrução de processamento é subdividida em
etapas, uma vez que cada uma destas etapas é executada por uma porção especializada da CPU,
podendo colocar mais de uma instrução em execução simultânea. Isto traz um uso mais racional
da capacidade computacional com ganho substancial de velocidade. Entre os problemas
enfrentados estão a dependência de instruções anteriores e desvios que dificultam o processo,
bem como a diferença de complexidade de instruções que fazem com que as mesmas possam
levar um tempo variável para execução.
Arquitetura Superescalar
8
Uma arquitetura superescalar deve possuir uma série de componentes especiais para
executar mais de uma instrução por ciclo:
Unidade de Busca de Instruções: capaz de buscar mais de uma instrução por ciclo.
Possui também um preditor de desvios, que deve ter alta taxa de acerto, para poder
buscar as instruções sem ter que esperar pelos resultados dos desvios.
Unidade de Decodificação: capaz de ler vários operandos do banco de registradores a
cada ciclo. Note que cada instrução sendo decodificada pode ler até dois operandos
do banco de registradores.
Unidades Funcionais Inteiras e de Ponto Flutuante: em número suficiente para
executar as diversas instruções buscadas e decodificadas a cada ciclo.
9
Conclusão
Assim concluímos o nosso trabalho onde abordamos de algumas arquiteturas e como elas
encaram a execução de instruções, este trabalho e de caracter avaliativo e introdutório, como foi
abordado notamos que há muito mais temas que podemos abordar ou ate mesmo desenvolver os
mesmos já abordados aqui.
10