Cap 2

9/20/09
Introduo
Processadores
Data path
Data Path
Composto pelo conjunto de registradores e o ULA Instrues register-memory

Operaes diretamente na memria Transferncias entre memria e registrador Valores armazenados em registrador Tempo de uma operao na ULA Velocidade de processamento
4
Instrues register-register
Ciclo de Dados

9/20/09
Execuo de instrues
Microprogramao
Ciclo fetch-decode-execute

Conceito de famlia de procesadores

parece muito com um programa equivalncia entre hardware e software
Manter compatibilidade O termo arquitetura foi cunhado assim Um software dentro do hardware Substitudo progressivamente por hardware para obter maior desempenho
Interpretao de comandos
Tcnica sugerida por Wilkes (1951)

CPUs tinha poucas instrues originalmente Tendncia: CPU rpida implica em muitas instrues especficas
5
Benefcios de microgramao
RISC versus CISC
Permite consertar instrues erradas sem refazer o hardware Capacidade de acrescentar instrues com custo baixo Projeto estruturado
Ser que algum hoje pensa em gerar um sistema operacional menos poderoso? Comeou com o 801 na IBM

desempenho em desenvolvimento, teste e documentao
RISC RISC II SPARC (Patterson) MIPS (Hennessy) Quantas instrues podem ser despachadas por unidade de tempo
8
Mudana de tendncia
Vantagem adicional
ROM era mais rpido do que RAM

7
9/20/09
Princpios de projeto
Princpios RISC
Depois da guerra religiosa
Pessoas parecem ter convergido um conjunto de regras bsicas dado o estado da arte
Toda instruo deve ser executada diretamente pelo hardware
O mundo deu uma volta completa
Mudanas tecnolgicas podem mudar essas regras
Processadores modernos seguem esses princpios Conhecidos como princpios RISC Restries externas
9
Deve-se maximizar a taxa de execuo de instrues
no importa quanto tempo cada instruo demora... ;-) Paralelismo se torna fundamental
e a coisa toda se torna interessante

10
Princpios RISC
Paralelismo a nvel de instruo
Instrues devem ser fceis de decodificar
Acelerar o clock no o suficiente
diretamente relacionado com a velocidade de disparo de cada instruo
Apenas LOADs e STOREs acessam a memria

Mais cedo ou mais tarde esbarra-se em limites tecnolgicos A nvel de instruo
Paralelismo a resposta natural
Tendncia a usar registradores ao mximo Acesso a memria lento Minimizar o custo de spill de registradores
Ter muitos registradores
cada instruo executada paralelamente para obter mais MIPS usar mais CPUs independentes
12
A nvel de processador
11
9/20/09
Pipelining
Pipelining
Desde 1959
instrues precisam ser buscadas na memria e depois executadas dois estgios: prefetch
Atualmente instrues so divididas em mais estgios
cada estgio tratado por uma poro especfica de hardware
Trade-off entre latncia e largura de banda

13 14
Arquiteturas Superescalares
Pipeline replicado
Se um bom, dois melhor ainda

velocidades relativas dos estgios conflito de instrues
e o compilador comea ter que ficar inteligente
As vezes apenas 1 pipeline
com certas unidades funcionais replicadas ou variadas
15
16
9/20/09
Mltiplos caminhos
Paralelismo a nvel de processador
Primeira lei do software (Nathan Myhrvold)
Software um gs que expande pra ocupar todo o seu recipiente
Existe um limite at onde 1 CPU pode ser rpida

velocidade da luz dissipao de calor paralelismo de instruo ajuda

18
17
Processadores vetoriais
Arquitetura do ILLIAC IV
ILLIAC (1972)
Grande nmero de processadores idnticos, ligados segundo um topologia regular Instrues que operam em vetores
Processadores vetorais
No so mais o foco da pesquisa
19
20
9/20/09
Multiprocessadores

Entramos em programao paralela Vrias configuraes possveis
memria compartilhada ou distribuda o que podemos explorar? como resolver conflitos? quando se escala para muitos processadores comunicao restrita a troca de mensagens
21
Como program-los

Memria
Multicomputadores

22
Definies
onde os dados e os programas so armazenados Binary Digit
mais eficiente pela tecnologia atual
Ordenao de bytes
1 byte sempre organizado da direita pra esquerda para 1 palavra, a ordem dos bytes pode variar
little endian (intel) big endian (sparc)
Endereo de memria
cada posio de memria recebe um nome cada posio armazena um conjunto de bits menor unidade endereavel
atualmente 1 byte = 8 bits
palavra = maior unidade de processamento

23
questo de portabilidade e de interoperabilidade

24
9/20/09
Ordenao de bytes
Cdigos de correo de erros

Distncia Hamming
em quantos bits duas palavras diferem (d)
Criao de cdigos para os dados

nem todas as combinaes so vlidas deteco de erros de at d 1 bits correo de erros de at (d 1)/2 bits
Bits de paridade
par ou mpar distncia hamming 2
25 26
Cdigo de Hamming
Acrescentam-se r = log(m) + 1 bits Os bits so numerados a partir de 1 Bit cujo nmero potncia de dois bit de verificao (paridade) Exemplo: m = 8, r = 4, n = 12.
Bit Bit Bit Bit 1 2 4 8 paridade paridade paridade paridade de: de: de: de: 1, 2, 4, 8, 3, 3, 5, 9, 5, 7, 9, 11. 6, 7, 10, 11. 6, 7, 12. 10, 11, 12.
Memria Cache
Desequilibrio de desempenho entre memria e CPU
acesso ao barramento
Princpio da localidade de referncia

acessos sequencias tendem a referenciar posies consecutivas colocar as posies mais acessadas na cache Se falhar, consulta memria primria
28
Para achar o erro, soma-se o valor dos bits de paridade que estiverem incorretos
27
9/20/09
Memria Cache
Supondo uma taxa de acerto h (hit ratio)
taxa de falha (miss) 1 h tempo de acesso: C + (1 h)M obter taxas de acertos alta fundamental
Hierarquia de memria
O conceito de cache se extende
memrias primrias
memria RAM do computador
Arquitetura de cache
tamanho organizao tamanho da linha caches separados quantidades de caches
29
secundrias
persistentes discos magnticos
tercirias
sequenciais fitas
30
Discos magnticos
Um disco magntico sob um indutor Formato do setor:
Prembulo
permite saber qual o setor sob o indutor
Discos magnticos
Floppy
o indutor toca a superficie
Dados
os bit armazenados (4096 bits)
IDE
migrao da controladora do disco para o prprio disco EIDE: endereamento lgico
ECC
Reed-Solomon
Gap
espao entre setores
SCSI
arquitetura de barramento melhor desempenho mltiplos acessos simultneos arbitragem do barramento
31 32
Tamanho formatado versus no formatado Velocidade de rajada versus sustentada Recalibragem trmica Zoneamento
9/20/09
RAID
RAID versus SLED RAID parece com um SLED, mas possui vrios discos operando coordenadamente Diversas configuraes
Nvel 0: striping Nvel 1: nvel 0 com replicao Nvel 2: stripes menores Nvel 3: nvel 2 com paridade Nvel 4: nvel 0 com cdigo de verificao Nvel 5: nvel 4 sem 1 disco de verificao nico
33
RAID
34

Cap 2

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Cap 2

Enviado por

Direitos autorais:

Formatos disponíveis

9/20/09

Composto pelo conjunto de registradores e o ULA Instrues register-memory

Conceito de famlia de procesadores

parece muito com um programa equivalncia entre hardware e software

Tcnica sugerida por Wilkes (1951)

RISC versus CISC

desempenho em desenvolvimento, teste e documentao

ROM era mais rpido do que RAM

Depois da guerra religiosa

Toda instruo deve ser executada diretamente pelo hardware

O mundo deu uma volta completa

Mudanas tecnolgicas podem mudar essas regras

Deve-se maximizar a taxa de execuo de instrues

e a coisa toda se torna interessante

Paralelismo a nvel de instruo

Instrues devem ser fceis de decodificar

Acelerar o clock no o suficiente

diretamente relacionado com a velocidade de disparo de cada instruo

Apenas LOADs e STOREs acessam a memria

Mais cedo ou mais tarde esbarra-se em limites tecnolgicos A nvel de instruo

Paralelismo a resposta natural

Ter muitos registradores

Atualmente instrues so divididas em mais estgios

cada estgio tratado por uma poro especfica de hardware

Trade-off entre latncia e largura de banda

Se um bom, dois melhor ainda

velocidades relativas dos estgios conflito de instrues

e o compilador comea ter que ficar inteligente

As vezes apenas 1 pipeline

com certas unidades funcionais replicadas ou variadas

Paralelismo a nvel de processador

Primeira lei do software (Nathan Myhrvold)

Software um gs que expande pra ocupar todo o seu recipiente

Existe um limite at onde 1 CPU pode ser rpida

velocidade da luz dissipao de calor paralelismo de instruo ajuda

No so mais o foco da pesquisa

Entramos em programao paralela Vrias configuraes possveis

palavra = maior unidade de processamento

questo de portabilidade e de interoperabilidade

Cdigos de correo de erros

Criao de cdigos para os dados

Princpio da localidade de referncia

Você também pode gostar