03 Aritmetica

Dizia eu que a aritmética…
Arquitetura de Computadores
Emilio Francesquini
e.francesquini@ufabc.edu.br
2021.Q1
Centro de Matemática, Computação e Cognição
Universidade Federal do ABC
Disclaimer
Estes slides foram preparados para o curso de Arquitetura de Computadores

na UFABC.
Este material pode ser usado livremente desde que sejam mantidos, além
deste aviso, os créditos aos autores e instituições.
O conteúdo destes slides foi baseado no conteúdo do livro Computer
Organization And Design: The Hardware/Software Interface, 5th Edition.
1
Aritmética para computadores
Aritmética para computadores
Operações em inteiros
I Soma e subtração
I Multiplicação e divisão
I Lidando com overflow
Números de ponto flutuante
I Representação e operações
2
Adição de inteiros
Exemplo: 7 + 6
Causa um overflow se o resultado estiver fora da faixa suportada

A soma de operando +s e -s nunca causa overflow. Pq?
Na adição de dois operandos positivos
I há overflow se o sinal do resultado for negativo
Na adição de dois operandos negativos
I há overflow se o sinal do resultado for positivo 3
Subtração de inteiros
Como usamos complemento de 2, o mais fácil é somar a negação do

segundo operando!
Exemplo: 7 − 6 = 7 + (−6)
+7: 0000 0000 ... 0000 0111

-6: 1111 1111 ... 1111 1010
+1: 0000 0000 ... 0000 0001
4
Lidando com overflows
Algumas linguagens simplesmente ignoram o overflow (ex. C).

I Utilizam as instruções addu e subu do MIPS.
Já outras linguagens como Ada e Fortran lançam exceções quando overflows
ocorrem.
I Utilizam as instruções add, addi, sub do MIPS.
I Quando um overflow ocorre elas invocam um tratador de exceções.
Salva o PC no registrador EPC (exception program counter).
Salta para o tratador de exceção pré-definido.
mfc0 (move from coprocessor reg) pode ser usado para recuperar o valor de EPC e
voltar ao ponto de erro logo ter corrigido o problema.
5
Aritmética para aplicações multimídia
Operações gráficas e de mídia normalmente trabalham com vetores de

dados com 8 ou 16 bits
I Pode-se utilizar um somador de 64 bits com a cadeia de ”carry”particionada
Assim, pode-se operar em vetores de 8x8, 4x16 ou 2*32 bits
I SIMD - Single Instruction Multiple Data
Operações com saturação
I No caso de overflows, o resultado é sempre o maior valor representável
I Exemplos: cortes de áudio, saturação em vídeo
6
Multiplicação e Divisão de Inteiros
Multiplicação
Começamos com o algoritmo de papel e lápis…
7
Multiplicação - Exemplo
2x3=6
4 bits
Iteration Step Multiplier Multiplicand Product
0 Initial values 0011 0000 0010 0000 0000
1 1a: 1 ⇒ Prod = Prod + Mcand 0011 0000 0010 0000 0010
2: Shift left Multiplicand 0011 0000 0100 0000 0010
3: Shift right Multiplier 0001 0000 0100 0000 0010
2 1a: 1 ⇒ Prod = Prod + Mcand 0001 0000 0100 0000 0110
3 1: 0 ⇒ No operation 0000 0000 1000 0000 0110
4 1: 0 ⇒ No operation 0000 0001 0000 0000 0110
8
Hardware para multiplicação
9
Multiplicador otimizado
Desempenha vários passos em paralelo: soma/deslocamento

Gasta um ciclo por adição do produto parcial
I Não é tão grave se a frequência da ocorrência de multiplicações é baixa
10
Um multiplicador ainda mais rápido
Utiliza diversos circuitos somadores

I Compromisso (tradeoff ) entre custo e desempenho
Pode ser usado como pipeline para melhorar o desempenho através do

11
paralelismo
A multiplicação no MIPS
Utiliza dois registradores especiais de 32 bits para o produto

I HI: 32 bits mais significativos
I LO: 32 bits menos significativos
Instruções disponíveis
1 # coloca o resultado do produto (64 bits) no HI/LO

2 mult rs, rt
3 multu rs, rt
4 # move resultados de HI/LO para rd
5 mfhi rd
6 mflo rd
7 # Multiplica rs por rt e guarda os 32 bits
8 # menos significativos em rd
9 mul rd, rs, rt
12
Divisão
Verifica divisão por 0

Abordagem de divisão papel e lápis
I Se o número de bits do divisor ≤ dividendo
1 no quociente, subtrai
I Caso contrário
0 no quociente, ”desce”o próximo bit
Divisão com restauração
I Faz a subtração e se o resto for menor que 0,
adiciona o divisor de volta.
Operandos de n bits resultam Divisão com sinal
em um quociente e resto de I Divide-se utilizando os valores absolutos
n bits. I Ajusta o sinal do quociente e do resto conforme
necessário
13
Divisão
1001010 | 1000
-1000 ---------
---- 1001
0001
10 # baixa o 0
101 # baixa o 1
1010 # baixa o 0
Operandos de n bits resultam
-1000
em um quociente e resto de ----
n bits. 0010 <- resto
14
Divisão - Exemplo
7 / 2 = 3 resto 1
4 bits
Iteration Step Quotient Divisor Remainder
0 Initial values 0000 0010 0000 0000 0111
1: Rem = Rem – Div 0000 0010 0000 1110 0111
1 2b: Rem < 0 ⇒ +Div, sll Q, Q0 = 0 0000 0010 0000 0000 0111
3: Shift Div right 0000 0001 0000 0000 0111
1: Rem = Rem – Div 0000 0001 0000 1111 0111
2 2b: Rem < 0 ⇒ +Div, sll Q, Q0 = 0 0000 0001 0000 0000 0111
3: Shift Div right 0000 0000 1000 0000 0111
1: Rem = Rem – Div 0000 0000 1000 1111 1111
3 2b: Rem < 0 ⇒ +Div, sll Q, Q0 = 0 0000 0000 1000 0000 0111
3: Shift Div right 0000 0000 0100 0000 0111
1: Rem = Rem – Div 0000 0000 0100 0000 0011
4 2a: Rem ≥ 0 ⇒ sll Q, Q0 = 1 0001 0000 0100 0000 0011
3: Shift Div right 0001 0000 0010 0000 0011
1: Rem = Rem – Div 0001 0000 0010 0000 0001
5 2a: Rem ≥ 0 ⇒ sll Q, Q0 = 1 0011 0000 0010 0000 0001 15
3: Shift Div right 0011 0000 0001 0000 0001
Hardware para divisão
16
Hardware otimizado para divisão
Um ciclo a cada subtração para resto-parcial

Parece muito com um multiplicador
I De fato, o mesmo hardware pode ser utilizado por ambos! 17
Uma divisão mais rápida
Infelizmente não é possível fazer um hardware paralelo como o da

multiplicação
I A subtração é condicionada ao sinal do resto
Circuitos para divisão mais rápidos (por ex. SRT) geram múltiplos bits do
quociente a cada passo.
I Mas ainda assim necessitam de múltiplos passos.
18
Divisão no MIPS
Utiliza os registradores HI e LO para os resultados

I HI: Guarda o resto (32 bits)
I LO: Guarda o quociente (32 bits)
Instruções
1 div rs, rt
2 divu rs, rt
Não há verificação para os casos de divisão por 0 ou por overflow

I É trabalho do software cuidar disto caso necessário
Utiliza as instruções mfhi e mflo para acessar os resultados.
19
Números com pontos flutuantes
Pontos flutuantes
Representam números não inteiros

I Incluindo aqueles muito grandes ou muito pequenos.
É muito semelhante à notação científica
−2, 34 × 1056 normalizado
+0, 002 × 10−4 não normalizado
+987, 02 × 109 não normalizado
Em binário é a mesma coisa
I ±1, xxxx2 × 2yyyy
Em C, por exemplo, são representados por float e double.
20
Padrão IEEE 754-1985
Definiu um padrão para a representação de números de ponto flutuante

Surgiu em resposta às divergentes maneiras de representar números
I Havia sérios problemas de portabilidade para códigos científicos
Agora é adotado quase que universalmente
Estabeleceu duas representações padrões
I Precisão simples (32 bits)
I Precisão dupla (64 bits)
21
Formato IEEE para números em ponto flutuante
Sinal Expoente Mantissa

Precisão simples 1 bit 8 bits 23 bits
Precisão dupla 1 bit 11 bits 52 bits
x = (−1)s × (1 + Mantissa) × 2Expoente−Bias
Bit de sinal: 0 positivo, 1 negativo

O significando, ou mantissa é mantido normalizado
I 1.0 ≤ mantissa < 2.0
I Logo possui, sempre, um bit 1 no início
I Por isto este bit não é guardado explicitamente e acrescentando 1 bit à
representação da mantissa
Expoente: guardado como um expoente + deslocamento (bias)
I Expoente é sempre guardado como um número sem sinal
Bias para precisão simples: 127 22
Bias para precisão dupla: 1023
Precisão Simples
Os expoentes 00000000 e 11111111 são reservados

Os ”menores” valores representáveis são:
I Expoente: 00000001
Expoente real: 1 − 127 = −126
I Mantissa: 0000...00, que com o bit implícito 1 se torna 1.0
I Valores: ±1.0 × 2−126 ≈ ±1.2 × 10−38
Os ”maiores” valores representáveis são:
I Expoente: 11111110
Expoente real: 254 − 127 = +127
I Mantissa: 1111...11, que com o bit implícito 1 é ≈ 2.0
I Valores: ±2.0 × 2+127 ≈ 3.4 × 10+38
23
Precisão Dupla
Os expoentes 00000000000 e 11111111111 são reservados

Os ”menores” valores representáveis são:
I Expoente: 00000000001
Expoente real: 1 − 1023 = −1022
I Mantissa: 0000...00, que com o bit implícito 1 se torna 1.0
I Valores: ±1.0 × 2−1022 ≈ ±2.2 × 10−308
Os ”maiores” valores representáveis são:
I Expoente: 11111111110
Expoente real: 2046 − 1023 = +1023
I Mantissa: 1111...11, que com o bit implícito 1 é ≈ 2.0
I Valores: ±2.0 × 2+1023 ≈ 1.8 × 10+308
24
Sobre a precisão de pontos flutuantes
A precisão é relativa
I Todos os bits da mantissa são levados em consideração
I Precisão simples: ≈ 2−23
Equivalente a 23 × log10 2 ≈ 23 × 0.3 ≈ 6 casas decimais
I Precisão dupla: ≈ 2−52
Equivalente a 52 × log10 2 = 52 × 0.3 ≈ 16 casas decimais
25
Exemplo 1
Como representar 0.75

I −0.75 = (−1)1 × 1.12 × 2−1
I Sinal: 1
I Expoente = -1 + bias
Simples: −1 + 127 = 126 = 01111110 2
Dupla: −1 + 1023 = 1022 = 0111111111110 2
I Mantissa: (sem o 1 antes da vírgula): 1000...00 2
Precisão simples: 1 01111110 1000...00
Precisão dupla: 1 01111111110 1000...00
26
Exemplo 2
Que número é representado pelo float de precisão simples: 1 10000001

01000...00
I Sinal: 1
I Expoente: 100000012 - 127 = 129 - 127 = 2
I Mantissa: 1 + .012 = 1 + (0 × 2−1 + 1 × 2−2 ) = 1 + 1 × 1
4 = 1 + 0.25 = 1.25
I x = (−1)1 × 1.25 × 22 = −1 × 1.25 × 22 = -5.0
27
Infinitos e NaNs
± Infinito
I Expoente: 1111...11
I Mantissa: 0000...00
I Pode ser utilizado pelos cálculos seguintes sem a necessidade de verificações
de overflow
Qualquer operação com Inf resulta em Inf, exceto com NaN que resulta em NaN.
NaN - Not a Number
I Expoente: 1111...11
I Mantissa: =
6 0000...00
√
I Indica uma operação ilegal ou resultado não definido ( −1 ou divisão por 0,
por exemplo).
I Pode ser utilizado pelos cálculos seguintes sem a necessidade de verificações
de overflow.
Qualquer operação com NaN resulta em NaN.
28
Resumo
Single precision Double precision Object represented
Exponent Fraction Exponent Fraction

0 0 0 0 0
0 Nonzero 0 Nonzero ± denormalized number
1–254 Anything 1–2046 Anything ± floating-point number
255 0 2047 0 ± infinity
255 Nonzero 2047 Nonzero NaN (Not a Number)
29
Adição e multiplicação de pontos
flutuantes
Adição de pontos flutuantes
Considere um exemplo, em decimal, de 4 dígitos

I 9.999 × 101 + 1.610 × 10–1
1 Alinhar os pontos decimais

I Desloca-se números com menor expoente
I 9.999 × 101 + 0.016 × 101
2 Adicionar mantissa
I 9.999 × 101 + 0.016 × 101 = 10.015 × 101
3 Normalizar resultado e verificar por overflow/underflow
I 1.0015×102
4 Arredondar e renormalizar se necessário
I 1.002×102
30
Adição de pontos flutuantes
Agora considere um exemplo com um binário de 4 dígitos

I 1.0002 × 2–1 + –1.1102 × 2–2 (0.5 + –0.4375)
1 Alinhar os pontos binários

I Desloca-se números com menor expoente
I 1.0002 × 2–1 + –0.1112 × 2–1
2 Adicionar mantissa
I 1.0002 × 2–1 + –0.1112 × 2–1 = 0.0012 × 2–1
3 Normalizar resultado e verificar por overflow/underflow
I 1.0002 × 2–4 , sem over/underflow
4 Arredondar e renormalizar se necessário
I 1.0002 × 2–4 (sem mudanças) = 0.0625
31
Hardware para a soma de FPs
Muito mais complexo que um somador de inteiros.

Para fazer a soma em um ciclo de clock faria com que o ciclo fosse muito
longo
I Muito mais longo do que operações sobre inteiros
I Mas um clock mais lento penalizaria todas as instruções
Consequência: o somador de FPs leva mais de um ciclo
I Contudo pode ser colocado em pipeline!
32
Somador de FPs
33
Multiplicação de FPs
Considere um exemplo decimal com 4 dígitos

I 1.110 × 1010 × 9.200 × 10–5
1 Some expoentes
I Para expoentes com bias subtraia o bias da soma
I Novo expoente = 10 + (–5) = 5
2 Multiplique as mantissas
I 1.110 × 9.200 = 10.212 → 10.212 × 105
3 Normaliza o resultado e verifica por over/underflow
I 1.0212 × 106
4 Arredonda e renormaliza se necessário
I 1.021 × 106 $
5 Determina o sinal do resultado pelo sinal dos operandos
I +1.021 × 106
34
Multiplicação de FPs
Agora considere um exemplo binário de 4 dígitos

I 1.0002 × 2–1 × –1.1102 × 2–2 (0.5 × –0.4375)
1 Soma expoentes
I Sem bias: –1 + (–2) = –3
I Com bias: (–1 + 127) + (–2 + 127) = –3 + 254–127 = –3 + 127
2 Multiplica mantissa
I 1.0002 × 1.1102 = 1.1102 → 1.1102 × 2–3
3 Normaliza resultado e verifica over/underflow
I 1.1102 × 2–3 (sem mudanças) sem over/underflow
4 Arredonda e renormaliza (se necessário)
I 1.1102 × 2–3 (sem mudanças)
5 Determina sinal: + × – → –
I –1.1102 × 2–3 = –0.21875
35
Multiplicador de FPs
O hardware para multiplicação de FPs é semelhante ao de somas

I No lugar de um somador para as mantissas usa um multiplicador
Aritmética de FPs geralmente lida com
I Soma, subtração, multiplicação, divisão, inverso e raiz quadrada
I Conversão inteiro ⇔ FP
Cada operação em geral leva vários ciclos
I Contudo pode ser colocada em um pipeline
36
Instruções de FP no MIPS
Instruções FP no MIPS
O hardware para FP é o coprocessador 1

I É um processador adjunto que complementa a ISA
Por isto contém um conjunto extra de registradores
I 32 registradores de precisão simples: $f0, $f1, …, $f31
I São usados pareados para precisão dupla: $f0 / $f1, $f2 / $f3,…, $f30 /
$f31
Operações de FPs só funcionam em registradores de FPs
I Programas em geral não fazem operações inteiras em dados de FPs ou
vice-versa
I Podemos, então, ter mais registradores com pouco impacto no tamanho do
código
Para carregar e armazenar FPs temos as instruções
I lwc1, ldc1, swc1, sdc1
1 ldc1 $f8, 32($sp)

37
Instruções FP no MIPS
1 # precisão simples: add.s sub.s mul.s div.s

2 add.s $f0, $f1, $f6
3 # precisão dupla: add.d sub.d mul.d div.d
4 mul.d $f4, $f4, $f6
5
6 # Comparação
7 # P. Simples: c.eq.s c.lt.s c.le.s ...
8 # P. Dupla: c.eq.d c.lt.d c.le.d ...
9 # Ambos os casos setam o bit de condição para 0 ou 1
10 c.lt.s $f3, $f4
11
12 # E para usar o bit temos o branch condicional de FPs

13 # bc1t, bc1f - true ou false
14 bc1t TargetLabel
38
Exemplo de código com FPs - °F para °C
1 float f2c (float fahr) {

2 return ((5.0 / 9.0) * (fahr - 32.0));
3 }
fahr em $f12, resultado em $f0, literais na memória global
1 f2c:
2 lwc1 $f16, const5($gp) # Carrega 5.0 para $f16
4 div.s $f16, $f16, $f18 # Div. $f16 por $f18
6 sub.s $f18, $f12, $f18 # Subtrai $f18 de $f12
7 mul.s $f0, $f16, $f18 # Multiplica $f16 $f18
8 jr $ra # Retorna
39
Exemplo 2 - Multiplicação de arrays
X =X+Y ×Z
I Todos são matrizes de 32 × 32 de FPs de precisão dupla
Código em C
1 void mm (double x[][], double y[][], double z[][]) {

2 int i, j, k;
3 for (i = 0; i! = 32; i = i + 1)
4 for (j = 0; j! = 32; j = j + 1)
5 for (k = 0; k! = 32; k = k + 1)
6 x[i][j] = x[i][j] + y[i][k] * z[k][j];
7 }
Endereços de x, y, z in $a0, $a1, $a2 e i, j, k em $s0, $s1, $s2
40
Exemplo 2 - Multiplicação de arrays
1 li $t1, 32 # $t1 = 32 (tamanho linha/fim do laço)
2 li $s0, 0 # i = 0; inicializa primeiro laço
3 L1: li $s1, 0 # j = 0; reinicia segundo laço
4 L2: li $s2, 0 # k = 0; reinicia terceiro laço
5 sll $t2, $s0, 5 # $t2 = i * 32 (tam. da linha de x)
6 addu $t2, $t2, $s1 # $t2 = i * tamanho(linha) + j
7 sll $t2, $t2, 3 # $t2 = byte offset de [i][j]
8 addu $t2, $a0, $t2 # $t2 = endereço de x[i][j]
9 l.d $f4, 0($t2) # $f4 = 8 bytes de x[i][j]
10 L3: sll $t0, $s2, 5 # $t0 = k * 32 (tam da linha de z)
11 addu $t0, $t0, $s1 # $t0 = k * tamanho(linha) + j
12 sll $t0, $t0, 3 # $t0 = byte offset de [k][j]
13 addu $t0, $a2, $t0 # $t0 = endereco de z[k][j]
14 l.d $f16, 0($t0) # $f16 = 8 bytes de z[k][j]
15 sll $t0, $s0, 5 # $t0 = i*32 (tam. da linha de y)
16 addu $t0, $t0, $s2 # $t0 = i*tamanho(linha) + k
17 sll $t0, $t0, 3 # $t0 = byte offset de [i][k]
18 addu $t0, $a1, $t0 # $t0 = endereco de y[i][k]
19 l.d $f18, 0($t0) # $f18 = 8 bytes de y[i][k]
20 mul.d $f16, $f18, $f16 # $f16 = y[i][k] * z[k][j]
21 add.d $f4, $f4, $f16 # f4=x[i][j] + y[i][k]*z[k][j]
22 addiu $s2, $s2, 1 # $k = k + 1
23 bne $s2, $t1, L3 # if (k != 32) vai para L3
24 s.d $f4, 0($t2) # x[i][j] = $f4
25 addiu $s1, $s1, 1 # $j = j + 1
26 bne $s1, $t1, L2 # if (j != 32) vai para L2
27 addiu $s0, $s0, 1 # $i = i + 1 41
28 bne $s0, $t1, L1 # if (i != 32) vai para L1
Aritmética mais precisa
O padrão IEEE 754 também especifica alguns controles de arredondamento

adicionais
I Bits extras de precisão (guard, round e sticky)
I Escolha do modo de arredondamento
I Permite que o programador ajuste o comportamento desejado para sua
aplicação
Nem todas as unidades de ponto flutuante fornecem todos os modos
I Boa parte das linguagens de programação e bibliotecas de FP usam os ajustes
padrão
Há novamente um trade-off entre a complexidade do hardware, o
desempenho e requerimentos de marketing
42
Outras Arquiteturas e Conclusão
Arquitetura FP do x86
Originalmente baseada no coprocessador 8087

I Registradores de precisão estendida de 80 bits
I Utilizado como uma pilha
I Registradores indexados a partir do TOS: ST(0), ST(1), …
Os valores em FP são armazenados em 64 bits na memória
I Convertidos durante o load/store do operando
I Operando inteiros também são convertidos neste momento
É muito complicado gerar e otimizar o código para esta arquitetura
I Resultado: baixo desempenho.
43
Instruções de FP no x86
Transf. Dados Aritmética Comparação Transcendental

F I LD mem/ST(i) F I ADD P mem/ST(i) F I COM P FPATAN
F I ST P mem/ST(i) F I SUB RP mem/ST(i) F I UCOM P F2XMI
FLD1, FLDZ F I MUL P mem/ST(i) FSTSW AX/mem FCOS
FLDL2T, FLDL2E, FLDPI, FLDLN2, FLDZ F I DIV RP mem/ST(i) FPTAN
FSQRT FPREM
FABS FPSIN
FRNDINT FYL2X
Variações
I Operando inteiro: I
I Pop do operando da pilha: P
I Ordem inversa dos operandos: R
I Mas nem todas as combinações são possíveis. 44
Streaming SIMD Extension 2 (SSE2)
Adicionou 4 registradores de 128 bits

I Mais 4, totalizando 8, foram adicionados no AMD64/EM64T
Podem ser usados para armazenar múltiplos operandos FP
I 2 operandos de 64 bits (precisão dupla)
I 4 operandos de 32 bits (precisão simples)
As instruções operam nos valores simultâneamente
I SIMD - Single Instruction Multiple Data
45
Deslocamento para esquerda e divisão
Fazer o deslocamento para esquerda (left shift) em i posições multiplica um

inteiro por 2i
Deslocar para a direita (right shift) em i posições divide por 2i ?
Para números sem sinal, sem problema
Para números com sinal
I É preciso estender o bit de sinal
I Exemplo: −5/4
11111011 >> 2 = 11111110 = -2
Arredonda para −∞
Confronte com: 11111011 >> 2 = 00111110 = +62
46
Associatividade
Programas paralelos podem intercalar operações em ordem inesperadas

Suposições sobre associatividade podem falhar
(x + y) + z x + (y + z)
x −1.50E + 38 −1.50E + 38
y +1.50E + 38 0.00E + 00
z 1.0 1.0 +1.50E + 38
1.00E + 00 0.00E + 00
É preciso fazer uma rodada a mais de testes em programas paralelos para

garantir os resultados com mais níveis de paralelismo
47
Quem se importa com a precisão de FPs?
É importantíssimo para código científico

E para consumidores do dia a dia?
I Imagine o seu saldo bancário com uma diferença de 0.0002 centavos…
O Bug do Pentium FDIV
I O mercado espera precisão
I Veja ”The Pentium Chronicles”, por Colwell
48
Conclusões
Bits não tem nenhum significado inerente

I A interpretação dos bits depende das instruções que forem aplicadas a eles
Representação pelo computador de números
I Tem limites finitos e de precisão
I Programas precisam levar isto em conta
49
Conclusões
As ISAs dão suporte a operações aritméticas

I Inteiros com e sem sinal
I Aproximação de números reais por FPs
Limites de valores e precisão
I Operações podem dar overflow ou underflow
A ISA do MIPS
I Instruções principais: 54
Representam 100% das instruções usadas pelo SPECINT
Representam 97% das instruções usadas pelo SPECFP
I Outras instruções são bem menos frequentes.
50

03 Aritmetica

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

03 Aritmetica

Enviado por

Direitos autorais:

Formatos disponíveis

Dizia eu que a aritmética…

Estes slides foram preparados para o curso de Arquitetura de Computadores

Causa um overflow se o resultado estiver fora da faixa suportada

Como usamos complemento de 2, o mais fácil é somar a negação do

+7: 0000 0000 ... 0000 0111

Algumas linguagens simplesmente ignoram o overflow (ex. C).

Operações gráficas e de mídia normalmente trabalham com vetores de

Começamos com o algoritmo de papel e lápis…

Desempenha vários passos em paralelo: soma/deslocamento

Utiliza diversos circuitos somadores

Pode ser usado como pipeline para melhorar o desempenho através do

Utiliza dois registradores especiais de 32 bits para o produto

1 # coloca o resultado do produto (64 bits) no HI/LO

Verifica divisão por 0

Um ciclo a cada subtração para resto-parcial

Infelizmente não é possível fazer um hardware paralelo como o da

Utiliza os registradores HI e LO para os resultados

Não há verificação para os casos de divisão por 0 ou por overflow

Representam números não inteiros

Definiu um padrão para a representação de números de ponto flutuante

Sinal Expoente Mantissa

x = (−1)s × (1 + Mantissa) × 2Expoente−Bias

Bit de sinal: 0 positivo, 1 negativo

Os expoentes 00000000 e 11111111 são reservados

Os expoentes 00000000000 e 11111111111 são reservados

Como representar 0.75

Que número é representado pelo float de precisão simples: 1 10000001

Single precision Double precision Object represented

Exponent Fraction Exponent Fraction

Considere um exemplo, em decimal, de 4 dígitos

1 Alinhar os pontos decimais

Agora considere um exemplo com um binário de 4 dígitos

1 Alinhar os pontos binários

Muito mais complexo que um somador de inteiros.

Considere um exemplo decimal com 4 dígitos

Agora considere um exemplo binário de 4 dígitos

O hardware para multiplicação de FPs é semelhante ao de somas

O hardware para FP é o coprocessador 1

1 ldc1 $f8, 32($sp)

1 # precisão simples: add.s sub.s mul.s div.s

12 # E para usar o bit temos o branch condicional de FPs

1 float f2c (float fahr) {

fahr em $f12, resultado em $f0, literais na memória global

1 void mm (double x[][], double y[][], double z[][]) {

Endereços de x, y, z in $a0, $a1, $a2 e i, j, k em $s0, $s1, $s2

O padrão IEEE 754 também especifica alguns controles de arredondamento

Originalmente baseada no coprocessador 8087

Transf. Dados Aritmética Comparação Transcendental

Adicionou 4 registradores de 128 bits

Fazer o deslocamento para esquerda (left shift) em i posições multiplica um

Programas paralelos podem intercalar operações em ordem inesperadas

É preciso fazer uma rodada a mais de testes em programas paralelos para

É importantíssimo para código científico

Bits não tem nenhum significado inerente

As ISAs dão suporte a operações aritméticas

Você também pode gostar