Escolar Documentos
Profissional Documentos
Cultura Documentos
COMPUTADORES PESSOAIS
1 PARTE
https://pt.wikipedia.org/wiki/Arquitetura_de_von_Neumann
2 Processadores
4 Processadores
1 Processador
Exagero: Tianhe-2
Microprocessadores
Um microprocessador um processador num nico
circuito integrado.
Um circuito integrado um conjunto de circuitos
eletrnicos colocados sobre um nico chip, uma placa de
material semicondutor, normalmente silcio.
O que interessa que, ao comprarmos um
microprocessador, estamos a comprar um circuito
integrado j embalado, pronto a colocar na sua socket.
POR DENTRO
8086
Pentium III
Este diagrama aqui apenas do GPU e no do CPU dos Skylake, os processadores Intel
da ltima gerao.
Os primeiros
Os primeiros, como os Intel 8085/6 e o
Zilog Z80 eram assim: tinham uma
Unidade de Controlo (Control Unit) para
controlar todo o seu funcionamento
interno, uma Unidade Aritmtica e
Lgica (ALU, Arithmetic and Logic Unit)
para efetuar os clculos e muitas
memoriazinhas (denominadas Registos)
para guardar os dados, as instrues, os
endereos necessrio, etc. Tudo ligado
internamente e externamente por
buses, claro. Reparem no bus interno e
nos buses externos de dados e de
endereos.
Registos
Os registos so (muito) pequenas memrias situadas
dentro dos processadores.
Servem para guardar temporariamente coisas como
endereos de instrues, instrues, dados e
resultados.
Se no tivessem estas memrias, como poderiam os
processadores trabalhar? No podiam memorizar
nada
2 PARTE
DE 1971 AO PRESENTE
1971
Primeiro microprocessador
Intel 4004
108 Hz
2300 transstores
Bus de 4 bits
Memria mxima de 640 B
1974
Primeiro microprocessador usado no
primeiro computador pessoal
Intel 8080
2 KHz
6000 transstores
Bus de 8 bits
Memria mxima: 64 KB
1978
O primeiro processador da famlia x-86 que foi
at aos Intel Pentium 4 e AMD Athlon
Intel 8086
5 MHz
29000 transstores
Bus e registos de 16 bits
Memria mxima: 1 MB (bus de mem. de
20 bits)
1986
O primeiro processador a 32 bits - Intel
Architecture, 32-bit ou IA-32
Intel 80386
Entre 12 e 33 MHz
Duas verses: DX e SX
DX
Registos e bus de 32 bits
Memria mxima: 4 MB
SX
Registos de 32 bits, bus externo de 16 bits e de
memria de 24 bits
Memria mxima: 16 MB
1993
Intel Pentium
Sucessor do 486, por sua vez sucessor do 386
Foi um grande passo relativamente ao 486, com uma
performance bastante superior e solues muito mais
desenvolvidas a nvel da sua arquitetura que foram
depois aprimoradas nos modelos que se lhe
seguiram.
De 60 a 300 MHz
Verses P5, P54C, P54CS, P55C, Tilamook
Ainda deu origem aos Pentium Pro (1995), Pentium II,
Pentium III, Pentium 4 e Pentium D (2005)
2001
Primeiro processador da Intel de 64 bits
Itanium
Destinado a servidores de grande porte
Entre 733 e 1.73 MHz
1,2 ou 4 ncleos (o ltimo modelo saiu
em 2010)
2003
Primeiros processadores de 64 bits da AMD
Athlon 64 e Opteron
Arquitetura AMD64
32 e 64 bits
Arquitecturas de 32/64 bits designam as cujas
unidades tm registos, bus de endereos ou
bus de memria de 32/64 bits.
A capacidade dos registos fundamental. Os
P4, por exemplo, tm registos de 32 bits e bus
de dados de 64, mas isso no faz deles
processadores de 64 bits!
E a Intel?
A Intel j tinha apresentado em 2001 a linha Itanium, a
64 bits, destinada a servidores de grande porte. No foi
grande o sucesso, j que foi um projeto que j tinha sido
adiado vezes demais.
em 2005 que a Intel lana os primeiros processadores
a 64 bits para computadores pessoais, os P4 Prescott,
srie F.
Ainda 2003
Pentium 4 Extreme Edition
Primeiro microprocessador com cache L3
2005
Primeiro dual-core da Intel:
Pentium D
Dual-core = 2 ncleos
2006
Primeiro quad-core da Intel:
2007
Primeiro quad-core da AMD:
Athlon X4
2010
Primeiro hex-core da Intel:
Core i7 980X Extreme Edition
Intel - Desktop
Sandy
Bridge
Skylake
Nehalem
Broadwell
Haswell
Ivy Bridge
ark.intel.com
Intel - Mobile
ark.intel.com
Modelos e sufixos
http://www.intel.com/content/www/us/en/processors/processor-numbers.html
6 gerao (Skylake)
5 gerao (Broadwell)
AMD - Desktop
http://www.amd.com/us/products/desktop/processors/Pages/desktopprocessors.aspx
AMD - APU
http://www.amd.com/en-us/products/processors/desktop/a-series-apu
AMD - mobile
http://www.amd.com/en-us/products/processors/notebook-tablet
Modelos e sufixos
Srie FX (apenas Desktop, no incluem GPU)
N de
ncleos
Gerao
(3 a
mais
recente)
Modelo
(8350
melhor
que 8300)
cpuboss.com
anandtech.com
3 PARTE
32 e 64 bits
Ncleos
Frequncias
Intel Turbo Boost / AMD Turbo Core
Intel Speedstep/AMD Coolnquiet
Overclocking
GPU integrada
Cache interna
Pipeline(s) de instrues
FPU
Controlador de memria integrado
Processo de fabrico (Litography)
Execuo dinmica
MMX/SSE/AVX/3D Now!
Hyperthreading
Virtualizao
1. 32 e 64 bits
Os 64 bits comearam em 2003; atualmente, todos os
microprocessadores so a 64 bits.
Recordando, isso significa que estes processadores tm
registos (de dados e de endereos) de 64 bits.
32 e 64 bits
3. A frequncia do relgio do
processador
As operaes dentro dum (ncleo dum) processador so
executadas a um ritmo imposto por um relgio.
A frequncia desse relgio o resultado do produto dum
multiplicador por uma outra frequncia.
Essa outra frequncia tem-se alterado ao longo dos tempos.
Vamos l a ver
N de ncleos ativos
Consumo de corrente eltrica
Consumo de energia
Temperatura do CPU
6. Overclocking
Sandy
Bridge
Skylake
Nehalem
Broadwell
Haswell
Ivy Bridge
Transform
Triangle setup
Lighting
Clipping
anandtech.com
Processadores
Sempron APUs
Athlon APUs
Srie A
Tipos de sistemas
Modelos de exemplo
http://www.digitaltrends.com/computing/apu-gpu-wtf-a-guide-to-amdsdesktop-processor-line-up/
O Core i7 -5775C conta com o Iris Pro Graphics 6200, nome de cdigo
Broadwell GT3e. Este GPU possui litografia de14 nm e conta com 48
shaders para processamento dos grficos, operando em modestos 300
MHz. Destaca-se pela memria: alm de utilizar uma parcela da RAM do
sistema, operando com a tecnologia DDR3, esse processador possui uma
quantidade massiva de cache L4, com um total 128MB e tecnologia
eDRAM. (A embeded RAM, ou eDRAM, uma poro de memria no
mesmo substrato do processador, e o resultado que a CPU e a GPU
possuem um acesso muito rpido a essa memria.)
A APU A10 conta com um GPU integrado Radeon R7, nome de cdigo
Spectre, com litografia de 28 nm e com 512 shaders. O relgio da iGPU
de 720Mhz e as memrias tambm no so "prprias": ela pede
emprestada RAM, mais distante. O processador conta com 4MB de
cache L2 (nada de L3, muito menos L4).
Olha o
controlador
da eDRAM
aqui!
8. Memrias cache
As memrias cache so memrias que possuem parte do
contedo de uma outra memria maior e mais lenta,
permitindo assim o acesso mais rpido, por exemplo na
leitura, se l tiverem o que for necessrio.
RAM
Cache
CPU
Memrias cache
Encontramos caches em vrios stios. Os discos rgidos, por
exemplo, possuem caches
Nos 386
Motherboard
RAM
Cache
(256KB)
CPU
Nos 486
Cache situada dentro do CPU acesso
muito mais rpido
Motherboard
RAM
L1 abreviatura de Level 1
CPU
Cache L1
(8KB ou 16KB)
Nos Pentium
Motherboard
Cache L1
(8KB instrues)
RAM
CPU
Cache L1
(8KB - dados)
Nos Pentium II
Motherboard
Cache L1
(16KB instrues)
RAM
CPU
Cache L1
(16KB - dados)
Cache L2
(512KB)
Motherboard
Cache L2
(256KB)
RAM
CPU
Cache L1
(8KB + 8KB)
Motherboard
No so muitos os
processadores que possuem
cache L3.
Cache L2
(entre 512KB e
2MB)
RAM
Cache L3
(2MB)
CPU
Cache L1
(8KB + 8KB)
Ncleo 1
Motherboard
Cache L1
RAM
Cache L1
CPU
Cache L2
Resumindo
9. Pipelines de instrues
A ideia vem de decompor a execuo de
instrues em fases, entregando cada fase a uma
entidade diferente.
Suponhamos uma loja como a ToysRUs em
poca de Natal, quando h imensos clientes para
atender. Se for um mesmo funcionrio a ir ter
com o cliente, a interpretar o seu pedido, a ir
buscar o brinquedo ao armazm, a embrulh-lo e
a receber o dinheiro, a soluo bem menos
eficiente do que se houver um funcionrio
especializado em cada tarefa. Porque assim
Atende um
cliente
Interpreta o
pedido
Vai ao
armazm
Embrulha o
brinquedo
Recebe
pagamento
Cliente 1
Cliente 2
Cliente 1
Cliente 3
Cliente 2
Cliente 1
Cliente 4
Cliente 3
Cliente 2
Cliente 1
Cliente 5
Cliente 4
Cliente 3
Cliente 2
Cliente 1
Pipelines de instrues
Exemplo com 4 fases (os 486
usavam 5 fases, porque duas
eram para a descodificao)
1. Busca
2. Descodificao
3. Execuo
4. Escrita do resultado
Execuo superescalar
FPU
No formato mais comum (ANSI/IEEE Std. 754-1985), o maior e o
menor nmeros passveis de serem representados em vrgula
flutuante com 32 bits so bem maiores em valor absoluto do
que aqueles em vrgula fixa: por exemplo, o maior inteiro com
sinal representado com 32 bits tem um valor, como vimos, de
231 - 1 = 2147483647, enquanto que, tambm usando 32 bits e
as regras da norma IEEE 754, o valor mximo em vrgula
flutuante (2223) 2127 3.402823 1038.
FPU
H outras vantagens no uso de nmeros em vrgula
flutuante, nomeadamente ao nvel da preciso.
Bom, e muito software h sobretudo grfico - que
exige a presena duma unidade de clculo em vrgula
flutuante nos processadores.
O primeiro processador a incluir uma foi o 486; antes
dele, as pessoas tinham que comprar um
coprocessador aritmtico, que custava quase tanto
como o prprio processador.
FPU
A AMD foi a primeira a fazer isto, nos seus processadores Athlon 64. A Intel seguiua um pouco mais tarde.
A razo bvia: ligar o mais proximamente possvel dois componentes que
dialogam constantemente: CPU e RAM.
Em C:
Em Assembly:
cmp ax, bx
jl
axLess
mov
word [X], 1
jmp Both
axLess:
mov
word [X], -1
Both:
Speculative execution
Tenta adiantar-se executando instrues que nem
sabe se sero ou no necessrias, mas achando que
sim Os seus resultados ficam guardados para o caso
de virem a ser necessrios.
Dataflow analysislysis
Programa a execuo de instrues independentemente da
ordem pela qual surgem no cdigo do programa em execuo.
A ideia organizar a execuo das instrues da forma mais
eficiente, mesmo que no coincida com a ordem pela qual
esto escritas no cdigo.
SIMD
A designao entende-se bem com o exemplo
do preenchimento de uma forma. Mudar a cor
a 8 pixis de cada vez, em torno de 1 de cada
vez , claramente, mais rpido! E situaes
deste tipo ocorrem em cerca de 90% do
tempo que uma aplicao multimdia
executada.
AVX
Nos Sandybridge, surgem 256 novas
instrues, num pacote denominado AVX
(Advanced Vector Extensions).
3D Now!
A AMD criou a tecnologia 3DNow! Como alternativa
MMX e SSE, mas a falta de compatibilidade entre
ambas e o facto da Intel ter mais fora, fez com que a
AMD tambm tivesse que adoptar a SSE. No entanto,
vai sempre introduzindo umas variantes e at, dizem
eles, j vo na SSE5.
A 3D Now! foi descontinuada em 2010.
J dissemos antes que, por causa dos ciclos e dos Ifs, o cdigo dos
programas em Assembly tem muitos saltos
Em C:
Em Assembly:
cmp ax, bx
jl
mov
jmp
axLess:
mov
Both:
axLess
word [X], 1
Both
word [X], -1
Speculative execution
Tenta adiantar-se executando instrues que nem sabe se sero ou no
necessrias, mas achando que sim De qualquer forma, adianta trabalho.
Os seus resultados ficam guardados para o caso de virem a ser necessrios.
Dataflow analysis
SIMD
A designao entende-se bem com o exemplo
do preenchimento de uma forma: mudar a cor
a 8 pixis de cada vez, em torno de 1 de cada
vez , claramente, mais rpido! E situaes
deste tipo ocorrem em cerca de 90% do
tempo que uma aplicao multimdia
executada.
Em 1999, a Intel aumentou o pacote MMX, deu-lhe uma unidade parte s para
ele dentro do processador e deu-lhe o nome de SSE.
O SSE2 surgiu em 2000, o 3 em 2004 e o 4 em 2008 nalguns Core 2 e foi ainda
melhorada para os Core i7.
AVX
3D Now!
15. Hyperthreading
Processo:
Um processo uma instncia dum programa de computador juntamente com
as suas necessidades para ser executado. Dependentemente do Sistema
operativo, um processo pode ser dividido em mais do que uma thread e essas
threads podem ser executadas concorrencionalmente.
Thread:
Uma thread provm da diviso de um processo em bocadinhos,
bocadinhos esses que podem usar as mesmas variveis e o mesmo espao
de memria, o que no pode acontecer com processos diferentes.
Tarefa:
Conjunto de instrues de um programa carregadas para a memria.
Hyperthreading
Hyperthreading ou hiperprocessamento uma tecnologia
usada em processadores que o faz simular dois
processadores tornando o sistema mais rpido ao permitir a
execuo em simultneo de duas threads.
Esse processo todo rende um acrscimo de at 20%, em
mdia, na velocidade dos programas.
Processador single
threaded.
Um processador
multithreaded. Ele simula
um processador com dois
ncleos, embora s tenha
um!
Nos primeiros Pentium 4
com HT, isso fazia com que
surgissem dois CPU no ecr
do POST e isso deixava
muitas pessoas confusas!
16. Virtualizao
Virtualizao em servidores
O uso de software de virtualizao em servidores,
com diferentes sistemas operativos num nico
computador fsico pode significar uma grande
poupana de dinheiro face opo por diferentes
computadores, cada um com o seu sistema
operativo.
A AMD (com a AMD-V) e a Intel (com a VT-X) do
suporte, por parte dos processadores, a esta soluo,
melhorando o desempenho e aumentando a
segurana.
Textos explicativos
32 e 64 bits
Frequncias
Intel Turbo Boost / AMD Turbo Core
Intel Speedstep/AMD Coolnquiet
Cache interna
Pipeline(s) de instrues
FPU
Controlador de memria integrado
Processo de fabrico (Litography)
MMX/SSE/AVX/3D Now!
Hyperthreading
Virtualizao
Textos do website
http://www.hardware.com.br/
que explicam um pouco melhor
vrios dos tpicos aqui tratados.