P. 1
cap07 - Processadores modernos

cap07 - Processadores modernos

4.5

|Views: 3.170|Likes:
Publicado porapi-3711983

More info:

Published by: api-3711983 on Oct 15, 2008
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

03/18/2014

pdf

text

original

Capítulo Processadores modernos

7

É um pouco difícil definir o que é um processador “moderno”. O que é moderno hoje pode ser obsoleto dentro de dois anos, e ser descontinuado (ou seja, deixar de ser fabricado) dentro de três ou quatro anos. Seja como for, dedicamos este capítulo aos modelos comuns no ano 2001, e que certamente continuarão em produção por mais alguns anos:       Intel Pentium III Intel Pentium 4 Intel Xeon AMD Duron AMD Athlon Cyrix III

Nomes confusos

Antigamente os processadores tinham nomes bastante simples. Todo mundo sabia que depois do 80286, o próximo processador a ser lançado seria o 80386, depois o 486, e assim por diante. Depois que a Intel perdeu uma briga judicial para a Cyrix a respeito da “marca registrada” 486, os processadores passaram a ter nomes ao invés de números. O P5 era o nome provisório do Pentium, enquanto P6 foi usado provisoriamente pelo Pentium Pro. O Pentium MMX era chamado de Klamath durante seu período de desenvolvimento. Hoje tanto a Intel como a AMD e a Cyrix utilizam esta estragégia de marketing. Usam nomes provisórios para seus processadores, para aplicarem o nome definitivo apenas na ocasião do seu lançamento. O

7-2

Hardware Total

Pentium 4, por exemplo, passou um bom tempo sendo chamado de Willamate, o Itanium foi chamado antes de Merced, e assim por diante. Mesmo após o lançamento, um processador pode passar a ter nome e sobrenome. Por exemplo, os primeiros processadores Pentium III eram de classe Katmai, bastante similares ao Pentium II. Mais tarde foi criado o Pentium III Coppermine, com vários melhoramentos, e finalmente o Pentium III Tualatin. Com processadores sendo lançados em novas versões quase mensais, o use desses “apelidos” ajuda a chamar atenção. Por incrível que pareça, para um técnico ou especialista em hardware também é importante conhecer a maioria dessas classificações.

Pentium III
O Pentium III foi lançado em 1999, inicialmente como um melhoramento do Pentium II. Utilizava o encapsulamento em forma de cartucho chamado SECC2 (Single Edge Contact Cartridge 2), uma versão derivada do SECC, usado pelo Pentium II. Também foram produzidas versões com encapsulamento SECC, idêntico ao do Pentium II. Outro ponto idêntico é o conector da placa de CPU, o conhecido Slot 1, também chamado de SC242.
Figura 7.1
Pentium III com encapsulamento SECC2.

Os primeiros processadores Pentium III utilizavam o núcleo Katmai, semelhante ao do Pentium II, porém com pequenas diferenças, como as novas instruções SSE (Streamed SIMD Extensions), voltadas para processamento 3D e multimídia.

Capítulo 7 – Processadores modernos *** 35% *** Figura 7.2
Pentium III com encapsulamento FC-PGA.

7-3

O novo núcleo Coppermine foi introduzido em meados do ano 2000. Além de utilizar a tecnologia de 0,18 , o Coppermine traz a nova cache L2 integrada ao núcleo. Esta nova versão do Pentium III passou a ser produzida no tradicional encapsulamento SECC2 e também no novo FC-PGA (Flip Chip Pin Grid Array). Já em meados de 2001 a Intel lançou o Pentium III Tualatin. Sua principal característica é a tecnologia de 0,13 , resultando em menor custo de produção e menor dissipação de calor. Foi introduzido com este modelo, o encapsulamento FC-PGA2, e passaram a ser oferecidas versões com 256 kB e com 512 kB de cache L2 integrada ao núcleo.
O Pentium III Katmai

Apesar de já ter sido substituído por versões mais novas (Coppermine e Tualatin), é importante estudar o Pentium III Katmai, já que suas características básicas foram mantidas nas novas versões. Em 1999 a Intel lançou a primeira versão do Pentium III construído com o núcleo Katmai, o mesmo do Pentium II, acrescentando algumas alterações importantes:  Maiores clocks que o Pentium II

7-4

Hardware Total

   

Novas instruções para multimídia e 3D (SSE) Identificação do processador através de número de série Pequena alteração no encapsulamento, que passou a ser SECC2 Clock externo de 100 MHz, e posteriormente de 133 MHz

Processador Pentium III Katmai

Lançamento 1999 Transistores 9.500.000 Tecnologia 0,25  Encapsulamento SECC ou SECC2 Barramento de dados 64 bits Barramento de endereços 36 bits Capacidade de memória 64 GB Clock interno 450 a 600 MHz Clock externo 100 ou 133 MHz Consumo 26 a 36W Cache L1 32 kB Cache L2 512 kB, “half speed” Novos recursos: Instruções SSE, número de série, encapsulamento SECC2 ou SECC.

A mais relevante alteração foi a introdução das novas instruções SSE (Streaming SIMD Extensions). São instruções especializadas em operações comuns em aplicações de áudio, vídeo e geração de imagens tridimensionais. Sem essas instruções, o processador teria que utilizar combinações de outras instruções clássicas para realizar o mesmo trabalho. Essas instruções são SIMD (Single Instruction, Multiple Data – instrução única para múltiplos dados) e facilitam os processamentos citados, pois envolvem a aplicação de cálculos fixos a grandes seqüências de dados. Essas instruções tem portanto o objetivo de aumentar a velocidade de processamento de aplicações de multimídia a geração de imagens 3D, apesar de também servir como resposta à tecnologia 3D Now da AMD, utilizada a partir do processador K62, desde 1998. A inclusão de um número de série em cada processador Pentium III foi uma questão polêmica, tanto assim que ele foi eliminado no Pentium 4. Quando habilitado pelo usuário, este recurso permite ao processador informar um número único quer o identifica entre todos os demais processadores. Com ele tornam-se mais seguras as transações comerciais pela Internet, e torna mais simples e confiável a identificação de um determinado PC dentro de uma rede. Muitos usuários reclamamaram sobre outra questão, que é a privacidade. Como cada processador tem seu próprio número, o usuário

Capítulo 7 – Processadores modernos

7-5

pode deixar um “rastro” nos sites percorridos ao acessar a Internet (é claro, se este recurso estiver habilitado, e se o computador do usuário estiver carregado com software próprio para prestar esta informação). A outra preocupação é que o uso desta identificação se tornar padrão, os fabricantes de software poderão vincular o número de série do processador ao número de série dos seus softwares. Desta forma seria fácil detectar ou impedir o uso de cópias ilegais de software, um golpe mortal sobre a pirataria. A Intel oferece um software que permite ao usuário desabilitar o número de série. Na verdade o número não é apagado, apenas o processador é impedido de informá-lo. A desabilitação só tem efeito depois que é executado um novo RESET. Da mesma forma, para habilitá-lo é preciso executar um RESET para que volte a ser usado. Os BIOS de placas de CPU para este processador também permitem desativar o número de série, através do CMOS Setup. Note que a cache L2 do Pentium III Katmai não é integrada ao seu núcleo, ou seja, é formada por chips discretos adicionais (“discretos”, significa que tratam-se de componentes independentes do processador). Possui 512 kB e opera com a metade da freqüência do processador, a exemplo do que ocorria com o Pentium II. Foi notável no ano de 98 a expansão da AMD com o seu processador K6-2. Esses processadores possuem dois conjuntos de instruções que se juntam às instruções do Pentium original: MMX (Multimedia Extensions, idênticas às da Intel) e 3D Now!, especializadas no processamento de imagens 3D (esta tecnologia foi mantida nos processadores mais novos da AMD, como o Athlon e o Duron). Tanto o Pentium MMX, o Celeron e o Pentium II possuem as instruções MMX, mas nada semelhante às instruções 3D Now! da AMD. As novas instruções introduzidas pela Intel rivalizam com a tecnologia 3D Now!. Passamos a ter a Intel com as tecnologias MMX e SSE (também chamada de MMX2), e a AMD com as tecnologias MMX e 3D Now!. Para que os diversos programas já disponíveis façam uso do 3D Now é preciso que seja instalado o pacote DirectX 6.0 ou superior. Para usar as novas instruções SSE do Pentium III é necessário instalar o DirectX 6.1 ou superior. O DirectX pode ser obtido em http://www.microsoft.com/directx. Periodicamente a Microsoft libera novas versões do DirectX. No Windows ME, por exemplo, era fornacido o DirectX 7.1. Poucos meses depois estava liberada a versão 8.0. Novas versões do DirectX visam dar suporte à utilização dos recursos encontrados nos novos processadores.

7-6

Hardware Total

Muitas placas de CPU para Pentium II podem ser usadas para instalar um Pentium III, desde que o barramento externo seja de 100 MHz. Placas para Pentium II mais antigas operavam com apenas 66 MHz (ex: chipset i440LX), e desta forma não aproveitavam todo o potencial do Pentium III. Logo a seguir, pequenas modificações de hardware e de BIOS foram feitas nas placas para Pentium II disponíveis na época, visando não apenas dar suporte ao Pentium III, mas aproveitar todo o seu potencial. Também deve ser tomado cuidado com a questão do cooler. Existem coolers que são próprios para o Pentium II, e outros que são próprios para o Pentium III. O Pentium II possui na sua parte posterior uma chapa metálica para acoplar o ventilador e facilitar a dissipação de calor. O seu encapsulamento é conhecido como SECC. O Pentium III usa o SECC2 (apesar de existirem versões com o SECC, igual ao do Pentium II), que não possui esta chapa metálica, ficando exposta a placa onde está o processador e a cache L2. Conjuntos de ventilador/dissipador para o Pentium III SECC2 deverão conter a chapa metálica apropriada.
Figura 7.3
Cartuchos SECC e SECC2, vistas frontais e traseiras.

O núcleo Katmai era construído com a tecnologia de 0,25 e era alimentado por uma tensão de 2 volts. Inicialmente foram lançadas versões de 450 e 500 MHz, ambas com clocks externos de 100 MHz. Posteriormente foram lançadas as versões de 550 e 600 MHz (clock externo de 100 MHz), e finalmente as de 533 e 600 MHz com clocks externos de 133 MHz. Para não fazer confusão com versões com clock externo de 100 MHz, passou a ser usado um sufixo “B”. Por exemplo, o Pentium III/600 tem clock externo de 100 MHz, enquanto o Pentium III/600B opera com clock externo de 133 MHz. Todos os modelos Katmai têm encapsulamento SECC ou SECC2 e possuem cache L2 no cartucho, com 512 kB e operando com a metade da freqüência do núcleo do processador. Modelo Clock interno e externo Multiplicador Potência

Capítulo 7 – Processadores modernos

7-7

Pentium Pentium Pentium Pentium Pentium Pentium

III/450 III/500 III/533B III/550 III/600 III/600B

450 MHz / 100 MHz 500 MHz / 100 MHz 533 MHz / 133 MHz 550 MHz / 100 MHz 600 MHz / 100 MHz 600 MHz / 133 MHz

4,5x 5x 4x 5,5x 6x 4,5x

26,6 W 29,3 W 31,1 W 32,2 W 36,1 W 36,1 W

Avanços da miniaturização
Sem dúvida um dos fatores que contribuiu (como sempre contribui) para a evolução do Pentium III foi a redução no tamanho dos minúsculos transistores que os formam. Ao ser lançado em 1997, o Pentium II usava a tecnologia de 0,35 mícron (ou seja, cada minúsculo transistor media 0,35 milésimos de milímetro). Já o Pentium II de 333 MHz introduziu a tecnologia de 0,25 mícron. Os atuais modelos utilizam a tecnologia mais recente, 0,18 mícron. A partir de meados de 2001, começou o uso da tecnologia de 0,13 mícron. Ao utilizar transistores menores é possível produzir processadores com clocks mais elevados e com menos aquecimento. Sem dúvida a elevada dissipação de calor é o maior obstáculo para atingir clocks elevados. Portanto ao reduzir o aquecimento, os fabricantes de processadores podem lançar modelos com clocks mais elevados, ainda mantendo níveis de aquecimento aceitáveis. Outra vantagem das tecnologias de transistores menores é a redução no tamanho do chip. Ao ocupar menos espaço, torna-se possível acrescentar mais circuitos, ou seja, mais recursos. Desta forma foi possível acrescentar aos processadores, instruções MMX, instruções SSE e integrar a cache L2 ao núcleo do processador. Finalmente temos a vantagem da redução dos preços. Preços de processadores são em parte definidos por questões comerciais, mas também em parte por questões técnicas. Ao reduzir o tamanho de um chip, é possível produzir um número maior deles em cada lote. Isto resulta em redução do custo de produção que pode ser repassada ao usuário final.

7-8

Hardware Total Figura 7.4
Base de silício onde são construídos os chips.

A figura 4 mostra a base de silício (waffer) na qual são produzidos os chips. Esta base tem 20 ou 30 cm de diâmetro, dependendo do equipamento usado na produção. Os pequenos quadrados estampados na base (mostrados em detalhe à direita) são os processadores. Quanto menor é o tamanho dos transistores, maior é o número de processadores que podem ser construídos em cada waffer, e desta forma, menor poderá ser o custo unitário. A adoção de tecnologias de produção com transistores menores permite lançar novas versões de processadores mais rápidos, com menor dissipação de calor e menor custo. Outro melhoramento importante foi o aumento do clock externo, permitindo o uso de memórias mais rápidas. Desde o lançamento do Pentium, a comunicação entre o processador e o seu exterior (o que inclui a memória RAM) era feita com o clock de 66 MHz, ou seja, permitia realizar teoricamente até 66 milhões de acessos à memória por segundo. Em 1998 o barramento do Pentium II passou a operar com até 100 MHz, possibilitando o uso das memórias classificadas como PC100. Em 1999 chegaram ao mercado modelos do Pentium III com clock externo de 133 MHz (ainda com o núcleo Katmai – Pentium III/533B e Pentium III/600B), permitindo assim o uso de memórias PC133. Se o clock externo do processador não tivesse aumentado, boa parte dos ganhos de desempenho seria colocada a perder. As versões de 233 a 333 MHz do Pentium II funcionavam com clock externo fixo em 66 MHz. Quanto mais elevado era o seu clock interno, mais difícil era obter desempenho mais elevado. Compare a relação entre clock interno e externo para esses processadores:

Capítulo 7 – Processadores modernos

7-9

Processador Pentium II/233 Pentium II/266 Pentium II/300 Pentium II/333

Clock interno 233 MHz 266 MHz 300 MHz 333 MHz

Clock externo 66 MHz 66 MHz 66 MHz 66 MHz

Multiplicador 3.5x 4x 4.5x 5x

Comparando os multiplicadores 3.5x e 5x do Pentium II/233 e do Pentium II/333, respectivamente, podemos afirmar que a capacidade do Pentium II/333 em buscar dados e instruções na memória manteve-se fixa (ou seja, aumentou 0%), enquanto a capacidade de processamento aumentou em 42%. Sendo assim, o aumento global no desempenho do processador não foi de 42%, fixou-se em um índice menor. Medidas de desempenho feitas com programas especializados mostraram que o desempenho do Pentium II/333 é apenas 35% maior que o do Pentium II/233, e não 42% como seria se o clock interno fosse o único determinante da velocidade de um processador. Isto mostra que para aproveitar integralmente o aumento do clock interno, é preciso melhorar o desempenho dos acessos à memória. Esta situação foi melhorada com o lançamento de novos modelos do Pentium II e posteriormente do Pentium III, com clock externo de 100 MHz, valor 50% maior que 66 MHz. As primeiras versões do Pentium II a usarem o novo clock externo de 100 MHz foram as de 350 e 400 MHz. Comparando o Pentium II/350 com o Pentium II/233, temos aumentos de 50% tanto no clock interno como no externo. Como resultado de ambos os clocks terem aumentado em 50%, o desempenho do Pentium II/350 é também 50% maior que o do Pentium II/233. Novos modelos do Pentium II, que deu lugar ao Pentium III, foram lançados com clocks mais elevados. Em agosto/1999 tínhamos o Pentium III/600, ainda operando com o clock externo de 100 MHz. Usando o multiplicador 6x, o barramento de 100 MHz deste processador já era considerado lento em relação aos 600 MHz que usava internamente. Para melhorar a situação, foram lançadas em setembro/1999 (ainda com o núcleo Katmai) as primeiras versões do Pentium III com barramento externo de 133 MHz. Com 600 MHz internos e 133 MHz externos, o multiplicador usado é 4.5x, menos ruim que o 6x usado na versão anterior. Por mais que se procure desenvolver memórias mais rápidas, um problema sempre ocorre na evolução dos processadores: a velocidade das memórias não acompanha a mesma evolução que a velocidade dos processadores. No primeiro Pentium lançado, tanto o clock interno como o externo eram de 66

7-10

Hardware Total

MHz, portanto o multiplicador era 1x. Nos modelos mais recentes do Pentium III são usados multiplicadores elevados como 6x e superiores. No Pentium III de 1000 MHz (barramento externo de 133 MHz), o multiplicador é 7.5x. Isto significa que a velocidade do processador evoluiu 7.5 vezes mais que a velocidade das memórias. Felizmente a Intel e outros fabricantes de processadores utilizaram uma forma de melhorar este quadro: utilizar uma memória cache L2 mais rápida, operando com a mesma freqüência do núcleo do processador. Esta é uma das principais características do Pentium III Coppermine.

Pentium III Coppermine
A criação desta nova versão do Pentium III foi possível graças ao desenvolvimento da tecnologia de fabricação com 0,18. Com transistores menores, tornou-se possível embutir a cache L2 no próprio núcleo do processador. O Celeron foi o primeiro processador a utilizar este recurso, com sua cache L2 de 128 kB operando na mesma freqüência do núcleo. O Pentium III Coppermine tem cache L2 embutida (on-die) e também operando na mesma freqüência do núcleo (full speed). Em outras palavras, em um Pentium III Coppermine de 600 MHz, a cache L2 opera com 600 MHz, enquanto nas versões Katmai de 600 MHz, a cache L2 operava com apenas 300 MHz. Processador Pentium III Coppermine
Lançamento 1999 Transistores 28.000.000 Tecnologia 0,18  Encapsulamento SECC, SECC2 e FC-PGA Barramento de dados 64 bits Barramento de endereços 36 bits Capacidade de memória 64 GB Clock interno 500 a 1.133 MHz Clock externo 100 ou 133 MHz Consumo 16 a 36 W Cache L1 32 kB Cache L2 256 kB (on-die, full speed) Novos recursos: Além dos já presentes no modelo Katmai, este modelo tem a nova cache L2 on die, com 256 kB, tecnologia de 0,18 e menor consumo de energia. Passou a ser produzido também no encapsulamento FC-PGA.

A versão Coppermine do Pentium III incorpora um grande melhoramento na cache L2. A Intel chama a tecnologia de Advanced Transfer Cache. Com

Capítulo 7 – Processadores modernos

7-11

a adoção do processo de fabricação com 0,18 mícron no lugar de 0,25 mícron, tornou-se possível incorporar a cache L2 ao próprio núcleo do processador, ao invés de utilizar chips SRAM independentes. Apesar de ter agora apenas 256 kB, a cache L2 do Pentium III é acessada com a mesma velocidade do núcleo, e não mais com a metade deste valor. Em um Pentium III /600E, o clock de acesso à cache L2 é de 600 MHz, e não de 300 MHz como no Pentium III/600. De certa forma, dobrar a velocidade de acesso à cache L2 compensa com vantagem a sua redução em tamanho pela metade. Melhor ainda, a transferência de dados entre a cache L2 e o núcleo do processador não é feito mais em grupos de 64 bits, e sim em grupos de 256 bits, ou seja, 4 vezes mais rápido. Comparando de forma simplificada, a cache L2 do Pentium III Coppermine tem tamanho duas vezes menor, mas sua taxa de transferência de dados para o processador é 8 vezes maior. O Pentium III/600 foi o último a ser produzido com a cache L2 “tradicional”, com 512 kB (núcleo Katmai), formada por chips SRAM e acesso em 64 bits. Todas as novas versões do Pentium III, de 600 MHz em diante, além das versões 550E, 533EB e 500E apresentam cache L2 na nova arquitetura. A tabela que se segue compara as caches L2 utilizadas nos últimos anos.
Processador
Pentium MMX

Tamanho da cache L2
512 kB

Tipo de cache L2
Chips SRAM na placa de CPU Chips SRAM no cartucho Integrado ao núcleo

Número Clock da de bits cache L2
64 64 256 66 MHz Metade do clock do núcleo Clock igual ao do núcleo

Pentium II e III 512 kB original (Katmai) Pentium IIIE 256 kB (Coppermine)

Você pode encontrar no Pentium III Coppermine, sufixos como B, E e EB. Os sufixos são usados apenas quando necessários, para diferenciar entre modelos diferentes, porém de mesmo clock. O sufixo “E” indica que o Pentium III é um modelo construído com tecnologia de 0,18 mícron e com Advanced Transfer Cache de 256 kB (núcleo Coppermine). Da mesma forma, o sufixo B indica o clock externo de 133 MHz (pode ser núcleo Katmai ou Coppermine). Entretanto a ausência desses sufixos não indica a ausência desses recursos. Eles são usados pela Intel apenas para diferenciar entre modelos que possuem e que não possuem esses recursos. Por exemplo, o Pentium III de 700 MHz não possui versões com clock externo de 133 MHz, nem versões com cache L2 de 512 kB operando com a metade do clock do núcleo, por isso não utiliza sufixos. Já o Pentium III de 600 MHz possui 4 versões: 600, 600E, 600B e 600EB.

7-12

Hardware Total Figura 7.5
Versões do Pentium III Katmai e Coppermine com encapsulamento de cartucho.

A figura 5 mostra uma tabela com os modelos de Pentium III com encapsulamento de cartucho (SECC e SECC2), ou seja, para placas de CPU equipadas com o Slot 1. Para cada um deles é indicado o clock interno, o clock externo, o tamanho e o tipo de cache. Note que existem versões Katmai, com cache L2 de 512 kB formada por chips SRAM, e versões Coppermine, com cache L2 de 256 kB integrada ao núcleo. Existem versões com barramentos de 100 e 133 MHz. Quando dois modelos têm o mesmo clock interno mas são produzidos com clocks externos diferentes (100 e 133 MHz), o sufixo “B” é usado para indicar a versão de 133 MHz.
Figura 7.6
Versões do Pentium III Coppermine com encapsulamento FC-PGA.

Capítulo 7 – Processadores modernos

7-13

A figura 6 mostra uma tabela com as versões do Pentium III com encapsulamento FC-PGA, ou seja, próprios para placas de CPU equipadas com o Soquete 370, até 1 GHz. Todos eles apresentam o núcleo Coppermine, mas encontramos versões com clocks externos de 100 e de 133 MHz. O sufixo B é usado para diferenciar a versão de 133 MHz, quando existem um modelo de mesmo clock interno e com o clock externo de 100 MHz. Note que neste livro damos prioridade à apresentação dos processadores e demais dispositivos para uso em PCs tipo desktop, ou seja, aqueles que são montados a partir de gabinetes, fontes, placas, etc. Lembre-se entretanto que também existem os modelos para uso em PCs portáteis (notebooks). Todos os processadores de todos os fabricantes, sejam eles novos ou antigos, são oferecidos também nas versões mobile ou portable, para uso em PCs portáteis. Esses processadores são similares aos usados em PCs desktop, exceto por algumas pequenas diferenças:    Menor voltagem e menor consumo de energia Geralmente são soldados, e não encaixados Usam encapsulamentos menores

Quanto aos clocks e demais características, são normalmente idênticas às dos processadores de uso geral. A figura 7 mostra um processador Pentium III (frente e verso) para uso em PCs portáteis. Este modelo utiliza o encapsulamento BGA (Ball Grid Array). Ao invés de ter pinos que se encaixam no soquete (PGA = Pin Grid Array), possui minúsculas esferas de solda. Isto torna mais simples e eficiente a sua fixação na placa de circuito. A soldagem é sempre melhor que o encaixe, do ponto de vista de contato elétrico. Como em notebooks normalmente não são oferecidas opções de upgrade por troca de processador, é vantajoso soldá-los definitivamente.

7-14 *** 35% *** Figura 7.7

Hardware Total

Pentium III com encapsulamento BGA.

Pentium III Tualatin
O ano de 2001 marcou o início da transição da tecnologia de 0,18 para 0,13. Como sempre ocorre com as reduções de tamanho, esta permitiu reduzir ainda mais a energia dissipada pelos novos processadores, o que era absolutamente necessário para que o Pentium 4, o Xeon e o Itanium operassem com temperaturas e níveis de dissipação aceitáveis. Entretanto, antes de utilizar a nova tecnologia de 0,13 nesses processadores, a Intel a empregou na nova versão do Pentium III, o Tualatin. Esta nova tecnologia veio a resolver problemas encontrados no Pentium III Coppermine ao operar com clocks superiores a 1 GHz. Ao atingir a marca de 1.13 GHz, aquela versão apresentou problemas de travamento que resultaram em um recall, ou seja, as unidades já vendidas foram recolhidas dos usuários. Apenas a versão de cartucho (SECC2) continuou sendo oferecida com os clocks máximos de 1 GHz e 1.13 GHz. A versão de encapsulamento FC-PGA passou a ser oferecida com clock máximo de 1 GHz. Isto ocorreu em meados de 2000, e a Intel passou cerca de um ano sem lançar versões mais velozes do Pentium III. Durante este período a Intel preferiu concentrar seus esforços em lançar o Pentium 4 e novas versões do Celeron. Processador Pentium III Tualatin
Lançamento Transistores Tecnologia Encapsulamento 2001 28.000.000 0,13  FC-PGA2

Capítulo 7 – Processadores modernos Barramento de dados 64 bits Barramento de endereços 36 bits Capacidade de memória 64 GB Clock interno 1.13 GHz e superiores Clock externo 133 MHz Consumo A partir de 29 W Cache L1 32 kB Cache L2 256 kB ou 512 kB Novos recursos: Similar ao Pentium III Coppermine, porém com menor dissipação de calor, clocks superiores e opções com 256 kB e 512 kB de cache. Voltagem externa de 2,5 volts.

7-15

Provavelmente o Pentium III Tualatin será o novo modelo a ser usado nos PCs mais simples, enquanto o Celeron será descontinuado. O Pentium 4 e o Xeon serão oferecidos para os PCs de alto desempenho, enquanto o Itanium será usado nas futuras máquinas de 64 bits. Uma curiosa novidade do Pentium III Tualatin é a voltagem externa, que passa a ser de 2,5 volts. Durante vários anos os processadores têm operado com voltagem externa de 3,3 volts, enquanto a voltagem interna se tornava cada vez menor. Enquanto isso, processadores para notebooks já utilizavam tensões menores. A partir de então a tensão de 2,5 volts se tornará padrão para chipsets, memórias e processadores. Um Pentium III Tualatin não pode ser instalado em uma placa de CPU para Pentium III Coppermine, já que nesses modelos a tensão externa é de 3,3 volts, e não 2,5 volts. Novas placas de CPU para Pentium III passarão a operar tanto com 3,3 como com 2,5 volts.
Figura 7.8
Pentium III Tualatin, com encapsulamento FC-PGA2.

7-16

Hardware Total

O novo Pentium III utiliza o encapsulamento FC-PGA2, uma variante do FCPGA. A diferença está no dissipador de calor localizado na sua parte superior. Além de facilitar a dissipação, este dissipador também dá maior rigidez mecânica ao processador, protegendo o seu núcleo de choques mecânicos e outros acidentes.
Figura 7.9
Visões laterais dos encapsulamentos FC-PGA e FCPGA2.

Figura 7.10
Primeiras versões do PIII Tualatin.

Pentium III Xeon
A diferença entre um Pentium III Xeon e um Pentium III comum é a mesma entre um Pentium II Xeon e um Pentium II comum. Entretanto, assim como o Pentium III sofreu várias evoluções desde o seu lançamento, principalmente na cache L2, o mesmo ocorreu também com o Pentium III Xeon.

Capítulo 7 – Processadores modernos Figura 7.11
Pentium III Xeon.

7-17

Assim como as primeiras versões do discreta (não embutida no núcleo), versões do Pentium III Xeon, sendo podia ter 512 kB, 1 MB ou 2 MB, e núcleo. Confira na tabela abaixo as Pentium III Xeon.
Lançament o Mar/99 Out/99 Mai/2000 Mai/2000 Mar/2001 Clocks (MHz) 500, 550 600 a 866 700 933, 1000 900 Núcleo

Pentium III utilizavam uma cache L2 o mesmo ocorria com as primeiras que esta cache L2, também discreta, operava com a mesma freqüência do diferenças entre as várias versões do
Cache L2 512k, 1 MB, 2 MB discreta 256 kB, integrada 1 MB, 2 MB integrada 256 kB, integrada 2 MB, integrada

Katmai / 0,25 Coppermine / 0,18 Coppermine / 0,18 Coppermine / 0,18 Coppermine / 0,18

Todas as versões do Pentium III Xeon possuem encapsulamento SEC, como o mostrado na figura 11. Nas suas primeiras versões, operando a 500 e 550 MHz, utilizava o conector SC330, o mesmo do Pentium II Xeon. Posteriormente passou a utilizar o conector SC330.1, uma nova versão com pequenas modificações, como a capacidade de operar com barramento externo de 133 MHz, em contraste com os 100 MHz permitidos pela versão original. O Pentium III Xeon também foi criado para uso em servidores. A maioria das placas de CPU para o Pentium III Xeon possuem slots para a instalação de 2 processadores. Até 4 processadores podem operar em conjunto na

7-18

Hardware Total

mesma placa, apesar deste tipo de placa de CPU ser bastante raro. A figura 12 mostra uma placa deste tipo, produzida pela SuperMicro. Além dos 6 slots PCI de 64 bits e do slot AGP Pro, podemos observar na sua parte direita, os 4 slots para a instalação dos processadores.
*** 75% *** Figura 7.12
Uma placa de CPU para 4 processadores Pentium III Xeon.

Note que a capacidade de operar com múltiplos processadores não é exclusividade dos modelos Xeon. Realmente a maioria das placas para servidores de alto desempenho possuem 2 ou 4 soquetes para esses processadores (SC330 ou SC330.1), mas também podemos encontrar essas placas para Pentium III. O Pentium III pode operar em grupos de até 2 processadores, e portanto pode ser usado em servidores de menor custo. A figura 13 por exemplo mostra uma placa de CPU, também produzida pela SuperMicro, com soquetes para a instalação de até 2 processadores Pentium III. Possui ainda um slot AGP Pro e 6 slots PCI de 64 bits, além de outros dispositovos encontrados nas placas de CPU convencionais.

Capítulo 7 – Processadores modernos Figura 7.13

7-19
Uma placa de CPU com suporte para dois processadores Pentium III.

Apesar de ser possível produzir PCs avançados com 2 processadores Pentium III, o uso do Pentium III Xeon é vantajoso, já que oferece caches L2 maiores e permite utilizar 4 processadores em conjunto. A tabela abaixo mostra os clocks interno e externo, os multiplicadores e a potência total dissipada por cada modelo do Pentium III Xeon. Os modelos indicados com “/K” usam o núcleo Katmai e usam cache L2 discreta. Os modelos indicados com “/C” usam o núcleo Coppermine e têm cache L2 integrada. Em ambos os casos, a cache L2 opera com a mesma freqüência do núcleo.
Modelo e cache L2 500/K + 512k 500/K + 1 MB 500/K + 2 MB 550/K + 512k 550/K + 1 MB 550/K + 2 MB 600/C + 256k 667/C + 256k 733/C + 256k 800/C + 256k Clock interno e externo 500 MHz / 100 MHz 500 MHz / 100 MHz 500 MHz / 100 MHz 550 MHz / 100 MHz 550 MHz / 100 MHz 550 MHz / 100 MHz 600 MHz / 133 MHz 667 MHz / 133 MHz 733 MHz / 133 MHz 800 MHz / 133 MHz Multiplicador 5x 5x 5x 5,5x 5,5x 5,5x 4,5x 5x 5,5x 6x Potência 40 W 47 W 39,6 W 37,8 W 37,8 W 43,2 W 21,6 W 23,9 W 26,2 W 28,5 W

7-20 866/C + 256k 933/C + 256k 1000/C + 256k 700/C + 1 MB 700/C + 2 MB 900/C + 2 MB 866 MHz / 133 MHz 933 MHz / 133 MHz 1000 MHz / 133 MHz 700 MHz / 100 MHz 700 MHz / 100 MHz 900 MHz / 100 MHz 6,5x 7x 7,5x 7x 7x 9x

Hardware Total 30,8 W 33,2 W 34,6 W 33,2 W 33,2 W 40,8 W

Pentium 4
No final do ano 2000 a Intel lançou o processador Pentium 4. Este processador inaugurou finalmente uma nova família de chips Intel de alto desempenho. A família anterior, formada pelos processadores Pentium Pro, Pentium II, Pentium III e Celeron, era baseada na microarquitetura P6. Cada um deles não era na verdade um projeto novo, mas um melhoramento do projeto anterior.
Figura 7.14
Processador Pentium 4.

Processador Pentium 4
Lançamento Transistores Tecnologia Encapsulamento Barramento de dados Barramento de endereços Capacidade de memória Clock interno Clock externo Consumo Cache L1 Cache L2 2000 42.000,000 0,18  e 0,13  PGA423 64 bits 36 bits 64 GB A partir de 1300 MHz 400 MHz 54 W na versão inicial 8 kB + 12 k micro-ops 256 kB

Capítulo 7 – Processadores modernos Novos recursos: Arquitetura NetBurst, barramento externo de 400 MHz, cache L1 mais eficiente, novo encapsulamento, instruções SSE2. Requer gabinete a fonte (ATX12V) apropriadas.

7-21

O Pentium 4 deverá substituir o Pentium III (assim como o Pentium III substituiu o Pentium II, como o Pentium II substituiu o Pentium MMX, como o Pentium substituiu o 486, etc.). Um Pentium 4 de 1.5 GHz tem velocidade de processamento quase duas vezes maior que a de um Pentium III/800. O Pentium 4 foi lançado inicialmente nas versões de 1.4 e 1.5 GHz, e logo surgiram versões mais rápidas, com 1.3, 1.6, 1.7 e 1.8 GHz. Tecnicamente, o Pentium 4 é um marco importante. O Pentium II e o Pentium III eram basicamente melhoramentos do Pentium Pro, lançado em 1995, todos com a microarquitetura conhecida como P6. O Pentium 4 é um projeto novo, utiliza uma nova arquitetura chamada de NetBurst. É um projeto que começou do zero, e não uma sucessão de melhoramentos feitos em uma arquitetura já existente. São os seguintes os principais melhoramentos desta arquitetura: * Barramento externo de 400 MHz, contra 133 MHz do Pentium III * Cache L1 mais eficiente * Unidade lógica e aritmética com o dobro da freqüência do processador * 20 estágios pipeline, contra apenas 10 do Pentium III * 144 novas instruções para processamento de sons, imagens e gráficos 3D Um PC baseado no Pentium 4 tem algumas características diferentes. Os gabinetes precisam ter furos adicionais para acomodar o novo processo de fixação do processador. O soquete é diferente do utilizado no Pentium III. Utiliza o formato ZIF, mas possui 423 pinos. As memórias precisam ser do tipo RDRAM para permitir o funcionamento a 400 MHz. São necessários coolers diferentes, e os gabinetes devem ter uma boa dissipação de calor, já que o Pentium 4 é um chip bastante quente.
Netburst x P6

Até o Pentium III, a arquitetura utilizada era a chamada “P6”, introduzida no final de 1995, com o Pentium Pro de 150 MHz. O Pentium Pro era menos eficiente que o Pentium MMX na execução de programas de 16 bits, por isso seu uso foi praticamente restrito a servidores baseados no Windows NT. Com a popularização do Windows 95 e aplicativos de 32 bits, a microarquitetura P6 passou a ser mais vantajosa. Com diversas adaptações,

7-22

Hardware Total

incluindo melhoramentos na eficiência de processamento para 16 bits, foi lançado o Pentium II. A partir daí, vários melhoramentos foram introduzidos: barramento de 100 MHz, instruções SSE, barramento de 133 MHz, cache L2 duas vezes mais rápida, tudo isso acompanhado pelo aumento de clock, graças ao uso de tecnologias de fabricação que possibilitavam a construção de transistores cada vez menores. O Pentium III/1000 (o mesmo pode ser dito sobre as versões mais velozes do Pentium III) é um produto resultante de uma seqüência de melhoramentos que começaram em 1995 com o Pentium Pro/150. Isto significa que a microarquitetura P6 foi bastante prolongada, chegando a um clock quase 7 vezes maior que o utilizado no seu lançamento. Apenas por comparação, a microarquitetura P5 (Pentium e Pentium MMX) foi de 60 a 233 MHz (quase 4 vezes) durante seu ciclo de vida (1992-1997). A arquitetura do 486 foi submetida a clocks de 25 a 100 MHz (4 vezes) e a arquitetura do 386 operou inicialmente a 16 MHz, terminando em 40 MHz (2.5 vezes). Vemos portanto que a arquitetura P6 teve sua utilização bastante prolongada, o que resulta em problemas tecnológicos para a introdução de novos melhoramentos. Finalmente a Intel passa a ter uma nova arquitetura, com espaço para crescer, obter clocks mais elevados e desempenho proporcionalmente maior. Esta arquitetura é chamada pela Intel de Netburst, e traz vários melhoramentos.
Tecnologia e clocks dos primeiros modelos do Pentium 4

As primeiras versões do Pentium 4 utilizam tecnologia de 0.18 micron. Seus clocks iniciais eram 1.4 e 1.5 GHz, sendo logo seguidos pelos modelos de 1.3, 1.6, 1.7 e 1.8 GHz. Em breve a Intel passará a utilizar a tecnologia de 0.13 micron, reduzindo os preços e possibilitando atingir clocks mais elevados. As primeiras versões do Pentium 4 dissipam 52 e 56 watts, respectivamente. São chips extremamente quentes e requerem fontes, gabinentes e coolers especiais. Em geral os processadores mais rápidos dissipam entre 30 e 50 watts. Subir a dissipação de potência muito acima de 60 watts resulta em sérios problemas de aquecimento, portanto o lançamento de versões mais rápidas pode estar condicionado à adoção do novo processo de fabricação, com 0.13 micron. As primeiras versões do Pentium 4 (1.4 e 1.5 GHz) operavam com a tensão interna de 1.7 volts, e dissipavam cerca de 52 e 55 Watts, respectivamente. A nova versão de 1.3 volts, de menor custo, também operava com 1.7 volts e dissipava cerca de 50 Watts. Devido a problemas técnicos, a Intel precisou aumentar a tensão interna para 1.75 volts nas novas versões do Pentium 4, o

Capítulo 7 – Processadores modernos

7-23

que aumentou ainda mais a potência dissipada, com maior calor. Note ainda que o clock externo de 400 MHz é na verdade obtido a partir de um clock de 100 MHz, no qual são feitas 4 transferências a cada ciclo (QDR = Quad Data Rate). Portanto os multiplicadores que definem o clock interno a partir do externo tomam como base 100 MHz, e não 400 MHz. Por exemplo, em um modelo de 1.6 GHz, o multiplicador usado é 16x, e não 4x. A tabela abaixo resume tais características para os modelos de Pentium 4 até 1.8 GHz. Modelo e voltagem Pentium Pentium Pentium Pentium Pentium Pentium Pentium Pentium Pentium 4 / 1.3 / 1.75V 4 / 1.4 / 1.75V 4 / 1.5 / 1.75V 4 / 1.6 / 1.75V 4 / 1.7 / 1.75V 4 / 1.8 / 1.75V 4 / 1.3 / 1.70V 4 / 1.4 / 1.70V 4 / 1.5 / 1.70V Clock interno e externo 1300 MHz / 400 MHz 1400 MHz / 400 MHz 1500 MHz / 400 MHz 1600 MHz / 400 MHz 1700 MHz / 400 MHz 1800 MHz / 400 MHz 1300 MHz / 400 MHz 1400 MHz / 400 MHz 1500 MHz / 400 MHz Multiplicador 13x 14x 15x 16x 17x 18x 13x 14x 15x Potência 51,6 W 54,7 W 57,8 W 61,0 W 64,0 W 66,7 W 49,8 W 51,8 W 54,7 W

Soquete de 423 pinos

Novas placas e novos chipsets. As placas de CPU para Pentium III, que utilizam o Socket 370, não aceitam a instalação de um Pentium 4. Não é apenas a questão do soquete, todo o funcionamento eletrônico do chip é diferente. Existem semelhanças com o Pentium III, como a arquitetura de 32 bits (IA-32) e as memórias de 64 bits. Fora isto, a eletrônica é totalmente diferente, exigindo chipsets próprios. O encapsulamento do Pentium 4 é chamado PGA423, e é mostrado em detalhes na figura 15. O núcleo do processador é fixo em uma placa chamada OLGA (Organic Land Grid Array). Esta placa é por sua vez soldada a uma outra, na qual está a matriz de pinos (Pin Grid Array), com a qual é feito o encaixe no soquete da placa de CPU. Logo acima do núcleo do processador existe uma interface térmica, que é um material que facilita a transferência de calor para o dissipador metálico existente na face superior do chip. Este dissipador, por sua vez, faz contato direto com o cooler do processador.

7-24 Figura 7.15

Hardware Total
Visão transversal do Pentium 4 com encapsulamento PGA423.

O novo encapsulamento do Pentium 4

Pouco tempo depois do lançamento do Pentium 4, a Intel criou uma nova versão com um encapsulamento um pouco diferente. Necessita de placas de CPU equipadas com o Socket 478. Pelo menos durante algum tempo serão lançadas novas versões com clocks maiores, para ambos os tipos de soquetes: Socket 423 e Socket 478.
Figura 7.16
Pentium 4 para Socket 478.

Barramento de 400 MHz

O barramento do Pentium 4, opera com 64 bits, tal qual o do Pentium III, entretanto o clock é bem mais elevado: 400 MHz, contra apenas 133 MHz do Pentium III. Isto significa que enquanto o Pentium III acessa a memória na velocidade de 1.06 GB/s, o Pentium 4 atinge 3.2 GB/s. Este salto no desempenho da memória é muito importante, e bastante significativo. Durante os 5 anos de vida da arquitetura P6, o acesso às memórias foi de 60 a 133 MHz. Agora com 400 MHz, novas aplicações complexas poderão ser executadas em tempo real. Entretanto esta alta velocidade só pode ser obtida com o uso de memórias de alto desempenho, como RDRAM e DDR. Note

Capítulo 7 – Processadores modernos

7-25

que a Intel, devido a um contrato com a Rambus (empresa parceira da Intel que criou a RDRAM), tem um prazo para produzir chipsets para o Pentium 4 com suporte a memórias RDRAM, entretanto outros fabricantes de chipsets como VIA, SiS e ALI estão aptos a desenvolver chipsets para o Pentium 4 com suporte a memórias DDR, que são tão velozes quanto a RDRAM, porém muito mais baratas. A própria Intel, de acordo com as condições do contrato com a Rambus, criará novos chipsets para Pentium 4 com suporte a DDR SDRAM. Na prática o barramento do Pentium 4 não é de 400 MHz, e sim de 100 MHz, entretanto em cada ciclo de clock são feitas 4 transferências, o que resulta em um desempenho idêntico ao de um barramento de 400 MHz que operasse com uma transferência por cada ciclo.
Figura 7.17
O Pentium 4 faz 4 transferências de dados a cada ciclo de 100 MHz, o que resulta em taxa efetiva de 400 MHz.

A figura 17 mostra o método que torna a taxa de transferência 4 vezes maior (QDR, ou Quad Data Rate). Os instantes T0 e T1 marcam o início e o fim de um ciclo, cuja duração é 10 ns (1 / 100 MHz). Nos instantes T=0, T=2.5, T=5 e T=7.5 são feitas as transferências das linhas de dados, representadas por D# (note que este sinal representa na verdade o grupo de 64 bits do barramento de dados do Pentium 4). Quando T=10 ns (indicado como T1 na figura), o cliclo se repete, com mais 4 transferênicas. Podemos assim calcular a taxa de transferência da do Pentium 4, medida em bytes por segundo. Como em cada ciclo são 4 transferências de grupos de 64 bits (8 bytes), ficamos com: 100 MHz x 4 x 8 bytes = 3.200.000.000 bytes por segundo Esses 3,2 bilhões de bytes por segundo são “arredondados” para 3,2 GB/s. Uma velocidade tão alta não pode ser obtida com as tradicionais memórias SDRAM. Uma SDRAM padrão PC133 faz apenas uma transferência de 64 bits (8 bytes) por ciclo, a 133 MHz, o que resulta na taxa de: 133 MHz x 8 = 1066 MB/s, aproximadamente

7-26

Hardware Total

Esta deficiência da SDRAM PC133 em atingir a taxa de 3,2 GB/s exigida pelo Pentium 4 é a mesma de usar um clock de 133 MHz onde deveria ser 400 MHz. Apenas as memórias DDR do tipo DDR400 (também chamadas de PC3200) são capazes de operar com a taxa de transferência exigida pelo Pentium 4. Os primeiros chipsets para Pentium 4 a suportar memórias DDR usam entretanto versões menos velozes, como DDR266 e DDR333. Ao se tornarem comuns as memórias DDR400, o Pentium 4 poderá ter o máximo rendimento do seu barramento sem a necessidade do uso de memórias RDRAM.
Cálculos em 2x

A unidade lógica e aritmética do Pentium 4 opera com o dobro da velocidade do seu núcleo. Isto é inédito em processadores. Operando a 1.5 GHz, um Pentium 4 é capaz de realizar 3 bilhões de adições por segundo. O Pentium III, que tem sua unidade de ponto flutuante operando com a mesma freqüência do núcleo, não consegue acompanhar a velocidade dos cálculos realizados pelo Pentium 4. A maioria das operações matemáticas simples com números inteiros poderá ser feita em apenas meio período de clock.
SSE2

As instruções SSE introduzidas no Pentium III foram melhoradas, e passaram a ser chamadas SSE2. São uma evolução da tecnologia MMX, agora com 144 novas instruções que tornam mais rápidas operações complexas como descompressão de vídeo MPEG-2 (DVD), reconhecimento de voz, geração de gráficos 3D, exibição de vídeo, compressão MP3, processamento de sinais em geral. As operações SSE2 passam a utilizar números de ponto flutuante com 128 bits, contra os 64 bits anteriormente usados. Isto significa maior precisão nos cálculos sem gasto adicional de tempo. Para aproveitar esses novos recursos é preciso instalar no computador, o DirectX 8.0 ou superior.
Hyper Pipelined Technology

Todos os procesadores modernos executam suas instruções em modo pipeline. Ao invés de serem usadas unidades de execução complexas e lentas, são utilizadas várias unidades elementares, sendo cada uma delas mais simples e rápida, todas ligadas em série. É como uma linha de montagem. Imagine 20 pessoas ao mesmo tempo montando um automóvel. O grupo só poderia montar um carro de cada vez. Mais rápido seria colocar as pessoas em uma linha, cada uma responsável por uma etapa da montagem. Este é basicamente o princípio do pipeline. A arquitetura P6 em 10 estágios

Capítulo 7 – Processadores modernos

7-27

pipeline, o Pentium 4 possui 20, o que o torna potencialmente mais veloz na execução de instruções. Em outras palavras, cada “GHz” do Pentium 4 tem mais capacidade de processamento que cada “GHz” do Pentium III.
A nova cache L1

A cache L1 do Pentium III tem 32 kB (16k para dados e 16k para código). O Pentium 4 tem 8 kB de cache para dados e 12 K micro-ops para código (trace cache). O uso de uma cache menor é conseqüência do funcionamento mais eficiente da cache de código. Ao invés de armazenar instruções, a cache L1 do Pentium 4 armazena micro-operações, ou seja, instruções já decodificadas e divididas em operações elementares. Ao acessar dados na área de código da cache L1, o Pentium 4 não perderá portanto tempo repetindo essas etapas. Com mais eficiência, a cache L1 pode ter seu tamanho diminuído sem comprometer o desempenho do processador.
Cache L2

A cache L2 do Pentium 4 é similar à do Pentium III, com 256 kB, 256 bits e operando na mesma freqüência do núcleo. Nada impede entretanto que sejam futuramente lançadas versões com caches maiores, sobretudo nos modelos Xeon.
Execução especulativa 33% mais eficiente que do Pentium III

Todos os processadores modernos fazem execução especulativa. Ao receberem uma seqüência de instruções da memória, passam a executar várias delas simultaneamente. Ocorre que algumas instruções dependem do resultado de outras, que podem ainda não ter sido concluídas. Este problema não ocorria com os processadores antigos, que executavam uma instrução de cada vez. Para permitir o paralelismo, o processador precisa “especular” qual será o resultado de operações ainda não terminadas. Várias vezes a especulação falha, e é preciso repetir aquele trecho de programa. O Pentium 4 sofreu melhoramentos que permitem “acertar” esta especulação em mais vezes que o Pentium III.
Sem número de série

O polêmico número de série introduzido no Pentium III, que possibilitava a identificação do processador, foi muito criticado pela comunidade de informática. Além de permitir maior segurança no comércio eletrônico, ele também possibilitava a identificação do usuário, comprometendo o anonimato e a privacidade. A solução foi incluir no BIOS um comando para desabilita-lo. Foi tão criticado que a Intel resolveu não usá-lo no Pentium 4.

7-28

Hardware Total

Intel Xeon
O Pentium II e o Pentium III foram lançados em versões Xeon, com caches maiores e suporte para até 4 processadores. Com o Pentium 4, foi introduzida uma pequena diferença. As versões comuns (não Xeon) do Pentium II e do Pentium III podiam ser utilizadas em placas de CPU para dois processadores. Desta forma poderiam ser construídos servidores de custo moderado utilizando dois processadores Pentium II ou Pentium III não Xeon. De certa forma, a capacidade de operar em dupla fazia com que o Pentium II e o Pentium III acabassem “roubando” uma parte do mercado de suas versões Xeon. Notável foi o caso das versões do Pentium III Xeon com cache L2 de 256 kB, usados em placas de CPU para 2 processadores. Esta configuração não apresentava vantagem alguma em relação ao uso de dois processadores Pentium III não Xeon, instalados em uma placa para 2 processadores. A cache L2 do Pentium III comum também opera com a mesma freqüência do núcleo, a exemplo do que ocorre com a sua versão Xeon. As únicas vantagens restantes foram as versões com cache L2 maiores (até 2 MB) e a possibilidade de operar em placas para 4 processadores. Com o Pentium 4, a Intel resolveu dividir os mercados entre a versão comum e a versão Xeon. O Pentium 4 só pode ser usado em configurações de um só processador, o que é um retrocesso em relação ao Pentium III e ao Pentium II. Sua versão Xeon, esta sim pode ser usada em cofigurações para 2 processadores. Esta diferenciação evita que o Pentium 4 “roube” o mercado da sua versão Xeon na área de servidores e placas de CPU de alto desempenho. Para deixar as coisas ainda mais separadas, a Intel não adotou o nome “Pentium 4 Xeon”, mas simplesmente, “Intel Xeon”. No manual do Intel Xeon, não existe uma só referência ao Pentium 4, apesar da descrição do Xeon ser idêntica à do Pentium 4, com exceção do funcionamento em sistemas duais e do soquete diferente, o PGA603.

Capítulo 7 – Processadores modernos Figura 7.18
Processador Intel Xeon.

7-29

Processador Intel Xeon

Lançamento 2001 Transistores 42.000.000 Tecnologia 0,18  e 0,13  Encapsulamento PGA603 Barramento de dados 64 bits Barramento de endereços 36 bits Capacidade de memória 64 GB Clock interno 1,4 GHz e superiores Clock externo 400 MHz (100 MHz x 4) Consumo A partir de 56 W Cache L1 20 kB Cache L2 256 kB Novos recursos: Soquete PGA603 e funcionamento em dupla. Todos os mais recursos são similares aos do Pentium 4.

A tabela abaixo mostra alguns parâmetros das versões iniciais do Xeon, com clocks de 1.4, 1.5 e 1.7 GHz. As potências dissipadas são sensivelmente maiores que as do Pentium 4. A Intel especifica para o Xeon, temperaturas máximas cerca de 3 graus inferiores às máximas especificadas para o Pentium 4. Portanto é preciso utilizar para o Xeon, coolers um pouco maiores que os indicados para processadores Pentium 4 de mesmo clock. Modelo Xeon 1.4 GHz Xeon 1.5 GHz Clock interno e externo 1400 MHz / 400 MHz 1500 MHz / 400 MHz Multiplicador 14x 15x Potência 56 W 59,2 W

7-30

Hardware Total

Xeon 1.7 GHz

1700 MHz / 400 MHz

17x

65,8 W

Com a adoção da tecnologia de 0,13, serão lançadas novas versões do Xeon, com menor dissipação de potência, maiores clocks, maiores caches L2 e com cache L3. Também poderão ser lançadas versões que suportem operar em placas para 4 processadores.
Figura 7.19
Uma placa de CPU para dois processadores Intel Xeon.

A figura 19 mostra uma placa de CPU para dois processadores Xeon, produzida pela SuperMicro. A placa possui 2 soquetes PGA603, 4 soquetes para memórias RDRAM, um slot AGP Pro, 4 slots PCI de 32 bits e 2 slots PCI de 64 bits, além de outras interfaces tradicionais.

AMD Athlon
Lançado em meados de 1999, este novo processador AMD trazia uma característica inédita: tomou o primeiro lugar da Intel na corrida pelo processador mais rápido para PCs. Um Athlon/550, por exemplo, era sensivelmente mais veloz que um Pentium III/550, e seu custo era menor. A partir daí, Intel e AMD começaram uma corrida em busca do primeiro lugar. A Intel lançava um modelo mais veloz, logo a seguir a AMD lançava um modelo ainda mais veloz, depois a Intel fazia o mesmo, e assim por diante.

Capítulo 7 – Processadores modernos Figura 7.20

7-31
Processador AMD Athlon para Slot A.

A primeira versão do Athlon usava tecnologia de 0,25 (Modelo 1) e utilizava um encapsulamento de cartucho, similar ao do Pentium II e do Pentium III. O seu soquete, chamado Slot A, era bastante parecido com o Slot 1, entretanto não são compatíveis do ponto de vista elétrico. Não é possível encaixar um Athlon em um Slot 1, assim como não é possível encaixar um Pentium II/III em um Slot A. Ambos os conectores são parecidos, mas possuem chanfros em posições diferentes que impedem o encaixe do processador errado. Um técnico distraído pode conseguir encaixar um Athlon no Slot 1, se inverter a posição do processador. Se isto for feito, o processador obviamente não funcionará. O processador e a placa de CPU serão danificados. Posteriormente a AMD lançou o Athlon Modelo 2, com tecnologia de 0,18 , porém ainda utilizando o formato de cartucho. Processador Atlhon, modelos 1 e 2
Lançamento Transistores Tecnologia Encapsulamento Barramento de dados Barramento de endereços Capacidade de memória Clock interno Clock externo Consumo Cache L1 Cache L2 1999 22.000.000 0,25  e 0,18  SEC 64 bits 36 bits 64 GB 500 a 1000 MHz 200 MHz 31 a 65 W 128 kB 512 kB, discreta

7-32

Hardware Total

No detalhe à direita da figura 20, que mostra processadores Athlon com o cartucho aberto, podemos observar que na placa interna existe o processador propriamente dito, na sua parte central, e dois chips de memória, que formam a cache L2. Dependendo do modelo, a cache L2 dessas primeiras vesões do Athlon podiam operar com 1/2, 2/5 ou 1/3 da freqüência do núcleo. Apenas um ano depois estava disponível o Athlon TBird, com cache L2 integrada ao núcleo, com 256 kB e “full speed”.
Barramento de 200 a 400 MHz

O Athlon foi criado para operar com um barramento externo de 200 MHz, podendo ter este clock aumentado para até 400 MHz em novas versões. Isto tornará possível a compatibilidade com novas memórias mais velozes a serem lançadas em um futuro próximo. Este barramento emprega um método chamado DDR (Double Data Rate), já utilizado por vários barramentos para obter clocks maiores. Em cada período de clock, o Athlon realiza duas transferências de dados, portanto cada período vale por dois. Com o clock de 100 MHz e usando DDR, o resultado é equivalente ao de um clock de 200 MHz. Com 133 MHz e DDR, o resultado é 266 MHz, e com 200 MHz e DDR, o resultado é o mesmo que 400 MHz. As primeiras versões do Athlon operavam com 100 MHz x 2. No final do ano 2000 foram lançadas versões de 133 MHz x 2. Note que um Athlon operando com 100 MHz e DDR produz um resultado melhor que um Pentium III usando 133 MHz, sem DDR. Mesmo sendo o Athlon capaz de operar a 200 MHz externos, as primeiras placas de CPU para Athlon não suportavam memórias de 200 MHz, pois elas simplesmente não existiam. Os primeiros chipsets faziam a comunicação com o processador à taxa de 200 MHz (100 MHz com DDR), mas comunicavam-se com a memória a 100 ou 133 MHz (memórias PC100 e PC133). No início do ano 2001 começaram a surgir no mercado, placas de CPU com suporte a memórias DDR. Memórias DDR200 podem operar a 200 MHz, e memórias DDR266 podem operar a 266 MHz. Com o uso dessas novas placas de CPU e novas memórias, o Athlon pode tirar o máximo proveito do seu veloz barramento externo.
Cache L1 de 128 kB

Caches maiores e com maior clock resultam em maior desempenho. Os processadores Intel tradicionalmente usam caches L1 de tamanho modesto, como 16 kB e 32 kB. Processadores AMD costumam usar caches L1 maiores como os 64 kB do K6-2 e do K6-III. A AMD colocou no Athlon, uma cache L1 de 128 kB, um tamanho bastante generoso. A conseqüência deste

Capítulo 7 – Processadores modernos

7-33

tamanho maior é que o processador encontrará com maior probabilidade, os dados e instruções que necessita na própria cache L1, sem a necessidade de utilizar mecanismos de acesso mais demorados para obter essas informações.
Unidade de ponto flutuante

A unidade de ponto flutuante, responsável pela execução de cálculos matemáticos complexos, é de extrema importância na execução de programas científicos, programas de CAD e engenharia, e em programas que geram gráficos tridimensionais. Antigamente, só engenheiros e cientistas precisavam de uma unidade de ponto flutuante. Hoje, todos os jogos 3D necessitam deste recurso. Por isso todos os processadores modernos possuem em seu interior, uma unidade de ponto flutuante, capaz de realizar operações matemáticas complexas com extrema velocidade. Até pouco tempo, a unidade de ponto flutuante de processadores Intel era imbatível. Um Celeron/266, por exemplo, realizava cálculos de forma mais rápida que um AMD K6-III/450. Esta situação mudou com o processador Athlon. Sua unidade de ponto flutuante foi totalmente reprojetada visando máxima eficiência. Um Athlon realiza cálculos matemáticos complexos com velocidade de 10 a 15% maior que um Pentium III de mesmo clock.
Enhanced 3D Now e MMX ampliado

As instruções 3D Now encontradas no K6-2 e K6-III foram mantidas e ampliadas no Athlon, com 5 novas instruções. As instruções MMX, também presentes nesses processadores, também foram ampliadas com 19 novas instruções. Essas instruções resultam em melhor desempenho na geração de imagens tridimensionais e melhor processamento de sinais de vídeo e áudio, útil para aplicações como reconhecimento de voz, compressão e descompressão de vídeo, tratamento de imagens 2D e sinais analógicos em geral.
Clocks e consumo de energia

O Athlon tem fama de ser um processador mais quente que o Pentium III. Isto se deve ao fato do Athlon ter um número muito maior de transistores. O Athlon é um processador de 7a geração, enquanto o Pentium III é de 6a. Comparemos inicialmente o Athlon modelo 1 de 600 MHz com o Pentium III Katmai de 600 MHz. Esses dois processadores possuem cache L2 separada do núcleo (discreta), com 512 kB. Ambos são construídos com tecnologia de 0,25. Processador Transistores Potência

7-34

Hardware Total

Pentium III/600 Athlon 600

9.500.000 22.000.000

36 W 50 W

Como vemos, o Athlon possui no seu núcleo um número de transistores mais que duas vezes maior que o do Pentium III, devido aos seus circuitos mais complexos. Como ambos utilizam transistores com tamanhos iguais, isto tornaria a potência elétrica dissipada pelo Athlon também duas vezes maior. Entretanto este aumento de potência é de apenas 40%, graças ao fato do Athlon/600 ter seu núcleo alimentado por 1,6 volts, enquanto o Pentium III/600 Katmai operava com 2 volts. Ainda assim é consideravelmente elevada a dissipação de 50 watts, resultando no uso de coolers de maior tamanho. A tabela que se segue mostra a potência dissipada por cada versão do Athlon até 1 GHz (modelos 1 e 2). Note que apesar do clock externo ser de 200 MHz em todos esses casos, os multiplicadores levam em conta o clock de 100 MHz. Por exemplo, um Athlon/500 usa multiplicador 5x, e não 2,5x. Na verdade o clock desses modelos do Athlon é de 100 MHz, que com DDR (Double Data Rate) resulta no mesmo efeito que teria um clock efetivo de 200 MHz. Clock e modelo 500 MHz modelo 1 550 MHz modelo 1 600 MHz modelo 1 650 MHz modelo 1 700 MHz modelo 1 550 MHz modelo 2 600 MHz modelo 2 650 MHz modelo 2 700 MHz modelo 2 750 MHz modelo 2 800 MHz modelo 2 850 MHz modelo 2 900 MHz modelo 2 950 MHz modelo 2 1000 MHz modelo 2 Clock interno Multiplicador e externo 500 MHz / 200 MHz 5x 550 MHz / 200 MHz 5,5x 600 MHz / 200 MHz 6x 650 MHz / 200 MHz 6,5x 700 MHz / 200 MHz 7x 550 MHz / 200 MHz 5,5x 600 MHz / 200 MHz 6x 650 MHz / 200 MHz 6,5x 700 MHz / 200 MHz 7x 750 MHz / 200 MHz 7,5x 800 MHz / 200 MHz 8x 850 MHz / 200 MHz 8,5x 900 MHz / 200 MHz 9x 950 MHz / 200 MHz 9,5x 1000 MHz / 200 MHz 10x Potência 42 W 46 W 50 W 54 W 50 W 31 W 34 W 36 W 39 W 40 W 48 W 50 W 60 W 62 W 65 W

Clock externo e acesso à memória

Capítulo 7 – Processadores modernos

7-35

Alguma confusão foi feita pelos usuários em relação ao clock externo e as memórias utilizadas pelo Athlon. Afinal, o clock externo era de 100 ou 200 MHz? E como esses clocks são compatibilizados com as memórias PC100 e PC133 (100 MHz e 133 MHz) disponíveis na época do seu lançamento? Seria necessário usar memórias de 200 MHz? Esta questão não é específica do Athlon, mas de outros processadores e chipsets. Durante muitos anos, as memórias usadas nas placas de CPU deveriam operar com o mesmo clock externo usado pelo processador. Em um Pentium MMX, as memórias deveriam operar a 66 MHz. Em um Pentium II/400, por exemplo, as memórias deveriam operar com 100 MHz, tal qual o processador. Dizemos que nesses casos a memória opera de forma síncrona, ou seja, com o mesmo clock do processador. Novos chipsets foram desenvolvidos com o recurso de acessar a memória de forma assíncrona, ou seja, com um clock diferente do utilizado pelo processador. Um dos primeiros chipsets com esta capacidade foi o VIA Apollo MVP3, que permitia por exemplo, usar memórias a 66 MHz com um processador operando com clock externo de 100 MHz. Muitos chipsets modernos têm esta capacidade, inclusive os utilizados pelo Athlon.
Figura 7.21
Conexões entre processador, chipset e memória.

A figura 21 mostra o diagrama de blocos de uma típica placa de CPU. Nele vemos em destaque o processador, o chipset e a memória DRAM. Normalmente os chipsets são formados por dois chips independentes: o Northbridge ou System Controller, que é encarregado de controlar a memória e o barramento AGP, e o SouthBridge, especializado em interfaces

7-36

Hardware Total

e comunicação com periféricos. Vemos na figura deste exemplo que a comunicação entre o processador e o chipset é feita a 200 MHz, enquanto a comunicação entre o chipset e a memória é feita a 100 MHz. Os diversos chipsets para Athlon passaram por várias gerações, com diferenças nas velocidades de comunicação com o processador e com as memórias: a) Processador a 200 MHz, memórias a 100 MHz b) Processador a 200 MHz, memórias a 100 ou 133 MHz c) Processador a 200 ou 266 MHz, memórias a 100 ou 133 MHz d) Processador a 200 ou 266 MHz, memórias DDR a 200 ou 266 MHz O melhor desempenho do processador é obtido quando a memória DRAM é capaz de operar com velocidade igual ao seu clock externo, o que só se tornou possível com as placas de CPU que dão suporte a memórias DDR, encontradas no mercado a partir de meados do ano 2001. Antes disso, as memórias PC100 e PC133 realmente estavam abaixo do desempenho exigido pelo Athlon.

Athlon T-Bird
Assim como a Intel passou o Pentium III da versão Katmai para a versão Coppermine, a AMD passou o processador Athlon original para a versão Thunderbird (T-Bird). Ambos os fabricantes lançaram versões com encapsulamentos de cartucho e soquete, passaram de 0,25 para 0,18 e fizeram alterações no seu núcleo, principalmente a integração da cache L2. Também foram lançadas versões econômicas: o Celeron baseado no núcleo Coppermine (até então era baseado no núcleo Katmai do Pentium II) e o Duron, que é um Athlon T-bird com cache L2 de 64 kB. A tabela que se segue mostra a transição que esses processadores sofreram no ano 2000.
Intel Pentium III Katmai, SEC, 0,25 Pentium III Coppermine, SEC, 0,18 Pentium III Coppermine, FC-PGA, 0,18 Celeron Coppermine-128, FC-PGA, 0,18 AMD Athlon, modelo 1, SEC, 0,25 Athlon, modelo 2, SEC, 0,18 Athlon T-Bird, SEC, 0,18 Athlon T-Bird, PGA, 0,18 AMD Duron, PGA, 0,18

Note que o modelo Katmai do Pentium III (cache L2 discreta) foi produzido apenas na versão de cartucho e com tecnologia de 0,25. Já os Athlons de cache discreta (modelos 1 e 2) foram ambos produzidos na versão de cartucho, com tecnologias de 0,25 e 0,18. Observe ainda que o Athlon modelo 2 não tem correspondente na Intel. Ao invés de partir diretamente

Capítulo 7 – Processadores modernos

7-37

para as novas versões com cache integrada, a AMD precisou lançar o modelo 2, já que a dissipação de calor do modelo 1 era muito elevada. Ambos os fabricantes fizeram a integração da cache L2 ao núcleo do processador utilizando a tecnologia de 0,18. O Coppermine da Intel corresponde ao T-Bird da AMD. Ambos os processadores foram produzidos nas versões PGA e de cartucho. Este é um engano que muitos cometem. As versões Coppermine e T-Bird, apesar de serem mais comuns no encapsulamento PGA, também foram produzidas no formato de cartucho. Até então, o Celeron era baseado no núcleo Katmai do Pentium II, e não tinha os recursos do Pentium III (que também era Katmai), como as instruções SIMD. Portanto o Celeron nada mais era que um Pentium II com menos cache, apesar desta cache ser full speed. Ao lançar o Pentium III Coppermine, a Intel passou a produzir novas versões do Celeron, finalmente baseadas no Pentium III, e não no Pentium II. É o chamado Celeron Coppermine-128. Esta nova versão do Celeron possui 128 kB de cache L2, contra 256 kB do Pentium III, e seu barramento externo operava a 66 MHz, contra 100 e 133 MHz do Pentium III. Assim como a Intel lançou o Celeron Coppermine-128, a AMD criou o “irmão mais novo” do Athlon. É o processador AMD Duron, cuja única diferença em relação ao Athlon T-Bird é a cache L2 de 64 kB. Tanto o Duron quanto as novas versões do Celeron são produzidas exclusivamente com o encapsulamento PGA, e não na versão de cartucho. O soquete utilizado pelo Duron e pelo Athlon T-Bird PGA é chamado de Socket A.

7-38

Hardware Total Figura 7.22
Processador Athlon para Socket A.

Processador Athlon T-Bird

Lançamento 2000 Transistores 37.000.000 Tecnologia 0,18  Encapsulamento PGA ou SEC Barramento de dados 64 bits Barramento de endereços 36 bits Capacidade de memória 64 GB Clock interno A partir de 650 MHz Clock externo 200 e 266 MHz Consumo Acima de 38 W Cache L1 128 kB Cache L2 256 kB Novos recursos: Cache L2 integrada ao núcleo, com 256 kB.

Apesar dos novos processadores Athlon terem encapsulamento PGA, a AMD ainda produz versões de cartucho. Podemos identificar facilmente um Athlon T-Bird de cartucho. Observe na figura 21 a descrição da numeração existente no processador. Os dígitos “2” e “4” na figura caracterizam o TBird. O “2” indica que a cache L2 tem 256 kB, e o “4” indica que o divisor de cache é 1:1, ou seja, a cache opera na mesma freqüência do núcleo. Esses processadores são mais velozes que os Athlons originais, e podem ser instalados em placas de CPU com Slot A. Como essas placas foram originalmente projetadas para os Athlons “antigos” (não T-Bird), o seu BIOS poderá apresentar a mensagem “Unknown Athlon Processor” (processador Athlon desconhecido) durante o boot. Este não reconhecimento preciso do

Capítulo 7 – Processadores modernos

7-39

processador não traz maiores conseqüências ao funcionamento do computador. O reconhecimento correto pode ser feito se realizarmos uma atualização no BIOS da placa de CPU.
Figura 7.23
Identificação de um processador Athlon TBird para Slot A.

O Athlon foi projetado para ser um processador compatível com as arquiteturas x86 / IA-32 e processar todos os sistemas operacionais e programas para PCs, como o Windows 9x/ME, Windows NT/2000, Windows XP, Linux, etc. Todos os programas que funcinam no Pentium, Pentium II/Pentium III e demais processadores Intel, funcionam também no Athlon. Apenas algumas atualizações cabem ser feitas nos sistemas operacionais. O Windows 2000, por exemplo, requer a instalação do Service Pack 1 para corrigir alguns problemas.
Clocks e potências do Athlon T-Bird

Periodicamente os fabricantes de processadores realizam alterações que resultam em redução da potência consumida. A alteração mais drástica é a redução do tamanho dos transistores (por exemplo, 0,25 para 0,18 e posteriormente para 0,13). Outras alterações também podem ser realizadas neste sentido, como a redução da tensão de alimentação interna do processador. Por isso para saber a potência elétrica exata dissipada por cada modelo (para efeito de cálculo do cooler) é preciso sempre consultar os manuais mais recentes. A tabela que se segue mostra os clocks e potências para o Athlon T-Bird modelo 4, operando com alimentação de 1,75V. Modelo 650 MHz Clock interno e externo 650 MHz / 200 MHz Multiplicador 6,5x Potência 38 W

7-40

Hardware Total

700 MHz 750 MHz 800 MHz 850 MHz 900 MHz 950 MHz 1000 MHz 1000 MHz 1100 MHz 1133 MHz 1200 MHz 1200 MHz 1300 MHz 1333 MHz 1400 MHz 1400 MHz

700 MHz / 200 MHz 750 MHz / 200 MHz 800 MHz / 200 MHz 850 MHz / 200 MHz 900 MHz / 200 MHz 950 MHz / 200 MHz 1000 MHz / 200 MHz 1000 MHz / 266 MHz 1100 MHz / 200 MHz 1133 MHz / 266 MHz 1200 MHz / 200 MHz 1200 MHz / 266 MHz 1300 MHz / 200 MHz 1333 MHz / 266 MHz 1400 MHz / 200 MHz 1400 MHz / 266 MHz

7x 7,5x 8x 8,5x 9x 9,5x 10x 7,5x 11x 8,5x 12x 9x 13x 10x 14x 10,5x

40 W 43 W 45 W 47 W 50 W 52 W 54 W 54 W 60 W 63 W 66 W 66 W 68 W 70 W 72 W 72 W

O Athlon continua a ser um processador quente, chegando até 72W de potência dissipada na sua versõa de 1.4 GHz. Para os modelos de 650, 700 e 750 MHz, ele chega a ser até um pouco mais quente que o modelo 2 de cartucho, porém a partir de 800 MHz, as potências dissipadas pelo T-Bird são menores que as das versões semelhantes do modelo 2 de cartucho. Podemos esperar para um futuro próximo, reduções nas potências dissipadas pelas novas versões do Athlon, resultantes da redução da tensão do núcleo e da adoção da tecnologia de 0,13. Note que as versões inferiores a 1 GHz são oferecidas apenas com o barramento externo de 200 MHz. A partir de 1 GHz, algumas versões são fabricadas apenas com o barramento de 200 MHz (1.1 e 1.3 GHz), outras são fabricadas apenas com o barramento de 266 MHz (1.13 e 1.33 GHz) e outras são oferecidas com barramentos de 200 e de 266 MHz (1, 1.2 e 1.4 GHz). As placas de CPU são capazes de detectar o clock externo suportado pelo processador e configurá-lo automaticamente. Podemos ainda fazer esta configuração no modo manual, forçando o processador para 200 ou 266 MHz, de acordo com o modelo. Para fazer esta configuração corretamente é preciso determinar se o Athlon usado tem barramento de 200 ou 266 MHz. Esta informação está estampada na face superior do processador.

Capítulo 7 – Processadores modernos Figura 7.24

7-41
Identificação de um processador Athlon TBird modelo 4.

A seqüência de letras existente na face superior do processador traz várias informações úteis, como mostra a figura 24. Entre elas, o último caracter indica o clock externo do barramento (B=200 MHz e C=266 MHz). Outra informação importantíssima é a que define a temperatura máxima do processador (S=95oC e T=90oC). Isto é importante para determinar o cooler correto para o processador usado. Um processador que suporta temperatura máxima maior (no caso, 95oC) é preferível a um que suporta uma temperatura menor. São informações úteis para conferir o processador na ocasião da compra, e também para configurar corretamente um computador durante sua montagem, manutenção ou expansão.
O Athlon Palomino (ou Athlon XP)

Depois de lançar o Athlon Thunderbird (modelo 4), a AMD criou o Athlon MP (servidores e workstations) e o Athlon 4 (portáteis). Ambos utilizam o núcleo modelo 6, com otimizações diversas, tais como Professional 3D Now e menor consumo de energia. Apesar de ambos serem baseados no núcleo modelo 6, o Athlon MP tem habilitados seus recursos especiais de multiprocessamento, enquanto o Athlon 4, que não realiza multiprocessamento, tem recursos especiais de economia de energia. O Athlon 4, que será estudado mais adiante, é na verdade um Athlon para portáteis. Nas seções seguintes apresentaremos os processadores Athlon MP e Athlon 4. O núcleo do modelo 6 passou a ser utilizado na nova versão do Athlon para PCs desktop, inicialmente chamado de “Athlon Palomino”. Esta nova versão possui melhoramentos na cache L2, instruções Professional 3D Now e reduzido consumo de energia, porém não conta com os recursos de multiprocessamento do Athlon MP nem com os recursos de economia de energia do Athlon 4. Logo o Athlon T-Bird para PCs desktop sairá de linha e dará lugar ao Athlon Palomino (note que este é um nome provisório usado internamente na AMD). Os resultados serão preços menores, maiores velocidades e menor geração de calor.

7-42

Hardware Total

### Colocar tabela de equivalência
Athlon Thoroughbred e Athlon Barton

Essas são novas versões do Athlon para PCs desktop que deverão substituir o modelo Palomino em 2002. São baseados na tecnologia de 0,13. Existirão também versões correspondentes para PCs portáteis.
Athlon Clawhammer

Poderá ser lançada uma versão para PCs desktop baseada na tecnologia AMD x86-64. Será um processador de 64 bits, apesar de compatível com a arquitetura x86. Este será um modelo de 8a geração, também com tecnologia de 0,13 e seu lançamento está previsto para 2002 ou 2003.

Athlon MP
O Athlon MP é uma versão do Athlon capaz de operar em placas de CPU com múltiplos processadores. Apenas para recordar, o Pentium II e o Pentium III podiam operar em placas com 1 ou 2 processadores (SP e DP), enquanto suas versões Xeon podiam operar em modos de até 4 processadores. Já o Pentium 4, assim como o Athlon, podem operar apenas no modo SP (ou seja, um único processador). Assim como o Intel Xeon é uma versão do Pentium 4 que pode operar no modo dual, o Athlon MP é uma versão do Athlon capaz de operar também em modo dual. Futuras versões do Athlon MP poderão operar em grupos de 4 e 8 processadores. O Athlon MP é portanto um processador voltado para servidores e estações de trabalho de alto desempenho, mercado que até então estava dominado pelos processadores Intel: Pentium II Xeon, Pentium III Xeon e (Pentium 4) Xeon.
Figura 7.25
Processador Athlon MP.

Capítulo 7 – Processadores modernos

7-43

Juntamente com o Athlon MP, a AMD lançou também o chipset AMD 760 MP, capaz de operar com o sistema dual. Na figura 26 vemos uma das primeiras placas de CPU para Athlon MP, a Tyan Thunder K7, equipada com este chipset. Como vemos são dois soquetes de 463 pinos, além de slot AGP Pro, 5 slots PCI de 64 bits e 4 soquetes para memórias DDR DDR padrões DDR200 (para processadores com clock externo de 200 MHz) e DDR266 (para as versões com clock externo de 266 MHz). Essas memórias são portanto capazes de operar com a plena velocidade exigida pelo Athlon MP, ao contrário das memórias PC100 e PC133, que ficam bem abaixo desta velocidade.
Figura 7.26
Uma placa de CPU para dois processadores Athlon MP.

A figura 27 mostra o diagrama de blocos de uma placa de CPU baseada no chipset AMD 760 MP, para dois processadores Athlon MP. Não é muito diferente de outras placas para múltiplos processadores. Este chipset é formado pelos chips AMD 762 (este é o que tem recursos de multiprocessamento) e o controlador de periféricos AMD 766. Note que este segundo chip não é responsável por funções de multiprocessamento, e é inclusive utilizado na versão “não multiprocessada” do AMD 760. Portanto o chipset AMD 760 é oferecido em duas versões: AMD 760 MP = AMD 762 (MP) + AMD 766 AMD 760 = AMD 761 (não MP) + AMD 766

7-44

Hardware Total *** 75% *** Figura 7.27
Diagrama de uma placa de CPU dual para processadores Athlon MP.

O chip AMD 762 faz a ligação com até dois processadores Athlon MP, a 200 ou 266 MHz. A ligação é feita com as memórias DDR, que poderão ser também de 200 ou 266 MHz. O AMD 762 também é responsável pela geração dos sinais do barramento PCI, que opera com 32 ou 64 bits, a 33 MHz. Na versão “não MP”, ou seja, no AMD 761, o barramento PCI é de apenas 32 bits, como na maioria das placas de CPU monoprocessadas. Já a velocidade da comunicação com o processador e com a memória DDR é a mesma da versão MP, ou seja, 200/266 MHz. A figura 28 mostra como reconhecer um processador Athlon MP, a partir da inscrição na sua face superior. O prefixo “HX” antes da indicação do clock é o que o distingue das outras vesões do Athlon. Assim como ocorre com outras versões, existem informações importantes, como o clock, a voltagem, o clock externo máximo, a temperatura máxima e o tamanho da cache L2.
Figura 7.28
Identificando um Athlon MP.

Processador Athlon MP
Lançamento

2001

Capítulo 7 – Processadores modernos Transistores 37.500.000 Tecnologia 0,18  Encapsulamento PGA Barramento de dados 64 bits Barramento de endereços 36 bits Capacidade de memória 64 GB Clock interno A partir de 1000 MHz Clock externo 266 MHz Consumo A partir de 46 W Cache L1 128 KB Cache L2 256 KB Novos recursos: Redução de 20% no consumo de energia, operação em modo dual, cache L2 com eficiência aumentada, Professional 3D Now, compatíveis com as instruções SSE do Pentium III.

7-45

Apesar de utilizar a mesma tecnologia de 0,18  e a mesma voltagem das versões então existentes do Athlon, o Athlon MP possui otimizações nos seus circuitos internos que resultaram em redução de cerca de 20% no consumo elétrico. Foi inicialmente liberado nas versões de 1000 e 1200 MHz, ambas com barramento externo de 266 MHz. Sua cache L2 sofreu melhoramentos na arquitetura (TLB = Translation Lookaside Buffer e Hardware Pre-fetch) que melhoraram sua eficiência, apesar de ter mantido o tamanho de 256 kB. Futuras versões do Athlon MP poderão usar caches L2 maiores.
Professional 3D Now

Outro recurso interessante introduzido no Athlon MP são as novas instruções especializadas em processamento 3D e multimídia, chamadas Professional 3D Now. Apenas para recordar, a tecnologia 3D Now foi introduzida no AMD K6-2, e com o lançamento do Athlon recebeu mais algumas instruções, passando a se chamar Advanced 3D Now. Ao lançar o Pentium III, a Intel criou suas próprias instruções 3D e de multimídia, chamadas SSE (Streamed SIMD Extensions). Muitos conhecem o SSE como MMX2. No Athlon MP, a AMD adicionou todas as instruções SSE da Intel, e passou a chamar o novo conjunto de Professional 3D Now. Portanto, temos: Professional 3D Now = Advanced 3D Now + SSE Isto dá ao Athlon MP a capacidade de executar programas originalmente otimizados para a tecnologia SSE do Pentium III. Note entretanto que pelo menos nesta versão inicial, não estão incluídas as novas instruções 3D (SSE2) do Pentium 4.

7-46 Smart MP

Hardware Total

O Smart Multiprocessing é um recurso novo criado pela AMD para seus processadores Athlon MP. Com ele é possível uma comunicação mais eficiente entre a memória e os processadores. O funcionamento de vários processadores em conjunto tem algumas complicações, como por exemplo, a coerência de caches. Quando um processador acessa um dado na memória, precisa saber se este dado está atualizado ou se consta como escrita pendente na cache do outro processador. Além disso em caso como este, é mais rápido um processador transferir o dado diretamente para outro, usando apenas as caches, e deixando liberada a memória. Graças à tecnologia Smart MP e ao chipset AMD 760 MP, uma comunicação mais eficiente pode ser obtida. Este chipset tem dois barramentos independentes, um para cada processador em uma configuração dual.
Figura 7.29
O Athlon MP e o chipset AMD 760 MP formam um sistema com dois barramentos independentes, um para cada processador, enquanto os sistemas da Intel (Intel Xeon + chipset i860 ou Pentium III Xeon + chipset i830) utilizam um único barramento compartilhado entre os dois processadores, o que reduz o desempenho.

A figura 29 mostra as conexões entre o chipset e os processadores em sistemas da Intel e AMD. Nos sistemas da Intel, a comunicação entre os processadores é feita através de um barramento compartilhado, e todas as transações passam pela memória. Nos sistemas da AMD, cada processador tem seu próprio barramento. A comunicação entre os processadores é feita diretamente, sem a necessidade de utilizar a memória, que poderá estar em uso por outros circuitos (AGP ou dispositivos PCI, por exemplo).
Freqüências e dissipação de energia

Apesar de também ser construído com a tecnologia de 0,18 e operar com os mesmos 1.75 volts usados pelo núcleo do Athlon T-Bird modelo 4, o Athlon MP (baseado no núcleo modelo 6), o Athlon MP tem outras modificações de engenharia que resultam na redução de 20% no seu

Capítulo 7 – Processadores modernos

7-47

consumo elétrico. Os dois primeiros modelos lançados foram os de 1000 e 1200 MHz, e suas características são resumidas na tabela abaixo. Modelo Athlon MP / 1000 Athlon MP / 1200 Clock interno Multiplicador e externo 1000 MHz / 266 MHz 7,5x 1200 MHz / 266 MHz 9x Potência 46,1 W 54,7 W

Athlon Thoroughbred MP e Barton MP

Essas serão novas versões do Athlon MP, com lançamento previsto para 2002. Serão baseados na arquitetura de 32 bits e 7a geração do Athlon, com tecnologia de 0,13, e serão destinados a servidores e workstations “entry level”. Em outras palavras, são para os mais modestos modelos de PCs de alto desempenho, já que para os de altíssimo desempenho a AMD oferecerá seus novos modelos de 8a geração, com nova arquitetura de 64 bits.
Athlon ClawHammer e SledgeHammer

Esses também são nomes provisórios, e não necessariamente serão chamados de “Athlon”. Ambos serão processadores de 8a geração, 64 bits e tecnologia de 0,13, com lançamento previsto para 2002. O ClawHammer irá operar em sistemas para até 2 processadores, e o SledgeHammer irá operar com sistemas para 4 e 8 processadores.

Athlon 4
Esta é uma nova versão do Athlon destinada ao mercado de PCs portáteis. Lançada ainda com a tecnologia de 0,18, porém utilizando menor dissipação de potência e menores voltagens, é também baseado no núcleo do modelo 6, o mesmo utilizado pelo Athlon MP e pelo Athlon Palomino.

7-48

Hardware Total Figura 7.30
Processador Athlon 4.

Processador Athlon 4

Lançamento Transistores Tecnologia Encapsulamento Barramento de dados Barramento de endereços Capacidade de memória Clock interno Clock externo Consumo Cache L1 Cache L2

2001 37.000.000 0,18  PGA 64 bits 36 bits 64 GB 650 a 1400 MHz (jun/2001) 200 / 266 MHz 38 a 72 W 128 kB 256 kB Figura 7.31
Identificação de processadores Athlon 4.

AMD Duron
Assim como a Intel produziu processadores Celeron como versões de menor custo e menor desempenho do Pentium II e Pentium III, a AMD produziu a partir do Athlon T-Bird, o AMD Duron. Tecnicamente a única diferença entre o Athlon e o Duron é a cache L2. O Athlon tem 256 kB, enquanto o Duron tem 64 KB. Todas as demais características são similares às do

Capítulo 7 – Processadores modernos

7-49

Athlon. Inclusive o aspecto externo do Duron é bastante parecido com o do Athlon, como podemos ver na figura 32.
Figura 7.32
Processador AMD Duron.

O AMD Duron destina-se ao mercado de PCs de baixo custo. Foi criado para substituir o K6-2, o processador que dominou este mercado entre 1998 e 2000. Ao mesmo tempo em que cessou a produção de chips K6-2, no final do ano 2000, aumenta a oferta de processadores Duron e de placas de CPU de baixo custo, com áudio e vídeo onboard, equipadas com Socket A. Processador AMD Duron
Lançamento 2000 Transistores 25.000.000 Tecnologia 0,18  Encapsulamento PGA Barramento de dados 64 bits Barramento de endereços 36 bits Capacidade de memória 64 GB Clock interno A partir de 600 MHz Clock externo 200 MHz Consumo A partir de 27 W Cache L1 128 kB Cache L2 64 kB Novos recursos: O Duron tem todos os recursos do Athlon T-Bird, exceto pela sua cache L2, que tem apenas 64 kB. Em compensação tem menor custo e menor dissipação de calor.

A princípio qualquer versão do Athlon pode ter uma versão do Duron correspondente, mas na prática não é o que tem ocorrido. A AMD tem dado prioriadade em produzir Athlons com clocks mais altos e Durons com clocks

7-50

Hardware Total

mais baixos. Enquanto eram oferecidos Athlons entre 800 e 1200 MHz, o Duron era oferecido em versões de 700 a 850 MHz. Deixando de lado a cache L2, que no Duron tem apenas 64 kB, todas as suas demais características são idênticas às do Athlon, como a cache L1 de 128 kB, o barramento externo de 200 MHz e a unidade de ponto flutuante de alto desempenho. É um excelente substituto de alto desempenho para o K6-2, voltado para o mercado dos PCs de baixo custo. Note que o Duron não foi produzido em versões de cartucho. O Duron passou a ser produzido já na versão T-Bird, com encapsulamento PGA. Modelo 600 MHz 650 MHz 700 MHz 750 MHz 800 MHz 850 MHz 900 MHz 950 MHz Clock interno e externo 600 MHz / 200 MHz 650 MHz / 200 MHz 700 MHz / 200 MHz 750 MHz / 200 MHz 800 MHz / 200 MHz 850 MHz / 200 MHz 900 MHz / 200 MHz 950 MHz / 200 MHz Multiplicador 6x 6,5x 7x 7,5x 8x 8,5x 9x 9,5x Potência 27,4 W 29,4 W 31,4 W 33,4 W 35,4 W 37,4 W 39,5 W 41,5 W

A figura 33 mostra como identificar as características de processadores AMD Duron. Assim como ocorre para outros processadores da AMD, o código tem indicações de clock interno e externo, cache L2, temperatura e voltagem.
Figura 7.33
Identificação de processadores Duron.

Duron para portáteis e Duron Morgan

O processador Duron para portáteis é uma nova versão baseada no mesmo núcleo usado pelo Athlon MP e Athlon 4 (modelo 6). É basicamente um Athlon 4 com cache L2 de 64 kB, ao invés de 256 kB. Assim como o núcleo do modelo 6 passou a ser usado nos novos Athlons para PCs desktop (Palomino), o núcleo do Duron portátil passou a ser usado nas novas versões

Capítulo 7 – Processadores modernos

7-51

do Duron para PCs desktop de baixo custo. Este é o chamado Duron Morgan.
Duron Appaloosa

Em 2002 o Duron também adotará a tecnologia de 0,13, e será lançado o modelo Appaloosa, nas versões para portáteis e para desktops.

VIA Cyrix III
Apesar deste processador ser bastante raro no Brasil, não poderíamos deixar de fazer uma citação. Afinal a Cyrix sempre foi o terceiro maior fabricante de processadores para PCs. Durante seus áureos tempos, chegou a produzir processadores melhores que os da AMD e Intel. Era o Cyrix 6x86 PR200, mais veloz e mais barato que o Pentium-200. Produziu ainda processadores 6x86MX e M-II, ambos com tecnologia MMX. Infelizmente a Cyrix mudou de dono duas vezes ao longo dos útlimos anos. Foi comprada pela National Semiconductors, que praticamente a sucateou. Passou muito tempo sem novos lançamentos, até que foi finalmente comprada pela VIA Technologies. Atualmente o processador chama-se Via Cyrix III. Ele é na verdade uma espécie de Celeron, tendo alguns pontos superiores e outros inferiores. Os pontos superiores são:        Barramento de 66, 100 ou 133 MHz Clocks mais elevados, como 700 MHz Cache L1 com 128 kB Instruções 3D Now e MMX Utiliza o Soquete 370, compatível com Pentium III e Celeron Baixa dissipação de calor Baixo custo

Seu ponto fraco é a cache L2, inexistente. Isso mesmo, a Cyrix preferiu aumentar o tamanho da cache L1 e acabar com a cache L2. Isso lembra os primeiros processadores Celeron, que também não tinham cache L2.

7-52

Hardware Total Figura 7.34
Processador VIA Cyrix III.

VIA C3
Um ponto fraco do VIA Cyrix III é a ausência de cache L2, o mesmo mal sofrido pelas primeiras versões do Celeron (apelidado maldosamente de Lentium, pelo menos no Brasil). Por isso a VIA optou por incluir uma cache L2 de 64 kB no seu novo processador, o VIA C3.
*** 35% *** Figura 7.35
Processador VIA C3.

Este processador foi desenvolvido pelas antiga equipe da Centaur (criadora do processador WinChip). Neste ponto a maior parte da equipe original da Cyrix já havia abandonado a VIA, e a maior parte do projeto foi realizado pelo grupo da Centaur. O nome “Cyrix” foi portanto eliminado do

Capítulo 7 – Processadores modernos

7-53

processador. É fabricado com tecnologia de 0,15 e tem baixo consumo de energia, inferior ao de um Celeron de mesmo clock.      Cache L1 com 128 kB Cache L2 com 64 kB Barramento de 66, 100 ou 133 MHz Instruções 3D Now e MMX Lançado em versões de 700 a 800 MHz

A tabela abaixo mostra algumas características do VIA C3. Modelo 700 MHz 733 MHz 750 MHz 800 MHz 800 MHz Clock interno e externo 700 MHz / 100 MHz 733 MHz / 133 MHz 750 MHz / 100 MHz 800 MHz / 133 MHz 800 MHz / 100 MHz Multiplicador 7x 5,5x 7,5x 6x 8x Potência 9,9 W 10,3 W 10,6 W 11,3 W 11,3 W

Note que o VIA C3 não é destinado a competir no mercado de PCs de alto desempenho, e sim na construção de PCs compactos de baixo consumo. Pode ser usado em notebooks e em PCs que operam em funções especializadas, como caixas eletrônicos, por exemplo. Inclusive sua unidade de ponto flutuante é de desempenho bastante modesto. Opera com apenas metade do clock do núcleo. Em um C3 de 800 MHz, por exemplo, apesar das caches L1 e L2 operarem com 800 MHz, a unidade de ponto flutuante opera com apenas 400 MHz. /////// FIM ///////////

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->