Escolar Documentos
Profissional Documentos
Cultura Documentos
Os mais avançados processadores da Intel e da AMD têm agora 6 núcleos. A AMD usa oficialmente
o termo “six-core”, mas é comum encontrar entre os usuários, referências como “hexacore” ou “hex-
core”, todas são aceitas. Antes dos novos processadores, o modelo mais avançado da AMD era o
Phenom II X4 modelo 965, de 3,4 GHz. Os novos modelos de 6 núcleos são oferecidos com as
velocidades de 2.8 e 3.2 GHz, e trazem uma novidade, o recurso “Turbo Core”, em resposta ao
Turbo Boost da Intel.
A AMD enviou para testes um modelo comercial de 3,2 GHz, ao contrário das amostras de
engenharia comuns em reviews. São os seguintes os primeiros modelos lançados. Os preços citados
são os médios das lojas do Centro do Rio de Janeiro, que constam no site www.boadica.com.br.
Note que existem dois modelos 1055T (2.8 MHz). O segundo deles mostrado na tabela
(HDT55TWFGRBOX) leva duas vantagens sobre o primeiro: Dissipa apenas 95 watts, contra 125
watts do outro, e suporta temperatura máxima de 71°C, contra apenas 62°C do outro. Para quem está
interessado neste processador, é bom anotar este código para checar na ocasião da compra. Observe
ainda que o modelo de 3.2 GHz é “Black Edition”, ou seja, suporta programação do seu
multiplicador interno por software, o que é muito útil para quem pretende fazer overclock.
Preço e performance
O Phenom II X6 é uma opção interessante para quem usa muitas aplicações que sejam beneficiadas
por múltiplos núcleos. As principais são edição de vídeo e geração de conteúdo de multimídia. Nem
sempre é o caso dos jogos, já que a maioria deles opera bem com dois núcleos, e são muito mais
beneficiados por uma placa de vídeo veloz que por um super processador. As opções de 6 núcleos da
Intel (Core i7 Extreme 980X e 970X) ainda são muito caras. A AMD ainda não consegue competir
com esses processadores mais velozes da Intel, pois ainda usa o processo de 45 nm. Os modelos
mais novos da Intel já usam 32 nm. Esse problema resulta em limitações de compromisso entre
clock, potência máxima e custo.
Ainda assim, os modelos mais avançados da AMD apresentam boa relação custo-benefício se
comparados com os modelos de quatro núcleos da Intel, ou seja, dada uma quantia fixa, é quase
sempre possível conseguir um processador mais rápido da AMD que se fosse escolhido um modelo
da Intel.
A figura 2 mostra o die do Phenom II X6. Nele podemos identificar facilmente os seis núcleos, cada
um com sua cache L2 de 512 KB, e a grande área à direita, que corresponde à cache L3 de 6 MB,
compartilhada entre os núcleos. Em relação aos jogos, podemos constatar que muitos deles, mesmo
modernos, operam bem com um ou dois núcleos.
As razões são óbvias: os desenvolvedores de jogos sofrem duas pressões de lados opostos. De um
lado, querem melhorar o realismo gráfico. De outro lado, querem que seus produtos possam ser
usados na maioria dos computadores atuais. Muitos deles possuem processadores de dois núcleos,
não podemos ainda considerar os processadores de quatro núcleos como populares. Já as placas de
vídeo velozes são bem mais comuns. Por isso a maioria dos benchmarks publicados sobre
desempenho para processadores diferentes apresenta variações pequenas em função do processador,
como o benchmark do GTA 4 publicado no Toms’s Hardware Guide.
Figura 3 – Na maioria dos casos, o desempenho em jogos depende mais da placa de vídeo que do
processador (GTA 4).
Sabemos que para a maioria dos jogos, o desempenho para execução de jogos 3D é mais
influenciado pela placa de vídeo que pelo processador. Existem algumas exceções, como os jogos
que usam intensamente inteligência artificial e física de movimentos, o que deixa o processador mais
ocupado.
Figura 4 – Em alguns casos o desempenho do processador afeta mais o desempenho 3D (Far Cry)
Como os processadores de 6 núcleos são hoje considerados “topo de linha”, a maioria dos jogos
ainda levam em conta que podem usar na média, entre 2 e 4 núcleos. A figura 5 mostra o gráfico de
uso da CPU durante a execução do jogo DIRT 2 durante uma corrida.
Observamos que todos os núcleos foram usados, mas a soma das taxas de utilização ficou em torno
de 300%, portanto tenderia a usar 3 núcleos ao máximo. Podemos considerar que um processador de
6 núcleos tem plenas condições para executar com eficiência os jogos mais avançados atuais e a
nova geração dos próximos anos.
Figura 5 – Uso dos núcleos em um Phenom X6 pelo jogo DIRT2
Não podemos estabelecer uma regra geral infalível entre desempenho 3D, placa de vídeo e
processador. Na maioria dos casos, o trabalho maior é da placa de vídeo, portanto seria melhor
comprar um processador moderado e gastar mais em uma placa de vídeo mais avançada. Em alguns
casos, o processador mais avançado será mais aproveitado.
Cada um é responsável por descobrir a demanda de CPU dos seus jogos prediletos para decidir se
investe em um processador mais avançado, ou economiza um pouco aqui para comprar uma placa de
vídeo melhor. Uma coisa é certa, em qualquer caso: uma placa de vídeo avançada sempre será um
bom investimento para quem gosta de jogos 3D. Um processador super avançado e caro nem sempre
será um bom investimento.
O Turbo Core é um recurso introduzido pela AMD no Phenom II X6 que já estava presente nos
modelos de 6 núcleos do Core i7 Extreme. Quando três ou mais núcleos estão com baixa carga de
trabalho (e portanto, gerando pouco calor), os núcleos restantes (1, 2 ou 3) poderão aumentar seu
clock (e aquecer mais) sem entretanto ultrapassar a máxima potência permitida. Esse aumento é feito
dinamicamente, de forma automática. Os modelos de 2.8 GHz terão seu clock aumentado para 3.2
GHz, e os modelos de 3.2 GHz terão o clock aumentado para 3.6 GHz.
A partir do momento em que existem quatro núcleos com utilização intensa (o mesmo vale para 5 ou
6), o Turbo Core é desativado momentaneamente, e o clock volta ao seu valor normal. Isso resulta
em um aumento de desempenho de pouco mais que 10% nas aplicações que exigem no máximo três
núcleos. Podemos considerar este recurso como uma espécie de overclock oficial controlado.
Entretando, foi necessário fazer uma atualização de BIOS e instalar o driver do processador (apenas
para testes sob o Windows XP, pois o Windows 7 já tem driver de processador apropriado). Sem
fazer a atualização de BIOS, o processador era reportado como um modelo desconhecido. A placa
mãe reduzia automaticamente a velocidade do processador para 800 MHz.
Figura 6 – Sem atualizar o BIOS, nem o Windows 7 mostra o processador corretamente
Outra dificuldade encontrada no sistema com a placa MSI foi uma queda de desempenho em
comparação com o Phenom II X4 965 nas aplicações que usam até 4 núcleos. Este Phenom II X4
tem clock de 3.4 GHz. O Phenom II X6 tem clock de 3.2 GHz, mas nas aplicações para até 3
núcleos, o clock é aumentado para 3,6 GHz graças ao Turbo Core, o que resultaria em um aumento
de desempenho de aproximadamente 5% para essas aplicações. O que ocorreu entretanto foi o
contrário: o desempenho diminuiu 9% ao invés de aumentar 5%, nas aplicações com 1 ou 2 núcleos.
Para fazer essas comparações, usamos valores obtidos em review anterior, baseado no programa
PCMark 2005, que analisa processadores de até 4 núcleos. Ocorre que este programa opera sob o
Windows XP, e por isso tivemos que usar este sistema. O driver de processador que acompanha o
Windows XP é de 2004. O Windows 7 já vem com o driver mais novo da AMD para processadores
multicore, que é de 2007 (não existe versão mais nova por enquanto). Devido ao uso do driver
antigo, o processador teve seu desempenho reduzido, independentemente do BIOS estar atualizado
ou não. O problema ocorreu com ambas as placas mãe usadas no teste.
Pior ainda foi o que ocorreu nas medidas que envolviam quatro núcleos. Quando quatro ou mais
núcleos do Phenom II X6 estão em plena atividade, o Turbo Core é desligado, fazendo com que seu
clock seja reduzido para a velocidade normal, no caso 3.2 GHz. Deveria reduzir em 5%, entretanto a
redução no desempenho foi de cerca de 15%. A instalação do “AMD Processor Driver” de versão
mais recente, obtida no site da AMD, resolveu os problemas, e as medidas de desempenho passaram
a apresentar os valores esperados.
Tudo isso confirma a importância de regras cruciais em upgrade: verificar no site do fabricante da
placa mãe se é necessário fazer uma atualização de BIOS, verificar se a placa mãe suporta o novo
processador, e verificar se é necessário atualizar o driver do processador.
Especificamente nos testes com o Phenom II, temos testado se a geração nova trazia vantagens em
relação à anterior. Não gostaríamos de ver coisas do tipo “é mais lento que o anterior quando usa
dois núcleos, mais quando usa todos os núcleos é bem veloz…”. No nosso primeiro artigo sobre o
Phenom, feito no seu lançamento, mostramos que é bem mais veloz nas aplicações para um ou dois
núcleos em comparação com o Athlon 64 X2 de mesmo clock. Nas aplicações para quatro núcleos, o
desempenho mais que dobra, em comparação com o uso de dois núcleos. Quando analisamos o
Phenom II X4, mostramos que é sensivelmente mais veloz que o Phenom X4 de mesmo clock.
1) Nas aplicações que usam até 4 núcleos, o Phenom II X6 tem desempenho maior ou igual ao do
X4? A resposta é SIM, totalmente, como mostraremos a seguir.
2) Nas aplicações que usam 6 núcleos, o Phenom II X6 é 50% mais rápido (6 contra 4) que o
Phenom II X4 de mesmo clock? A resposta é SIM, porém ainda são poucas as aplicações que tiram o
máximo proveito de todos os núcleos do processador. As principais aplicações que aproveitam todos
os núcleos são as que lidam com codificação de vídeo.
A tabela abaixo mostra os resultados. Os testes foram feitos em uma placa MSI 790GX-G65 com 4
GB de memória DDR3/1600. Testes feitos com memória mais lentas (1333) apresentaram resultados
praticamente idênticos, graças à cache L3.
PC Mark 2005
Nas aplicações que usam quatro núcleos, o Phenom II X6 desativa o Turbo Core e volta a operar
com seu clock normal de 3,2 GHz. A queda média de desempenho em relação ao X4 foi de 5,4 %,
que é aproximadamente a mesma queda correspondente à proporção entre os clocks (3,2 GHz / 3,4
GHz = 0,941, que corresponde a uma queda de 5,9%). Concluímos que o X6 apresenta ganho de
desempenho proporcional à variação de clock, isso comprova a sua escalabilidade, ou seja, termos
um desempenho maior na mesma proporção do aumento de clock. Parece algo óbvio, mas é bom
sempre conferir essas medidas nos novos processadores devido ao histórico de “inflação de GHz”
(aumento de desempenho não acompanhava o aumento de clock). ocorrida em alguns casos nos
últimos anos.
Com 5 núcleos em uso, o ganho de desempenho será hipoteticamente 25%, e com 6 núcleos será
também hipoteticamente 50%, como checaremos mais adiante. Portanto o Phenom II X6 de 3,2
GHz, em comparação com o Phenom II X4 de 3,4 GHz apresentará ganhos de cerca de 5% quando
operar com até 3 núcleos, queda de 5% ao operar com 4 núcleos, e ganhos de 25% e 50% ao operar
com 5 ou 6 núcleos.
Note que esses são resultados de um benchmark sintético. Na prática cenários diferentes podem
ocorrer. Se usaremos por exemplo um disco rígido lento, pouca memória ou no caso de jogos, uma
placa 3D simples, os resultados serão comprometidos. Não haverá diferença entre os dois
processadores nas operações que envolvem o uso da Internet, pois o fator limitante nesse caso é a
velocidade da conexão, não do processador.
Ainda saindo dos limites das análises sintéticas, o processamento no mundo real com 6 núcleos
poderá ser mais vantajoso que com 4 núcleos. Considere a realização de duas tarefas pesadas:
codificação de múltiplos arquivos de vídeo e o uso de um jogo 3D pesado. Usamos no nosso teste o
jogo DIRT2, considerado um dos mais pesados em termos de gráficos e de uso do processador.
Medidas feitas com o Gerenciador de Tarefas do Windows 7 mostraram que este jogo usa somente
dois núcleos do processador, mesmo que existam mais núcleos disponíveis.
Suponha que você vai usar este jogo ao mesmo tempo em que faz uma codificação de múltiplos
arquivos de vídeo (por exemplo, converter múltiplos arquivos AVI, WMV, MOV e outros para
formato de iPOD). Se o jogo está usando 2 núcleos, um Phenom II X4 ficará com dois núcleos
disponíveis para fazer a conversão de vídeo, enquanto o Phenom II X6 ficará com 4 núcleos
disponíveis para o mesmo trabalho. Leve em conta que outros jogos modernos poderão usar mais
núcleos, daí seria maior ainda a vantagem em usar um modelo X6 ao invés de um modelo X4. Note
que estamos fazendo análises com o Phenom II, mas princípio semelhante se aplica aos modelos da
Intel.
O problema é que os modelos de 6 núcleos da Intel são muito mais caros, e os núcleos HT não são
reais e não aumentam o desempenho. Um Core i7 com 4 núcleos HT não é equivalente a um
processador de 8 núcleos, vamos considerar que seja equivalente a um de 5 núcleos, levando em
conta um aumento de 25% no desempenho graças aos “núcleos virtuais” do HT. A análise de
desempenho X núcleos nos processadores Intel é assunto interessante para outro artigo.
Voltando à comparação com o X4, fizemos também testes sem o Turbo Core, que seriam mais
“justos”. Desativamos o Turbo Core no CMOS Setup, o que deixaria os núcleos do X6 operando a
3.2 GHz em qualquer caso. Como o X4 do nosso teste é de 3.4 GHz, seria mais justo reduzir seu
clock para 3,2 GHz para ficar igual ao do X6. Optamos por manter o X4 a 3.4 GHz e aumentar o
clock do X6 para 3.4 GHz pelo CMOS Setup, o que é permitido pois trata-se de um modelo Black
Edition. Aqui estão os resultados obtidos, com ambos a 3,4 GHz:
Falta agora mostrar o ganho obtido com 6 núcleos em comparação com o modelo de 4 núcleos nas
aplicações que aproveitam todos os núcleos. Façamos inicialmente as medidas de desempenho com
o programa PCMark Vantage sob o Windows 7.
6 núcleos contra 4
Infelizmente a maioria dos programas atuais não estão otimizados para aproveitar 6 núcleos. Na
verdade muitos deles nem mesmo chegam a aproveitar 4 núcleos com todo o seu potencial. Isso era
diferente na época do lançamento dos primeiros processadores de dois núcleos. Graças ao
lançamento do Hyper-Threading, dois anos antes, os fabricantes de software tiveram tempo para
otimizar seus programas.
Quando chegaram os processadores de dois núcleos, a maioria deles conseguiu dobrar ou quase
dobrar o desempenho nas aplicações mais beneficiadas pela velocidade do processador, como o
processamento de imagem, vídeo e áudio, sobretudo os CODECs de vídeo. Hoje isso nem sempre é
verdade. Para aproveitar melhor os vários núcleos do processador é preciso instalar versões mais
novas dos programas, ou esperar pelas versões otimizadas.
Veja por exemplo o caso do programa XiliSoft Vídeo Converter Ultimate. Esse programa converte
vídeos entre formatos diferentes. Por exemplo, podemos baixar arquivos WMV, RMVB, AVI ou
mesmo usar arquivos VOB de DVDs, e convertê-los para praticamente qualquer formato existente.
Fizemos um teste convertendo 270 arquivos AVI codificados em DIVX 6.8, todos com resolução de
640×480, para formato 320×240 codificados em H.264, compatível com iPOD. As conversões foram
feitas na mesma máquina, mas usando dois processadores diferentes:
Como o Video Converter Ultimate pode usar todos os núcleos do processador, deveria fazer o
trabalho de conversão com uma velocidade 50% maior com 6 núcleos que com o uso de 4 núcleos.
Ao invés de 9 minutos, deveria operar na faixa de 6 minutos, entretanto o tempo total de conversão
foi de 8 minutos e meio. O motivo da discrepância é que este programa, assim como a maioria deles,
não usa plenamente todos os núcleos do processador, como podemos aferir com o Gerenciador de
Tarefas.
Figura 7 – Programa não usa totalmente os núcleos do processador.
O histórico de uso do processador durante a execução dos programas apresentou uma utilização
média de 70% em cada núcleo. Daí vem a diferença pequena no desempenho com 4 e com 6
núcleos.
Mais uma vez lembramos que essa análise se aplica ao caso de um só programa “pesado” usando
todos os núcleos do processador. Em um cenário mais comum, podemos ter dois ou mais programas
pesados. Com mais núcleos disponíveis, um sistema com 6 núcleos levaria vantagem sobre um
sistema com 4 núcleos, independentemente dos programas utilizados.
A figura 8 mostra medidas de utilização dos núcleos do Phenom II X6 durante uma conversão de
vídeo (DVD para AVI com os programas FlaskMPEG e DIVX 7.0). Nesse tipo de conversão, a
maior parte do trabalho cabe ao DIVX, que faz a codificação, tarefa que é muito mais pesada que a
decodificação dos arquivos MPEG-2 do DVD. Para a medida ser justa, temos que descartar a lenta
operação de leitura do DVD. Por isso antes de iniciar a conversão, fizemos a cópia do conteúdo do
DVD para o disco rígido usando o programa DVD Decrypter.
Observe que a taxa de utilização do processador não chega a 100%, fica com a média de 80%, ou
seja, o programa não é totalmente otimizado para usar todos os núcleos do processador ao máximo,
por isso não podemos obter um o ganho máximo teórico para uso de 6 núcleos contra 4 núcleos, que
seria +50% (considerando clocks iguais).
Seria 50% mais veloz se ambos os processadores operassem com o mesmo clock.
Usamos para verificar o ganho de performance com o uso dos 6 núcleos o programa Handbrake,
obtido em http://handbrake.fr. Este programa é um conversor de vídeo gratuito. Não é um conversor
universal. Aceita vários formatos de arquivos de vídeo como entrada, mas gera apenas arquivos de
saída nos formatos MP4 e MKV.
Nosso teste é mostrado na figura 9. Fizemos a conversão de um arquivo AVI com duas horas de
duração e 6000kbps (5,8 GB) e resolução de 720×480. O arquivo gerado tem formato MP4. Note
que o gerenciador de tarefas mostra ao longo do tempo, uma taxa de utilização de quase 100% para
os seis núcleos. É mostrada na janela de CMD.EXE acima a taxa instantânea e a taxa média de
conversão. A média ficou em 159 fps com 6 núcleos. Fizemos as mesmas medidas com 6 núcleos
(3.2 GHz) e com 4 núcleos (3.4 GHz) e foram obtidos os seguintes resultados:
É um resultado bem próximo dos 41% teóricos. O fato de não ter sido alcançado o resultado
esperado (41%) pode ter várias explicações:
a) O programa não está totalmente otimizado para os 6 núcleos
b) O fato da cache L3 ser 6 MB nos dois casos pode prejudicar a escalabilidade
c) O tempo gasto na leitura do arquivo de entrada pode afetar o resultado
O tempo gasto na leitura de um arquivo a ser convertido pode afetar o desempenho total, caso este
arquivo seja grande. No teste realizado, o tempo total de conversão foi de 20 minutos. Como o
arquivo tem quase 6 GB, seria gasto cerca de um minuto na sua leitura, supondo uma taxa efetiva de
100 MB/s. De fato, somente a operação de cópia deste arquivo a partir de um HD externo demorou 3
minutos.
Isso nos motivou a repetir a medida usando um arquivo de vídeo menor. Dessa vez escolhemos um
filme com 1 hora e meia de duração, resolução de 640×480 e 700 MB. Os testes de conversão deste
arquivo para MP4 foram feitos duas vezes, no mesmo computador, inicialmente com um Phenom II
de 4 núcleos, depois com o de 6 núcleos. As medidas em andamento podem ser vistas nas figuras 10
e 11.
Nesses testes observamos que a taxa de utilização dos núcleos do processador ficou acima de 97%, o
que mostra que o tamanho grande do arquivo de entrada no teste anterior impedia que o processador
ficasse 100% do tempo ocupado, já que pesava um pouco o tempo de leitura do arquivo.
O ganho obtido agora foi 1,408, valor praticamente idêntico ao 1,41 calculado de forma teórica. Isso
prova que o novo processador realmente escala o seu desempenho com a utilização de todos os
núcleos, mas é preciso levar em conta:
1) Programas que usam todos os núcleos devem ser otimizados para aproveitamento máximo.
Enquanto os fabricantes não os otimizam, o ganho será inferior ao valor teórico.
2) Mesmo quando programas não foram otimizados, sempre ocorrerá ganho de desempenho quando
usamos múltiplos programas pesados simultaneamente.
3) Outras partes do computador também precisam ser rápidas. No exemplo acima, vimos que o
tempo gasto na leitura do arquivo do disco rígido afetou o desempenho total. Para o computador ser
rápido como um todo, não podemos ter partes causando “gargalos”.
Além dos benchmarks sintéticos, existem também os benchmarks de sistema. Nesse tipo de teste, o
resultado final depende não só do processador, mas também do disco rígido, memória e placa de
vídeo. Dá uma idéia do desempenho do computador como um todo, mas é ineficiente para avaliar
individualmente cada módulo, como o processador, por exemplo.
Diferenças relativamente grandes são observadas quando usamos placas de vídeo diferentes ou
discos rígidos diferentes. Como resultado, cada processador recebe um índice “CPU Test” que não
depende somente do processador, mas de outros módulos. Para comparar processadores diferentes
seria preciso, em todos os testes, usar placas de vídeo idênticas e discos rígidos idênticos. Além
disso, se a placa de vídeo e o disco rígido não tiverem altíssimo desempenho, penalizarão os
resultados obtidos pelos processadores mais velozes.
Fizemos o teste do Phenom II X6 1090T e do Phenom II X4 965 no mesmo sistema, trocando apenas
o processador. A configuração em ambos os testes foi:
O PCMark Vantage realiza oito bateria de testes, com duração total de 1 hora e meia (no nosso caso,
pois o tempo total depende da velocidade dos componentes testados). De todos os testes, aquele mais
importante para comparação de processadores é o primeiro (índice PCMark). Nos nossos testes o
índice obtido pelo Phenom II X6 foi 6,5% mais veloz. Note que esse é um benchmark de sistema, e
não sintético.
A maioria dos testes realizados pelo PCMark exige trabalho pesado de menos de quatro núcleos,
quando o desempenho fica realmente cerca de 6% maior (3,6 GHz / 3,4 GHz). Nos testes que
exigem o uso de todos os núcleos o Phenom II X6 leva vantagem maior, entretanto o índice
apresentado é a média de todos os testes. Como este programa não é mais um benchmark sintético,
não é dada prioridade aos testes individuais, e sim à média geral.
Nos demais conjuntos de testes, o ganho do Phenom II X6 foi também pequeno em comparação com
o Phenom II X4, e em alguns casos o desempenho foi até um pouco menor. Note que todos esses
testes são influenciados por outros fatores, como o desempenho do disco rígido e da placa de vídeo.
As operações com arquivos no disco rígido sofrem variações de velocidade, dependendo da
localização dos arquivos no disco (trilhas externas apresentam taxa de transferência mais alta).
A simples comparação numérica dos resultados que o Pcmark Vantage apresenta para os modelos
X4 e X6 nos levaria à conclusão de que estaríamos comprando um processador quase duas vezes
mais caro para ter um desempenho apenas 6,5% maior. É uma conclusão equivocada. O ganho
máximo do modelo X6 em relação ao X4 ocorrerá apenas em duas situações:
a) Com programas pesados que aproveitem todos os núcleos ao mesmo tempo, e que sejam
otimizados para usar ao máximo todos os núcleos, como é o caso do Handbrake
b) Quando forem usados vários programas pesados, os núcleos tendem a ficar todos com máxima
utilização, então o modelo de 6 núcleos ganhará do modelo de 4 núcleos. Por exemplo, rodar um
jogo 3D moderno ao mesmo tempo em que é feita a codificação de um lote de arquivos de vídeo.
Fora esses dois casos, o modelo de 6 núcleos (e o de 4 também) estará sub-aproveitado. É também
verdade que:
a) Para um computador parado, um modelo avançado é 0% mais veloz que um modelo simples.
b) Para digitação de texto e tarefas simples, um modelo avançado é 0% mais veloz que um modelo
simples.
De fato, ao realizar seus testes, o programa PCMark Vantage não utiliza todos os núcleos do
processador. Muitas das suas tarefas dependem mais do desempenho do vídeo e do disco rígido, e
em grande parte de tempo não mantém todos os núcleos do processador ocupados. Veja por exemplo
o gráfico de uso da CPU durante a execução do PCMark Vantage, na figura 9.
No exato instante mostrado na figura 9, o uso total do processador está marcando 99%. Realmente os
gráficos dos seis núcleos, na sua parte direita, estão próximos a 100%. Entretanto ao longo do tempo,
considerando os gráficos por completo, vemos que quase sempre os núcleos estão apenas
parcialmente ocupados. Sendo assim, o processador de 6 núcleos não mostra todo o seu potencial.
O índice de desempenho é uma média obtida nos vários testes, e naqueles que usam menos núcleos,
a pontuação será igual à dos processadores mais simples. Por um lado isso é correto, pois nem
sempre um usuário utilizará tarefas pesadas que demandam trabalho de todos os núcleos. Por outro
lado, é injusto usar este método para fazer a avaliação de um processador, já que o usuário pode estar
interessado exatamente nas aplicações de atividade mais intensa, que aproveitam ao máximo todos
os núcleos. Como vemos a coisa é complexa, e não devemos levar em conta somente o índice final
obtido para comparar processadores.
O programa PCMark Vantage, infelizmente, não pode ser considerado um software totalmente
preciso para avaliar a performance individual de um processador. Vamos justificar porque,
aproveitando para comentar um concorrente Intel do Phenom II X6 1090T, o Core i7 930. Este
processador ocupa a mesma faixa de preço que o Phenom II X6 1090T. Apesar dos clocks dos seus
núcleos serem 2.8 GHz, apresenta desempenho sensivelmente maior, de acordo com o PCMark
Vantage.
Nos testes realizados, usamos o mesmo disco rígido (Seagate 1,5 TB) e a mesma placa de vídeo
(HIS 5850) dos testes do Phenom II. De acordo com o PCMark Vantage, o sistema da Intel
apresentou ganho de desempenho na maioria dos testes. O índice geral PCMark apresentou ganho de
11,2%. O problema é que esses resultados variam de acordo com a configuração de hardware usada
no teste. Veja por exemplo os resultados apresentados para esses três processadores nos nossos testes
e em testes feitos pelo Tom’s Hardware Guide, que são considerados bastante precisos. Adicionamos
na tabela os índices relativos ao processador Phenom II X4 965.
Em veículos diferentes, com placas de vídeo e HDs diferentes, o Phenom II X6 1090T mostrou-se
6,5% mais rápido ou 0,2% mais lento que o X4. O Core i7 930 mostrou ser 18,5% ou 12,7% mais
rápido. É correto afirmar que cada núcleo do Core i7 é mais veloz que cada núcleo do Phenom II
com mesmo clock. A vantagem do Core i7 é mais acentuada quando lembramos que o clock do
Phenom II X6 do nosso exemplo é 3,2 GHz (3,6 com Turbo Core) contra 2,8 GHz (3,06 com Turbo
Boost) do Core i7.
Mas nosso objetivo aqui não é iniciar mais uma das discussões Intel x AMD, já bastante populares.
Antes de festejar o ganho de performance do i7, é preciso também comparar o seu preço, o preço da
placa mãe, levar em conta que estão sendo usados 3 módulos (triplo canal, com 6 GB que talvez
raramente sejam necessários, quando 4 GB com duplo canal atenderia muito bem e apresentaria
custo menor).
O que queremos mostrar aqui é a dificuldade do PCMark Vantage em apresentar medidas realistas
para a velocidade do processador. Veja por exemplo o que acontece nos testes do Core i7 quando
trocamos a placa de vídeo. Fizemos os testes em condições semelhantes, mas usando placas com
chips GeForce 7600 GTS e ATI 5850.
Tabela 11: A placa de vídeo afeta os resultados dos testes do processador
O mesmo Core i7 930 recebeu do PCMark Vantage um índice de performance 9% maior quando
executou os testes com uma placa de vídeo veloz. Observe na penúltima linha da tabela o motivo
disso: o índice GPU Gaming com a ATI 5850 foi 58,883 FPS, enquanto com a placa GeForce 7600
apresentou apenas 7,054 FPS. Com a placa mais rápida, o índice PCMark Gaming foi quase 3 vezes
maior (304,49 contra 106,82) e daí veio o ganho de 9,2% sobre o mesmo sistema com a placa de
vídeo mais simples.
De um modo geral, usar placas de vídeo e discos rígidos mais velozes tendem a acentuar as
diferenças entre processadores diferentes, enquanto usar placas de vídeo e discos rígidos mais lentos
tendem reduzir as diferenças. Por tudo isso é difícil avaliar com precisão, quanto um processador é
mais veloz que outro, pelo menos com o PCMark Vantage.
Por tudo isso, consideramos que o velho programa PCMark 2005, para Windows XP e limitado a
testar quatro núcleos, apresenta resultados mais precisos na avaliação de processadores. É também
um programa que apresenta resultados que não dependem da velocidade do disco rígido e da placa
de vídeo, e sim, do processador e da memória. Apresentamos então as medidas feitas nos dois
processadores Phenom II e no Core i7 930, todos com o HD Seagate de 1,5 TB e placa de vídeo HD
5850.
Tabela 12: Comparação com o i7, feita com o PCMark 2005
O resultado obtido com este velho programa mostra uma vantagem dos processadores Phenom II X4
e X6 na maioria das aplicações que usam um ou dois núcleos. Já nas aplicações que usam quatro
núcleos, existe alguma vantagem no Core i7.
Os resultados acima são bem interessantes. É bem sabido no meio técnico que o Core i7 leva
vantagem sobre o Phenom II X4 e o Phenom II X6 em uma comparação clock por clock. As medidas
realizadas entretanto mostram que nem sempre isso é assim. Com o Turbo Core, o Phenom II X6
1090T tem seu clock elevado para 3,6 GHz nas aplicações que demandam esforço de até 3 núcleos,
enquanto o Core i7 930 vai para 3,06 GHz com o Turbo Boost. Uma vantagem de quase 20% no
clock faz os núcleos do Phenom II levarem vantagem sobre o Core i7.
Essa discussão deve levar os leitores a refletirem sobre a questão de desempenho. Cada usuário
individualmente nem sempre tem dois processadores rivais para comparar, em sistemas semelhantes.
Nós que temos os processadores em mãos, nem sempre temos os programas que interessam ao
usuário. Um meio termo interessante é o realizado no Tom’s Hardware Guide, que faz testes
exaustivos em praticamente todos os modelos de processadores (já que os recebe para avaliação com
mais facilidade).
Replicamos aqui os resultados de alguns testes de benchmark feitos com alguns processadores Intel e
AMD. Todos os da tabela são de 4 núcleos, exceto o Phenom II X6, de 6 núcleos. Não foram feitos
testes com o i7-930, mas replicamos os resultados do i7-920 e do i7-940, que são modelos próximos.
Mostramos também os resultados do i5-750, que tem se mostrado uma excelente opção de 4 núcleos.
As tabelas mostram que em alguns casos o Phenom II X6 leva vantagem, em outros tem dificuldades
para competir com o i7, e algumas vezes até com o i5 de 4 núcleos (lembre-se que existem vários
modelos de i5 com 2 núcleos).
Tabela 13: Comparação de processadores
Temperatura
Assim como ocorre com o Phenom II X4, o Phenom II X6 1090T é um processador bem quente.
Dissipa 125 watts e suporta uma temperatura máxima de 62°C. Em caso de uso extremo, esta
temperatura máxima é facilmente atingida. Devemos tomar os cuidados usuais com a refrigeração do
processador e do gabinete.
Fizemos um teste visando a levar o Phenom II X6 à sua temperatura limite. Ao invés de instalar o
cooler que o acompanha na versão BOX, usamos inicialmente um cooler simples, típico de
processadores AMD que dissipam 65 watts ou menos.
Figura 13 - Cooler inadequado para o Phenom II X6
Usamos no gabinete um cooler traseiro de 12 cm expulsando o ar quente para fora, uma fonte de
alimentação com ventilador interno e duto lateral de ventilação no gabinete, apesar do cooler ser
inadequado. O ambiente estava à temperatura de 27°C. Depois de alguns minutos com o computador
inativo, o interior do gabinete estabilizou sua temperatura em 42°C, com processador estabilizado a
44°C. Colocamos em execução o programa Handbrake para fazer uma codificação de vídeo,
mantendo os seis núcleos com taxa de utilização acima de 95%. O gabinete permaneceu a 42°C ao
longo do teste, mas o processador esquentou bastante em poucos minutos:
Em apenas quatro minutos o processador atingiu sua temperatura máxima permitida. Interrompemos
o teste para evitar danos. Na verdade o processador tem uma proteção interna, reduzindo o seu clock
quando a temperatura máxima é atingida. Ainda assim, como o processador foi emprestado pela
AMD para o teste, resolvemos exagerar no cuidado.
Fizemos a seguir a instalação do cooler correto para este processador, mostrado na figura abaixo. Na
verdade a AMD enviou o processador sem cooler, usamos então o cooler de um outro Phenom II X6
disponível em nosso laboratório.
Figura 14 - Cooler correto do Phenom II X6 1090T
Repetimos os testes nas mesmas condições, e dessa vez a temperatura ficou estabilizada em 51°C.
As condições de temperatura desse segundo teste foram:
Apesar da sua elevada dissipação de 125 watts, o processador teve sua temperatura estabilizada em
51°C, ficando apenas 12°C acima da temperatura interna do gabinete. Ainda temos uma margem de
11°C até chegar à temperatura máxima suportada pelo processador, mesmo com quase 100% de
ocupação nos 6 núcleos. Isso tudo só pode ser conseguido com o uso do cooler correto e com os
cuidados usuais com a ventilação do gabinete.
Conclusão
É fato que um núcleo de processador moderno Intel é mais veloz que um núcleo de processador
moderno da AMD de mesmo clock. A AMD compensa essa diferença oferecendo processadores
com custo menor. Há poucos anos atrás, os processadores mais novos recém lançados, tanto da
AMD quanto da Intel, custavam cerca 1000 dólares em lotes de 1000 peças (E.U.A). O Phenom II
X6 1090T custa menos que 300 dólares, também em lotes de 1000 peças.
Apesar de não competirem diretamente com os modelos mais velozes da Intel, que são bem mais
caros, os novos processadores de 6 núcleos da AMD não fazem feio quando comparados a
processadores Intel de custo semelhante. Como podem ter desempenho similar com clocks menores,
os processadores Intel que rivalizam com o Phenom II X6 em preço e desempenho apresentam outro
ponto favorável: a baixa dissipação de calor.
Isso é em parte conseqüência do uso do processo de fabricação Intel com transistores de 32 nm,
enquanto a AMD ainda está usando o processo de 45 nm. Com a adoção do processo de 32 nm, a
AMD poderá oferecer outras vantagens, como redução de dissipação de calor e redução de custo.
Bibliografia:
http://blogs.forumpcs.com.br/laercio_vasconcelos/2010/08/06/editando-
review-phenom-ii-x6/7/