Você está na página 1de 24

Introdução

Os mais avançados processadores da Intel e da AMD têm agora 6 núcleos. A AMD usa oficialmente
o termo “six-core”, mas é comum encontrar entre os usuários, referências como “hexacore” ou “hex-
core”, todas são aceitas. Antes dos novos processadores, o modelo mais avançado da AMD era o
Phenom II X4 modelo 965, de 3,4 GHz. Os novos modelos de 6 núcleos são oferecidos com as
velocidades de 2.8 e 3.2 GHz, e trazem uma novidade, o recurso “Turbo Core”, em resposta ao
Turbo Boost da Intel.

Figura 1 – Phenom II X6 de 3.2 GHz, modelo HDT90ZFBK6DGR

A AMD enviou para testes um modelo comercial de 3,2 GHz, ao contrário das amostras de
engenharia comuns em reviews. São os seguintes os primeiros modelos lançados. Os preços citados
são os médios das lojas do Centro do Rio de Janeiro, que constam no site www.boadica.com.br.

Tabela 1: Modelos do Phenom II X6

Os três modelos possuem as seguintes características comuns:

Tabela 2: Características do Phenom II X6

Note que existem dois modelos 1055T (2.8 MHz). O segundo deles mostrado na tabela
(HDT55TWFGRBOX) leva duas vantagens sobre o primeiro: Dissipa apenas 95 watts, contra 125
watts do outro, e suporta temperatura máxima de 71°C, contra apenas 62°C do outro. Para quem está
interessado neste processador, é bom anotar este código para checar na ocasião da compra. Observe
ainda que o modelo de 3.2 GHz é “Black Edition”, ou seja, suporta programação do seu
multiplicador interno por software, o que é muito útil para quem pretende fazer overclock.

Preço e performance
O Phenom II X6 é uma opção interessante para quem usa muitas aplicações que sejam beneficiadas
por múltiplos núcleos. As principais são edição de vídeo e geração de conteúdo de multimídia. Nem
sempre é o caso dos jogos, já que a maioria deles opera bem com dois núcleos, e são muito mais
beneficiados por uma placa de vídeo veloz que por um super processador. As opções de 6 núcleos da
Intel (Core i7 Extreme 980X e 970X) ainda são muito caras. A AMD ainda não consegue competir
com esses processadores mais velozes da Intel, pois ainda usa o processo de 45 nm. Os modelos
mais novos da Intel já usam 32 nm. Esse problema resulta em limitações de compromisso entre
clock, potência máxima e custo.

Ainda assim, os modelos mais avançados da AMD apresentam boa relação custo-benefício se
comparados com os modelos de quatro núcleos da Intel, ou seja, dada uma quantia fixa, é quase
sempre possível conseguir um processador mais rápido da AMD que se fosse escolhido um modelo
da Intel.

Figura 2 – Pastilha de silício do Phenom II X6

A figura 2 mostra o die do Phenom II X6. Nele podemos identificar facilmente os seis núcleos, cada
um com sua cache L2 de 512 KB, e a grande área à direita, que corresponde à cache L3 de 6 MB,
compartilhada entre os núcleos. Em relação aos jogos, podemos constatar que muitos deles, mesmo
modernos, operam bem com um ou dois núcleos.

As razões são óbvias: os desenvolvedores de jogos sofrem duas pressões de lados opostos. De um
lado, querem melhorar o realismo gráfico. De outro lado, querem que seus produtos possam ser
usados na maioria dos computadores atuais. Muitos deles possuem processadores de dois núcleos,
não podemos ainda considerar os processadores de quatro núcleos como populares. Já as placas de
vídeo velozes são bem mais comuns. Por isso a maioria dos benchmarks publicados sobre
desempenho para processadores diferentes apresenta variações pequenas em função do processador,
como o benchmark do GTA 4 publicado no Toms’s Hardware Guide.
Figura 3 – Na maioria dos casos, o desempenho em jogos depende mais da placa de vídeo que do
processador (GTA 4).

Sabemos que para a maioria dos jogos, o desempenho para execução de jogos 3D é mais
influenciado pela placa de vídeo que pelo processador. Existem algumas exceções, como os jogos
que usam intensamente inteligência artificial e física de movimentos, o que deixa o processador mais
ocupado.
Figura 4 – Em alguns casos o desempenho do processador afeta mais o desempenho 3D (Far Cry)

Como os processadores de 6 núcleos são hoje considerados “topo de linha”, a maioria dos jogos
ainda levam em conta que podem usar na média, entre 2 e 4 núcleos. A figura 5 mostra o gráfico de
uso da CPU durante a execução do jogo DIRT 2 durante uma corrida.

Observamos que todos os núcleos foram usados, mas a soma das taxas de utilização ficou em torno
de 300%, portanto tenderia a usar 3 núcleos ao máximo. Podemos considerar que um processador de
6 núcleos tem plenas condições para executar com eficiência os jogos mais avançados atuais e a
nova geração dos próximos anos.
Figura 5 – Uso dos núcleos em um Phenom X6 pelo jogo DIRT2

Não podemos estabelecer uma regra geral infalível entre desempenho 3D, placa de vídeo e
processador. Na maioria dos casos, o trabalho maior é da placa de vídeo, portanto seria melhor
comprar um processador moderado e gastar mais em uma placa de vídeo mais avançada. Em alguns
casos, o processador mais avançado será mais aproveitado.

Cada um é responsável por descobrir a demanda de CPU dos seus jogos prediletos para decidir se
investe em um processador mais avançado, ou economiza um pouco aqui para comprar uma placa de
vídeo melhor. Uma coisa é certa, em qualquer caso: uma placa de vídeo avançada sempre será um
bom investimento para quem gosta de jogos 3D. Um processador super avançado e caro nem sempre
será um bom investimento.

Turbo Boost e Turbo Core


Quando todos os núcleos estão operando com carga de trabalho de 100%, o processador atinge seu
máximo valor de potência elétrica, ou seja, é máximo o seu aquecimento. Como sabemos, são dois
os fatores que limitam o clock máximo de um processador: estabilidade em altas freqüências e
dissipação de calor. O uso de coolers avançados é a solução para o problema do calor, mas ainda
existe a questão do correto funcionamento dos circuitos em altas freqüências. Os núcleos dos
processadores AMD atuais podem funcionar com até 3,6 GHz, e em alguns casos até 4.0 GHz. O
problema é que quando todos os núcleos operam com essa velocidade, o processador fica muito
quente e pode “fritar”, apesar dos circuitos internos terem tempo de resposta suficientemente rápido
para operar corretamente nessas velocidades, se não fosse o problema do calor.

O Turbo Core é um recurso introduzido pela AMD no Phenom II X6 que já estava presente nos
modelos de 6 núcleos do Core i7 Extreme. Quando três ou mais núcleos estão com baixa carga de
trabalho (e portanto, gerando pouco calor), os núcleos restantes (1, 2 ou 3) poderão aumentar seu
clock (e aquecer mais) sem entretanto ultrapassar a máxima potência permitida. Esse aumento é feito
dinamicamente, de forma automática. Os modelos de 2.8 GHz terão seu clock aumentado para 3.2
GHz, e os modelos de 3.2 GHz terão o clock aumentado para 3.6 GHz.

A partir do momento em que existem quatro núcleos com utilização intensa (o mesmo vale para 5 ou
6), o Turbo Core é desativado momentaneamente, e o clock volta ao seu valor normal. Isso resulta
em um aumento de desempenho de pouco mais que 10% nas aplicações que exigem no máximo três
núcleos. Podemos considerar este recurso como uma espécie de overclock oficial controlado.

Dificuldades com o novo processador


Tivemos algumas dificuldades (solucionadas de forma simples) com este novo processador. São
dificuldades típicas que ocorrem quando é instalado um novo processador em uma placa mãe já
existente. Antes de testar o Phenom II X6, montamos um sistema para testar o Phenom II X4,
baseado na placa mãe MSI 790GX-G65. Com a chegada do novo processador, bastaria fazer a
substituição e repetir os testes de benchmark.

Entretando, foi necessário fazer uma atualização de BIOS e instalar o driver do processador (apenas
para testes sob o Windows XP, pois o Windows 7 já tem driver de processador apropriado). Sem
fazer a atualização de BIOS, o processador era reportado como um modelo desconhecido. A placa
mãe reduzia automaticamente a velocidade do processador para 800 MHz.
Figura 6 – Sem atualizar o BIOS, nem o Windows 7 mostra o processador corretamente

A princípio não notamos problema no fato do Gerenciador de dispositivos do Windows 7 ter


mostrado o processador como “model unknown” (figura 6), pois isso é comum nas amostras de
engenharia. Entretanto, o processador que recebemos não era uma amostra de engenharia, mas um
modelo comercial. O Windows precisa de alguma informação do BIOS a respeito do processador
para reconhecê-lo corretamente e usar seus recursos. Depois da atualização do BIOS, o processador
passou a ser reconhecido corretamente no Windows 7. O problema não ocorria com a placa Asus
CrossHair, enviada pela AMD junto com o processador, pois seu BIOS já estava atualizado.

Outra dificuldade encontrada no sistema com a placa MSI foi uma queda de desempenho em
comparação com o Phenom II X4 965 nas aplicações que usam até 4 núcleos. Este Phenom II X4
tem clock de 3.4 GHz. O Phenom II X6 tem clock de 3.2 GHz, mas nas aplicações para até 3
núcleos, o clock é aumentado para 3,6 GHz graças ao Turbo Core, o que resultaria em um aumento
de desempenho de aproximadamente 5% para essas aplicações. O que ocorreu entretanto foi o
contrário: o desempenho diminuiu 9% ao invés de aumentar 5%, nas aplicações com 1 ou 2 núcleos.

Para fazer essas comparações, usamos valores obtidos em review anterior, baseado no programa
PCMark 2005, que analisa processadores de até 4 núcleos. Ocorre que este programa opera sob o
Windows XP, e por isso tivemos que usar este sistema. O driver de processador que acompanha o
Windows XP é de 2004. O Windows 7 já vem com o driver mais novo da AMD para processadores
multicore, que é de 2007 (não existe versão mais nova por enquanto). Devido ao uso do driver
antigo, o processador teve seu desempenho reduzido, independentemente do BIOS estar atualizado
ou não. O problema ocorreu com ambas as placas mãe usadas no teste.

Pior ainda foi o que ocorreu nas medidas que envolviam quatro núcleos. Quando quatro ou mais
núcleos do Phenom II X6 estão em plena atividade, o Turbo Core é desligado, fazendo com que seu
clock seja reduzido para a velocidade normal, no caso 3.2 GHz. Deveria reduzir em 5%, entretanto a
redução no desempenho foi de cerca de 15%. A instalação do “AMD Processor Driver” de versão
mais recente, obtida no site da AMD, resolveu os problemas, e as medidas de desempenho passaram
a apresentar os valores esperados.

O computador com o Phenom II X6 também apresentou problemas de desligamento enquanto não


era feita a atualização de BIOS e a instalação do driver do processador. O micro simplesmente não
desligava com o comando normal de desligamento do Windows, mesmo esperando vários minutos.
Era preciso desligar “na marra” (chave power ou pressionar o botão Power por mais de 4 segundos).
Com a atualização de BIOS e de driver, o problema foi resolvido.

Tudo isso confirma a importância de regras cruciais em upgrade: verificar no site do fabricante da
placa mãe se é necessário fazer uma atualização de BIOS, verificar se a placa mãe suporta o novo
processador, e verificar se é necessário atualizar o driver do processador.

Comparação com o Phenom II X4


Sempre que é lançado um novo processador é importante fazer a sua comparação com modelos da
geração anterior. Existem alguns casos históricos de modelos novos que eram piores que os
anteriores:

AMD K6-2/550 era só 30% mais rápido que o K6-2/300

Pentium 4 era mais lento que o Pentium III de mesmo clock

Pentium 4 Prescott tinha o mesmo desempenho do Pentium 4 Northwood de mesmo clock

Especificamente nos testes com o Phenom II, temos testado se a geração nova trazia vantagens em
relação à anterior. Não gostaríamos de ver coisas do tipo “é mais lento que o anterior quando usa
dois núcleos, mais quando usa todos os núcleos é bem veloz…”. No nosso primeiro artigo sobre o
Phenom, feito no seu lançamento, mostramos que é bem mais veloz nas aplicações para um ou dois
núcleos em comparação com o Athlon 64 X2 de mesmo clock. Nas aplicações para quatro núcleos, o
desempenho mais que dobra, em comparação com o uso de dois núcleos. Quando analisamos o
Phenom II X4, mostramos que é sensivelmente mais veloz que o Phenom X4 de mesmo clock.

Agora, ao analisar o Phenom II X6, precisamos responder duas perguntas importantes:

1) Nas aplicações que usam até 4 núcleos, o Phenom II X6 tem desempenho maior ou igual ao do
X4? A resposta é SIM, totalmente, como mostraremos a seguir.

2) Nas aplicações que usam 6 núcleos, o Phenom II X6 é 50% mais rápido (6 contra 4) que o
Phenom II X4 de mesmo clock? A resposta é SIM, porém ainda são poucas as aplicações que tiram o
máximo proveito de todos os núcleos do processador. As principais aplicações que aproveitam todos
os núcleos são as que lidam com codificação de vídeo.

Comparação com o X4, usando até 4


núcleos
O Phenom II X6 é realmente um processador superior ao Phenom II X4 de mesmo clock. Tomemos
como exemplo o Phenom II X4 mais veloz, que é o modelo 965, de 3.4 GHz, e o Phenom II X6 mais
veloz até o momento, que é o modelo 1090T, de 3.2 GHz. Graças ao Turbo Core, o X6 tem seu
clock aumentado automaticamente para 3,6 GHz em aplicações que usam até 3 núcleos, o que de
certa forma tornaria a comparação injusta.
Vejamos os resultados dos benchmarks realizados com o programa PCMark 2005, sob o Windows
XP. A versão mais nova deste programa é o PCMark Vantage, que roda sob Windows Vista e
Windows 7, porém não apresenta resultados tão detalhados quanto a versão 2005. Por outro lado, a
versão 2005 apresenta testes apenas para processadores de até quatro núcleos. Como nosso objetivo
nesse teste é avaliar o desempenho do X6 nas aplicações que usam até 4 núcleos, este é o programa
mais indicado.

A tabela abaixo mostra os resultados. Os testes foram feitos em uma placa MSI 790GX-G65 com 4
GB de memória DDR3/1600. Testes feitos com memória mais lentas (1333) apresentaram resultados
praticamente idênticos, graças à cache L3.

PC Mark 2005

Tabela 3: Medidas de desempenho com o PCMark 2006 no Phenom II X5 e Phenom II X6

Os resultados foram muito interessantes e dentro do esperado. Nos testes de 1 a 6 (processamento


com um núcleo) e 7 (processamento com dois núcleos), o ganho de desempenho foi de cerca de
5,2%. É praticamente igual à proporção entre os clocks (3,6 GHz / 3,4 GHz = 1,059, ou seja,
+5,9%).

Nas aplicações que usam quatro núcleos, o Phenom II X6 desativa o Turbo Core e volta a operar
com seu clock normal de 3,2 GHz. A queda média de desempenho em relação ao X4 foi de 5,4 %,
que é aproximadamente a mesma queda correspondente à proporção entre os clocks (3,2 GHz / 3,4
GHz = 0,941, que corresponde a uma queda de 5,9%). Concluímos que o X6 apresenta ganho de
desempenho proporcional à variação de clock, isso comprova a sua escalabilidade, ou seja, termos
um desempenho maior na mesma proporção do aumento de clock. Parece algo óbvio, mas é bom
sempre conferir essas medidas nos novos processadores devido ao histórico de “inflação de GHz”
(aumento de desempenho não acompanhava o aumento de clock). ocorrida em alguns casos nos
últimos anos.

Com 5 núcleos em uso, o ganho de desempenho será hipoteticamente 25%, e com 6 núcleos será
também hipoteticamente 50%, como checaremos mais adiante. Portanto o Phenom II X6 de 3,2
GHz, em comparação com o Phenom II X4 de 3,4 GHz apresentará ganhos de cerca de 5% quando
operar com até 3 núcleos, queda de 5% ao operar com 4 núcleos, e ganhos de 25% e 50% ao operar
com 5 ou 6 núcleos.

Note que esses são resultados de um benchmark sintético. Na prática cenários diferentes podem
ocorrer. Se usaremos por exemplo um disco rígido lento, pouca memória ou no caso de jogos, uma
placa 3D simples, os resultados serão comprometidos. Não haverá diferença entre os dois
processadores nas operações que envolvem o uso da Internet, pois o fator limitante nesse caso é a
velocidade da conexão, não do processador.

Ainda saindo dos limites das análises sintéticas, o processamento no mundo real com 6 núcleos
poderá ser mais vantajoso que com 4 núcleos. Considere a realização de duas tarefas pesadas:
codificação de múltiplos arquivos de vídeo e o uso de um jogo 3D pesado. Usamos no nosso teste o
jogo DIRT2, considerado um dos mais pesados em termos de gráficos e de uso do processador.
Medidas feitas com o Gerenciador de Tarefas do Windows 7 mostraram que este jogo usa somente
dois núcleos do processador, mesmo que existam mais núcleos disponíveis.

Suponha que você vai usar este jogo ao mesmo tempo em que faz uma codificação de múltiplos
arquivos de vídeo (por exemplo, converter múltiplos arquivos AVI, WMV, MOV e outros para
formato de iPOD). Se o jogo está usando 2 núcleos, um Phenom II X4 ficará com dois núcleos
disponíveis para fazer a conversão de vídeo, enquanto o Phenom II X6 ficará com 4 núcleos
disponíveis para o mesmo trabalho. Leve em conta que outros jogos modernos poderão usar mais
núcleos, daí seria maior ainda a vantagem em usar um modelo X6 ao invés de um modelo X4. Note
que estamos fazendo análises com o Phenom II, mas princípio semelhante se aplica aos modelos da
Intel.

O problema é que os modelos de 6 núcleos da Intel são muito mais caros, e os núcleos HT não são
reais e não aumentam o desempenho. Um Core i7 com 4 núcleos HT não é equivalente a um
processador de 8 núcleos, vamos considerar que seja equivalente a um de 5 núcleos, levando em
conta um aumento de 25% no desempenho graças aos “núcleos virtuais” do HT. A análise de
desempenho X núcleos nos processadores Intel é assunto interessante para outro artigo.

Voltando à comparação com o X4, fizemos também testes sem o Turbo Core, que seriam mais
“justos”. Desativamos o Turbo Core no CMOS Setup, o que deixaria os núcleos do X6 operando a
3.2 GHz em qualquer caso. Como o X4 do nosso teste é de 3.4 GHz, seria mais justo reduzir seu
clock para 3,2 GHz para ficar igual ao do X6. Optamos por manter o X4 a 3.4 GHz e aumentar o
clock do X6 para 3.4 GHz pelo CMOS Setup, o que é permitido pois trata-se de um modelo Black
Edition. Aqui estão os resultados obtidos, com ambos a 3,4 GHz:

Tabela 4: Medidas de desempenho com o PCMark 2005 no Phenom II X4 e Phenom II X6


As diferenças obtidas foram inferiores a 1%, para mais ou para menos, usando sistemas idênticos.
Podemos então considerar que a AMD não “estragou” o X4 com overhead na sua arquitetura ao
desenvolver o modelo de 6 núcleos.

Falta agora mostrar o ganho obtido com 6 núcleos em comparação com o modelo de 4 núcleos nas
aplicações que aproveitam todos os núcleos. Façamos inicialmente as medidas de desempenho com
o programa PCMark Vantage sob o Windows 7.

6 núcleos contra 4
Infelizmente a maioria dos programas atuais não estão otimizados para aproveitar 6 núcleos. Na
verdade muitos deles nem mesmo chegam a aproveitar 4 núcleos com todo o seu potencial. Isso era
diferente na época do lançamento dos primeiros processadores de dois núcleos. Graças ao
lançamento do Hyper-Threading, dois anos antes, os fabricantes de software tiveram tempo para
otimizar seus programas.

Quando chegaram os processadores de dois núcleos, a maioria deles conseguiu dobrar ou quase
dobrar o desempenho nas aplicações mais beneficiadas pela velocidade do processador, como o
processamento de imagem, vídeo e áudio, sobretudo os CODECs de vídeo. Hoje isso nem sempre é
verdade. Para aproveitar melhor os vários núcleos do processador é preciso instalar versões mais
novas dos programas, ou esperar pelas versões otimizadas.

Veja por exemplo o caso do programa XiliSoft Vídeo Converter Ultimate. Esse programa converte
vídeos entre formatos diferentes. Por exemplo, podemos baixar arquivos WMV, RMVB, AVI ou
mesmo usar arquivos VOB de DVDs, e convertê-los para praticamente qualquer formato existente.
Fizemos um teste convertendo 270 arquivos AVI codificados em DIVX 6.8, todos com resolução de
640×480, para formato 320×240 codificados em H.264, compatível com iPOD. As conversões foram
feitas na mesma máquina, mas usando dois processadores diferentes:

Tabela 5: Nesta tarefa o X6 teve pequena vantagem sobre o X4

Como o Video Converter Ultimate pode usar todos os núcleos do processador, deveria fazer o
trabalho de conversão com uma velocidade 50% maior com 6 núcleos que com o uso de 4 núcleos.
Ao invés de 9 minutos, deveria operar na faixa de 6 minutos, entretanto o tempo total de conversão
foi de 8 minutos e meio. O motivo da discrepância é que este programa, assim como a maioria deles,
não usa plenamente todos os núcleos do processador, como podemos aferir com o Gerenciador de
Tarefas.
Figura 7 – Programa não usa totalmente os núcleos do processador.

O histórico de uso do processador durante a execução dos programas apresentou uma utilização
média de 70% em cada núcleo. Daí vem a diferença pequena no desempenho com 4 e com 6
núcleos.

Mais uma vez lembramos que essa análise se aplica ao caso de um só programa “pesado” usando
todos os núcleos do processador. Em um cenário mais comum, podemos ter dois ou mais programas
pesados. Com mais núcleos disponíveis, um sistema com 6 núcleos levaria vantagem sobre um
sistema com 4 núcleos, independentemente dos programas utilizados.

Figura 8 – Conversão de DVD para AVI com FlaskMPEG e DIVX 7.0

A figura 8 mostra medidas de utilização dos núcleos do Phenom II X6 durante uma conversão de
vídeo (DVD para AVI com os programas FlaskMPEG e DIVX 7.0). Nesse tipo de conversão, a
maior parte do trabalho cabe ao DIVX, que faz a codificação, tarefa que é muito mais pesada que a
decodificação dos arquivos MPEG-2 do DVD. Para a medida ser justa, temos que descartar a lenta
operação de leitura do DVD. Por isso antes de iniciar a conversão, fizemos a cópia do conteúdo do
DVD para o disco rígido usando o programa DVD Decrypter.

Observe que a taxa de utilização do processador não chega a 100%, fica com a média de 80%, ou
seja, o programa não é totalmente otimizado para usar todos os núcleos do processador ao máximo,
por isso não podemos obter um o ganho máximo teórico para uso de 6 núcleos contra 4 núcleos, que
seria +50% (considerando clocks iguais).

Codificação de vídeo com o Handbrake


Já sabemos que nem todos os programas pesados aproveitam todos os núcleos do processador.
Também sabemos que, mesmo entre os que usam todos os núcleos disponíveis, nem sempre são
otimizados para que seu uso seja 100%, o que resultaria na maior velocidade. Devemos levar em
conta que quando usamos certos programas pesados como codificadores de vídeo, nem sempre
desejamos deixar o computador voltado apenas para esta tarefa, e sim, continuar a usá-lo
normalmente enquanto a conversão é feita em segundo plano.
Talvez por isso os fabricantes de programas nem sempre dão prioridade a usar todos os núcleos do
processador ao extremo. Seja como for, seria muito bom testar um programa que use ao extremo os
núcleos do processador para checar se o modelo de 6 núcleos “escala” em comparação com o
modelo de 4 núcleos, ou seja, se o ganho de performance é proporcional ao aumento de clock e ao
aumento do número de núcleos. Para um programa que obedeça esta regra, o ganho de performance
obtido em um Phenom II X6 em comparação com um Phenom II X4 deveria ser igual a:

Ganho = (clock do x6 x 6) / (clock do x4 x 4)

Comparando o Phenom II X6 de 3.2 GHz com o Phenom II X4 de 3.4 GHz ficaria:

(3.2 x 6) / (3.4 x 4) = 1,41, ou seja, 41% mais veloz

Seria 50% mais veloz se ambos os processadores operassem com o mesmo clock.

Usamos para verificar o ganho de performance com o uso dos 6 núcleos o programa Handbrake,
obtido em http://handbrake.fr. Este programa é um conversor de vídeo gratuito. Não é um conversor
universal. Aceita vários formatos de arquivos de vídeo como entrada, mas gera apenas arquivos de
saída nos formatos MP4 e MKV.

Figura 9 – Medida de desempenho com o programa HandBrake

Nosso teste é mostrado na figura 9. Fizemos a conversão de um arquivo AVI com duas horas de
duração e 6000kbps (5,8 GB) e resolução de 720×480. O arquivo gerado tem formato MP4. Note
que o gerenciador de tarefas mostra ao longo do tempo, uma taxa de utilização de quase 100% para
os seis núcleos. É mostrada na janela de CMD.EXE acima a taxa instantânea e a taxa média de
conversão. A média ficou em 159 fps com 6 núcleos. Fizemos as mesmas medidas com 6 núcleos
(3.2 GHz) e com 4 núcleos (3.4 GHz) e foram obtidos os seguintes resultados:

Tabela 6: X6 teve ganho de 38%

O ganho observado foi:

159 / 115 = 1,38, ou seja, 38% mais veloz

É um resultado bem próximo dos 41% teóricos. O fato de não ter sido alcançado o resultado
esperado (41%) pode ter várias explicações:
a) O programa não está totalmente otimizado para os 6 núcleos
b) O fato da cache L3 ser 6 MB nos dois casos pode prejudicar a escalabilidade
c) O tempo gasto na leitura do arquivo de entrada pode afetar o resultado

O tempo gasto na leitura de um arquivo a ser convertido pode afetar o desempenho total, caso este
arquivo seja grande. No teste realizado, o tempo total de conversão foi de 20 minutos. Como o
arquivo tem quase 6 GB, seria gasto cerca de um minuto na sua leitura, supondo uma taxa efetiva de
100 MB/s. De fato, somente a operação de cópia deste arquivo a partir de um HD externo demorou 3
minutos.

Isso nos motivou a repetir a medida usando um arquivo de vídeo menor. Dessa vez escolhemos um
filme com 1 hora e meia de duração, resolução de 640×480 e 700 MB. Os testes de conversão deste
arquivo para MP4 foram feitos duas vezes, no mesmo computador, inicialmente com um Phenom II
de 4 núcleos, depois com o de 6 núcleos. As medidas em andamento podem ser vistas nas figuras 10
e 11.

Figura 10 – Conversão de vídeo no Phenom II X4

Figura 11 – Conversão de vídeo no Phenom II X6

Nesses testes observamos que a taxa de utilização dos núcleos do processador ficou acima de 97%, o
que mostra que o tamanho grande do arquivo de entrada no teste anterior impedia que o processador
ficasse 100% do tempo ocupado, já que pesava um pouco o tempo de leitura do arquivo.

Os resultados são resumidos na tabela abaixo:

Tabela 7: X6 teve ganho de 40,8%


Ganho = 197,40 / 140,13 = 1,408

O ganho obtido agora foi 1,408, valor praticamente idêntico ao 1,41 calculado de forma teórica. Isso
prova que o novo processador realmente escala o seu desempenho com a utilização de todos os
núcleos, mas é preciso levar em conta:

1) Programas que usam todos os núcleos devem ser otimizados para aproveitamento máximo.
Enquanto os fabricantes não os otimizam, o ganho será inferior ao valor teórico.

2) Mesmo quando programas não foram otimizados, sempre ocorrerá ganho de desempenho quando
usamos múltiplos programas pesados simultaneamente.

3) Outras partes do computador também precisam ser rápidas. No exemplo acima, vimos que o
tempo gasto na leitura do arquivo do disco rígido afetou o desempenho total. Para o computador ser
rápido como um todo, não podemos ter partes causando “gargalos”.

Testes com o PCMark Vantage sob o


Windows 7
O PCMark 2005 é um programa antiquado. Tem mais de 5 anos, só funciona sob o Windows XP e
não avalia corretamente processadores com mais de 4 núcleos. Apesar disso, suas medidas de
desempenho são perfeitamente válidas, e também é um benchmark sintético. Este tipo de benchmark
é o mais adequado quando queremos testar individualmente módulos do computador: processador,
memória, disco rígido, placa de vídeo.

Além dos benchmarks sintéticos, existem também os benchmarks de sistema. Nesse tipo de teste, o
resultado final depende não só do processador, mas também do disco rígido, memória e placa de
vídeo. Dá uma idéia do desempenho do computador como um todo, mas é ineficiente para avaliar
individualmente cada módulo, como o processador, por exemplo.

A versão mais recente de programa de benchmark da Futuremark (produtora do PCMark 2005) é o


PCMark Vantage. Apesar de ser aceito no meio técnico, este programa é atualmente menos um
benchmark sintético e mais um benchmark de sistema. Por exemplo, em um dos testes de CPU existe
o “web page rendering”, no qual páginas de Internet são escritas na tela com máxima velocidade. O
desempenho depende do processador, mas também da placa de vídeo.

Diferenças relativamente grandes são observadas quando usamos placas de vídeo diferentes ou
discos rígidos diferentes. Como resultado, cada processador recebe um índice “CPU Test” que não
depende somente do processador, mas de outros módulos. Para comparar processadores diferentes
seria preciso, em todos os testes, usar placas de vídeo idênticas e discos rígidos idênticos. Além
disso, se a placa de vídeo e o disco rígido não tiverem altíssimo desempenho, penalizarão os
resultados obtidos pelos processadores mais velozes.

Fizemos o teste do Phenom II X6 1090T e do Phenom II X4 965 no mesmo sistema, trocando apenas
o processador. A configuração em ambos os testes foi:

Memória: 4 GB (2 x 2GB) DDR3/1600 em dual channel


HD de 1.5 TB Seagate ST31500541AS
Placa de vídeo HIS Radeon HD 5850 com 1 GB de memória
Windows 7 Ultimate
PCMark Vantage, 64 bits
Tabela 8: Testes do X4 e do X6 com o PCMark Vantage

O PCMark Vantage realiza oito bateria de testes, com duração total de 1 hora e meia (no nosso caso,
pois o tempo total depende da velocidade dos componentes testados). De todos os testes, aquele mais
importante para comparação de processadores é o primeiro (índice PCMark). Nos nossos testes o
índice obtido pelo Phenom II X6 foi 6,5% mais veloz. Note que esse é um benchmark de sistema, e
não sintético.

A maioria dos testes realizados pelo PCMark exige trabalho pesado de menos de quatro núcleos,
quando o desempenho fica realmente cerca de 6% maior (3,6 GHz / 3,4 GHz). Nos testes que
exigem o uso de todos os núcleos o Phenom II X6 leva vantagem maior, entretanto o índice
apresentado é a média de todos os testes. Como este programa não é mais um benchmark sintético,
não é dada prioridade aos testes individuais, e sim à média geral.

Nos demais conjuntos de testes, o ganho do Phenom II X6 foi também pequeno em comparação com
o Phenom II X4, e em alguns casos o desempenho foi até um pouco menor. Note que todos esses
testes são influenciados por outros fatores, como o desempenho do disco rígido e da placa de vídeo.
As operações com arquivos no disco rígido sofrem variações de velocidade, dependendo da
localização dos arquivos no disco (trilhas externas apresentam taxa de transferência mais alta).

A simples comparação numérica dos resultados que o Pcmark Vantage apresenta para os modelos
X4 e X6 nos levaria à conclusão de que estaríamos comprando um processador quase duas vezes
mais caro para ter um desempenho apenas 6,5% maior. É uma conclusão equivocada. O ganho
máximo do modelo X6 em relação ao X4 ocorrerá apenas em duas situações:

a) Com programas pesados que aproveitem todos os núcleos ao mesmo tempo, e que sejam
otimizados para usar ao máximo todos os núcleos, como é o caso do Handbrake

b) Quando forem usados vários programas pesados, os núcleos tendem a ficar todos com máxima
utilização, então o modelo de 6 núcleos ganhará do modelo de 4 núcleos. Por exemplo, rodar um
jogo 3D moderno ao mesmo tempo em que é feita a codificação de um lote de arquivos de vídeo.

Fora esses dois casos, o modelo de 6 núcleos (e o de 4 também) estará sub-aproveitado. É também
verdade que:

a) Para um computador parado, um modelo avançado é 0% mais veloz que um modelo simples.

b) Para digitação de texto e tarefas simples, um modelo avançado é 0% mais veloz que um modelo
simples.
De fato, ao realizar seus testes, o programa PCMark Vantage não utiliza todos os núcleos do
processador. Muitas das suas tarefas dependem mais do desempenho do vídeo e do disco rígido, e
em grande parte de tempo não mantém todos os núcleos do processador ocupados. Veja por exemplo
o gráfico de uso da CPU durante a execução do PCMark Vantage, na figura 9.

Figura 12 – PCMark Vantage, uso da CPU monitorado com o Gerenciador de Tarefas

No exato instante mostrado na figura 9, o uso total do processador está marcando 99%. Realmente os
gráficos dos seis núcleos, na sua parte direita, estão próximos a 100%. Entretanto ao longo do tempo,
considerando os gráficos por completo, vemos que quase sempre os núcleos estão apenas
parcialmente ocupados. Sendo assim, o processador de 6 núcleos não mostra todo o seu potencial.

O índice de desempenho é uma média obtida nos vários testes, e naqueles que usam menos núcleos,
a pontuação será igual à dos processadores mais simples. Por um lado isso é correto, pois nem
sempre um usuário utilizará tarefas pesadas que demandam trabalho de todos os núcleos. Por outro
lado, é injusto usar este método para fazer a avaliação de um processador, já que o usuário pode estar
interessado exatamente nas aplicações de atividade mais intensa, que aproveitam ao máximo todos
os núcleos. Como vemos a coisa é complexa, e não devemos levar em conta somente o índice final
obtido para comparar processadores.

Tabela 9: Testes do X4, X6 e i7 com o PCMark Vantage

O programa PCMark Vantage, infelizmente, não pode ser considerado um software totalmente
preciso para avaliar a performance individual de um processador. Vamos justificar porque,
aproveitando para comentar um concorrente Intel do Phenom II X6 1090T, o Core i7 930. Este
processador ocupa a mesma faixa de preço que o Phenom II X6 1090T. Apesar dos clocks dos seus
núcleos serem 2.8 GHz, apresenta desempenho sensivelmente maior, de acordo com o PCMark
Vantage.
Nos testes realizados, usamos o mesmo disco rígido (Seagate 1,5 TB) e a mesma placa de vídeo
(HIS 5850) dos testes do Phenom II. De acordo com o PCMark Vantage, o sistema da Intel
apresentou ganho de desempenho na maioria dos testes. O índice geral PCMark apresentou ganho de
11,2%. O problema é que esses resultados variam de acordo com a configuração de hardware usada
no teste. Veja por exemplo os resultados apresentados para esses três processadores nos nossos testes
e em testes feitos pelo Tom’s Hardware Guide, que são considerados bastante precisos. Adicionamos
na tabela os índices relativos ao processador Phenom II X4 965.

Tabela 10: Testes do ForumPCs e do Tom’s Hardware Guide

Em veículos diferentes, com placas de vídeo e HDs diferentes, o Phenom II X6 1090T mostrou-se
6,5% mais rápido ou 0,2% mais lento que o X4. O Core i7 930 mostrou ser 18,5% ou 12,7% mais
rápido. É correto afirmar que cada núcleo do Core i7 é mais veloz que cada núcleo do Phenom II
com mesmo clock. A vantagem do Core i7 é mais acentuada quando lembramos que o clock do
Phenom II X6 do nosso exemplo é 3,2 GHz (3,6 com Turbo Core) contra 2,8 GHz (3,06 com Turbo
Boost) do Core i7.

Mas nosso objetivo aqui não é iniciar mais uma das discussões Intel x AMD, já bastante populares.
Antes de festejar o ganho de performance do i7, é preciso também comparar o seu preço, o preço da
placa mãe, levar em conta que estão sendo usados 3 módulos (triplo canal, com 6 GB que talvez
raramente sejam necessários, quando 4 GB com duplo canal atenderia muito bem e apresentaria
custo menor).

O que queremos mostrar aqui é a dificuldade do PCMark Vantage em apresentar medidas realistas
para a velocidade do processador. Veja por exemplo o que acontece nos testes do Core i7 quando
trocamos a placa de vídeo. Fizemos os testes em condições semelhantes, mas usando placas com
chips GeForce 7600 GTS e ATI 5850.
Tabela 11: A placa de vídeo afeta os resultados dos testes do processador

O mesmo Core i7 930 recebeu do PCMark Vantage um índice de performance 9% maior quando
executou os testes com uma placa de vídeo veloz. Observe na penúltima linha da tabela o motivo
disso: o índice GPU Gaming com a ATI 5850 foi 58,883 FPS, enquanto com a placa GeForce 7600
apresentou apenas 7,054 FPS. Com a placa mais rápida, o índice PCMark Gaming foi quase 3 vezes
maior (304,49 contra 106,82) e daí veio o ganho de 9,2% sobre o mesmo sistema com a placa de
vídeo mais simples.

De um modo geral, usar placas de vídeo e discos rígidos mais velozes tendem a acentuar as
diferenças entre processadores diferentes, enquanto usar placas de vídeo e discos rígidos mais lentos
tendem reduzir as diferenças. Por tudo isso é difícil avaliar com precisão, quanto um processador é
mais veloz que outro, pelo menos com o PCMark Vantage.

Outro problema do PCMark Vantage na avaliação de processadores é que os resultados apresentam


valores bem diferentes a cada vez que os testes são executados. É preciso executar a bateria
completa de testes várias vezes para que o programa apresente os valores médios. O conjunto total
de testes do PCMark Vantage dura cerca de uma hora e meia, seriam então quatro horas e meia para
repetir os testes três vezes. Isso torna o trabalho de avaliação bastante demorado.

Por tudo isso, consideramos que o velho programa PCMark 2005, para Windows XP e limitado a
testar quatro núcleos, apresenta resultados mais precisos na avaliação de processadores. É também
um programa que apresenta resultados que não dependem da velocidade do disco rígido e da placa
de vídeo, e sim, do processador e da memória. Apresentamos então as medidas feitas nos dois
processadores Phenom II e no Core i7 930, todos com o HD Seagate de 1,5 TB e placa de vídeo HD
5850.
Tabela 12: Comparação com o i7, feita com o PCMark 2005

O resultado obtido com este velho programa mostra uma vantagem dos processadores Phenom II X4
e X6 na maioria das aplicações que usam um ou dois núcleos. Já nas aplicações que usam quatro
núcleos, existe alguma vantagem no Core i7.

Os resultados acima são bem interessantes. É bem sabido no meio técnico que o Core i7 leva
vantagem sobre o Phenom II X4 e o Phenom II X6 em uma comparação clock por clock. As medidas
realizadas entretanto mostram que nem sempre isso é assim. Com o Turbo Core, o Phenom II X6
1090T tem seu clock elevado para 3,6 GHz nas aplicações que demandam esforço de até 3 núcleos,
enquanto o Core i7 930 vai para 3,06 GHz com o Turbo Boost. Uma vantagem de quase 20% no
clock faz os núcleos do Phenom II levarem vantagem sobre o Core i7.

Essa discussão deve levar os leitores a refletirem sobre a questão de desempenho. Cada usuário
individualmente nem sempre tem dois processadores rivais para comparar, em sistemas semelhantes.
Nós que temos os processadores em mãos, nem sempre temos os programas que interessam ao
usuário. Um meio termo interessante é o realizado no Tom’s Hardware Guide, que faz testes
exaustivos em praticamente todos os modelos de processadores (já que os recebe para avaliação com
mais facilidade).

Replicamos aqui os resultados de alguns testes de benchmark feitos com alguns processadores Intel e
AMD. Todos os da tabela são de 4 núcleos, exceto o Phenom II X6, de 6 núcleos. Não foram feitos
testes com o i7-930, mas replicamos os resultados do i7-920 e do i7-940, que são modelos próximos.
Mostramos também os resultados do i5-750, que tem se mostrado uma excelente opção de 4 núcleos.
As tabelas mostram que em alguns casos o Phenom II X6 leva vantagem, em outros tem dificuldades
para competir com o i7, e algumas vezes até com o i5 de 4 núcleos (lembre-se que existem vários
modelos de i5 com 2 núcleos).
Tabela 13: Comparação de processadores

Fonte: Tom’s Hardware Guide, www.tomshardware.com


Tabela 14: Comparação de processadores

Temperatura
Assim como ocorre com o Phenom II X4, o Phenom II X6 1090T é um processador bem quente.
Dissipa 125 watts e suporta uma temperatura máxima de 62°C. Em caso de uso extremo, esta
temperatura máxima é facilmente atingida. Devemos tomar os cuidados usuais com a refrigeração do
processador e do gabinete.

Fizemos um teste visando a levar o Phenom II X6 à sua temperatura limite. Ao invés de instalar o
cooler que o acompanha na versão BOX, usamos inicialmente um cooler simples, típico de
processadores AMD que dissipam 65 watts ou menos.
Figura 13 - Cooler inadequado para o Phenom II X6

Usamos no gabinete um cooler traseiro de 12 cm expulsando o ar quente para fora, uma fonte de
alimentação com ventilador interno e duto lateral de ventilação no gabinete, apesar do cooler ser
inadequado. O ambiente estava à temperatura de 27°C. Depois de alguns minutos com o computador
inativo, o interior do gabinete estabilizou sua temperatura em 42°C, com processador estabilizado a
44°C. Colocamos em execução o programa Handbrake para fazer uma codificação de vídeo,
mantendo os seis núcleos com taxa de utilização acima de 95%. O gabinete permaneceu a 42°C ao
longo do teste, mas o processador esquentou bastante em poucos minutos:

Tabela 15: Temperatura do processador com cooler inadequado

Em apenas quatro minutos o processador atingiu sua temperatura máxima permitida. Interrompemos
o teste para evitar danos. Na verdade o processador tem uma proteção interna, reduzindo o seu clock
quando a temperatura máxima é atingida. Ainda assim, como o processador foi emprestado pela
AMD para o teste, resolvemos exagerar no cuidado.

Fizemos a seguir a instalação do cooler correto para este processador, mostrado na figura abaixo. Na
verdade a AMD enviou o processador sem cooler, usamos então o cooler de um outro Phenom II X6
disponível em nosso laboratório.
Figura 14 - Cooler correto do Phenom II X6 1090T

Repetimos os testes nas mesmas condições, e dessa vez a temperatura ficou estabilizada em 51°C.
As condições de temperatura desse segundo teste foram:

Temperatura ambiente: 27°C.


Temperatura interna do gabinete: 36°C
Temperatura do processador em repouso: 35°C

A tabela abaixo mostra a evolução da temperatura do processador ao longo do teste.

Tabela 16: Temperatura do processador com cooler adequado

Apesar da sua elevada dissipação de 125 watts, o processador teve sua temperatura estabilizada em
51°C, ficando apenas 12°C acima da temperatura interna do gabinete. Ainda temos uma margem de
11°C até chegar à temperatura máxima suportada pelo processador, mesmo com quase 100% de
ocupação nos 6 núcleos. Isso tudo só pode ser conseguido com o uso do cooler correto e com os
cuidados usuais com a ventilação do gabinete.
Conclusão
É fato que um núcleo de processador moderno Intel é mais veloz que um núcleo de processador
moderno da AMD de mesmo clock. A AMD compensa essa diferença oferecendo processadores
com custo menor. Há poucos anos atrás, os processadores mais novos recém lançados, tanto da
AMD quanto da Intel, custavam cerca 1000 dólares em lotes de 1000 peças (E.U.A). O Phenom II
X6 1090T custa menos que 300 dólares, também em lotes de 1000 peças.

Apesar de não competirem diretamente com os modelos mais velozes da Intel, que são bem mais
caros, os novos processadores de 6 núcleos da AMD não fazem feio quando comparados a
processadores Intel de custo semelhante. Como podem ter desempenho similar com clocks menores,
os processadores Intel que rivalizam com o Phenom II X6 em preço e desempenho apresentam outro
ponto favorável: a baixa dissipação de calor.

Isso é em parte conseqüência do uso do processo de fabricação Intel com transistores de 32 nm,
enquanto a AMD ainda está usando o processo de 45 nm. Com a adoção do processo de 32 nm, a
AMD poderá oferecer outras vantagens, como redução de dissipação de calor e redução de custo.

Bibliografia:
http://blogs.forumpcs.com.br/laercio_vasconcelos/2010/08/06/editando-
review-phenom-ii-x6/7/

Você também pode gostar