Você está na página 1de 14

29 de agosto de 2009

1. Introdução / Histórico:
Como todos já devem saber, a Intel lançou seu novo
processador. Sob o nome de Core i7, estes são os primeiros
processadores baseados na micro-arquitetura Nehalem, sobre
a qual você irá conhecer um pouco mais neste trabalho. Esta
nova micro-arquitetura não prevê uma mudança tão radical
quanto a passagem de Netburst (Pentium 4) para Core2, pelo
menos não em um nível tão baixo. O que não significa que
não venha a trazer ganhos significativos em desempenho.

Pense da seguinte forma: tomando como base os núcleos


Core2, o que pode ser feito para obter processadores ainda
melhores? Além pequenas melhorias na já excelente micro-
arquitetura, uma das principais mudanças, ou pelo menos a
que chama mais atenção é que finalmente a controladora de
memória foi integrada ao processador, aposentando o
esquema de FSB e Northbridge, aproveitando a oportunidade
para a implementação de um novo barramento; serial, ponto-
a-ponto, bi-direcional e de baixa latência: o QPI (Quick Path
Interconnect); para conexão do processador com o chipset ou
outros processadores.

Com a controladora de memória dentro do processador, os núcleos não devem percorrer o longo caminho do FSB
cada vez que necessitarem um dado da memória RAM. Aproveitando a ocasião da inclusão de vários núcleos (2, 4
ou mais) no mesmo chip, a Intel optou por implementar uma controladora de memória com 3 canais. Com uma
largura efetiva de 192 bits e usando memórias DDR3 (apenas, memórias DDR2 não são suportadas), a oferta de
banda de memória atinge níveis bem maiores que os que estamos acostumados a
ver.asdfgdfgdhdhhdfcnbvchgfrtyutrrdhfdhffhduyuiooyuyhklhjhkhghghjkg

A integração de 4 núcleos (com possibilidade para mais núcleos num futuro próximo, conforme a necessidade /

1
29 de agosto de 2009

possibilidade por questões energéticas/térmicas) no mesmo chip, requer uma re-organização na estrutura de
cache. O grande cache L2 compartilhado do Core2 funciona muito bem quando há apenas 2 núcleos por chip, mas
4 núcleos brigando pelo acesso ao cache L2 não é algo bonito de se ver. Então transportou-se o cache
compartilhado para um nível superior e entre eles criou-se um cache L2; razoavelmente pequeno, mas de latência
baixíssima (para um cache L2), para diminuir a concorrência pelo grande (na verdade, enorme) cache L3, de 8MB;
compartilhado por todos os núcleos.

2. Características
 Baseado na Arquitetura Nehalen
 Composição do sistema com dois chips principais: Processador com seus quatro núcleos (cores) físicos +
Controlador de memória que a partir de agora passará da Ponte Norte da Motherboard para dentro do processador
possibilitando assim maior rapidez nos acessos aos dados da memória
 A partir do novo Core I7 a informação do FSB sai de cena e temos agora as seguintes informações
relevantes:

Como exemplo, analisaremos o processador Intel I7 em sua versão I920

o Frequência (Clock): 2.66GHz;


o Número de núcleos: 4 núcleos físicos e 4 núcleos virtuais graças à Tecnologia Hyper Treading;
o Memória Cache: 8MB L3;
o Novo BUS Chamado de Q.U.P.I (Quick Patch Inter Connect): Canal em que o processador "conversa" com
o sistema e a forma como medimos essa velocidade é na quantidade de dados que passa por segundo
dentro desse bus. No caso do I7 920 a velocidade é de 4.8 Gigatransfer o que se traduz em 19.2GB de
informações passando por segundo no bus.

Isso significa uma arquitetura desenhada para entregar a melhor performance do sistema aos usuários.
Além disso ele trabalha com memória DDR3 o que traz ainda mais performance ao sistema como um todo

1
29 de agosto de 2009

3.E para quem o I7 É recomendado?


O Processador Intel Core I7 é recomendado além de todas as aplicações do dia a dia principalmente para Jogos e
Edição de Gráficos e Vídeo.
A performance do Core I7 por exemplo em uma edição de vídeo tem performance até 40% superior ao
Core2Quad Extreme. Já em aplicações multitarefas esse ganho chega a 25%.

Para uma solução completa o ideal é utilizar junto com o Core I7 a placa mãe Intel DX58SO e uma nova tecnologia
de disco desenvolvida pela Intel chamada de SSD (Disco de Estado Solido). O Disco SSD é um disco que grava as
informações de maneira digital. Essa escolha proporciona 9 vezes mais performance ao sistema se comparado
com um disco rígido.

Com a tecnologia multi-core mais rápida e inteligente que aplica poder de processamento onde ele é mais
necessário, os novos processadores Intel® Core™ i7 oferecem uma inovação revolucionária em desempenho de
PC. Eles são os melhores processadores para desktop do planeta.

Você vai executar multitarefa de aplicativos mais rapidamente e liberar uma criatividade incrível de mídia digital.
E experimentará o desempenho máximo em tudo o que fizer, graças à combinação da tecnologia Intel® Turbo
Boost² e da tecnologia Intel® Hyper-Threading (Tecnologia Intel® HT)³ que maximiza o desempenho para a sua
carga de trabalho.

1
29 de agosto de 2009

4.A arquitetura Nehalem (Arquitetura do i7)


Você pode olhar para o microprocessador Nehalem como um chip que tem duas seções principais: um núcleo e
os componentes que o cercam, os chamados não-núcleo. O núcleo do processador contém os seguintes
elementos:

 Os processadores, que fazem a real trituração dos números. Isso pode incluir qualquer coisa - de operações
matemáticas simples, como somar e subtrair, a funções muito mais complexas.
 Uma seção dedicada ao agendamento não-funcional e à lógica de saída. Isto permite ao computador fazer
cálculos de um modo mais eficiente ao parar  instruções em qualquer ordem em que são colocadas.
 A memória cache ocupa cerca de um terço do núcleo do processador. O cache permite ao
microprocessador armazenar informação temporariamente dentro do chip, diminuindo a necessidade de puxar
informação de outras partes do computador. Há também duas seções de memória cache no núcleo chamadas L1
e L2.
 Uma seção de previsão de desvio no núcleo permite que o processador antecipe funções baseado em uma
entrada de dados anterior. Ao prever funções, o microprocessador pode trabalhar de maneira mais eficiente. Se
acontecer de a previsão estar errada, o chip pode cessar os cálculos e mudar para executar as funções corretas.
 O resto do núcleo ordena funções, decodifica informação e organiza dados.

A seção não-núcleo tem uma memória adicional de 8 megabytes contida no cache L3. A razão de o cache L3 não
estar no núcleo é porque o microprocessador Nehalem é escalável e modular. Isso significa que a Intel pode
construir vários chips que tenham múltiplos núcleos. E isso quer dizer que múltiplos núcleos podem trabalhar na
mesma informação ao mesmo tempo.

Intel/Divulgação
Pat Gelsinger, da Digital Enterprise Group, e Jim Brayton, da
Intel, mostram a bolacha de silício feita com microarquitetura
Nehalem

Por que criar microprocessadores escaláveis? É uma solução elegante para um problema difícil - construir mais
poder de processamento sem ter que reinventar o processador em si. De certo modo, é como conectar várias
baterias em seqüência. A Intel planeja construir microprocessadores Nehalem em configurações de dois, quatro e
oito núcleos. Processadores de dois núcleos são bons para pequenos dispositivos, como smartphones. É mais
provável que você encontre um processador com quatro núcleos em um laptop ou em um computador de mesa.

1
29 de agosto de 2009

A Intel projetou os processadores de oito núcleos para máquinas como servidores - computadores que lidam com
carga de trabalho pesada.

A Intel diz que vai oferecer microprocessadores Nehalem que incorporam uma unidade de processamento
gráfico (GPU) no não-núcleo. A GPU vai funcionar do mesmo modo que as placas gráficas dedicadas.

5. Modelos e Preços

Finalmente, o momento que todos esperam, veremos se o Core i7 é mesmo "tudo


isso que dizem". Para isso, escalamos representantes de sistemas "atuais" já com
desempenho muito bom, que serão comparados trabalhando sob sua configuração
original e em overclock, para dar uma idéia da diferença entre uma máquina muito
rápida e o Core i7!

Os sistemas utilizados:

Intel Core i7

Processador Core i7 920 (2,66GHz) @ 3.2GHz (16x200)


Placa Mãe Intel DX58SO (X58+ICH10R)
Memórias 3x2GB Patriot Viper DDR3-1600 9-9-9 1,65v
Preço do Processador: R$ 1050,00

Intel Core 2
Processador Core 2 Extreme QX6700 (Quad Core 2,66GHz)
Core 2 Duo E8400 (Dual Core 3GHz) @ 3,2GHz (8x400)
@ 4GHz (9x450)
Placa Mãe Biostar TPower I45 (P45+ICH10R)
Memórias 2x2GB GSkill 4GBPK DDR2-800 4-4-4-12
2x1GB GSkill 2GBPK DDR2-800 4-4-4-12
Preço do Processador: R$ 2998,00

AMD Phenom
Processador Phenom X4 9950 Black Edition (2,6GHz) @ 3GHz (12x240)
Placa Mãe Jetway HA07-Ultra (AMD790GX+SB750)
Memórias 2x2GB GSkill 4GBPK DDR2-800 4-4-4-12
2x1GB GSkill 2GBPK DDR2-800 4-4-4-12
Preço do Processador:R$ 422,45

O restante dos componentes é comum a todos:

Placa de Vídeo ATI Radeon HD 4870X2


Disco Rígido Western Digital Raptor 36GB (10.000RPM)
Fonte MTEK Xtreme 1200w
Sistema Operacional Windows Vista Home Premium X64 SP1

1
29 de agosto de 2009

Algumas observações:

Os testes de desempenho do i7 sob condições normais foram feitas com a memória a DDR3-1066 7-7-7, definidas
automaticamente pela DX58SO. Como o ajuste de memórias especiais sem XMP requer uma boa dose de
conhecimento, achamos por bem testar o sistema em sua configuração automática, pois assim terá o mesmo
comportamento de um sistema montado por um usuário menos experiente. Em overclock as memórias operavam
a DDR3-1600 9-9-9.

Para evitar que uma diferença no volume de memória influenciasse os testes, como o i7 foi equipado com 6GB de
RAM (3x2GB), também equipamos os demais sistemas com 6GB de RAM (2x2GB + 2x1GB), o que por outro lado
impediu o uso de memórias DDR2-1066, portanto utilizamos a configuração imediatamente inferior (DDR2-800
4-4-4-12). A diferença de desempenho é inferior a 3%, portanto não é uma perda muito significativa.

O processador AMD Phenom utilizado é na verdade um X4 9850 Black Edition (2.5GHz), foi feito este pequeno
overclock para ter uma comparação mais próxima "clock a clock" com os demais processadores. Como não foi
necessário nenhum aumento no vcore, os testes de consumo refletem o comportamento de um 9950
verdadeiro.

Como o Cool n Quiet (sistema de economia de energia do Phenom) afeta negativamente seu desempenho na
maioria dos testes single thread (pois o uso de apenas um núcleo a 100% não é suficiente para forçar o retorno do
processador ao clock original), o recurso foi desativado; sendo usado apenas nos testes de consumo.

1
29 de agosto de 2009

Com 3 canais de memória DDR3 já era de se esperar que o Core i7 dominasse esse teste, mas não esperávamos
que fosse por tanto! Com memórias DDR3-1600 obtém-se praticamente o dobro da banda e a metade da
latências dos demais sistemas! Mesmo o Phenom, que também conta com controladora de memória integrada,
fica bem atrás, próximo aos sistemas Intel com controladora discreta, vencendo apenas na latência da memória.

1
29 de agosto de 2009

O desempenho no WinRAR depende diretamente da velocidade no acesso à memória, como podemos ver que o
i7 920 a 2,66GHz com memórias DDR3-1600 obtém praticamente o mesmo desempenho que trabalhando a
3,2GHz (também com DDR3-1600). E com uma controladora de memória tão eficiente, não é surpresa que
dispare na liderança em relação aos demais. É interessante observar também que o HyperThreading
proporcionou um bom ganho em desempenho neste teste.

1
29 de agosto de 2009

O Cinebench é bem otimizado para SSE4, então os Core2 de 45nm e o i7 já partem com vantagem nesse teste,
veja que usando apenas um núcleo o E8400 a 3GHz praticamente empata com o QX6700 a 3,2GHz. Mas a
superioridade do i7 aqui é
indiscutível, com a ajuda do Hyper Threading obtém-se um "CPU Scaling" (ganho de desempenho por usar vários
núcleos, em relação a usar apenas um) até ligeiramente superior ao aumento linear, a 2,66GHz o ganho foi de
4,16x! Algo
extremamente raro, já que a tendência natural é de um índice ligeiramente inferior ao linear (pois enquanto um
núcleo trabalha sozinho tende a trabalhar um pouco mais rápido por ter todo o cache L3 disponível e acesso
exclusivo à controladora de memória, sem ter que concorrer com os demais, sem falar no modo Turbo), mas com
o melhor aproveitamento dos núcleos com HT esta limitação é quebrada.

1
29 de agosto de 2009

Interessante que mesmo sendo o x264 muito bem otimizado para multithread, na primeira passada o HT
prejudicou um pouco o desempenho do i7. Mas na segunda passada (a que efetivamente faz a conversão do
vídeo) observa-se um ganho razoável. Novamente a superioridade do i7 é indiscutível, pois a apenas 2,66GHz e
sem HT já supera todos os demais.

1
29 de agosto de 2009

Ao desligar o HT o teste de CPU caiu ligeiramente, mas o resultado no teste 2 (Firefly Forest) melhorou
consideravelmente, contribuindo no resultado final. Observe que o Core 2 Duo E8400 a 4GHz chegou muito perto
do i7 a 3,2GHz; de fato nos testes gráficos ele se saiu ligeiramente melhor, porém perde no teste de CPU (por ter
apenas 2 núcleos), o que acaba pesando no resultado final. De todas formas, o desempenho "por clock" do i7
ainda é bem superior.

1
29 de agosto de 2009

Obs. : Resolução de 1600x1200, detalhes em High, sem AA(Anti-Aliasing)

Como o Crysis não foi feito com processadores multicore em mente (na maior parte do tempo ele usa apenas um
núcleo), a maior parte do potencial do i7 permanece ociosa, deixando espaço para o E8400 @ 4GHz superá-lo por
operar a um clock bem mais elevado. De todas as formas, a diferença é discreta, porém como isso reflete o
cenário da maioria dos jogos (salvo raras exceções como o GTA4, que é otimizado para multicore), ainda não há
motivo para investir bem mais em um i7 se a máquina for usada principalmente para jogos.

1
29 de agosto de 2009

Os números de consumo nos revelam dados bem interessantes. Vemos que o i7 é bem econômico quando ocioso,
perdendo apenas (obviamente) para o E8400. E usando apenas o processador a 100% vemos um empate técnico
entre ele e o QX6700. Se o desempenho entrar na questão o i7 sai vencedor por oferecer mais "performance por
watt", mas os dados mais curiosos são do consumo do sistema em jogos. Aqui foi usado o primeiro teste do
3DMark06 (Return to Proxycon), que não é otimizado para multithread; porém conforme varia o desempenho da
CPU, varia o uso da placa
de vídeo, e portanto seu consumo. Então comparando o QX6700 com o i7 920, como o primeiro executou o teste
a uma média de 44fps e o segundo a 55fps, isto nos leva a crer que dos 370w do i7, a 4870X2 é responsável por
uma parcela maior que nos 360w do QX6700. Indicando que sob "meia carga" o consumo do i7 é bem menor,
devido ao seu excelente gerenciamento de energia; que desliga os núcleos que não estão em uso praticamente
por completo. Chama atenção também a excelente relação performance por watt do E8400, devido ótimo
desempenho com consumo baixíssimo.

6. Conclusão
Finalmente, o i7 está entre nós. E mostra como os benefícios da controladora de memória integrada, por anos
exclusividade da AMD, são significativos. Junto com ela vieram melhoras na micro-arquitetura, como o
HyperThreading e a nova estrutura de cache.

O alto preço, principalmente das placas mãe X58 (quase todas custam mais de 300 dólares) e o preço ainda
proibitivo das memórias DDR3 freiam o interesse dos usuários. Mas para quem realmente trabalha com a
máquina, fazendo renderização 3D ou edição de vídeo, o investimento é pequeno perto do benefício; pois nessas
aplicações ele é no mínimo 50% mais rápido, e isso trabalhando à mesma frequência.

Para os entusiastas o i7 é ainda mais atraente, pois, além do excelente desempenho sob condições normais,
possui um potencial de overclock enorme! E nos surpreende a facilidade para mexer nos ajustes; é um pouco
mais complicado que mexer num Core2 simplesmente porque há alguns ajustes a mais. Mas a arquitetura é muito
mais flexível e deve melhorar à medida que amadurecer (esperamos que a Intel libere multiplicadores menores

1
29 de agosto de 2009

para o QPI, permitindo overclocks ainda maiores, mesmo com processadores simples como o 920).

Apesar de se tratar apenas de uma "vitrine tecnológica", o i7 cumpre muito bem com a proposta, criando
expectativa para as próximas "personificações" do Nehalem. Como o Lynnfield, que terá controladora de
memória "apenas" dual channel, mas integrará todas funções do northbridge. No caso a única que falta é o
controlador do PCI Express, portanto na placa mãe só restará o southbridge, permitindo a criação de placas mais
baratas.

Você também pode gostar