Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução / Histórico:
Como todos já devem saber, a Intel lançou seu novo
processador. Sob o nome de Core i7, estes são os primeiros
processadores baseados na micro-arquitetura Nehalem, sobre
a qual você irá conhecer um pouco mais neste trabalho. Esta
nova micro-arquitetura não prevê uma mudança tão radical
quanto a passagem de Netburst (Pentium 4) para Core2, pelo
menos não em um nível tão baixo. O que não significa que
não venha a trazer ganhos significativos em desempenho.
Com a controladora de memória dentro do processador, os núcleos não devem percorrer o longo caminho do FSB
cada vez que necessitarem um dado da memória RAM. Aproveitando a ocasião da inclusão de vários núcleos (2, 4
ou mais) no mesmo chip, a Intel optou por implementar uma controladora de memória com 3 canais. Com uma
largura efetiva de 192 bits e usando memórias DDR3 (apenas, memórias DDR2 não são suportadas), a oferta de
banda de memória atinge níveis bem maiores que os que estamos acostumados a
ver.asdfgdfgdhdhhdfcnbvchgfrtyutrrdhfdhffhduyuiooyuyhklhjhkhghghjkg
A integração de 4 núcleos (com possibilidade para mais núcleos num futuro próximo, conforme a necessidade /
1
29 de agosto de 2009
possibilidade por questões energéticas/térmicas) no mesmo chip, requer uma re-organização na estrutura de
cache. O grande cache L2 compartilhado do Core2 funciona muito bem quando há apenas 2 núcleos por chip, mas
4 núcleos brigando pelo acesso ao cache L2 não é algo bonito de se ver. Então transportou-se o cache
compartilhado para um nível superior e entre eles criou-se um cache L2; razoavelmente pequeno, mas de latência
baixíssima (para um cache L2), para diminuir a concorrência pelo grande (na verdade, enorme) cache L3, de 8MB;
compartilhado por todos os núcleos.
2. Características
Baseado na Arquitetura Nehalen
Composição do sistema com dois chips principais: Processador com seus quatro núcleos (cores) físicos +
Controlador de memória que a partir de agora passará da Ponte Norte da Motherboard para dentro do processador
possibilitando assim maior rapidez nos acessos aos dados da memória
A partir do novo Core I7 a informação do FSB sai de cena e temos agora as seguintes informações
relevantes:
Isso significa uma arquitetura desenhada para entregar a melhor performance do sistema aos usuários.
Além disso ele trabalha com memória DDR3 o que traz ainda mais performance ao sistema como um todo
1
29 de agosto de 2009
Para uma solução completa o ideal é utilizar junto com o Core I7 a placa mãe Intel DX58SO e uma nova tecnologia
de disco desenvolvida pela Intel chamada de SSD (Disco de Estado Solido). O Disco SSD é um disco que grava as
informações de maneira digital. Essa escolha proporciona 9 vezes mais performance ao sistema se comparado
com um disco rígido.
Com a tecnologia multi-core mais rápida e inteligente que aplica poder de processamento onde ele é mais
necessário, os novos processadores Intel® Core™ i7 oferecem uma inovação revolucionária em desempenho de
PC. Eles são os melhores processadores para desktop do planeta.
Você vai executar multitarefa de aplicativos mais rapidamente e liberar uma criatividade incrível de mídia digital.
E experimentará o desempenho máximo em tudo o que fizer, graças à combinação da tecnologia Intel® Turbo
Boost² e da tecnologia Intel® Hyper-Threading (Tecnologia Intel® HT)³ que maximiza o desempenho para a sua
carga de trabalho.
1
29 de agosto de 2009
Os processadores, que fazem a real trituração dos números. Isso pode incluir qualquer coisa - de operações
matemáticas simples, como somar e subtrair, a funções muito mais complexas.
Uma seção dedicada ao agendamento não-funcional e à lógica de saída. Isto permite ao computador fazer
cálculos de um modo mais eficiente ao parar instruções em qualquer ordem em que são colocadas.
A memória cache ocupa cerca de um terço do núcleo do processador. O cache permite ao
microprocessador armazenar informação temporariamente dentro do chip, diminuindo a necessidade de puxar
informação de outras partes do computador. Há também duas seções de memória cache no núcleo chamadas L1
e L2.
Uma seção de previsão de desvio no núcleo permite que o processador antecipe funções baseado em uma
entrada de dados anterior. Ao prever funções, o microprocessador pode trabalhar de maneira mais eficiente. Se
acontecer de a previsão estar errada, o chip pode cessar os cálculos e mudar para executar as funções corretas.
O resto do núcleo ordena funções, decodifica informação e organiza dados.
A seção não-núcleo tem uma memória adicional de 8 megabytes contida no cache L3. A razão de o cache L3 não
estar no núcleo é porque o microprocessador Nehalem é escalável e modular. Isso significa que a Intel pode
construir vários chips que tenham múltiplos núcleos. E isso quer dizer que múltiplos núcleos podem trabalhar na
mesma informação ao mesmo tempo.
Intel/Divulgação
Pat Gelsinger, da Digital Enterprise Group, e Jim Brayton, da
Intel, mostram a bolacha de silício feita com microarquitetura
Nehalem
Por que criar microprocessadores escaláveis? É uma solução elegante para um problema difícil - construir mais
poder de processamento sem ter que reinventar o processador em si. De certo modo, é como conectar várias
baterias em seqüência. A Intel planeja construir microprocessadores Nehalem em configurações de dois, quatro e
oito núcleos. Processadores de dois núcleos são bons para pequenos dispositivos, como smartphones. É mais
provável que você encontre um processador com quatro núcleos em um laptop ou em um computador de mesa.
1
29 de agosto de 2009
A Intel projetou os processadores de oito núcleos para máquinas como servidores - computadores que lidam com
carga de trabalho pesada.
A Intel diz que vai oferecer microprocessadores Nehalem que incorporam uma unidade de processamento
gráfico (GPU) no não-núcleo. A GPU vai funcionar do mesmo modo que as placas gráficas dedicadas.
5. Modelos e Preços
Os sistemas utilizados:
Intel Core i7
Intel Core 2
Processador Core 2 Extreme QX6700 (Quad Core 2,66GHz)
Core 2 Duo E8400 (Dual Core 3GHz) @ 3,2GHz (8x400)
@ 4GHz (9x450)
Placa Mãe Biostar TPower I45 (P45+ICH10R)
Memórias 2x2GB GSkill 4GBPK DDR2-800 4-4-4-12
2x1GB GSkill 2GBPK DDR2-800 4-4-4-12
Preço do Processador: R$ 2998,00
AMD Phenom
Processador Phenom X4 9950 Black Edition (2,6GHz) @ 3GHz (12x240)
Placa Mãe Jetway HA07-Ultra (AMD790GX+SB750)
Memórias 2x2GB GSkill 4GBPK DDR2-800 4-4-4-12
2x1GB GSkill 2GBPK DDR2-800 4-4-4-12
Preço do Processador:R$ 422,45
1
29 de agosto de 2009
Algumas observações:
Os testes de desempenho do i7 sob condições normais foram feitas com a memória a DDR3-1066 7-7-7, definidas
automaticamente pela DX58SO. Como o ajuste de memórias especiais sem XMP requer uma boa dose de
conhecimento, achamos por bem testar o sistema em sua configuração automática, pois assim terá o mesmo
comportamento de um sistema montado por um usuário menos experiente. Em overclock as memórias operavam
a DDR3-1600 9-9-9.
Para evitar que uma diferença no volume de memória influenciasse os testes, como o i7 foi equipado com 6GB de
RAM (3x2GB), também equipamos os demais sistemas com 6GB de RAM (2x2GB + 2x1GB), o que por outro lado
impediu o uso de memórias DDR2-1066, portanto utilizamos a configuração imediatamente inferior (DDR2-800
4-4-4-12). A diferença de desempenho é inferior a 3%, portanto não é uma perda muito significativa.
O processador AMD Phenom utilizado é na verdade um X4 9850 Black Edition (2.5GHz), foi feito este pequeno
overclock para ter uma comparação mais próxima "clock a clock" com os demais processadores. Como não foi
necessário nenhum aumento no vcore, os testes de consumo refletem o comportamento de um 9950
verdadeiro.
Como o Cool n Quiet (sistema de economia de energia do Phenom) afeta negativamente seu desempenho na
maioria dos testes single thread (pois o uso de apenas um núcleo a 100% não é suficiente para forçar o retorno do
processador ao clock original), o recurso foi desativado; sendo usado apenas nos testes de consumo.
1
29 de agosto de 2009
Com 3 canais de memória DDR3 já era de se esperar que o Core i7 dominasse esse teste, mas não esperávamos
que fosse por tanto! Com memórias DDR3-1600 obtém-se praticamente o dobro da banda e a metade da
latências dos demais sistemas! Mesmo o Phenom, que também conta com controladora de memória integrada,
fica bem atrás, próximo aos sistemas Intel com controladora discreta, vencendo apenas na latência da memória.
1
29 de agosto de 2009
O desempenho no WinRAR depende diretamente da velocidade no acesso à memória, como podemos ver que o
i7 920 a 2,66GHz com memórias DDR3-1600 obtém praticamente o mesmo desempenho que trabalhando a
3,2GHz (também com DDR3-1600). E com uma controladora de memória tão eficiente, não é surpresa que
dispare na liderança em relação aos demais. É interessante observar também que o HyperThreading
proporcionou um bom ganho em desempenho neste teste.
1
29 de agosto de 2009
O Cinebench é bem otimizado para SSE4, então os Core2 de 45nm e o i7 já partem com vantagem nesse teste,
veja que usando apenas um núcleo o E8400 a 3GHz praticamente empata com o QX6700 a 3,2GHz. Mas a
superioridade do i7 aqui é
indiscutível, com a ajuda do Hyper Threading obtém-se um "CPU Scaling" (ganho de desempenho por usar vários
núcleos, em relação a usar apenas um) até ligeiramente superior ao aumento linear, a 2,66GHz o ganho foi de
4,16x! Algo
extremamente raro, já que a tendência natural é de um índice ligeiramente inferior ao linear (pois enquanto um
núcleo trabalha sozinho tende a trabalhar um pouco mais rápido por ter todo o cache L3 disponível e acesso
exclusivo à controladora de memória, sem ter que concorrer com os demais, sem falar no modo Turbo), mas com
o melhor aproveitamento dos núcleos com HT esta limitação é quebrada.
1
29 de agosto de 2009
Interessante que mesmo sendo o x264 muito bem otimizado para multithread, na primeira passada o HT
prejudicou um pouco o desempenho do i7. Mas na segunda passada (a que efetivamente faz a conversão do
vídeo) observa-se um ganho razoável. Novamente a superioridade do i7 é indiscutível, pois a apenas 2,66GHz e
sem HT já supera todos os demais.
1
29 de agosto de 2009
Ao desligar o HT o teste de CPU caiu ligeiramente, mas o resultado no teste 2 (Firefly Forest) melhorou
consideravelmente, contribuindo no resultado final. Observe que o Core 2 Duo E8400 a 4GHz chegou muito perto
do i7 a 3,2GHz; de fato nos testes gráficos ele se saiu ligeiramente melhor, porém perde no teste de CPU (por ter
apenas 2 núcleos), o que acaba pesando no resultado final. De todas formas, o desempenho "por clock" do i7
ainda é bem superior.
1
29 de agosto de 2009
Como o Crysis não foi feito com processadores multicore em mente (na maior parte do tempo ele usa apenas um
núcleo), a maior parte do potencial do i7 permanece ociosa, deixando espaço para o E8400 @ 4GHz superá-lo por
operar a um clock bem mais elevado. De todas as formas, a diferença é discreta, porém como isso reflete o
cenário da maioria dos jogos (salvo raras exceções como o GTA4, que é otimizado para multicore), ainda não há
motivo para investir bem mais em um i7 se a máquina for usada principalmente para jogos.
1
29 de agosto de 2009
Os números de consumo nos revelam dados bem interessantes. Vemos que o i7 é bem econômico quando ocioso,
perdendo apenas (obviamente) para o E8400. E usando apenas o processador a 100% vemos um empate técnico
entre ele e o QX6700. Se o desempenho entrar na questão o i7 sai vencedor por oferecer mais "performance por
watt", mas os dados mais curiosos são do consumo do sistema em jogos. Aqui foi usado o primeiro teste do
3DMark06 (Return to Proxycon), que não é otimizado para multithread; porém conforme varia o desempenho da
CPU, varia o uso da placa
de vídeo, e portanto seu consumo. Então comparando o QX6700 com o i7 920, como o primeiro executou o teste
a uma média de 44fps e o segundo a 55fps, isto nos leva a crer que dos 370w do i7, a 4870X2 é responsável por
uma parcela maior que nos 360w do QX6700. Indicando que sob "meia carga" o consumo do i7 é bem menor,
devido ao seu excelente gerenciamento de energia; que desliga os núcleos que não estão em uso praticamente
por completo. Chama atenção também a excelente relação performance por watt do E8400, devido ótimo
desempenho com consumo baixíssimo.
6. Conclusão
Finalmente, o i7 está entre nós. E mostra como os benefícios da controladora de memória integrada, por anos
exclusividade da AMD, são significativos. Junto com ela vieram melhoras na micro-arquitetura, como o
HyperThreading e a nova estrutura de cache.
O alto preço, principalmente das placas mãe X58 (quase todas custam mais de 300 dólares) e o preço ainda
proibitivo das memórias DDR3 freiam o interesse dos usuários. Mas para quem realmente trabalha com a
máquina, fazendo renderização 3D ou edição de vídeo, o investimento é pequeno perto do benefício; pois nessas
aplicações ele é no mínimo 50% mais rápido, e isso trabalhando à mesma frequência.
Para os entusiastas o i7 é ainda mais atraente, pois, além do excelente desempenho sob condições normais,
possui um potencial de overclock enorme! E nos surpreende a facilidade para mexer nos ajustes; é um pouco
mais complicado que mexer num Core2 simplesmente porque há alguns ajustes a mais. Mas a arquitetura é muito
mais flexível e deve melhorar à medida que amadurecer (esperamos que a Intel libere multiplicadores menores
1
29 de agosto de 2009
para o QPI, permitindo overclocks ainda maiores, mesmo com processadores simples como o 920).
Apesar de se tratar apenas de uma "vitrine tecnológica", o i7 cumpre muito bem com a proposta, criando
expectativa para as próximas "personificações" do Nehalem. Como o Lynnfield, que terá controladora de
memória "apenas" dual channel, mas integrará todas funções do northbridge. No caso a única que falta é o
controlador do PCI Express, portanto na placa mãe só restará o southbridge, permitindo a criação de placas mais
baratas.