Você está na página 1de 7

Sumário

1 Compilação do Siesta - LNCC 2

2 Resultados obtidos 2
2.1 B700 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 BULLSequana X: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3 Comparação entre computadores . . . . . . . . . . . . . . . . . . . . . . . . 5

3 Conclusão 7

1
SEÇÃO 1
Compilação do Siesta - LNCC

Este trabalho consiste em fazer um Benchmark da compilação do Siesta via OpenMP


utilizando os computadores B700 e BULLSequana X do LNCC. Depois faremos também
uma comparação dos resultados obtidos com o último Benchmark feito do Siesta utilizando
o computador da UFF. As especificações dos computadores utilizados foram:

1. Computador 17 da sala 107B da UFF - VR:

• Processador: Intel(R) Core(TM)i7 - 2600U


• Frequência: 3.40 GHz
• Memória RAM: 4 GB
• CPU’s: 8
• Thread por core: 2
• Core por socket: 4
• Sockets: 1
• L1d cache: 32 kB
• L1i cache: 32 kB
• L2 cache: 256 kB
• L3 cache: 8 MB

2. Computador B700:

• As especificações podem ser encontradas em: https://sdumont.lncc.br/support_


manual.php

3. BULLSequana X:

• As especificações podem ser encontradas em: https://sdumont.lncc.br/support_


manual.php

SEÇÃO 2
Resultados obtidos

2.1 B700
Primeiro vamos analisar o desempenho obtido no computador B700. Abaixo temos o
gráfico que relaciona o tempo de processo com o número de Threads utilizadas.

2
Figura 1: Gráfico Tempo (s) × Threads - B700

Primeiro, notemos que a compilação foi realizada de 2 em 2 Threads devido a limitação


do tempo de execução de JOBS no LNCC. Agora, observe que o maior tempo gasto foi
quando fizemos a compilação em serial, ou seja, utilizando-se apenas uma Thread, o que já
era esperado. De forma geral, notemos que a partir da compilação com 14 Threads, houve
uma certa estabilização do tempo de execução do processo. E de forma mais específica, o
menor tempo ocorreu com 20 Threads. Abaixo, segue o gráfico que relaciona a eficência
calculada em porcentagem com o número de Threads utilizadas:

Figura 2: Gráfico Eficiência × Threads - B700

3
Para os cálculos de eficiência, tomamos como referência o tempo gasto na compilação do
programa em serial, ou seja, utilizando apenas 1 Thread. Observe que o aspecto do gráfico
ocorreu perfeitamente como esperado em termos de estabilização a partir das 14 Threads.
E a melhor eficiência foi com 20 Threads.

2.2 BULLSequana X:
Abaixo segue o gráfico do tempo em função do número de Threads:

Figura 3: Gráfico Tempo (s) × Threads - BULLSequana X

Observamos que o desempenho com este computador foi bem melhor. De fato, a partir
das 14 Threads houve também uma certa estbilização dos tempos de execução, e o menor
tempo novamente ocoreu com as 20 Threads. Além disso, os tempos de execução a partir de
12 Threads ficaram inferiores a 120 segundos, isto é, um tempo menor do que o obtido com
o B700. Abaixo segue o gráfico que relaciona eficiência com as Threads utilizadas.
Abaixo segue o gráfico do tempo em função do número de Threads:

4
Figura 4: Gráfico Eficiência × Threads - BULLSequana X

Novamente, conforme o esperado, tivemos uma certa "estabilização"a partir das 14 Th-
reads.

2.3 Comparação entre computadores


Abaixo temos os gráficos comparativos entre os computadores B700 e BULLSequana X
em relação aos tempos de execução e às eficiências:

Figura 5: Gráfico Tempo (s) × Threads - Máquinas do LNCC

5
Figura 6: Gráfico Eficiência × Threads - Máquinas no LNCC

E abaixo temos os gráficos que comparam os tempos de execução e as eficências entre o


computador da UFF (utilizado no último Benchmark) e os computadores do LNCC:

Figura 7: Gráfico Tempo (s) × Threads das 3 máquinas

6
Figura 8: Gráfico Eficiência × Threads das 3 máquinas

SEÇÃO 3
Conclusão

Após as análises dos gráficos comparativos entre os computadores do LNCC, fica evidente
que obtivemos melhor performance com o BULLSequana X. De fato, pela Figuraa 5 notemos
que há uma distância considerável entre os gráficos. Agora em relação à Figura 6 que
relacionada as eficiências, notemos que a maior eficiência ocorreu para o computador B700,
entretanto, o BULLSequana X ainda pode ser considerado melhor, pois o tempo de execução
foi consideravelmente menor e o número de Threads é maior.
Agora, analisando-se os gráficos que relacionam os desempenhos das 3 máquinas, notemos
que o menor tempo obtido sempre foi para o computador BULLSequanda X. Agora em
relação às eficiências, notemos que para um número maior de Threads, a melhor eficiência
ocorreu para o computador B700. Mas devemos ressaltar que estamos comparando nestes
gráficos o desempenho para execuções com no máximo 8 Threads, e constatamos que a
melhor performance ocorre para um número superior a 14 Threads. Portanto, a melhor
opção para execução do Siesta em paralelo com o OpenMP realmente é utilizar o computador
BULLSequana X.

Você também pode gostar