Siesta Removed

Sumário
1 Compilação do Siesta - LNCC 2
2 Resultados obtidos 2
2.1 B700 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 BULLSequana X: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3 Comparação entre computadores . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Conclusão 7
1
SEÇÃO 1
Compilação do Siesta - LNCC
Este trabalho consiste em fazer um Benchmark da compilação do Siesta via OpenMP

utilizando os computadores B700 e BULLSequana X do LNCC. Depois faremos também
uma comparação dos resultados obtidos com o último Benchmark feito do Siesta utilizando
o computador da UFF. As especificações dos computadores utilizados foram:
1. Computador 17 da sala 107B da UFF - VR:
• Processador: Intel(R) Core(TM)i7 - 2600U

• Frequência: 3.40 GHz
• Memória RAM: 4 GB
• CPU’s: 8
• Thread por core: 2
• Core por socket: 4
• Sockets: 1
• L1d cache: 32 kB
• L1i cache: 32 kB
• L2 cache: 256 kB
• L3 cache: 8 MB
2. Computador B700:
• As especificações podem ser encontradas em: https://sdumont.lncc.br/support_

manual.php
3. BULLSequana X:
• As especificações podem ser encontradas em: https://sdumont.lncc.br/support_

manual.php
SEÇÃO 2
Resultados obtidos
2.1 B700
Primeiro vamos analisar o desempenho obtido no computador B700. Abaixo temos o
gráfico que relaciona o tempo de processo com o número de Threads utilizadas.
2
Figura 1: Gráfico Tempo (s) × Threads - B700
Primeiro, notemos que a compilação foi realizada de 2 em 2 Threads devido a limitação

do tempo de execução de JOBS no LNCC. Agora, observe que o maior tempo gasto foi
quando fizemos a compilação em serial, ou seja, utilizando-se apenas uma Thread, o que já
era esperado. De forma geral, notemos que a partir da compilação com 14 Threads, houve
uma certa estabilização do tempo de execução do processo. E de forma mais específica, o
menor tempo ocorreu com 20 Threads. Abaixo, segue o gráfico que relaciona a eficência
calculada em porcentagem com o número de Threads utilizadas:
Figura 2: Gráfico Eficiência × Threads - B700
3
Para os cálculos de eficiência, tomamos como referência o tempo gasto na compilação do
programa em serial, ou seja, utilizando apenas 1 Thread. Observe que o aspecto do gráfico
ocorreu perfeitamente como esperado em termos de estabilização a partir das 14 Threads.
E a melhor eficiência foi com 20 Threads.
2.2 BULLSequana X:
Abaixo segue o gráfico do tempo em função do número de Threads:
Figura 3: Gráfico Tempo (s) × Threads - BULLSequana X
Observamos que o desempenho com este computador foi bem melhor. De fato, a partir
das 14 Threads houve também uma certa estbilização dos tempos de execução, e o menor
tempo novamente ocoreu com as 20 Threads. Além disso, os tempos de execução a partir de
12 Threads ficaram inferiores a 120 segundos, isto é, um tempo menor do que o obtido com
o B700. Abaixo segue o gráfico que relaciona eficiência com as Threads utilizadas.
Abaixo segue o gráfico do tempo em função do número de Threads:
4
Figura 4: Gráfico Eficiência × Threads - BULLSequana X
Novamente, conforme o esperado, tivemos uma certa "estabilização"a partir das 14 Th-
reads.
2.3 Comparação entre computadores

Abaixo temos os gráficos comparativos entre os computadores B700 e BULLSequana X
em relação aos tempos de execução e às eficiências:
Figura 5: Gráfico Tempo (s) × Threads - Máquinas do LNCC
5
Figura 6: Gráfico Eficiência × Threads - Máquinas no LNCC
E abaixo temos os gráficos que comparam os tempos de execução e as eficências entre o

computador da UFF (utilizado no último Benchmark) e os computadores do LNCC:
Figura 7: Gráfico Tempo (s) × Threads das 3 máquinas
6
Figura 8: Gráfico Eficiência × Threads das 3 máquinas
SEÇÃO 3
Conclusão
Após as análises dos gráficos comparativos entre os computadores do LNCC, fica evidente
que obtivemos melhor performance com o BULLSequana X. De fato, pela Figuraa 5 notemos
que há uma distância considerável entre os gráficos. Agora em relação à Figura 6 que
relacionada as eficiências, notemos que a maior eficiência ocorreu para o computador B700,
entretanto, o BULLSequana X ainda pode ser considerado melhor, pois o tempo de execução
foi consideravelmente menor e o número de Threads é maior.
Agora, analisando-se os gráficos que relacionam os desempenhos das 3 máquinas, notemos
que o menor tempo obtido sempre foi para o computador BULLSequanda X. Agora em
relação às eficiências, notemos que para um número maior de Threads, a melhor eficiência
ocorreu para o computador B700. Mas devemos ressaltar que estamos comparando nestes
gráficos o desempenho para execuções com no máximo 8 Threads, e constatamos que a
melhor performance ocorre para um número superior a 14 Threads. Portanto, a melhor
opção para execução do Siesta em paralelo com o OpenMP realmente é utilizar o computador
BULLSequana X.

Siesta Removed

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Siesta Removed

Enviado por

Direitos autorais:

Formatos disponíveis

Sumário

1 Compilação do Siesta - LNCC 2

Este trabalho consiste em fazer um Benchmark da compilação do Siesta via OpenMP

1. Computador 17 da sala 107B da UFF - VR:

• Processador: Intel(R) Core(TM)i7 - 2600U

• As especificações podem ser encontradas em: https://sdumont.lncc.br/support_

• As especificações podem ser encontradas em: https://sdumont.lncc.br/support_

Primeiro, notemos que a compilação foi realizada de 2 em 2 Threads devido a limitação

Figura 2: Gráfico Eficiência × Threads - B700

Figura 3: Gráfico Tempo (s) × Threads - BULLSequana X

2.3 Comparação entre computadores

Figura 5: Gráfico Tempo (s) × Threads - Máquinas do LNCC

E abaixo temos os gráficos que comparam os tempos de execução e as eficências entre o

Figura 7: Gráfico Tempo (s) × Threads das 3 máquinas

Você também pode gostar