Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo de Artigo Científico Sobre HPC
Resumo de Artigo Científico Sobre HPC
Andrei Mattos
Jeovano Coutinho
Vanderson Martins
DOURADOS – MS
2018
Introdução
Design
Implementação
Avaliação de Desempenho
Resultados do benchmark
Após a coleta de dados dos benchmarks efetuados foi possível observar que tanto no teste
com o detector de falhas esporádico quanto no periódico o overhead variou de menos de
1% até 21% e com média de 10% e também que com o uso do detector de falhas
periodicamente ele igualou ou superou em 2-6% o uso esporádico. Após foram conduzidos
testes com checagens periódicas como uma atividade sendo executada ao fundo da
principal, neste teste utilizou um switch com Gigabit Ethernet no mesmo cluster. O resultado
foi que não houve overhead algum nos códigos NPB sobre 128 processos.
Após todos os testes pode-se observar alguns comportamentos, como o overhead em
utilizar testes de falha esporádicos difere significantemente em diferentes benchmarks, cada
MPI faz a chamada da aplicação de forma diferente internamente aonde gera um overhead
diferente, ou seja benchmarks que fazem um maior número de chamadas da MPI tendem a
sofrer mais com overhead. Enfim, os testes mostraram que o uso de detecção de falhas
periodicamente tem um desempenho maior em códigos com comunicação intensa.
Conclusão
Foi criado e implementado duas abordagens diferentes, a onde uma utiliza o conceito de
teste periódico de falhas com uma rede em anel e enquanto a outra utiliza o conceito
esporádico de testes com utilização de mensagens ponto-a-ponto. Os dados experimentais
indicam que enquanto o detector de falhas esporádico minimiza o gasto de banda gerando
probes apenas quando é criado uma chamada da MPI. Em contrapartida o modo periódico
estatisticamente evita conexões conforme o número de processos aumenta.
De modo geral o teste de falhas periódico se mostrou melhor que o seu oponente a onde
existe comunicação intensa.
Referência
Assessing HPC Failure Detectors for MPI Jobs - Kharbas, K. Kim, D. Hoefler,T.
Mueller, F (2012)