Artigo Supercomputador Thianei

O Supercomputador Tianhe-1A
Henrique P. Maurer, Ivan Adams, Carlos Solon, Yuri Kilian Departamento de Engenharias e Cincias da Computao Universidade Regional Integrada do Alto Uruguai e das Misses(URI) Santo ngelo, RS - Brazil
Henrique.parcianello.maurer@gmail.com, jr_solon@hotmail.com, ivan_k_adams@hotmail.com, ykilian2006@gmail.com
Abstract. This article aims to describe the characteristics of Tianhe supercomputer-1A and the need to design a computer architecture for data processing organization. Resumo. Este artigo tem como objetivo descrever as caractersticas do supercomputador Tianhe-1A e a necessidade de um projeto de arquitetura de computadores para a organizao do processamento de dados.
Introduo
Supercomputador vem sendo usado desde 1960 como termo para distinguir sistemas de alto desempenho de computadores de pequeno e mdio porte. Embora muito grande, um supercomputador pode fornecer um poder de processamento muito maior que um computador comum o que permitem que clculos sejam executados de forma mais rpida e permitam pesquisas que necessitam de muita capacidade de processamento como preveno de desastre naturais e simulao de trfego areo. Este artigo tem como objetivos descrever as caractersticas, aplicaes e algumas analogias sobre o supercomputador Tianhe-1A que est no Centro Nacional de Pesquisas da China em Tianjin e foi desenvolvido pela Universidade Nacional de Tecnologias de Defesa da China.
Aplicaes
Dentre as aplicaes de que um supercomputador capaz de auxiliar, o Tianhe-1A est envolvido com explorao de petrleo, pesquisas na rea de biomedicina, simulao de projeto de aeronaves, processamento de dados de sensoriamento, anlise de dados de engenharia financeira e simulao de ambientes de pesquisas.
Caractersticas fsicas
O Tianhe-1A composto de 112 gabinetes de computador, 12 gabinetes de armazenamento, 6 gabinetes de comunicao e 8 gabinetes de I / O. Cada gabinete de computador composto de quatro quadros, cada quadro contendo oito lminas, alm de um switch com 16 portas. Uma lmina composta de dois ns de computador, com cada n de computao com dois processadores Xeon X5670 e um mdulo de computao Nvidia M2050. Cada processador Intel desse modelo possui 2.98Ghz de
clock tendo 6 ncleos e 12MB de cache. O mdulo de computao possui a arquitetura CUDA com 3GB de memria DDR5 com interface de memria de 384-bit, velocidade de 1,55GHz e largura de banda de 184GB/s um mdulo de computao Nvidia M2050 fornece 448 ncleos CUDA que permite a integrao contnua de computao de GPU com sistemas host para uma computao de alta performance e grandes implantaes de escalabilidade horizontal de centros de dados. O sistema tem um total de 3584 lminas contendo 7168 GPUs e 14336 CPUs, geridos pelo agendador de tarefas SLURM. O SLURM trata-se de um sistema que controla as tarefas dos mdulos de computao do supercomputador, alocando acessos exclusivos dos recursos permitindo para os usurios de modo que todos possam se conectar simultaneamente. O armazenamento em disco total dos sistemas de 2 Petabytes implementado como um sistema de arquivos Lustre cluster que ser descrito na prxima seo deste artigo. O sistema de interconexo proprietrio com troughput de 160 Gbps da vem o segredo de desenvolvimento do equipamento.
Lustre
O lustre trata-se de uma arquitetura de armazenamento para clusters desenvolvido inicialmente pela Carnegie Mellon University como projeto de pesquisa iniciado em 1999. Em 2003 na sua verso 1.0 passou diretamente a ser utilizado em diversos ambientes de produo no meio acadmico e corporativo. O componente central do lustre um sistema de arquivos compartilhado para clusters. Prov uma interface POSIX. Um cluster Lustre composto pelas seguintes camadas: - Os clientes que iro acessar o sistema de arquivos. - Os OSSs - Object Storage Servers que iro prover os servios de I/O para os arquivos - Os MDSs Metadata Servers responsveis por gerenciar os nomes e diretrios do sistema de arquivos. As camadas so interligadas por meio de uma rede local. Tradicionais como gigabit ethernet ou de baixa latncia como Infiniband ou Myrinet. Os storages de discos (OST) so interligados aos servidores MDSs e OCSs por meio de uma rede de armazenamento de dados (SAN Storege Area Network). Os servidores MDS e OSS executam as funes de leitura, escrita e alteraes impostas por estes sistemas de arquivos. Cada servidor OSS pode ser responsvel por mltiplos OSTs uma para cada volume, sendo o trfego de I/O balanceado pelos servidores e storages. Um servidor OSS com o hardware adequado pode controlar de 2 a 25 volumes, onde cada um pode ter oito terabytes de tamanho. A capacidade mxima do Lustre dada pelo somatrio dos volumes de armazenamento. Com relao aos servidores de metadados (MDS), um storage devera ser anexado para o armazenamento dos metadados. O espao de armazenamento deve ser calculado na base de 2% da capacidade total do sistema de arquivos. O processo de acesso aos dados nos MDS requer muito acessos de leitura e escrita em pequenas quantidades de dados, bem diferente do processo relacionado aos OSS, que precisa grande largura de banda para I/O ao acesso dos dados armazenados.
O Lustre utiliza uma metodologia de para recuperao de dados baseada em journaling e, no caso do MDS, podemos ganhar 20% a mais de desempenho colocando o journal em outro dispositivo. O servidor MDS necessita de bastante processamento e, dependendo do tamanho da estrutura de armazenamento, mquinas quad-core devem ser utilizadas.
Concluso
Com as informaes descritas neste artigo podemos constatar que so vrias as tecnologias empregadas para que o Tianhe-1A se torne um sistema hibrido. por meio das tecnologias concorrentes que so gerados grandes sistemas teis para uso organizacional constatando-se que em um mundo de somente uma tecnologia a corrida pela mais veloz no ocorre devido acomodao, sendo assim a concorrncia um bom fator para surgimento de novas tecnologias cada vez mais velozes. Podemos perceber tambm que sem um projeto consolidado de arquitetura de computadores no podemos ver vias de organizao em um sistema de supercomputao.
7. Referncias
PITANGA, Marcos. Construindo Supercomputadores com Linux NVIDIA Corporation. Mdulo de Computao de GPU Tesla M2050/M2070, disponvel em http://www.nvidia.com.br/object/product_tesla_M2050_M2070_br.html Lustre a Network Clustering FS, disponvel em www.lustre.org SLURM a Highly Scalar Resource https://computing.llnl.gov/linux/slurm/ InfiniBand Linux SourceForge http://infiniband.sourceforge.net/ Manager, disponvel em
Project,
disponvel
em

Artigo Supercomputador Thianei

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Artigo Supercomputador Thianei

Enviado por

Direitos autorais:

Formatos disponíveis

O Supercomputador Tianhe-1A

Você também pode gostar