Você está na página 1de 3

Renato B.

Pereira 0990100812

Clusters de Alto Desempenho Utilizados em atividades que requerem um grande processamento, devido complexidade e do grande volume de dados, existentes em determinadas aplicaes. Exemplos: previso meteorolgica (previso do tempo e condies climticas), simulaes geotrmicas (ou seja, simulao de eventos no solo), renderizao de efeitos especiais (muito usado em filmes), simulaes financeiras, etc.; Nesse modelo, o foco o desenvolvimento de supercomputadores, algoritmos de processamento paralelo e construo de aplicaes paralelas. Seu desenvolvimento uma alternativa aos caros supercomputadores e a facilidade est no custo e na montagem, j a performance est associada ao uso de hardware de alta velocidade (processadores ou perifricos de alta performance), capacidade de efetuar tarefas de maneira mais eficiente atravs do uso de algoritmos que resolvam questes computacionais especficas e condio de usar mltiplos computadores para executarem as sub- tarefas Sendo assim, o cluster de alta performance um sistema paralelo ou distribudo com o objetivo de dividir grandes aplicaes em tarefas menores para que possam ser processadas de maneira mais organizada. Os ns trabalham para disponibilizar recursos de maneira simples e integrada, provendo um grande poder computacional. Em uma configurao de alta performance, um n do cluster pode ser multiprocessado ou uniprocessado. Clusters de Alta Disponibilidade utilizados em tarefas crticas, ou seja, tarefas que necessitam da disponibilidade integral do sistema, existindo uma percentagem insignificante de falhas (prxima do 0%), onde qualquer falha pode causar srios problemas ao usurio final, constituindo as atividades das aplicaes denominadas de misso- crtica. Exemplos: servidores Web, de email, rede.

Clusters de Alta Disponibilidade

Estes modelos de clusters so construdos para que servios e recursos estejam sempre disponveis, sem interrupes. Basicamente, nos locais onde a disponibilidade dos sistemas torna- se uma questo vital, se o sistema parar, a empresa tambm pra. A idia geral que se um n do cluster vier a falhar, as aplicaes ou servios possam estar disponveis em outro n Clusters de alta disponibilidade aplicam- se em situaes crticas, em outras palavras, em sistemas de misso- crtica, tais como, por exemplo, bases de dados crticas e servidores de aplicaes. Sendo assim, todos os elementos constituintes de um cluster de alta disponibilidade so usados em conjunto para manter o sistema sempre ativo, replicando servios e servidores. No entanto, esse modelo propenso a ter perda de performance e poder de processamento. A seguir, so apresentados alguns exemplos de como contornar as falhas dos sistemas, considerando a categoria de cluster em questo. Hardware especializado: no mercado, existem alternativas de hardware mais especializado que prevem possveis falhas, solucionando- as atravs da redundncia de recursos. Outros so voltados para o uso de software que executa balanceamento de carga, redundncia de links , monitorao, backup em tempo real. Quanto mais especializado for o sistema, melhores resultados so obtidos; Sistemas tolerantes a falhas: Falhas dizem respeito ao ambiente fsico, quando h interferncia eletromagntica, por exemplo. Erros ocorrem quando estas falhas mudam o valor de algum dado, trocando o valor de algum bit, por exemplo. A tolerncia a falhas consiste no mnimo de impacto que o sistema possa sentir caso uma falha ocorra. Alta disponibilidade: prev as redundncias totais do sistema, atuando em caso de defeito, quando a mquina trava. Defeito caracterizado pelo erro que provoca falha no sistema, prejudicando o usurio. Esse sistema trabalha com a hiptese de completa parada do sistema, atravs de uma soluo em redundncia de hardware e controle por software. A complexidade desse controle deixada a cargo do software de gerenciamento, mantendo a simplicidade do hardware. O gerenciamento de ambientes de alta disponibilidade uma tarefa complexa, uma vez que envolve itens tais como: Vrios recursos e estados destes a serem gerenciados; Testes a serem executados periodicamente e/ou atravs de comando manual; Aes que devem ser tomadas quando os testes falharem;

E ferramentas para monitorar e gerenciar recursos e seus estados. Sendo assim, existem ferramentas de gerenciamento, livres ou proprietrias, disponveis no mercado. Como exemplo temos, Mosix , OpenMosix , ClusterKnoppix , Clustermatic , Scyld . Para montar um ambiente de alta disponibilidade importante considerar itens tais como as configuraes necessrias para obter alta disponibilidade, a redundncia de hardware e ns principais e secundrios, que seriam como espelhos do n principal. Ns secundrios (ou os chamados ns espelhos) devem possuir estado consistente com o n principal (ou que espelhado), tratando- se de dados e/ou recursos envolvidos no servio que oferecido. Em sntese, os itens que envolvem a montagem de um ambiente de alta disponibilidade so: Hardware: o indispensvel a redundncia de ns, necessria utilizao de links, alm da conexo dedicada e de alta velocidade ser recomendada; Instalao do sistema: os softwares devem ser independentes de distribuio e a identidade dos ns fica a critrio do administrador do sistema; Consistncia dos dados: utilizao de sistemas de arquivo journaled , ou seja, sistemas que comportam um registro cronolgico das alteraes efetuadas num conjunto de dados, que pode ser usado para construir uma verso anterior do conjunto. Dessa forma, estes sistemas armazenam em um journal (log) as aes antes de serem efetuadas. Com isso, em uma parada no sistema, seja por pane no sistema ou queda de energia, a recuperao muito mais rpida e sem grandes danos; Espelhamento de dados: a redundncia de dados, realizada em tempo real, necessria para a completa disponibilidade do sistema no caso em que ocorre algum problema; Controle de servios: com os dados espelhados, os servios esto disponveis para outro n, caso ocorra necessidade de utilizao. Porm, o sistema deve ser autnomo nesta transferncia, e ser capaz de se reconfigurar para continuar atendendo aos usurios; Monitoramento : o monitoramento realizado pelo sistema deve ser constante para que detecte, por exemplo, a falha e/ou a necessidade de iniciar um novo servio e parar algum outro, disparando assim, a reconfigurao.