Você está na página 1de 30

Tcnicas de tolerncia a

falhas em sistemas
distribudos
UNIVERSIDADE DO ESTADO DO RIO RANDE DO NORTE ! UERN
N"#$EO DE NOVA #RU% ! RN
DIS#I&$INA DE SISTE'AS TO$ERANTES A (A$)AS
&RO(ESSOR 'AURI#IO RA*E$$O
Arthur Giuliano da S. Pinheiro
Lvia Priscila R. de Oliveira
Sum+rio
,- Introdu./o
0- Resili1ncia de &rocesso
2- #omunica./o #onfi+3el
4- Recu5era./o
6- #onclus/o
O 7ue um Sistema Distribudo8

Um Sistema Distribudo 9SD: um


con;unto de com5utadores
inde5endentes 7ue se a5resenta a seus
usu+rios como um sistema <nico e
coerente -

Um SD de3e ser trans5arente -


2
Tolerncia a falhas em SDs
4

A ocorr1ncias de falhas 5odem fa=er o


sistema 5erder o conceito de
trans5ar1ncia-

(alhas>
?
Totais

&arciais

Um SD de3e ocultar a falha e a


recu5era./o de um recurso @ sem 5re;u=o
de desem5enho -
Tcnicas de tolerncia a falhas em SDs
6

&rote./o de 5rocessos contra falhas


?
Resili1ncia de &rocesso

#omunica./o #onfi+3el > comunica./o


entre 5rocessos

Recu5era./o
Sum+rio
,- Introdu./o
0- Resili1ncia de &rocesso
2- #omunica./o #onfi+3el
4- Recu5era./o
6- #onclus/o
Resili1ncia de &rocesso
A

A tcnica de Resilincia de processo consiste na


capacidade de recuperao a sua forma ou posio original
aps sofrer choque ou deformao adversidades

Um aspecto chave para contornar falhas de processos


organizar vrios processos idnticos em um grupo

Eiste dois tipos de grupos! o simples e o hierrquico"


Grupo simples
Grupo Hierrquico
ru5o Sim5les
B

#odos os processos so iguais$

%ecis&es so tomadas coletivamente'


Vantagens

(o tem ponto de falha )nico$

*esmo que um processo caia! o grupo continua a oferecer o servio'



Desvantagem

#omada de decis&es podem ser complicada com necessidade de uma


votao +retardo,'
Grupo Hierrquico
C

Eiste um processo coordenador os demais so operrios

-empre que uma requisio gerada! enviada para o coordenador

. coordenador decide qual o operrio mais adequado para


eecutado
Vantagens

DecisDes s/o centrali=adas



Desvantage

#aso o coordenador falhe@ o ser3i.o falhar+-


Associao a Grupos
,E

#odas as requisi&es so enviadas a um servidor


mantendo um /anco de dados completo de todos
os grupos e seus associados'

-e o servidor de grupo cair! o gerenciador deia de


eistir e assim os grupos tero que ser
reconstru0dos do zero' Alem disso o gerenciamento
pode ser centralizado ou distri/u0do'
Replica!"o
,,

A replicao consiste em facilitar a criao de


rplicas ou copias de um mesmo o/1eto em
meios f0sico diferentes! garantindo assim! que
no caso de uma falha em um dos dispositivos!
o cliente se1a redirecionado de forma
transparente para outro que tenha rplica do
o/1eto ativa'
Replica!"o Passiva
,0

2 apenas um )nico o/1eto que rece/e as requisi&es dos clientes'

.s outros o/1etos so chamados secundrios ou /ac3ups

4onstantemente so informados pelo primrio so/re o estado atual do mesmo'

5ara a realizao utiliza6se dos mecanismos de chec3point e logging'

. primrio rece/e as requisi&es! e atravs do mecanismo de chec3point estas


requisi&es so salvas nos arquivos do o/1eto primrio! um dos dois o/1etos
secundrios assume o lugar do primrio! continuando assim o processamento'
Replica!"o Ativa
,2

(o so utilizados tcnicas de recuperao

#odas as rplicas so primarias

#odas as rplicas rece/em as requisi&es num mesmo instante na


mesma ordem

Esse tipo de replicao pode gerar inconsistncia dos dados

5ara a resoluo desse pro/lema comum a pratica de utiliza6se de


uma variao deste mtodo chamada replicao ativa com votao

*elhora de desempenho no funcionamento do sistema


Re5lica./o Ati3a
,4

Desvantagem
?
Este tipo de replicao causa um trafego de informa&es para todas as maquinas
de rede na rede'

Tcnica de gerenciamento de grupos

A uma definio de grupos de o/1etos! onde so integrados em su/grupos


diferentes! contendo cada grupo uma )nica referncia'
?
4om isso tanto o pro/lema da localizao das replicas pelos clientes como
tam/m o trafego ecessivo na rede seriam resolvido! pois com a utilizao
dessa tcnica 1 estaria inclu0do a implementao de comunicao multicast!
onde apenas um determinado grupo de o/1etos rece/eria as requisi&es! ao
contrario da comunicao /roadcast! onde todos os o/1etos replicados rece/em
requisi&es
Re5lica./o Ati3a
,6

A tcnica visa tam/m felicitar a manipulao de rplicas! onde podemos


cadastrar e ecluir rplicas de um grupo! alm de aumentar a
confia/ilidade no tratamento de toler7ncia a falhas'

Comunicao Confivel
?
8rande parte dos sistemas distri/u0dos eistentes atualmente tra/alha dentro do
paradigma cliente9 servidor'

Troca de mensagens

A troca de mensagens feita atravs de primitivas eplicitas de comunicao"


Troca de 'ensaFens
,G

-end +destino! mensagem,

Receive +origem! mensagem,

Um sistema pode possuir diferentes com/ina&es desses tipos primitivos!


podemos classificar as primitivas acima da seguinte forma"
?
Direta

Indireta

!ncrono ou "loqueante

Ass!ncrona ou #o "loqueante

A principal desvantagem dessa a/ordagem o /aio n0vel de a/strao que


permite apenas a modelagem de troca indireta de informao entre processos
Sum+rio
,- Introdu./o
0- Resili1ncia de &rocesso
2- #omunica./o #onfi+3el
4- Recu5era./o
6- #onclus/o
#omunica./o #onfi+3el
,B

Um suporte de comunicao de grupo implementa um con1unto de


a/stra&es e funcionalidades que permitem a associao de o/1etos
ou processos como receptores de comunicao um para muitos-

: geralmente utilizado para minimizar compleidade das grades


aplica&es ou para prover aspectos no ; funcionais em sistemas
distri/u0dos'

<alhas no atingem somente processos! mas tam/m a


comunicao entre eles
Ti5os de (alhas
,C

$arada% Uma ligao faltosa da rede para transportar mensagens$

&misso% A rede se omite intermitentemente de transportar mensagens atravs dela$

Ar'itrria" A rede pode ei/ir qualquer comportamento' 5odendo! inclusive! gerar


mensagens esp)rias' Este tipo de falha tam/m pode ser chamada de maliciosa ou
/izantina$

(em'ers)ip
?
A lista de mem/ros de um grupo o que chamamos de mem/ership'

. sistema distri/u0do apresenta um pro/lema em suportes de comunicao em


grupo! relacionado determinao em tempo de eecuo de quais processos so
mem/ros de um grupo'
Tipos de (em'ers)ip
0E

mem'ers)ip esttico
?
.s mem/ros do grupo so conhecidos
previamente! em tempo de compilao'

mem'ers)ip din*micos

5rocessos entram e saem de grupos'

. con1unto de mem/ros de grupo pode mudar por


pelo menos trs razoes"
0,

+equisitos da aplicao% alguns mem/ros podem entrar


na sesson+grupo, aps o inicio desta e ainda alguns
podem deia l antes do seu fim'

,al)as de $rocessos% falhas de processo devem ser


removidos de grupos'

+edimensionamento% as vezes a demanda pelo sistema


cresce ou diminui tanto que redimensionamento de seis
recursos faz necessrio'
Difus/o #onfi+3el
00

Um servio de difuso confivel garante que


todas as mensagens enviadas a um grupo de
processos sero rece/idas por todos os
mem/ros no faltosos do grupo'
Tipos de difuso confivel
02

Difuso ,I,& -,irst.In. ,irst.&ut/% nada


mais que uma difuso confivel com
propriedades de ordenao <=<.'

Difuso Casual% refora a ordenao <=<.!


generalizando a noo de dependncia entre
mensagens e garantido que uma s ser
entregue a aplicao se a mensagem que a
causou tiver sido entregue antes'
Tipos de difuso confivel
04

Difuso Tempori0ada% este tipo de difuso s faz sentido em sistemas temporizados!


onde se pode esta/elecer >limites? dese1veis para utilizao de servios'

Difuso 1niforme% evita que processos faltosos originem inconsistncias em grupos de


processos poss0vel tam/m fortalecer as propriedades de ordenao e temporizao'

Difuso At2mica% a difuso at@mica garante que todos os processos corretos entregaro
todas as mensagens na mesma ordem' %esta forma! todos os processos tem a mesma
viso do sistema e podem agir de maneira consistente sem comunica&es adicionais'
Sum+rio
,- Introdu./o
0- Resili1ncia de &rocesso
2- #omunica./o #onfi+3el
4- Recu5era./o
6- #onclus/o
Recu5era./o
0G

Recu5era./o 5ara frente-


?
criado um no3o estado no 7ual o sistema
5ossa continuar a eHecu./o-

5reciso conhecer anteriormente 7uais


erros 5odem ocorrer
Recu5era./o
0A

Recu5era./o retroati3a-

retrocede 5ara um 5onto anterior I falha


sem5re 7ue ela ocorre-

arma=enamento est+3el

des5erdcio de 5rocessamento

Solu./o
?
ReFistro de mensaFens
Sum+rio
,- Introdu./o
0- Resili1ncia de &rocesso
2- #omunica./o #onfi+3el
4- Recu5era./o
6- #onclus/o
#onclus/o
0C

Redundncia uma tcnica fundamental


5ara conseFuir a tolerncia a falha-

Difus/o #onfi+3el o mecanismo mais


b+sico de comunica./o-

Recu5era./o uma tcnica eficiente@


5orm cara-

SDs de3em continuar a funcionar mesmo


na 5resen.a de falhas mantendo a
trans5ar1ncia-
Refer1ncias
2E
J,KTanenbaum@ AndreL S- and 3an STEEN@ 'arten- Sistemas Distribudos>
5rinc5ios e 5aradiFmas- 0- Ed- ! S/o &aulo> &erson &rentice )all@ 0EEA-
J0K'achado@ #aciano dos Santos- M'&I sobre 'O' 5ara su5ortar loF de mensaFens
5essimista remotoN- &orto AleFre> &&# da U(RS@ 0E,E- Dis5on3el em>
htt5>OOLLL-lume-ufrFs-brObitstreamOhandleO,E,B2O0AG6GOEEEAG2G4B-5df8
se7uenceP@ acesso em outubro de 0E,0
J2K*essani@ AlQsson Ne3es- O 5adr/o U'IO& como base 5ara comunica./o de
Fru5o confi+3el em sistemas distribudos de larFa escala- U(S# R (lorianS5olis@
Setembro de 0EE0-
J4K'endon.a@ (abio da Sil3a- Tolerncia a falhas em sistemas distribudos> a
abordaFem do #OR*AO(T- Uni3ersidade Tiradentes ! Araca;u 0EE0-