Você está na página 1de 105

Contingência e Alta

Disponibilidade
Prof. Hugo Dias
hugojdias@gmail.com

1
Agenda
• Introdução
• Motivação e
• Tecnologias
• Definição
• Conceitos
• Falhas
• Confiabilidade / Dependabilidade
• Tolerância a Falhas
• Disponibilidade
• Contigência
• Alta Disponibilidade

2
Agenda
• Alta Disponibilidade
• Nível 0 - Centralização
• Nível 1 - Backup
• Nível 2 – Redundância
• Nivel 3 - RAID
• Nível 4 - Standby
• Nível 5 - Cluster
• Nível 6 – Site Backup

3
Agenda
• Introdução
• Motivação e
• Tecnologias
• Definição
• Conceitos
• Falhas
• Confiabilidade / Dependabilidade
• Tolerância a Falhas
• Disponibilidade
• Contigência
• Alta Disponibilidade

4
Introdução
• Falhas são inevitáveis
– Compreensão das Falhas
– Evitar as conseqüências das falhas
• interrupção no fornecimento do serviço
• perda de dados
– Uso adequado de técnicas prevenção
– Custo associado / Orçamento
• Dependência tecnológica
– Segurança / Reputação das empresas
– Confiabilidade e disponibilidade dos negócios

5
Introdução
• Que sistemas são afetados pelas falhas?
– Controle de tráfego
– Geração de energia
– Manutenção de dados sigilosos
– Dados financeiros
– Telecomunicações
– Transações de e-commerce
• Exemplos
– “Sistema esta fora...”
– Pergunta: Disponibilidade na sua empresa
6
Motivação
• Necessidade de sistemas mais confiáveis
• Demanda de serviços de alta disponibilidade
• Conseqüência da interrupção dos serviços
– Incluem sistemas menos rígidos mas que geram
expectativa negativa do negócio
• Alto desempenho / Alta Confiabilidade / Alta
Disponibilidade
• Segurança
• Histórico (Como cresceu esta demanda por HA??)

7
Tecnologias
• Cloud Computing
• Remodelagem CPD
• Virtualização
• Redundância e Tolerância a falhas
• Backup
• ITIL
• ABNT NBR 15999
• Gestão de Continuidades dos Negócios (GCN)
• Análise de impactos nos negócios (BIA – Business Impact Analysis)
• BCP (Plano de Continuidade de Negócio)
• PDR (Plano de recuperação de desastres)
• ISO 2700X
• Que mais?

8
Definição
• “Tolerância a falhas é a propriedade que
permite que sistemas (em geral,
computacionais) continuem a operar
adequadamente mesmo após falhas em
alguns de seus componentes. Se sua
qualidade de operação diminui, a queda é
proporcional à severidade da falha. A
tolerância a falhas é propriedade inerente em
sistemas de alta disponibilidade ou aplicações
críticas ...”
9
Conceitos
• Falha
– Problema no nível físico ou erro algorítmo
– Ex: Falha disco (RAID), Fontes, CPU,Exceções não
tratadas
• Erro
– Problema na informação
– Sem tratamento
• Defeito
– Problema para o usuário
– Interrupção do serviço
10
Falhas
• Falhas são inevitáveis
• Derivadas da Complexidade dos Projetos e Hardware
– Grande volume de detalhes
– Deficiência das especificações
– Fragilidade humana x Complexidade
• Falhas Físicas
– Desgaste Hardware
• Falhas Humanas
– Projetos (Definição, Bugs)  MAIS GRAVES
– Interação (Operação)
• Maliciosa (Vírus)
• Ambiental (Desastres naturais, Energia, Refrigeração)
• Comunicação (Infraestrutura de Redes)

11
Falhas
• Exemplos falhas?

12
Falhas
• Considerações:
– Natureza:Hardware, Software, Operação, Projeto,
Comunicação
– Duração: permanente ou temporária
– Extensão: Local, Global, a áreas afetadas
– Valor: Tempo, Custo, Lucro cessante
• Latência da Falha: tempo entre a falha e a
manifestação do erro
• Comunicação antecipada

13
Falhas
• Cada módulo de um sistema tem um
comportamento esperado e outro observado;
• Uma falha (failure) corresponde a um desvio entre o
comportamento esperado e o observado;
• Uma falha ocorre devido a um erro (error) em um
módulo;
• A causa de um erro é chamada de falta (fault).

14
Falhas

Serviço Disponível
(Service Accomplishment)

Falta (fault)

Erro

Falha (failure)

Serviço Indisponível
(Service Interruption)

15
Falhas
• Exemplo:

Programador escreve
um trecho de código Falta (fault) ou erro latente
errado para uma aplicação

Trecho de código é
Falha (failure) ou erro efetivo
ativado pela aplicação

16
Dependabilidade
• Uma propriedade/qualidade de um sistema
computacional, tal como usabilidade, desempenho e
custo.
• Dependabilidade diz respeito a habilidade de entregar
um serviço comprovadamente confiável, ou seja,
habilidade do sistema para evitar defeitos inaceitáveis
para seus usuários.
• Qualidade do serviço fornecido por um dado sistema e a
confiança depositada no serviço fornecido
• O objetivo de tolerância a falhas é alcançar
dependabilidade (confiabilidade).
17
Dependabilidade - Atributos
• Disponibilidade
– diz respeito a média de tempo disponível para acesso.
• Confiabilidade
– diz respeito a continuidade da entrega de serviço correto.
• Performability
– queda de desempenho provocado por falhas, onde o sistema
continua a operar, mas degradado em desempenho
• Integridade
– impedimento de alterações de estado impróprias.
• Segurança (safety)
– diz respeito a garantias de não haver defeitos catastróficos ao
usuário ou ambiente.

18
Dependabilidade - Atributos
• Confidencialidade
– impedimento de acesso indevido.
• Mantenabilidade
– habilidade para reparo e modificações eficientes.
• Segurança (security)
– proteção contra acessos, ou controle, não
autorizados ao estado do sistema.
• Testabilidade
– facilidade para testar o sistema (ponto de teste,
testes automatizados)

19
Como obter sistemas confiáveis
• Prevenção de Falhas: visa prevenir a
ocorrência ou introdução de falhas.
• Validação de Falhas: remoção de falhas,
verificação da presença de falhas.
• Previsão de Falhas: visa estimar o número
presente, a incidência futura e as
conseqüências das falhas.
• Tolerância a Falhas: visa entregar o serviço
correto mesmo na presença de falhas.
20
Tolerância a falhas
• Prevenção e remoção de falhas não são
suficientes quando o sistema exige alta
confiabilidade e/ou alta disponibilidade.
• Técnicas de tolerância a falhas
– mascaramento (Redundância)
– detecção, localização e reconfiguração

21
Fases de aplicação das técnicas de
tolerância a falhas
• 4 Fases
• Detecção: testes de limites de tempo,cão de
guarda (watchdog timers),codificação:
paridade, códigos de detecção de erros, testes
estruturais e de consistência
• confinamento e avaliação : atomicidade e
isolamento
• Recuperação de erros: retorno ou avanço
• Tratamento da falha: diagnóstico e reparo
22
CREATE OR REPLACE FUNCTION f_inverso(x IN NUMBER)
RETURN NUMBER IS vFx
NUMBER;
BEGIN
vFx := 1/x;
RETURN vFx;
EXCEPTION
WHEN ZERO_DIVIDE THEN
DBMS_OUTPUT.PUT_LINE('----------------------------------');
DBMS_OUTPUT.PUT_LINE('Erro: divisão por ZERO.');
DBMS_OUTPUT.PUT_LINE('Não é possível obter o f(x) = 1/x.');
DBMS_OUTPUT.PUT_LINE('----------------------------------');
RETURN NULL;
END f_inverso;

23
Mascaramento
• O mascaramento de falhas garante resposta
correta mesmo na presença de falhas.
• A falha não se manifesta como erro, o
sistema não entra em estado errôneo e,
portanto, erros não precisam ser detectados,
confinados e recuperados
• em caso de falhas permanentes, a localização
e o reparo da falha ainda são necessários.

24
Mascaramento
• redundância de hardware (replicação de
componentes)
• codificação: ECC (código de correção de erros)
• diversidade, programação diversitária (n-
versões)
• blocos de recuperação

25
Disponibilidade
• “Propriedade de estar acessível e utilizável
sob demanda por uma entidade autorizada” –
ISO/IEC 13335-1:2004
• Sistemas no ar durante período acordado
– ERP/E-commerce/Rede/arquivos disponíveis
• Objetivo é manter os serviços disponibilizados
o máximo de tempo possível.
• Motivos Indisponibilidade:
– Hardware, Desastres (fogo), Software, etc..

26
Conseqüências da Indisponibilidade
• Produção parada
• Perda de vantagem competitiva
• Problemas financeiros (perda de receita)
• Fuga de acionistas
• Problemas jurídicos
• Fechamento da empresa
• Que problemas teriam na sua empresa ?

27
Medidas de
Confiabilidade/Disponibilidade
• Taxa de Defeitos:Número esperado de
defeitos durante vida útil do componente.
• MTTF ( Mean Time to Failure) – tempo
esperado até a primeira falha
• MTTR (Mean Time to Repair) – Tempo médio
para reparo do sistema
• MTBF (Mean time between failure) – tempo
médio entre as falhas

28
Análise de Disponibilidade
• A escala dos “9”s

Fonte: Marcus, 2003

29
Contingência
• Após a identificação e documentação das possíveis falhas de
um sistema, seus impactos e consequências, definir um plano
de contingência é elaborar um plano detalhado de ações a
serem tomadas quando as falhas ocorrerem.
• Planejamento de riscos, plano de continuidade de negócios
ou plano de recuperação de desastres
• Evitar paradas que implicam em prejuízos
• Combate/planejamento das ocorrências anormais
• Envolve diretoria (altos custos)
– Ti implementa

30
Alta Disponibilidade
• HA:High- Availability
• Sistema resistente a falhas
de hardware, software e energia, cujo
objetivo é manter os serviços disponibilizados
o máximo de tempo possível.
• Disponível/Confiável/Ausências de
Interrupções
• Redundância
– SPOF (Single Point Of Failure)

31
Primeiro Trabalho
• Duplas
• Uma empresa e um sócio

32
Soluções para Alta Disponibilidade
• Relação entre disponibilidade e investimento:

Fonte: Marcus, 2003


33
Alta disponibilidade
• Nivel 0 – Centralização das Informações
– Banco de Dados/ERP/Email/Arquivos/Impressoras
• Hardware confiável
• Fabricado para 24x7
• HD: Tempo vida: 5 anos
• Fonte: MTBF > 50.000 horas
• 5 anos de garantia do fabricante
• Memória ECC (registrada) – Correção de Erro
• Nobreak Senoidal
34
Nivel 0 – Centralização

35
Nivel 0 – Centralização
• Sistemas e Infra bem documentados
• Lista de Sistemas
• Lista de Servidores
– Ip/Oracle/Email/Serv Arquivos
• Lista de usuários Chaves
• Lista de telefones de suporte
• Pasta de mídias para reinstalação e chaves de
licença.
36
Nivel 0 - Organização

37
Nível 1 - Backup
• Agendamento
– Diário / Semanal
– Tempo de armazenamento
– Não prejudicar operação
• Janela de Backup (Tempo )
– Cópias de arquivos
– Tempo de backup e recuperação

38
Nível 1 Backup
• RPO – Recovery Point Objetives
– Dados perdidos após backup
• Tempo de recuperação após uma falha
• SLA (Service Level Agreement) tem que
considerar diversos pont
• RTO – Recovery Time Objective

39
Nível 1 Backup
• Tipos de Backup
• Nivel 0 (FULL)
– Backup completo
• Nivel 1( Incremental)
– Alterações desde o último backup full
• Nivel 1 (Diferencial)
– Alterações desde o último backup full ou
diferencial
• Outros: Archive / Lógico
40
Nível 1 Backup
• Exemplos de políticas de backup:
– Full diário:
– Indicado para ambientes com baixa freqüência de atualização, com
bancos de dados pequenos e informações de pouco valor.

SAB DOM SEG TER QUA QUI SEX

FULL FULL FULL FULL FULL FULL FULL

41
Nível 1 Backup
• Exemplos de políticas de backup:
– Full (diário) + Log (30 min):
– Indicado para ambientes com alta freqüência de atualização, com
bancos de dados pequenos e informações críticas.

SAB DOM SEG TER QUA QUI SEX

FULL FULL FULL FULL FULL FULL FULL

LOG LOG LOG LOG LOG LOG LOG

42
Nível 1 Backup
• Exemplos de políticas de backup:
– Full (Semanal) + Diferencial (Diário) +
Log (30 min):
– Indicado para ambientes com alta frequência de atualização, com
bancos de dados grandes e informações críticas.

SAB DOM SEG TER QUA QUI SEX

FULL DIFF DIFF DIFF DIFF DIFF DIFF

LOG LOG LOG LOG LOG LOG LOG

43
Nível 1 Backup
• Considerações sobre backups:
– Testes regulares de restauração são fundamentais para
garantir a integridade dos backups;
– É importante manter cópias dos backups em um local
diferente e distante de onde o backup foi realizado;
– Backups críticos devem possuir mais de uma cópia.

44
Nivel 2 – Redundância Elétrica
• Redundância Elétrica
– Fontes redundantes
– Componente mais sensível
– 2 PDU (Power Distribution Unit)
– 2 UPS (Uninterruptible Power Supply) – Nobreak
– 2 Redes Elétricas Separadas
– 2 postes distintos
– TIA – 942 (Norma para Datacenter)

45
Nivel 2 – Redundância Elétrica
• Nobreak
– Senoidal
– Rede elétrica fornece ondas quadradas
– Dupla conversão : fornecimento de energia
através das baterias (ondas mais puras)
• Evita picos

46
47
Nivel 2 – Redundância na Refrigeração
• AC de precisão para DataCenter
• não permite oscilação térmica
• Pode-se usar AC tipo conforto:
– Recomenda-se que tenha função Inverter para evitar
oscilação de temperatura / menos energia
• Novos servidores permitem trabalhar a
temperatura ambiente (EUA)
• Ar gelado na parte de baixo e frente
• Rack de costas um dos outros
– Corredor de ar-frio e ar-quente

48
49
Armazenamento de Dados
• Considerações sobre armazenamento de dados:
– Discos são elementos com grande probabilidade de falha;
– O disco é destino dos dados processados;
– Os dados precisam ser preservados e disponibilizados aos
usuários.

50
Nivel 3 - Armazenamento de Dados
• RAID:
– O padrão RAID descreve diferentes formas de combinar múltiplos
discos para garantir redundância;
– Existem 6 níveis oficiais de RAID (de 0 a 5);
– Os níveis de RAID não interferem no formato dos dados nem no
sistema de arquivos, mas sim, na forma como os dados são
armazenados fisicamente.

51
Armazenamento de Dados
• RAID-0 (disk striping)
– O nível 0 de RAID não provê nenhuma redundância, mas permite que
os dados estejam distribuídos em múltiplos discos aumentando a
performance de leitura e gravação. Este nível possui as seguintes
características:
• Boa performance de leitura e gravação
• Nenhum espaço adicional é requerido
• Nenhuma disponibilidade em caso de falhas

52
Armazenamento de Dados
• RAID-1 (mirroring) - HOTSWAP
– No RAID-1 os dados são gravados e lidos simultaneamente em 2 ou
mais discos. Em caso de falha em um dos discos, os sistema continua a
responder normalmente. Esse nível possui as seguintes características:
• Boa performance de leitura
• Perda de performance de gravação
• Alto tempo de restauração
• 100% de espaço adicional é requerido para cada cópia
• Alto índice de disponibilidade em caso de falhas

53
Armazenamento de Dados
• RAID-1+0 (striped mirrors)
– Combina características dos níveis 1 e 0 (necessariamente nessa
ordem) para prover performance e disponibilidade:

Fonte: Marcus, 2003


54
Armazenamento de Dados
• RAID-5 (Striped Parity Region)
– No RAID-5 informações de paridade são gravadas em porções de cada
um dos discos. A partir dessas informações, é possível restaurar dados
perdido, caso um dos discos do array falhe. Esse nível possui as
seguintes características:
• Boa performance de leitura
• Perda de performance de gravação
• Alto tempo de restauração
• Até 33% de espaço adicional é requerido
• Alto índice de disponibilidade em caso de falhas

55
Peças de Reposição
• Onde armazenar todas as peças
• Normalmente não se encontra pronta entrega
• Terceirizar: garantia do fabricante

56
Redundância de Rede

57
Internet Redundante

58
Nivel 4 - Servidor de Stand-BY

59
Standby
• Um servidor sobressalente

60
Replicação
• Menos tempo de recuperção

61
Replicação
• Windows
– PDC  BDC (Usuários, DNS)
– DFS (Arquivos)
• Linux
– GlusterFS (Arquivos)
– Rsync (Arquivos)
– DRBD

62
Replicação de Banco de Dados
• Oracle (Dataguard)
• SqlServer (LogShipping)
• Mysql (Binary log)
• Postgres (Log)

63
Replicação de Banco de Dados

64
Replicação
• 1 Servidor fica ocioso
• Pode perder os últimos dados gerados
• O Failover pode demorar
• O Failback é complicado
• Não protege contra catástrofes.

65
Nível 5- Cluster de Alta
Disponibilidade (HA)

66
Nível 5- Cluster de Alta Disponibilidade
(HA)
• SAN (Storage Area Network)
– Conjunto de tecnologias configuradas de tal forma que seja possível
alcançar os seguintes resultados:
• Armazenamento centralizado
• Compartilhamento de discos
• Redução de carga na rede
• Backups rápidos
• Acesso a dados eficiente

67
Nível 5- Cluster de Alta Disponibilidade
(HA)
• SAN

68
Nível 5- Cluster de Alta
Disponibilidade (HA)

69
Nível 5- Cluster de Alta
Disponibilidade (HA)

70
Nível 5- Cluster de Alta
Disponibilidade (HA)

71
Nível 5- Cluster de Alta
Disponibilidade (HA)
• Ainda não protege contra catástrofes!

72
Nivel 5 – Site Backup ou Disaster
Recovery

73
Nivel 5 – Site Backup ou Disaster
Recovery
• Somente aplicações críticas
• Distância !?
– 50M – World Trade Center
– 50KM – Fukishima
– 5400KM / 300km/ms (Luz)
• =18ms*2
• =36ms de delay
• Afeta arreplicacao
• Fora do Pais (conlucação)

74
Tipos de Replicacao
• Sincrona
– Só libera para o usuário após a confirmação do DR
– Não tem perda de informações
– Maximo 10km
– Link Alto (Fibra)
– Performance do DR tem que ser igual (tempo de
gravação)

75
Tipos de Replicação
• Assincrona
– Confirma para o usuário antes da replicação
– Usuário continua trabalhando
– O DR não precisa ter mesma performance
– Links menores
– Distancias maiores

76
Tipo de Replicação
• Point in Time
– Usuario recebe ok na mesma hora
– O site primario faz um FLUSH de tudo que foi
alterado. (LOG)
– Depois envia o LOG de tudo para o DR
– Pontos de recuperação
– Link pequeno
– Cloud

77
Replicação
• Deduplicação
– Só armazena as diferenças
– Caso o arquivo seja original é apagado os dados
são aplicados na copia
– No DR isto é feito ao nível de bloco

78
Replicação

79
Replicação

80
DR - Desafios
• Custo
• Plano de recuperação

81
Alta Disponibilidade (Oracle)
• Tipo de Backup
– Backup Lógico (expdp/impdp)
– Backup Físico (RMAN)
– Backup frio (cold Backup)
– Backup quente (hot backup)
– Tecnologia Flashback
• Flashback Query / Flashback Database
• Flashback Table / Flashback Drop
• Flashback Data Archive

82
Export
• CREATE DIRECTORY dp AS '.../datapump‘
• expdp system/password@db10g full=Y directory=dp
dumpfile=DB10G.dmp logfile=expdpDB10G.log
• expdp scott/tiger@db10g schemas=SCOTT directory=dp
dumpfile=SCOTT.dmp logfile=expdpSCOTT.log
• impdp scott/tiger@db10g tables=EMP,DEPT
directory=dp dumpfile=EMP_DEPT.dmp
logfile=impdpEMP_DEPT.log

• impdp scott/tiger@db10g tables=EMP,DEPT


directory=dp dumpfile=EMP_DEPT.dmp
logfile=impdpEMP_DEPT.log

83
RMAN

84
RMAN

85
RMAN

86
RMAN

87
RMAN
run
{
CONFIGURE DEFAULT DEVICE TYPE TO sbt_tape;
allocate channel t1 type 'sbt_tape' parms
'ENV=(TDPO_OPTFILE=/usr/tivoli/tsm/client/oracle/b
in64/tdpo.opt)';
backup INCREMENTAL LEVEL 0 CUMULATIVE database tag
'prod11_full_backup';
backup archivelog all DELETE ALL INPUT tag
'archive';
backup current controlfile tag 'prod11_controlfile';
backup spfile tag 'prod11_spfile';
}

88
Oracle Dataguard
• Síncrona
– aguardar a confirmação do StandBy Database que
o Redo foi descarregado em disco
• Assíncrona
– Evita problemas de performance no Primary
Database
– alterações ocorridas são transferidas diretamente
do Log Buffer (ao invés do Online Redo Log File)
– pequena possibilidade de perda de dados
89
Oracle Dataguard
• Apply Service
• REDO APPLY
– Fisicamente idêntico ao banco de dados principal;
– Modo de recuperação – aplicando REDO
– Aberto somente para leituras – usado para consultas;
– Managed Recovery Process (MRP)
• SQL APL
– Logicamente idêntico ( fisicamente diferente);
– Os logs são aplicados como comandos SQL no standby;
– Está disponível em modo somente leitura
– Consistência lógica dos dados

90
Oracle Dataguard
• Modos de Proteção
– Máxima Proteção (Maximum Protection)
• Altíssimo nível de proteção de dados;
• Configuração: LGWR SYNC;
• Proteção a cada transação;
• Só libera transação após o redo ser aplicado em ambos
os sites;
• Se ocorrer algum problema com o site standby, o
ambiente produtivo é parado;
• Possibilidade de sincronismo com dois sites distintos;

91
Oracle Dataguard
– Máxima Disponibilidade (Maximum Availability)
• Proteção a cada transação;
• Configuração: LGWR SYNC;
• Só libera transação após o redo ser aplicado em ambos
os sites;
• Se ocorrer algum problema com o site standby, o
ambiente produtivo continua em funcionamento;
• Quando o ambiente standby retorna, a sincronização é
feita de forma automática.;
• Pré requisito para Failover automático (Fast-start
failover);
92
Oracle Dataguard
• Máxima Performance (Maximum
Performance)
– Alto nível de performance;
– Configuração: LGWR ASYNC, ou ARCH;
– Mínimo impacto ao ambiente de produção;
– Utilizado para aplicações que toleram perda de
dados;

93
Oracle Dataguard

94
Oracle Dataguard
• Gerenciamento
• Um “Switchover” pode-ser utilizado para executar
manutenções programadas
– operação de “Switchover” tem sempre ZERO de perda de dados
(Data Loss)
• Um “Failover” converte o Standby Database para
Primary
– devido a algum problema inesperado com o Primary Database.
• Oracle Data Broker, que automatiza (E MUITO) as
operações de manutenção e monitoramento do Data
Guard Oracle

95
Oracle Dataguard
• .db_name=orcl
• *.db_unique_name=stdby
• *.db_file_name_convert='/u01/app/oracle/oradata/orcl','/u01/
app/oracle/oradata/stdby'
• *.log_file_name_convert='/u01/app/oracle/oradata/orcl','/u01/
app/oracle/oradata/stdby'
• *.log_archive_config='DG_CONFIG=(orcl,stdby)'
• *.log_archive_dest_1='LOCATION=/u01/app/oracle/archive/stdby
VALID_FOR=(ALL_LOGFILES,ALL_ROLES) DB_UNIQUE_NAME=stdby'
• *.log_archive_dest_2='SERVICE=orcl LGWR ASYNC
VALID_FOR=(ONLINE_LOGFILES,PRIMARY_ROLE) DB_UNIQUE_NAME=orcl'
• *.log_archive_dest_state_1='ENABLE'
• *.fal_client='stdby'
• *.fal_server='orcl'
• *.remote_login_passwordfile='EXCLUSIVE'
• *.standby_file_management=auto

96
Clusterware

97
Clusterware

98
Clusterware

99
Clusterware

100
NBR 15999-1 - Gestão de
Continuidades dos Negócios (GCN)
– A norma NBR 15999-1 serve como um guia para
orientar as empresas na preparação de um plano
alternativo em caso de algum incidente, com a
adoção de melhores práticas em Gestão de
Continuidades de Negócios e orientação de planos
de respostas a incidentes, fornecendo uma base
para propiciar o entendimento, desenvolvimento
e implementação de um GCN em uma
organização, independente do seu tamanho e
setor.

101
Continuidades dos Negócios (GCN)
– Avaliar o custo/benefício de ser ter uma gestão de continuidade
dos negócios.
– Avaliar o estrago que isto pode causar na imagem da empresa
diante de seus clientes.
– Avaliação dos Riscos, quais eventos podem prejudicar a entrega
dos serviços.
– Identificação dos serviços mais críticos e fundamentais para a
operação do negócio.
– Planejamento da Implementação.
– Desenvolvimento de planos de recuperação.
– Testes
– Auditorias
– Promover o alinhamento do GCSTI ao Gerenciamento de
Mudanças,
102
Plano
– a) como o PCN é ativado;
– b) as pessoas responsáveis por ativar o plano de continuidade de
negócios;
– c) o procedimento que esta pessoa deve adotar ao tomar esta
decisão;
– d) as pessoas que devem ser consultadas antes desta decisão ser
tomada;
– e) as pessoas que devem ser informadas quando a decisão for
tomada;
– f) quem vai para onde e quando;
– g) quais serviços estão disponíveis, aonde e quando, incluindo
como a organização mobilizará seus recursos externos e de
terceiros;
– h) como e quando esta informação será comunicada; e
– i) se relevante, procedimentos detalhados para soluções
manuais, recuperação dos sistemas etc.
103
Atividade
• 5 Lojas e uma central abastecimento o fica o CPD
• Diretoria quer:
– Alta-Disponibilidade e Plano de COntigência
– Há limite de custo

• Sistemas com Banco Oracle


– Vendas / Estoque / WIS
– ERP
– Notas Fiscais Eletrônicas
– Sistemas Corporativos
– Internet / Firewall / Email / Servidor Dominio / Arquivos

104
Elaborar
• Estrutura de rede
• Infra com custo moderado
• Estrutura dos servidores (Novos) e Storage
– Definir equipamentos
• Situação atual de documento e planejamento
• Procedimento de seguranca: backup
• Plano de Contigência

105

Você também pode gostar