Você está na página 1de 28

Módulo 4 Gerenciamento de Problema

Módulo 4
Gerenciamento de
Problema

Todos os direitos de cópia reservados. Não é permitida a distribuição física ou eletrônica


deste material sem a permissão expressa do autor.
www.tiexames.com.br
Objetivos do módulo
Neste módulo, iremos apresentar o Processo de Gerenciamento de Problema
que tem como objetivo primário o tratamento de problemas ocasionados na
infra-estrutura de TI.

Durante este módulo iremos:

Apresentar o propósito do processo de Gerenciamento de Problema


Entender as diferenças entre Incidente e Problema
Entender os processos de Tratamento de Problema e Erro
Apresentar as Técnicas para o Gerenciamento de Problema
Apresentar principais problemas e benefícios
Missão

Minimizar a interrupção nos serviços de TI através da


organização dos recursos para solucionar problemas
de acordo com as necessidades de negócio,
prevenindo a recorrência dos mesmos e registrando
informações que melhorem a maneira pela qual a
organização de TI trata os problemas, resultando em
níveis mais altos de disponibilidade e produtividade.
Objetivos
Minimizar os efeitos adversos no negócio
Tratar Incidentes e Problemas causados por erros na infra-estrutura
Prevenir pró - ativamente a ocorrência dos Incidentes, Problemas e Erros
Reduzir o número geral de incidentes de TI
Garantir que os fornecedores cumpram os contratos
Escopo
Problemas de TI que afetam os serviços de TI
Problemas recorrentes
Gerenciamento pró-ativo de problemas
Incidentes de maior importância
Relacionamento com os fornecedores
Origem dos Problemas
Incidentes com causas desconhecidas
Análise de tendência ou prevenção
Monitoramento de serviços
Gerenciamento de disponibilidade
Gerenciamento de liberações
Conceitos
Problema: é a causa desconhecida de um ou mais incidentes
Solução de Contorno (Workaround)
Causa: é um Erro em um Item de Configuração
Erro Conhecido (Known Error): É um problema cuja Causa foi diagnosticada
e para qual existe uma Solução de Contorno
Solução: resolução definitiva do erro
Relacionamento entre Incidente, Problema, Erro Conhecido,
Mudança

Erro na infra-
estrutura

Incidente

Problema

Erro
Conhecido

Requisição
de Mudança

Resolução
Estrutura
Relacionamento entre Service-Desk, Incidente e Problema

Service Desk
• É uma função na área TI.
• Ponto central de contato entre Usuários e Gerenciamento de Serviços de TI.

Gerenciamento de Incidente
• Restaurar o serviço normal o mais rápido possível
• Usa soluções de contorno geradas no processo de Gerenciamento de
Problema

Gerenciamento de Problema
• Minimizar o efeito adverso no negócio, causado por Incidentes e Problemas,
com erros na Infra-estrutura
• Faz o diagnóstico da causa raiz dos incidentes
• Identifica uma solução definitiva
• É um processo mais demorado do que o Gerenciamento de Incidente
Entradas, Saídas e Atividades

Banco de Dados do Base de Dados


Gerenciamento Da de Erros e
Configuração (BDGC) Problemas

Incidentes
Graves

• Controle de Problemas
• Controle de Erros
• Prevenção Pró-ativa Requisição de
• Identificar tendências Mudança (RDM)
• Informações Gerenciais
• Revisão Pós Implementação
Incidentes
correlacionados

Gerenciamento de
Mudança Gerenciamento de Gerenciamento de
Configuração Liberação
Atividades
Controle de Problemas
Controle de Erros
Prevenção Pró-ativa
Identificar tendências
Informações Gerenciais
Revisão Pós Implementação
Controle de Problemas

Identificação e Registro do Problema


Acompanhamento e Monitoramento de Problemas

Classificação

Investigação e Diagnóstico

Análise da Causa Raiz

(Controle de Erros)
Controle de Problemas
Metas:
Identificar a Causa Raiz dos Incidentes (ex. Item de Configuração (IC) com
Defeito)
Depende da qualidade do registro dos Incidentes
Sua característica de evitar recorrência demanda mais planejamento e
gerenciamento
Reativo
Atividades:
Identificação e Registro (análise!)
Classificação (parecido com Incidentes)
Investigação e Diagnóstico (técnicas)
Análise da Causa Raiz
Classificação de Problemas
Categorização
Aplicar o grupo técnico responsável pela área do problema
Impacto
Efeito no negócio
Urgência
Tempo disponível para evitar ou reduzir o impacot
Prioridade
Combinação Impacto x Urgência
Análise de Kepner e Tregoe
É um método desenvolvido por Charles Kepner e Benjamin Tregoe que serve
como sistemática para resolver problemas e usar o máximo de vantagem do
conhecimento das experiências adquiridas. Os passos sugeridos para a
identificação do problema são:

Definir o Problema
Descrever o Problema relacionando identidade, localização, tempo e
tamanho
Estabilizar possíveis causas
Testar a causa mais provável
Verificar a verdadeira causa
Diagrama de Ishikawa
Diagrama conhecido como causa e efeito, busca identificar a causa raiz de um
problema através de uma série de causas e efeitos que estão relacionados com
o problema.

Segurança Lógica Middleware Rede

Sistema de
vendas
indisponível

Banco de Dados Camada lógica Camada apresentação


Controle de Erros

Acompanhamento e Monitoramento de Erros (Controle de Problemas)

Identificação e Registro de Erro

Avaliação

Registra a Solução do Erro


RDM - OK
Monitora as Soluções

Fechar Erro e Problemas Associados


Controle de Erros
Envolve o processamento do Erro Conhecido até sua erradicação via uma
Mudança, esta controlada pelo Gerenciamento de Mudança.
Metas:
Identificar, monitorar e erradicar Erros quando justificável
Ponte entre ambientes de Desenvolvimento e Produção
Ambos os ambientes alimentam a base de Erros Conhecidos
Atividades:
Identificação e Registro de Erros
Avaliação de Erros
Registro da Solução dos Erros e emite uma RDM
Monitoramento das Soluções
Fechamento dos Erros
Gerenciamento Pró-ativo de Problemas
O Gerenciamento Pró-ativo de Problemas cobre as atividades destinadas à
identificação e resolução de Problemas antes da ocorrência de Incidentes.

Essas atividades são:


Análise de Tendência
Ações preventivas
Realimentação das informações para as pessoas adequadas (informações de
tendências pode ser útil na identificação da causa raiz)
Reativo para Pró-ativo
Reativo Pró-ativo

Prevenção de problemas em
outros sistemas e aplicações
Monitoramento do Gerenciamento de
Mudanças

Iniciação de mudanças para combater:


• ocorrência de incidentes
• repetição de incidentes
Identificação de tendências

Identificação do Problema e Diagnóstico do Problema

Fornecer suporte para 2º./3º. nível


Análise de Tendência

Rede ERP E-mail

Categoria de incidentes
Peso
Funções
O Gerente de Problema deve assegurar que:
Os dados estejam registrados adequadamente
Os dados sejam regularmente auditados
Os erros conhecidos sejam registrados no BD de Erros conhecidos
A equipe de suporte esteja preparada para fazer o registro correto dos
problemas.
A equipe de suporte é responsável por:
Identificação dos Problemas
Investigação dos Problemas chegando aos Erros conhecidos
Monitoramento do Processo de eliminação dos Erros conhecidos
Emitir RDM (Requisição de Mudança) quando necessário
Identificar tendências
Comunicar soluções de contorno para o Gerenciamento de Incidente
Relacionamentos

Gerenciamento Gerenciamento Gerenciamento Gerenciamento Gerenciamento


de Incidente de Configuração de Nível de Serviço de Disponibilidade de Capacidade

Informação Informação
Incidentes &
Informação
Problemas gravados
Gerenciamento
de Problema
Informação BD Problemas

Revisão Pós-Implementação
Requisição de Mudança

Gerenciamento
de Mudança
Problemas Comuns
Qualidade das informações dos incidentes
Tempo e recursos para fazer o tratamento dos
problemas
Criar e manter uma Base de Conhecimento e Erros
conhecidos
Reconhecer que Service Desk tem um papel
importante neste processo
Lidar com Erros Conhecidos não resolvidos
Dados históricos não confiáveis para a análise de
tendência
Desvio do Service Desk
Avaliação errônea do impacto no negócio
Falta de comprometimento gerencial e da equipe
Comprometimento da equipe (cultura)
Principais Benefícios
Melhora os Serviços de TI
Reduz o Número de Incidentes
Soluções Permanentes
Melhora o aprendizado da organização
Aumento do índice de resolução do Service-Desk
no primeiro contato
IPDs - Indicadores Principais de Desempenho
Número de Problemas por status, serviço,
impacto e classificação
Número e impacto dos Incidentes durante a
operação do processo
Percentual de esforço reativo x pró-ativo
Esforço, custo e tempo dos diagnósticos
Número de Requisições de Mudança geradas
pelo processo de Controle de Erros
Tempo para Solução de Problemas x Tempo
Estimado
Retorno sobre o Investimento - ROI
Suponha que a implementação deste processo
reduza em 10% o número de incidentes gerados
por ano.
Exemplo do Benefício: Isto significa uma receita de
R$ 4.165,00 por ano – (500 incidentes x 10
minutos x R$ 0.833 por minuto)

Você também pode gostar