Escolar Documentos
Profissional Documentos
Cultura Documentos
Apresentação Frisia
Apresentação Frisia
Marcelo Dante
Especialista DBA
Objetivo:
O objetivo deste documento é evidenciar erros e falhar apresentados no relatório EXAchk
enviado pela equipe de banco de dados da Frisia para análise.
O resultado desta análise serve de base para possíveis ações de ajustes e adequações as
melhores práticas visando manter a integridade do ambiente Exadata, assim como os seus
respectivos banco de dados.
Todas as informações coletadas pelo EXAchk são sintetizadas em um único relatório sendo
efetuado comparativos com também o relatório sundiag, também encaminhado pela equipe
Frisia.
A informação passada foi de possíveis problemas de performance e timed out do ambiente como mostra do documento de
referência abaixo, porém para uma avaliação correta, seria necessário o acesso ao ambiente e efetuar uma nova execução do
EXAchk.
https://docs.oracle.com/en/engineered-systems/health-diagnostics/autonomous-health-framework/ahfug/index.html
Entendendo o EXAchk
O EXAchk possui relatórios gerados e categorizados de acordo com o grau de importância, e são divididos nas seguintes
categorias:
CRITICAL – Alertas com criticidade alta referente ao funcionamento do Exadata, Serviços e Banco de Dados;
FAIL – Alertas de falhas reportadas no ambiente, podem ser considerado falhas de implementação e até mesmo falhas ocorridas
no decorrer da utilização do ambiente, refere-se também ao funcionamento do Exadata, Serviços e Banco de Dados;
WARNING – São alertas de menor importância, porém que requer atenção também se refere ao funcionamento do Exadata,
Serviços e Banco de Dados;
PASS – São todos os serviços que não apresentaram problemas na coleta do EXAchk, também se refere ao funcionamento do
Exadata, Serviços e Banco de Dados;
Nesta apresentação iremos focar nos alertas CRITICAL’s e FAIL’s, estaremos reportando alguns deles, pois para outros seria
necessário efetuar mais coletas de informações do ambiente e entender o seu funcionamento, porém todos serão listados nesta
apresentação.
Alertas Critical
Abaixo estaremos reportando os alertas com o status CRITICAL identificados no EXAchk, foram avaliados alguns em particular
que serão apresentados e que devem ser tratados com maior urgência, isso não abstem dizer que os demais não possuam a
mesma importância, porém são cenários que dependeriam de acesso e entendimento do ambiente para uma melhor análise.
Alertas Critical
Neste primeiro cenário elencamos o primeiro report System is exposed to Exadata Critical Issue DB42 , pois trata-se de um alerta
referente a um cenário de disaster e recovery, como mostra a descrição do alerta abaixo:
Este alerta visa evitar que haja problemas de corrupção dos backup’s, evitando assim possíveis perdas em um cenário de
disaster/recovery.
Este alerta evidencia possíveis problemas de comunicação entre os servidores do cluster, a utilização do interconnect é altamente
recomendada afim de garantir maior estabilidade entre os servidores que formam o cluster, além de aumentar a performance e
disponibilidade do ambiente.
Alertas Critical
Conforme reportando no slide anterior abaixo a lista de instâncias a serem regularizadas:
Alertas Critical
Continuando o slide anterior abaixo a lista de instâncias a serem regularizadas:
O TFA possui uma coleta automática, que fica ativa por padrão, e monitora seus logs e pesquisar por problemas.
Quando um evento for detectado, o TFA coletará e guardará em seu repositório todos os logs necessários para análise do problema. Os
logs poderão ser posteriormente acessados pelo DBA para análise e, caso necessário, poderão ser utilizados para a abertura de
chamado no suporte.
Sendo assim é altamente recomendado a instalação do TFA no ambiente.
Conclusão
Concluímos assim:
Hoje no ambiente atual há muitos pontos a serem corrigidos conforme evidenciados, o volume de alertas gerados pelo Exachk
pincipalmente os categorizados como CRITICAL e FAIL devem ter uma atenção maior afim de garantir o bom funcionamento do
ambiente.
Muitos pontos não foram debatidos nesta apresentação, pois dependem de um maior campo da analise, e de um mapeamento
maior de todo o funcionamento do ambiente.
A recomendação é de que todos esses alertas sejam tratados antes mesmo da entrada em produção do ambiente, pois muitos
pontos dependem de janela de outage e indisponibilidade.
Dúvidas ?
Análise ambiente Exadata - FRISIA
Marcelo Dante
Especialista DBA
www.compwire.com.br
contato@compwire.com.br
+55 41 3333.6066
Catálogo de Serviço Compwire
Manutenção
Monitoramento 24x7
Instalação e configuração de appliance e SGBD
Atendimento 24x7
Atualização e migração de SGBD
Firewall
Migração
Rede e Conexão
Sustentação ambiente
Virtualização
Consultoria
Infraestrutura
Tuning
Processos de negócio
Monitoramento
Automação