Você está na página 1de 22

Soluções em Tecnologia

Análise ambiente Exadata - FRISIA

Marcelo Dante
Especialista DBA

www.compwire.com.br | +55 41 3333.6066


Análise Ambiente Exadata - FRISIA

Objetivo:
O objetivo deste documento é evidenciar erros e falhar apresentados no relatório EXAchk
enviado pela equipe de banco de dados da Frisia para análise.

O resultado desta análise serve de base para possíveis ações de ajustes e adequações as
melhores práticas visando manter a integridade do ambiente Exadata, assim como os seus
respectivos banco de dados.

Todas as informações coletadas pelo EXAchk são sintetizadas em um único relatório sendo
efetuado comparativos com também o relatório sundiag, também encaminhado pela equipe
Frisia.

Como todas as informações foram baseadas no EXAchk, estaremos avaliando e informando


as informações referente ao Exadata, as questões relacionadas ao funcionamento do banco
de dados não estarão nesta apresentação, pois se faz necessário uma avaliação e
entendimento de todo o ambiente hoje da Frisia.
Informações do Ambiente

Ao lado temos o quadro informativo aonde são


informados as seguintes informações:

1 – Versão do Sistema Operacional;


2 – Versão dos Banco de Dados;
3 – Versão do EXAchk;
4 – Data da Coleta e tempo da Coleta.

Este quadro é meramente informativo apenas


para validação do ambiente.
Warning Inicial
Logo a seguir das informações iniciais do ambiente, foi reportado um alerta informando que apesar da coleta ter sido executada a
mesma foi gerada incompleta, e informando as opções Killed Processes ou Skipped Checks para verificação do ocorrido.

Avaliando ambos encontramos as seguintes informações:

A informação passada foi de possíveis problemas de performance e timed out do ambiente como mostra do documento de
referência abaixo, porém para uma avaliação correta, seria necessário o acesso ao ambiente e efetuar uma nova execução do
EXAchk.
https://docs.oracle.com/en/engineered-systems/health-diagnostics/autonomous-health-framework/ahfug/index.html
Entendendo o EXAchk
O EXAchk possui relatórios gerados e categorizados de acordo com o grau de importância, e são divididos nas seguintes
categorias:

CRITICAL – Alertas com criticidade alta referente ao funcionamento do Exadata, Serviços e Banco de Dados;

FAIL – Alertas de falhas reportadas no ambiente, podem ser considerado falhas de implementação e até mesmo falhas ocorridas
no decorrer da utilização do ambiente, refere-se também ao funcionamento do Exadata, Serviços e Banco de Dados;

WARNING – São alertas de menor importância, porém que requer atenção também se refere ao funcionamento do Exadata,
Serviços e Banco de Dados;

PASS – São todos os serviços que não apresentaram problemas na coleta do EXAchk, também se refere ao funcionamento do
Exadata, Serviços e Banco de Dados;

INFO – Apenas informações de possíveis issues identificados.

Nesta apresentação iremos focar nos alertas CRITICAL’s e FAIL’s, estaremos reportando alguns deles, pois para outros seria
necessário efetuar mais coletas de informações do ambiente e entender o seu funcionamento, porém todos serão listados nesta
apresentação.
Alertas Critical
Abaixo estaremos reportando os alertas com o status CRITICAL identificados no EXAchk, foram avaliados alguns em particular
que serão apresentados e que devem ser tratados com maior urgência, isso não abstem dizer que os demais não possuam a
mesma importância, porém são cenários que dependeriam de acesso e entendimento do ambiente para uma melhor análise.
Alertas Critical
Neste primeiro cenário elencamos o primeiro report System is exposed to Exadata Critical Issue DB42 , pois trata-se de um alerta
referente a um cenário de disaster e recovery, como mostra a descrição do alerta abaixo:

Este alerta visa evitar que haja problemas de corrupção dos backup’s, evitando assim possíveis perdas em um cenário de
disaster/recovery.

No slide seguinte evidenciamos em quais instâncias que serão necessário a intervenção.


Alertas Critical
Conforme reportando no slide anterior abaixo a lista de instâncias a serem regularizadas:

Como referência foi utilizado o Doc Id:


https://support.oracle.com/epmos/faces/DocumentDisplay?parent=exachkReport&sou
rceId=%20&id=1270094.1

Abaixo evidenciamos a recomendação descrita no Doc Id:


Alertas Critical
Neste segundo cenário elencamos o report Database parameter CLUSTER_INTERCONNECTS is not set to the recommended
value , pois trata-se de um alerta referente a um cenário de possível perde de conexão e impacto na performance:

Este alerta evidencia possíveis problemas de comunicação entre os servidores do cluster, a utilização do interconnect é altamente
recomendada afim de garantir maior estabilidade entre os servidores que formam o cluster, além de aumentar a performance e
disponibilidade do ambiente.
Alertas Critical
Conforme reportando no slide anterior abaixo a lista de instâncias a serem regularizadas:
Alertas Critical
Continuando o slide anterior abaixo a lista de instâncias a serem regularizadas:

Para este cenário utilizamos o Doc Id:


https://support.oracle.com/epmos/faces/DocumentDisplay?parent=exachk
Report&sourceId=%20DATABASE&id=2353240.1:
Alertas FAIL
Abaixo estaremos reportando os alertas com o status FAIL identificados no EXAchk, foram avaliados alguns em particular que
serão apresentados e que devem ser tratados com maior urgência, assim como nos alertas CRITICAL não se abstém dizer que os
demais não possuam a mesma importância, porém são cenários que também dependeriam de acesso e entendimento do
ambiente para uma melhor análise.
Alertas FAIL
Neste cenário elencamos o primeiro report The bundle patch version installed does not match the bundle patch version registered
in the database , pois trata-se de um alerta referente a questão de versionamento e possível incompatibilidade de software, como
mostra a descrição do alerta abaixo:

Esta falha é identificada em todos os databases que hoje estão


configurados no exadata.
Este tipo de falha pode ocasionar problemas como:

1 – Perda de performance e lentidão no ambiente;


2 – Erros ORA-600;
3 – Problemas de compatibilidade;
Alertas FAIL
No próprio Exachk é informado a versão recomendada, vale frisar que além das versões dos databases e do grid estarem
defasadas, a versão do bundle patch do Exadata também está desatualizada, o que torna necessário o acionamento da Oracle
para a equalização do mesmo.
Alertas WARNING
Abaixo estaremos reportando os alertas com o status WARNING identificados no EXAchk, avaliamos um em particular que será
apresentado e que devem ser tratados com maior urgência, assim como nos alertas CRITICAL e FAIL não se abstém dizer que os
demais não possuam a mesma importância, porém são cenários que também dependeriam de acesso e entendimento do
ambiente para uma melhor análise.
Alertas WARNING
Neste cenário elencamos o primeiro report TFA Collector is either not installed or not running , pois trata-se de um warning
referente a coleta de informações e diagnóstico de erros dos ambiente:

O TFA possui uma coleta automática, que fica ativa por padrão, e monitora seus logs e pesquisar por problemas.
Quando um evento for detectado, o TFA coletará e guardará em seu repositório todos os logs necessários para análise do problema. Os
logs poderão ser posteriormente acessados pelo DBA para análise e, caso necessário, poderão ser utilizados para a abertura de
chamado no suporte.
Sendo assim é altamente recomendado a instalação do TFA no ambiente.
Conclusão
Concluímos assim:

Hoje no ambiente atual há muitos pontos a serem corrigidos conforme evidenciados, o volume de alertas gerados pelo Exachk
pincipalmente os categorizados como CRITICAL e FAIL devem ter uma atenção maior afim de garantir o bom funcionamento do
ambiente.

Muitos pontos não foram debatidos nesta apresentação, pois dependem de um maior campo da analise, e de um mapeamento
maior de todo o funcionamento do ambiente.

A recomendação é de que todos esses alertas sejam tratados antes mesmo da entrada em produção do ambiente, pois muitos
pontos dependem de janela de outage e indisponibilidade.
Dúvidas ?
Análise ambiente Exadata - FRISIA

Marcelo Dante
Especialista DBA

www.compwire.com.br

contato@compwire.com.br

+55 41 3333.6066
Catálogo de Serviço Compwire

Administração Bodyshop Garantia Gerência de


Consultoria Instalação
de Ambiente (residente) Equipamento Projeto
 Melhoria contínua  Storage  Storage  SLA (acordo nível serviço)  Gestão de Projeto  Desembalagem
 Customização e ajuste  Servidor  Servidor  Substituição de peça  Comunicação  Montagem
 Avaliação e diagnóstico  Backup  Backup  Acionamento Call-Home  Controle de prazos  Instalação Física
 Preventiva e corretiva  Virtualização e S.O.  Virtualização e S.O.  Preventiva  Entregáveis  Configuração lógica
 Vistoria  Rede  Rede  Atendimento 24x7  Documentação  Atualização de firmware
 Execução de projeto  Segurança da Informação  Segurança da Informação  Atendimento 8x5  Relatório  Migração de dados
 Documentação  Gerência de projeto  Gestão operacional  Reunião periódica
 Sobre aviso  Gestão operacional

Locação de Manutenção Sustentação


Migração Movimentação Treinamento
Equipamento Corretiva de Ambiente
 Adaptado a necessidade  Diagnóstico e execução  Servidor  Desligamento  Execução por especialista  Atuação com especialista
 Garantia do equipamento  Substituição de peça  Storage  Embalagem  Carga horária  Avaliação e diagnóstico
 Desembalagem  Configuração Lógica  Dados  Transporte segurado  Aperfeiçoamento  Preventiva e corretiva
 Montagem  Execução de projeto  Firewall  Desembalagem  Pós implementação  Sobre aviso
 Instalação Física  Atendimento 24x7  SAN  Montagem  Operacional  Atendimento 24x7
 Configuração lógica  Atendimento 8x5  LAN  Instalação Física  Local e/ou Compwire  Atendimento 8x5
 Atualização de firmware  Banco de horas técnica  Atendimento 24x7  Checklist  Material impresso
 Migração de dados  Atendimento 8x5  Laboratório educacional
Serviços por Fabricante

AWS DELL/EMC Huawei Lenovo Oracle


 Gestão de ambiente virtual  Garantia hardware  Instalação física  Instalação física  Atualização
 Bilhetagem  Instalação física  Configuração lógica  Configuração lógica  Instalação
 Configuração de serviço  Configuração lógica  Movimentação  Movimentação  Configuração
 Consultoria  Movimentação  Migração de dados  Migração de dados  Consultoria
 Migração on-premise  AWS  Substituição de peça  Suporte  Migração
 Segurança  Migração de dados  Treinamento  Suporte
 Suporte serviços AWS e VM  Suporte  Sustentação  Movimentação

Palo Alto Quantum Veeam VMware

 Instalação  Instalação  Instalação  Instalação


 Configuração  Configuração lógica  Atualização  Atualização
 Consultoria  Movimentação  Configuração  Configuração
 Treinamento operacional  Migração de dados  Consultoria  Consultoria
 Suporte  Suporte  Suporte  Projeto
 Sustentação  Sustentação  Workshop
 Sustentação
Serviços foco 2020
Serviço Serviço

Monitoramento NOC/SOC Sustentação Oracle

 Manutenção
 Monitoramento 24x7
 Instalação e configuração de appliance e SGBD
 Atendimento 24x7
 Atualização e migração de SGBD
 Firewall
 Migração
 Rede e Conexão
 Sustentação ambiente
 Virtualização
 Consultoria
 Infraestrutura
 Tuning
 Processos de negócio
 Monitoramento
 Automação

Você também pode gostar