Escolar Documentos
Profissional Documentos
Cultura Documentos
10.11.2016 3
A ITGX
Por que
Por que aa ITGX
ITGX ??
Simplificação Agilidade
Eficácia
Inovação Integração
Nossas Competências:
– Business Inteligence
• Dashboards para acompanhamento de KPIs
• Relatórios e Cubos Analíticos
• Big Data (Incorporação de info de Cloud)
• Compliance (Negócio)
– Infraestrutura
• Segurança da Informação
• Compliance (Rede, Banco de Dados, Aplicações)
• Recuperação de Desastres e Continuidade
• Monitoração de TI (NPM)
• Virtualização e Cloud Computing
– Banco de Dados
• Gestão e Tunning de Banco de Dados
– Digital Performance (APM)
• Analise de Performance e Capacidade de Aplicações e Infra
• Troubleshooting de Problemas em Produção
SNOC
24x7
SNOC
SNOC– Centro
- Gerenciamento
de Gerenciamento
de Infraestrutura
de Redeee Segurança
Segurança
Maior Maior
Visibilidade Agilidade
Segurança
Monitoramento de Rede
de
Infraestrutura
Monitoramento Antivirus
de Aplicações
Backup Patches
Parcerias estratégicas
Alguns Clientes
Niveis de Serviços oferecidos pela ITGX
Serviços
Gerenciados
Monitoria do
Ambiente
Serviços de Suporte
Desenho da Solução
Implementação da solução
A Companhia
• Fundada em 1996
• Matriz em Nuremberg, Alemanha
• 20 anos de experiência em desenvolver soluções poderosas e fáceis de
utilizar para monitorar a TI de nossos clientes
• Mais informações: www.paessler.com/company
–
Compromisso com :
• Fazer o mais simples possível para:
Licenciamento, Instalação, Configuração, e Utilização
• Ser justo e transparente!
• Um negócio bem sucedido tem que gerar benefícios para todas as partes
• Que são os mesmos compromissos da ITGX, por isso a parceria bem
sucedida !
10.11.2016 13
Paessler – Fatos e Numeros
10.11.2016 14
PRTG: Tudo Incluido! Sem Custos Escondidos !
10.11.2016 15
A Prova de Cerificação
Material Recomendado :
– Usar o PRTG por 3 meses
– Ver os Vídeos do canal da PAESSLER no YouTube ou no Site da empresa
– Ler o Manual
– Ver os FAQs
– Conhecimento de TCP/IP Básico é Fundamental
PROBES podem ser Instalados Livremente, quantos você quiser, dentro de um Pais !
CORE Server normalmente é Limitado em 1 ativo, e um em HA, Passivo
Licenças :
– Trial : Ilimitada, mas válida por 30 dias – após 30 dias, vira a Free
– Free : Limitada a 100 sensores
– Licenças Limitadas : 500, 1000, 2500, 5000 sensores
– XL1 - Ilimitada : Sensores Ilimitados, porem apenas 1 CORE Server em HA
– XL5 – Ilimitada : Até 5 Core Servers, Independentes ou não
– As Licenças Comerciais NÃO podem ser instaladas no software Free
10.11.2016 19
Por que monitorar?
10.11.2016 20
O que monitorar?
10.11.2016 21
O que monitorar?
10.11.2016 22
O que monitorar?
10.11.2016 24
O que monitorar?
– Agora, se você perguntar para quem paga a conta (CIO, CFO, CEO)....
10.11.2016 25
O que Monitoramos com o PRTG ?
10.11.2016 26
O que não Monitoramos com o PRTG ?
10.11.2016 27
Diferenças entre o PRTG e um APM ?
Como vimos até agora, o PRTG nos da uma visão Global e Horizontal
da TI de uma Empresa.
Já um APM nós dará uma visão Vertical da TI, com foco em uma
aplicação.
– Podemos ter múltiplas notificações no mesmo sensor com o mesmo evento, para pessoas diferentes
– Podemos ter múltiplas notificações no mesmo sensor com eventos diferentes
– Toda a notificação pode ter um escalonamento (Se não resolver em X tempo, dispara outra notificação para outra
pessoa)
– Toda a notificação pode ter uma “notificação de solução” associada, que é disparada quando o problema é resolvido
10.11.2016 32
Processo de Notificação e Escalonamento
10.11.2016 34
Integração do PRTG com outras Soluções
Com estas opções podemos Integrar o PRTG com outros Aplicativos e Consoles
de Gerencia
– Via SNMP Trap (O PRTG pode Enviar e Receber Traps para notificar de um Alarme)
• Ex: O Oracle Grid Control pode enviar uma Trap para o PRTG para informar que tem um
problema no Oracle
• O PRTG pode enviar uma Trap para a TEC do Tivolli para indicar que um Link caiu
– Via HTTP POST
• O PRTG pode repassar alertas para o SLACK e outros aplicativos via HTTP POST
• https://blog.cdemi.io/setting-up-prtg-to-post-to-slack/
• Aqui vemos como integrar com o Linc ou Sype
• https://www.matthewproctor.com/sending-prtg-notifications-via-lync/
– Via envio de e-mail para o seu Sistema de Ticket
• Na ITGX temos o PRTG Integrado com o ZenDesk
– Via API
• Você pode criar aplicativos que falem com o PRTG para enviar e/ou receber Notificações para
o PRTG
• Um exemplo disto é : http://www.prtgplugins.com/
• Outra integração interessante é : https://www.uvexplorer.com/ que mapeia a sua rede na
camada 2 integrado ao PRTG
10.11.2016 35
Integração do PRTG com outras Soluções
Ticket
Backup E-Mail System
Query E-Mail
Plug-In
E-Mail
Trap
SNMP E-Mail
Oracle
Grid
Control http post
Trap action
SNMP
PRTG http post
http post action
action
Trap http post
SNMP action
Tivolli Enterprise
Console
10.11.2016 36
O PRTG
Arquitetura
10.11.2016 37
PRTG Arquitetura do Produto
PRTG Server
– Responsável pela Interface do usuário, Configurações, Geração de Alertas e Relatórios
PRTG Probe
– Responsável por executar a monitoria
– OBS : Os Sensores são executados no PROBE, não nos dispositivos monitorados
10.11.2016 38
Monitoramento distribuido com o PRTG
10.11.2016 39
Pagina Inicial do PRTG
Hierarquia do PRTG
Hierarquia do PRTG
Probe Localidade
– Testes Externos
– Network
• Links e Roteadores
• Firewalls
• Switches
• APs
– Servidores
• DBMS
• Aplicação
• Infraestrutura
• Storages
– Sistemas e Serviços
• CRM
• ERP
• Site
Configuração do PRTG
Por ser hierárquico, todas as configurações feitas nos grupos mais altos serão
validos para todos dai para baixo :
– Para evitar problemas, devemos evitar substituir configurações globais por outras
muito especificas, feitas diretamente em dispositivos ou sensores.
– Se isso for mandatório, devemos ter isso documentado e divulgado para todos da
equipe de monitoria.
– As configurações, (usuários, acessos, tempo de scan, etc...) devem ser sempre feitas
nos níveis o mais alto possíveis
– Devemos sempre Agrupar dispositivos por suas funções em Grupos
– Cada Localidade deve ter um PROBE e a hierarquia das localidades devem ser
sempre iguais (retirando apenas o que não existe em alguma delas)
– Como vimos anteriormente as Notificações também respeitam a hierarquia do PRTG,
e podem ser herdadas ou suprimidas, quando criamos uma nova notificação em um
nível mais baixo
Configuração do PRTG
Recomendações :
– Intervalo de SCAN
• 1 min para Network e Serviços Críticos (site)
• 5 min para servidores (x1.5 para WMI) padrão
• Atenção para não termos sobreposição de scans
– Usar SNMP v2c sempre que possível
– Limitar o uso de WMI e Performance counters se possível, pois consomem recursos
– Limitar a 2500 sensores “tipo 1” (Ping, SNMP, verificação de Porta) por Probe (é
suportado até 5.000 e em maquina Fisica)
– Sensores “tipo 5” (SOA, Sniffer, xFlow, Business Process, File Scan) chegam a
consumir 300x mais recursos do PROBE que os sensores “tipo 1”, e são limitados a 50
por Probe (já equivaleriam aos 2500 sensores “tipo 1”)
– Os tempos de SCAN podem ser redefinidos de um mínimo de um a cada 10 seg ate o
tempo que você achar necessário (não recomendo)
– Mais de 2.500 sensores por Probe é recomendado ter maquina FISICA
– Não passar de 5.000 sensores por Probe, não é Suportado
– Usar o CORE em maquina Física para ambientes com mais de 5.000 sensores
– Quando em maquina Virtual, as Maquinas do PRTG devem estar Fixas nos Hosts
ESXi / Hyper-V (sem DRS para estas maquinas)
– Quando tivermos mais de um CORE Server na Instalação, usar o Enterprise Console
para a visualização Integrada da Monitoria
Configuração do PRTG
Rede Conjunto de computadores Interligados pelo mesmo meio físico que falam o mesmo protocolo
Roteador Equipamento que Interliga diversas Redes Logicas ou Fisicas (Rede do RH com a do Financeiro, ou Matriz com Filiais)
Equipamento que Interliga diversos Computadores, porem qdo um fala todos escutam, como vc gritar para outra pessoa em
Hub uma sala cheia
Equipamento que Interliga diversos Computadores, porem qdo um fala so o destinatário escuta, como falar com uma pessoa ao
Switch telefone - Elimina a Colisão - mais seguro
AP Um HUB que usa o Ar como meio de Transmissão
Técnica que permite diversas redes diferentes compartilharem os mesmos recursos físicos - Switches/Cabos, sem que um
VLAN (802.1q) interfira com o outro. Aumenta Segurança e Controle, Limita o Domínio de Broadcast
Trunk Juntar, porem mantendo a segregação, 2 ou mais VLANs em um mesmo Cabo e Porta de Switch
Juntar 2 ou mais cabos de rede entre equipamentos diferentes e trata-los como se fossem 1 só cabo, para Aumentar o
LACP (802.3.ad), Bounding Thrugthput (Performance) e Disponibilidade
802.3 ou CDMA/CD ou
Ethernet Exemplo de protocolo de comunicação de enlace - Camada 2 do modelo OSI (MAC x MAC)
802.11 ou CDMA/CA ou
WiFi Exemplo de protocolo de comunicação de enlace - Camada 2 do modelo OSI (MAC x MAC)
Cabo UTP Meio Fisico (Camada 1 do modelo OSI), Unshielded Twisted Pair (Cabo de Par Trançado não Blindado)
Endereçamento IP Composto por um Endereço e uma mascara de Rede, que identifica um único dispositivo na rede
Endereços Locais Rede 10.0.0.0/8, Rede 172.16.0.0/12, Rede 192.168.0.0/16, Rede 169.254.0.0/16
Termos comuns
Suíte de Protocolos de Redes, compreendendo Network Access Layer (Físico), Internet Layer (IP, ICMP, ARP), Transport Layer
TCP/IP (TCP, UDP), Application (Ports : HTTP/S, Telnet, FTP, SMTP, Oracle, SQL Server)
Internet Protocol, base da comunicação das redes atuais, dentro da suíte de protocolos IP temos os Orientado a Conexões
(TCP), os não Orientado a Conexões (UDP), os de Controle (ICMP), Gerenciamento (IGMP) e o de resolução de endereços
IP físicos (ARP)
Transmission Control Protocol : Usando para as comunicações com controle de sessão (os que vc sabe que o destinatário
TCP recebeu ou não o pacote), são mais seguras que as conexões UDP (sem conexão), mas tem um overhead maior
User Datagram Protocol : Protocolo sem controle de sessão, utilizado em aplicações que necessitam de rápida resposta e baixo
UDP controle (Ex : DNS, VoIP, Video), Send and Forget, você não sabe se o destino recebeu o pacote.
Utilizado para verificar ou controlar as comunicações (Ex: PING na maioria das plataformas usa ICMP), Router Redirect é uma
mensagem ICMP que um roteador (default gayteway da rede), informa a um cliente que para chegar a um determinado destino
ICMP ele deve falar com outro roteador (cria rotas estáticas temporárias nos clientes) é um risco de segurança
Latência Tempo de Propagação de uma informação pelo meio (latência alta, impacta na interatividade de uma aplicação – ex: TS, VoIP)
Normalmente medido em Mbps, mede a Capacidade de um Link, ou Quanto de informação o Link leva de um ponto a outro
Banda naquele intervalo de Tempo (Não é Velocidade do Link, que é medida pela latência)
Tempo que um pacote foi enviado ao seu destino e a sua resposta voltou (o tempo de PING é o RTT entre os 2 pontos), e a
RTT (Round Trip Time) metade da Latência.
Variação da Latência, qdo temos um Jitter alto, é sinal que o link está com problemas e pode vir a cair (impacta diretamente na
Jitter qualidade de aplicações UDP – VoIP / Video e outras)
Flap Usado para indicar que um link está ficando Ativo e Inativa varias vezes em um período curto de tempo
Qualidade de Serviço, em termos práticos usamos em 2 senários : Limitação ou Priorização de Banda e Pacotes por aplicção
QoS (priorizar as mais importantes), ou se tratando de VoIP, a medida da qualidade do Link
Mean Opinion Score (indicador médio de opinião), um indicador empírico e subjetivo que a CISCO criou para indicar a
qualidade de uma ligação VoIP em um link (5 = Excelente, 0 = Link Fora), os itens que afetam o MOS são : Latencia, Jitter,
MOS Pacotes fora de Ordem, Corrompidos e Perdidos
Link
O que ?
– Disponibilidade
– Latência
– Banda
– Protocolos sendo utilizados
– IPs que consomem recursos (ofensores da rede)
– Qualidade de Seviço para Voz e Video
Como
– Ping em IP com rota passando pelo Link (ou usar Probe Externo)
– Ping até o destino, ou usar o IP-SLA
– SNMP na porta do Roteador
– Coleta de xFlow do roteador ou Packet Sniffer da porta espelhada
– IP-SLA, ou QoS entre 2 Probes
10.11.2016 51
Monitorando Link : Disponibilidade e Latência
– Via IP-SLA
• Mede a qualidade do link entre 2
Roteadores Cisco
• Problema :
– Só disponível nos Roteadores CISCO
– Tem CUSTO de Licença Extra
– A Administração dos Roteadores
geralmente é da OPERADORA, que
pode configurar o IP-SLA de forma
ERRADA
Monitorando Link : Consumo de Banda
Quando monitoramos o consumo de Para sabermos o que esta trafegando no link Internet
banda de um Link, normalmente
vemos a sua ocupação (Ex: temos a Configurar o NetFlow no Roteador
Enviando as Informações para o Probe PRTG
ocupação de 40Mbps de um link de
50Mbps)
Porem só esta informação, não é
suficiente para descobrirmos o que
ou quem está causando esta
ocupação, para isso, temos que usar
a análise de fluxo de dados na rede
(sFlow, NetFlow, jFlow, IPFIX)
O processo de Coleta de
Informações de consumo de link é
feito no dispositivo sendo analisado
(coletor), e os dados são enviados
para uma aplicação para a sua xFlow Data
análise (Server)
O PRTG é um Server xFlow
O Agente deve ser ativado no Informações do trafego são coletadas pelo Dispositivo
e enviadas ao Server O PRTG Analisa os Dados Recebidos e Mostra :
Dispositivo (Roteador, Firewall, Protocolos que mais consomem
IPs que mais Consolem
Switch), sendo analisado Quem fala com quem
Alternativa ao xFlow
Eventualmente, nossos dispositivos Para sabermos o que esta trafegando no link Internet
de rede podem não ter suporte a Via Network Sniffer
10.11.2016 56
Monitorando VoIP
Como : QoS
Sensor
– Via IP-SLA
• Mede a qualidade do link entre 2
Roteadores Cisco
– Via QoS Sensor do PRTG
• Mede a qualidade entre 2 Probes do
PRTG
• O Sensor é instalado nos Probes do
PRTG
• A LAN vai interferer na medição
– Via SIP PING
• O PRTG solicita que o PABX
ping o dispositivo final
• Problema :
– Só disponível nos Roteadores CISCO
Monitorando Switches
Dados operacionais
– Banda por porta
• SNMP
• RMON SNMP Query
– Erros
– Broadcasts
– Drops
– Colisões (!)
– Tamanho de pacotes
Como
– Ping
– SNMP
– WMI / Performance Counters / SSH
– Verificação de Processos e Arquivos
– Sensores especificos para DELL, HP, IBM 10.11.2016 62
Servidor Linux
O que ?
– Disponiblidade e UpTime
– CPU, Memória, Disco (espaço), Rede
– Hardware : Fontes, Erros de Discos, Temperatura, Abertura Chssis (Insight
ou Open Manager deve estar instalado no servidor)
– Existencia e Conteúdo de Arquivos / Diretório
– Procesos : Está em execução
– Syslog
Como
– Ping
– SNMP
– SSH / Scrip
– Syslog
– WBEM
– Sensores especificos para DELL, HP, IBM
10.11.2016 63
Storages
O que ?
– Disponibilidade
– CPU / Memória / Rede (SAN / NAS)
– Controladoras
– Volumes Logicos
– Discos Fisicos
– I/O
– Espaço em Disco
Como
– Ping, TCP Port
– Sensores especificos do Storage (NetApp, QNAP, EMC, EVA, DELL)
– MIB Importer (para outros como Compellent, 3Par, outros)
10.11.2016 64
Oracle
O que ?
– Disponibilidade
– Memoria
– I/O
– Armazenamento
– Objetos
– Sessoes
– Outros...
Como
– Ping, TCP Port, Oracle Especifico, Processos, Logs
– Queries no Banco de Dados
– SNMP
– Integração com o CloudControl (Via Trap SNMP)
10.11.2016 65
Oracle 10g e 11g
SQL Server
O que ? Descrição Alarme Erro
SELECT ROUND((1-(sum(phy.value) / (sum(cur.value) + sum(con.value))))*100,2) "Cache Hit Ratio"
FROM gv$sysstat cur, gv$sysstat con, gv$sysstat phy
WHERE cur.name = 'db block gets'
Buffer Hit Ratio AND con.name = 'consistent gets'
AND phy.name = 'physical reads'
and cur.INST_ID = con.INST_ID
and con.INST_ID = phy.INST_ID <90 <70
Library Cache Hit rate select 100*(sum(pins)-sum(reloads))/sum(pins) from gv$librarycache <99 <80
Dict Cache Hit rate select 100*(sum(gets)-sum(getmisses))/sum(gets) from gv$rowcache <90 <69
select sum(value) from gv$sysstat
Redo Log space requests
where name = 'redo log space requests' 5000 10000
Page Splits Number of page splits per second that occur as the result of overflowing index pages.
SELECT Decode(sum(immediate_gets)+sum(immediate_misses),0,0,
Redo Allocation Ratio sum(immediate_misses)/(sum(immediate_gets)+sum(immediate_misses))*100) ratio
FROM gv$latch WHERE name IN ('redo allocation') >81 =100
SELECT Decode(sum(immediate_gets)+sum(immediate_misses),0,0,
Redo Copy Ratio sum(immediate_misses)/(sum(immediate_gets)+sum(immediate_misses))*100) ratio
FROM gv$latch WHERE name IN ('redo copy')
>81 =100
select /*+ no_merge */ sum(io.physical_reads)
from gv$sess_io io
Sessões atuais com mais leituras , gv$session s
físicas where s.sid = io.sid
and s.type != 'BACKGROUND‘and io.INST_ID = s.INST_ID
order by io.physical_reads >50000 >75000
select substr(to_char(max(100 * s.disk_reads / t.total_disk_reads), '99.00'),
2) || '%' load
from (select sum(disk_reads) total_disk_reads
from gv$sql
where command_type != 47) t,
SQL que consomem mais LOAD gv$sql s,
do Banco de Dados gv$sqltext p
where 100 * s.disk_reads / t.total_disk_reads > 2.5
and s.disk_reads > 50 * s.executions
and s.command_type != 47
and p.address = s.address
and s.INST_ID = p.INST_ID
10.11.2016>90
>85
66
Oracle 10g e 11g
SQL Server
O que ? Descrição Alarme Erro
select round(((df.BYTES - fs.BYTES) / df.BYTES) * 100) usage_pct , df.TABLESPACE_NAME
FROM
( select TABLESPACE_NAME, sum(BYTES) BYTES, count(distinct FILE_ID) FILE_ID from dba_data_files
Check Tablespace Oracle – group by TABLESPACE_NAME ) df, ( select TABLESPACE_NAME, sum(BYTES) BYTES from dba_free_space
DATAFILES group by TABLESPACE_NAME) fs
where df.TABLESPACE_NAME=fs.TABLESPACE_NAME
and df.TABLESPACE_NAME NOT IN ('SYSTEM','SYSAUX')
order by df.TABLESPACE_NAME asc >70 >90
select round(substr(to_char(sum(waits) / sum(gets)), 1, 10)*100,10) "Ratio Wait/Gets"
Contenção em Segmentos UNDO
From gv$rollstat >1.0 >2.0
select ((sum(A.Count) / (sum(B.Value) + sum(C.Value))) * 100) Pct
from gV$WaitStat A, gV$SysStat B, gV$SysStat C
where A.Class = 'free list'
and B.Statistic# = (select Statistic#
from gV$StatName b1
where Name = 'db block gets'
Free Lists and b1.INST_ID = b.INST_ID)
and C.Statistic# = (select Statistic#
from gV$StatName c1
where Name = 'consistent gets'
and c1.INST_ID = c.INST_ID)
and a.INST_ID = b.INST_ID
and b.INST_ID = c.INST_ID >1 >1.5
select count(object_name)
Objetos Inválidos
from dba_objects where status <> 'VALID' >1 >1.5
Objetos alterados nas ultimas 12 select count(object_name)
horas from dba_objects a where a.last_ddl_time > sysdate-1/2 >1 >1.5
SELECT count(1)
Monitorar sessões com longa
FROM gv$session_longops
duração
WHERE sofar/totalwork < 1 >100 >150
select round(max(elapsed_time)/1000000)
SQL com ELAPSED_TIME Alto (
from gv$sql
Maior que 15 minutos)
where parsing_schema_name not in ('SYS','SYSTEM','SYSMAN') >900 >1800
select round(max(cpu_time)/1000000)
SQL com CPU_TIME Alto ( Maior
from gv$sql
que 30 minutos)
where parsing_schema_name not in ('SYS','SYSTEM','SYSMAN') >1800 >3600
Verificar o Listener TCP Port 1521 Error
10.11.2016 67
SQL Server
SQL Server
O que ? Descrição Alarme Erro
Number of user connections. Because each user connection consumes some memory, configuring overly high
User Connections numbers of user connections could affect throughput. Set user connections to the maximum expected number of
concurrent users.
Logins Total number of logins started per second.
Logouts Total number of logout operations started per second.
Full Scans Number of unrestricted full scans per second. These can be either base-table or full-index scans.
Page Splits Number of page splits per second that occur as the result of overflowing index pages.
Table Lock Escalations Number of times locks on a table were escalated.
Percentage of pages found in the buffer cache without having to read from disk. The ratio is the total number of cache
hits divided by the total number of cache lookups since an instance of SQL Server was started. After a long period of
Buffer Cache Hit Ratio time, the ratio moves very little. Because reading from the cache is much less expensive than reading from disk, you
want this ratio to be high. Generally, you can increase the buffer cache hit ratio by increasing the amount of memory
available to SQL Server.
Database Pages Number of pages in the buffer pool with database content.
Stolen Pages Number of pages used for miscellaneous server purposes (including procedure cache).
Page Life Expectancy Number of seconds a page will stay in the buffer pool without references.
Connection Memory (KB) Total amount of dynamic memory the server is using for maintaining connections.
Optimizer Memory (KB) Total amount of dynamic memory the server is using for query optimization.
Total Server Memory (KB) Total amount of dynamic memory (in kilobytes) that the server is using currently.
Target Server Memory (KB) Total amount of dynamic memory the server can consume.
SQL Cache Memory (KB) Total amount of dynamic memory the server is using for the dynamic SQL cache.
Lock Requests Number of new locks and lock conversions per second requested from the lock manager.
Deadlocks Number of lock requests per second that resulted in a deadlock.
Average Wait Time Average amount of wait time (in milliseconds) for each lock request that resulted in a wait.
Number of Transact-SQL command batches received per second. This statistic is affected by all constraints (such as
Batch Requests
I/O, number of users, cache size, complexity of requests, and so on). High batch requests mean good throughput.
Number of SQL compilations per second. Indicates the number of times the compile code path is entered. Includes
SQL Compilations
compiles due to recompiles. After SQL Server user activity is stable, this value reaches a steady state.
Number of SQL recompiles per second. Counts the number of times recompiles are triggered. In general, you want
SQL Re-Compilations
the recompiles to be low.
10.11.2016 69
Monitorando Banco de Dados
10.11.2016 70
E-mail / Exchange
O que ?
– Disponibilidade
– Performance (tempo de entrega / recebimento de uma mensagem)
– Portas (SNMP, POP, IMAP, MAPI)
– Envio e Recebimento de e-mails (funcionamento do sistema)
– SPAM Black List
– Numero de Mensagens em uma caixa postal
– Tamanho da Fila
– Base de Dados / Backup
Como
– Ping / TCP Port
– Exchange Especificos (PowerShel instalado)
– Performance Counters do Windows / SQL Server
– IP on DNS Black List
– Round Trip (este sendo o mais importante)
10.11.2016 71
Como Saber se meu e-mail funciona ?
Além do Obvio :
– Verificar as Portas de Comunicação
– Verificar se os processos do serviço está ativo
O PRTG tem sensores específicos para Exchange
– Via WMI
• Maior parte das estatísticas necessárias
– Via PowerShell
• DAG Status
• Mail Queue
• MailBoxes
• Backup Status
• Public Folders
Mas também tem suporte para SMTP/POP3/IMAP4 Servers
– Incluindo poder ver se uma das mensagens da Cx Postal Monitorada tem uma
mensagem com texto específico (ex: Backup Error)
Como Saber se meu e-mail funciona ? Round Trip Sensor
O que ?
– Disponibilidade
– Performance (da Pagina)
– Usuários Conectados
– Conteúdo da Pagina
– Execução de uma Transação (varias paginas em sequencia)
– Acesso Externo (Performance, e Disponibilidade)
– Application Pools
– Validade e Segurança do Certificado
Como
– Ping / TCP Port
– SSL Security Check
– HTTP / HTTP Advaced
– Windows e IIS Performance Counters
– Cloud Ping, Cloud HTTP
– Desenvolvendo uma URL que Execute uma operação.
10.11.2016 75
Servidores WEB : Principais Sensores
HTTP Sensor Verifica se consegue carregar uma URL
Carrega a Pagina, verifica se teve Mudança, e se veio a Pagina Certa ou teve Erro. Suporta
HTTP Advanced Sensor
Autenticação de usuário
Permite verificar se uma sequencia de navegação, com até 10 URLs pode ser completada em
HTTP Transaction Sensor
um determinado tempo (ex: Login, compra 1, compra 2, checkout, paga, logout)
Cloud Ping Conecta a uma Porta TCP via um PROBE Remoto na Nuvem
Cloud HTTP Conecta usando HTTP a uma URL especifica, via uma PROBE Remota na Nuvem
SSL Certificate Verifica se o Certificado é valido e quantos dias tem para a sua expiração
SSL Security Check Valida se estão sendo utilizados os protocolos seguros (TLS) ou não (SSL 2.0, SSL 3.0)
10.11.2016 76
PRTG : Mais que um simples NPM
Monitorando uma Aplicação
O que ?
– Disponibilidade
– Performance (da Pagina e/ou Aplicação)
Como
– Ter uma URL para a Consulta, Inclusão, Exclusão
– Sensor Cloud HTTP / Cloud Ping verificando o Status Externo da sua Aplicação
– Sensor HTTP Advanced, para poder verificar o conteúdo retornado pela Aplicação
– Sensor HTTP Transaction, onde podemos simular uma navegação do usuário
– Usar o Business Process Sensor
10.11.2016 78
Monitorando Processos
Monitorando processos de TI & Negócio
– Segurança
• Backup (via e-mal ou plugin), Antivirus (verificando o processo ou pelo Windows Security
Center), Aplicações de Patchs (WSUS ou Windows Update), saúde de seu Firewall, logins
Invalidos nos ultimos 5 min, logs de arquivos, e-mails e traps de alerta
– Efetividade dos seus sistemas
• HTTP Transaction Monitor
– Monitora uma simulação de navegação em seus sistemas
• HTTP Advanced Sensor
– Criando uma URL Autenticada para consulta (inclusão, e exclusao de pedidos)
• Cloud HTTP & Ping
– Verifica a acessibilidade dos sistemas externamente
• Verificando Logs de Arquivos
– Efetividade do seu negócio
• Uma query no Banco de Dados retornando o numro de pedidos da ultima hora que gera um
grafico em um dashboard do PRTG
– Saude de um sistema olhando todos os seus componentes
• Business Process
10.11.2016 80
Business Process Sensor
Com este sensor, conseguimos agrupar diversos outros sensores que
monitoram diversos dispositivos, e apresentar um status único e geral de um
serviço que é suportado por estes dispositivos.
Um busines process (BP) pode ser utilizado dentro de outro business process,
de forma a irmos montando a representação dos serviços de TI utilizando itens
mais simples, sem a necessidade de nos repetirmos.
Um exemplo :
– Imagine que você tem um site de comercio eletrônico. Este site é suportado por um
cluster de Servidores WEB, Pelo Switch CORE, Pelo seu Acesso a Internet (que é
compartilhado por outros processos, e também é composto por 3 links e um cluster de
Firewalls), e pelo seu Cluster Oracle (que tambem é utilizado por outros processos e é
composto por 2 Servidores, o Switch de Interconnect, e pelo seu Storage). Como
representar isso ?
10.11.2016 81
Business Process e-Commerce
Criar um BP representando o Serviço Internet
– 3 Links
– 2 Firewalls
Criar um BP representando o Serviço Oracle (ou o nome que fizer mais
sentido)
– Disponibilidade e Acesso aos 2 Servidores Oracles (Porta TCP 1521)
– Saude do Storage (System Health) e algum outro contador como IOPS
– Saúde e Portas do Switch CORE e iSCSI (uptime e ping)
Criar um BP Representando o e-Commerce
– Serviço Internet
– Serviço Oracle
– 2 Servidores WEB e tempo de resposta
– Switch Servidores
– HTTP Transaction Sensor
– Cloud HTTP
E desta forma ir montando os demais processos de negócio da
empresa, usando peças já montadas anteriormente
– Desta forma, se o serviço Oracle ficar indisponivel, todos os Processos de
Negócio que Dependem dele, ficarão Indisponiveis 10.11.2016 82
Benefícios
Simplificação :
– Desta forma simplificamos o processo de representar os nossos processos de
negócio
• Mapeamos processos menores, e mais faceis de levantar
– Vamos montando os demais processos da empresa, usando peças já montadas
anteriormente
• Não temos o trabalho de de levantar itens já mapeados anteriormente
• Se o serviço Oracle ficar indisponivel, todos os Processos de Negócio que Dependem dele,
ficarão Indisponiveis tambem.
Termos o SLA dos Serviços, não de seus Componentes
– Não é por que um link caiu, ou um nó do cluster oracle ficou indisponivel, que os
serviços que são suportados por eles ficaram indisponiveis, eles ficaram em Alerta
(ou contingencia), mas ainda disponiveis.
Darmos uma visão geral dos serviços dara a Direção da Empresa, não da TI
– Um gestor não quer saber de SLA de Links ou Servidores, ele quer Saber do SLA do
e-Commerce
Mostrarmos a importancia de termos redundancias na TI
– Qdo um item redundante falhar, o BP vai avisar, mas mostrará tambem que ele
continua funcional, e sem o investimento em rdundancia, o processo de negócio teria
sido afetado
10.11.2016 83
Mapas e Dashboards
Dashboards
1. Visão geral
2. Infraestrutura (por site)
3. Banco de Dados
4. Segurança
5. Operação de TI
6. Facilities
7. Operação Monitoria
10.11.2016 86
Dashboards
10.11.2016 87
Dashboard de Negócio
Como vimos quando falamos de monitoria de Oracle, com o PRTG podemos fazer uma
série de queries nos bancos de dados, e mostrar o resultado como gráfico, relatórios de
SLA e alertas.
Usando o mesmo principio, podemos fazer criar sensores que monitoram o Desempenho
do Negócio da Empresa, para isso basta desenvolvermos uma query que traga do banco
de dados indicadores de performance do negócio, como :
– Pedidos/Dia
– Pedidos/Semana
– Faturamento/Mês
– Itens Entregues no Prazo/Mês
– Outros.....
10.11.2016 88
Instalação do PRTG
PRTGProbes
: MapasRemotos
e Dashboards
Criação de Mapas e Relatórios
Notiticações
10.11.2016 92
Instalação do PRTG
Ao iniciar a instalação, a seguinte janela irá se
abrir. Clique em Next.
Aceite os termos
Insira um e-mail para alertas
Insira as informações de licença
Escolha a pasta de instalação
Aguarde o final da instalação
Após a instalação, uma janela do browser abrirá.
O login e senha padrão é “prtgadmin”.
Instalação de probe remoto
Preparando a instalação
Acesse, na interface web, o caminho: Setup >
System Administration > Core & Probes.
Na opção “Probe Connection Ips”, deixe
marcada a opção “All IPs available on this
computer”
Copie a chave do campo Access Keys. Será
necessária para a conexão do probe com o core
server.
No campo “Allow Ips”, insira o IP do probe, ou
“any” para aceitar conexão de qualquer IP
Para obter o arquivo de instalação, acesse o
caminho: Setup > Download / AddOns > Remote
Probe Installer
Instalando o probe
Execute o arquivo e na primeira tela clique em
Next.
Aceite os termos.
Aceite os termos.
Após os arquivos serem copiados, uma janela do
PRTG Administration Tool. Insira o IP ou nome
DNS do core server
Insira também a Access Key, copiada
previamente.
Após finalizar as configurações, confirme a
inicialização do serviço de Probe e clique em
Finish.
Liberando acesso
Após a conexão bem sucedida, aparecerá na
interface web uma janela para aprovação do
novo probe remoto. Clique em “Approve New
Probe”
Migração de dispositivos entre
probes
Para migrar dispositivos entre probes, temos 2
possibilidades.
1 – Clique com o botão direito no dispositivo,
acesse a opção Move > To Other Group.
2 – Acesse a aba “Management”. Arraste e solte
os devices no probe desejado.
Criação de mapas.
Para criar um novo mapa, acesse o menu
Maps > Add Maps.
Na primeira tela, defina o nome do mapa e seu
tamanho (em pixels).
Selecione um dispositivo no menu à esquerda,
depois selecione um ícone à esquerda e o
arraste para a tela central.
Pode-se montar uma visão gráfica da
infraestrutura de rede, interligando os
dispositivos.
Para linkar um mapa ao outro, selecione o
dispositivo, e na aba Properties, no campo
External Link, cole o endereço do mapa o qual
deseja linkar.
Geração de Relatórios
Existem 3 formas de gerar relatórios:
1. Clicando dentro do Grupo/Subgrupo e utilizando o ícone “Add Device” 2. Clicando com o botão direito do mouse Grupo/Subgrupo onde o dispositivo será adicionado
1. Após adicionar um dispositivo clique 2. Clique com o botão direito no dispositivo criado e selecione em “Add Sensor”
no ícone “Add Sensor” para adicionar de maneira manual
ou “Run Auto-Discovery” para seleção automática
3. Caso a forma de adição manual tenha sido selecionada uma janela irá abrir com todos os sensores
disponíveis e as opções de busca por nome e filtros por tipo de sensor, bastando apenas clicar no sensor.
4. Após selecionado, uma janela com a
confirmação das configurações irá aparecer, para
confirmar a configuração clique em “Continue”
5. Após a adição o sensor será processado (unknown ?) e após ser processado irá
mostrar o resultado da consulta como
OK (Verde), Warning (Amarelo) Error (Vermelho).
6. Caso o método de adição de sensores tenha sido o “Auto-Discovery” como explicado anteriormente
os sensores serão adicionados automaticamente, restando ao operador apenas selecionar o método de “Auto-Discovery “e se
um “Auto-Discovery” será agendado periodicamente para busca de sensores ou não (a opção padrão é Once)
Para transformar toda a MIB é necessário clicar em “File/Save Complete OIDLIB AS” e nomear 6. Após importar o arquivo, adicione um sensor “SNMP Library” no dispositivo que os
o arquivo que será exportado. sensores serão importados, selecione na lista a seguir o arquivo importado na pasta e
selecione o sensores desejados, após clica em “continue” a seleção o sensores serão
Para transformar apenas as entradas selecionadas utilize a interface “Save As” na sessão inseridos no dispositivo automaticamente
“Selection For Partial OIDLIB” no canto interior do programa e nomear o arquivo a que será
exportado.
Abertura de tickets de suporte e Knowledge base
1. Há 2 maneira de se abrir um ticket de suporte, pelo próprio PRTG ou pelo site da Paessler. 2. Knowledge base:
No canto inferior direito há uma aba “Contact Paessler Support” clique nesta aba KB: http://kb.paessler.com/en/
e preencha as informações para abertura do chamado, após o envio um email de confirmação FAQS: https://www.br.paessler.com/support/faqs
da paessler será enviado ao e-mail inserido no chamado Manuais: https://www.br.paessler.com/support/manuals
Videos e Webinars : https://www.br.paessler.com/support/videos
OK
Sua melhor opção
Obrigado!!