Você está na página 1de 4

Identificação de outliers

em conjuntos de dados
Prof. Rafael H. P. Lima
Blog Aprendendo Gestão
www.aprendendogestao.com.br
Introdução
O que são outliers? Observação Valor
Outliers são pontos que se distinguem dos 1 501
demais; 2 504
Devemos procurar explicações para os outliers 3 493
4 499
Em estimativas estatísticas, costuma-se eliminar 5 497
os outliers para evitar o viés sobre as
estimativas 6 503
7 525
Exemplo: estimativa de peso dos produtos em 8 495
uma fábrica de alimentos
9 506
10 502
Vamos analisar esses valores individuais com relação à média da amostra

Observação Valor 530

1 501
520
2 504
3 493 510
4 499

Peso
500
5 497
6 503 490
7 525
480
8 495
9 506 470
10 502 1 2 3 4 5 6 7 8 9 10
Observações
Média 502,5
Identificação de Outliers
Método para Identificação de Outliers
Vamos utilizar o método baseado na amplitude interquartil (IQR)

𝐼𝑄𝑅 = 𝑄3 − 𝑄1
Podemos usar essa estimativa de variabilidade para calcular os limites inferior e
superior para identificação de outliers

𝐿𝑆𝑢𝑝 = 𝑥ҧ + 1,5 × 𝐼𝑄𝑅


𝐿𝐼𝑛𝑓 = 𝑥ҧ − 1,5 × 𝐼𝑄𝑅

Você também pode gostar