Você está na página 1de 34

Uma maneira simples,

rápida e poderosa de
representar seus dados

BOX PLOT
Box Plot

Sumário

»» Como representar esses dados?  . . . . . . . . . . . .  3 »» Resumindo  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  17


»» O que é  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  4 »» Exercitando  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  18
»» Box plot  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  5 »» Resolução:  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  19
»» Representação  . . . . . . . . . . . . . . . . . . . . . . . . . . .  6 »» Representando os 4 conjuntos:  . . . . . . . . . . . .  23
»» Métrica fundamental: Quartis  . . . . . . . . . . . . . .  7 »» Box Plot no Excel  . . . . . . . . . . . . . . . . . . . . . . . .  24
»» Calculando os quartis…  . . . . . . . . . . . . . . . . . . .  8 »» Correlação utilizando box plot  . . . . . . . . . . . . .  27
»» Montando o Box Plot  . . . . . . . . . . . . . . . . . . . . .  11 »» ANOVA auxiliado pelo Box-Plot  . . . . . . . . . . . .  29
»» Qual a vantagem?  . . . . . . . . . . . . . . . . . . . . . . . .  12 »» Exemplo prático 1:  . . . . . . . . . . . . . . . . . . . . . . .  31
»» O que o Box-plot não mostra?  . . . . . . . . . . . . .  13 »» Exemplo prático 2:  . . . . . . . . . . . . . . . . . . . . . . .  32
»» Outliers  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  14 »» Exercitando  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  33
»» Como decidir quando um dado
será um outlier?  . . . . . . . . . . . . . . . . . . . . . . . . .  16

2
Box Plot

Como representar
esses dados?
17 31 12 5 17 22 29 6 31 31 17 33
5 25 20 33 13 13 18 26 29 12 34 22
32 8 27 28 29 6 35 7 32 6 19 15
24 16 21 14 19 19 30 11 5 10 31 23

DotPlot: HistoGrama: BOX PLOT

3
Box Plot

O que é

»» Representação gráfica de uma variável


numérica, utilizando quartis.

»» Recurso muito útil para realizar comparações


de dados, principalmente a variação destes;

»» Útil para evidenciar correlação entre variáveis;

»» Permite representar dados sem que


estes obedeçam a determinada
distribuição específica;

»» Também conhecido como diagrama de


caixa, diagrama de extremos e quartis

4
Box Plot

Box plot

5
Box Plot

Representação

Limite
Superior
Whisker;
“Fio de
bigode”

3º quartil

“CAIXA” Mediana

1º quartil

Whisker;
“Fio de
bigode”
Limite
Inferior

6
Box Plot

Métrica
fundamental: Quartis
» Os quartis (Q1; Q2; Q3) Andar nº funcionários
dividem uma distribuição de 1º 42
dados em 4 partes iguais .
2º 19

EXemPlo: 3º 44
4º 53
» Observe a distribuição 5º 28
abaixo que representa o
6º 19
número de funcionários
alocados em cada andar 7º 22
de um prédio comercial . 8º 23
9º 39
10º 35
11º 39

7
Box Plot

Calculando
os quartis…
1º Passo: Ordenar os dados.

19 19 22 23 28 35 39 39 42 44 53

2º Passo: LoCaliZar a mediana.

19 19 22 23 28 35 39 39 42 44 53

MEDIANA

50% 50%

8
Box Plot

Calculando
os quartis…
3º Passo: CalCUlar o Primeiro e terCeiro QUartis.

19 19 22 23 28 35 39 39 42 44 53

1º quartil MEDIANA 3º quartil


2º quartil

19 19 22 23 28 35 39 39 42 44 53

1/4 1/4 1/4 1/4


25% 25% 25% 25%

9
Box Plot

Calculando
os quartis…
19 19 22 23 28 35 39 39 42 44 53

1
/4= 25% Q1 3
/4= 75%

19 19 22 23 28 35 39 39 42 44 53

2
/4= 50% Q2 ou mediana 2
/4= 50%

19 19 22 23 28 35 39 39 42 44 53

/4= 75%
3
Q3 1
/4= 25%

10
Box Plot

Montando
o Box Plot
19 19 22 23 28 35 39 39 42 44 53

» 1º quartil 22

» 2º quartil 35

» 3º quartil 42

» mínimo 19

» máximo 53

11
Box Plot

Qual a
vantagem?

Fácil compreensão

Simples

Entendimento da dispersão

12
Box Plot

O que o Box-plot
não mostra?
» É possível saber qual a média
de altura do time A? NÃO

» É possível saber qual a média


de altura do time B? NÃO

» É possível saber quantos


jogadores tem o time A? NÃO

» É possível saber quantos


jogadores tem o time B? NÃO

BoX-Plot não mostra

» Média dos dados;

» Quantidade de dados;

13
Box Plot

Outliers

»» Um empresa de logística
monitora o tempo que os Outlier
entregadores levam para Valor atípico“ponto
fora da curva”
realizar uma rota entre
duas cidades próximas.

»» Os dados coletados durante


um mês estão representados
pelo box plot ao lado

14
Box Plot

Outliers

Observemos os dados:
Outlier!
Semana
1ª 2ª 3ª 4ª
45 57 48 51
55 52 50 55
49 39 55 42
42 42 55 111
44 44

Obs.: tempo em segundos.

15
Box Plot

Como decidir quando um


dado será um outlier?
Calculemos: Q3 + 1,5 (Q3 – Q1) Calculemos: Q1 - 1,5 (Q3 – Q1)

39 42 42 42 44 44 45 48 49 50 51 52 55 55 55 55 57 111

Q1 = 43,50
Q3 – Q1 =
Q2 ou mediana = 49,50
(55,00 – 43,50) = 11,50
Q3 = 55,00

Q3 + 1,5 (Q3 – Q1) Q1 - 1,5 (Q3 – Q1)


55,00 + 1,5 (11,50) 43,50 - 1,5 (11,50)
= 72,25 = 26,25

Portanto

Outliers são todos os valores abaixo de 26,25 e acima de 72,25

16
Box Plot

Resumindo

Limite Superior = mín { max


(dados); Q3 + 1,5 (Q3 – Q1) }

3º quartil

Mediana

1º quartil

Limite Inferior = máx { min


(dados); Q1 – 1,5 (Q3 – Q1)

17
Box Plot

Exercitando

A B C D
» Considere os quatro
1 3 1 1
conjuntos de dados 1 4 4 2
mostrados ao lado . 1 5 6 3
2 5 10 4
» Represente esses conjuntos 4 6 12 5
5 7 14 6
utilizando-se box plots .
6 8 14 7
7 10 14 8
10 12 15 9
11 12 16 10
13 15 16 11
14 21 12
14 22 13
15 27 13
16 30 13
17 30 30
18 30
20
25

18
Box Plot

Resolução:

A
Há Presença de OUtliers? VERIFICAR!
1
1
1 Q3 + 1,5 (Q3 – Q1)
2 16 + 1,5 (16 - 4) = 34
4 Outiliers são
5 dados que
6 estão fora desse
» Q1 = 4 Q1 - 1,5 (Q3 – Q1)
7
intervalo
10 4 - 1,5 (16 - 4) = - 14
11 » Q2 = 11
13
14 » Q3 = 16 POrtaNtO NãO HÁ Outliers
14
15
16
QUal o » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }
17 tamanHo dos • Limite Superior = min { 25 ; 34 } = 25
18 WHisKers?
20 » Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
25 • Limite Inferior = máx { 1 ; -14 } = 1

19
Box Plot

Resolução:

B
Há Presença de OUtliers? VERIFICAR!
3
4
5 Q3 + 1,5 (Q3 – Q1)
5 » Q1 = 5
12 + 1,5 (12 - 5) = 22,5
6 Outiliers são
7 » Q2 = 7 dados que
8 estão fora desse
» Q3 = 12 Q1 - 1,5 (Q3 – Q1)
10
intervalo
12 5 - 1,5 (12 - 5) = - 5,5
12
15
POrtaNtO NãO HÁ Outliers

QUal o » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }


tamanHo dos • Limite Superior = min { 15 ; 22,5 } = 15
WHisKers?
» Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
• Limite Inferior = máx { 3 ; - 5,5} = 3

20
Box Plot

Resolução:

C
Há Presença de OUtliers? VERIFICAR!
1
4
6 Q3 + 1,5 (Q3 – Q1)
10 24,5 + 1,5 (24,5 - 11) = 44,75
12 Outiliers são
14 dados que
14 » Q1 = 11 Q1 - 1,5 (Q3 – Q1) estão fora desse
14
intervalo
15 » Q2 = 15 11 - 1,5 (24,5 - 11) = -9,25
16
16 » Q3 = 24,5
21 POrtaNtO NãO HÁ Outliers
22
27
30
QUal o » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }
30 tamanHo dos • Limite Superior = min { 30 ; 44,75 } = 30
30 WHisKers?
» Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
• Limite Inferior = máx { 1 ; - 9,25} = 1

21
Box Plot

Resolução:

D
Há Presença de OUtliers? VERIFICAR!
1
2
3 Q3 + 1,5 (Q3 – Q1)
4 12,75 + 1,5 (12,75 – 4,25) = 25,5
5 Outiliers são
6
» Q1 = 4,25 dados que
7 estão fora desse
Q1 - 1,5 (Q3 – Q1)
8
» Q2 = 8,50 intervalo
9 4,25 - 1,5 (12,75 – 4,25) = - 8,5
10
» Q3 = 12,75
11
12 POrtaNtO Há Outliers
13
13
13
QUal o » Limite Superior = mín { max (dados); Q3 + 1,5 (Q3 – Q1) }
30 tamanHo dos • Limite Superior = min { 13 ; 25,5 } = 13
WHisKers?
» Limite Inferior = máx { min (dados); Q1 – 1,5 (Q3 – Q1)
• Limite Inferior = máx { 1 ; - 8,5 } = 1

22
Box Plot

Representando
os 4 conjuntos:

23
Box Plot

Box Plot
no Excel
» O Microsoft Excel traz em seu pacote de recursos a opção para construir um gráfico box plot .

» No caso, ele é denominado “Caixa Estreita”

24
Box Plot

Box Plot
no Excel
RealiZando o eXemPlo dos QUatro ConJUntos no EXCel:

1) Selecione o conjunto de dados; 2) Inserir → Gráficos → Caixa Estreia

25
Box Plot

Box Plot
no Excel
» É possível alterar o que é mostrado no box plot . Clique sobre
alguma caixa e as opções serão mostradas ao lado .

» Por exemplo: por padrão, o Excel mostra (através


de um símbolo “x”) a média dos dados .

26
Box Plot

Correlação
utilizando box plot
»» Correlação é a “interdependência 1º turno 2º turno 3º turno
entre duas variáveis” 20 24 29
19 23 24
»» Exemplo: Uma empresa que produz canecas 21 28 26
plásticas estava enfrentando problemas 21 22 28
com tempos excessivos de setup. Como a 22 24 27
18 24 27
variedade de modelos era elevada, o setup
20 23 25
é considerado crítico para a produção. Os
20 21 29
responsáveis por um projeto de melhoria 19 25 25
estavam desconfiados que havia diferentes 19 23 26
nos tempos de setup entre os três turnos. 23 26 28
Buscando verificar se havia correlação entre o 21 27 26
tempo de setup e o turno de trabalho, foram 19 22 28
20 22 27
coletados dados conformes mostrado ao lado:
22 25 25
18 26 30

27
Box Plot

Correlação
utilizando box plot
Como tradUZir esses dados de maneira a
evidenCiar se eXiste Correlação? BOX-PLOT!!

28
Box Plot

ANOVA auxiliado
pelo Box-Plot
ANOVA = Análise de Variação Remédio A Remédio B Remédio C

»» Análise para comparar as médias de 80 56 97


mais de duas populações 73 72 90

»» Exemplo: Um médico deseja comparar os efeitos de 79 61 75


três diferentes remédios na recuperação de pacientes 88 64 87
idosos, que sofreram derrame devido a um ataque 68 80 88
do coração de média intensidade. Um total de 18
75 74 83
pacientes foi selecionado procurando manter constantes
parâmetros como idade, condição física, motivação,
etc... Esses pacientes foram divididos aleatoriamente
em três grupos e, após um período de seis meses, eles
foram avaliados por um especialista que não tinha
conhecimento a que grupo pertencia cada paciente.

29
Box Plot

ANOVA auxiliado
pelo Box-Plot
» Com o auxílio de um software estatístico, sua análise fica fácil e rápida, e
o Box-plot é utilizado para auxiliar a análise conforme vemos

Análise de variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P
C6 2 1064,1 532,06 8,78 0,003
Erro 15 909,0 60,60
Total 17 1973,1

30
Box Plot

Exemplo
prático 1:
» Um pesquisador realizou um experimento para comparar três tipos de fertilizantes . O intuito
era descobrir qual deles contribuia mais para o crescimento de mudas de cana de açúcar .
Cada fertilizante foi aplicado em dez mudas . Após duas semanas, anotou-se o comprimento
de cada muda . As condições ambientais (temperatura, luminosidade, umidade, etc) foram
mantidas idênticas . O resultado do experimento é mostrado no box-plot abaixo:

Observando-se o gráfico é possível ver de maneira


clara a comparação entre os três fertilizantes .

Claramente o fertilizante 3 foi aquele que


provocou os maiores resultados de crescimento .
Podemos notar um outlier para esse fertilizante .
No caso, uma das mudas apresentou um
comportamento anormal . Este ponto deve
ser investigado o que de fato aconteceu .
Provavelmente essa medida será excluída .

31
Box Plot

Exemplo
prático 2:
» Uma grande rede de shoppings, com cinco unidades localizadas em regiões distintas da
cidade de São Paulo, monitora a quantidade diária de pessoas que frequentam o shopping .
Os dados comparativos das cinco unidades são mostrados abaixo para o mês de agosto .

32
Box Plot

Exercitando

» Os números abaixo representam a idade dos funcionários de determinada


empresa . Qual o Box-plot que representa corretamente esses valores?

21 23 23 26 28 29 30 30 31 33 36 38 39 40 45

a)

b)

c)

33
Box Plot

Exercitando

» Considerando os dados mostrados abaixo, qual o Box-plot que representa corretamente esses valores?

0 5 6 7 8 10 12 12 15 16 22 43 43

a)

b)

c)

34

Você também pode gostar