Você está na página 1de 19

Universidade Federal de Minas Gerais

Instituto de Ciências Exatas


Departamento de Estatística

Introdução à Bioestatística

Módulo 1: Conceitos Básicos e Análise Descritiva

Aula 9: Outros Gráficos – Boxplot e Ogiva

Narração: Profa. Edna Afonso Reis


Outros Gráficos para Visualizar a Distribuição de Frequências de uma
Variável Quantitativa Unimodal

Boxplot: - Usa a mediana e os quartis


- Prático para comparação de vários grupos
- Aponta valores discrepantes

Ogiva: - Usa as frequências acumuladas


- Útil para identificar os percentis
- Prático para comparação de vários grupos

2
Boxplot
Valores discrepantes
Usa a Mediana e os
Quartis . escala de valores da variável Limite da linha superior:
Q3+CM
LS = menor ( max; Q3+CM )

Comprimento máximo da linha: CM


= 1.5(DQ)

distância
Interquartílica :
altura da caixa
DQ = Q3 – Q1
Representa os 50%
dos valores centrais.

Limite da linha inferior:


LI = maior ( min; Q1-CM )

Q1-CM 3
Exemplo: % de Gordura Inicial (n=90, dados brutos ordenados)

Q1 = 23.6
Mediana = 25.5
Q3 = 27.4

DQ = Q3 – Q1 = 27.4 – 23.6 = 3.8 Altura da caixa

CM = 1.5(DQ) = 1.5(3.8) = 5.7 Máximo de comprimento que as linhas superior e


inferior vão ter

LI = maior[ Min ; Q1–CM ] = maior[ 17.8 ; 23.6–5.7 ]


= maior[ 17.8 ; 17.9 ] = 17.9 (vai ter um *) ponto que
ultrapassou a linha.
LS = menor[ Max ; Q3+CM ] = menor[ 32.5 ; 27.4+5.7 ]
= menor[ 32.5 ; 33.1 ] = 32.5 (não vai ter *)
Número de Erros de Tradução em um Texto por Alunos de Três Turmas:

Q1 = 2 ( 8º valor)
Mediana = 3 (15º valor)
Q3 = 6 (22º valor)
1.5(DQ) = 1.5(4) = 6
LI = maior( 0;2 -6= -4) = 0
LS = menor(14;6+6=12) = 12*

Q1 = 5 ( 8º valor)
Mediana = 7 (15º valor)
Q3 = 9 (22º valor)
1.5(DQ) = 1.5(4) = 6
LI = maior( 1;5-6=-1) = 1
LS = menor(13;9+6=15) = 13

Q1 = 9 ( 8º valor)
Mediana = 11 (15º valor)
Q3 = 13 (22º valor)
1.5(DQ) = 1.5(4) = 6
LI = maior( 4;9-6=3) = 4
LS = menor(14;13+6=19) = 14
O boxplot e a forma da distribuição de frequências
Assimétrica Assimétrica
concentração à Simétrica concentração à
esquerda direita

Boxplot simétrico
Distância entre Q1 e Med Distância entre Q1 e Med Distância entre Q1 e Med
menor que entre Med e Q3. igual à entre Med e Q3. maior que entre Med e Q3.
Linha inferior mais curta; Linhas inferior e superior Linha inferior mais longa;
Linha superior mais longa; de igual comprimento; Linha superior mais curta;
Valores discrepantes altos. Valores discrepantes Valores discrepantes baixos.
em ambos lados.
Série de boxplots: comparando vários grupos no mesmo gráfico.
(A) (B) (C)

A) Simetria com baixa variabilidade dentro dos grupos: G1 = G2 << G3 < G4.

B) Assimetria com alta variabilidade dentro dos grupos: G1 < G2 <(?) G3 <(?) G4.

C) Simetria com muito alta variabilidade dentro dos grupos: G1 = G2 = G3 = G4.


Quando o “tamanho da caixa” (DQ=Q3-Q1) é muito grande em relação ao comprimento
das linhas, pode ser sinal de que a distribuição não é unimodal.
Significa que a mediana não é uma boa medida de tendência central 7
Boxplot: não é adequado para distribuições com mais de uma moda.

Exemplo: pesquisa de opinião com 26 pessoas de baixa renda:


“Incluindo crianças e adultos, que tamanho de família você acha ideal?”

10
M

A largura da caixa ( DI) é muito grande em relação


ao comprimento das linhas .

8
Boxplot: não é adequado para distribuições amodais.

Exemplo: pesquisa de opinião com 26 pessoas de baixa renda:


“Incluindo crianças e adultos, que tamanho de família você acha ideal?”

9
Alternativas ao Boxplot

A caixa não permite Os pontos espalhados na “Mistura” dos dois gráficos


visualizar variáveis amodais horizontal permitem anteriores:
ou identificar mais de uma ou largura proporcional à
multimodais. nenhuma moda, densidade de pontos.
mas o gráfico fica confuso se
há muitos valores.

No R: pacote ggplot2, funções geom_boxplot, geom_dotplot e geom_violin.


Ilustração adaptada de:
10
Polígono de Frequências Acumuladas (Ogiva)

Gráfico da distribuição de frequências acumuladas da variável.

Distribuição de frequências da concentração de ureia em 70 amostras

soma a classe e
todas as anteriores

Frequência acumulada
até o final da classe
A frequência relativa será utilizada 11
para desenhar o grafico OGIVA
FrequÊncia relativa
acumulada

Ogiva (%) da concen. de ureia em 70 amostras

100
98.6

85.7

Grafico sempre
crescente .
57.2

27.2

8.6

12
A Ogiva pode ser usada para aproximar os Percentis

P90

P15

22.5 36.5

13
Gráfico de Frequências Acumuladas com Variável Discreta

No. de erros
de tradução

14
Número de Erros de Tradução em um Texto por Alunos de Três Turmas:

15
16
Ogiva e Forma da Distribuição de Frequências
Assimétrica Assimétrica
concentração à Simétrica concentração à
esquerda direita

Cresce rapidamente Velocidade do Cresce lentamente


no ínicio da escala crescimento igual nas no ínicio da escala
da variável “pontas” da variável
17
Mas quando a distribuição não é unimodal ...

Dois “S”

18
E quando a distribuição é amodal ...

19

Você também pode gostar