Escolar Documentos
Profissional Documentos
Cultura Documentos
Probabilidade I
Parte 3
Medidas de Dispersão
Exemplo: Salários de professores de música
Lembram do exemplo dos salários de professores de música na Dinamarca e
EUA?
‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
n ‾
1
2
s = (xi − x̄)
n − 1 ∑
i=1
⎷
3/32
Dispersão dos Dados
Considere dois conjuntos de dados:
⎯⎯
⎯
A = {1, 2, 3} ⟹ x A = 2, sA = 1
⎯⎯
⎯
B = {101, 102, 103} ⟹ x B = 102, sB = 1
Veja que:
4/32
Exemplo: Notas
Considere as notas de 2 provas:
Desvio padrão: s1 = 1
Prova 2: Notas 0 a 10
Desvio padrão: s2 = 1
Neste caso, como as escalas são diferentes, não podemos tirar conclusões
usando apenas o desvio padrão.
5/32
Coeficiente de Variação
Coeficiente de variação (CV): razão do desvio padrão s pela média x̄, isto é
s
CV = .
x̄
Exemplo:
⎯⎯
⎯
A = {1, 2, 3} ⟹ x A = 2, sA = 1
⎯⎯
⎯
B = {101, 102, 103} ⟹ x B = 102, sB = 1
Nesse caso,
sA sB
C VA = ⎯⎯
⎯
= 0.5 e C VB = ⎯⎯
⎯
= 0.0098.
xA xB
6/32
Coeficiente de Variação
Exemplos das notas de duas provas:
Prova 1: x̄1 = 70 e s1 = 1
Prova 2: x̄2 = 7 e s2 = 1
Coeficiente de Variação: é o
desvio padrão escalonado pela
média dos dados.
7/32
Medidas de posição para descrever dispersão
Média e mediana: medidas de posição central.
8/32
Quartis
Para obter os quartis:
2. Encontre a mediana Q2 .
9/32
Exemplo: Sódio em cereais matinais
Considere as quantidades de sódio (mg) em 20 cereais
matinais:
200, 210, 210, 220, 220, 230, 250, 260, 290, 290
Q1 =145
Q3 =225
10/32
Simetria e Assimetria da Distribuição
Vimos na aula passada que as posições da média e mediana fornecem
informação sobre o formato da distribuição.
Em geral, se a distribuição é:
11/32
Quartis e Assimetria
Os quartis também fornecem informação sobre o formato da distribuição.
A mediana Q2 é 14.
12/32
Quartis e simetria da distribuição
Para uma distribuição simétrica ou
aproximadamente simétrica:
· Q2 − x(1) ≈ x(n) − Q2
· Q2 − Q1 ≈ Q3 − Q2
· Q1 − x(1) ≈ x(n) − Q3
13/32
Exemplo: Pesos de alunas de Educação Física
Veja as medidas resumo dos pesos (em libras) de 64 alunas de Educação Física:
, ,
x̄ = 133 Q1 = 119 Q2 = 131.5 , e Q3 .
= 144
Q2 − Q1 ≈ Q3 − Q2 (?)
Q2 − Q1 = Q3 − Q2
131.5−119=12.5 144−131.5=12.5
14/32
Intervalo Interquartílico
A vantagem do uso de quartis sobre o desvio padrão ou a amplitude, é que os
quartis são mais resistentes a dados extremos, ou seja, são mais robustos.
15/32
Esquema dos 5 números e Boxplot
Esquema dos 5 números
Notação:
x(1) : mínimo
x(n) : máximo
⎩ , se n é par
2
17/32
Dados discrepantes (Outliers)
Importante: examinar os dados para verificar se há observações discrepantes.
18/32
Dados discrepantes (Outliers)
Como regra geral, dizemos que uma observação é um potencial outlier se está:
· abaixo de Q1 − 1.5 × I Q ou
· acima de Q3 .
+ 1.5 × I Q
19/32
Boxplot
Boxplot: representação gráfica do esquema dos 5 números.
20/32
Boxplot
Voltando no exemplo das quantidades de sódio (mg) em 20
cereais matinais:
200, 210, 210, 220, 220, 230, 250, 260, 290, 290
21/32
Exemplo: Sódio em cereais matinais
Regra para detectar outliers:
I Q = Q3 − Q1 = 225 − 145 = 80
22/32
Construção de um Boxplot
Assista ao vídeo da Khan Academy sobre
como criar um boxplot:
https://youtu.be/OanEVzmBD8Y
https://pt.khanacademy.org/math/ap-statistics/summarizing-quantitative-data-
ap/stats-box-whisker-plots
23/32
Exemplo: Taxa de desemprego na UE em 2003
País Taxa País Taxa Responda:
Bélgica 8.3 Luxemburgo 3.9
1. Qual a amplitude dos dados?
Dinamarca 6.0 Irlanda 4.6
2. Encontre os valores da mediana e de
Alemanha 9.2 Itália 8.5
Q1 e Q3 ?
Grécia 9.3 Finlândia 8.9
Espanha 11.2 Áustria 4.5 3. Desenhe um boxplot.
França 9.5 Suécia 6
Portugal 6.7 Reino Unido 4.8
Holanda 4.4
24/32
Exemplo: Taxa de desemprego na UE em 2003
Ordenando os dados:
3.9, 4.4, 4.5, 4.6, 4.8, 6.0, 6.0, 6.7, 8.3, 8.5, 8.9, 9.2, 9.3, 9.5, 11.2
Mediana = 6.7
Q1 = 4.6 e Q3 = 9.2
I Q = Q3 − Q1 =4.6
Q1 − 1.5 × I Q = -2.3
Q3 + 1.5 × I Q =16.1
25/32
Exemplo: População dos estados brasileiros
A tabela abaixo apresenta a população (em 1000 habitantes) dos 26 estados
brasileiros e o Distrito Federal.
Portanto, a mediana é
x n+1 = x 27+1 = x(14) = 3098 (ES).
( 2 ) ( 2 )
26/32
Exemplo: População dos estados brasileiros
População (em 1000 habitantes):
Q1 − 1.5 × I Q = −6748.5
Q3 + 1.5 × I Q = 16720
Temos outliers?
27/32
Exemplo: Sódio em cereais matinais
28/32
Boxplot x Histograma
Boxplot não substitui o histograma e vice-versa.
29/32
Exemplo: QI
Para os dados dos QI’s das 32 crianças, vamos calcular as medidas resumo, fazer
o boxplot e histograma.
30/32
Exemplo: SleepStudy
Vamos obter as medidas resumo e fazer o boxplot da variável AverageSleep do
SleepStudy.
31/32
Agradecimentos
Slides produzidos pelos professores:
· Benilton Carvalho
· Larissa Matos
· Samara Kiihl
· Tatiana Benaglia
https://xkcd.com/539/
32/32