Escolar Documentos
Profissional Documentos
Cultura Documentos
MEDIDAS DESCRITIVAS
1. Introdução
Vimos que para descrever um conjunto de dados pode-se utilizar tabelas, gráficos e medidas numéricas.
As medidas numéricas são utilizadas para reduzir o conjunto de dados utilizando um único número. As
medidas numéricas podem ser parâmetros ou estatísticas.
Os parâmetros são medidas numéricas calculadas a partir dos dados populacionais. O dados
populacionais obtêm-se através de censos.
As estatísticas são medidas numéricas calculadas a partir dos dados amostrais. Os dados amostrais
obtêm-se através de amostragens.
As estatísticas são utilizadas para estimar os valores dos respectivos parâmetros da população que, em
geral, são desconhecidos.
Para um conjunto de dados pode-se calcular medidas de tendência central, medidas de posição,
medidas de dispersão e medidas de forma da distribuição.
2.1. A média
A média é a medida de tendência central mais utilizada. A média é um valor que indica o ponto central
da distribuição de dados em torno do qual se distribuem os dados da população ou de amostra. Pode-se
calcular média aritmética e média ponderada.
A média aritmética de um conjunto de dados numéricos é igual a soma de todos os valores divididos
pelo número total dos elementos.
x 1 + x 2 +. ..+x N ∑ xi N
i=1 1
μ= = = ∑ xi
N N N i=1
x 1 + x 2 +. . .+ xn ∑ xi n
1
X̄ = = i=1 = ∑ x i
n n n i=1
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
2
Por simplificação, vamos dar exemplos de médias calculadas a partir de dados de amostras.
Exemplo 1:
Calcule a média aritmética de uma aluno que as notas seguintes nos três testes de Matemática: 10; 8;
12:
n=3
x 1=10
x 2=8
x 3=12
x1 + x2 +. x 3 10+ 8+12 30
X̄ = = = =10
3 3 3
Exemplo 2:
A média ponderada é usada quando se atribuem pesos diferentes aos dados. É muito usada no cálculo
das médias finais das avaliações escolares, concursos etc.
Suponhamos que se pretende a média dos valores x 1 ;x 2 ;...; x n com pesos w 1 ;w2 ;...;w n
respectivamente. A média calcula-se pela seguinte fórmula:
n
∑ w i xi
w x +w x +.. .+w n x n i=1
X̄ = 1 1 2 2 = n
w 1 +w 2 +. ..+ wn
∑ wi
i=1
Exemplo 3:
x 1=10 ; w1 =1
x 2=8; w2 =1
x 3=12 w3 =2
x w + x w +. x 3 w3 10×1+8×1+ 12×2 10+8+24 42
X̄ = 1 1 2 2 = = = =10 , 5
w1 + w2 +. w3 1+1+2 4 4
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
3
Exemplo 4:
x 1=10 ; w1 =1
x 2=8; w2 =1
x 3=12 w3 =2
x w + x w +. x 3 w3 10×1+8×1+ 12×2 10+8+24 42
X̄ = 1 1 2 2 = = = =10 , 5
w1 + w2 +. w3 1+1+2 4 4
Exemplo 5:
x 1 f 1 + x 2 f 2 +.. .+ x n f n ∑ xi f i ∑ xi f i
X̄ = = i=1n = i=1
f 1 +f 2 +. ..+ f n n
∑ fi
i=1
Exemplo:
i xi fi
1
0 2
2 1 5
3 2 2
4 3 3
5 4 3
6 5 3
7 6 2
∑ 20
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
4
Solução:
x 1 f 1 + x 2 f 2 + x3 f 3 + x 4 f 4 + x 5 f 5 + x 6 f 6 + x 7 f 7
X̄ =
f 1 +f 2 + f 3 + f 4 +f 5 + f 6 + f 7
i xi fi xi f i
1 0 2 0
2 1 5 5
3 2 2 4
4 3 3 9
5 4 3 12
6 5 3 15
7 6 2 12
∑ 20 57
57
X̄ = =2,85≈3
20
No caso dos dados sobre o tempo (minutos) que cada aluno da turma da 9ª classe leva de casa para a
escola temos:
i classes x^ i fi
1 [5-12[ 8,5
6
2 [12-19[ 15,5 10
3 [19-26[ 22,5 10
4 [26-33[ 29,5 9
5 [33-40[ 36,5 4
6 [40-47[ 43,5 2
7 [47-54[ 50,5 1
∑ 42
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
5
i x^ i fi ^x i f i
1 8,5
6 51
2 15,5 10 155
3 22,5 10 225
4 29,5 9 265,5
5 36,5 4 146
6 43,5 2 87
7 50,5 1 50,5
∑ 42 980
980
X̄ = =23,33≈23
42
Obs:
2.2 A mediana
A mediana ( Me ) é um valor que divide um conjunto ordenado de dados em duas partes iguais tal que
metade (50%) dos dados sejam menores ou iguais a mediana e a outra metade sejam maiores ou
iguais à mediana.
Exemplo:
2, 5, 3, 7, 1, 9, 2.
1, 2, 2, 3, 5, 7, 9.
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
6
n+1 1
i= = ( n+1 )
2 2
1, 2, 2, 3, 5, 7, 9.
Note-se que temos 3 valores menores que mediana (1,2,2) e três valores maiores que mediana. A
mediana está no meio ou centro.
Exemplo:
Resolução: n=6
n+1 6+1 7 x[ i ] + x[ i ] +1 x3 + x 4 6+ 8 14
i= = = =3,5 Me= = = = =7
2º 2 2 2 não é inteiro, então 2 2 2 2
1, 3, 6, 7, 8, 10, 12.
1º Localizar a classe mediana, que é aquela que tem frequência acumulada até 50% dos dados.
1
Me=L +
( 2
n−F ) a i −1 i
i
fi
Onde:
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
7
Exemplo:
i classes x^ i fi F i Fr %
1 [5-12[ 8,5 6
6 14%
2 [12-19[ 15,5 10 1
6 38%
3 [19-26[ 22,5 10 2
6 62%
4 [26-33[ 29,5 9 3
5 83%
5 [33-40[ 36,5 4 3
9 93%
6 [40-47[ 43,5 2 4
1 98%
7 [47-54[ 50,5 1 4
2 100%
∑ 4
2
Solução:
1 42
Me=L +
( 2
n−F ) a
=19+
( −16 )×7
i−1
2 i
=19+
( 21−16 )×7
=19+
5×7 35
=19+ =19+3,5=22 ,5
i
2º : fi 10 10 10 10
i xi fi fr f r% Fi Fr Fr %
1 2 0,10
0 2 0,10 10% 10%
2 1 5 0,25 25% 7 0,35 35%
3 2 2 0,10 10% 9 0,45 45%
4 3 3 0,15 15% 12 0,60 60%
5 4 3 0,15 15% 15 0,75 75%
6 5 3 0,15 15% 18 0,90 90%
7 6 2 0,10 10% 20 1,00 100%
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
8
∑ 20 1,00 100
%
A mediana é x 4 =3
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
9
N Categoria fi fr f r% Fi Fr Fr %
º
1 M 2 0,0 5% 2 0,05 5%
5
2 S 10 0,2 25% 12 0,30 30%
5
3 B 24 0,6 60% 36 0,90 90%
0
4 E 4 0,1 10% 40 1,00 100%
0
∑ 40 1,0 100%
0
2.3 A moda
A moda de um conjunto de dados ( Mo) é o valor que ocorre com maior frequência.
Exemplo:
i xi fi fr f r% Fi Fr Fr %
1 2 0,10
0 2 0,10 10% 10%
2 1 5 0,25 25% 7 0,35 35%
3 2 2 0,10 10% 9 0,45 45%
4 3 3 0,15 15% 12 0,60 60%
5 4 3 0,15 15% 15 0,75 75%
6 5 3 0,15 15% 18 0,90 90%
7 6 2 0,10 10% 20 1,00 100%
∑ 20 1,00 100
%
Note que a moda pode ser calculada para dados qualitativos nominais e ordinais.
a)
N Categoria fi fr f r%
º
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
10
1 A 6 0,12 12%
2 B 15 0,30 30%
3 F 16 0,32 32%
4 T 8 0,16 16%
5 V 5 0,10 10%
∑ 50 1,00 100%
b)
N Categoria fi fr f r% Fi Fr Fr %
º
1 M 2 0,0 5% 2 0,05 5%
5
2 S 10 0,2 25% 12 0,30 30%
5
3 B 24 0,6 60% 36 0,90 90%
0
4 E 4 0,1 10% 40 1,00 100%
0
∑ 40 1,0 100%
0
Respostas:
a) F
b) B
1º: localizar a classe modal, que é aquela que tem a maior frequência
( f i−f i −1 ) ai
Mo=Li +
2 f i−( f i −1 +f i +1 )
Onde:
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
11
Exemplo:
i Classes x^ i fi F i Fr %
1 [5-12[ 8,5 6
6 14%
2 [12-19[ 15,5 10 1
6 38%
3 [19-26[ 22,5 10 2
6 62%
4 [26-33[ 29,5 9 3
5 83%
5 [33-40[ 36,5 4 3
9 93%
6 [40-47[ 43,5 2 4
1 98%
7 [47-54[ 50,5 1 4
2 100%
∑ 42
1º: Neste caso temos duas classes modais [12-19[ e [19-26 [ ; logo temos duas modas
Obs: Uma distribuição de dados pode não ter moda, pode ter uma moda (distribuição unimodal), duas
modas (distribuição bimodal), n modas (distribuição multimodal).
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
12
3. Medidas de posição
As medidas de posição ou de são valores que nos dão a localização de alguns pontos da distribuição de
dados. As mais usadas são os Quartís e os Percentís.
3.1. Os Quartis
Os quartis são três valores que dividem um conjunto ordenado de dados em quatro partes, ver a figura
seguinte:
O 1º Quartil ( Q1 ) é o valor que divide um conjunto ordenado de dados em duas partes, tal que
1 3
( 25% ) ( 75 %)
4 são menores ou iguais a Q1 e 4 são maiores ou iguais a Q1 .
O 3º Quartil ( Q3 ) é o valor que divide um conjunto ordenado de dados em duas partes, tal que
3 1
( 75 %) ( 25 % )
4 são menores ou iguais a Q3 e 4 são maiores ou iguais a Q3 .
Cálculos de quartis
As regras para o cálculo dos quartis de um conjunto de dados são similares às usadas no cálculo da
mediana:
Exemplo 1:
Solução:
n=11
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
13
Q1 :
n+1 11+1 12
i= = = =3→Q1 =x 3 =8
4 4 4
Q2 =Me :
n+1 11+1 12
i= = = =6 →Q2 =x 6 =11
2 2 2
Q3 : :
3 3 3 36
i= ( n+1 )= ( 11+ 1 )= 12= =9→Q3 =x 9 =16
4 4 4 4
Exemplo 2:
Solução:
n=10
Q1 :
n+1 10+1 11
i= = = =2,75 →Q1 =x 2 +0 , 75 ( x 3 −x 2 ) =6+0 , 75 ( 8−6 )=6+0 ,75×2=6 +1,5=7,5
4 4 4
Q2 =Me :
n+1 10+1 11
i= = = =5,5 →Q2 =x 5 + 0,5 ( x6 −x 5 )=11+ 0,5 (15−11 ) =11+0,5×4=11+2=13
2 2 2
Repare que este resultado pode-se obter pela seguinte fórmula já conhecida:
x 5 + x 6 11+15 26
Q2 = = = =13
2 2 2
Q3 : :
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
14
3 3 3 33
i= ( n+1 )= ( 10+1 ) = 11= =8,25→Q3 =x 8 +0 ,25 ( x 9 −x 8 ) =18+0 , 25 ( 20−18 )=18+0 , 25×2=18+0,5=18,5
4 4 4 4
i Classes x^ i fi F i Fr %
1 [5-12[ 8,5 6
6 14%
2 [12-19[ 15,5 10 1
6 38%
3 [19-26[ 22,5 10 2
6 62%
4 [26-33[ 29,5 9 3
5 83%
5 [33-40[ 36,5 4 3
9 93%
6 [40-47[ 43,5 2 4
1 98%
7 [47-54[ 50,5 1 4
2 100%
∑ 42
Solução:
Q1 :
Q1 ∈[12-19[
1
Q =L +
( 4
n−F ) a i−1 i
1 i
fi
42
Q =12+
( 4
−6 )×7
=12+
( 10,5−6 )×7
=12+
4,5×7
=12+
31,5
=12+3 , 15=15,5
1
10 10 10 10
Q2 =Me∈[19-26 [ :
1
Q =L +
( 2
n−F ) a i−1 i
2 i
fi
42
Q =19+
( 2
−16 )×7
=19+
( 21−16 )×7
=19+
5×7 35
=19+ =19+3,5=22 ,5
2
10 10 10 10
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
15
Q3 : :
Q3 ∈[26-33 [
3
Q =L +
( 4
n−F ) a i−1 i
3 i
fi
3 126
Q =26+
( 4
×42−10 )×7
=26+
( 4
−10)×7
=26+
( 31,5−10 )×7
=26 +
21,5×7
=26+
150,5
=26+ 16,72=42,72
3
9 9 9 9 9
Intervalo Interquartil:
O intervalo interquartil é uma medida de dispersão dos dados calcula através da seguinte fórmula:
ΔQ=Q3 −Q1
No caso do último exemplo temos:
ΔQ=42,72−15,5=27,22
3.2. Os Percentís
Os percentís são valores que dividem um conjunto ordenado de dados em 100 partes: P1 ; P2 ; P3 ;
…; P99 . , ver a figura seguinte:
O percentil 95 ( P95 ) é um valor que dividem um conjunto ordenado de dados em duas partes, tal que
95% dos dados são menores ou igual a P95 e as restantes 5% são maiores ou iguais a P95 .
O P10 é um valor que divide um conjunto ordenado de dados em duas partes, tal que 10% são menores a P10
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
16
Exemplo:
Supõe que a sua nota no exame de Estatística foi de 12 valores e depois de ordenar os dados, a sua
classificação localiza-se no P60 . Isso significa que 60% dos estudantes tiveram nota inferior que a
sua e os restantes 40% tiveram notas superiores que a sua.
Note que:
P25=Q1
P50=Q2 =Me
P75=Q3
O gráfico de Caixa e Bigodes (Boxplot) é uma representação gráfica de uma distribuição de dados que
permite visualizar a forma da distribuição de dados e identificar os dados extremos (outliers).
3º Desenhar um rectângulo cujos extremos são Q1 e Q3 e indicar a posição da mediana Q2 por uma
recta vertical.
4º Calcular o limite inferior e limite o superior entre os valores admissíveis (normais) e os valores
extremos (anormais):
No intervalo [ Li ; Ls]
ficam os valores considerados normais (não extremos).
5º Desenhar um segmento de recta que parte do mínimo valor e termina no máximo valor dentro do
intervalo [ Li ; L s]
.
Consideram-se valores extremos aos valores que se encontram fora do intervalo [ Li ; Ls]
; ou seja
x i é valor extremo se x i <Li ou x i > Ls .
Exemplo:
1.7; 2.2, 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9, 20.1, 32,7,
40.5.
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
17
Solução:
n=23
Q1 :
n+1 23+1 24
i= = = =6→Q1 =x 6=3. 2
4 4 4
Q2 =Me :
n+1 23+1 24
i= = = =12→Q 2=x 12=5 .3
2 2 2
Q3 : :
3 3 3 72
i= ( n+1 )= ( 23+1 ) = 24= =18→Q 3 =x 18=7 . 6
4 4 4 4
Li=Q1 −1,5 ( Q3 −Q1 ) =Q1 −1,5 ΔQ=3. 2−1 . 5×4 . 4=3 .2−6,6=-3. 4
Ls =Q3 +1,5 ( Q3 −Q1 )=Q3 +1,5 ΔQ=7 .6+ 1,5×4 . 4=7 .6 +6 .6=14 . 2
O intervalo admissível é:
[ −3.4 14.2 ]
O mínimo valor que pertence ao intervalo é 1.7
10
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
18
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
19
1.7, 2.2, 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9ᴼ, 20.1ᴼ, 32,7*,
40.5*.
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
20
Alguns pacotes estatísticos como o SPSS, para além da média aritmética, calculam a média aparada.
A Média Aparada (Trimmed Mean) é a média das 90% observações do meio obtida depois de excluir 5%
observações menores e 5% observações maiores do conjunto de dados.
Diferentemente da média aritmética, a média aparada não é afectada por dados extremos.
Voltado ao exemplo:
1.7, 2.2, 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9, 20.1, 32,7,
40.5.
Resposta:
n=23
Média aritmética:
X̄ =
∑ x i =199,1 =8,66
n 23
Média aparada:
Média aritmética obtém-se somando as observações que restam depois de excluir 10% das
observações (5% menores e 5% maiores).
n=23→0 , 05×23=1,15≈1
Isto significa que temos que eliminar os dois menores e os dois maiores valores:
2.2; 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9, 20.1, 32,7.
,
n =21
X̄ a=
∑ x i =156,9 =7,47
n, 21
Obs:
Quando estas as médias diferem muito, significa que a distribuição original contém dados extremos
muito discrepantes.
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
21
4. Medidas de dispersão
Por dispersão de um conjunto de dados refere-se ao grau da variabilidade existente entre os dados. Se
todos os dados são iguais, então não existe dispersão.
No conjunto A não tem nenhuma dispersão, pois os dados não variam. No conjunto B há dispersão
porque há variabilidade entre os dados.
A dispersão define-se tendo em conta a posição das observações (dados) em relação ao valor da
média. Portanto o primeiro passo será calcular os desvios dos dados em relação à média.
Amplitude Total
O Intervalo Interquartil
Variância e desvio padrão
O coeficiente de Variação
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
22
Exemplo:
Calcule a variância e o desvio padrão dos seguintes dados amostrais sobre o nº de irmãos dos alunos
de uma turma da 10ª classe de uma escola secundária:
2; 5; 1; 4; 0; 6; 1; 3; 6; 1; 5; 3; 4; 1; 3; 5; 0; 4; 2; 1.
Solução:
n
∑ ( x i− X̄ )2
S 2 =i=1
n−1
n=20
n
∑ xi
X̄ = i=1
n
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
23
i xi ( x i− X̄ ) (
2
( x i− X̄ )
1 2 -1 1
57
2 5 2 4 X̄ = =2,85=3
20
3 1 -2 4 73 73
S 2= = =3,84→
20−1 19
4 4 1 1 S= √ 3 , 84=1,96
5 0 -3 9
Para evitar o cálculo das diferenças costuma-se usar a seguinte fórmula para o
6 6 3 9
cálculo da variância:
7 1 -2 4 i xi x 2
i
2
8
9
3
6
0
3
0
9
1
2
2
5
4
25
2
s=
1
n−1 (∑ x 2−
i
(∑ x i )
n )
10 1 -2 4 3 1 1
11 5 2 4 4 4 16
12 3 0 0 5 0 0
13 4 1 1 6 6 36
14 1 -2 4 7 1 1
15 3 0 0 8 3 9
16 5 2 4 9 6 36
17 0 -3 9 10 1 1
18 4 1 1 11 5 25
19 2 -1 1 12 3 9
20 1 -2 4 13 4 16
∑ 57 73 14 1 1
15 3 9
16 5 25
17 0 0
18 4 16
19 2 4
_____________________________________________________________________________________________
Atanasio Matsimbe 20 1 1 Maputo, 2019
∑ 57 235
24
∑ x i=57
∑ x 2i =235
2
1 ( 57 ) 1 3249 1 72,55
s=
2
20−1 (
235−
20
= 235−
19 ) (
20
= (235−162,45 )=
19 19) =3,8184
s= √3,8184=1,95
A ligeira diferença vem por causa do arredondamento da média no 1º cálculo.
Onde:
^x i = representante da classe i
Exemplo:
a)
i Classes fi
1 [5-12[
6
2 [12-19[ 10
3 [19-26[ 10
4 [26-33[ 9
5 [33-40[ 4
6 [40-47[ 2
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
25
7 [47-54[ 1
∑ 42
b)
i xi fi
1
0 2
2 1 5
3 2 2
4 3 3
5 4 3
6 5 3
7 6 2
∑ 20
Respostas:
a)
i ^x i fi ^x i f i ^x i− X̄ 2 2
( x^ i− X̄ ) ( x^ i− X̄ ) fi
1 8,5 51 -14,8
6 219,04
1314,24
2 15,5 10 155 -7,8 60,84 608,4
3 22,5 10 225 -0,8 0,64 6,4
4 29,5 9 265,5 6,2 38,44 345,96
5 36,5 4 146 13,2 174,24 696,96
6 43,5 2 87 20,2 408,04 816,08
7 50,5 1 50,5 27,2 739,84 739,84
∑ 42 980 4527,88
980
X̄ = =23,3
42
n
∑ ( x^ i− X̄ )2 f i
4527,88 4527,88
S 2 =i=1 = = =110,44
n−1 42-1 41
S= √110,44=10,5
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
26
b)
i xi fi xi f i x i− X̄ 2 2
( x i− X̄ ) ( x i− X̄ ) f i
1
0 2 0 -2,85 8,1225 16,245
2 1 5 5 -1,85 3,4225 17,1125
3 2 2 4 -0,85 0,7225 1,445
4 3 3 9 0,15 0,0225 0,0675
5 4 3 12 1,15 1,3225 3,9675
6 5 3 15 2,15 4,6225 13,8675
7 6 2 12 3,15 9,9225 19,845
∑ 20 57 72,55
57
X̄ = =2,85
20
n
∑ ( x^ i− X̄ )2 f i
72,55 72,55
S 2 =i=1 = = =3,82
n−1 20-1 19
S= √ 3,82=1,95
O Coeficiente de Variação ( CV ) é uma medida relativa de dispersão que permite comparar conjuntos
de dados medidas em diferentes unidades de medição. Obtém-se dividindo o desvio padrão pela média
da distribuição e normalmente expressa-se em valores percentuais:
δ
CV = ×100
opulacional: μ
Coeficiente de Variação p
S
CV = ×100
amostral: X̄
Coeficiente de Variação
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
27
S 1 , 95
CV = ×100= ×100=0,68×100=68%
X̄ 2 , 85
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
28
A média e o desvio padrão de um conjunto de dados podem fornecer uma informação importante sobre
a distribuição de dados
Dado um conjunto de observações com média μ e desvio padrão σ e um número inteiro k >1 ,
1
cumpre-se que entre a média e k desvios padrão existem pelo menos
( 1−
k ) observações. Ou
2
1
seja, entre o intervalo ( μ-±kδ ) =( μ-kδ; μ+kδ ) existem pelo menos
( k )×100 observações.
1− 2
Exemplo:
Obs.: A desigualdade de Tchebychev, também é válida para dados amostrais; ou seja para X̄ e S
Algumas vezes precisamos de conhecer a posição relativa de uma observação em relação a outras
observações num conjunto de dados. Por exemplo, num teste de 20 valores você obteve 15 valores e
pretende saber qual é a posição da sua nota em relação às notas de outros estudantes da turma.
A média e o desvio padrão das notas da turma podem ser utilizadas para calcular medidas padronizadas
( Z −score ) que permitem medir a posição relativa de uma observação num conjunto de dados.
Uma medida padronizada ( Z ) de uma observação x num conjunto com média μ e desvio
padrão σ é calculada pela fórmula:
x−μ
Z=
δ .
Uma medida padronizada mede a distância entre uma observação e a média em unidades de desvios
padrão.
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
29
Exemplo:
Suponhamos que a média e o desvio padrão de um teste de 20 valores são 14,3 e 2,5 respectivamente.
Qual é a posição relativa da nota de um aluno que obteve 17,4 valores.
Resposta:
μ=14 ,3
δ=2,5
x=17 ,4
x−μ 17 ,4−14,3 3,1
Z= = = =1,24
δ 2,5 2,5
Teorema:
Pode-se demonstrar que a média de um conjunto de dados é igual a zero e o desvio padrão é igual a 1.
Note que a1 = X̄
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
30
que m2=s 2
Note
Diz-se que uma distribuição é simétrica quando a sua representação gráfica tem a seguinte forma:
50% 50%
Uma distribuição é assimétrica quando a sua representação gráfica não tem aquela forma. Nestas
condições podemos ter uma distribuição assimétrica positiva ou uma distribuição assimétrica
negativa:
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
31
Uma forma de conhecer o grau de assimetria de uma distribuição sem recorrer á sua representação
gráfica é através do coeficiente de assimetria. O mais usado é o coeficiente de assimetria de Fisher
calculado através da seguinte fórmula:
n
m3 ∑ ( x i − X̄ )3
CA= 3
= i =1
S nS 3
3 ( X̄ −Me )
CA=
S
( Q3 −Me ) −( Me−Q1 )
CA=
ΔQ
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
32
As medidas de achatamento (curtose) medem o grau de concentração dos dados em relação ao centro
da distribuição dos dados. Quanto ao grau de achatamento uma distribuição pode ser classificada em
leptocúrtica, mesocúrtica e planicúrtica.
a. Uma distribuição leptocúrtica é aquela que tem alta concentração de dados em relação ao
centro da distribuição:
b. Uma distribuição mesocúrtica é aquela que tem concentração normal de dados em relação ao
centro da distribuição:
c. Uma distribuição planicúrtica é aquela que tem baixa concentração de dados em relação ao
centro da distribuição:
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
33
Uma forma de conhecer o grau de achatamento de uma distribuição sem recorrer á sua representação
é através do coeficiente de curtose que se calcula através da seguinte fórmula:
n
m4 ∑ ( x i− X̄ )4
CK = 4
−3= i=1 −3
S nS 4
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
34
Exercícios:
1. Os registos da biblioteca de uma universidade mostram que 22 estudantes do último ano do curso de
académico: 62; 73; 40; 72; 79; 88; 35; 51; 48; 42; 75; 65; 69; 82; 50; 66; 103; 68; 54; 38; 52; 72.
2. São dadas as notas de cinco alunos obtidas nas três avaliações realizadas durante o 1º trimestre:
aluno
Ana 14 12 10
Cláudia 2 4 18
Marcos 10 10 10
Pedro 20 20 0
Sérgio 10 14 6
Supondo que os dois mini testes têm peso 1 e o teste tem peso 2, obtenha a nota média de cada aluno
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
35
16; 11; 11;14; 18; 15; 16; 2; 11, 16; 14; 15; 16; 20; 12, 16; 17; 11; 8; 6; 12; 13; 3; 6; 19; 11; 10; 7; 14; 7;
17; 16; 17; 15; 15; 13; 14; 15;11; 8; 16; 15; 14; 7.
f) Com base nos resultados obtidos, faça uma análise geral da distribuição.
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
36
5. Os dados seguintes referem-se aos resultados de frequência obtidos por alunos de uma turma
durante um ano.
1 F 10 Admitido
2 M 14 Dispensado
3 M 5 Excluído
4 F 12 Admitido
5 M 5 Excluído
6 M 6 Excluído
7 M 6 Excluído
8 M 10 Admitido
9 F 16 Dispensado
1 Excluído
0 F 8
1 Admitido
1 M 12
1 Excluído
2 F 4
1 Admitido
3 M 10
1 Excluído
4 F 9
1 Excluído
5 F 7
1 Excluído
6 F 8
a) Indique, justificando, as medidas de tendência central que se pode calcular para cada variável.
b) Para cada variável, calcule as medidas de tendência central.
c) Para cada variável, as medidas da dispersão.
d) Classifique a distribuição quanto a assimetria.
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
37
6. A tabela seguinte uma distribuição de tempos que um grupo de estudantes do Curso de Licenciatura
Tempo Nº de estuantes
(horas)
30-39 14
40-49 46
50-59 58
60-69 76
70-79 68
80-89 62
90-99 48
100-109 22
110-119 6
7. A tabela seguinte apresenta a distribuição de notas obtidas num exame final de Matemática:
Nota Nº de estudantes
30-39 1
40-49 3
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
38
50-59 11
60-69 21
70-79 43
80-89 32
90-100 9
Calcule:
a) As medidas de tendência central;
b) Os quartis;
c) As medidas de assimetria e classifique a distribuição.
8. Considere uma amostra com 10; 20; 12; 12; 17; e 16.
a) Calcule os valores padronizados para cada uma das observações.
b) Calcule a média e o desvio padrão dos valores padronizados.
9. Um aluno que teve 18 valores no primeiro teste e 12 no segundo teste. Sabendo que a média das
notas do 1º teste foi de 14 valores e desvio padrão de padrão de 8 e a média do segundo teste foi de
10 valores e desvio de 2. Em qual das duas avaliações esteve melhor posicionado?
10. Considere um conjunto de dados com média de 30 e desvio padrão de 5. Use a desigualdade de
Tchebychev para calcular a percentagem das observações que estão dentro dos seguintes
intervalos:
a) 20 a 40
b) 15 a 45
c) 10 a 50
Fim
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019