Você está na página 1de 39

3.

MEDIDAS DESCRITIVAS

Atanasio Matsimbe, Maputo 2019


1

1. Introdução
Vimos que para descrever um conjunto de dados pode-se utilizar tabelas, gráficos e medidas numéricas.
As medidas numéricas são utilizadas para reduzir o conjunto de dados utilizando um único número. As
medidas numéricas podem ser parâmetros ou estatísticas.

Os parâmetros são medidas numéricas calculadas a partir dos dados populacionais. O dados
populacionais obtêm-se através de censos.

As estatísticas são medidas numéricas calculadas a partir dos dados amostrais. Os dados amostrais
obtêm-se através de amostragens.

As estatísticas são utilizadas para estimar os valores dos respectivos parâmetros da população que, em
geral, são desconhecidos.

Para um conjunto de dados pode-se calcular medidas de tendência central, medidas de posição,
medidas de dispersão e medidas de forma da distribuição.

2. Medidas de tendência central


As medidas de tendência central são valores que nos indicam o centro da distribuição. Incluem a média,
a mediana e a moda.

2.1. A média

A média é a medida de tendência central mais utilizada. A média é um valor que indica o ponto central
da distribuição de dados em torno do qual se distribuem os dados da população ou de amostra. Pode-se
calcular média aritmética e média ponderada.

Cálculo da média aritmética

A média aritmética de um conjunto de dados numéricos é igual a soma de todos os valores divididos
pelo número total dos elementos.

A média de uma população ( μ ) com N calcula-se através da seguinte fórmula:


N

x 1 + x 2 +. ..+x N ∑ xi N
i=1 1
μ= = = ∑ xi
N N N i=1

A média de uma amostra ( X̄ ) com n calcula-se através da seguinte fórmula:


n

x 1 + x 2 +. . .+ xn ∑ xi n
1
X̄ = = i=1 = ∑ x i
n n n i=1

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
2

Por simplificação, vamos dar exemplos de médias calculadas a partir de dados de amostras.

Exemplo 1:

Calcule a média aritmética de uma aluno que as notas seguintes nos três testes de Matemática: 10; 8;
12:

n=3
x 1=10
x 2=8
x 3=12
x1 + x2 +. x 3 10+ 8+12 30
X̄ = = = =10
3 3 3

Exemplo 2:

Um produto é vendido por 10,00 Mt no mercado A, 12,00 Mt no mercado B, 8,00 Mt no mercado C,


15,00 Mt no mercado D e 5,00 Mt no mercado E. Calcule o preço médio do produto.

Cálculo da média ponderada

A média ponderada é usada quando se atribuem pesos diferentes aos dados. É muito usada no cálculo
das médias finais das avaliações escolares, concursos etc.

Suponhamos que se pretende a média dos valores x 1 ;x 2 ;...; x n com pesos w 1 ;w2 ;...;w n
respectivamente. A média calcula-se pela seguinte fórmula:
n
∑ w i xi
w x +w x +.. .+w n x n i=1
X̄ = 1 1 2 2 = n
w 1 +w 2 +. ..+ wn
∑ wi
i=1

Exemplo 3:

Suponhamos que no exemplo 1 a nota do 3º teste tem peso 2, calcule a média.

x 1=10 ; w1 =1
x 2=8; w2 =1
x 3=12 w3 =2
x w + x w +. x 3 w3 10×1+8×1+ 12×2 10+8+24 42
X̄ = 1 1 2 2 = = = =10 , 5
w1 + w2 +. w3 1+1+2 4 4

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
3

Exemplo 4:

Suponhamos que no exemplo 1 a nota do 3º teste tem peso 2, calcule a média.

x 1=10 ; w1 =1
x 2=8; w2 =1
x 3=12 w3 =2
x w + x w +. x 3 w3 10×1+8×1+ 12×2 10+8+24 42
X̄ = 1 1 2 2 = = = =10 , 5
w1 + w2 +. w3 1+1+2 4 4

Exemplo 5:

A tabela seguinte apresenta os preços e as quantidades vendidas de determinados produtos em 5


diferentes cidades:

i Mercado preço quantidades


1 A 10,00 500
2 B 12,00 200
3 C 8,00 600
4 D 15,00 100
5 E 5,00 1000

Determine o preço médio.

Cálculo da média de dados agrupados

A média de dados agrupados é igual a média ponderada pelas frequências:


n n

x 1 f 1 + x 2 f 2 +.. .+ x n f n ∑ xi f i ∑ xi f i
X̄ = = i=1n = i=1
f 1 +f 2 +. ..+ f n n
∑ fi
i=1

Exemplo:

Calcule o nº médio de irmãos de 20 alunos a partir da seguinte tabela:

i xi fi
1
0 2
2 1 5
3 2 2
4 3 3
5 4 3
6 5 3
7 6 2
∑ 20

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
4

Solução:

x 1 f 1 + x 2 f 2 + x3 f 3 + x 4 f 4 + x 5 f 5 + x 6 f 6 + x 7 f 7
X̄ =
f 1 +f 2 + f 3 + f 4 +f 5 + f 6 + f 7

Para facilitar os cálculos vamos usar a seguinte tabela auxiliar:

i xi fi xi f i
1 0 2 0
2 1 5 5
3 2 2 4
4 3 3 9
5 4 3 12
6 5 3 15
7 6 2 12
∑ 20 57

57
X̄ = =2,85≈3
20

Para dados agrupados em intervalos de classe temos:


n

x^ f + ^x f +.. .+^x n f n i=1


∑ ^x i f i
X̄ = 1 1 2 2 = n
f 1 +f 2 +. ..+ f n
∑ fi
i=1

^x i= ponto médio (representante ou marca da classe) i .

No caso dos dados sobre o tempo (minutos) que cada aluno da turma da 9ª classe leva de casa para a
escola temos:

i classes x^ i fi
1 [5-12[ 8,5
6
2 [12-19[ 15,5 10
3 [19-26[ 22,5 10
4 [26-33[ 29,5 9
5 [33-40[ 36,5 4
6 [40-47[ 43,5 2
7 [47-54[ 50,5 1
∑ 42

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
5

i x^ i fi ^x i f i
1 8,5
6 51
2 15,5 10 155
3 22,5 10 225
4 29,5 9 265,5
5 36,5 4 146
6 43,5 2 87
7 50,5 1 50,5
∑ 42 980

980
X̄ = =23,33≈23
42

Obs:

 A média é calculada para dados quantitativos.


 Embora a média seja a medida de tendência central mais usada, nem sempre representa melhor
o centro de distribuição de dados porque é afectada por dados extremos (atípicos). Por exemplo,
5+7+18 30
X̄ = = =10
a média dos valores 5, 7 e 18 é 3 3 , é afectada por 18 que é valor extremo
em relação aos outros.

2.2 A mediana

A mediana ( Me ) é um valor que divide um conjunto ordenado de dados em duas partes iguais tal que
metade (50%) dos dados sejam menores ou iguais a mediana e a outra metade sejam maiores ou
iguais à mediana.

Cálculo de mediana para dados não agrupados:

Exemplo:

2, 5, 3, 7, 1, 9, 2.

1º Coloca-se os dados em ordem crescente:

1, 2, 2, 3, 5, 7, 9.

2º Coloca-se a posição da mediana no conjunto de dados ordenados:

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
6

n+1 1
i= = ( n+1 )
2 2

 Para i inteiro (caso de n impar), Me=x i


x[ i ] + x[ i ] +1
Me=
 Para i decimal (caso de n par), 2
[ i ]= parte inteira de i .
n+1 7 +1 8
i= = = =4 Me=x 4 =3
Neste caso temos n=7, 2 2 2 , inteiro, então

1, 2, 2, 3, 5, 7, 9.

Note-se que temos 3 valores menores que mediana (1,2,2) e três valores maiores que mediana. A
mediana está no meio ou centro.

Exemplo:

Calcule a mediana dos seguintes dados: 3, 10, 6, 12, 8, 1.

Resolução: n=6

1º: 1, 3, 6, 8; 10, 12.

n+1 6+1 7 x[ i ] + x[ i ] +1 x3 + x 4 6+ 8 14
i= = = =3,5 Me= = = = =7
2º 2 2 2 não é inteiro, então 2 2 2 2

1, 3, 6, 7, 8, 10, 12.

Obs: A mediana não é afectada por dados extremos;

Cálculo da mediana para dados agrupados:

Para dados agrupados a mediana calcula-se da seguinte maneira:

1º Localizar a classe mediana, que é aquela que tem frequência acumulada até 50% dos dados.

2º Calcular a mediana através da seguinte fórmula:

1
Me=L +
( 2
n−F ) a i −1 i

i
fi

Onde:

Li= limite inferior da classe mediana

f i = frequência absoluta da classe mediana

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
7

Fi−1 = frequência absoluta acumulada da classe anterior à classe mediana

ai = amplitude da classe mediana.

Exemplo:

Calcule a mediana dos seguintes dados:

i classes x^ i fi F i Fr %
1 [5-12[ 8,5 6
6 14%
2 [12-19[ 15,5 10 1
6 38%
3 [19-26[ 22,5 10 2
6 62%
4 [26-33[ 29,5 9 3
5 83%
5 [33-40[ 36,5 4 3
9 93%
6 [40-47[ 43,5 2 4
1 98%
7 [47-54[ 50,5 1 4
2 100%
∑ 4
2

Solução:

1º A classe mediana é [19-26 [

1 42
Me=L +
( 2
n−F ) a
=19+
( −16 )×7
i−1
2 i
=19+
( 21−16 )×7
=19+
5×7 35
=19+ =19+3,5=22 ,5
i
2º : fi 10 10 10 10

No caso da distribuição dos irmãos:

i xi fi fr f r% Fi Fr Fr %
1 2 0,10
0 2 0,10 10% 10%
2 1 5 0,25 25% 7 0,35 35%
3 2 2 0,10 10% 9 0,45 45%
4 3 3 0,15 15% 12 0,60 60%
5 4 3 0,15 15% 15 0,75 75%
6 5 3 0,15 15% 18 0,90 90%
7 6 2 0,10 10% 20 1,00 100%

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
8

∑ 20 1,00 100
%

A mediana é x 4 =3

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
9

A mediana também pode-se calcular para dados qualitativos ordinais.

Por exemplo, no caso da classificação do comportamento dos alunos de uma turma:

N Categoria fi fr f r% Fi Fr Fr %
º
1 M 2 0,0 5% 2 0,05 5%
5
2 S 10 0,2 25% 12 0,30 30%
5
3 B 24 0,6 60% 36 0,90 90%
0
4 E 4 0,1 10% 40 1,00 100%
0
∑ 40 1,0 100%
0

A mediana é a categoria B (Bom).

2.3 A moda

A moda de um conjunto de dados ( Mo) é o valor que ocorre com maior frequência.

Exemplo:

Para o caso de distribuição do nº de irmão a moda é x 2=1

i xi fi fr f r% Fi Fr Fr %
1 2 0,10
0 2 0,10 10% 10%
2 1 5 0,25 25% 7 0,35 35%
3 2 2 0,10 10% 9 0,45 45%
4 3 3 0,15 15% 12 0,60 60%
5 4 3 0,15 15% 15 0,75 75%
6 5 3 0,15 15% 18 0,90 90%
7 6 2 0,10 10% 20 1,00 100%
∑ 20 1,00 100
%

Note que a moda pode ser calculada para dados qualitativos nominais e ordinais.

Exemplos: Qual é a moda das seguintes distribuições?

a)

N Categoria fi fr f r%
º
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
10

1 A 6 0,12 12%
2 B 15 0,30 30%
3 F 16 0,32 32%
4 T 8 0,16 16%
5 V 5 0,10 10%
∑ 50 1,00 100%

b)

N Categoria fi fr f r% Fi Fr Fr %
º
1 M 2 0,0 5% 2 0,05 5%
5
2 S 10 0,2 25% 12 0,30 30%
5
3 B 24 0,6 60% 36 0,90 90%
0
4 E 4 0,1 10% 40 1,00 100%
0
∑ 40 1,0 100%
0

Respostas:

a) F
b) B

Cálculo da moda para dados agrupados em classes

Para dados agrupados em classes, o cálculo da moda faz-se da seguinte maneira:

1º: localizar a classe modal, que é aquela que tem a maior frequência

2º: calcular o valor da moda através da seguinte fórmula:

( f i−f i −1 ) ai
Mo=Li +
2 f i−( f i −1 +f i +1 )

Onde:

Li= limite inferior da classe modal

f i = frequência absoluta da classe modal

f i−1= frequência absoluta da classe anterior à classe modal

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
11

f i+1 = frequência absoluta da classe posterior à classe modal

ai = amplitude da classe mediana.

Exemplo:

Calcule a moda dos seguintes dados:

i Classes x^ i fi F i Fr %
1 [5-12[ 8,5 6
6 14%
2 [12-19[ 15,5 10 1
6 38%
3 [19-26[ 22,5 10 2
6 62%
4 [26-33[ 29,5 9 3
5 83%
5 [33-40[ 36,5 4 3
9 93%
6 [40-47[ 43,5 2 4
1 98%
7 [47-54[ 50,5 1 4
2 100%
∑ 42

1º: Neste caso temos duas classes modais [12-19[ e [19-26 [ ; logo temos duas modas

( 10−6 )×7 4×7 28


Mo 1=12+ =12+ =12+ =12+7=19
2º: 2×10−( 6+10 ) 20−16 4 ;
( 10−10 )×7 0×7
Mo 2 =19+ =19+ =19
2×10−( 10+9 ) 20−19

Obs: Uma distribuição de dados pode não ter moda, pode ter uma moda (distribuição unimodal), duas
modas (distribuição bimodal), n modas (distribuição multimodal).

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
12

3. Medidas de posição
As medidas de posição ou de são valores que nos dão a localização de alguns pontos da distribuição de
dados. As mais usadas são os Quartís e os Percentís.

3.1. Os Quartis

Os quartis são três valores que dividem um conjunto ordenado de dados em quatro partes, ver a figura
seguinte:

 O 1º Quartil ( Q1 ) é o valor que divide um conjunto ordenado de dados em duas partes, tal que
1 3
( 25% ) ( 75 %)
4 são menores ou iguais a Q1 e 4 são maiores ou iguais a Q1 .

 O 2º Quartil ( Q2 ) é igual à mediana ( Q2 =Me ) .

 O 3º Quartil ( Q3 ) é o valor que divide um conjunto ordenado de dados em duas partes, tal que
3 1
( 75 %) ( 25 % )
4 são menores ou iguais a Q3 e 4 são maiores ou iguais a Q3 .

Cálculos de quartis

As regras para o cálculo dos quartis de um conjunto de dados são similares às usadas no cálculo da
mediana:

1º Colocar os dados em ordem crescente

2º Localizar a posição do quartil desejado.

Exemplo 1:

11 alunos obtiveram as seguintes notas numa prova de Educação Visual:

16, 15, 4; 18; 11; 13; 20; 8; 11; 9; 6.

Calcule os quartis da distribuição.

Solução:

n=11
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
13

4; 6; 8; 9; 11; 11; 13; 15; 16, 18; 20.

Q1 :

n+1 11+1 12
i= = = =3→Q1 =x 3 =8
4 4 4

Q2 =Me :

n+1 11+1 12
i= = = =6 →Q2 =x 6 =11
2 2 2

Q3 : :

3 3 3 36
i= ( n+1 )= ( 11+ 1 )= 12= =9→Q3 =x 9 =16
4 4 4 4

Exemplo 2:

Q1 , Q2 e Q3 para o seguinte conjunto de dados:


Calcule

16; 25; 4; 18; 15; 20; 8; 11; 9; 6.

Solução:

n=10

4; 6; 8; 9; 11; 15; 16, 18; 20; 25.

Q1 :

n+1 10+1 11
i= = = =2,75 →Q1 =x 2 +0 , 75 ( x 3 −x 2 ) =6+0 , 75 ( 8−6 )=6+0 ,75×2=6 +1,5=7,5
4 4 4

Q2 =Me :

n+1 10+1 11
i= = = =5,5 →Q2 =x 5 + 0,5 ( x6 −x 5 )=11+ 0,5 (15−11 ) =11+0,5×4=11+2=13
2 2 2

Repare que este resultado pode-se obter pela seguinte fórmula já conhecida:

x 5 + x 6 11+15 26
Q2 = = = =13
2 2 2

Q3 : :
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
14

3 3 3 33
i= ( n+1 )= ( 10+1 ) = 11= =8,25→Q3 =x 8 +0 ,25 ( x 9 −x 8 ) =18+0 , 25 ( 20−18 )=18+0 , 25×2=18+0,5=18,5
4 4 4 4

4; 6; 7,5; 8; 9; 11; 13,5; 15; 16, 18; 18,5; 20; 25.

Cálculo de quartis para dados agrupados

Calcule os quartis da seguinte distribuição:

i Classes x^ i fi F i Fr %
1 [5-12[ 8,5 6
6 14%
2 [12-19[ 15,5 10 1
6 38%
3 [19-26[ 22,5 10 2
6 62%
4 [26-33[ 29,5 9 3
5 83%
5 [33-40[ 36,5 4 3
9 93%
6 [40-47[ 43,5 2 4
1 98%
7 [47-54[ 50,5 1 4
2 100%
∑ 42

Solução:

Q1 :

Q1 ∈[12-19[

1
Q =L +
( 4
n−F ) a i−1 i

1 i
fi

42
Q =12+
( 4
−6 )×7
=12+
( 10,5−6 )×7
=12+
4,5×7
=12+
31,5
=12+3 , 15=15,5
1
10 10 10 10

Q2 =Me∈[19-26 [ :

1
Q =L +
( 2
n−F ) a i−1 i

2 i
fi

42
Q =19+
( 2
−16 )×7
=19+
( 21−16 )×7
=19+
5×7 35
=19+ =19+3,5=22 ,5
2
10 10 10 10
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
15

Q3 : :

Q3 ∈[26-33 [

3
Q =L +
( 4
n−F ) a i−1 i

3 i
fi

3 126
Q =26+
( 4
×42−10 )×7
=26+
( 4
−10)×7
=26+
( 31,5−10 )×7
=26 +
21,5×7
=26+
150,5
=26+ 16,72=42,72
3
9 9 9 9 9

Intervalo Interquartil:

O intervalo interquartil é uma medida de dispersão dos dados calcula através da seguinte fórmula:

ΔQ=Q3 −Q1
No caso do último exemplo temos:

ΔQ=42,72−15,5=27,22

3.2. Os Percentís

Os percentís são valores que dividem um conjunto ordenado de dados em 100 partes: P1 ; P2 ; P3 ;
…; P99 . , ver a figura seguinte:

A interpretação dos valores de percentis é similar à de quartis:

O percentil 95 ( P95 ) é um valor que dividem um conjunto ordenado de dados em duas partes, tal que
95% dos dados são menores ou igual a P95 e as restantes 5% são maiores ou iguais a P95 .

O P10 é um valor que divide um conjunto ordenado de dados em duas partes, tal que 10% são menores a P10

e 90% são maiores ou iguais a P10 .

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
16

Exemplo:

Supõe que a sua nota no exame de Estatística foi de 12 valores e depois de ordenar os dados, a sua
classificação localiza-se no P60 . Isso significa que 60% dos estudantes tiveram nota inferior que a
sua e os restantes 40% tiveram notas superiores que a sua.

Note que:

P25=Q1
P50=Q2 =Me
P75=Q3

3.3. Gráfico de Caixa e Bigodes

O gráfico de Caixa e Bigodes (Boxplot) é uma representação gráfica de uma distribuição de dados que
permite visualizar a forma da distribuição de dados e identificar os dados extremos (outliers).

Os passos para a construção de um gráfico de caixa bigodes são:

1º Colocar os dados em ordem crescente;

2º Calcular os quartis da distribuição: Q1 ;Q2 ;Q3 ;

3º Desenhar um rectângulo cujos extremos são Q1 e Q3 e indicar a posição da mediana Q2 por uma
recta vertical.

4º Calcular o limite inferior e limite o superior entre os valores admissíveis (normais) e os valores
extremos (anormais):

Li=Q1 −1,5 ( Q3 −Q1 ) =Q 1 −1,5 ΔQ


Ls =Q3 +1,5 ( Q3 −Q1 )=Q3 +1,5 ΔQ

No intervalo [ Li ; Ls]
ficam os valores considerados normais (não extremos).

5º Desenhar um segmento de recta que parte do mínimo valor e termina no máximo valor dentro do
intervalo [ Li ; L s]
.

Consideram-se valores extremos aos valores que se encontram fora do intervalo [ Li ; Ls]
; ou seja
x i é valor extremo se x i <Li ou x i > Ls .

Exemplo:

Considere o seguinte conjunto ordenado de dados:

1.7; 2.2, 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9, 20.1, 32,7,
40.5.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
17

Construa o gráfico de caixa e bigodes e identifique os dados atípicos:

Solução:

n=23

Q1 :

n+1 23+1 24
i= = = =6→Q1 =x 6=3. 2
4 4 4

Q2 =Me :

n+1 23+1 24
i= = = =12→Q 2=x 12=5 .3
2 2 2

Q3 : :

3 3 3 72
i= ( n+1 )= ( 23+1 ) = 24= =18→Q 3 =x 18=7 . 6
4 4 4 4

ΔQ=Q 3 −Q1 =7. 6−3 .2=4. 4

Li=Q1 −1,5 ( Q3 −Q1 ) =Q1 −1,5 ΔQ=3. 2−1 . 5×4 . 4=3 .2−6,6=-3. 4

Ls =Q3 +1,5 ( Q3 −Q1 )=Q3 +1,5 ΔQ=7 .6+ 1,5×4 . 4=7 .6 +6 .6=14 . 2

O intervalo admissível é:

[ −3.4 14.2 ]
O mínimo valor que pertence ao intervalo é 1.7

O máximo valor que está dentro do intervalo é 9.1

O gráfico de caixa e bigodes é:

10

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
18

Os dados extremos são 15.9, 20.1, 32.7 e 40.5.

Usando SPSS temos:

SPSS indica a posição dos dados extremos. Sendo marcados

os marcados por são considerados extremos suaves ( x 20 , x 21 ).

os marcados por * são considerados extremos graves ( x 22 , x 23 )

Os limites dos extremos graves são obtidos por:

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
19

Li=Q1 −3 ( Q3 −Q1 ) =Q1 −3 ΔQ


Ls =Q3 +3 ( Q 3−Q1 )=Q 3 +3 ΔQ

1.7, 2.2, 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9ᴼ, 20.1ᴼ, 32,7*,
40.5*.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
20

3.4 Media Aparada

Alguns pacotes estatísticos como o SPSS, para além da média aritmética, calculam a média aparada.

A Média Aparada (Trimmed Mean) é a média das 90% observações do meio obtida depois de excluir 5%
observações menores e 5% observações maiores do conjunto de dados.

Diferentemente da média aritmética, a média aparada não é afectada por dados extremos.

Voltado ao exemplo:

Calcule a média aritmética e a média aparada dos seguintes dados:

1.7, 2.2, 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9, 20.1, 32,7,
40.5.

Resposta:

n=23

Média aritmética:

Média aritmética obtém-se somando todas as observações e dividir pelo nº total:

X̄ =
∑ x i =199,1 =8,66
n 23

Média aparada:

Média aritmética obtém-se somando as observações que restam depois de excluir 10% das
observações (5% menores e 5% maiores).

n=23→0 , 05×23=1,15≈1

Isto significa que temos que eliminar os dois menores e os dois maiores valores:

2.2; 2.3, 2.9, 3.2, 3.2, 3.4, 3.9, 4.1, 4.6, 5.1, 5.3, 5.5, 5.8, 5.9, 6.7, 7.4, 7.6, 9.1, 15.9, 20.1, 32,7.
,
n =21

X̄ a=
∑ x i =156,9 =7,47
n, 21

Obs:

Quando estas as médias diferem muito, significa que a distribuição original contém dados extremos
muito discrepantes.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
21

4. Medidas de dispersão
Por dispersão de um conjunto de dados refere-se ao grau da variabilidade existente entre os dados. Se
todos os dados são iguais, então não existe dispersão.

Considere os seguintes conjuntos de dados:

A: 10; 10; 10; 10; 10

B: 10; 5; 18; 2; 13.

No conjunto A não tem nenhuma dispersão, pois os dados não variam. No conjunto B há dispersão
porque há variabilidade entre os dados.

A dispersão é pequena quando todos os dados, apesar de serem diferentes, encontram-se


concentrados em torno da média e, é grande quando muitos dados se encontram muito afastados da
média.

A dispersão define-se tendo em conta a posição das observações (dados) em relação ao valor da
média. Portanto o primeiro passo será calcular os desvios dos dados em relação à média.

Seja x 1 , x 2 , ..., x n um conjunto de n observações com média X̄ .

O desvio do dado x i , em relação à média obtém-se pela fórmula seguinte:

Di=x i − X̄ ;....;i=1 ;2 ;...;n que é a distancia de x i , em relação à X̄ .

Pode-se provar que a soma dos desvios é igual a zero.

As medidas de dispersão de dados são:

 Amplitude Total
 O Intervalo Interquartil
 Variância e desvio padrão
 O coeficiente de Variação

O cálculo da Amplitude Total ( AT ) e do Intervalo Interquartil ( ΔQ ) já foi abordado nas secções


anteriores. Nesta secção vamos estudar a variância, o desvio padrão e o coeficiente de variação.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
22

4.1 Variância e desvio padrão

A variância e o desvio padrão são as medidas de dispersão mais usadas.

Cálculo da variância para dados não agrupados


N
∑ ( x i −μ )2
i =1
δ 2=
N
Variância populacional:
n
∑ ( x i− X̄ )2
i=1
S 2=
amostral: n−1
Variância

O desvio padrão é igual à raiz quadrada da variância:

δ=√ δ 2 , desvio padrão populacional

S= √ S2 , desvio padrão amostral

Exemplo:

Calcule a variância e o desvio padrão dos seguintes dados amostrais sobre o nº de irmãos dos alunos
de uma turma da 10ª classe de uma escola secundária:

2; 5; 1; 4; 0; 6; 1; 3; 6; 1; 5; 3; 4; 1; 3; 5; 0; 4; 2; 1.

Solução:

n
∑ ( x i− X̄ )2
S 2 =i=1
n−1
n=20
n
∑ xi
X̄ = i=1
n

Para facilitar os cálculos utiliza-se a seguinte tabela auxiliar:

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
23

i xi ( x i− X̄ ) (
2
( x i− X̄ )
1 2 -1 1
57
2 5 2 4 X̄ = =2,85=3
20
3 1 -2 4 73 73
S 2= = =3,84→
20−1 19
4 4 1 1 S= √ 3 , 84=1,96
5 0 -3 9
Para evitar o cálculo das diferenças costuma-se usar a seguinte fórmula para o
6 6 3 9
cálculo da variância:
7 1 -2 4 i xi x 2
i
2
8

9
3

6
0

3
0

9
1

2
2

5
4

25
2
s=
1
n−1 (∑ x 2−
i
(∑ x i )
n )
10 1 -2 4 3 1 1

11 5 2 4 4 4 16

12 3 0 0 5 0 0

13 4 1 1 6 6 36

14 1 -2 4 7 1 1

15 3 0 0 8 3 9

16 5 2 4 9 6 36

17 0 -3 9 10 1 1

18 4 1 1 11 5 25

19 2 -1 1 12 3 9

20 1 -2 4 13 4 16

∑ 57 73 14 1 1

15 3 9

16 5 25

17 0 0

18 4 16

19 2 4
_____________________________________________________________________________________________
Atanasio Matsimbe 20 1 1 Maputo, 2019

∑ 57 235
24

∑ x i=57
∑ x 2i =235
2
1 ( 57 ) 1 3249 1 72,55
s=
2
20−1 (
235−
20
= 235−
19 ) (
20
= (235−162,45 )=
19 19) =3,8184
s= √3,8184=1,95
A ligeira diferença vem por causa do arredondamento da média no 1º cálculo.

Cálculo da variância para dados agrupados

Para dados agrupados temos as seguintes formulas:


N
∑ ( x^ i −μ )2 f i
δ 2= i=1
N
Variância populacional:
n
∑ ( ^x i− X̄ )2 f i
i=1
S 2=
amostral: n−1
Variância

Onde:

^x i = representante da classe i

f i = frequência absoluta da classe i

Exemplo:

Calcule a variância e o desvio padrão dos seguintes conjuntos de dados:

a)

i Classes fi
1 [5-12[
6
2 [12-19[ 10
3 [19-26[ 10
4 [26-33[ 9
5 [33-40[ 4
6 [40-47[ 2
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
25

7 [47-54[ 1
∑ 42

b)

i xi fi
1
0 2
2 1 5
3 2 2
4 3 3
5 4 3
6 5 3
7 6 2
∑ 20

Respostas:

a)

i ^x i fi ^x i f i ^x i− X̄ 2 2
( x^ i− X̄ ) ( x^ i− X̄ ) fi

1 8,5 51 -14,8
6 219,04
1314,24
2 15,5 10 155 -7,8 60,84 608,4
3 22,5 10 225 -0,8 0,64 6,4
4 29,5 9 265,5 6,2 38,44 345,96
5 36,5 4 146 13,2 174,24 696,96
6 43,5 2 87 20,2 408,04 816,08
7 50,5 1 50,5 27,2 739,84 739,84
∑ 42 980 4527,88

980
X̄ = =23,3
42
n
∑ ( x^ i− X̄ )2 f i
4527,88 4527,88
S 2 =i=1 = = =110,44
n−1 42-1 41
S= √110,44=10,5

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
26

b)

i xi fi xi f i x i− X̄ 2 2
( x i− X̄ ) ( x i− X̄ ) f i
1
0 2 0 -2,85 8,1225 16,245
2 1 5 5 -1,85 3,4225 17,1125
3 2 2 4 -0,85 0,7225 1,445
4 3 3 9 0,15 0,0225 0,0675
5 4 3 12 1,15 1,3225 3,9675
6 5 3 15 2,15 4,6225 13,8675
7 6 2 12 3,15 9,9225 19,845
∑ 20 57 72,55

57
X̄ = =2,85
20
n
∑ ( x^ i− X̄ )2 f i
72,55 72,55
S 2 =i=1 = = =3,82
n−1 20-1 19
S= √ 3,82=1,95

4.3 Coeficiente de variação

O Coeficiente de Variação ( CV ) é uma medida relativa de dispersão que permite comparar conjuntos
de dados medidas em diferentes unidades de medição. Obtém-se dividindo o desvio padrão pela média
da distribuição e normalmente expressa-se em valores percentuais:

δ
CV = ×100
opulacional: μ
Coeficiente de Variação p

S
CV = ×100
amostral: X̄
Coeficiente de Variação

O Coeficiente de Variação do exemplo anterior é:

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
27

S 1 , 95
CV = ×100= ×100=0,68×100=68%
X̄ 2 , 85

Bastante elevado! Um CV maior que 20 é considerado alto.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
28

4.4. Desigualdade de Tchebychev

A média e o desvio padrão de um conjunto de dados podem fornecer uma informação importante sobre
a distribuição de dados

Dado um conjunto de observações com média μ e desvio padrão σ e um número inteiro k >1 ,

1
cumpre-se que entre a média e k desvios padrão existem pelo menos
( 1−
k ) observações. Ou
2

1
seja, entre o intervalo ( μ-±kδ ) =( μ-kδ; μ+kδ ) existem pelo menos
( k )×100 observações.
1− 2

Exemplo:

Se a média de um conjunto de dados é 500 e o desvio padrão é 20, então:

1. Entre a média e 2 desvios padrão ;


( μ-kδ; μ+kδ )=( 500−2×20 ; 500+2×20 )=( 500−40 ; 500+40 )=( 460 ; 540 ) existem pelo menos

(1− k1 )=(1− 21 )=( 1− 14 )= 34 =0 , 75=75 %


2 2
observações.
2. Entre a média e três desvios padrão; ( 500−3×20 ; 500+3×20 )=( 500−60; 500+60 )=( 440; 560 )

existem pelo menos


(1− 31 )=(1− 19 )= 89 =0 , 89=89 %
2

Obs.: A desigualdade de Tchebychev, também é válida para dados amostrais; ou seja para X̄ e S

4.5. Medidas padronizadas

Algumas vezes precisamos de conhecer a posição relativa de uma observação em relação a outras
observações num conjunto de dados. Por exemplo, num teste de 20 valores você obteve 15 valores e
pretende saber qual é a posição da sua nota em relação às notas de outros estudantes da turma.

A média e o desvio padrão das notas da turma podem ser utilizadas para calcular medidas padronizadas
( Z −score ) que permitem medir a posição relativa de uma observação num conjunto de dados.

Uma medida padronizada ( Z ) de uma observação x num conjunto com média μ e desvio
padrão σ é calculada pela fórmula:

x−μ
Z=
δ .

Uma medida padronizada mede a distância entre uma observação e a média em unidades de desvios
padrão.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
29

Exemplo:

Suponhamos que a média e o desvio padrão de um teste de 20 valores são 14,3 e 2,5 respectivamente.
Qual é a posição relativa da nota de um aluno que obteve 17,4 valores.

Resposta:

μ=14 ,3
δ=2,5
x=17 ,4
x−μ 17 ,4−14,3 3,1
Z= = = =1,24
δ 2,5 2,5
Teorema:

Pode-se demonstrar que a média de um conjunto de dados é igual a zero e o desvio padrão é igual a 1.

4.6. Momentos de uma distribuição

Em algumas situações, para descrever um conjunto de dados precisamos de calcular os momentos da


distribuição. Existem dois tipos de momentos: momentos em relação à origem e momentos em relação à
média.

Define-se o momento de ordem r em relação à origem como sendo:


n
∑ x ri
ar = i=1 , .. . , r=1,2 ,. . .
n para dados não agrupados;
n
∑ x ri f i
ar = i=1 ,. . ., r=1,2, . ..
n para dados agrupados.

Note que a1 = X̄

Define-se o momento de ordem r em relação à média (momento central) como sendo:


n
∑ ( x i− X̄ )r
i=1
mr = , .. . , r=1,2 ,.. .
n , para dados não agrupados;
n
∑ ( x i− X̄ )r f i
mr = i=1 ,. .. , r=1,2, . ..
n , para dados agrupados.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
30

que m2=s 2
Note

5. Medidas de forma da distribuição


As medidas de forma permitem conhecer a forma da distribuição de dados sem a necessidade de
recorrer a sua representação gráfica. Existem dois tipos de medidas de forma: medidas de assimetria e
medidas de achatamento.

5.1. Medidas de Assimetria (Skewness)

Quanto à assimetria uma distribuição pode ser classificada em simétrica e em assimétrica.

Diz-se que uma distribuição é simétrica quando a sua representação gráfica tem a seguinte forma:

50% 50%

Nestas condições, a média, a mediana e a moda são iguais ( X̄ =Me=Mo )

Uma distribuição é assimétrica quando a sua representação gráfica não tem aquela forma. Nestas
condições podemos ter uma distribuição assimétrica positiva ou uma distribuição assimétrica
negativa:

a) Distribuição assimétrica positiva:

Aqui temos X̄ >Me>Mo

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
31

a) Distribuição assimétrica negativa:

Aqui temos X̄ <Me<Mo

Uma forma de conhecer o grau de assimetria de uma distribuição sem recorrer á sua representação
gráfica é através do coeficiente de assimetria. O mais usado é o coeficiente de assimetria de Fisher
calculado através da seguinte fórmula:
n

m3 ∑ ( x i − X̄ )3
CA= 3
= i =1
S nS 3

Também se pode utilizar as seguintes fórmulas:

3 ( X̄ −Me )
CA=
S

( Q3 −Me ) −( Me−Q1 )
CA=
ΔQ

1. Para CA=0 , temos uma distribuição simétrica;


2. Para CA>0 , temos uma distribuição assimétrica positiva;
3. Para CA<0 , temos uma distribuição assimétrica negativa.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
32

5.2. Medidas de Achatamento

As medidas de achatamento (curtose) medem o grau de concentração dos dados em relação ao centro
da distribuição dos dados. Quanto ao grau de achatamento uma distribuição pode ser classificada em
leptocúrtica, mesocúrtica e planicúrtica.

a. Uma distribuição leptocúrtica é aquela que tem alta concentração de dados em relação ao
centro da distribuição:

b. Uma distribuição mesocúrtica é aquela que tem concentração normal de dados em relação ao
centro da distribuição:

c. Uma distribuição planicúrtica é aquela que tem baixa concentração de dados em relação ao
centro da distribuição:

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
33

Uma forma de conhecer o grau de achatamento de uma distribuição sem recorrer á sua representação
é através do coeficiente de curtose que se calcula através da seguinte fórmula:
n

m4 ∑ ( x i− X̄ )4
CK = 4
−3= i=1 −3
S nS 4

1. Para CK =0 , temos uma distribuição mesocúrtica;


2. Para CK >0 , temos uma distribuição leptocúrtica;
1. Para CK <0 , temos uma distribuição planicúrtica.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
34

Exercícios:

1. Os registos da biblioteca de uma universidade mostram que 22 estudantes do último ano do curso de

licenciatura em Educação Visual consultaram os seguintes números de livros durante o ano

académico: 62; 73; 40; 72; 79; 88; 35; 51; 48; 42; 75; 65; 69; 82; 50; 66; 103; 68; 54; 38; 52; 72.

Calcule a média, mediana e a moda da distribuição.

2. São dadas as notas de cinco alunos obtidas nas três avaliações realizadas durante o 1º trimestre:

Nome do 1º mini teste 2º mini teste Teste

aluno

Ana 14 12 10

Cláudia 2 4 18

Marcos 10 10 10

Pedro 20 20 0

Sérgio 10 14 6

Supondo que os dois mini testes têm peso 1 e o teste tem peso 2, obtenha a nota média de cada aluno

e diga qual é o resultado final de cada aluno (excluído, admitido, dispensado).

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
35

3. Os alunos de uma turma obtiveram as seguintes notas numa prova da Geografia:

16; 11; 11;14; 18; 15; 16; 2; 11, 16; 14; 15; 16; 20; 12, 16; 17; 11; 8; 6; 12; 13; 3; 6; 19; 11; 10; 7; 14; 7;

17; 16; 17; 15; 15; 13; 14; 15;11; 8; 16; 15; 14; 7.

a) Calcule a média, mediana e a moda das notas da turma.

b) Calcule a média aparada.

c) Calcule a variância, desvio padrão e coeficiente de variação.

d) Calcule os quartis da distribuição

e) Construa o diagrama de caixa e bigodes e identifique os dados extremos.

f) Com base nos resultados obtidos, faça uma análise geral da distribuição.

4. Os seguintes dados referem-se ao tempo (minutos) os estudantes de uma turma gastaram na


Internet na sua última sessão:
50; 40; 41; 17; 11; 22; 44; 28; 21; 19; 23; 37; 51; 54; 42; 86; 41; 78; 56; 72; 56; 17; 69;30; 80; 56; 29;
20; 18; 29; 34; 59; 73; 77; 36; 39; 30; 62; 54; 67; 39; 31; 53; 44.

a) Calcule as medidas da tendência central da distribuição.


b) Calcule as medidas da dispersão de dados
c) Calcule o coeficiente de assimetria e de curtose.
d) Classifique a distribuição quanto a assimetria.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
36

5. Os dados seguintes referem-se aos resultados de frequência obtidos por alunos de uma turma

durante um ano.

nº Sexo Nota freq. Resultado

1 F 10 Admitido

2 M 14 Dispensado

3 M 5 Excluído

4 F 12 Admitido

5 M 5 Excluído

6 M 6 Excluído

7 M 6 Excluído

8 M 10 Admitido

9 F 16 Dispensado

1 Excluído
0 F 8

1 Admitido
1 M 12

1 Excluído
2 F 4

1 Admitido
3 M 10

1 Excluído
4 F 9

1 Excluído
5 F 7

1 Excluído
6 F 8

a) Indique, justificando, as medidas de tendência central que se pode calcular para cada variável.
b) Para cada variável, calcule as medidas de tendência central.
c) Para cada variável, as medidas da dispersão.
d) Classifique a distribuição quanto a assimetria.

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
37

6. A tabela seguinte uma distribuição de tempos que um grupo de estudantes do Curso de Licenciatura

em Filosofia dedicam aos estudos individuais independentes.

Tempo Nº de estuantes

(horas)

30-39 14

40-49 46

50-59 58

60-69 76

70-79 68

80-89 62

90-99 48

100-109 22

110-119 6

a) Calcule a média, mediana e moda da distribuição.

b) Calcule as medidas de dispersão

7. A tabela seguinte apresenta a distribuição de notas obtidas num exame final de Matemática:

Nota Nº de estudantes

30-39 1

40-49 3
_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019
38

50-59 11

60-69 21

70-79 43

80-89 32

90-100 9

Calcule:
a) As medidas de tendência central;
b) Os quartis;
c) As medidas de assimetria e classifique a distribuição.

8. Considere uma amostra com 10; 20; 12; 12; 17; e 16.
a) Calcule os valores padronizados para cada uma das observações.
b) Calcule a média e o desvio padrão dos valores padronizados.

9. Um aluno que teve 18 valores no primeiro teste e 12 no segundo teste. Sabendo que a média das
notas do 1º teste foi de 14 valores e desvio padrão de padrão de 8 e a média do segundo teste foi de
10 valores e desvio de 2. Em qual das duas avaliações esteve melhor posicionado?

10. Considere um conjunto de dados com média de 30 e desvio padrão de 5. Use a desigualdade de
Tchebychev para calcular a percentagem das observações que estão dentro dos seguintes
intervalos:
a) 20 a 40
b) 15 a 45
c) 10 a 50
Fim

_____________________________________________________________________________________________
Atanasio Matsimbe Maputo, 2019

Você também pode gostar