Você está na página 1de 31

Medidas de Tendncia

Central e de
Disperso
Prof. Ms. Fbio Cahu
NOTAO

Caracterstica amostra populao

Somatrio de um conjunto de valores


Valores individuais dos dados xi xi
Nmero de valores (tamanho do conjunto) n N

Mdia aritmtica x

Desvio padro s
Varincia s2 2

Range (amplitude) R -
Medidas de Tendncia
Central
Medidas de Tendncia Central

As medidas de tendncia central so valores


calculados com o objetivo de representar os
dados de uma forma ainda mais condensada.
Quando o desejo representar por meio de
um valor nico, determinado conjunto de
informaes que variam, parece razovel
escolher um valor central, mesmo que esse
valor seja uma abstrao. (Callegari-Jacques,
2003)
Mdia Artmtica ()

a mais importante das medidas de tendncia central;


A mdia de um conjunto de nmeros pode ser sempre
calculada;
Para um dado conjunto de nmeros, a mdia nica;
sensvel (ou afetada) a todos os valores do conjunto. Assim
se um valor se modifica, a mdia tambm se modifica;
Somando-se ou reduzindo-se uma constante a cada valor do
conjunto, a mdia ficar aumentada ou reduzida dessa
constante: (x k) = (x) k;
Multiplicando-se ou dividindo-se cada valor do conjunto por
uma constante, a mdia ficar multiplicada ou reduzida por
essa constante: (x .\ k) = (x) .\ k
Mdia Aritmtica

Corresponde ao somatrio de Mdia = x


um conjunto de valores dividido n
pelo nmero destes valores. n = nmero de amostras

x Mdia de um conjunto de
x =
n valores amostrais.

x Mdia de todos os valores de


= uma populao.
N

Obs.: A mdia nos d uma ideia de onde os valores do meu conjunto de


dados tende a se concentrar.
Mdia Ponderada ( p)

Notao

x1 p1 x2 p2 ... xn pn
xp p1, p2....pn so os pesos
p1 p2 ... pn
n

x i pi
xp i 1
n

p
i 1
i
Mediana ()

A Mediana de um conjunto de valores o valor do meio
desse conjunto, quando estes esto em ordem crescente.
Divide um conjunto de dados ordenados em dois grupos
iguais.
Exerccio
Dado o conjunto de 11 dados: 3, 7, 5, 5, 1, 9, 15, 13, 17, 13, 17
Calcule a mediana. Valor central = mediana

Conjunto dados
1, 3, 5, 5, 7, 9, 11, 13, 13, 15, 17
ordenados

5 dados 5 dados
Mediana ()

Conjunto de valores pares ( n = par)

~ ( xn 2 x( n 2 ) 1 )
x exemplo 5, 7, 10, 11 n=4
2

~ ( x4 2 x( 4 2 ) 1 ) ( x2 x3 ) 7 10
x 8,5
2 2 2
Conjunto de valores impares (n = impar)
exemplo 5, 7, 10, 11, 14 n=5
~ ( x( n 1) 2 )
x ~x = x (5+1)/2 = x3
~
x x3 10
Mdia Aritmtica x Mediana

Salrio dos funcionrios de um restaurante


200 250 250 300 450 460 510
200, 250, 250, 300, 450, 460, 510 x 345,7
7
A mdia de 345,7 sintetiza razoavelmente o conjunto de dados (salrios)

Salrio dos funcionrios incluindo o gerente 200, 250, 250, 300, 450, 460, 2300
200 250 250 300 450 460 2300
x 601,4
7
A mdia de 601,4 no sintetiza razoavelmente o conjunto de dados
Nos dois casos a mediana 300. Para o segundo caso a mediana
representa melhor o conjunto de dados.
Num conjunto de dados fortemente desviado, a mediana uma medida
mais representativa (distribuio de rendas, folha de pagamentos)
Moda (Mo)
A Moda de um conjunto de valores o valor que apresenta maior
freqncia em um conjunto de observaes.
o valor ou classe de maior freqncia num conjunto de dados.
- pode no existir
- pode no ser nica
Exerccio : Dado o conjunto de dados 10, 10, 11, 14, 15, 16, 17, 18, 18.
Calcule a moda.
A moda constituda de dois valores: MO = 10 e 18 (duas vezes cada)
Medidas de Tendncia Central - Comparao
medida definio quo existncia consider afetada vantagens e
freqent a todos pelos desvantagens
e valores valores
? extremos
mdia mdia existe sim sim muito utilizada
x mais sempre em estatstica
x= n
familiar
mediana Valor usada existe no no costuma ser
mdio sempre boa escolha se
h valores
extremos

moda valor usada s pode no no no apropriada para


mais vezes existir; dados ao nvel
freqente pode ter nominal
mais de
uma moda
Medidas de Disperso
MEDIDAS DE DISPERSO

Medidas de tendncia central fornecem um


resumo parcial das informaes de um conjunto de
dados. A necessidade de uma medida de variao
aparente, para que nos permita, por exemplo,
comparar conjuntos diferentes de valores. Algumas
caracterstica desta medida devem ser atendidos
como veremos a seguir.
MEDIDAS DE DISPERSO
Amostragem A: 8, 8, 9, 10, 11, 12, 12
Mdia 10; Mediana 10 e Bimodal (8, 12)
Amostragem B: 5, 6, 8, 10, 12, 14, 15
Mdia 10; Mediana 10 e sem Moda
Amostragem C: 1, 2, 5, 10, 15, 18, 19
Mdia 10; Mediana 10 e sem Moda
As medidas de tendncia central pouco ou nada informam a
respeito da disperso dos dados
O conceito de medida de disperso relativamente difcil. O
quanto informativo dizer que as trs amostragens possuem
disperso 4, 10 e 18 (Y7-Y1)?
MEDIDAS DE DISPERSO
Amostragem D: 8, 9, 10, 10, 10, 11, 12
Mdia 10; Mediana 10 e Modal 10
Amostragem E: 5, 7, 9, 10, 11, 13, 15
Mdia 10; Mediana 10 e sem Moda
Amostragem F:1, 5, 8, 10, 12, 15, 19
Mdia 9; Mediana 10 e sem Moda
Estes trs conjuntos de dados tambm possuem disperso mxima
igual a 4, 10 e 18, respectivamente. As amostras A, B e C
apresentam um maior nmero de observaes mais distantes da
mdia, enquanto nas amostras D, E e F ocorre um maior nmero
de observaes concentradas em torno da mdia. Torna-se
interessante que haja uma definio a qual use todas as
observaes e que seja um pequeno valor quando as observaes
se aproximam da mdia e grande quando estas so espaadas.
MEDIDAS DE DISPERSO

Por fim considere os dados destas duas amostras:


Amostra A: 5, 6, 8, 10, 12, 14, 15
Amostra B: 105, 106, 108, 110, 112, 114, 115
A disperso (Y7-Y1) igual nas duas amostra e, portanto, independe
do tamanho dos nmeros.
MEDIDAS DE DISPERO
O critrio geralmente utilizado aquele que mede a concentrao dos
dados em torno da mdia, e algumas medidas so as mais usadas: desvio
mdio, varincia, desvio padro e Coeficiente de Variao.
Ex: 3, 4, 5, 6, 7 (mdia 5), os desvios xi-x, so: -2, -1, 0, 1 ,2.
1, 3, 5, 7, 9 (mdia 5), os desvios xi-x, so: -4, -2, 0, 2, 4.
fcil observar que a soma dos desvios igual a zero, o que torna
invivel esta medida. As opes so:
a)Considerar o total dos desvios em valor absoluto (mdulo) ou,
b)Considerar o total dos quadrados dos desvios. Assim teramos:
Para a amostra: 3, 4, 5, 6, 7
5

n
i 1
i xi x 2 1 0 1 2 6 (a)

n x
5 2

i i x 4 1 0 1 4 10 (b)
i 1
DESVIO MDIO (DM)
O desvio mdio (DM) refere-se mdia dos desvio em valor
absoluto, como na frmula a seguir, aplicada a amostra 3, 4, 5,
6, 7.

DM
x x
i

n
usando o exemplo anterior DM(x) = 6/5 = 1,2

Para a amostra 1, 3, 5, 7, 9 teramos:

DM
x x , DM(x) = 12/5 = 24
i

n
Baseado nos dados, pode-se dizer que a primeira amostra mais
homognea.
DESVIO MDIO (DM)

Exerccio: Calcule o DMA do conjunto de dados 2, 4, 6, 8, 10. Calcular


o desvio mdio.

X= (2 +4 +6 +8 +10) / 5 = 6

Xi - X
26= -4
46= -2
DM
x x i
66= 0 n
86= 2
10 6 = 4 DM = (4 +2 +0 +2 + 4 ) / 5 = 2,4
soma 0
VARINCIA (2 ou s2)
A medida que contempla os aspectos apresentados e que mais utilizada a
Varincia. A varincia representada por dois smbolos: 2 (letra grega
sigma) para populao e s2 para uma amostra. As frmulas para a varincia
da populao e da amostra so apresentadas abaixo.
k

n xi )
i
2

Populao: 2 i 1
n
k

Amostra: n i x i x ) 2

s2 i 1
n 1

O denominador n-1 tem o propsito de tornar a varincia da amostra a


estimativa da varincia da populao. n-1 conhecido como grau de
liberdade e refere-se ao nmero de somas independentes lineares numa
soma de quadrados.
A varincia uma medida que expressa um desvio quadrtico mdio. A
unidade da varincia portanto o quadrado dos dados originais. Ex: para
dados expressos em centmetros a varincia ser expressa em centmetros
quadrados.
VARINCIA (2 ou s2)

Para as amostras 3, 4, 5, 6, 7 e
1, 3, 5, 7, 9
As varincias seriam:
S12 = (3-5)2+ (4-5)2 + (5-5)2+ (6-5)2+ (7-5)2/4 S12 =2,5

S22 = (1-5)2+ (3-5)2+ (5-5)2+ (7-5)2+ (9-5)2/4 S22 =10

A amostra 3, 4, 5, 6, 7 mais homognea.


VARINCIA (2 ou s2)

Exerccio: Calcule a varincia da amostra 2, 4, 6, 8, 10.

A mdia desse conjunto 6.


xi x x i- x (x i - x ) 2 k

2 6 -4 16 n i x i x ) 2
40
6 -2 4 s2 i 1
10
4 n 1 5 1
6 6 0 0
8 6 +2 4
10 6 +4 16 Se esses valores representassem
somas 0 40 toda a populao (2), a varincia
seria 40/5 = 8.
VARINCIA (2 ou s2)

Mdia = (0*4)+(1*5)+(2*7)+(3*3)+(5*1))/20=1,65

DM(x) = 4*(0-1,65) + 5* (1-1,65) + 7* (2-1,65) + 3* (3-1,65) + 1* (5-1,65)/20 = 0,98

Varincia S2 = 4*(-1,65)2 + 5* (-0,65)2 + 7* (0,35)2 + 3* (1,35)2 + 1* (3,35)2/19 = 1,6


DESVIO PADRO ( OU s)
Sendo a varincia uma medida que expressa um desvio quadrtico mdio, esta
pode causar alguns problemas de interpretao. Para evitar isto, costuma-se usar
o desvio padro, que definido como a raiz quadrada positiva da varincia. Desta
forma, tem-se uma medida de variabilidade expressa na mesma unidade dos
valores do conjunto de dados. O desvio padro (, para populao e s para
amostras) pode ser calculado atravs das seguintes frmulas:

1
k
ni xi 2
s 1
k
ni xi x 2

n n 1

O DESVIO PADRO DAS AMOSTRAS 3, 4, 5, 6, 7 e 1, 3, 5, 7, 9 seria:


S1= 2,5 =1,58 S2= 10 =3,16
DESVIO PADRO ( OU s)

O desvio padro a medida de disperso mais usada. Quanto maior


o desvio padro maior a disperso dos dados em torno da mdia.

emtodosos casos temos 7 medidas


s=0
7
6 com mdia X 4
5
4
s = 0,8 s = 1,0 s=3
3
2
1
0
1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

O desvio-padro cresce quando a disperso dos dados aumenta


COEFICIENTE DE VARIAO (CV)
A variao ou disperso real, determinada a partir do desvio
padro, ou qualquer outra medida de disperso,
denominada disperso absoluta. Entretanto, uma variao
ou disperso de 10 cm, na medida de uma distncia de 1.000
m, inteiramente diferente, quanto ao efeito, da mesma
variao em uma distncia de 20 cm. A medida desse efeito
proporcionada pela disperso relativa, definida por:
Disperso relativa = Disperso absoluta/mdia
Se a disperso absoluta o desvio padro s e a mdia a
aritmtica, a disperso relativa denominada Coeficiente de
Variao ou de Disperso.

s
CV 100
x
COEFICIENTE DE VARIAO (CV)

O coeficiente de variao geralmente expresso em


percentagem. O C.V. independente das unidades
adotadas. Por essa razo, vantajosa para a
comparao de distribuies cujas unidades podem
ser diferentes. Uma desvantagem do C.V. que ele
deixa de ser til quando a mdia esta prximo de
zero.
Baixa disperso: CV 15%
Mdia disperso: CV 15-30%
Alta disperso: CV 30%
ERRO PADRO DA MDIA
(Sx)
Quando se obtm uma amostra aleatria de
tamanho n, estima-se a mdia populacional.
bastante intuitivo supor que se uma nova amostra
aleatria for realizada a estimativa obtida ser
diferente daquela primeira. Desta forma, reconhece-
se que as mdias amostrais esto sujeitas variao
e formam populaes de mdias amostrais, quando
todas as possveis amostras so retiradas de uma
populao.
O erro padro analisa a variabilidade de uma mdia
Erro padro
Fornece um mecanismo de medir a preciso com que a mdia
populacional foi estimada

S
Sx
n
Exerccios
Dada a tabela abaixo, calcule:
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97

Desvio mdio, Varincia, Desvio padro, Coeficiente


de variao e erro padro da mdia

Você também pode gostar