Você está na página 1de 38

Estatstica

1 Medidas de Tendncia Central 2 Medidas de Posio 3 Medidas de Disperso

Renata Souza

Medidas
Depois que voc conheceu os conceitos de coleta de dados, variao, causas comuns e causas especiais, chegou a hora de estudarmos algumas formas de medir os resultados. Para melhor interpretar os resultados obtidos com uma amostra, so definidas algumas medidas:
medidas de posio central medidas de posio medidas de disperso.

Medidas de Tendncia Central


Mostram a tendncia dos pontos se concentrarem em torno de um determinado valor

Medidas de Tendncia Central


H vrias medidas de tendncia central. Entre elas citamos a mdia aritmtica, a mediana, a mdia harmnica, geomtrica, etc. Cada uma dessas medidas apresenta vantagens e desvantagens, e a escolha depende dos objetivos desejados.

Mdia Aritmtica
A mdia aritmtica, ou simplesmente mdia, de um conjunto de n valores x1, ..., xn definida como: x1 + ... + xn 1 n X= = xi n n i =1 As letras gregas so usadas para representar parmetros populacionais e as letras comuns parmetros amostrais. A mdia de uma amostra representada por X e mdia de uma populao representada pela letra grega . Exemplo: A mdia aritmtica de 7,5 7,9 8,1 8,2 8,7
7,5 + 7,9 + 8,1 + 8,2 + 8,7 X= = 8,08 5

Mdia Aritmtica Ponderada


Algumas vezes associa-se a cada observao um peso Wi. onde esse peso representa a importncia atribuda a cada observao. Nesse caso a mdia ponderada calculada n como: wi xi w1x1 + .... + wn xn i =1 X= = n w1 + .... + wn wi
i=1

Exemplo: O exame de seleo pode ser composto de trs provas onde as duas primeiras tem peso 1 e a terceira tem peso 2. Um candidato com notas 70 75 e 90 ter mdia final:
1(70) + 1(75) + 2(90) X= = 81,25 4

Mediana
Dado um conjunto de valores em ordem crescente, a mediana definida como:
Se n impar, o valor central; Se n par, a mdia simples dos dois valores centrais. Exemplos Exemplo 1: Na amostra 25 26 26 28 30 a mediana

~ = 26 x
Exemplo 2: Na amostra 71 73 74 75 77 79 a mediana

~ = (74 + 75) = 74,5 x 2

Moda
A moda o valor que ocorre com maior freqncia, ou seja, o valor mais comum.
Exemplos Exemplo 1: A amostra 23 25 25 26 26 26 27 29 tem moda 26. Exemplo 2: A amostra 71 73 73 75 76 77 77 79 81 tem moda 73 e 77. A moda pode ser mltipla ou pode no existir.

Relaes Empricas entre Mdia, Moda e Mediana


Para distribuies simtricas a mdia, a mediana e a moda coincidem aproximadamente. Para distribuies assimtricas observa-se o seguinte:

Relaes Empricas entre Mdia, Moda e Mediana


Exemplo A relao entre mdia e mediana para as amostras a seguir
A B C Distribuio simtrica Distribuio assimtrica direita Distribuio assimtrica esquerda 10 12 14 16 18 10 12 14 16 23 05 12 14 16 18
x = 14 = ~ = 14 x x = 15 > ~ = 14 x x = 13 < ~ = 14 x

Comparao entre Mdia, Moda e Mediana


Quo freqente?
Mdia: mais familiar Mediana: usada comumente Moda: usada s vezes

Existncia
Mdia: existe sempre. Mediana: existe sempre. Moda: pode no existir; pode haver mais de uma moda

Afetada pelos extremos?


Mdia: sim Mediana: no Moda: no

Comparao entre Mdia, Moda e Mediana


Vantagens e desvantagens:
Mdia: funciona bem com muitos mtodos estatsticos Mediana: costuma ser uma boa escolha se h alguns valores extremos. Moda: apropriada para dados ao nvel nominal

Mdia Geomtrica (G)


a raiz de ordem n do produto dos valores da amostra:

G = n X 1X2 .... X n

Exemplo A mdia geomtrica de 12 14 16 :


G = 3 12 14 16 = 13,90

usada em administrao e economia para achar taxas mdias de variao, de crescimento, ou razes mdias

Mdia Harmnica (H)


o inverso da mdia aritmtica dos inversos das observaes. n 1
H= 1 1 n Xi = 1 Xi
3 H= = 13,81 1 1 1 + + 12 14 16

Exemplo A mdia harmnica de 12 14 16 :

Relao entre Mdia Aritmtica, Geomtrica e Harmnica:


A mdia geomtrica e a mdia harmnica so menores, ou no mximo igual, mdia aritmtica. A igualdade s ocorre no caso em que todos os valores da amostra so idnticos. Quanto maior a variabilidade, maior ser a diferena entre as mdias harmnica e geomtrica e a mdia aritmtica.

HG X

Exemplo: Para a amostra 12 14 16 tem-se H = 13,81 < G = 13,90 < X = 14,00

Comparao Mdia Aritmtica e Mdia Harmnica

O grfico abaixo mostra uma simulao comparativa entre a Mdia Harmnica e a Mdia Aritmtica, calculadas para cinco avaliaes, onde as notas de quatro avaliaes correspondem a 6,0 e a nota da 5 avaliao varia de 0 a 10.

Medidas de Disperso
Invariavelmente as observaes individuais iro apresentar alguma disperso em torno do valor mdio. Isso chamado de variabilidade ou disperso dos dados. H muitas medidas de variabilidade, como por exemplo, a amplitude total, o desvio padro, a amplitude inter-quartlica ou o coeficiente de variao. Os valores mnimos e mximos tambm podem ser usados como medidas de variabilidade

Amplitude total
definida como a diferena entre o maior e o menor valor das observaes. Exemplo : 8,5 8,7 8,9 10,1 10,5 10,7 11,5 11,9 A amplitude total: R = 11,9 - 8,5 = 3,4 A amplitude fcil de calcular e fornece uma idia da magnitude da faixa de variao dos dados. No informa a respeito da disperso dos valores que caem entre os dois extremos.

Desvio Padro
Para uma amostra de n observaes, x1, ..., xn , o desvio padro S definido como: ( xi x )2
S= n 1

A vantagem do desvio padro que trata-se de uma medida de variabilidade que leva em conta toda a informao contida na amostra. O desvio-padro de uma populao representado por e o desvio padro de uma amostra por S.

Medidas de Disperso

As medidas mais utilizadas para representar a disperso a VARINCIA e o DESVIO PADRO. Uma dificuldade que a varincia no expressa nas mesmas unidades dos dados originais.

Desvio Padro
Exemplo: para a amostra 10 12 14 16 18 A mdia x = 14 e o desvio-padro calculado: Os desvios de cada valor em relao mdia totalizam zero pois a mdia o valor central:
10 14 = 4 12 14 = 2 14 14 = 0 16 14 = +2 18 14 = +4

(10 14)2 + (12 14)2 + (14 14)2 + (16 14)2 + (18 14)2 S= = 3,16 n 1

Varincia
A varincia S2 definida como o quadrado do desvio padro.
S2 =

(x i x )2
n 1

A varincia de uma populao representada pela letra grega 2. A varincia o quadrado do desvio padro, ou seja, 2 =3,16 2 = 9,98

Amplitude Inter-quartlica
definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou seja:

Q = Q3 Q1

s vezes tambm usada a semi-amplitude interquartlica, que a metade da anterior. Trata-se de uma medida de variabilidade bastante robusta, que pouco afetada pela presena de dados atpicos. A amplitude inter-quartlica guarda a seguinte relao aproximada com o desvio padro: Q = (4/3) x desvio padro

Coeficiente de Variao
definido como o quociente entre o desvio padro e a mdia e, em geral, expresso em percentual.

S CV = 100 X

O coeficiente de variao uma medida dimensional, til para comparar resultados de amostras ou populaes cujas unidades podem ser diferentes. Uma desvantagem do coeficiente de variao que ele deixa de ser til quando a mdia prxima de zero.

Medidas de Posio: Quartis


Tanto a mdia como o desvio padro podem no ser medidas adequadas para representar dados, pois: So afetadas por valores extremos Apenas com estes dois valores no temos idia da simetria ou assimetria da distribuio dos dados Se um conjunto de dados organizado em ordem crescente, o valor central a mediana. Valores que dividem o conjunto em quatro partes iguais so representados por Q1, Q2, Q3 e denominam-se primeiro, segundo e terceiro quartis, respectivamente. Q1 separa os 25% inferiores dos 75% dos superiores. Q2 a mediana. Q3 separa os 75% inferiores dos 25% dos superiores. Resumo dos cinco nmeros: Q1, Q2, Q3 e os valores mnimo e mximo.

Relaes
1o quartil = 25o percentil Mediana = 5o decil =50o percentil 3o quartil = 75o percentil

Clculo do k simo percentil


Ordenar os dados do menor para o maior Calcular:
L=(k/100)n n=nmero de valores k=percentil desejado

Se L no inteiro: arredonde L para o prximo inteiro acima dele. Pk L-simo valor da lista ordenada.

Quartis: Exemplo
Exemplo: Para a amostra a seguir calcular o primeiro e terceiro quartis:
13,3 13,5 17,2 13,8 12,3 12,7 13,0 14,5 14,9 15,8 13,1 13,3 14,1
x(i) 12,3 12,7 13,0 13,1 13,3 13,3 13,5 13,8 14,1 14,5 14,9 17,2 i 1 2 3 4 5 6 7 8 9 10 11 13

Exemplo: Quartis
1o quartil = 25o percentil
L=(25/100)13=3,25 L=4 P25=Q1=13,1

3o quartil = 75o percentil


L=(75/100)13=9,25 L=10 P25=Q3 =14,5

Percentis: Dados agrupados


Pi
in 100 Pi = l Pi + f Pi f h

i {1,2,3,4,5,6,...,99,100} lPi - limite inferior da classe de Pi f - soma das freqncias anteriores a classe de Pi h amplitude da classe de Pi fPi freqncia da classe Pi

Percentis: Exemplo com dados agrupados


Intervalos de classe Freqncia absoluta Freqncia absoluta

12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50

3 8 15 13 9 2

0,06 0,22 0,52 0,78 0,96 100,00

1o quartil = 25o percentil


25 50 11 1,01 100 P25 = 14,51 + = 14,51 + 0,1 = 14,52 15

Varivel Reduzida ou Padronizada


XX Z= S
Ela mede a magnitude do desvio em relao mdia, em unidades do desvio padro. Z = 1,5 significa uma observao desviada 1,5 desvios padro para cima da mdia. A varivel reduzida muito til para comparar distribuies e detectar dados atpicos. Dados so considerados atpicos quando Z > 3.

Exemplo
O engenheiro est analisando as espessuras de peas fabricadas em duas mquinas de corte. O operador mediu uma pea da mq. A com espessura de 90 mm e outra pea da mq. B com espessura de 100 mm. engenheiro deve considerar esses dados reais ou atpicos? A mq. A possui mdia 51mm e desvio-padro de 12mm.
Mq. A Z =
X X 90 51 = = 3,25 S 12

Como Z > 3 dado atpico

A mq. B possui mdia 72mm e desvio-padro de 16mm.


Mq. B
Z= X X 100 72 = = 1,75 16 S

Como Z < 3 no dado atpico

Exemplo
Supondo que 51 fosse a mdia em uma prova de ingls, onde o desvio padro 12, para um candidato que obtivesse 90 acertos tem-se:

X X 90 51 Z= = = 3,25 12 S
Conclui-se que na prova de ingls este candidato est 3,25 desvios-padro acima da mdia.

Medidas de assimetria e curtose


As caractersticas mais importantes so o grau de deformao ou assimetria e o grau de achatamento ou afilamento da curva de freqncias ou do histograma, chamado curtose.

Assimetria: skewness
Coeficiente = 0 (Simtrica) Coeficiente > 0 (Assimetria positiva) Coeficiente < 0 (Assimetria negativa)

S1

Mdia=Mediana=Moda

Moda < Mediana < Mdia

Moda > Mediana> Mdia

Clculo da assimetria
Conhecido como primeiro coeficiente de assimetria de Pearson S: desvio padro amostral Mo: moda X : mdia Assimetria assume valores entre -1 e +1

X Mo Sk = S

Curtose: kurtosis
Coeficiente de curtose de Pearson

a4 = m4/s4, onde m4 = (X a4 = 3 (Mesocrtica) a4 > 3 (Leptocrtica) a4 < 3 (Platocrtica)

x )4/n

A distribuio normal tem curtose igual a 3

Você também pode gostar