Escolar Documentos
Profissional Documentos
Cultura Documentos
Biometria - EDAP
Descrio de amostras
(Leitura complementar ao captulo 1)
Sumrio:
Desvio Padro
Mdia
Mdia e mediana
Mdia, varincia e DP em dados classificados
Mediana
Medidas de disperso
Medidas de tendncia central
Medidas Separatrizes
Moda
Varincia
Mdia
H vrios tipos de mdia (aritmtica - simples ou ponderada, geomtrica, harmnica,
quadrtica, cbica, biquadrtica).
A mais usada a mdia aritmtica simples ou, simplesmente, mdia, que obtida dividindo-se
a soma das observaes pelo nmero delas. um quociente geralmente representado pela letra
M ou pelo smbolo (l-se "x barra").
= / N = 664 / 50 = 13,28
Para saber como efetuar os clculos no BrOffice.org Calc, quando se tem todos os dados
individuais, clicar aqui.
Lembrar que refere-se mdia da amostra (com n elementos) e deve ser distinguida da
mdia da populao, (com N elementos).
dev
4 1 4
5 1 5
6 3 18
7 3 21
8 2 16
9 5 45
10 4 40
11 1 11
12 5, sub total: 25 60
13 4 52
14 2 28
15 5 75
16 1 16
17 1 17
18 1 18
19 3 57
20 2 40
21 1 21
22 1 22
23 1 23
24 1 24
25 1 25
26 1 26
Totais 50 664
f = N fx
Mdia: 664/50 13,28
Mediana
A mediana ocupa a posio central de uma srie de dados ordenados.
o prprio valor central se a srie for impar ou
a mdia aritmtica dos dois valores centrais quando a sequncia for par.
absolutamente necessrio que os valores estejam dispostos em ordem (crescente ou
decrescente) de magnitude. Ou seja, a mediana divide os dados: 50% dos valores esto abaixo e
50% esto acima da mediana.
Portanto, mediana o valor que divide uma srie ordenada de modo que pelo menos a metade
das observaes sejam iguais ou maiores do que ela, e que haja pelo menos outra metade de
observaes maiores do que ela.
Chama-se de EMd o elemento mediano, aquele que indica a posio da mediana.
Mi
0---------------Q1---------------Q2---------------Q3--------------Q4
A mediana representada pelo smbolo Mi e, evidentemente, coincide com o segundo quartil
(Q2).
Na amostra acima, em que h 50 valores a mediana a mdia dos 2 valores centrais (12 e 13)
portanto 12,5.
Mdia e Mediana
Como se pode interpretar a Mediana e a Mdia?
preciso lembrar , primeiramente, que a Mediana pode ser usada tanto para variveis
quantitativas intervalares como para variveis qualitativas ordinais, enquanto a Mdia s pode ser
utilizada para variveis intervalares.
Em segundo lugar, no caso das variveis quantitativas, embora a Mdia seja um valor mais
fcil de entender, tem o defeito de nos induzir em erro se a amostra contiver valores muito
extremos.
Por exemplo, supondo uma amostra A em que foi estudada a idade de 7 indivduos (1 a 7), em
meses.
Mas, se o ltimo elemento for 350, ao invs de 70, seria obtida a amostra B:
Moda
o valor amostral que tem a maior frequncia, ou seja, o encontrado em maior nmero de
vezes, portanto, a observao mais "provvel" da distribuio dos dados. representada pela
notao Mo e tambm chamada de "Modo".
Portanto, numa amostra a moda pode no existir. E uma distribuio em que no h elementos
repetidos dita amodal.
Tambm deve-se considerar que a moda pode no ser nica. Se dois valores aparecem em
igual quantidade de vezes a distribuio dita bimodal. Para trs valores, trimodal, e assim,
sucessivamente.
Importante notar que se existe apenas uma moda em uma amostra, h apenas um grupo de
indivduos com suas variaes, ou seja, a amostra homognea.
Mas, se houver duas ou mais modas, h grupos diferentes dentro daquela amostra. Diz-se,
ento, que a amostra heterognea.
Verifica-se qual a classe que tem a maior frequncia. Essa classe se constitui na moda.
Se os dados esto agrupados a moda o ponto mdio da classe que tem a maior
frequncia.
Note-se que uma amostra pode ter uma moda ou mais (diz-se que a curva unimodal,
bimodal, trimodal...)
Processo emprico
Em distribuies moderadamente assimtricas pode ser usada a frmula de Pearson,
sendo que:
Mo = 3 Mi - 2M
Como a mdia = x / N = 664 / 50 = 13,28.
Portanto, Mo = 3 . 13,25 - 2 . 13,28 = 39,75 - 26,56 = 13,19
Processo grfico
Usa-se o histograma gerado pelos dados, passando-se dois segmentos de reta entre o
vrtice esquerdo da maior coluna e o vrtice direito da coluna seguinte e entre o vrtice
direito da maior coluna e o vrtice esquerdo da coluna anterior. No ponto onde as retas se
cruzam traa-se uma perpendicular abcissa e o valor encontrado no eixo dos X a
moda.
Portanto, Q2, D5 e P50 correspondem mediana, da mesma forma que P25 e P75
correspondem a Q1 e Q3, respectivamente.
Medidas de disperso
Variao ou disperso o grau com que os dados numricos tendem a se espalhar em torno
de um valor mdio. Ou seja, medidas de disperso so indicadores do grau de variabilidade
demonstrada pelos indivduos em torno das medidas de tendncia central.
Para estudar a variao h vrias medidas j definidas. Dentre elas destacam-se a varincia e
o desvio padro.
Varincia
A varincia, representada por s2, e definida como o "desvio quadrtico mdio da mdia".
Note-se que como a varincia mede os desvios em relao mdia (ou seja, a diferena entre
cada dado e a mdia) e avalia o grau de disperso de um conjunto de dados.
Considere 3 amostras, A, B e C, com mdias iguais, em que o comprimento de um rgo (em
mm) foi anotado.
soma mdia
A 160 162 165 168 172 175 1002 167
B 160 161 162 168 170 173 175 1169 167
C 160 162 163 164 165 167 170 171 173 175 1670 167
(x ) (x )2 (x ) (x ) (x )2
((x )2
175 8 64 170 3 9
171 4 16
173 6 36
175 8 64
Ressalte-se que apesar da disperso dos dados em torno da mdia ser a mesma nos 3 grupos,
a soma dos quadrados dos desvios (x )2 maior no grupo C, pois o que possui maior
nmero de dados.
Mas, para medir a disperso dos dados em relao mdia, deve-se usar a varincia, ( s2),
pois o valor obtido leva em considerao o tamanho da amostra.
Frmulas
Considerando uma srie de N valores de uma varivel x ( x1, x2, x3, x4, ... xn ), com mdia ,a
varincia pode ser determinada por:
s2 = ( xi )2 / (N - 1)
s2 = (xi2) - N 2 / (N - 1)
s2 = x2 - [(x)2 / N] / (N - 1)
Assim, a varincia a medida que se obtm somando os quadrados dos desvios das
observaes da amostra, relativamente sua mdia, e dividindo pelo nmero de observaes da
amostra menos um.
importante notar que:
a varincia nunca negativa, porque os quadrados so sempre positivos ou nulos. Assim,
a unidade de varincia o quadrado da unidade de observao. (Exemplo: a varincia de
um conjunto de alturas medidas em centmetros ser dada em centmetros quadrados).
se todas as mdias das amostras forem iguais, o valor da varincia da mdia seria igual a
zero.
quanto maior for a varincia menor o grau de concentrao dos indivduos na amostra
Exemplo:
Apenas como exemplo, suponha que duas amostras apresentaram os seguintes valores de
largura de um rgo, em cm:
A = 8, 10, 12, 14 e 16 e
B = 4, 8, 12, 16 e 20
Amostras A B
x x2 x x2
8 64 4 16
10 100 8 64
12 144 12 144
14 196 16 256
16 256 20 400
Total 60 760 60 880
Varincia A
s2A = x2 - [(x)2 / N] / (N - 1) = [760 - (602 / 5)] / 4 =
= (760 - 720) / 4 = 10
Varincia B
s2B = x2 - [(x)2/ N] / (N - 1)
= [880 - (602 / 5)] / 4 = (880 - 720) / 4 = 40
Notar que na amostra A os indivduos esto mais concentrados, distribuindo-se entre o valor
mnimo = 8 e o mximo = 16
E, na amostra B esto mais dispersos (distribuindo-se ente 4 e 20).
Assim, na amostra A a varincia ( s2A = 10) menor que a da B ( s2B = 40).
Exerccio
Acessar a lista de exerccios 1g. Responder a questo 6.
Desvio Padro
O desvio padro obtido simplesmente encontrando-se a raiz quadrada do valor obtido para a
varincia. representado por s.
Utilizando os dados do exemplo anterior:
Limites f
Como seria possvel calcular,
4a7 0 a partir apenas desses dados:
8 a 11 2
12 a 15 1 a. mdia
b. varincia
16 a 19 3
c. desvio padro
20 a 23 8
24 a 27 11
H um mtodo fcil. Primeiramente, calcula-se o valor central de cada intervalo de classe (x).
E calcula-se:
Mdia = M fx / n = 537,50 / 25 = 21,50
2 2 2
Varincia = s = fx - [(fx) / N]} / (N - 1) = [12132,25 - (537,502 / 25)] / 24 = 24,00
Desvio padro = s = raiz s2 = raiz 24,00 = 4,8990
C=s/
Simetria e Assimetria
As distribuies de frequncias no diferem apenas quanto ao valor mdio e variabilidade.
Deve-se considerar tambm a sua forma, que pode ser simtrica ou assimtrica. Assim, uma das
caractersticas mais importantes de uma distribuio de frequncias a simetria ou a falta dela.
Simetria: diz-se que uma distribuio de frequncias simtrica quando a mdia, mediana e
moda so iguais, ou seja, coincidem num mesmo ponto, apresentando o mesmo valor.
Assimetria: J, quando a mdia, mediana e a moda apresentam valores diversos, caindo em
pontos diferentes da distribuio, diz-se que a distribuio de frequncias assimtrica.
O deslocamento desses pontos pode acontecer para a direita ou para a esquerda. Portanto,
quanto ao grau de deformao, uma curva de frequncia de uma distribuio unimodal pode ser:
Simtrica
Assimtrica Positiva
Assimtrica Negativa
de probabilidade:
Sub-rea da curva
1 1s 68,26 %
2 2s 95,44 %
3 3s 99,74%
(Se desejar saber como esses valores de probabilidade foram obtidos, clicar aqui).
Importante notar que ao estudar uma varivel com distribuio normal em duas ou mais
amostras em geral necessrio saber se uma amostra difere significativamente das outras, ou
seja, se elas podem ser consideradas como extradas da mesma populao.
Como a distribuio normal determinada pela mdia e desvio padro (ou varincia) bvio
que se as mdias e varincias de 2 ou + amostras no diferirem significativamente pode-se
aceitar que elas foram extradas da mesma populao.
Assimetria
A assimetria, representada pela notao "As" caracterstica das distribuies deformadas.
Pearson props a seguinte frmula de clculo:
As = ( - Mo) / s
Exemplo:
Usando os dados numricos anteriores e sabendo-se que o desvio padro 5,58, calcule a
simetria
As = (13,28 -13,19) / 5,58 = 0,0161
Este "site", destinado prioritariamente aos alunos de Ftima Conti, pretende auxiliar quem
esteja comeando a se interessar por Bioestatstica, computadores e programas, estando em
permanente construo. Sugestes e comentrios so bem vindos. Agradeo antecipadamente.
____
Endereo dessa pgina:
HTML: http://www.cultura.ufpa.br/dicas/biome/bioamos.htm
PDF: http://www.cultura.ufpa.br/dicas/biopdf/bioamos.pdf
ltima alterao: 24 mar 2011 (Solicito conferir datas. Pode haver atualizao s em HTML).