Você está na página 1de 12

DISTRIBUIES NORMAIS

As distribuies normais ocupam posio proeminente tanto na estatstica terica como na


aplicada, por vrias razes. Uma delas que, com bastante frequncia, elas representam, com boa
aproximao, as distribuies de frequncias observadas de muitos fenmenos naturais e fsicos.
Outra razo que as normais servem como aproximao de probabilidades binomiais, quando n
grande. Todavia, o motivo mais importante da proeminncia da distribuio normal que as
distribuies tanto das mdias como das propores em grandes amostras tendem a ser distribudas
normalmente, o que tem relevante implicao na amostragem.
As distribuies normais foram descobertas no sculo XVIII. Astrnomos e outros
cientistas observaram, no sem certa surpresa, que mensuraes repetidas de uma mesma
quantidade (como a distncia da Lua ou a massa de um objeto) tendiam a variar, e quando se
coletava grande nmero dessas mensuraes, dispondo-as num distribuio de frequncia, elas se
apresentavam repetidamente com uma forma anloga da Figura 1. E como essa forma grfica
vinha associada aos erros de mensurao, a nossa distribuio cedo comeou a ser conhecida como
distribuio normal dos erros, ou simplesmente distribuio normal. Constatou-se
subsequentemente que a distribuio podia ser bem aproximada por uma distribuio matemtica
como a da Figura 2. A distribuio normal costuma designar-se tambm pelo nome de distribuio
Gaussiana, em razo da contribuio de Karl F. Gauss (1777-1855) sua teoria matemtica.















Caractersticas das Distribuies Normais
As curvas normais apresentam algumas caractersticas bastante especiais em termos de sua
forma, de como se especificam e de como so utilizadas para obteno de probabilidades.
O grfico de uma distribuio normal se assemelha muito a um sino. suave, unimodal, e
simtrico em relao sua mdia. Menos bvio o fato de que a curva se prolonga indefinidamente
em qualquer das direes, a partir da mdia. Tende cada vez mais para o eixo horizontal medida
que aumenta a distncia a contar da mdia, mas nunca chega a tocar o eixo. Teoricamente, os
valores possveis vo de - a +. Ver a Figura 3.







Outra caracterstica importante que uma distribuio normal fica completamente
especificada por dois parmetros: sua mdia e seu desvio padro. Em outras palavras, existe uma
nica distribuio normal para cada combinao de uma mdia e um desvio padro. Diferentes
combinaes de mdia e desvio padro originam curvas normais distintas. Como mdias e desvios
padres so medidos em escala contnua, segue-se que o nmero de distribuies normais
ilimitado. A Figura 4 ilustra algumas dessas possibilidades.







A rea total sob qualquer curva normal representa 100% da probabilidade associada
varivel. Alm disso, como a curva simtrica em relao sua mdia, a probabilidade de observar
um valor inferior mdia 50%, como tambm a probabilidade de observar um valor acima da
mdia. A probabilidade de predizer exatamente um valor 0, pois a escala de mensurao
contnua. Logo, a probabilidade de observar um valor exatamente igual mdia zero.
A probabilidade de uma varivel aleatria distribuda normalmente tomar um valor entre
dois pontos quaisquer igual rea sob a curva normal compreendida entre aqueles dois pontos.
Ver a Figura 5.







A probabilidade de uma varivel aleatria tomar um valor entre dois pontos quaisquer
igual rea sob a curva normal entre aqueles pontos.
Uma consequncia importante do fato de uma curva normal poder ser completamente
especificada por sua mdia e seu desvio padro que a rea sob a curva entre um ponto qualquer e
a mdia funo somente do nmero de desvios padres que aquele ponto dista da mdia. Esta a
chave que nos permite calcular probabilidades para a curva normal.
Em resumo, eis as caractersticas das curvas normais:
1 A curva normal tem forma de sino
2 simtrica em relao mdia.
3 Prolonga-se de - a +.
4 Cada distribuio normal fica completamente especificada por sua mdia e seu desvio padro; h
uma distribuio normal distinta para cada combinao de mdia e desvio padro.
5 A rea total sob a curva normal considerada com o100%.
6 A rea sob a curva entre dois pontos a probabilidade de uma varivel normalmente distribuda
tomar um valor entre esses pontos.
7 Como h um nmero ilimitado de valores no intervalo de - a +, a probabilidade de uma
varivel aleatria distribuda normalmente tomar exatamente determinado valor
aproximadamente zero. Assim, as probabilidades se referem sempre a intervalos de valores.
8 A rea sob a curva entre a mdia e um ponto arbitrrio funo do nmero de desvios padres
entre a mdia e aquele ponto.


A Distribuio Normal como Modelo
essencial reconhecer que uma distribuio normal uma distribuio terica. Para
mensuraes fsicas grupadas numa distribuio de frequncia, uma distribuio ideal; nenhum
conjunto de valores efetivos se adaptar exatamente a ela. Assim que, por exemplo, os valores
reais no variam entre - e +. E as limitaes do instrumental de mensurao eliminam
efetivamente muitos outros valores potenciais. No obstante, tais deficincias so amplamente
contrabalanadas pela facilidade de utilizao da distribuio normal na obteno de probabilidades,
e pelo fato de que a referida distribuio ainda constitui uma boa aproximao de dados reais.
Assim, quando se diz que uma varivel aleatria (fsica) distribuda normalmente, a afirmao deve
ser interpretada como uma implicao de que a distribuio de frequncia de seus resultados
possveis pode ser satisfatoriamente bem aproximada pela distribuio normal de probabilidades.
Logo, a curva normal um modelo.
A Distribuio Normal Padronizada
A distribuio normal constitui, na realidade, uma famlia infinitamente grande de
distribuies uma para cada combinao possvel de mdia e desvio padro. Consequentemente,
seria intil procurar elaborar tabelas que atendessem a todas as necessidades. Alm disso, a
expresso da distribuio normal no conveniente para tal objetivo, em vista de sua
complexidade.* H, entretanto uma alternativa bastante simples que contorna o problema.
Conceitualmente anloga determinao de probabilidades no caso do ponteiro. Vimos ali que
o tamanho do crculo no influa; era a forma que o interessava. Desde que considerssemos a rea
total do crculo como 100%, qualquer tamanho de crculo daria exatamente as mesmas
probabilidades. Isto o que se passa com a distribuio normal: o fato de considerarmos a rea total
sob a curva como 100% padroniza a curva.
Se uma varivel tem distribuio normal, cerca de 68% de seus valores cairo no intervalo de
um desvio padro a contar de cada lado da mdia; cerca de 95,5% no intervalo de dois desvios
padres a contar da mdia, e cerca de 99,7% dentro de trs desvios padres a contar da mdia. A
Figura 6 ilustra a ideia. Alm do mais, isto verdade quaisquer que sejam a mdia e o desvio padro
de uma distribuio normal particular; vlido para todas as distribuies normais.


()

]
Pouco mais adiante aprenderemos como determinar estas e outras percentagens. Por ora,
reflitamos uma pouco sobre a significao deste fato. A implicao que o problema de lidar com
uma famlia infinita de distribuies normais pode ser completamente evitado desde que queiramos
trabalhar com valores relativos, ao invs de com valores reais. Isto equivale a tomar a mdia como
ponto de referncia (origem) e o desvio padro como medida de afastamento a contar daquele
ponto (unidade de medida). Esta nova escala comumente conhecida como escala z.
Consideremos uma distribuio normal com mdia 100,0 e desvio padro de 10,0, conforme
a Figura 7. Podemos converter esta escala efetiva numa escala relativa substituindo os valores
efetivos por nmeros de desvios padres a contar da mdia da distribuio.
Embora a Figura 7 ilustre apenas uns poucos valores, o mesmo conceito pode ser aplicado a
qualquer valor da distribuio. Assim que o valor 90 est a -10 abaixo da mdia; ou -10/10 = -1
desvio padro; 120 est a +20 acima da mdia, ou 20/10 = 2 desvios padres, etc. 95 est a -0,5
desvio padro abaixo da mdia e 107 est a +0,7 desvio padro acima da mdia.









Podemos resumir este processo da seguinte maneira: converta-se a diferena efetiva entre a
mdia e algum outro valor da distribuio para uma diferena relativa exprimindo-a em termos do
nmero de desvios padres a contar da mdia. Algebricamente, pode-se escrever:


Onde:
z = nmero de desvios padres a contar da mdia
x = valor arbitrrio
= a mdia da distribuio normal
= o desvio padro
Note-se que z tem sinal negativo para valores de x inferiores mdia e sinal positivo para
valores superiores mdia.
Eis alguns exemplos de converso das diferenas efetivas entre mdia e um outro valor, para
distncia relativa em termos do nmero de desvios padres:
Mdia () Desvio padro() Valor Considerado (x) Diferena (x- ) Diferena Relativa
( (x- )/ = z)
40 1 42 2 2
25 2 23 -2 -1
30 2,5 37,5 7,5 3
18 3 13,5 -4,5 -1,5
22 4 22 0 0

tambm necessrio sabermos trabalhar em sentido inverso, passando dos valores z para
os valores efetivos. Por exemplo, podemos querer saber que valor corresponde a z = 2. Supondo
conhecidos a mdia e o desvio padro e que estejamos lidando com uma distribuio normal, a
converso toma a forma:
Valor efetivo = + z
Eis alguns exemplos:
Mdia () Desvio padro() z + z Valor efetivo
20 1 3 20 + 3(1) 23
50 3 -1 50 1(3) 47
60 2 -2 60 2(2) 56
72 5 0,3 72+0,3(5) 73,5
H uma grande vantagem em podermos pensar e trabalhar com valores relativos. que, em
vez de lidarmos com uma famlia infinita de distribuies normais, precisamos de apenas uma
distribuio normal para todos os problemas. Podemos converter qualquer valor de qualquer
distribuio normal em um valor z, ou escore z, que nos diz a quantos desvios padres o valor
considerado dista da mdia. Isto nos permite determinar todas as probabilidades da curva normal
utilizando uma nica tabela padronizada, elaborada exclusivamente com esse propsito.
A Tabela Normal Padronizada
As reas sob a curva de qualquer distribuio normal podem ser achadas utilizando-se uma
tabela normal padronizada, aps fazer a converso da escala original para a escala em termos de
desvios padres. A mdia passa a servir como ponto de referncia (origem) e o desvio padro como
unidade de medida. A tabela padronizada construda de modo que pode ser lida em unidades de z
nmeros de desvios padres a contar da mdia. A tabela d a rea sob a curva (isto , a
probabilidade de um valor cair naquele intervalo) entre a mdia e valores escolhidos de z. A poro
sombreada da Figura 8 corresponde rea sob a curva que pode ser lida diretamente na tabela.
Note-se que a mdia da distribuio agora 0, pois a mdia est distncia 0 de si mesma.



Como a distribuio normal simtrica em torno de sua mdia, a metade esquerda da rea
sob a curva a imagem reflexa da metade direita. Em razo de tal simetria, costuma-se dar apenas a
metade da distribuio numa tabela. Em outras palavras, para cada segmento esquerda existe um
segmento correspondente direita. comum apresentar a tabela para a metade direita da
distribuio. Ento, se se necessita de uma poro da metade esquerda, basta considerar como
desvios positivos os valores ali constantes. Por exemplo, a rea sob a curva entre a mdia e +1
desvio padro exatamente igual rea sobre a curva entre a mdia -1 desvio padro, conforme se
v na Figura 9.









Podemos agora voltar nossa ateno tabela em si. A tabela 1 ser usada em nossos
estudos; A tabela vem dada em termos de valores de z com duas decimais, tais como 2,78, 1,04,
2,45, etc. Uma peculiaridade que os valores de z vm decompostos em duas partes (o que pode
causar certa confuso a quem estuda o assunto pela primeira vez, mas de real vantagem na
apresentao grfica): os valores da parte inteira e da primeira decimal integram a coluna
esquerda, enquanto que a segunda decimal aparece na linha horizontal do topo. Determinemos
algumas reas entre a mdia e z para ilustrar o uso da tabela.
Suponhamos que queiramos determinar a rea entre a mdia e z = 1,25. Devemos primeiro
localizar 1,2 na coluna esquerda e, em seguida, 0,05 na linha horizontal do topo. A rea ser ento
dada pelo nmero formado pela interseo da linha z = 1,2 e da coluna 0,05. O valor 0,3944 a
percentagem da rea sob a curva normal entre a mdia 0 e z = 1,25. Ver a Figura 10. Naturalmente,
tal percentagem nada mais do que a probabilidade de uma varivel aleatria normal tomar um
valor z entre a mdia e um ponto situado a 1,25 desvios padres acima da mdia.
Eis mais alguns exemplos. Ver Tambm a Figura 11.
z rea entre a mdia e z
1,00 0,3413
1,50 0,4332
2,13 0,4834
2,77 0,4972

























Como a metade esquerda essencialmente a mesma da direita, se cada um dos valores de z
na tabela acima tivesse antes de si um sinal menos, as reas sob a curva ainda seriam as mesmas.
A tabela normal pode tambm ser usada para determinar a rea sob a curva alm de um
dado valor de z. A chave aqui que a rea de uma das metades 50%, logo a rea alm de z 50% -
valor tabelado. Por exemplo, se o valor tabelado 30%, a rea alm de z 50% - 30% = 20%. A rea
alm de z = + 1 ser 0,5 0,3413 = 0,1587, pois a rea entre a mdia e z = +1 0,3413. A figura 12
ilustra o conceito.
Eis alguns exemplos:
z P(0<x<z) P(x>z) = 0,5 P(0<x<z)
1,65 0,4505 0,0495
1,96 0,4750 0,0250
2,33 0,4901 0,0099
No estamos necessariamente confinados a situaes limitadas pela mdia. Quando um
intervalo ou seu complemento no limitado pela mdia da distribuio, a determinao da rea
sob a curva um processo de dois estgios. Por exemplo, seja determinar a rea sob a curva entre z
= -1 e z = 1. Como a mdia sempre o ponto de referncia, devemos determinar a rea entre a
mdia e cada um dos dois limites. Acabamos de ver que a rea entre a mdia e z = 1 0,3413.
Analogamente, a rea entre a mdia e z = -1 0,3413. Combinando os dois valores, temos a rea
total: 0,6826. Isso ilustrado na figura 13.

Analogamente, se os limites de um intervalo esto ambos do mesmo lado da mdia, e se
queremos achar a rea sob a curva entre esses dois limites, novamente deveremos determinar a
rea entre a mdia e cada um deles. Mas nesse caso necessitamos da diferena entre as duas reas.
Por exemplo, se queremos a rea entre z = 1 e z = 2 (Figura 14), devemos achar a rea entre a mdia
e z = 1 (0,3413) e subtra-la da rea entre z = 2 e a mdia (0,4772): 0,4772 0,3413 = 0,1359 a rea
entre z = 1 e z = 2.