Você está na página 1de 10

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

Nota de Aula 8 Distribuio Normal


1. Introduo: Quando uma varivel aleatria qualquer segue uma distribuio binomial, por exemplo, fica restrita a assumir somente valores inteiros, pois suas informaes so originadas de uma varivel aleatria discreta. Mas em alguns casos, os resultados de uma varivel aleatria podem no estar limitados a nmeros inteiros apenas, podendo ser no inteiros tambm, por exemplo, suponha que a varivel X represente a altura de um indivduo, neste caso, raramente um indivduo tem exatamente 1,67cm ou 1,68cm de altura, pois teoricamente, esta varivel pode assumir um nmero infinito de valores intermedirios, como 1,6704cm ou 1,6832 cm. Portanto, trata-se de uma varivel aleatria contnua, ou seja, aquela que obtida por mensurao e por este motivo seus possveis valores tendem para o infinito, visto no serem inteiros, e o grfico paulatinamente se parecer com uma curva suave, que usada para representar a distribuio de probabilidade de uma varivel aleatria contnua, chamada de funo densidade de probabilidade. A distribuio contnua mais comum a distribuio chamada normal, que tambm conhecida como curva em forma de sino. Esta distribuio tem uma histria bastante longa e est ligada histria da descoberta das probabilidades, que surgiram no sculo XVII para resolver, inicialmente, questes de apostas de jogo de azar. O responsvel direto da curva normal foi o matemtico Frances Abraham de Moivre (1667-1754), exilado na Inglaterra, que a definiu em 1730, dando sequncia aos trabalhos de Jacob Bernoulli (com o teorema dos grandes nmeros) e de seu sobrinho Nicolaus Bernoulli, matemticos suos. A descoberta teve logo grande sucesso e grandes nomes ligados curva normal, tais como Laplace que em 1783 a utilizou para descrever a distribuio de erros, e Gauss que em 1809 a empregou para analisar dados astronmicos. Assim, a curva da normal chamada de distribuio de Gauss ou Gaussiana, pela suposio de que Gauss foi a primeira pessoa a reafirmar o papel fundamental proposta por Moivre.
Johann Carl Friedrich Gauss (1777-1855)

A lei dos grandes nmeros proposta por Bernoulli diz o seguinte: numa situao de eventos casuais, onde as alternativas so independentes, obter coroa em lances de uma moeda de cara ou coroa, tem a probabilidade matemtica exata de 50% (porque somente dois eventos possveis: cara ou coroa), mas na prtica esta probabilidade de 50% apenas aproximada. E essa aproximao tanto mais exata quanto maior forem s tentativas que voc fizer de lanar moeda, chegando a quase atingir os exatos 50% se voc lanar a moeda infinitas vezes. Isto , quanto mais lances voc fizer, menor ser o desvio (erro) em relao mdia de 50% que o resultado ir produzir. Isso quer dizer que os desvios sero menores na medida em que sobe o nmero de lances. Desvios grandes so raros e desvios pequenos frequentes, quanto menores os desvios mais frequentes eles sero, de sorte que, aumentando as tentativas (os lances), aumenta o nmero de desvios pequenos, sobrepujando cada vez mais os desvios grandes, de tal sorte que, no limite, haver quase somente desvios pequenos, sendo o desvio zero o menor deles e, por consequncia, o mais frequente. Moivre assumiu essa idia de Bernoulli e disse: erros grandes so mais raros que erros pequenos. Assim, quanto menores os erros, mais frequentes eles sero e quanto maiores, menos frequentes. Dessa forma, os erros se distribuem equitativamente em torno de um ponto modal, a mdia, formando uma curva simtrica com pico na mdia e caindo rapidamente para as caudas esquerda (erros que subestimam a mdia) e direita (erros que superestimam a mdia). Alm disso, essa curva simtrica permitiu a Moivre calcular uma medida de disperso das observaes em torno da mdia, medida esta que hoje em dia

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

conhecida como o desvio padro. Moivre chamou esta curva de normal, por que a mdia dela representa a norma, isto , as coisas todas deviam ser como a mdia, de sorte que tudo que se desvia dessa mdia considerado erro, portanto a equivalncia, neste caso, entre desvio e erro. Quetelet, matemtico belga do sculo XIX, fez uma orgia de medies sobre eventos do homem, tais como natalidade, mortalidade, alcoolismo, insanidade, medidas antropomtricas, dentre outros, resultando no Tratado sobre o homem e o desenvolvimento de suas faculdades (1835), afirmando que tudo no homem e no mundo se distribui segundo a curva normal. Embora essa afirmao de Quetelet tenha tido reaes contrrias, ela evocou pesquisas sem fim sobre esta histria da distribuio normal dos eventos, chegando hoje em dia a ser mantida a idia de que, praticamente, todos os eventos se distribuem assim. Da, a hegemonia da curva normal nas anlises estatsticas em pesquisas cientficas. Alis, assumir a distribuio normal em pesquisa est baseado em dois fundamentos: 1 Quando a distribuio da prpria populao e eventos normal (como insiste Quetelet para todos os eventos), ou 2 Quando a distribuio da populao no for normal, mas o nmero de casos for grande (teorema de Bernoulli ou o teorema central do limite). Esta histria do limite central extremamente complicada, mas os matemticos chegaram a provar este teorema. Assim, qualquer que seja a distribuio dos seus dados, se voc tiver um nmero grande de observaes, voc pode usar com tranquilidade a curva normal como uma aproximao adequada para a anlise dos seus dados. Uma curiosidade: um N de tamanho 30 j considerado um grande nmero se a distribuio da populao for prximo do normal. Um N bem maior ser necessrio se a distribuio da populao no for normal. Hoje em dia, a curva da normal um ganho fundamental, pois a normalidade dos dados ocorre naturalmente em muitas reas cientficas, como na fsica, biologia e nas reas sociais, e tambm uma distribuio fundamental para a inferncia estatstica. Por exemplo, a sua aplicao na anlise de dados na rea da biomedicina grande, pois muitas variveis numricas contnuas de estudos anteriores comprovaram que tm distribuio normal ou aproximadamente normal. Um outro exemplo que podemos citar a altura, o peso, o ndice de massa corporal (IMC), dentre outras. Alguns dos principais mtodos empregados na anlise estatstica (Anlise de Varincia, Anlise de Regresso, dentre outros) exigem que os dados tenham distribuio normal para sua realizao. Esta nota de aula mostrar o uso prtico da distribuio normal de probabilidade nas prticas empresariais e acadmicas. 2. Distribuio Normal: Mas por que esta distribuio tem esse nome? Existe uma explicao plausvel para isto, veremos mais a frente. A distribuio normal uma distribuio de probabilidade usada para variveis aleatrias contnuas (obtidas por mensurao), com a seguinte notao X ~ N (; ) e funo densidade de probabilidade dada por: f ( x) = 1

1 x 2

, para - < x < (ou x ), onde:

X = Varivel aleatria contnua analisada x = Valor qualquer da varivel aleatria X = Mdia populacional = Desvio padro populacional = 3,1416... e = 2,7182... 3. Caractersticas da Distribuio Normal: a) A varivel X pode assumir qualquer valor real (- a + );
2

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

b) O grfico da distribuio normal tem uma curva simtrica (a mdia moda mediana) e unimodal na forma de um sino e apresentado um ponto de inflexo esquerda (x = - 1) e outro direita (x = + 1), ou seja, ou seja, o que define a rea sob a curva so os desvios padro (), ou seja, fixando o valor da mdia, o achatamento da curva est diretamente ligado ao valor de ; OBS: No caso da normal padro, completamente definida por Z.

O grfico que mostra os indcios de que os dados de uma distribuio aproximadamente normal o histograma ou o diagrama de ramo e folhas. A distribuio normal uma das distribuies fundamentais da moderna teoria estatstica. A vantagem da distribuio normal reside na facilidade de defini-la com apenas dois parmetros, a mdia e o desvio padro da distribuio, por exemplo, suponha a seguinte a curva da normal f(x) para = 40 e = 10, o grfico construdo ser:
0,0450 0,0400 Frequncia relativa 0,0350 0,0300 0,0250 0,0200 0,0150 0,0100 0,0050 0,0000 0 10 20 30 40 50 60 Parmetros da varivel aleatria 70 80

Substituindo os parmetros = 40 e = 10 na funo densidade de probabilidade, encontraremos os seguintes valores: x f(x) 20 0,0007 30 0,0146 40 0,0399 50 0,0146 60 0,0007 Segue o grfico 1 com a plotagem dos seguintes valores.

Grfico 1: Distribuio Normal com mdia e desvio padro

Uma das caractersticas importantes da normal que a partir desses parmetros ser possvel calcular, por exemplo, a porcentagem de valores que devero estar acima ou abaixo de um determinado valor da v.a., ou entre esses dois valores definidos. Analisando a frmula de f(x), observe que para cada par de parmetros e , h uma curva diferente de f(x) ou que, para qualquer outro par de parmetros e , a curva f(x) ser diferente. c) Os valores de f(x) nunca tocam o eixo x da curva da Normal, mas f(x) 0, se x ; d) A rea sob a curva 1.
3

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

Como se trata de distribuio de probabilidade contnua, a rea que fica entre a curva e o eixo x representa a probabilidade. A probabilidade de ocorrer um evento entre os pontos a e b calculada pela integral definida da funo entre os pontos a e b, representada por: P ( a, b) =
a b

1 x 2

, graficamente:

Observa-se que o clculo direto de probabilidade envolvendo a distribuio normal exige recursos de clculo avanado e, mesmo assim, dada a forma da funo densidade de probabilidade (f.d.p), no um processo muito elementar. Por isso ela foi tabelada, permitindo assim obter diretamente o valor da probabilidade desejada. Verifica-se que, no entanto a f.d.p da normal depende de dois parmetros e , o que acarreta um grande trabalhado para tabelar as probabilidades, considerando-se as vrias combinaes de e . Esse problema pode ser resolvido por meio de uma mudana de varivel, obtendo-se, assim, a distribuio normal padronizada ou reduzida. 4. A curva normal e a curva padronizada (Z): Os pesquisadores quando falam da curvam normal, tipicamente entendem a curva normal padronizada (ou igualitria a normal original), a qual definida pela simetria e pela curtose. Mas a curva normal original definida exclusivamente pela simetria, isto , que as reas sob a curva so idnticas em ambos os lados da mdia: a curva normal unimodal (tem apenas um pico) e simtrica. Assim, todas as curvas da figura abaixo so normais, porque tm um pico somente e so simtricas, embora os desvios sejam diferentes, provocando diferentes nveis de curtose.

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas


1 Na frmula f ( x ) = e 2 2 2 1 x
2

, observa-se que a parte mais importante o expoente

1 X , e nele se v que quem comanda as aes so os dados empricos de X e os parmetros de sua 2 distribuio ( e ). Agora, tanto os X quanto os parmetros de uma distribuio variam de pesquisa para pesquisa e, assim, as curvas normais que resultam so diferentes. Portanto, ao invs de trabalhar com os valores brutos de X, vamos padronizar estes valores e transform-los em valores de Z, ou seja, agora a distribuio normal ter o seguinte formato:
Z X 1 2 Z= , com isso f ( Z ) = e 2 A vantagem deste curva normal padronizada que em alguns parmetros j esto automaticamente definidos para qualquer escala de medida que voc utilizar , quais seja, a mdia zero ( = 0) e desvio padro um ( = 1), onde suas probabilidades j foram calculadas e so apresentadas em uma tabela (ver anexo desta nota de aula) de fcil utilizao. Essa tabela nada mais que uma tabela de converso do nmero de desvios padro entre x e em um algoritmo. Em que X uma varivel aleatria normal da mdia e varincia (so constantes), assim: X ~ N(; ) Z ~ N(0; 1), seu grfico ser:
2

A curva normal padronizada definida pela simetria e pela curtose, sendo chamada de mesocrtica. A curtose da distribuio normal se refere altura do pico da curva, o qual acontece na mdia da distribuio: se o pico muito elevado, a curva chamada de leptocrtica, se o pico achatado a curva chamada de platicrtica, se for mediano, a curva chamada de mesocrtica, sendo esta ltima, a caracterstica da normal padronizada, como mostra a figura abaixo:

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

Trabalhar com a curva normal padronizada facilita muito a vida da gente, pois com ela a mdia sempre ser zero e o desvio padro ser um. Quando no for padronizada, ento teremos que calcular o valor da mdia e o valor do desvio padro da distribuio e trabalhar com os dois parmetros. 5. Uso da tabela normal padro (Z): A tabela oferece a rea entre 0 e Z0 ou P(0 Z Z0), conforme visto no grfico abaixo:

Onde Z0 representa o nmero de desvios padro distante da mdia, ou seja, as informaes contidas nessa tabela no so sempre idnticas nos diferentes autores de livros de estatstica, mas duas informaes sempre esto presentes e essas duas so as mais importantes, a saber, o Z e a proporo de casos que caem na faixa que vai da mdia zero at este valor de Z. Assim, se voc conhece o Z, voc pode descobrir qual a proporo de casos que corresponde a ele ou, se voc conhece a proporo de casos, voc pode descobrir qual o Z que lhe corresponde. OBS: Embora a curva normal v at o infinito (positivo e negativo), voc v que quase a totalidade dos casos cai entre -3 e 3 desvios padro (ou Z), de fato, 99,74% dos casos, por isso, a tabela (em anexo) varia -3,99 a 3,99, acima ou abaixo disso 0,499. 6. Regra emprica (ou Regra 68-95-99): Outra regra que auxilia a interpretao de um desvio padro a regra emprica, aplicvel somente a conjunto de dados com distribuio aproximadamente em forma de sino, pois mostra como a mdia e o desvio padro esto relacionados com a proporo dos dados que se enquadram em determinados limites. A regra a seguinte: Cerca de 68% dos valores esto a menos ou a mais de 1 desvio padro a contar da mdia, o que justifica o nome da distribuio de probabilidade normal, pois 68% representa a maioria, e a maioria o que representa ser normal ou que est dentro do padro. Nesse caso, 68% dos elementos (a maioria) apresentam determinada caracterstica; Se quiser melhorar esse nvel proporcional de elementos que possuem determinada caracterstica, de 68% para 95%, ou seja, basta-se pegar 2 desvios padro para mais e para menos a contar da mdia, assim: Cerca de 95% dos valores esto a menos ou a mais de 2 desvios padro a contar da mdia; Se quiser ainda aumento esse nvel proporcional de 95% para 99,7%, ento deve-se pegar 3 desvios padro para mais e para menos a contar da mdia, assim: Cerca de 99,7% dos valores esto a menos ou a mais de 3 desvios padro a contar da mdia. Nesse ltimo caso, a anlise de quase toda a populao possuir determinada caracterstica. Com isso, se os dados so aproximadamente normais, as porcentagens sero aproximadamente iguais a 68%, 95% e 100%, respectivamente.

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

Ver figura da regra emprica.

Portanto, quase nunca preciso prolongar muito as caudas de uma distribuio normal, porque a rea sob a curva de mais ou menos 4 ou 5 desvios-padro a contar da mdia desprezvel para quase todos os fins prticos. Exemplo1: Encontre a probabilidade de: a) P(Z 1,23)

b) P(Z -1,23)

Portanto: P(Z a) = P(Z -a) c) P(Z 1)

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

d) P(-2,55 Z 1,2)

e) P(1 Z 3,09)

f) P( - 3 X + 3)

Exemplo2: Encontre o valor de Z: a) P(Z z) = 0,7088

b) P(Z z) = 0,1

c) P(-b < Z < b) = 0,3182, determine b

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

Exemplo3: O saldo dirio de caixa de uma determinada empresa de grande porte de Fortaleza nos ltimos 400 dias tem distribuio normal com mdia R$ 110.000 e desvio padro R$ 40.000. Calcular: a) A probabilidade do saldo dirio de caixa est entre R$ 70.000 e R$ 150.000:
Soluo:

b) A probabilidade do saldo dirio de caixa est fora do intervalo entre R$ 70.000 e R$ 150.000:
Soluo:

c) P (X > 160.000)
Soluo:

d) A probabilidade do saldo dirio de caixa ser negativo:


Soluo:

Nota de aula 8 Distribuio Normal Professor: Kleison Freitas

Anexo 3 Tabela da distribuio Normal

10