Distribuição Normal
Probabilidade I
Camila Borelli Zeller – DE/UFJF
Distribuição Normal
• É a mais importante distribuição em
Estatística.
– É chamada freqüentemente de
distribuição Gaussiana.
Função Densidade
A curva é unimodal (forma de um
sino) e é simétrica.
µ
Valor
• Parâmetros da distribuição normal: Média
() e o desvio padrão () ou variância (2).
• Notação: X ~ N(, 2),
Propriedades
Características
• Distribuição Simétrica: média=moda=mediana.
• Nela, a média é, simultaneamente, o valor mais
freqüente, isto é, a moda, e o ponto central da
distribuição, ou seja, a mediana.
• Em conseqüência disso, é claro que área antes
de = área depois de = 0,5.
Características
• Parâmetro de locação:
• Parâmetro de escala: (2) – indica a dispersão dos
valores ao redor da média.
Altura de Mulheres e Homens
Adultos
Mulheres:
µ = 1,615
= 0,0635 Homens:
µ = 1,753
= 0,0711
1,615 1,753
Alturas (m)
Aplicações
• É importante notar que muitas variáveis de
interesse, tais como, pressão sangüínea,
nível de colesterol, altura, peso têm
distribuição aproximadamente normal.
• A curva normal pode ser usada, por
exemplo, para calcular probabilidades
associadas a essas variáveis.
Aplicações
• Por exemplo, considere uma população na
qual o nível de colesterol é normalmente
distribuído com média C e desvio padrão D,
poderíamos encontrar a probabilidade de que
um indivíduo escolhido aleatoriamente tenha
um nível de colesterol maior que
250mg/100ml.
• Tal conhecimento pode nos auxiliar a planejar
futuros serviços de atendimentos a cardíacos.
Aplicações
• Cálculo: P(X> 250)!!! Auxílio de um
programa de computador ou uma tabela de
áreas calculadas para a curva normal.
• Desde que uma distribuição normal possa ter
um número infinito de valores possíveis para
sua média e desvio padrão, é impossível
tabular a área associada a cada uma das
curvas normais. Trabalha-se com a
distribuição normal padrão.
Distribuição Normal Padrão
• Todas as curvas normais podem ser
transformadas em uma curva normal padrão.
Considere a seguinte transformação:
• Cria-se uma nova variável, denominada Z,
cuja distribuição tem média zero e variância
1.
Distribuição Normal Padrão
• Z ~ N(0, 1)
• Média () = 0
•Desvio padrão () = 1
•Valores de área tabelados
Cálculo de Probabilidades
• Seja a variável aleatória Z ~ N(0, 1).
– Calcule P(Z > 1,96)
– Roteiro:
• Esboce a curva normal.
• Trace uma linha para z =1,96.
• Verifique a área que se deseja calcular.
• Determine a área a partir da tabela.
Cálculo de Probabilidades
• Calcule P(Z < 1,96)
• Calcule P(0 < Z < 1,96)
• Calcule P(Z< -1,96)
• Calcule P (-1,96 < Z < 1,96)
Lembrete!
NOTA: Embora o valor z (também
conhecido como escore) possa ser
negativo, a área sob a curva (ou a
probabilidade correspondente) nunca
pode ser negativa.
Exercício
• P (-1 < Z < 1): área contida no intervalo
[ - ; + ].
• P (-2 < Z < 2): área contida no intervalo
[ - 2; + 2].
• P (-3 < Z < 3): área contida no intervalo
[ - 3; + 3].
Faixa de Referência
Outra utilidade
• Poderíamos desejar encontrar o valor z que
limite os 10% superiores da distribuição
normal padrão, ou seja, o valor de z para o
qual P(Z > z) = 0,10.
• Basta localizar no corpo da tabela 0,10,
observa-se valor de z = 1,28.
Percentil
• Definição:
– O p-ésimo percentil (ou de ordem p) de
uma amostra é um valor tal que p% dos
elementos têm valores menores que ele e
(100-p)% tem valores maiores.
Percentil
• Casos Particulares:
– Percentil 50 = mediana
– Percentil 25 = Primeiro Quartil
– Percentil 75 = Terceiro Quartil
Percentil
• Interpretações:
– Primeiro Percentil determina o 1% menor
dos dados.
– Quinto Percentil: 5% dos dados são
menores ou iguais ao mesmo.
Outras Distribuições Normais
• Caso Geral:
– Média:
– Desvio padrão:
• Transformação:
• Mesmos procedimentos após transformação
(tabela normal padrão).
Conversão na Normal Padrão
• P( < X < x ) = P (0 < Z < z ).
Exemplo
• A contagem total de cristas das impressões
digitais de seres humanos tem distribuição
aproximadamente normal com média 140 e
desvio padrão 50.
– X: contagem de cristas de impressão
digital
X ~ N (140, 502)
Cálculo de Probabilidades
• Encontre a probabilidade de um indivíduo
escolhido ao acaso ter uma contagem de
cristas inferior a 100.
Cálculo de Probabilidades
• Padronização:
• Pela tabela
P ( Z < – 0,80) = 0,212.
P ( X < 100) = 0,212.
Outra utilidade
• Qual o valor da contagem de cristas que
delimita as 5% maiores valores em seres
humanos?
Exercício
• Seja X uma variável aleatória que representa
a pressão sangüínea sistólica. Para a
população de homens de 18 a 74 anos,nos
Estados Unidos, a pressão sangüínea tem
distribuição aproximadamente normal com
média de 129 milímetros de mercúrio
(mmHg) e desvio padrão de 19,8 mmHg.
Cálculo de Probabilidades
• Determine a proporção de homens na
população que têm pressões sangüíneas
sistólicas maiores do que 150 mmHg.
Outra Utilidade
• Encontre o valor de x que limita os 2,5%
superiores da curva de pressão sangüínea
sistólica, ou equivalentemente, o valor de x
para o qual P (X > x) = 0,025.