Escolar Documentos
Profissional Documentos
Cultura Documentos
2 - DISTRIBUIÇÃO NORMAL
A distribuição normal conhecida também como distribuição gaussiana é sem dúvida a mais
importante distribuição contínua. Sua importância se deve a vários fatores, entre eles podemos citar
o teorema central do limite, o qual é um resultado fundamental em aplicações práticas e teóricas,
pois ele garante que mesmo que os dados não sejam distribuídos segundo uma normal a média
dos dados converge para uma distribuição normal conforme o número de dados aumenta. Além
disso diversos estudos práticos tem como resultado uma distribuição normal. Podemos citar como
exemplo a altura de uma determinada população em geral segue uma distribuição normal. Entre
outras características físicas e sociais tem um comportamento gaussiano, ou seja, segue uma
distribuição normal.
Definição 6.2.1:
Uma variável aleatória contínua tem distribuição Normal se sua função densidade de
probabilidade for dada por:
Usamos a notação
A variação natural de muitos processos industriais é realmente aleatória. Embora as distribuições
de muitos processos possam assumir uma variedade de formas, muitas variáveis observadas
possuem uma distribuição de frequências que é, aproximadamente, uma distribuição de
probabilidade Normal.
Probabilidade é a chance real de ocorrer um determinado evento, isto é, a chance de ocorrer uma
medida em um determinado intervalo. Por exemplo, a frequência relativa deste intervalo, observada
à partir de uma amostra de medidas, é a aproximação da probabilidade. E a distribuição de
frequências é a aproximação da distribuição de probabilidades.
A distribuição é normal quando tem a forma de "sino":
Para achar a área sob a curva normal devemos conhecer dois valores numéricos, a média eo
desvio padrão . A Figura a seguir mostra algumas áreas importantes:
Quando e são desconhecidos (caso mais comum), estes valores serão estimados por e ,
Assim, a distribuição passa a ter média e desvio padrão . Pelo fato da distribuição ser
simétrica em relação à média , a área à direita é igual a área à esquerda de . Por ser uma
distribuição muito usada, existem tabelas a qual encontramos a resolução de suas integrais. Assim,
a tabela fornece áreas acima de valores não negativos que vão desde até . Veja o gráfico
da curva Normal padronizada na Figura abaixo.
Exemplo 6.2.1:
Calcular a área sob a curva para maior que .
A área sob a curva normal para maior do que é dada por
Exemplo 6.2.3:
Suponha que a espessura média de arruelas produzidas em uma fábrica tenha distribuição normal
com média mm e desvio padrão mm. Qual a porcentagem de arruelas que tem
espessura entre mm e mm?
Para encontrar a porcentagem de arruelas com a espessura desejada devemos encontrar a área
abaixo da curva normal, compreendida entre os pontos e mm.
Para isso, temos que encontrar dois pontos da distribuição normal padronizada.
O primeiro ponto é
A área para valores maiores do que é , ou seja, . Portanto, a área para
valores menores do que é de .
O segundo ponto é:
Exemplo 6.2.5:
Suponha que siga uma distribuição normal com média e variância , ou seja, .
Então .
De fato,
Exemplo 6.2.6:
Suponha que seja uma variável aleatória tal que . Seja , mostremos
que também tem distribuição normal, sabendo que a e b são constantes reais.
De fato,
Fazendo uma mudança de variável; s=at+b temos que e então
e, portanto
Agora vamos calcular a função geradora de momentos para uma variável aleatória Z, tal
que . Lembremo-nos de que com . Assim
Se tem distribuição Normal, podemos calcular o valor esperado de a partir da função
geradora de momentos.
e assim
e, portanto
Utilizamos a notação .
Observação 6.12.1:
A distribuição Exponencial pode ser parametrizada de uma forma alternativa segundo a função
densidade de probabilidade dada por
Exemplo 6.12.2:
Suponha que o tempo de vida de uma determinada espécie de inseto tenha uma distribuição
exponencial de parâmetro dia. Suponha também que estes insetos atinjam a maturidade
sexual após dias de seu nascimento. Qual a função densidade de probabilidade, em dias, dos
insetos que conseguem se reproduzir? E qual a probabilidade de que um inseto reprodutor viva
mais de dias?
Seja a distribuição do tempo de vida dos insetos, e a distribuição do tempo de vida dos
insetos que chegam a reprodução. Observem que , assim
Agora falta encontramos qual a probabilidade de que o inseto reprodutor dure mais de 24 dias.
Usando a densidade acima temos que
Exemplo 6.12.3:
Uma fábrica utiliza dois métodos para a produção de lâmpadas. 70% das lâmpadas são produzidas
pelo método e as demais pelo método . A duração da lâmpada depende do método pelo qual
ela foi produzida, sendo que as produzidas pelo método seguem uma distribuição exponencial
com parâmetro e as do método seguem uma exponencial de parâmetro . Qual a
probabilidade de que, se escolhermos uma lâmpada ao acaso, ela dure mais de horas?
e, portanto,
Portanto a probabilidade de que uma lâmpada escolhida ao acaso dure mais de 100 horas é de
31%.
Exemplo 6.12.4:
Sabendo que , qual a função densidade de probabilidade de .
Sabemos que a densidade de é dada por
Assim
Seja um variável aleatória com distribuição exponencial com parâmetro . Então sua função
geradora de momentos é dada por:
Temos que o valor esperado e a variância de uma variável aleatória X com distribuição exponencial
com parâmetro λ são dados, respectivamente, por
Observação 6.12.3:
Quando estamos trabalhando com a distribuição exponencial parametrizada com o parâmetro
escala temos que
Definição 6.9.1:
Uma variável aleatória tem distribuição Gama com parâmetros (também denominado
parâmetro de forma) e (parâmetro de taxa), denotando-se , se sua função
densidade é dada por
Teorema 6.9.1:
Suponha que seja uma sequência de variáveis aleatórias independentes, tais
que . Então
Para demonstrar esse fato vamos utilizar da função geradora de momentos, mas antes vamos
encontrar a função geradora da distribuição gamma.
Portanto,
Portanto .
Com a demonstração deste teorema, mostramos também que soma de distribuições qui-
quadradado independentes tem distribuição qui-quadrado, com a soma dos graus de liberdade.
Definição 6.3.1:
Uma variável aleatória contínua tem distribuição qui-quadrado com graus de liberdade se sua
função densidade for dada por:
sendo . Denotamos .
O gráfico abaixo mostra a função qui-quadrado com 2 graus de liberdade.
Notemos pelo gráfico da distribuição qui-quadrado que ela é assimétrica e positiva, isto vale para
qualquer grau de liberdade. Sua positividade é fácil de ser verificada, pois ela é soma de normais ao
quadrado, portanto só pode ser positiva. A distribuição qui-quadrado possui diversas aplicações na
inferência estatística.
Para entender a ideia de graus de liberdade, consideremos um conjunto de dados qualquer. Graus
de liberdade é o número de valores deste conjunto de dados que podem variar após terem sido
impostas certas restrições a todos os valores. Por exemplo, consideremos que estudantes
obtiveram em um teste média . Assim, a soma das notas deve ser (restrição). Portanto,
neste caso, temos um grau de liberdade de , pois as nove primeiras notas podem ser
escolhidas aleatoriamente, contudo a ª nota deve ser igual a [ - (soma das primeiras)].
Observação 6.3.1:
Se , então temos que , ou seja a distribuição qui-quadrado é um
caso particular da distribuição Gama. A distribuição Gama será apresentada no tópico 6.9.
Exemplo 6.3.1:
Suponha que sejam variáveis aleatórias normais independentes e identicamente
distribuídas com média e desvio padrão . Então, temos que a estatística
tem distribuição qui-quadrado com graus de liberdade, onde é o desvio padrão amostral.
O número de graus de liberdade de uma soma de quadrados corresponde ao número de elementos
independentes na soma de quadrados. Considerando novamente variáveis aleatórias
normais independentes e identicamente distribuídas com média e desvio padrão , temos que os
elementos da soma de quadrados não são todos independentes. Na
realidade, somente destes elementos são independentes, implicando que tem
graus de liberdade. Podemos encontrar mais detalhes sobre isso na apostila de inferência.
Exemplo 6.3.2:
Suponha agora que segue uma distribuição qui-quadrado com graus de liberdade e
queremos encontrar e tais que . Para isto notemos que
Assim e .
Observação 6.3.1:
Observamos que poderíamos ter encontrado outros valores de e para os
quais , porém, na prática, sempre buscamos por valores de forma que as
probabilidade .
Exemplo 6.3.3:
Seja uma variável aleatória com distribuição normal padronizada. Vamos mostrar que , segue
uma distribuição com um grau de liberdade.
Seja , então
Observe que na última igualdade foi usado o fato da função normal padronizada ser simétrica em
torno de zero. Agora basta apenas fazermos uma mudança de variável tomando ,
Aqui vale uma observação, para mostramos que segue uma distribuição qui-quadrado,
precisamos usar o fato de que , e portanto a distribuição acima é uma .
Teorema 6.3.1:
Sejam variáveis aleatórias independentes, com e .
Mas
e, portanto,
em que a última integral é igual a 1, pois se trata justamente de uma normal com média zero e
variância . Portanto,
Portanto, podemos calcular o valor de esperado e a variância da variável . De fato, temos que
e