Escolar Documentos
Profissional Documentos
Cultura Documentos
Distribuição Normal
Vimos na aula teórica que podemos usar duas funções do R, no lugar de recorrermos a
famosa tabela de distribuição Normal padronizada (que geralmente todos os livros de
estatística trazem em seus apêndices).
Vimos que UMA das opções de tabela de distribuição normal é que ela fornecer
SOMENTE a área a esquerda de um valor 𝑧 (padronizado), conforme ilustrado pela figura
abaixo:
Isso significa que calcular 𝑃(𝑥 ≤ 100) = 𝑃(𝑧 ≤ 2). Para obter a resposta basta
consultar na tabela de distribuição Normal padrão, o valor da área a esquerda do valor
de 𝑧 = 2.
Para responder a pergunta feita pela Alexandra, 𝑃(𝑥 = 75) = ?, podemos usar a
equação da distribuição normal, substituindo 𝑥 = 75; 𝜇 = 181 𝑒 𝜎 = 37,6
(#$%)! (()$*+*)!
9 ? 9 ?
𝑦(𝑥) = 𝑃(𝑥) = :√<= 𝑒 !'! ⇒ 𝑃(𝑥 = 75) = HI,J√<= 𝑒 !(,(,.)! = 0,0105
Isso quer dizer que 𝑃(𝑥 < 175) = 0,4366 ou 43,66%, ou ainda, arredondando
podemos dizer que a probabilidade uma mulher com idade entre 20 e 34 ter
colesterol inferior a 175 miligramas por decilitros é de 44%.
EXTRA
Observe que o comando pnorm(175, mean=181, sd=37.6) pode ser abreviado para
pnorm(175, 181, 37.6), mas a sequência dos argumentos devem ser o valor de x, média
e desvio padrão. Também é permitido trocar a ordem dos argumentos desde que eles
sejam nomeados, ou seja, é permitido pnorm(175, sd=37.6, mean=181), bem como
pnorm(sd=37.6, mean=181, 175).
2. Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha
colesterol superior a 185 miligramas por decilitro?
Queremos calcular 𝑃(𝑥 > 185). Então calculamos 1 − 𝑃(𝑥 < 185).
O comando no R é:
1 - pnorm(185, 181, 37.6)
A resposta fornecida pelo R é
O que quer dizer 0.4576? Elabore uma frase de interpretação para o resultado.
EXTRA
A função pnorm( ) fornece por default a área a esquerda, como a tabela que estudamos
na teoria, mas podemos obter a área a direita passando mais um argumento para
função: pnorm(185, 181, 37.6, lower.tail = F)
O argumento lower.tail = F, significa que área a direita é a que será fornecida, assim não
precisamos fazer o cálculo: 1 – área a esquerda de z.
lower.tail = T lower.tail = F
3. Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha
colesterol entre 175 e 185 miligramas por decilitro?
Queremos calcular 𝑃(175 < 𝑥 < 185). Então calculamos a diferença 𝑃(𝑥 <
185) − 𝑃(𝑥 < 175). No R:
pnorm(185, 181, 37.6) - pnorm(175, 181, 37.6)
OBSERVAÇÃO
Note que no R “pulamos” a etapa da padronização do valor de x para z. Para
comparamos com a tabela da distribuição normal vamos padronizar o valor 𝑥 = 175.
# Usando o R como calculadora:
m <- 181
dp <- 37.6
x <- 175
z <- ( x - m )/ dp
z
Podemos verificar que 𝑃(𝑥 < 175) = 𝑃(𝑧 < −0.1595745):
Verifique se você compreendeu esse conceito. Observe que em pnorm(z), estamos
passando como argumento um valor padronizado, então não precisamos informar o
valor da média e desvio padrão, o R considera como sendo a distribuição normal padrão,
que como vimos, ela tem média zero e desvio padrão igual a 1.
1. Vamos simular uma distribuição Normal que tem média igual 175 e desvio
padrão igual a 3. Pense que é a altura de pessoas (centímetros) de uma dada
amostra, vamos simular uma amostra de tamanho 500.
O comando no R é:
rnorm(500, mean=175, sd=3)
A resposta será 500 números aleatórios que seguem uma distribuição normal
com média 175 e desvio padrão 3.
Se você executar esse comando novamente, novos 500 números serão gerados! Para
“travar” os números gerados usamos a função set.seed( ), antes de gera-los a partir da
função rnorm( ). Da seguinte forma:
set.seed(1)
rnorm(500, mean=175, sd=3)
EXTRA
O número entre parênteses de set.seed( ) indica a “semente” dos números aleatórios
que foram gerados, você pode usar qualquer outro número, aí você terá um novo
conjunto de dados.
2. Armazene esses números em um objeto (dê num nome, por exemplo, dados)
para ficar mais fácil explorarmos algumas características da distribuição Normal:
boxplot(dadosunif) boxplot(dadoschi)
qqnorm(dadosunif) qqnorm(dadoschi)
qqline(dadosunif, col = "red") qqline(dadoschi, col = "red")