Você está na página 1de 19

11/07/2021 Distribuição Normal (Gaussiana)

Distribuição Normal

Distribuição Normal Padronizada


Exemplo - Normal 1

Exemplo - Normal 2

Distribuição Normal (Gaussiana) Code

Distribuição Normal
A distribuição normal é um modelo bastante útil na estatística, e não seria uma surpresa pois a
soma de efeitos independentes (ou efeitos não muito correlacionados) deveriam, se houvesse
muitos desses, se distribuir normalmente (sempre sujeito a certos pressupostos).

Nos séculos dezoito e dezenove, alguns matemáticos e físicos desenvolveram uma função
densidade de probabilidade que descrevia os erros experimentais obtidos em medidas físicas
Caire, 2012 (http://repositorio.unesp.br/bitstream/handle/11449/91024/caire_e_me_rcla.pdf?
sequence=1). De certa forma todo e qualquer processo de mensuração está sujeito a um erro de
medida. Esse erro pode ter diferentes fontes, desde a variação de tempertura, tempo, entre
inúmeras outras características não identificáveis.

Na época (século dezoito) a sua aplicação inicial era apenas como uma conveniente aproximação
da distribuição binomial (http://www.inf.ufsc.br/~andre.zibetti/binomial.html), mais tarde no
século XIX a distribuição normal ganhou importância com os trabalhos de Abraham de Moivre
(em The Doctrine of Chances
(https://archive.org/stream/doctrineofchance00moiv#page/n5/mode/2up)), Pierre Simon
Laplace e Carl Friedrich Gauss.

A grande utilidade dessa distribuição (função densidade de probabilidade) está associada ao


fato de que aproxima de forma bastante satisfatória as curvas de frequências de medidas físicas,
essa curva é conhecida como distribuição normal ou gaussina.

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 1/19
11/07/2021 Distribuição Normal (Gaussiana)

A distribuição normal possui dois parâmetros, a média (μ), ou seja onde está centralizada e a
variância (σ 2 > 0) que descreve o seu grau de dispersão. Ainda, é comum se referir a dispersão
em termos de unidades padrão, ou seja desvio padrão (σ). Cabe salientar que como qualquer
outro modelo, dependendo dos parâmetros, teremos diferentes distribuições normais.

É importante lembrar que a variável X se distribui de forma contínua (variável contínua) de


−∞ < x < +∞ e a área total sob a curva do modelo é unitária (ou seja 1).

Observe na figura abaixo uma distribuição normal com parâmetros μ = 20, σ


2
= 4 ou (σ = 2) .

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 2/19
11/07/2021 Distribuição Normal (Gaussiana)

Exemplo de uma normal com parâmetros μ = −15, σ


2
= 6 ou (σ = 2.44949) .

Code

O modelo da função normal pode se expresso matemáticamente da seguinte forma:

Variável Aleatória Generalizada

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 3/19
11/07/2021 Distribuição Normal (Gaussiana)

Seja X uma variável aleatória contínua com média μ em que −∞ < x < ∞ ,eσ > 0 .

Função Densidade de Probabilidade

2
x−μ
1 −
1
( )
σ
f X (x) = e 2
− ∞ < x < ∞
− −−−
√ 2πσ 2

Podemos dizer que X possui uma distribuição normal e escrever X ∼ N (μ, σ )


2
.

Valor Esperado e variância

E[X] = μ

2
V (X) = σ

Cálculo da Probabilidade

b
2
x−μ
1 −
1
( )
σ
P(a < X < b) = ∫ e 2
dx
− −−−
√ 2πσ 2
a

Cabe notar que a integral da função densidade de probabilidade normal não possui solução
analítica, sendo neste caso o seu cálculo deve ser realizado por uma aproximação, método
numérico.

Por exemplo, pode-se utilizar o método numérico (regra de Newton-cotes, ponto-médio,


trapezoidal, Simpson, etc..) ou outros métodos de aproximação.

Seja a área sob a curva no intervalo [a, b] a probabilidade de algo ocorrer entre os valores de a
até b . É importante salientar que o valor da densidade, ou seja os valores de f X (x) representa as
densidades, enquanto que a área sob essas densidades é a probabilidade.

Exemplo, para uma normal, X ∼ N (μ = 10, σ 2 = 4) ou (σ = 2) , temos as seguintes


probabilidades, ou áreas sob a curva da normal.

A probabilidade entre [8, 12]

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 4/19
11/07/2021 Distribuição Normal (Gaussiana)

A probabilidade entre [6, 14]

Code

A probabilidade entre [4, 16]

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 5/19
11/07/2021 Distribuição Normal (Gaussiana)

Resumindo, na distribuição normal acima onde X ∼ N (μ = 10, σ


2
= 4) ou (σ = 2) , as
probabilidades obtidas (numéricamente) foram:

P(8 < X < 12) ≈ 0.68

P(6 < X < 14) ≈ 0.95

P(4 < X < 16) ≈ 0.99

Ou seja,

P(μ − σ < X < μ + σ) ≈ 0.68

P(μ − 2σ < X < μ + 2σ) ≈ 0.95

P(μ − 3σ < X < μ + 3σ) ≈ 0.99

Note que para uma distribuição normal isso é válido, sejam quais forem os parâmetros (μ, σ 2 ).
Observe na figura abaixo a mesma situação com diferentes distribuições normais.

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 6/19
11/07/2021 Distribuição Normal (Gaussiana)

Code

Distribuição Normal Padronizada


Qualquer distribuição normal pode ser padronizada, de forma que no processo de padronização
dos valores da variável aleatória (X) os parâmetros se tornem μ = 0 e σ 2 = 1 . Essa
abordagem é dada pela definição de uma nova variável aleatória Z , chamada de variável
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 7/19
11/07/2021 Distribuição Normal (Gaussiana)

aleatória normal padronizada, dada pela função linear Z .

X − μ
Z =
σ

onde X é uma variável aleatória normal com média (μ, σ 2 > 0) .

Padronizando uma variável aleatória Normal

Se X for uma variável aleatória normal com E[X] = μ e V (X) = σ


2
, a variável aleatória

X − μ
Z =
σ

será uma variável aleatória normal, com E[Z ] = 0 e V (Z ) = 1 . Ou seja, Z é uma variável
aleatória normal padrão.

Como exemplo vamos transformar uma variável aleatória normal em uma normal padronizada,
para isso todos os valores de X irão ser transformados linearmente em Z .

Code

Dessa forma, é possível uma única vez obter a área sob a curva da normal padrão. Assim uma vez
que a v.a. X é padronizada em Z é possível obter a área entre dois pontos sob a curva
diretamente com o uso de uma tabela, e essa área representa uma probabilidade.

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 8/19
11/07/2021 Distribuição Normal (Gaussiana)

Exemplo - Normal 1
Os dados de uma pesquisa mostram algumas informações sobre o tempo de cirurgias para
recostrução ACL em hospitais com alto volume de cirurgia. A partir dos dados foram
calculados, o tempo médio de 129 minutos com um desvio padrão de 14 minutos.

a. Qual é a probabilidade de uma cirurgia ACL, em um hospital com alto volume de


cirurgias, requerer um tempo maior do que dois desvios-padrão acima da média?
b. Qual é a probabilidade de uma cirurgia ACL, em um hospital com alto volume de
cirurgias ser completada em menos de 100 minutos?
c. Em qual tempo a probabilidade de uma cirurgia ACL em um hospital com alto volume de
cirurgias é igual a 0.95?
d. Se uma cirurgia requer 199 minutos, o que você conclui sobre o volume de tais cirurgias
em um hospital? Explique.

Solução

a. Qual é a probabilidade de uma cirurgia ACL, em um hospital com alto volume de


cirurgias, requerer um tempo maior do que dois desvios-padrão acima da média?

1 − P(Z < 2) = 1 − ϕ(2) = 0.0228

Code

[1] 0.02275013

b. Qual é a probabilidade de uma cirurgia ACL, em um hospital com alto volume de


cirurgias ser completada em menos de 100 minutos?

Seja X o tempo, onde X ∼ N (129, 14 )


2

X − μ 100 − 129
Z = = = −2.0714
σ 14

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 9/19
11/07/2021 Distribuição Normal (Gaussiana)

P(X < 100) = ϕ(−2.0714) = 0.01916072

Code

[1] 0.01916072

c. Em qual tempo a probabilidade de uma cirurgia ACL em um hospital com alto volume de
cirurgias é igual a 0.95?

Code

[1] 1.644854

Code

[1] 152.028

O tempo em que 95 % das cirurgias irão acabaram é dentro de 152.028 minutos.

d. Se uma cirurgia requer 199 minutos, o que você conclui sobre o volume de tais cirurgias
em um hospital? Explique.

De acordo com a distribuição sabemos que menos de 5 % das cirurgias irão demandar tal
quantidade de tempo. Observe a figura abaixo e conclua.

Code

Exemplo - Normal 2

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 10/19
11/07/2021 Distribuição Normal (Gaussiana)

Numa ilha existem três modelos de automóveis disponíveis para compra, um de cada uma das
seguintes marcas: A, B e C. Segundo os fabricantes, e tendo em conta as características da rede
de estradas local, o consumo dos referidos automóveis (em litros aos cem km) é caracterizado
pelas seguintes distribuições:
2
A ∼ N (10, 1 )
2
B ∼ N (11, 1.5 )
2
C ∼ N (8, 1.25 )

Um determinado Senhor, residente da ilha, possui um automóvel da marca C, dois da marca A e


três da marca B. O referido Senhor tem por costume escolher na segunda-feira de manhã o
automóvel que vai utilizar ao longo da semana.

a. Sabendo que na última semana o automóvel utilizado gastou em média mais de 10 litros
(aos cem km), calcule a probabilidade de ter sido um automóvel da marca A o escolhido.
b. Qual a probabilidade de o consumo de um automóvel da marca C ser pelo menos 1 litro
inferior ao consumo de um automóvel da marca A?

Solução

a - Sabendo que na última semana o automóvel utilizado gastou em média mais de 10 litros
(aos cem km), calcule a probabilidade de ter sido um automóvel da marca A o escolhido.

A questão pode ser respondida utilizando o teorema de Bayes. Imagine o espaço amostral
particionado com eventos mutuamente exclusivos (carros), agora suponha o evento de interesse
ocorrendo neste espaço amostral (X > 10 ), onde X = consumo, v.a. contínua com
distribuição normal. Podemos representar esse cenário (partições) de acordo com a figura abaixo
e suas probabilidades.

2
P(A) =
6

3
P(B) =
6

1
P(C ) =
6

Dado que o consumo foi maior do que 10 litros/100 km, X > 10 , qual é a probabilidade de ter
sido o carro A o escolhido, ou seja,
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 11/19
11/07/2021 Distribuição Normal (Gaussiana)

P(A). P(X > 10|A)


P(A|X > 10) =
P(X > 10)

P(A). P(X > 10|A)


P(A|X > 10) =
P(A). P(X > 10|A) + P(B). P(X > 10|B) + P(C ). P(X > 10|C )

Para calcularmos as probabilidades condicionais temos,

Code

P(X > 10|A) = 0.50

P(X > 10|B) = 0.7475075

P(X > 10|C ) = 0.05479929

Code

P(X>10|A) = 0.5

Code

P(X>10|B) = 0.7475075

Code

P(X>10|C) = 0.05479929

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 12/19
11/07/2021 Distribuição Normal (Gaussiana)

Assim temos que,

P(A). P(X > 10|A) (2/6)(0.5)


P(A|X > 10) = = = 0.303
P(X > 10) (2/6)(0.5) + (3/6)(0.748) + (1/6)(0.0548)

A probabilidade de ter sido escolhido o carro A, dado que X > 10 ocorreu é de 0.303 ou 30.3 %.

b - Qual a probabilidade de o consumo de um automóvel da marca C ser pelo menos 1 litro


inferior ao consumo de um automóvel da marca A?

Nesta questão vamos que utilizar a distribuição da diferença entre variáveis aleatórias, ou seja a
distribuição da diferença entre o consumo do carro C e A. Como consequência teremos uma
nova distribuição normal, sendo C e A normais, e aplicaremos a propriedade da linearidade do
valor esperado e da variância para determinar os parâmetros desta nova distribuição.

Assim temos que a nova variável aleatória é D onde,

D = C − A

Sabemos que D possui distribuição normal, com média e variância / desvio padrão.

Calculando os parâmetros,

E[C − A] = E[C ] − E[A]

V (C − A) = V (C ) + V (A)

Substituindo,

E[D] = E[C ] − E[A] = 8 − 10 = −2

2 2
V (D) = V (C ) + V (A) = (1) + (1.25) = 2.5625

DP (D) = 1.60

Dessa forma a distribuição da v.a. D representa a diferença no consumo do carro C em relação


ao carro A.

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 13/19
11/07/2021 Distribuição Normal (Gaussiana)

Para calcularmos a probabilidade de o consumo de um automóvel da marca C ser pelo menos 1


litro inferior ao consumo de um automóvel da marca A,

P(D < −1) = 0.7340145

Intepretação:

Considere o seguinte,

se D = 0 significa que o consumo dos dois automóveis C e A não se diferenciam


se D = 1 significa que o consumo de C é 1 litro superior ao de A
se D = −1 significa que o consumo de C é 1 litro inferior ao de A
na média o consumo de D é de 2 litros inferior ao de A (μ = −2 )

Assim,

Code

P(D < -1) = 0.7340145

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 14/19
11/07/2021 Distribuição Normal (Gaussiana)

(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR)

Este conteúdo
está disponível por meio da Licença Creative Commons 4.0

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 15/19
11/07/2021 Distribuição Normal (Gaussiana)

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 16/19
11/07/2021 Distribuição Normal (Gaussiana)

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 17/19
11/07/2021 Distribuição Normal (Gaussiana)

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 18/19
11/07/2021 Distribuição Normal (Gaussiana)

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html 19/19

Você também pode gostar