Você está na página 1de 24

Distribuição Log - Normal

Muitas distribuições de frequência relacionadas a medidas não se


apresentam em uma forma simétrica.

Em geral é possível encontrar uma mudança de variável que faça


Com que a distribuição seja, aproximadamente, Normal.

Seja uma grandeza x , se ln x tem uma distribuição Normal, então


x tem uma distribuição chamada Log – Normal dada por:

f ( x )=
1 1
σ √2π x
exp
[ 1
2σ 2
( ln x µ )2
]
Distribuição de probabilidade e distribuição acumulada

Definida em termos dos parâmetros µ e σ


µ = 10

σ = 0,1 ; 0,3 ; 0,5


Mesma distribuição com escala logarítmica
Média Geométrica

Relacionamos a Média Aritmética com a Média Geométrica ( x g )

1
x = xg exp 
2
(ln s g ) 
2

Sg é o desvio padrão geométrico

s = X acum
(84,1%)
g
X acum
(50%)
Xacum (84.1%) ≡ valor de log (x) correspondente a frequência acumulada 84.1%
Xacum (50%) ≡ valor de log (x) correspondente a frequência acumulada 50%.
Ajustando os dados experimentais no gráfico,
podemos fazer nossa estimativa usando a equação

 1  (50%) X acum (84,1%) 


X
sg = log  2  (15,9%) +
acum

  X acum X acum( 50%) 

A relação entre o desvio padrão geométrico e o desvio padrão é dada por:

Sg = ln(S)

Observação: Xacum(50%) = xg
conjunto de dados plotados no papel probabilístico Log-Normal

1 ln x
|______|______|
Sg Sg

desvio padrão geométrico obtido graficamente.

O intervalo que abrange um desvio padrão geométrico


em torno da média geométrica é dado por

[ x g /s g ; x g s g ]
Distribuição t de Student

• É muito usada em teste de hipóteses.

• Foi desenvolvida por W. S. Gosset sob o pseudônimo


de Student.

• Partindo de amostras pequenas n ≤ 30 de uma


população com comportamento Gaussiano (Normal):
N(µ,σ)
Partindo de pequenas amostras:

Construímos intervalos de confiança usando Dist. Normal se,


a população tem comportamento normal e σ é conhecido.

Quando σ não é conhecido podemos usar a t de Student.

Calculamos o desvio padrão amostral S e média amostral x

Construímos uma nova variável aleatória t definida por:

x µ
t=
S / √n 1
cuja Distribuição de Probabilidade é:

Γ ( )
ν+1
( ν+1 )
Distribuição
P (t )=
1 2
√νπ Γ ν ( )
1+
t2 2 t de Student

2() ν

com ν graus de liberdade.

Obs: o número de graus de liberdade, para um conjunto


de dados, corresponde ao número de valores que podem
variar após terem sido impostas certas restrições a todos
os valores.
Exemplo:

Amostra de 10 elementos com média 80.

Conhecendo 9 elementos o elemento 10 pode ser calculado.

Portanto,
ν = n-1
Condições de uso:
• Amostra de tamanho pequeno n ≤ 30
• σ desconhecido
• população original com distribuição
essencialmente normal (observação de
histogramas)
Tabela da distribuição t

n=1 n=2

n = 30 n = 100
Curtose
A curtose é uma medida de dispersão que caracteriza o "achatamento"
da curva da função de distribuição. É normalmente definida como:
M4
4
3
σ
Onde M 4 é o quarto momento e σ é o Desvio padrão.

•Se o valor da curtose for = 0, então tem o mesmo achatamento que a


distribuição normal. Chama-se a estas funções de mesocúrticas;

•Se o valor é > 0 então a distribuição em questão é mais alta (afunilada)


e concentrada que a distribuição normal. Chamamos de leptocúrtica;

•Se o valor é < 0 então a função de distribuição é mais "achatada" que


a distribuição normal. Chamamos de platicúrtica.
Distribuição t de Student : t de Student (n) versus N (0,1)
Graus de Desvio
Liberdade Padrão Curtose
5 1.2910 9.0000
10 1.1180 4.0000
20 1.0541 3.3750
30 1.0351 3.2308
50 1.0206 3.1304
60 1.0171 3.1071
70 1.0146 3.0909
80 1.0127 3.0789
90 1.0113 3.0698
100 1.0102 3.0625
Na tabela obtemos os valores de t 1/2

A margem de erro para a estimativa de µ é:

E=t 1/2 S / √n
onde t 1/2 tem ν = n-1 graus de liberdade.

O intervalo de confiança para a estimativa de µ é:

x E<µ< x +E
Exemplo: teste de colisão
Início

Pelo teorema do limite central podemos


sim usar a distribuição normal com
N>30?
E=z α /2 σ / √n
(se σ é desconhecido, use s)
não

A população tem Utilize métodos não-


não paramétricos que não exijam
distribuição
normal? uma distribuição normal

sim
O valor
de σ é
sim Use a distribuição normal com
conhecido?
E=z α /2 σ / √n
não

Use a distribuição t com


E=t α/ 2 S / √n
Exemplo

Em testes de colisão feitos em 15 minivans, os custos de


conserto apresentam uma distribuição aproximadamente em
forma de sino, com média de 5000 reais e desvio padrão de 2000
reais. Construa um intervalo de confiança de 99% para o custo
médio de conserto para as colisões de todos os veículos desse
tipo.
No caso de usar a distribuição normal na estimativa:

Se n>30 podemos substituir σ pelo desvio padrão


amostral s na fórmula.

Se n<30 a população deve ter distribuição normal, e


devemos conhecer σ para aplicar a fórmula.

Determinação de tamanho de amostra


2
 zα / 2σ 
n=  
 E 
Caso n seja fracionário arredonde para cima.

No caso de pequenas amostras usamos t de student


com s no lugar de sigma.
Exemplo: Qual o tamanho da amostra que deve ser coletada
por um pesquisador, que deseja trabalhar com um nível de
confiança de 95% e um erro na estimação menor que 0,06?
Supõe-se que σ = 0,5.
Estimativa de uma proporção populacional

Ex: Estimar a proporção de motoristas embriagados para uma seguradora.


Estimar a proporção de teleespectadores de uma final de campeonato.

P = proporção populacional

x (proporção amostral de x sucessos em uma amostra de tamanho n


̂p=
n
A margem de erro da estimativa de p é

E=z α / 2
√ ̂q
p
n
̂

Consequentemente, o intervalo de confiança para a proporção populacional


p é dado por
pˆ − E < p < pˆ + E
Exemplo:

Pesquisadores de opinião são atormentados por fatores


adversos como secretárias eletrônicas. Uma pesquisa
junto a 1068 americanos, 673 informaram ter secretária
eletrônica (dados da International Mass Retail
Association relatados no USA Today). Com esses dados
determinar:

a)A estimativa pontual da proporção populacional de


todos os americanos que têm secretária eletrônica.
b)A estimativa intervalar de 95% da proporção
populacional de todos os americanos que têm secretária
eletrônica.
Determinação do tamanho da amostra

Vamos determinar o tamanho necessário da amostra para achar o valor aproximado


de uma proporção populacional.

Partimos da expressão da margem de erro

E=z α / 2
√ ̂ q̂
p
n
E resolvemos em relação a n para obter o tamanho da amostra

n=
[ z α / 2 ] ̂p q̂
E2

Desconhecendo uma estimativa para ̂p :


2
[ z α/2 ] 0.25
n= 2
E
Exemplo:

Um estudo de saúde envolve 1000 mortes selecionadas


aleatoriamente, dentre as quais 331 causadas por doenças
cardíacas (co base em dados do Center for Disease
Control).

a.Com os dados amostrais, construa um intervalo de


confiança de 99% para a proporção de todas as mortes
causadas por doenças cardíacas.
b.Utilizando os dados amostrais como estudo piloto,
determine o tamanho da amostra necessário para estimar
a proporção de todas as mortes causadas por doenças
cardíacas. Admita um nível de confiança de 98%, em que o
erro da estimativa não supere 0,01.

Você também pode gostar