Escolar Documentos
Profissional Documentos
Cultura Documentos
DADOS → INFORMAÇÃO
Estatística Descritiva ou
Análise Exploratória de Dados Exemplo:
Inferência Estatística ou
Estatística Inferencial Exemplo:
1
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Dados primários são aqueles obtidos • Dados em corte (transversal) são aqueles
de forma direta, mediante observação, referentes ao mesmo instante de tempo.
pesquisas ou experimentos controlados.
• Dados de séries temporais são aqueles
• Dados secundários são aqueles que não registrados ao longo de um período de
são obtidos diretamente, e sim mediante tempo, com determinada frequência.
publicações (como relatórios ou artigos).
2
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Neste exemplo, se a avaliação fosse por notas • Dados em escala discreta são
de 1 a 5, as notas também seriam classificadas provenientes de uma contagem.
como dados qualitativos em escala ordinal! Exemplo: número de filhos.
3
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
4
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
5
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Exemplo 1.3
É muito frequente a confusão de histograma
Frequências de reclamações diárias no
com gráfico de barras, mas note que são
SAC de uma empresa em um certo mês:
ferramentas para tipos distintos de dados.
6
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Exemplo 1.5:
Gráfico de Setores Circulares
• Medidas de Posição
Média
Uma medida de posição é um valor em
torno do qual os dados estão concentrados. É a soma das observações dividida
pelo número de observações:
n
Sinônimos: medida de localização ∑x i x 1 + x 2 + ... + x n
ou de tendência central. µ= i =1
= .
n n
Principais medidas de posição:
no de i-ésima
Média , Mediana e Moda. observações observação
7
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Exemplo 1.6:
No exemplo 1.1, o faturamento médio
é µ = 307,7/30 = 10,3 milhões. Salários de economistas recém-formados
(em R$ 1.000): 2,8; 6,0; 2,6; 3,1; 3,0.
Note que o valor 10,3 não ocorre.
Salário médio (dos 5 economistas):
µ = 3,5 (R$ 3.500,00).
Nenhum problema!
A média de um conjunto de dados não
Este número é representativo
precisa ser um dos valores observados.
dos salários destes 5 economistas?
8
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
∑ ω jx j i =1 p0
j=1 ω1x 1 + ω2 x 2 + ... + ωk x k
µp = = .
k
∑ ωj ω1 + ω2 + ... + ωk
p i0 q i0 valor no
j=1 ωi = n
. período-base
9
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
10
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
11
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
12
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
n ∑ ( x − µ)i
é a amplitude = máximo - mínimo. ∑ ( x − µ) ou i =1
.
i
i =1 n
Uma forma mais completa de definir
uma medida de dispersão é: valor que Problema:
nos informa o quanto os dados variam n
∑| x
i =1
i −µ|
DM = .
n
As mais simples são o módulo e o quadrado.
Esta medida possui alguns inconvenientes,
sendo usual tomar os quadrados dos desvios.
σ2)
Variância (σ Forma alternativa para o cálculo de σ2:
13
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
99,72%
Regra Z
σ= σ . 2
para identificar
outliers: valores
que estejam fora
No exemplo 1.9, para o fornecedor A: σ = de [µ-3σ,µ+3σ].
6,72 dias, e para o fornecedor B: σ = 1,10 dias.
O desvio padrão preserva a unidade original
dos dados e ainda possui interpretação direta.
13
17
21
25
29
33
37
41
45
49
-2
Neste contexto, o desvio padrão é uma medida -4
-6 média da
do risco do ativo, chamada volatilidade. -8 ação B
média da DIAS
ação A Em compensação, a flutuação dos retornos
da ação B é bem maior → maior desvio
padrão = medida de risco = volatilidade.
14
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Variância para Dados Agrupados Exercício 1.4 - Calcule a variância dos pesos
Quando os dados estão disponíveis na forma de na população do exercício 1.2, com base
distribuição de frequências (isto é, agrupados), apenas na distribuição de frequências:
só é possível obter a variância por meio de uma Classe Frequência
aproximação, a partir da média dos quadrados 50 Kg
40 | 2
dos desvios dos pontos médios das k classes em 60 Kg
50 | 5
relação à média, ponderados pelas frequências: 70 Kg
60 | 7
k
80 Kg
70 | 8
∑ ω j ( x j − µ)
2
90 Kg
80 | 3
j=1
σ2 ≅ .
n R: 128.
15
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
∑ (x
n
− c) 2
i =1
i
∑x i −c
. i =1
.
n n
Exemplo 1.12 - Suponha que estejamos O desvio padrão dos salários dos gerentes
interessados em estudar a variabilidade de foi igual ao dos salários dos auxiliares
salários em diferentes ramos de atividade de escritório, ambos iguais a 100.
profissional. Como um caso extremo, Isto indica variabilidade alta ou baixa?
considere a comparação entre salários
de gerentes e de auxiliares de escritório. No caso dos auxiliares de escritório, cujos
salários estão em torno de R$ 500,00, é alta.
Sabe-se que o salário médio dos
gerentes é de R$ 5.000,00 e o dos Já para os gerentes, cujos salários estão em
auxiliares de escritório é de R$ 500,00. torno de R$ 5.000,00, é relativamente baixa.
16
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
17
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Conclusões a respeito de
• Outras Medidas Importantes
transformações nos dados:
Medidas de posição e de dispersão, embora
A média é sensível a transformações
muito importantes, não são as únicas medidas
tanto de escala, tanto de origem.
resumo que descrevem um conjunto de dados.
A variância e o desvio padrão são
invariantes à transformações de origem. Para uma análise mais completa, em algumas
situações específicas, podemos precisar de
O coeficiente de variação é invariante
medidas mais sofisticadas, como assimetria,
a transformações de escala (e esta é outra
curtose e percentis (= quantis = separatrizes).
propriedade importante desta medida!).
∑ ( x i − µ) 3 e ∑ (x i − µ) 4
a= i =1
k= i =1
Aspecto achatado, com aspecto pontiagudo, com nσ 3 nσ 4
valores distribuídos de valores concentrados em um
modo uniforme (k<3). intervalo pequeno (k>3).
18
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Cálculo de Percentis a
Um importante caso particular são os
Partir de Dados Agrupados
quartis = medidas Q1, Q2 e Q3 que
dividem os dados em 4 partes iguais. Exemplo 1.13 - Considere a seguinte
distribuição de frequências dos consumos
domiciliares mensais de energia elétrica:
Faixas de Consumo Frequência Relativa
0 | 50 KWh 8%
50 | 100 KWh 12%
100 | 150 KWh 32%
150 | 300 KWh 40%
300 | 500 KWh 8%
Total: 100%
0 | 50 KWh 8%
50 | 100 KWh 20%
100 | 150 KWh 52%
150 | 300 KWh 92%
300 | 500 KWh 100%
19
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
150 − 100 52 − 20
= .
h 50 − 20
150 − 100 52 − 20
= .
h 25 − 20
20
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
21
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
1. Comparar dispersões (via amplitudes A partir das distâncias da mediana aos quartis.
interquartílicas) de dois conjuntos de dados.
Se a mediana está mais próxima de Q1,
2. Identificar a presença de assimetria os dados apresentam assimetria positiva.
(e o tipo dela – se é positiva ou negativa),
Se a mediana está mais próxima de Q3,
por meio de uma regra mais precisa do que
os dados apresentam assimetria negativa.
a regra baseada nas medidas de posição.
22
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Exercício 1.6 - As idades das mulheres Obs1 - Por que quem está fora dos
com 40 anos ou mais, em uma localidade, limites LI e LS é considerado outlier?
apresentam Q1 = 49, Md = 54 e Q3 = 63. A
mais velha tem 71 anos. Obtenha o box-plot. Por que estes limites são construídos de
tal forma que, se os dados seguirem uma
distribuição Normal, aproximadamente
Solução: 99,3% dos dados estarão contidos em [LI,LS]
(aproximando-se, desta forma, da regra Z)
• Análise Bidimensional
Diagrama de Dispersão
É a análise estatística que envolve 2 variáveis.
23
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Interpretação da Covariância:
Covariância
Uma covariância positiva nos diz que
quando X tende a variar acima de sua média
A covariância é uma medida da (xi>µ X), Y também tende (yi>µ Y), e quando
variabilidade conjunta de X e Y. X tende a variar abaixo de sua média
(xi<µ X), Y também tende (yi<µ Y), ou seja:
Fórmula:
n X e Y variam no mesmo sentido.
∑ (x i − µ X )( y i − µ Y )
Uma covariância negativa significa
σ XY = i =1
. que X e Y variam em sentidos opostos.
n
24
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Coeficiente de Correlação
A covariância evidencia o sentido da relação
entre as variáveis, mas o interesse maior
costuma ser medir a força desta associação. O coeficiente de correlação é um
número entre -1 e 1, que mede a força
da associação linear entre X e Y.
25
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Se a relação linear entre X e Y for positiva, Se a relação linear entre X e Y for negativa,
mas não perfeita, a correlação está entre 0 e 1. mas não perfeita, a correlação está entre -1 e 0.
Neste caso, quanto maior a intensidade da Neste caso, quanto maior a intensidade da
associação, mais próximo ρXY está de 1. associação, mais próximo ρXY está de -1.
26
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Estimação Pontual
População Parâmetro
27
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
A seleção de cada aluno, e o registro da O conjunto de v.a.`s: {X1, X2, ..., Xn}
sua altura, é um experimento aleatório. é o que se denomina amostra.
Temos então n experimentos aleatórios.
Amostra Estimador
28
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
P (µ − ε < X < µ + ε)
Se a população é Normal, a
29
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
E ( X ) = µ, e assim X
B(θˆ ) = E (θˆ ) − θ.
é não viciado para µ.
do inglês: bias = vício
Isto mostra que o resultado do
exerc. 2.1 não foi coincidência!
Demonstração:
Embora a ausência de vício seja uma
propriedade importante, ela não garante
1 n 1 n que um estimador seja adequado.
E(X) = E( ∑ Xi ) = E(∑ Xi ) =
n i=1 n i=1
1 n 1
∑ E(Xi ) = nµ = µ.
n i=1 n A variância também é importante, pois
mede a dispersão em torno do parâmetro.
distribuição de µˆ 1
P(µ − ε < µˆ < µ + ε),
distribuição de µˆ 2
para um ε arbitrário, > 0.
µ-ε µ µ+ε
30
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
n
n n
∑ (X − X ) ∑ X − nX
2 2 2
i i Prova:
σˆ * =
2 i =1
= i =1
.
n n
∑ X 2 − nX 2
( )
n
i 1 n 2
Problema: E i =1 = E ∑ X i − nX 2 =
n n i =1
o estimador acima é viciado.
=
1 n
n i=1
(( )
E ∑ X i2 − E(nX 2 ) = ) Usaremos os seguintes resultados:
V (X i ) = E (X i2 ) − E 2 (X i ) ⇒
1 n
n
∑
i =1
(
E(X i2 ) − nE(X 2 ) ) E(X i2 ) = V( X i ) + E 2 (X i ) = σ 2 + µ 2 .
V ( X ) = E(X 2 ) − E 2 ( X ) ⇒
?
? σ2
E (X ) = V ( X ) + E ( X ) = + µ 2 .
2 2
31
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Retomando a demonstração:
1 σ
2
n (σ 2 + µ 2 ) − n + µ 2 =
n
( )
n
∑ E(X i ) − nE(X ) =
1 n 2 2
n i =1
1
(nσ 2 + nµ 2 − σ 2 − nµ 2 ) =
n
1 n 2 σ
2
∑ (σ + µ ) − n + µ 2 =
(nσ 2 − σ 2 ) = n − 1 σ 2 ≠ σ 2 .
2
1
n i=1 n n n
32
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
υ
1 −1 −
x
Valor Esperado e Variância:
f (x) = υ x 2 e 2 ; x > 0; υ > 0.
2 2
π
E(X) = υ
υ
V(X) = 2υ
Parâmetro: υ (graus de liberdade)
Notação: X ~ χ 2υ .
E (n − 1) 2 = ( n − 1) V (n − 1) 2 = 2(n − 1)
σ σ
(n − 1) (n − 1) 2
E(S2 ) = (n − 1) ⇒ E(S2 ) = σ 2 . ( ) ( ) 2σ 4
V S 2
= 2 ( n − 1) ⇒ V S 2
= .
(n − 1)
2
σ σ4
33
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
proporção p̂ = i =1
= X.
celular que desenvolvem câncer cerebral. n
amostral
1 n 1 n 1 n 1
2 n
1
2 n
E(p̂) = E( ∑
n i=1
Xi ) = E(∑ Xi ) =
n i=1 V(p̂) = V( ∑Xi ) = V(∑Xi ) = ∑V(X ) =i
n i=1 n i =1 n i =1
n n
1 1 1
∑ E(Xi ) = ∑ p = np = p. p(1− p)
2 n
1 1
n i=1 n i=1 n
n
∑p(1− p) = n
i =1
2
np(1− p) =
n
.
p(1 − p)
p̂ ≈ N p, . 1. É um estimador não viciado para p.
n
2. Tem distribuição amostral
aproximada para n grande. assintoticamente Normal (T.C.L.).
Padronizando: Z =
p̂ − p 3. Sua variância decresce quando n
≈ N (0,1). cresce, como também ocorre com X.
p(1 − p)
(isto é muito importante, como será visto)
n
34
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Comparação de Estimadores
V(θˆ 2 )
Ef (θˆ 1 , θˆ 2 ) = . Se Ef = 1, os estimadores
V(θˆ 1 ) são igualmente eficientes.
35
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
E (θˆ − θ) 2 .
Se o estimador é não-viciado, então o
Esta medida é chamada erro quadrático EQM e a variância são a mesma coisa.
médio, em geral abreviado por EQM.
36
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Demonstração :
E(θˆ − E(θˆ ) ) + 2(E(θˆ ) − θ)E (θˆ − E(θˆ ) ) + (E(θˆ ) − θ) =
2 2
Esta fórmula serve tanto para estimadores
Exemplo 3.3 - Dada uma AAS de tamanho Exercício 3.1- Para estimar a variância
n = 3, considere os seguintes candidatos a de uma população Normal, considere:
estimadores para a média populacional µ: n
∑ (X i − X ) 2
X1 + X 2 + X 3 σˆ =
2 i =1
µˆ 1 = X = *
n
(viciado) e
3
n
X1 + 2 X 2 + X 3 ∑ (X i − X ) 2
e µˆ 2 = .
3 S2 = i =1
(não viciado).
n −1
Calcule a eficiência relativa.
µ2 ( n − 1)( 2 n − 1)
R :2+ . Verifique que : Ef (S 2 , σˆ *2 ) = .
3σ 2 2n 2
n − 1 2σ 2(n − 1)σ 4
2
Caminho para a resolução: O EQM 4
EQM(σˆ ) = V(σˆ ) + −
2
*
2
*
n −1 2 n −1
2
n
σˆ =
2
S ⇒ V (σˆ *2 ) = 2
V(S ).
*
n n 2(n − 1)σ 4 σ 4 (2n − 1)σ 4
= + 2 = .
n2 n n2
sendo que a variância de S2 já foi obtida,
Dividindo por V(S2) e manipulando,
no caso de populações Normais. Assim:
chega-se ao resultado proposto.
37
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
38
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Fórmula do Limite
O UMVUE só será eficiente se Inferior de Cramér-Rao:
sua variância for igual ao LICR.
1
LICR (θ) = .
I(θ)
Assim, nem todo UMVUE é eficiente,
mas todo estimador eficiente é UMVUE. Informação de Fisher
39
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
1
Prova de que é viciado para λ :
Exemplo 3.5 - Seja uma AAS de uma X
população Expo(λ). Verifique se 1
Usando a desigualdade de Jensen para g(X) = :
ˆλ = 1 / X é um estimador eficiente para λ. X
1
E(g(X)) > g(E(X)), pois é convexa.
Solução: X
1 1 1
Então : E > = = λ.
X E(X) 1/λ
λˆ = 1 / X é viciado (slide seguinte),
e assim não tem como ser eficiente. Daí :
1 1
E > λ ⇒ sobrestima λ.
X X
40
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Solução: n θ2
I(θ) = ⇒ LICR ( θ) = .
θ2 n
Obs - X é não viciado para θ e sua variância
é igual a θ2/n. O que temos que fazer é Que é igual à variância do estimador. Logo,
compará-la com o LICR(θ), obtido a seguir. o estimador proposto é eficiente para θ.
Solução:
Exemplo 3.6 - Seja uma AAS de uma
população Bernoulli(p). Verifique se
P( X) = p X (1 − p)1−X ⇒ ln(P (X )) = X ln p + (1 − X) ln(1 − p).
p̂ = X é um estimador eficiente para p. dln(P( X)) X (1 − X ) X−p
⇒ = + (−1) = .
dp p 1− p p(1 − p)
Solução:
E (X − p )
2 2
dln(P (X )) X−p
2
V( X)
E = E = 2 = 2
Obs - p̂ = X é não viciado e sua variância dp p (1 − p ) p (1 − p ) 2
p (1 − p) 2
é igual a p(1-p)/n. O que temos que fazer é 1 n p(1 − p)
= ⇒ I ( p) = ⇒ LICR( p) = .
compará-la com o LICR(p), obtido a seguir. p(1 − p) p(1 − p) n
41
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Seja então p o parâmetro original e θ = g(p) a Exemplo 3.7 - Seja uma AAS de uma
função para a qual desejamos calcular o LICR. população Bernoulli(p). Encontre o limite
inferior de Cramer-Rao para θ = p(1-p).
Utilizando a fórmula:
Exercício 3.4 - Seja novamente uma
AAS de uma população Bernoulli(p).
[g`( p)]2 dg (p)
LICR (g ( p)) = , sendo g`( p) = .
I( p) p = g −1 ( θ )
dp
Calcule o LICR para θ = 1/p
42
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Estimador Linear
Esta afirmação é: dentre todos os estimadores
lineares não viciados, a média amostral é o
melhor (mais eficiente ou de menor variância). Estimador linear é uma função linear
das variáveis aleatórias da amostra:
n
Tecnicamente, dizemos que ele é o BLUE θˆ = ∑ ci X i
(Best Linear Unbiased Estimator). i =1
43
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
∑c i = 1.
mínima se c i = 1 / n para todo i. i =1
∑k
i =1
i = 0. Nosso problema, então, reduz-se a minimizar:
2
n
1
∑ + ki
i =1 n
∑
i =1 n
+ k i
= ∑
i =1 n
+ 2
n
k i + k 2
i
∑k 2
i = 0.
i =1
2
n
1 2 n n
1 n
= ∑ + ∑ k i + ∑ k i2 = + ∑ k i2 ,
i =1 n n i=1 i=1 n i=1 O que só acontece se ki = 0, para todo i.
n
pois ∑k
i =1
i = 0. Assim: ci = 1/n + ki = 1/n, c.q.d.
44
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
45
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
46
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Assim:
σ2
[ σ2
P X −µ ≥ ε ≤ 2 .
nε
] Como Lim
n →∞ nε 2
= 0, temos:
n →∞
[
Lim P X − µ ≥ ε ≤ Lim ] n →∞
σ2
nε 2
.
Estimadores e suas Propriedades - Estimadores e suas Propriedades -
Prof. Eduardo Lima Campos. Prof. Eduardo Lima Campos.
[ ]
assintoticamente ou (2) É viciado, mas:
Lim P X − µ ≥ ε = 0 , c.q.d.. não viciado.
n →∞
Lim
n →∞
B(θˆ ) = 0 e Lim
n →∞
V(θˆ ) = 0.
Estimadores e suas Propriedades -
Prof. Eduardo Lima Campos.
[ V(θˆ )
P θˆ − θ ≥ ε ≤ 2 .
ε
]
Estimadores e suas Propriedades -
Prof. Eduardo Lima Campos.
47
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
n →∞
[ˆ ]
n →∞
V (θˆ ) Lim
Lim P θ − θ ≥ ε ≤ Lim 2 =
ε
n →∞
V(θˆ )
ε2
. Verifique se o estimador (não
viciado) a seguir é consistente.
De tal forma que, se Lim V (θˆ ) = 0, n
n →∞
∑ (X i − X)2
S =
2 i =1
.
LimP[| θˆ − θ |≥ ε] ≤ 0 n −1
n →∞
A condição (2) é algumas vezes denominada Obs - Por que a condição (2) equivale a
(de forma inadequada!) convergência em Lim EQM (θˆ ) = 0 ?
média quadrática ou consistência em EQM. n →∞
48
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
n →∞
[
ˆ ]
Lim P θ − θ ≥ ε ≤ Lim
n →∞
EQM (θˆ ) Lim
ε2
= n →∞
EQM (θˆ )
ε2
. Verifique se o estimador
viciado) a seguir é consistente.
De tal forma que, se Lim EQM (θˆ ) = 0, n
n →∞
∑ (X i − X) 2
σˆ *2 = i =1
.
LimP[| θˆ − θ |≥ ε] ≤ 0 n
n →∞
θ
ˆ
2 P lim(θ
ˆ )
2 que c(n) é uma função determinística de n.
49
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
50
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
λ 2e − λ
P(X = 2) = .
Mas o problema aqui é inverso: 2!
51
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
0
A idéia do método a ser apresentado é
0,01
0,64
1,27
1,9
2,53
3,16
3,79
4,42
5,05
5,68
6,31
6,94
7,57
8,2
8,83
9,46
10,1
10,7
11,4
12
12,6
13,2
13,9
14,5
buscar o valor de λ que maximiza L(λ).
0,2
• Função de Verossimilhança (caso discreto) Exemplo 5.1 (cont.) no caso de uma AAS
de tamanho n de uma população Poisson(λ):
n
O produto é pelo fato de ser uma ∑ xi
AAS (v.a.´s independentes!) λ i=1 e −nλ
n L (λ ) = .
P(X1 = x1 , X2 = x 2 ,...,Xn = x n ) = ∏ P(Xi = xi ),
n
i =1
∏x ! i
∀(x1,x2,...,xn). i =1
52
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
l(λ) = ln n = ∑ x ln λ − nλ + c
é o mesmo que maximiza L(λ). i =1 i
∏ x i!
i =1
Nos casos práticos, é bem mais fácil derivar
(e, portanto, maximizar) l(λ) do que L(λ).
Maximizando a Função
de Log-Verossimilhança: Exemplo 5.1 (cont.) - A derivada da função
de log-verossimilhança encontrada é:
O ponto de máximo de l(λ)
é o valor de λ tal que: n
∑ xi
l`(λ) = 0 e l``(λ) < 0. l`(λ) = i =1
−n
λ
Um facilitador: em geral, l(λ) é
côncava, o que garante que: l``(λ) < 0,
∀ λ. Portanto, basta resolver: l`(λ) = 0.
n λˆ MV = X.
∑ xi
cuja solução é: λ = i =1
= x.
n
53
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
n i =1
L(λ) = ∏ f (x i ) = Derivando e igualando a zero :
i=1
n
∑xi n n n 1
n −λ
l`( λ ) = − ∑ xi = 0 ⇔ λ = n = .
∏λe =λe
−λx i n i=1
. λ
i=1
i =1
∑ xi x
i =1
54
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Obtenha o EMV de p.
1
λˆ MV = .
X R:
p̂ MV = X.
Solução:
A função de verossimilhança é:
n
A idéia aqui é derivar a função de log- L(µ, θ = σ2 ) = ∏ f (x i ) =
verossimilhança em relação a µ e θ = σ2 i=1
n
( x i −µ ) 2
(que são os parâmetros a serem estimados). n −
1 ( x −µ ) 2
− i −
n − ∑
∏ (2πθ) e =(2πθ) e
2θ 2θ
2 2 i=1
.
i =1
55
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Derivando em relação à µ:
A função de log-verossimilhança é:
n
∂l(µ, θ) ∑ (x i − µ)
n −∑ ( xi −µ)
n 2
= i=1 .
− 2θ ∂µ θ
l(µ, θ) = ln (2πθ) e2 i=1
=
n Igualando a zero:
n ∑(xi − µ) 2
− ln(2πθ) − i=1
n
2 2θ
.
∑ (x
i =1
i − µ) = 0 ⇔ µ = x ⇒ µˆ MV = X.
Derivando em relação à θ:
Assim, os EMV`s de µ e σ2 da Normal são:
n
∑ (xi − µ)
2
∂l(µ, θ) n
= − + i=1 µˆ MV = X.
∂θ 2θ 2θ2 n
θ= i =1
. Obs - note que o EMV de σ2 é viciado.
n
56
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
q̂ MV = 1 − p̂ MV = 1 − X.
Obtenha o EMV de α. n
l(α) = nln(α) + (α −1)∑ln(x i ).
i=1
n
R : αˆ MV = −
n
n n
n
. l`(α) = + ∑ln(x i ) = 0 ⇔ α = − .
∑ ln(X i ) α i=1 n
i =1 ∑ln(x )
i=1
i
57
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Bernoulli : p̂ MM = X.
No caso de populações com 2 parâmetros
Poisson : λˆMM = X.
(ex.: Normal), o estimador de momentos é
1
exponencial : λˆ MM = . obtido igualando os 2 primeiros momentos
X populacionais - E(X) e E(X2) - aos
1 respectivos momentos amostrais.
geométrica : p̂ MM = .
X
Exercício 5.3 - Seja uma AAS de Dica para a solução do exercício 5.3:
tamanho n de uma população N(µ,σ2).
Para obter o estimador da variância, você
precisará usar que E(X2) = V(X) + E2(X), e:
Obtenha os estimadores de
momentos de µ e σ2. n n
∑X 2
i ∑X 2
i
n σ2 + X 2 = i =1
⇒ σˆ 2MM = i =1
− X2
n n
∑ (X i − X ) 2 n n
R : µˆ MM = X e σˆ = i =1
∑X ∑ (X
2
MM
n
. 2
i − nX 2 i − X)2
= i =1
= i =1
.
n n
58
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
R : σˆ 2
MM = i =1
= σˆ 2MV . consistentes dos momentos populacionais.
n
Exercício 5.5 - Seja uma AAS de tamanho Exercício 5.6 - Seja uma AAS de
n de uma população referenciada pela tamanho n de uma população Gama (α,β).
distribuição: f(x) = αxα-1, 0<x<1, α>0.
59
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
60
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
n
1 1
L(θ) = ∏ = n . Em casos como este, o estimador adequado
i =1 θ θ baseia-se em estatísticas de ordem.
Antes de começar a fazer contas, é
importante olhar para o gráfico de L(θ).
61
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
FX( n ) ( x ) = [P(X ≤ x )]n = [FX ( x )]n , Agora estamos aptos a obter E(X(n)), e
verificar que o estimador de máxima
cuja derivada conduz à distribuição de X (n) . verossimilhança é viciado para θ.
θˆ MV = X (1) .
Se X (1) > x , então todos os X i `s também são.
Daí : P( X (1) > x ) = P (X1 > x, X 2 > x ,..., X n > x ).
O EMV de θ é o mínimo da amostra!
62
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
FX(1) ( x ) = 1 − [P(X > x )]n , Neste caso, a integral para o cálculo de E[X(1)]
é um pouco mais chata, mas pode ser resolvida
pelo método da substituição (faça u = (1-x)).
cuja derivada conduz à distribuição de X (1) .
De forma geral, sempre que o domínio da Exemplo 6.3 - Seja uma AAS de
distribuição que referencia a população tamanho n de uma população
depender do parâmetro θ, o estimador de referenciada pela distribuição:
θ será função de estatísticas de ordem.
Se θ aparece apenas em um dos limites do 3 2
domínio, uma regra útil a ser aplicada é: f(x) = x , se 0 ≤ x ≤ 2θ.
8θ 3
- X(n) será o estimador para
o limite superior do domínio. Ache a estimativa de máxima
- X(1) será o estimador para verossimilhança de θ, com base
o limite inferior do domínio. na amostra : {1, 2, 3}. R: 1,5.
63
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
64
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Construção de um IC para a
X −µ
Média de uma População Normal P − z α ≤ ≤ z α = (1 − α)
2 σ/ n 2
Parte-se do seguinte resultado (conhecido):
z α é o valor da v.a. Z ~ N(0,1)
2
σ2 X −µ α
X ~ N (µ , ) ⇒ Z = ~ N(0,1). tal que : P(Z ≥ z α ) = .
n σ 2 2
n
O passo seguinte é manipular esta probabilidade
a partir do qual, pode-se escrever: de tal forma que µ situe-se no centro do evento.
X −µ
P( − z α ≤ ≤ z α ) = (1 − α) O que esta última probabilidade nos informa?
2 σ/ n 2
P( X + z α
σ
≥ µ ≥ X − zα
σ
) = (1 − α)
[x − z α ; x + zα ],
n n 2 n 2 n
2 2
σ σ
P( X − z α ≤ µ ≤ X + zα ) = (1 − α) µ estará contido em 100(1-α)% destes intervalos.
2 n 2 n
65
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Suponha agora que, com base em uma única Resposta: não! Embora tenhamos visto que:
amostra observada (a qual, note, é só o que
temos na prática) seja calculado o intervalo: P( X − ε ≤ µ ≤ X + ε) = (1 − α), (I)
σ σ
[x − z α ;x + zα ]. é completamente errado afirmar que:
2 n 2 n
P( x − ε ≤ µ ≤ x + ε) = (1 − α ). (II)
Pergunta: está correto afirmar que:
σ σ Justificativa: não há nenhuma v.a. em (II),
P( x − z α ≤ µ ≤ x + zα ) = (1 − α) ? somente números, e assim não podemos
2 n 2 n falar em probabilidade, como em (I).
66
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
67
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Achando z0,025 = valor de k tal que P(Z>k) = 0,025: Achando z0,05 = valor de k tal que P(Z>k) = 0,05:
k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
Achando z0,005 = valor de k tal que P(Z>k) = 0,005: Exemplo 7.1 - Na situação do exemplo
k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 2.1, considere que o desvio padrão das
alturas de toda a turma (populacional)
seja σ = 6. A altura média na amostra
de tamanho 5 fornecida naquele exemplo
resultou 180 cm. Determine o IC95%(µ).
Solução:
68
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
σ σ
IC95% (µ) = x − 1,96 ; x + 1,96 ,
Esta interpretação é fundamentada pelo 5 5
que ocorreria em amostras repetidas.
µ estaria em 95% dos intervalos.
69
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
X −µ
~ t n −1.
S/ n
distribuição t de Student
com n-1 graus de liberdade
(demonstração a seguir)
Parâmetro: υ = número de graus de liberdade.
Demonstração: Fazendo:
Uma v.a. com distribuição t com υ graus
de liberdade é obtida da seguinte forma: X−µ
Z=
σ/ n
Z Z~N(0,1). υ = n-1
T= e
Q
Q ~ χ 2υ S2
υ (qui-quadrado Q = (n − 1)
σ2
com υ g.l.),
independente de Z. temos:
70
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
= [172,55;187,45].
71
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Solução:
Exemplo 7.4 - Suponha que a vida
x = 400; s = 450. útil de uma marca de tv`s de LED seja
O valor na tabela t é t 24;0,05 = 1,711. normalmente distribuída. A partir de
uma amostra de 16 tv`s, estimou-se
uma vida útil média de 8.900 horas e
O IC solicitado é : um desvio padrão igual a 500 horas.
450 450
IC 90% (µ) = 400 − 1,711 ;400 + 1,711 =
25 25 Construa IC`s de 95% e 99% para o
[ 246,01;553,99]. tempo médio de vida útil das tv desta
Interpretação: com 90% de confiança, o salário médio µ de
marca. Interprete estes intervalos.
todos os trabalhadores da fábrica encontra-se neste intervalo.
Solução (95%):
• Consultando a Tabela t: x = 8.900; s = 500.
O valor na tabela é t 15;0,025 = 2,131.
O IC de 95% é :
500 500
IC95% (µ) = 8.900 − 2,131 ;8.900 + 2,131 =
16 16
[8.633,6;9.166,4].
Interpretação: com 95% de confiança, o tempo médio de
vida útil de tv`s de LED desta marca encontra-se neste intervalo.
72
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Solução (99%):
Exercício 7.1 - Os índices de endividamento
O que muda é só o valor na tabela t, de empresas de um certo setor da economia
que agora é : t 15;0,005 = 2,947. seguem distribuição Normal.
Solução (99%):
• Consultando a Tabela t para 99%:
x = 45, s = 30.
t 8; 0 , 005 = 3,355. O valor na tabela é t 8;0,005 = 3,355.
O IC de 99% é :
30 30
IC99% (µ) = 45 − 3,355 ;45 + 3,355 =
9 9
[11,5;78,5].
Interpretação: com 99% de confiança, o índice médio de
endividamento das empresas deste setor está entre 11,5 e 78,5.
Solução (95%):
• Consultando a Tabela t para 95%:
O valor na tabela é t 8;0,025 = 2,306.
t 8; 0 , 025 = 2,306.
O IC de 95% é :
30 30
IC95% (µ) = 45 − 2,306 ;45 + 2,306 =
9 9
[21,9;68,1].
73
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Solução (90%):
• Consultando a Tabela t para 90%:
O valor na tabela é t 8;0,05 = 1,86.
t 8; 0 , 05 = 1,86.
O IC de 90% é :
30 30
IC90% (µ) = 45 − 1,86 ;45 + 1,86 =
9 9
[26,4;63,6].
• Relação entre a Distribuição t e a Normal Por isso a tabela t que vocês receberam
vai só até 30 e depois começa a “pular”.
Para 30 ou mais graus de liberdade,
À medida que o número de graus de costuma-se usar a Normal como aproximação.
liberdade υ aumenta, o comportamento da Note, em particular, que a última linha da tabela
distribuição t aproxima-se do da Normal t (graus de liberdade = ∞) corresponde aos
valores usados nos IC para σ conhecido!
(isto permite evitar aquele procedimento chato
para extrair esses valores da tabela Normal)
74
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
75
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
2 n 2
Exemplo 7.6 - 70 peças são selecionadas ao
(1 − α). acaso de um lote, e observa-se que 49 são
defeituosas. Um IC de 95% para a
proporção de peças defeituosas no lote é:
Para que seja possível calcular um IC, 0,7 * 0,3
pode-se substituir p por sua estimativa. IC95% (p) = 0,7 m 1,96 = [0,5927;0,8073].
70
76
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Determinando o Tamanho
Já no caso da estimação de p, a
de uma Amostra
condição para determinar ε é:
Um aspecto importante da estatística é a
P( −ε ≤ p̂ − p ≤ ε) = (1 − α).
determinação do número de unidades a
serem selecionadas = tamanho da amostra.
Assim, a margem de erro para
estimar uma proporção é: A partir da especificação da margem de erro ε
(erro máximo considerado tolerável, com uma
p(1 − p) probabilidade 1-α), chega-se ao tamanho de
ε = zα . amostra necessário, invertendo-se a fórmula da
n
margem de erro para obter n em função de ε.
2
• Tamanho de Amostra para Estimar µ Note que não faz sentido usar a estimativa
de σ nesta fórmula, uma vez que ainda não
No caso da média de uma população Normal: temos a amostra (a fórmula é para definir
o tamanho da amostra que será coletada!).
σ z 2α σ 2 Há 2 soluções “paliativas”:
ε = zα ⇒ n= 2 .
n ε2
2
1 - Utilizar a estimativa do σ em uma
pesquisa anterior com característica similar.
Problema: σ na prática não é conhecido,
2 - Utilizar estimativa do σ
portanto não há como obter o valor de n.
em uma amostra “piloto”.
77
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
0,36
0,42
0,48
0,54
0,66
0,72
0,78
0,84
0,96
0,3
0,6
0,9
0
Exemplo 7.7 - Qual o tamanho de amostra E se reduzirmos esta margem para 5%?
necessário para estimar uma proporção 1
com uma margem de erro de 10% (a 95% Solução: n ≅ = 400.
ε2
de confiança), com base em uma AAS? Conclusão: para reduzir a margem
de erro pela metade, é necessário
quadruplicar o tamanho da amostra!
Solução (considerando zα/2 ≅ 2):
Questão: Pesquisas eleitorais, cuja margem
2
2 1 1 de erro usual é 2%, costumam trabalhar
n≅ = 2 = = 100.
4ε 2
ε (0,1) 2 com amostras em torno de 2.500 pessoas.
Este tamanho de amostra é adequado?
78
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
valor k1 na tabela valor k 2 na tabela 1 σ2 1
qui - quadrado tal que : qui - quadrado tal que : P 2 ≥ ≥ 2 = (1 - α)
χ α (n − 1)S
2
χ α
α α n −1, 1− n −1,
P(X < k1 ) = P(X > k 2 ) = 2 2
2 2
1 σ2 1
P 2 ≤ ≤ 2 = (1 - α)
χ α (n − 1)S
2
χ α Passo 2 - Substituindo agora S2
n −1, n −1, 1−
2 2
pela estimativa correspondente
s2, obtém-se o IC a seguir.
(n − 1)S 2 (n − 1)S 2
P 2 ≤ σ2 ≤ 2 = (1 - α)
χ α χ α
n −1, n −1, 1−
2 2
79
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• IC para a Variância de
uma População Normal Exemplo 8.1 - Uma amostra de 30 alunos
de uma universidade apresenta variância
amostral das notas dada por: s2 = 132,7.
s2 s2
IC 100(1−α)% (σ ) = (n − 1) 2 ; (n − 1) 2
2
.
χ α χ α
n −1,
2
n −1,
2
1−
Supondo que a população é Normal,
valor k 2 na tabela valor k1 na tabela obtenha o IC de 95% para σ2.
qui - quadrado tal que : qui - quadrado tal que :
α α
P(X > k 2 ) = . P(X < k1 ) = .
2 2
.
Substituindo na fórmula do IC:
132,7 132,7
IC 95% (σ 2 ) = 29 ;2 9 = [84,21;240 ,52].
χ 229;0,975 = 16 e χ 229;0,025 = 45,7. 45,7 16
Intervalos Ótimos
80
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Distribuição Amostral de X1 − X 2 :
Variância do Estimador de µ1-µ2:
σ12 σ22
(X1 − X2 ) ~ N(µ1 − µ2 , + ).
n1 n2
amostras são independentes!
+
n1 n 2
não viciado S2p , cuja fórmula é apresentada a seguir : com Sp = S2p . Esta estatística segue
81
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
σ σ 2 2
de liberdade é obtida da seguinte forma: + 1 2
n1 n 2
Z~N(0,1).
Z (n1 − 1)S12 (n 2 − 1)S22
T= 2) + ~ χ 2n + n 2 −2
σ12 σ 22 1
Q
Q ~ χ υ,
2
υ independente de Z
(soma de qui-quadrados independentes segue
uma qui-quadrado com os g.l. somados.)
T=
Z
=
n1 n 2 (X − X ) − (µ − µ )
1 2 1 2
(X 1 )
− X 2 − (µ1 − µ 2 )
Q ( n1 − 1)S (n 2 − 1)S
2 2
σ σ
+
2 2
1 1
σ2 +
+ 1 2 1 2
n1 + n 2 − 2 σ12 σ 22 n1 n 2 n1 n 2
=
n1 + n 2 − 2 ( n1 − 1)S12 (n 2 − 1)S22 1
+ [(n1 − 1)S12 + (n 2 − 1)S22 ]
σ12 σ22 σ2
Problema : não conseguimo s cancelar σ12 e σ 22 ! n1 + n 2 − 2 n1 + n 2 − 2
(X 1 )
− X 2 − (µ1 − µ 2 ) Passo 1 - escrever a probabilidade:
1 1
σ +
n1 n 2
=
(X 1 )
− X 2 − (µ1 − µ 2 )
. ( X1 − X 2 ) − (µ1 − µ 2 )
1 ( n1 − 1)S12 + ( n 2 − 1)S22 1 1 P − t α ≤ ≤t α
Sp + n1 + n 2 − 2 ; 1 1 n1 + n 2 − 2 ;
σ n1 + n 2 − 2 n1 n 2 2
Sp + 2
n n
1 2
A estatística T acima segue distribuição t
com n1+n2-2 graus de liberdade, C.Q.D.. Esta = (1 − α).
estatística é o pivot usado para obter o IC.
82
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Solução:
• Consultando a Tabela t:
[
IC 99% (µ1 − µ 2 ) = ( x1 − x 2 ) m t 16;0 , 005s p 1
n1 ]
+ n12 =
[
= ( 4.600 − 4.000) m t 16;0 , 005s p 1
8 + 101 ]
= [(600) m 2,921 * 223,26 * 0,4743]
= [(600 ) m 309,33] = [290,67;909,33].
83
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
84
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Z=
(p̂ − p̂ 2 ) − (p1 − p 2 )
1
≈ N(0,1).
p1 (1 − p1 ) p 2 (1 − p 2 ) p̂ (1− p̂1 ) p̂2 (1− p̂2 )
+ IC100(1−α)%(p1 − p2 ) = (p̂1 − p̂2 ) m zα 1 + .
n1 n2 2 n1 n2
Os passos para obter o IC não apresentam Obs - deve ser ressaltado que este IC demanda
nenhuma novidade em relação ao que já foi que as duas amostras sejam grandes.
visto, e resultam no seguinte IC para p1-p2:
85
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
S12 σ 22
O IC para a razão das variâncias de A demonstração de que ~ Fn1 −1,n 2 −1
S22 σ12
2 populações Normais é obtido
a partir do seguinte resultado: parte da regra de formação da distribuição F:
Q1
pivot S12 σ 22 υ1 Q1 ~ χ 2υ1 e Q 2 ~ χ 2υ2 ,
~ Fn1 −1,n 2 −1 , F= .
S22 σ12 Q2 Q1 e Q 2independentes.
υ2
em que S12 e S22 são as variâncias das amostras e n1 e S2
Usando agora que: (n − 1) 2
~ χ n2 −1 , temos que:
n 2 são os tamanhos destas amostras, respectivamente. σ
S12
(n1 − 1) 2
σ1 S12 Distribuição F - Gráfico:
(n1 − 1) σ 2
Sσ
2 2
F= = 1
= 1
.2
S2
S 2
Sσ
2 2
(n 2 − 1) 2 2 2 1
σ2 σ 22
2 α/2
(n 2 − 1)
86
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Passo 2 - isolar
σ 22 no meio do evento:
σ12 Substituindo, como em todos os outros IC`s,
os estimadores pelas estimativas, ou seja:
S12 σ 22
P f ≤ ≤f = (1 - α); S22 s 22
n1 −1, n 2 −1; 1− S 2 σ1
α 2 2 n 1 −1, n 2 −1;
α por 2 ,
2 2 S12 s1
S2 σ 22 S 22
P 22 f ≤ ≤ f = (1 - α).
S1 n1 −1, n 2 −1; 1− α σ12 S12 n1 −1, n 2 −1; α2
2 obtemos a fórmula do IC para uma amostra
observada, apresentada no slide seguinte:
• IC p/ a Razão de Variâncias
de Duas Populações Normais Problema:
Q2
1 1 υ2 Q 2 ~ χ 2υ2 e Q1 ~ χ 2υ1 .
f = . = .
α F Q1
υ1 , υ 2 ; 1−
2 f α υ1
υ 2 , υ1 ;
2
87
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Assim:
1 1
P ≥F≥ = (1 - α).
f υ ,υ ; 1- α f α
2 1
2
υ ,υ ;
2 1
2
1
P f α ≤ ≤ f α = (1 - α).
υ ,υ ; 1− 2 F
2 1 υ ,υ ;
2 1
2 f α
, c.q.d..
υ1 , υ 2 ; 1−
2
1 1
Invertendo: P ≤F≤ = (1 - α).
f α
f α
υ ,υ ; 2 2 1
2
υ , υ ; 1-
2 1
f4,3;0,025 =
σ 22 15,10.
Ache o IC de 95% para 2 .
σ1
σ 22
IC95% 2 = [0,1293;19,4839].
σ1
88
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
f 5 , 5; 0 , 95 = 1 / 5,05 = 0,198.
E o intervalo solicitado é:
σ2
f5,5;0,05 =
IC90% 22 = [0,1831;4,6713].
5,05.
σ1
• IC`s Assintóticos
Exercício 8.3 - Enuncie as hipóteses necessárias
ao cálculo de cada IC estudado nos capítulos
1. baseados na aproximação da t pela Normal 7 e 8 quanto aos seguintes aspectos:
(resultado de convergência em distribuição).
Onde:
89
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
• Testes de Hipóteses
90
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Esta é uma primeira diretriz para formular Isto porque o sistema considera mais
hipóteses: H1 representa aquilo que se quer grave condenar um eventual inocente
tentar evidenciar e H0 é a premissa que se quer do que absolver um eventual culpado.
contestar, colocar em xeque, ou ainda, julgar.
91
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
92
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
93
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
R: b1) X ≥ 3,8225.
Em seguida é que a regra de rejeição
b2) β = 0,0094.
é especificada, de tal forma que a
probabilidade de erro tipo I seja α. Esta configuração parece fazer sentido?
De que forma parece natural proceder?
94
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Conclusão:
não rejeitamos H0, ao nível α = 0,05.
95
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Exemplo 9.2 - (exemplo 7.3) Uma AAS Solução: As hipóteses de interesse são:
de 25 trabalhadores de uma fábrica foi H0: µ = 600 (hipótese nula);
selecionada, fornecendo salário médio H1: µ ≠ 600 (hipótese alternativa).
de R$ 400,00 e desvio padrão R$ 450,00.
O IC90%(µ) foi (exemplo 7.3):
[246,01;553,99].
Considerando a população Normal, teste
a hipótese de que o salário médio dos Basta verificar se este intervalo contém
empregados da fábrica seja R$ 600,00, o 600. De imediato, vemos que não.
ao nível de significância α = 0,1.
Assim, rejeitamos H0, ao nível α = 0,1.
Obs - Note que o enunciado fala Exemplo 9.3 - (exemplo 7.4) Suponha que a
em “testar a hipótese de que o vida útil de uma marca de tv`s de LED seja
salário médio seja R$ 600,00”. normalmente distribuída. A partir de uma
amostra de 16 tv`s, estimou-se uma vida
Isto é consistente com o que foi dito útil média de 8.900 horas, e um
anteriormente: o ponto de partida, desvio padrão igual a 500 horas.
a referência, é a hipótese nula. É ela
que queremos testar. Porém, é da sua
Teste se o tempo médio das tv`s desta marca
contrapartida - a hipótese alternativa -
é igual a 9.000, ao nível de significância 0,05.
que o teste poderá fornecer evidência.
96
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
97
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
“Intuição” para o fato da RC ser nos extremos Exemplo 9.1 (cont.) - Vamos agora aplicar o
método da RC para conduzir o teste H0: µ = 175
Quanto maior for a distância entre a média da
x H1: µ ≠ 175, ao nível de significância α = 0,05.
amostra e o valor testado, maior será a
evidência contra H0 (e a favor de H1). Considere σ = 6. A amostra observada é a
do exemplo 7.2 (n = 5 e média = 180 cm.).
Porém, o desvio padrão populacional e o Solução - os valores críticos possíveis são os
tamanho da amostra também influenciam. mesmos dos respectivos IC`s de 100(1-α)%:
Uma certa diferença entre x e k pode não Para α = 0,01 ⇒ z0,005 = 2,575.
significar nada se a população tiver um desvio Para α = 0,05 ⇒ z0,025 = 1,96.
padrão grande e/ou a amostra for pequena. Para α = 0,1 ⇒ z0,05 = 1,645.
98
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Neste caso, a região crítica baseia-se na No exemplo 9.1, vamos agora considerar σ
distribuição t com n-1 graus de liberdade: desconhecido e testar as mesmas hipóteses:
H0: µ = 175
RC = (-∞,-tn-1;α/2]∪[tn-1;α/2,∞).
x
H1: µ ≠ 175,
valor crítico
Assim: RC = (-∞,-2,776]∪[2,776,∞),
x − 175 180 − 175 Erro conceitual comum:
e t0 = = = 1,8634.
s/ 5 6/ 5
Rejeitar H0 ao nível α porque o valor
A conclusão é a mesma do caso com calculado da estatística de teste (t0 ou z0)
σ conhecido. Todavia, note que a RC não pertence ao IC de 100(1-α)%.
obtida aqui é bem mais conservadora, ou
seja, rigorosa com a decisão de rejeitar H0.
Isto é razoável, dado que estamos
introduzindo incerteza por meio da Por que isto está errado?
estimação de σ, e a amostra é pequena.
99
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Solução:
3 - Cálculo de t0:
1 - As hipóteses de interesse são:
x − 600 400 − 600 200
H0: µ = 600 (hipótese nula); t0 = = =− = −2,2222.
s / 25 450 / 5 90
H1: µ ≠ 600 (hipótese alternativa).
O nível de significância pedido é α = 0,1.
4 - Verifica-se que t0 pertence à RC.
2 - A região crítica do teste é:
RC = (-∞,-t24;0,05]∪[t24;0,05,∞). 5 - Conclusão: rejeitamos H0, ao nível 0,1.
No exemplo 7.3, vimos que t24;0,05 = 1,711.
• Testes Unilaterais/Unicaudais
Em algumas situações específicas, não
estaremos preocupados em evidenciar Exemplo 9.4 - Um fabricante afirma
se o parâmetro de interesse (µ, nos que seus cigarros contém, em média, no
exemplos até aqui) é diferente de k, e máximo 30mg de nicotina. Queremos
sim se ele é maior ou menor do que k. verificar a partir de uma amostra se
existe evidência contra esta afirmação.
Isto conduz ao estudo de testes unilaterais. Neste caso, H1, a hipótese que se quer
evidenciar não é µ ≠ 30, e sim µ > 30.
100
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Exemplo 9.4 (cont.) - Foi coletada uma Considere agora o desvio padrão σ
amostra de 25 cigarros, fornecendo média desconhecido e estimado, com s = 3 mg.
31,5 mg. O desvio padrão populacional é
conhecido, e igual a 3 mg. Ao nível α = 0,05, Da tabela t, t24;0,05 = 1,711,
os dados refutam a afirmação do fabricante? e assim: RC = [1,711;∞).
Exercício 9.3 - Especula-se que, próximo às Obs - Quando a hipótese nula é composta,
eleições, a rentabilidade média dos fundos de como nestes exemplos mais recentes, a
investimento mais alavancados do mercado definição de nível de significância deve
seja negativa. Uma amostra aleatória de 16 ser substituída pela de tamanho do teste.
fundos deste tipo forneceu rentabilidade
média de -1% e desvio padrão de 2%. Voltaremos a este ponto no capítulo 12,
Existe evidência de que proceda a mas observe que o problema é que
especulação acima, a algum nível usual? passamos a não ter um único valor do
parâmetro sob H0, e assim não faz sentido
Resposta: t0 = -2 ⇒ assim, há evidência definir de forma única a probabilidade
de que µ < 0 apenas aos níveis 0,05 e 0,1. de rejeitar H0 quando ela é verdadeira.
101
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
102
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
103
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Note que:
Se uma hipótese é rejeitada a um certo Podemos definir um “ponto de corte”, isto é,
nível de significância, também o será a um valor de α abaixo do qual não rejeitamos
níveis superiores (pois a RC aumentará). H0, e a partir do qual passamos a rejeitar H0.
104
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
105
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
α = P(Z ≥ zα)
Considere, agora, z0 < zα (situação
p-valor
em que o método da RC nos
= P(Z ≥ zo)
conduz a não rejeitar H0).
R: 0,0207.
No exemplo 9.8, se H1: µ ≠ 30:
p-valor = 2*0,00621 = 0,01242.
106
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
107
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
108
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
109
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
x1 − x 2 4.600 − 4.000
t0 = = = 5,67.
1 1 1 1
sp + 223,26 +
n1 n 2 8 10
110
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Substituindo p1 e p2 no denominador
Relembrando o pivot do IC para p1-p2 e sua por suas respectivas estimativas, a
distribuição (aproximada para n1 e n2 grandes): aproximação permanece válida. Assim:
(p̂1 − p̂ 2 ) − (p1 − p 2 )
Z=
(p̂1 − p̂ 2 ) − (p1 − p 2 ) ≈ N(0,1).
Z= ≈ N(0,1)
p̂1 (1 − p̂1 ) p̂ 2 (1 − p̂ 2 )
p1 (1 − p1 ) p 2 (1 − p 2 ) +
+ n1 n2
n1 n2
Finalmente, fazendo p1-p2 = 0,
obtemos a estatística do teste.
111
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
112
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
S12
F= .
S22 s12
f0 = 2
s2
P(F > k 2 ) =
α
, ou seja :
Valor da estatística F: f0 = 0,775.
2
1
f α
= . O processo para obter os valores da tabela F é
υ1 , υ 2 ; 1−
2
f α α/2
υ 2 , υ1 ;
2
o mesmo do exemplo 8.4, repetido a seguir.
k2
f4,3;0,025 = f3,4;0,025 =
Invertendo: f4,3;0,975 =
15,10. 9,98.
1/9,98 = 0,1002.
113
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Implementação no Excel
Região Crítica:
Solução:
114
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Poder de um Teste
Temos então que o poder de um teste é
a probabilidade de uma decisão correta.
O poder π de um teste de
hipóteses é a probabilidade de
rejeitar H0 quando ela é falsa. A idéia é que um bom teste deve - ao
menos na maioria das vezes - conduzir
à rejeição de H0 quando ela for falsa.
Obs - o poder também é
chamado potência do teste.
115
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
116
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
0,8
0,7
0,5
O limite da curva de
poder quando µ tende a 75
0,4
75,6
76,1
76,6
77,1
77,6
78,1
78,6
79,1
79,6
80,1
80,6
81,1
81,6
82,1
82,6
83,1
83,6
84,1
84,6
85,1
85,6
117
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
Faz sentido, portanto, que assim como Exemplo 11.2 (cont.) - Esboce a curva
foi feito para π, defina-se uma curva característica de operação do teste.
de valores possíveis para β.
0,8
O que ocorre com esta
0,7 curva se mudarmos o valor
0,6 de α para 0,1? E para 0,01?
0,5 H0: µ = 75 contra H1: µ < 75,
0,4
µ
0,1
0
75,1
75,6
76,1
76,6
77,1
77,6
78,1
78,6
79,1
79,6
80,1
80,6
81,1
81,6
82,1
82,6
83,1
83,6
84,1
84,6
85,1
85,6
0,9
1
β(µ)
0,9
0,8
0,8
0,7
0,7
0,6
0,6
0,5 0,5
0,4 0,4
0,3 0,3
0,2 0,2
µ
0,1 0,1
µ
0 0
64
64,5
65
65,5
66
66,5
67
67,5
68
68,5
69
69,5
70
70,5
71
71,5
72
72,5
73
73,5
74
74,5
64
64,5
65
65,5
66
66,5
67
67,5
68
68,5
69
69,5
70
70,5
71
71,5
72
72,5
73
73,5
74
74,5
118
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
0.9
0.8
0.7
0.4
0.3
0.2
0.1
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
Curva Característica de Operação (ex. 11.4):
Exercício 11.1 - Calcule o poder a
1
β(µ) probabilidade do erro tipo II associados
0.9
0.7
0.4
0.1
0
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
0,9
1
β(µ)
0,9
0,8
0,8
0,7
0,7
0,6
0,6
0,5 0,5
0,4 0,4
0,3 0,3
0,2 0,2
µ
0,1 0,1
µ
0 0
64
64,5
65
65,5
66
66,5
67
67,5
68
68,5
69
69,5
70
70,5
71
71,5
72
72,5
73
73,5
74
74,5
64
64,5
65
65,5
66
66,5
67
67,5
68
68,5
69
69,5
70
70,5
71
71,5
72
72,5
73
73,5
74
74,5
119
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
0.6
0.2 reduz o
seu poder!
µ
0.1
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
β(74) situado na C.C.O.:
1
β(µ)
0.9
0.8
0.7
12. TESTES DE
HIPÓTESES
0.6
0.5
0.4
0.2
0.1
µ
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
120
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
n
−k * ∑ xi
L( k ) = k e
* *n i=1
n
−k ∑ xi n n
k ( k −k ) ∑ x
n
L( k ) ke i =1 *
= = * e
i
n . i =1
k
*
L( k ) −k ∑ x *
i
*n
k e i =1
k (k
n *
−k ) ∑ xi
* e i =1
≤ cte
k Conclui-se que a forma da RC do T.U.M.P. é
n
( k −k )
*
∑ xi
e i =1
≤ cte * n
∑ X i ≥ c ou X ≥ c.
n i =1
(k * − k ) ∑ x i ≤ cte * *
i =1
121
FGV/EPGE - Graduação em Ciências Econômicas
Disciplina: Estatística - Professor: Eduardo Campos
122