Você está na página 1de 9

7.

Estimação por intervalos

Seja X1 , . . . , Xn uma amostra aleatória de uma população X indexada


por um parâmetro θ. Por vezes, torna-se mais valioso especificar um
intervalo que contém o verdadeiro valor de θ com um certo grau de
confiança do que apenas estimar θ pontualmente.

Noções básicas.
Definição 7.1: Seja X1 , . . . , Xn uma amostra aleatória de uma popu-
lação X indexada por um parâmetro θ ∈ Θ. Se Ti = Ti (X1 , . . . , Xn ),
i = 1, 2, são duas estatísticas tais que
P (T1 < θ < T2 ) = γ,
onde γ é um valor fixado entre 0 e 1, diz-se que (T1 , T2 ) é um intervalo
aleatório de confiança para θ de grau (coeficiente) de confiança γ.
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 124/207

Exemplo 7.1: Seja X1 , . . . , Xn uma a.a. de X ∼ N (µ, σ 2 = 4). Qual o


intervalo aleatório de confiança para µ com grau de confiança de 95%?

Sabe-se que X̄ é o estimador de máxima verosimilhança de µ e que

X̄ − µ
X̄ ∼ N (µ, σ 2 /n) ⇒ Z= p ∼ N (0, 1)
4/n

Por outro lado, P (−1.96 < Z < 1.96) = 0.95 e consequentemente


p p
P (X̄ − 1.96 4/n < µ < X̄ + 1.96 4/n) = 0.95,

indicando que o intervalo aleatório de confiança a 95% para µ é ex-


presso por
p p
(T1 = X̄ − 1.96 4/n, T2 = X̄ + 1.96 4/n).

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 125/207


Método da variável fulcral.

Definição 7.2: Seja X1 , . . . , Xn uma a.a. de uma população X indexada


pelo parâmetro θ ∈ Θ. Diz-se que a função da a.a. e de θ,

W = W (X1 , . . . , Xn ; θ)

é uma variável fulcral ou quantidade pivotal usada na construção de um


intervalo de confiança para θ quando a sua distribuição (f.m.p. ou f.d.p.)
não depende de θ.

Os intervalos de confiança são obtidos aqui pelo método da variável


fulcral ou método pivotal. Isto é, dada uma variável fulcral W =
W (X1 , . . . , Xn ; θ), os intervalos de confiança para θ são obtidos da
seguinte forma:

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 126/207

1. Fixado um grau de confiança γ, obtêm-se aγ e bγ tais que

P (aγ < W < bγ ) = γ, ∀θ ∈ Θ.

2. Se a partir de aγ < W < bγ , for possível obter uma outra dupla


desigualdade T1 < θ < T2 , onde Ti = Ti (X1 , . . . , Xn ), i = 1, 2,
tem-se

P (aγ < W < bγ ) = P (T1 < θ < T2 ) = γ, ∀θ ∈ Θ.

3. Dado uma amostra particular (x1 , . . . , xn ), a concretização do in-


tervalo aleatório de confiança para θ com grau de confiança γ é
designada por intervalo de confiança a 100γ% para θ, dado por

(t1 , t2 ) = (t1 (x1 , . . . , xn ), t2 (x1 , . . . , xn )).

Nota: O intervalo acima é bilateral, sendo os respectivos intervalos de


confiança unilaterais do tipo (−∞, u2 ) ou (u1 , ∞), u1 < u2 .
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 127/207
Em suma, o intervalo (t1 , t2 ) é um intervalo de confiança para θ a
100γ%, denotado por

IC(θ, γ) = (t1 , t2 ),

sendo a concretização do intervalo aleatório de confiança, denotado por

IAC(θ, γ) = (T1 , T2 ).

A probabilidade γ é interpretada como a frequência relativa de todos os


intervalos (t1 , t2 ) que contêm θ obtidos numa sequência infinitamente
grande de observações de (X1 , . . . , Xn ) (perspectiva frequencista). En-
tretanto, (
1, se θ ∈ (t1 , t2 ),
γ 6= P (t1 < θ < t2 ) =
0, c.c.

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 128/207

Intervalos de confiança para parâmetros de uma


população normal.
Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ).
X̄−µ
Poder-se-á considerar Z = σ/ √ ∼ N (0, 1) como variável fulcral para
n
obter um intervalo de confiança para µ? Não.
X̄−µ
Entretanto, sabe-se que T = √
S/ n
∼ t(n−1) , onde S 2 é a variância
amostral corrigida. Portanto,
P (a < T < b) = γ = 1−α
P (X̄ −b √Sn < µ < X̄ +b √Sn ) = 1−α
IAC(µ, γ = 1−α) = X̄ ± b √Sn

−b 0 b T

IC(µ, 1−α) = x̄ ± b √sn



b = −a = Ft−1
(n−1)
(1− α2 )
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 129/207
Exemplo 7.2: Suponha que o tempo X de reparação de uma máquina
segue uma distribuição Normal com média µ e variância σ 2 . Estime o
tempo médio µ de reparação (em minutos) com um grau de confiança
de 99%, P
baseando-se nos Pseguintes dados para uma amostra aleatória:
n = 10, i=1 xi = 846 e ni=1 x2i = 71607.
n

X̄−µ
Nesse cenário, a variável fulcral é T = S/ √ ∼ t(9) e as quantidades
n
n n
1
x̄ = n i=1 xi = 84.6 e s = n−1 ( i=1 xi − n x̄2 ) = 35.4
2 1 2
P P
9
= 3.933.

• P (−3.25 < T < 3.25) = 0.99.


• P (X̄ −3.25 √S < µ < X̄ +3.25 √S ) = 0.99
n n

• IAC(µ, γ = 0.99) = (X̄ ± 3.25 √S )


n
q
• IC(µ, 0.99) = (84.6 ± 3.25 3.933
10
) = (84.6 ± 2.038)
= (82.562, 86.638).

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 130/207

Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ). Na


construção do intervalo de confiança para σ 2 com grau de confiança
γ = 1−α, tem-se como variável fulcral

(n−1)S 2
Q= 2
∼ χ2(n−1) .
σ

P (a < Q < b) = γ = 1 − α, onde


a = Fχ−1
2 ( α2 ) e b = Fχ−1
2 (1− α2 )
(n−1) (n−1)
2 (n−1)S 2
P ( (n−1)S
b
<σ < 2
a
)=1−α
2 (n−1)S 2 0 a b Q
2
IAC(σ , 1−α) = ( (n−1)S
b
, a )

(n−1)s2 (n−1)s2
 
IC(σ 2 , 1−α) = ,
b a

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 131/207


Exemplo 7.2a: Para o tempo de reparação de uma máquina X ∼
N (µ, σ 2 ), estime a variância de X com um grau de confiança de 95%.
Recorde-se que x̄ = 84.6, s2 = 3.933 e n = 10.

Nesse cenário,
• A variável fulcral é Q = (n−1)S 2
σ2
∼ χ(9) .
• P (2.7 < Q < 19.02) = γ = 1 − α = 0.95, uma vez que
Fχ−1 −1
2 (0.025) = 2.7 e Fχ2 (0.975) = 19.02.
(9) (9)

2 (n−1)S 2
• IAC(σ 2 , 0.95) = ( (n−1)S , ).
19.02 2.7

Consequentemente,
 
9 × 3.933 9 × 3.933
IC(σ 2 , 0.95) = , = (1.86, 13.11).
19.02 2.7

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 132/207

Duas populações normais


Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações indepen-
dentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente.

Se σ12 e σ22 são conhecidas, a variável fulcral para estimar µ1 − µ2 com


grau de confiança γ = 1−α tem como base os seguintes resultados:
• X̄i ∼ N (µi , σi2 ), i = 1, 2 (independentes),
• X̄1 − X̄2 ∼ N (µ1 − µ2 , σ12 /n1 + σ22 /n2 ),
1
Pni
onde X̄i = ni j=1 Xij , i = 1, 2. Por conseguinte, a variável fulcral é
dada por
X̄1 − X̄2 − (µ1 − µ2 )
Z= p
2 2
∼ N (0, 1).
σ1 /n1 + σ2 /n2

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 133/207


P (a < Z < b) = γ = 1−α,
b = −a = FN−1(0,1) (1− α2 )
−b 0 b Z

p
• P (X̄1 − X̄2 −b σ12 /n1 + σ22 /n2 < µ1 − µ2 <
p
< X̄1 − X̄2 +b σ12 /n1 + σ22 /n2 ) = 1−α
p
• IAC(µ1 − µ2 , γ = 1−α) = (X̄1 − X̄2 ± b σ12 /n1 + σ22 /n2 )

Consequentemente,
q
IC(µ1 −µ2 , 1−α) = (x̄1 − x̄2 ± b σ12 /n1 + σ22 /n2 )

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 134/207

Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações indepen-


dentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente.

Se σ12 = σ22 = σ 2 (desconhecida), a variável fulcral para estimar µ1 −µ2


com grau de confiança γ = 1−α tem como base os seguintes resultados:
p
• Z = (X̄1 − X̄2 − (µ1 − µ2 ))/ σ 2 (1/n1 + 1/n2 ) ∼ N (0, 1).
• Sp2 = ((n1 −1)S12 + (n2 −1)S22 )/(n1 +n2 −2) ∼ χ2
(n1 +n2 −2) , onde
1
Pni
Si2 = ni −1 j=1 (Xij − X̄i )2 , i = 1, 2.
• X̄1 , X̄2 , S12 e S22 são independentes.

X̄1 − X̄2 − (µ1 − µ2 )


⇒ T =q ∼ t(n1 +n2 −2) .
(n1−1)S12 +(n2−1)S22 1 1
n1 +n2 −2
( n1 + n2
)

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 135/207


P (a < T < b) = γ = 1−α,
b = −a = Ft−1
(n +n −2)
(1− α2 )
1 2
−b 0 b T

q
(n1−1)S12 +(n2−1)S22 1 1
• P (X̄1 − X̄2 −b ( n1 + ) < µ1 − µ 2 <
n1 +n2 −2 n2
q
(n1−1)S12 +(n2−1)S22 1 1
< X̄1 − X̄2 +b n1 +n2 −2
( n1 + n2
)) = 1−α
 q 
(n1−1)S12+(n2−1)S22 1
• IAC(µ1 −µ2 , 1−α) = X̄1 −X̄2 ± b n1 +n2 −2
( n1 + n12 )

Consequentemente,
s
(n1 −1)s21 +(n2 −1)s22 1
  
1
IC(µ1 −µ2 , 1−α) = x̄1 − x̄2 ± b + .
n1 + n2 − 2 n1 n2

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 136/207

Exemplo 7.3: Sejam Xi o tempo de vida de uma bactéria do tipo i,


i = 1, 2, independentes. Considere X11 , . . . , X1n1 e X21 , . . . , X2n2 duas
a.a. de X1 ∼ N (µ1 , σ 2 ) e X2 ∼ N (µ2 , σ 2 ), respectivamente. Estime
a diferença dos tempos de vida médios dos dois tipos de bactérias Pn1 com
95% de grau de confiança, sabendo que n1 = 10, n2 = 13, j=1 x1j =
300, nj=1 x2j = 260, nj=1 x1j = 10000 e nj=1
P 2 P 1 2 P 2 2
x2j = 7000.
X̄1−X̄2 −(µ1 −µ2 )
Variável fulcral: T = r
(n1−1)S12 +(n −1)S 2
∼ t(21) .
2 2( 1 + 1 )
n1 +n2 −2 n1 n2

• P (−2.08 < T < 2.08) = 0.95, com Ft−1 (0.975) = 2.08.


(21)

(n1−1)S12 +(n2−1)S22 9×111.11+12×138.46


• Sp2 = ⇒ s2p = = 126.74.
n1 +n2 −2 21
q
• IAC(µ1 − µ2 , 0.95) = (X̄1 − X̄2 ± 2.08 Sp2 ( 1 + 1 ))
n1 n2
q
• IC(µ1−µ2 , 0.95) = (10±2.08 126.74( 1 + 1 )) = (0.15, 19.85).
10 13

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 137/207


Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações inde-
pendentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente. Para
grandes amostras (n1 , n2 → ∞), pode-se substituir as variâncias σ12 e
σ22 pelas suas variâncias amostrais S12 e S22 (estimadores consistentes).
Portanto, na construção de um intervalo de confiança (aproximado) para
µ1 − µ2 com grau de confiança γ = 1−α, tem-se como variável fulcral

X̄1 − X̄2 − (µ1 − µ2 ) a


Z= p 2 ∼ N (0, 1).
S1 /n1 + S22 /n2

Consequentemente,
• P (a < Z < b) = γ = 1−α, onde b = −a ≃ F −1 (1− α ).
N (0,1) 2
p
• IAC(µ1 − µ2 , 1−α) ≈ (X̄1 − X̄2 ± b S12 /n1 + S22 /n2 ).
p
• IC(µ1 − µ2 , 1−α) ≈ (x̄1 − x̄2 ± b s21 /n1 + s22 /n2 ).

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 138/207

Intervalos de confiança para parâmetros de popu-


lações não normais uniparamétricas.
Exemplo 7.4: Seja X1 , . . . , Xn uma a.a. de uma população X ∼
Exponencial com E(X) = λ. Encontre um intervalo de confiança
aleatório a 100(1−α)% para o logaritmo da média populacional λ.
Nesse cenário, sabe-se que
1
Pn
• O estimador de máxima verosimilhança de λ é X̄ = Xi .
n i=1
Pn 2
Pn

i=1 Xi ∼ Gamma(n, 1/λ) ⇒ W = λ i=1 Xi ∼ χ2(2n) .
• P (a < W < b) = 1−α, onde a = F −1
χ2
( α2 ) e b = Fχ−1
2 (1− α2 ).
(2n) (2n)
Pn Pn
• P(2 i=1 Xi
<λ<
2
) = 1−α.
i=1 Xi
b a
 
2 n
P Pn
Xi 2 Xi
Portanto, IAC(log λ, 1−α) = log( i=1b
), log( i=1a
)

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 139/207


Exemplo 7.6: Seja X1 , . . . , Xn uma a.a. de uma população X ∼
Bernoulli(p). Encontre um intervalo de confiança (aproximado) a
100(1−α)% para a proporção populacional p.

Nesse cenário,
(
1, se ocorrer sucesso,
Xi = , i = 1, . . . , n.
0, c.c.

1
Pn
• O estimador de máxima verosimilhança de p é X̄ = Xi .
n i=1
Pn
• Xi ∼ Binomial(n, p). Todavia, para grandes amostras, tem-
i=1
se pelo T.L.C. que
X̄ − p a
Z=p ∼ N (0, 1).
p(1 − p)/n

• P (−b < Z < b) = 1−α, onde a = F −1 ( α ) e b = F −1 (1−α ).


N (0,1) 2 N (0,1) 2

NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 140/207

• Para encontrar os limites do intervalo de confiança de p, deve-se


isolar o valor de p, encontrando as raízes do respectivo polinómio
de 2o grau. Uma alternativa a este procedimento para n grande
é usar o facto de que X̄ é um estimador consistente de p e, para
grandes amostras, pode-se substituir p no denominador de Z por
X̄.
 q q 
• P X̄ − b X̄(1− X̄) X̄(1− X̄)
n
< p < X̄ + b n
= 1−α.
 q 
• IAC(p, 1−α) ≈ X̄(1−X̄)
X̄ ± b n

Portanto, um intervalo de confiança (aproximado) a 100(1−α)% para p


é dado por
 r 
x̄(1− x̄)
IC(p, 1−α) ≈ x̄ ± b .
n
NOTAS DE PROBABILIDADES E ESTATÍSTICA - GS – 141/207

Você também pode gostar