Você está na página 1de 22

Estimação Intervalar - Pt1

Quantis
Dada uma v.a. X, dizemos que o valor xα é o quantil α × 100%
de X se P(X ≤ xα ) = α.

1-
Quantis

Por exemplo, 1,96 é o quantil 97,5% de uma v.a. normal


padrão, pois, se Z ∼N(0,1), então P(Z ≤ 1, 96) = 0, 975.
Quantis

Por exemplo, 1,96 é o quantil 97,5% de uma v.a. normal


padrão, pois, se Z ∼N(0,1), então P(Z ≤ 1, 96) = 0, 975.

Ex. Obter o quantil 50% de uma v.a. exponencial com média 3.


Quantis

Por exemplo, 1,96 é o quantil 97,5% de uma v.a. normal


padrão, pois, se Z ∼N(0,1), então P(Z ≤ 1, 96) = 0, 975.

Ex. Obter o quantil 50% de uma v.a. exponencial com média 3.

Sol. Se E(X) = 3, então X ∼Exp(1/3). Logo,

P(X ≤ x) = 0, 5
1 − e−x/3 = 0, 5
e−x/3 = 0, 5
−x/3 = log 0, 5 ⇒ x = 2.0794
Quantis
Os quantis 25, 50 e 75% são também conhecidos como
primeiro, segundo e terceiro quartis, respectivamente.

Além de segundo quartil, o quantil 50% também é chamado de


mediana.

A mediana coincide com a média quando a distribuição é


simétrica.

Os quantis 20, 40, 60 e 80% são chamados de quintis.

Os quantis 10, 20, . . ., 90% são chamados de decis.

Os quantis 1, 2, . . ., 99 são chamados de percentis.


Estimação intervalar

Suponha que {X1 , ..., Xn } seja uma amostra aleatória i.i.d. com
Xi ∼N(µ, σ 2 ).

Já vimos que a média amostral X é um bom estimador para µ,


mas não podemos esperar que X seja igual a µ.

Sabendo que a estimativa pontual sempre tem um erro, às vezes


é mais interessante especificar um intervalo que contenha o
verdadeiro valor de µ com uma certa confiança.
Para determinar tal intervalo, levamos em conta que, se
Xi ∼N(µ, σ 2 ), então X ∼ N(µ, σ 2 /n) e, portanto,

X−µ
√ ∼ N(0, 1).
σ/ n
Assim, considerando Z ∼ N(0,1), para α ∈ (0, 1), temos

P(−z1− α2 < Z < z1− α2 ) = 1 − α


Assim, considerando Z ∼ N(0,1), para α ∈ (0, 1), temos

P −z1− α2 < Z < z1− α2 = 1 − α
 
X−µ
P −z1− α2 < √ < z1− α2 = 1 − α
σ/ n
 
σ σ
P −z1− 2 √ < X − µ < z1− 2 √
α α =1−α
n n

 
σ σ
P −X − z1− α2 √ < −µ < −X + z1− α2 √ =1−α
n n
 
σ σ
P X − z1− 2 √ < µ < X + z1− 2 √
α α =1−α
n n
 
σ σ
P X − z1− α2 √ < µ < X + z1− α2 √ =1−α
n n

Assim, com probabilidade 1 − α, o intervalo


(X − z1− α2 √σn ; X + z1− α2 √σn ) contempla o verdadeiro valor do
parâmetro µ.

Notemos que, na expressão acima, a única v.a. é X. Portanto, o


intervalo obtido é aleatório.

Para entender melhor, considere que uma amostra foi observada


e, a partir dela tenhamos calculado o intervalo. Se uma outra
amostra for observada obteremos outro intervalo, diferente do
primeiro.
A probabilidade 1 − α pode ser interpretada da seguinte forma:
o intervalo aleatório contemplará o verdadeiro valor de µ com
probabilidade 1 − α.

Uma vez observada a amostra e calculado o intervalo, ele


cobrirá ou não o verdadeiro valor de µ.

Se pudéssemos tomar várias amostras e, para cada uma delas


calcular o intervalo, em média (1 − α) × 100% dos intervalos
obtidos contemplariam µ.

Esse intervalo é chamado de intervalo de confiança (IC) para o


parâmetro desconhecido µ.
σ
Da expressão do IC, X ± z1− α2 √ :
n

A quantidade  = z1− α2 √σn é chamada de erro e 2 é a


amplitude do intervalo.
Quanto maior a variância, maior o erro/amplitude do
intervalo.
Fixado o tamanho da amostra, n, quanto maior a confiança
desejada, maior a amplitude do intervalo.
Fixada a confiança, quanto maior o tamanho da amostra,
menor é a amplitude do intervalo.
Ex. Suponha que o tempo de vida (em meses) das baterias
automotivas de uma certa marca siga distribuição normal com
variância σ 2 = 25. Para uma amostra de 30 dessas baterias
observou-se um tempo de vida médio de 48,3 meses. Obtenha
um intervalo de 95% de confiança para o verdadeiro tempo de
vida médio dessas baterias.
Ex. Suponha que o tempo de vida (em meses) das baterias
automotivas de uma certa marca siga distribuição normal com
variância σ 2 = 25. Para uma amostra de 30 dessas baterias
observou-se um tempo de vida médio de 48,3 meses. Obtenha
um intervalo de 95% de confiança para o verdadeiro tempo de
vida médio dessas baterias.

x = 48, 3
n = 30
σ=5 0,95

z = 1, 96 0,025 0,025
Ex. Suponha que o tempo de vida (em meses) das baterias
automotivas de uma certa marca siga distribuição normal com
variância σ 2 = 25. Para uma amostra de 30 dessas baterias
observou-se um tempo de vida médio de 48,3 meses. Obtenha
um intervalo de 95% de confiança para o verdadeiro tempo de
vida médio dessas baterias.

x = 48, 3
n = 30
σ=5 0,95

z = 1, 96 0,025 0,025

σ
X ± z1− α2 √
n
5
48, 3 ± 1, 96 √ ⇒ 48, 3 ± 1, 79 ⇒ [46, 51; 50, 09]
30
Ex. Para o exemplo anterior, qual deve ser o tamanho da
amostra para que, com um nível de confiança de 90%, o erro de
estimação seja de, no máximo, 1 mês?
Ex. Para o exemplo anterior, qual deve ser o tamanho da
amostra para que, com um nível de confiança de 90%, o erro de
estimação seja de, no máximo, 1 mês?

0,90

0,05 0,05

σ
 = z1− α2 √
n
5
1 = 1, 645 √
n
n = (1, 645 × 5)2 = 67, 65 ⇒ n = 68
No exemplo, a v.a. envolvida segue distribuição normal, de
modo que X também segue distribuição normal.

Mas e quando a v.a. segue outra distribuição, ou sua


distribuição é desconhecida?

Podemos usar o TLC que garante que, para amostras grandes,


se E(Xi ) = µ e Var(Xi ) = σ 2 , então

X − µ aprox.
√ ∼ N(0, 1)
σ/ n
independentemente da distribuição dos Xi s.
Assim, seja X1 , . . . , Xn uma amostra aleatória i.i.d., tal que
E(Xi ) = µ e Var(Xi ) = σ 2 , com µ desconhecido e σ 2 conhecido.

Se n ≥ 30, um IC (1 − α) × 100% para µ será dado por


σ
X ± z1− α2 √
n

Esse intervalo é aproximado, pois utilizamos o TLC para


aproximar a distribuição de X para a distribuição normal.
Ex. Um provedor de acesso à internet está monitorando o
tempo (em minutos) das conexões de seus clientes. São
desconhecidas a média e a distribuição desses tempos, mas a
variância, por analogia a outros serviços, é considerada igual a
50. Uma amostra de 500 conexões resultou num valor médio
observado de 25 minutos. O que dizer sobre a verdadeira
média, com confiança de 92%?
Ex. Um provedor de acesso à internet está monitorando o
tempo (em minutos) das conexões de seus clientes. São
desconhecidas a média e a distribuição desses tempos, mas a
variância, por analogia a outros serviços, é considerada igual a
50. Uma amostra de 500 conexões resultou num valor médio
observado de 25 minutos. O que dizer sobre a verdadeira
média, com confiança de 92%?

x = 25
n = 500

σ = 50 0,92

z = 1, 75 0,04 0,04


σ 50
X ± z1− α2 √ ⇒ 25 ± 1, 75 √ ⇒ 25 ± 0, 55
n 500

Você também pode gostar