Você está na página 1de 7

Estimação por intervalos

Os estimadores que foram discutidos na aula sobre Inferência Estatı́stica


são estimadores pontuais, isto é, fornecem como estimativa um único valor
númerico para o parâmetro de interesse. Por serem variáveis aleatórias, os
estimadores possuem uma distribuição de probabilidade e, levando este fato
em consideração, podemos apresentar uma estimativa mais informativa para
o parâmetro de interesse que inclua uma medida de precisão do valor obtido.
Esse método de estimação, denominado intervalo de confiança, incorpora,
à estimativa pontual do parâmetro, informações a respeito da variabilidade
do estimador.

1 Intervalos de Confiança para a média de uma popula-


ção Normal em que a variância é conhecida

Consideremos, inicialmente, o intervalo de confiança para a média µ de uma


certa população Normal com variância conhecida σ 2 . Supondo uma amostra
de tamanho n dada por (X1 , X2 , ..., Xn ) vimos que

σ2
 
X̄ ∼ N µ, .
n

Assim,
X̄ − µ
Z= √ ∼ N (0, 1).
σ/ n
Fixado um valor α tal que 0 < α < 1, podemos encontrar um valor zα/2
(veja Figura 1.1) tal que

P (−zα/2 ≤ Z ≤ zα/2 ) = 1 − α. (1)

Substituindo Z na Equação (1) temos que

Figura 1.1: Gráfico correspondente à Equação 1.

1
 
X̄ − µ
P −zα/2 ≤ √ ≤ zα/2 = 1 − α.
σ/ n

Manipulando a relação acima obteremos que


 
P −zα/2 √σn ≤ X̄ − µ ≤ zα/2 √σn = 1−α
 
P −X̄ − zα/2 √σn ≤ −µ ≤ −X̄ + zα/2 √σn = 1−α
 
P X̄ − zα/2 √σn ≤ −µ ≤ X̄ + zα/2 √σn = 1−α

Podemos reescrever a expressão acima da seguinte forma:


  
σ σ
P µ ∈ X̄ − zα/2 √ ; X̄ + zα/2 √ = 1 − α.
n n

Esta última expressão motiva a seguinte definição:

Definição 1. Seja X1 , X2 , . . . , Xn uma amostra aleatória de uma população


que possui distribuição N (µ, σ 2 ). Suponha que a variância dessa população
seja conhecida. O intervalo de confiança de nı́vel de confiança 1 − α para a
média populacional µ é dado por
 
σ σ
X̄ − zα/2 √ ; X̄ + zα/2 √
n n

O intervalo de confiança com coeficiente de confiança 1 − α para a média


populacional µ será denotado por IC(µ, 1 − α), isto é,
 
σ σ
IC(µ, 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √ .
n n

Exemplo 1. Um engenheiro civil está analisando a resistência à compreen-


são do concreto. A resistência à compreensão segue uma distribuição Nor-
mal com média µ desconhecida e variância igual a σ 2 = 1000 (psi)2 . Uma
amostra aleatória de 12 corpos de prova tem uma resistência média à com-
preensão de x̄ = 3250 psi. Desejamos uma estimativa para o parâmetro µ
desconhecido. A estimativa será intervalar e, para isso, construiremos um
intervalo de 95% de confiança para µ. Como a confiança é de 95%, temos
que 1 − α = 0, 95, ou seja, α = 0, 05 e α/2 = 0, 025. Utilizando a tabela da
Normal padrão, obtemos que zα/2 = 1, 96 e, assim, temos que
" r r #
1000 1000
IC(µ, 95%) = 3250 − 1, 96 ; 3250 + 1, 96 = [3232, 11; 3267, 89].
12 12

2
Exemplo 2. Suponha que os comprimentos de jacarés adultos de certa espécie
siga o modelo Normal com média µ desconhecida e variância igual a 0, 01
m2 . Desejamos uma estimativa para o parâmetro desconhecido µ. Para
isso, uma amostra de 10 animais foi sorteada. O resultado da amostra, em
metros, encontra-se abaixo:

1, 71; 1, 65; 1, 73; 1, 67; 1, 82; 1, 79; 1, 58; 1, 57; 1, 70; 1, 68.

2 Interpretando um intervalo de confiança

A interpretação de um intervalo de confiança deve ser feita com cuidado. A


expressão IC(µ, 1 − α) envolve a quantidade X̄ que é uma variável aleatória
e, portanto, o intervalo obtido também é aleatório. A probabilidade que
ele contenha o verdadeiro valor da média populacional µ é dada por 1 − α.
Ao coletar a amostra X1 , X2 , . . . , Xn a variável X̄ torna-se o número x̄obs
e, como conhecemos σ, n e zα/2 , o intervalo de confiança passa a ser um in-
tervalo númerico. Desta forma, uma interpretação conveniente é a seguinte:
se obtivermos várias amostras de mesmo tamanho e, para cada uma de-
las, calcularmos os correspondentes intervalos de confiança com coeficiente
de confiança α, esperamos que a proporção de intervalos que contenham o
valor de µ seja igual a 1 − α.

Exemplo 3. Uma máquina produz bastões cilı́ndricos metálicos. Uma amos-


tra aleatória de 15 bastões foi coletada, sendo o diâmetro medido. Os dados
(em milı́metros) resultantes são mostrados a seguir:

8,24 8,25 8,20 8,23 8,24


8,21 8,26 8,26 8,20 8,25
8,23 8,23 8,19 8,28 8,24

Admitindo que o diâmetro de cada bastão siga uma distribuição Normal com
média µ desconhecida e desvio padrão dado por σ = 0, 25, determinaremos
um intervalo de confiança de 99% para o diâmetro médio dos bastões. Para
isso, primeiro vamos fornecer uma estimativa pontual e depois uma estima-
tiva intervalar. Como estimador para média desconhecida, vamos utilizar a
variável aleatória X̄. Sua estimativa, representada por x̄obs , será:
8, 24 + 8, 25 + · · · + 8, 28 + 8, 24
x̄obs = = 8, 23.
15
Agora vamos obter uma estimativa intervalar. Para isso, construiremos um
intervalo de 99% de confiança para µ. Como a confiança é de 99%, temos
que 1 − α = 0, 99, ou seja, α = 0, 01 e α/2 = 0, 005. Utilizando a tabela da

3
Normal padrão, obtemos que zα/2 = 2, 57 e, assim, temos que
 
0, 25 0, 25
IC(µ, 99%) = 8, 23 − 2, 57 × √ ; 8, 23 + 2, 57 × √ = [8, 06; 8, 40].
15 15

Vamos agora interpretar o intervalo encontrado. É errado dizer que o verda-


deiro valor de µ pertence ao intervalo [8, 06; 8, 40] com probabilidade 0, 99.
Observe que, como o intervalo encontrado é númerico (não depende de va-
riáveis aleatórias), então o verdadeiro valor de µ está neste intervalo ou não
está neste intervalo, ou seja, como esses dois casos são complementares e dis-
juntos, um deles possui probabilidade 1 e o outro possui probabilidade zero.
Logo, a interpretação correta é: Se coletássemos 100 amostras de tamanho
15 e, para cada uma delas, calculássemos os seus respectivos intervalos de
confiança com coeficiente de confiança de 0, 99, então esperamos que 99 dos
intervalos obtidos conterão a verdadeira média µ. De modo geral, uma única
amostra é coletada e, portanto, um único intervalo de confiança é obtido.
Assim, o que se considera usualmente é admitir que o intervalo de confi-
ança calculado é um daqueles “bons”, isto é, o intervalo encontrado contém
a verdadeira média µ. Essa razão explica a necessidade de, além de fornecer
o intervalo númerico obtido, forcenecer também o indı́ce de confiança que
foi utilizado. Por fim, observe que o nı́vel de confiança está associado à
confiabilidade do processo de obtenção do intervalo: esse processo é tal que
acertamos em 100 × (1 − α)% das vezes.

Figura 2.1: Intervalos de confiança para a mesma média µ para 10 amostras


de mesmo tamanho.

4
Na Figura 2.1, os segmentos horizontais representam os intervalos de con-
fança de 90% para diferentes amostras de mesmo tamanho. No fnal das
contas, nesse caso, 9 dos 10 de tais intervalos contêm m.

3 Amplitude e margem de erro

Definição 2. A amplitude de um intervalo de 100 × (1 − α)% de confiança


para a média µ é dada pela diferença entre o extremo superior e o extremo
inferior do intervalo, isto é,
 
σ σ σ
X̄ + zα/2 √ − X̄ + zα/2 √ = 2 × zα/2 √
n n n

Observe que a amplitude de um intervalo de confiança depende da confiança,


do desvio padrão e do tamanho da amostra. Cada vez que a confiança é
aumentada o valor de zα/2 aumenta e, assim, o intervalo de confiança terá
uma aplitude maior. Note que isso, de fato, era esperado: quanto maior
o intervalo maior chance ele terá de conter o verdadeiro valor de µ. Por
outro lado, se a confiança permanece a mesma mas o tamanho da amostra é
aumentado então a amplitude diminuirá, ou seja, uma amostra maior contém
mais informação e por isso conduz a um intervalo mais informativo.
Definição 3. A margem de erro do intervalo de confiança para a média de
uma população Normal é dado por
σ
E = zα/2 √ .
n

Da definição de margem de erro, podemos então reescrever um intervalo de


100 × (1 − α)% de confiança para a média µ de uma população Normal da
seguinte maneira:

IC(µ, 1 − α) = [X̄ − E; X̄ + E].

4 Intervalo de confiança para uma proporção

Considere o seguinte problema: pretende-se estimar a proporção p de cura,


através do uso de um certo medicamento em doentes contaminados com
cercária, que é uma das formas do verme da esquistossomose. Um expe-
rimento consistiu em aplicar o medicamento em 200 pacientes, escolhidos
ao acaso, e observar que 160 deles foram curados. Queremos, a partir da
amostra coletada, inferir alguma coisa sobre a proporção p. Podemos, por

5
exemplo, tentar obter um intervalo de 90% de confiança para p. Entretanto,
se quisermos fazer isso, não poderemos utilizar as técnicas desencolvidas nas
seções anteriores porque, para isso, precisarı́amos garantir que a população
em questão possui uma distribuição Normal, o que não é o caso desse pro-
blema. O que faremos então? A resposta não é tão complicada: utilizaremos
o Teorema Central do Limite e aproximaremos a distribuição da nossa po-
pulação por uma distribuição Normal. Feito isso, poderemos então utilizar
as técnicas desenvolvidas anteriormente. Vejamos:

Uma estimativa para a proporção p de cura da população pode ser dada


por

número de casos favoráveis à caracterı́stica 160


p̂obs = = = 0, 8.
n 200

Em termos de variáveis aleatórias, o problema pode ser visto assim:


cada indivı́duo da população será denotado por Xi tal que Xi possui uma
distribuição de Bernoulli(p) da seguinte forma:

1, curado = sucesso,
Xi =
0, não curado = fracasso.
Denote por p̂ a seguinte proporção:
X1 + X2 + . . . + Xn
p̂ = .
n
Assim, pelo Teorema central do Limite, temos que a distribuição de p̂ será
uma distribuição com média µ e variância σ 2 dadas por
µ = E[Xi ] = p
V ar[Xi ] p(1 − p)
σ2 = = ,
n n
isto é,  
p(1 − p)
p̂ = N p, .
n
Assim, um intervalo de confiança com coeficiente de confiança dado por 1−α
será dado por
" r r #
p(1 − p) p(1 − p)
IC(p, 1 − α) = p̂ − zα/2 ; p̂ + zα/2 .
n n

Lembre-se que queremos estimar p. Todavia, o termo dentro da raiz qua-


drada na expressão anterior depende dessa quantidade desconhecida e, por-
tanto, o intervalo ainda não pode ser calculado. Uma maneira de contornar-
mos este problema é susbstituindo p(1 − p) por p̂(1 − p̂). Logo, o intervalo

6
de 100(1 − α)% de confiança para a proporção p será dado por:
" r r #
p̂(1 − p̂) p̂(1 − p̂)
IC(p, 1 − α) = p̂ − zα/2 ; p̂ + zα/2 .
n n

Vamos retomar o exemplo apresentado no inı́cio dessa seção. Para um coe-


ficiente de confiança 0, 90, temos que z0,05 = 1, 64 e assim
" r r #
0, 8 × 0, 2 0, 8 × 0, 2
IC(p, 90%) = 0, 8 − 1, 64 ; 0, 8 + 1, 64
200 200
= [0, 754; 0, 846].

5 Exercı́cios

Exercı́cio 1. De uma população normal com desvio padrão 2, extrai-se uma


amostra aleatória simples de tamanho 36, que fornece o seguinte resultado:
36
X
xi = 1236.
i=1

Calcule o intervalo de confiança para a média populacional µ utilizando o


nı́vel de confiança α = 2%.

Exercı́cio 2. A vida média de baterias automotivas de certa marca está sendo


estudada. Baseado em estudos similares, com outras marcas, é possı́vel
admitir que a vida dessas baterias segue a distribuição Normal com desvio
padrão de 4,5 meses. De qual tamanho deverá ser a amostra, para que a
amplitude do intervalo de 90% de confiança para a vida média seja de 3
meses?

Você também pode gostar