Você está na página 1de 10

Intervalo de Confiança

1 Estimação

A estimação é o processo que consiste em utilizar dados


amostrais para estimar os valores de parâmetros popu-
lacionais desconhecidos. Essencialmente, qualquer ca-
racterı́stica de uma população pode ser estimada a par-
tir de uma amostra aleatória. Entre os mais comuns,
estão a média e o desvio padrão de uma população e a
proporção populacional.

1.1 Estimação por ponto:

È o processo através do qual obteremos um único ponto,


ou seja, um único valor para estimar o parâmetro.
Exemplo: Amostra (1,3,2)

X = nxi = 1+3+2
P

3 = 2 Estimativa pontual ou por


ponto de µ.
(xi −x)2
P
2
S = n−1 = 1 estimativa pontual ou por ponto
de σ 2

1
1.2 Estimação por Intervalo:

É um processo que permite obter um intervalo onde,


com uma determinada probabilidade (nı́vel de confiança),
podemos esperar encontrar o verdadeiro valor do parâmetro.

LI < θ < LS
As estimativas por intervalo são preferı́veis às esti-
mativas por ponto porque indicam a precisão, ou seja,
sabemos a probabilidade de o intervalo conter o parâmetro.

2 Intervalo de Confiança

Trata-se de uma das técnicas para inferência estatı́stica,


onde a partir de um intervalo de confiança, construı́do
com os elementos da amostra, pode-se inferir sobre um
parâmetro populacional.

Devido à variabilidade amostral, as possı́veis amostras


aleatórias de mesmo tamanho retiradas da mesma po-
pulação terão medidas diferentes. Assim, surge nat-
uralmente a pergunta: qual a confiabilidade de uma
estimativa pontual? O intervalo de confiança foi in-
stituı́do para definir de forma objetiva a credibilidade
da estimativa.

2
INTERVALO DE CONFIANÇA é o intervalo de va-
lores que contém o parâmetro da população, com uma
determinada probabilidade de acerto, e é construı́do a
partir de uma amostra aleatória retirada da população.

Se pudessemos construir uma quantidade grande de


intervalos (aleatórios!) da forma ]X − 1, 96σX , X +
1, 96σX [, todos baseados em amostras de tamanho n,
95% deles conteriam o parâmetro µ.

Dizemos que 1 − α = 0, 95 é o nı́vel de confiança


e α é o nı́vel de significância. Nessa figura estão es-
quematizados o funcionamento e o significado de um
intervalo de confiança (IC) para µ, com 1 − α = 0, 95
e σ 2 conhecido.
3
Escolhida uma amostra e encontrada sua média x0,
e admitindo-se σx conhecido, podemos construir o in-
tervalo

]x0 − 1, 96σX , x0 + 1, 96σX [.


Este intervalo pode ou não conter o parâmetro µ.
Suponha que tenhamos uma amostra de tamanho n e
que construı́mos um intervalo de confiança com nı́vel de
confiança 95% e obtemos o seguinte intervalo: 0, 476 <
µ < 0, 544.
1. ERRADA: “Há uma chance de 95% de que o ver-
dadeiro valor de µ está entre 0,476 e 0,544.”
2. CERTA: “Estamos 95% confiantes de que o inter-
valo de 0,476 e 0,544 realmente contém o verdadeiro
valor de µ”. Isto significa que, se selecionarmos
muitas diferentes amostras de mesmo tamanho n
e construı́ssemos os intervalos de confiança corre-
spondentes, 95% deles realmente conteriam o valor
da média populacional µ. O nı́vel de 95% se refere à
taxa de sucesso do processo em uso para estimar a
média populacional, e não se refere à própria média
populacional.)
Consideremos o seguinte experimento de simulação.

4
Geramos 20 amostras de tamanho n = 25 de uma
distribuição normal de média µ = 5 e desvio padrão
σ = 3. Para cada amostra construı́mos o intervalo de
confiança para µ, com nı́vel de significância α = 0, 5
, que é da forma X ± 1, 176. Na figura abaixo temos
esses intervalos representados e notamos que três deles
(amostras de números 5, 14 e 15) não contém a média
µ = 5.

5
2.1 Intervalo de confiança para a Média de Populações
Normais com Variância Conhecida

Considere que desejamos estimar a media µ de uma


população X com variância σ 2 conhecida.

Para determinar o intervalo de confiança (IC) para


µ , utilizamos o estimador X . Conforme já estabele-
cido, o estimador da média populacional (µ) é a média
amostral (X), e a distribuição de probabilidade das
médias é NORMAL com parâmetros:
2
 
σ 
X ∼ N µ,

n

Logo, a variável padronizada de X será

X −µ
Z= ∼ N (0, 1)
√σ
n
Fixando-se um nı́vel de confiança 1 − α , temos a
seguinte representação da situação:

6
ou seja,
 
P −zα/2 ≤ Z ≤ zα/2 = 1 − α
X−µ
Substituindo-se o valor de Z, tirado de Z = σ , e
resolvendo-se para as duas ineqüações, temos:
 
σ σ 
P X − zα/2 √ ≤ µ ≤ X + zα/2 √  = 1 − α

n n
Este intervalo de confiança, também pode ser ex-
presso da seguinte forma:
σ
IC(µ; 1 − α) = X ± zα/2 √
n

2.1.1 Margem de Erro

O Erro num intervalo de estimação diz respeito ao


desvio (diferença) entre a média amostral e a verdadeira
média da população. Como o intervalo de confiança
tem centro na média amostral, o erro máximo provável
é igual à metade da amplitude do intervalo. Logo, o
intervalo
σ
X ± zα/2 √ ou X ± 
n
onde o erro  sendo dado por

7
σ
 = zα/2 √
n
Exemplo: Em determinada população, o peso dos
homens adultos é distribuı́do normalmente com um
desvio padrão de 16kg. Uma amostra aleatória sim-
ples de 36 homens adultos é sorteada desta população,
obtendo-se um peso médio de 78, 2kg. Construa um
intervalo de confiança de nı́vel de confiança 0,95 para
o peso médio de todos os homens adultos dessa pop-
ulação.
Exemplo: De uma população normal com variância
25 extrai-se uma amostra aleatória simples de tamanho
n com o objetivo de se estimar a média populacional µ
com um nı́vel de confiança de 90% e margem de erro
de 2. Qual deve ser o tamanho da amostra?

2.2 Intervalo de Confiança para uma Proporção - Amostras


Grandes

O procedimento de construção do intervalo de confiança


para a proporção populacional é totalmente análogo ao
do intervalo de confiança para a média de uma pop-
ulação normal com variância conhecida.

Já foi estabelecido que o estimador para proporção p


é a proporção amostral p,
c e a distribuição de probabili-

8
dade da proporção amostral é Normal com parâmetros:

p(1 − p) 
 

pc ∼ N p; (1)

n

Assim, para o caso de populações infinitas, a variável


padronizada de pc é dada por:
pc − p
Z= s
p(1−p)
∼ N (0, 1) (2)
n
Fixando-se um nı́vel de confiança 1 − α, temos a
seguinte representação da situação:

Ou seja:
 
P −zα/2 ≤ Z ≤ zα/2 = 1 − α
Substituindo-se o valor de Z, tirado de Z = r p−p ,
b
p(1−p)
n
e resolvendo-se para as duas ineqüações, temos:

9
 v v 
p(1 − p) p(1 − p) 
u u
u u
u u
P p − zα/2 ≤ p ≤ p + zα/2

 = 1−α
c u c u
 t t

n n 
s

Reconhecemos a quantidade p(1−p) n como erro-padrão


do estimador pontual p. c Infelizmente, os limites supe-

rior e inferior do intervalo de confiança dependem do


parâmetro desconhecido p. No entanto, uma solução
satisfatória é substituir p por pc no erro-padrão, resul-
tando em um erro-padrão estimado. Assim,
 v v 
p(1 − p) p(1 − p)
u u
uc c uc c 
u u
P p − zα/2 ≤ p ≤ p + zα/2

c

u
t c u
t = 1−α



n n 

Este intervalo de confiança bilateral, também pode


ser expresso da seguinte forma:
v
p(1 − p)
u
uc c
u
c 1 − α) = p
IC(p; c± z u
α/2 t
n
Exemplo: Um gerente de produção deseja estimar
a proporção de peças defeituosas em uma de suas li-
nhas de produção. Para isso, ele seleciona uma amostra
aleatória simples de 100 peças dessa linha de produção,
obtendo 30 defeituosas. Determine o intervalo de con-
fiança para a verdadeira proporção de peças defeituosas
nessa linha de produção, a um nı́vel de significância de
5%.
10

Você também pode gostar