VI - Intervalos de Confiança

VI - INTERVALOS DE CONFIANÇA
Um enfoque alternativo à estimação pontual de um parâmetro populacional

desconhecido consiste em se obter uma cobertura para o parâmetro ou seja, uma
vizinhança para o seu valor que apresente elevada probabilidade de ocorrência.
No caso de um parâmetro unidimensional, a construção dos Intervalos de Confiança

constitue uma estimação intervalar para este parâmetro.
Todo ao longo da exposição, trataremos o grau de confiança ( , ou tamanho da

cobertura) como um parâmetro a ser escolhido pelo pesquisador. Normalmente, os
valores mais usuais são   0. 90; 0. 95; 0. 99.
Também, consideraremos apenas a construção de Intervalos de Confiança ou seja,

de coberturas unidimensionais de tamanho  pré-fixado.
A construção dos Intervalos de Confiança para um parâmetro    requer o


conhecimento da distribuição de probabilidade de um estimador  n , obtido à partir de
uma amostra de tamanho n.

Considere o intervalo I  t 1  , t 2  tal que P  n  I  .
Ou seja, a probabilidade que o estimador esteja no intervalo I é de 100%.
Vamos supor, sem perda de generalidade, que os limites t 1 e t 2 sejam funções

decrescentes do verdadeiro valor .
Então:
  
t 1    n  t 2   t 1 1
1  n    t2  n
Assim, o Intervalo de Confiança  para  será:

 
IC    t 1 1
1   n  ; t 2   n  1
Interpretação: O intervalo de confiança dado em 1 não significa que existe 100%
 
que o parâmetro  esteja dentro do intervalo t 1 1
1   n  ; t 2   n , pois  é um parâmetro,
não uma variável aleatória. Calcula-se probabilidades para variáveis aleatórias e não
para parâmetros !
__________________________
Hugo Boff - Estatística II 2021
2
O que a expressão 1 nos diz é que, se uma sequência de amostras forem
tomadas, todas de tamanho n, e se para cada amostra uma estimativa para  for obtida
  
e um intervalo do tipo t 1 1
1   n  ; t 2   n  para o estimador  n for calculado, então
100% destes intervalos conterão o verdadeiro valor de .
1. Intervalos de Confiança em populações Normais

Com base em amostras X 1 , X 2 , . . . , X n extraídas de populações normais
X  N,  2 , podemos calcular explícitamente intervalos de confiança  tanto para a
média  como para a variância  2 .
A) Intervalos de Confiança para a média
Sabemos que o estimador MVU de  é a média amostral X n .
Por outro lado, sabemos que X n  N,  2 /n. Padronizando a v.a. X n vem:
Xn  
Z  N0, 1 2
/ n
a)  2 conhecida
Neste caso, de acôrdo com 2 a estatística do IC é a normal-padrão.

Dado , vamos determinar na tabela da normal-padrão o valor de z /2 tal que:
P|Z|  z /2    3
O gráfico abaixo ilustra o caso de um intervalo de confiança   0. 95 caso este em

que lemos na tabela o valor z /2  1. 96, ou seja: P|Z|  1. 96  0. 95 .
Density Normal
-3 -1.96 -1 0 1 1.96 3 z
__________________________
3
Então, avaliando 2 na estimativa amostral da média x e usando o resultado em 3
x
obtemos:  z /2 , ou seja:
/ n
|x  |   z /2 4
n
ou ainda: x   z /2    x   z /2

n n
Logo, IC     x   z /2 , x   z /2  4  

n n
Uma estimação intervalar será tanto melhor quanto menor a amplitude do intervalo
para um dado nível de confiança .
Nas expressões 4  4   acima vemos que a estimação intervalar da média será
tanto melhor quanto menor o desvio-padrão . A amplitude do intervalo  2  z /2 
n
também diminui com o aumento do tamanho da amostra n.
b)  2 desconhecida
Neste caso,  2 deverá ser estimado. A estatística do IC é a v.a.T  Student padrão.
No Capítulo V vimos que o estimador MVU deste parâmetro é:
S 2n1  1  n X i  X n  2
n1 i1
e que esta estatística é independente de X n . Vimos também, no Capítulo II, que:
n  1S 2n1
  2 n  1 5
2
Por outro lado, da Estatística I vimos que a variável aleatória T  Z tem

2
 /
distribuição T  Student com  graus de liberdade, quando Z e  2  são independentes.
Combinando 2 com 5 temos então que

Xn   n  1S 2n1 Xn  
/ 2
/n  1  tem distribuição t  Student com n  1 graus de
/ n  S n1 / n
liberdade.
Ou seja,
__________________________
4
X n  
 Tn  1 6
S n1 / n
Comparando-se 6 com 2 vemos que o desconhecimento da variância tem

simplesmente o efeito de substituir na estatística da estimação intervalar, mutatis
mutandis, o desvio-padrão populacional  pela sua estimativa amostral s.
Dado , vamos determinar na tabela da Student-padrão, com n  1 graus de

liberdade, o valor de t /2 tal que:
P|T|  t /2    7
O gráfico abaixo ilustra o caso de um intervalo de confiança   0. 95, caso este em

que, para n  1  20, lemos na tabela o valor t /2  2. 08, ou seja: P|T|  2. 08  0. 95.
Student Density
-2.08 -1 0 1 2.08 3 t
A densidade da v.a. T  padrão com 20 g. l. é:
 21  1 1/2 1 2  21
f T t; 20  2
 12  20 
 18  1  18
t  2
2

onde, como vimos em Estatística I, x   u x1 e u du é a função gama.
0
Integrando-se por partes obtemos a recorrência: x  x  1x  1.
Em particular,  12    e, se x for inteiro, n  1  n!
Obs.:
1 1/2 1 
1 2  1
A densidade da T tabulada é: f tab. T t;    1       1   t  2 ; t 
2
. Como
2 2
ET tab   0 e a variância é VT tab    , obtemos a T  padrão fazendo a
2
transformação T  T / tab  .
2
__________________________
5
Para o caso   20, esta expressão resulta na densidade dada acima. Esta é a
densidade que deve ser usada para comparações com a Normal-padrão.
Então, avaliando 6 na estimativa amostral da média s n1 e usando o resultado em

xn  
7 obtemos:  t /2 , ou seja:
s/ n
|x n  |  s t /2 8
n
ou ainda: xn  s t    xn  s t
/2 /2
n n
Logo, IC     x n  s t , xn  s t  8  
/2 /2
n n
Como mencionamos acima, a estimação intervalar será tanto melhor quanto menor
a amplitude do intervalo para um dado nível de confiança .
Nas expressões 8  8   acima vemos que a estimação intervalar da média será
tanto melhor quanto menor o desvio-padrão amostral.
A amplitude do intervalo é: 2 s t /2 .

n
Comparação:
Comparando a situação a) em que a variância é conhecida, vemos que a amplitude

do intervalo é aqui maior, pois para  elevado temos: t /2  z /2 .
Com efeito, sendo T leptocúrtica, as caudas da sua distribuição são mais altas que
as caudas da v.a. Normal.
(Lembre da Estatística I que o curtose da distribuição Normal é igual à 3, ao passo

que o curtose T é igual à 3  6 
4
Deste modo, para   s, a amplitude do IC  2 s t /2  é maior que a sua amplitude

n
quando  é conhecida 2  z /2 .
n
A maior imprecisão incorrida na estimação intervalar é um custo a suportar por não

se conhecer a variância populacional, havendo a necessidade de substituí-la pela sua
estimativa amostral.
Exemplo 1: A receita mensal em R$1. 000 das farmácias da Capital é uma v.a.
X com distribuição Normal com média  desconhecida e variância  2 . Uma amostragem
com 25 farmácias sorteadas aleatoriamente mostrou: x  270 ; s 2  225.
__________________________
6
Vamos fazer a estimação intervalar de  para os níveis de confiança
90%, 95% e 99%.
a) Se  2  225 conhecida:
O intervalo de Confiança  é dado por 270   15 z /2 . Os percentis relevantes da

5
Normal padrão são: z  1. 65 90%;  1. 96 95%;  2. 58 99%.
Deste modo, teremos:
270  31. 65 para   0. 90; 270  31. 96 para   0. 95 e 270  32. 58 para
  0. 99.
Os intervalos de confiança correspondentes são:
IC .90   265. 05 , 274. 95 ; IC .95   264. 12 , 275. 88 ;
IC .99   262. 26 , 277. 74
b) Se  2 for estimada por s 2  225
O intervalo de Confiança  é dado por 270   15 t /2 . Os percentis relevantes da

5
Student padrão são: t  1. 711 90%;  2. 064 95%;  2. 797 99%.
Deste modo, teremos: 270  31. 711 para   0. 90; 270  32. 064 para   0. 95 e
270  32. 797 para   0. 99. E o intervalos de confiança correspondentes são:
IC .90   264. 87 , 275. 13 ; IC .95   263. 81 , 276. 19 ;
IC .99   261. 61 , 278. 39
Vemos que a amplitude do IC .95  é igual à 276. 19  263. 81  12, 38.
Este valor é a comparar com o comprimento do mesmo intervalo quando a variância

é conhecida, cuja amplitude é menor: 275. 88  264. 12  11. 76 reais.
Ou seja, o desconhecimento da variância trouxe uma perda de eficiência na

estimação intervalar de 5, 3%.
Para a interpretação, se uma sequência de amostras aleatórias de 25 farmácias for

tomada e para cada amostra for calculado um Intervalo com confiança 0. 95  dos quais
23. 81 , 276. 19 é um deles  95% destes intervalos conterão a receita média .
__________________________
7
B) Intervalos de Confiança para a Variância
A distribuição do estimador amostral da variância, dada em 5, permite que se

construa intervalos de confiança para a variância, usando os percentis da v.a.  2 n  1.
Pela tabela da  2 achamos os percentis q 1 e q 2 tais que:
Pq 1   2 n  1  q 2    9
A curva abaixo representa os pontos da  2 24 ou seja, com 24 g.l. cuja densidade
é a de uma v.a. gama  12 ; n1
2
:
24 1
q 2 1
f  2 q; 24  24 e 2 q
24
2 
2
2

Os percentis indicados correspondem à um intervalo de confiança

0. 95 : q 1  12. 4 e q 2  39. 4 .
C h i- s q u a re
12.4 20 30 39.4 q
Então, avaliando 5 na estimativa amostral s 2n1 e usando 9 temos:
n  1s 2 2
q1   q2  q12   q11
2 n  1s 2
n  1s 2 2 n  1s 2
ou: q2    q1 10
Temos enfim o intervalo de confiança  para a variância:
n  1s 2 n  1s 2
IC   2    q2 , q1  10  
Exemplo 2: No contexto do Exemplo 1 anterior, temos: n  1  24 e

s  225. Vamos efetuar a estimação intervalar da variância  2 para três níveis de
2
confiança: 90%, 95% e 98%.
__________________________
8
2
Os percentis correspondentes à estes níveis, mostrados na tabela da  24, são os
seguintes:
Confiança 0. 90 0. 95 0. 98
q1 13. 85 12. 40 10. 85
q2 36. 41 39. 36 42. 98
24225 24225
IC .90  2    ,   148. 31 , 389, 89
36. 41 13. 85
24225 24225
IC .95  2    ,   137, 19 , 435, 48
39. 36 12. 40
24225 24225
IC .98  2    ,   125, 63 , 497, 69
42. 98 10. 85
Observe que amplitude dos intervalos cresce com o aumento do nível de confiança
. O aumento na confiabilidade do intervalo tem como preço uma menor precisão da
estimativa intervalar.
2. Intervalos de Confiança em populações Não Normais
No item anterior construimos intervalos de confiança para a média e a variância de

populações normais.
Em muitos casos pode-se fazer a estimação paramétrica intervalar também em

populações não normais.
Os exemplos dados aqui ilustram como isto acontece. A racionalidade destes

intervalos é a mesma, e sua construção segue exatamente o mesmo método
empregado para a distribuição normal.
A) População Gama
Temos uma amostra X 1 , X 2 , . . . , X n de uma população X  , 1.
Temos EX   1 e VX  1 , de modo que os dois primeiros momentos desta

2
variável são funções de   0.
Vimos no Capítulo II que S  X 1  X 2 . . . X n é uma estatística suficiente para 

e que  1 é o seu estimador pontual MVU (Capítulo V).
n
S
__________________________
9
Para obtermos um estimação intervalar de , lembramos da Estatística I que:
2S n   2 2n 11
Assim, dado o nível de confiança , e sendo os percentis q 1 e q 2 tais que

Pq 1   2 2n  q 2   , teremos:
q q
q 1  2S n  q 2  1    2
2S n 2S n
Assim, substituindo a v.a. S pela sua realização amostral s  x 1  x 2 . . . x n e

levando em conta que s  nx obtemos o intervalo desejado:
q1 q
IC     , 2  12
2nx 2nx
E o intervalo de confiança para a média será:
1    2nx , 2nx 
IC    12  
q2 q1
Exemplo 3: O tempo de vida de um ponto de iluminação pública em noites de 10h

tem distribuição Exponencial com média 1/ desconhecida. Uma amostragem aleatória
1 .
em 50 pontos mostrou o tempo de vida médio x  180. Vamos calcular IC .95  
Da tabela da  2 100 encontramos: q 1  74. 22 e q 2  129. 6 . O intervalo dado em

12  fica:

1    250180 ; 250180   138. 88 , 242. 52

IC .95  
129. 6 74. 22
Ou seja, esta amostra em particular indica que a duração média das luminárias fica
entre 138. 88 noites ( 4 meses e 18 dias) e 242. 52 noites (8 meses e 2 dias) com
95% de probabilidade.
A amplitude do intervalo é de 242. 52  138. 88  103. 64 noites.
Lembrête do significado: Se uma sequência de amostras aleatórias for realizada,

todas com 50 pontos de iluminação e se, para cada amostra, for calculada a estimativa
para a duração média das luminárias e o intervalo de confiança 0. 95 dado em 12   para
a duração média populacional, 95% destes intervalos conterão o tempo de vida médio
de todos os pontos de iluminação pública da cidade.
B) População Uniforme
Temos uma amostra X 1 , X 2 , . . . , X n de uma população X  Unif , b.
__________________________
10
Vimos no Capítulo V que se b é conhecido, a estatística suficiente para  é o
mínimo amostral X 1 . Supondo b conhecido b  , vamos usar a distribuição desta
estatística para construir um estimação intervalar de confiança  para o mínimo
populacional .
Sabemos que PX 1  x   b  x  n ; x  , b.

b
Então, dado   0, 1, vamos buscar os percentis u 1 e u 2 tais que:
Pu 1  X 1  u 2    13
, o que implica: b  u 2  n 
1 1
Assim, u 2 é tal que PX 1  u 2   ; e então:
2 b 2
1 1
u 2  b  b   2
n 13  
1
Análogamente, u 1 é tal que PX 1  u 1   2 , o que implica:
1   b  u 1  n  2 . Ou seja:
1
b
1 1 
u 1  b  b   2  n 13 
Avaliando as desigualdades em 13 para a realização amostral x 1 e substituindo ali

os percentis dados em 13   e 13   vem: u 1  x 1  u 2 
1 1 1 1
b  b   2
 n  x 1  u 2  b  b   2
n 
b  x 1 b  x 1
b 1 1
   b 1 1
o que nos leva ao intervalo:
 2
 n  2
n
b  x 1 b  x 1
IC    b  1 1
, b 1 1
 14
 2
 n  2
n
Observe que o limite superior do intervalo de confiança em 14 é inferior à x 1 pois
b  x 1
: b  x 1  1 1 . Isto implica que o intervalo não inclui o valor observado x 1 .
 2 n
Isto ocorre porque a estatística X 1 superestima o mínimo populacional .
Com efeito, não é difícil checar que EX 1     b    .

n1
Exemplo 4: O preço da limpeza completa nos lava-jatos da cidade (em R$ é

uma v.a. Uniforme no intervalo , 100. Em 40 postos sorteados, o menor preço
observado foi de 28 reais. Calculemos um intervalo de confiança 0. 90 para o preço
mínimo .
__________________________
11
Com base em 14, o intervalo fica:
IC    100  100  281 , 100  100  281 

 10.90
2
 40  10.90
2
 40
IC    22. 40, 27. 90
Ou seja, a amostra indica, com 90% de confiança, que o preço mínimo do lava-jato
na cidade está entre 22 reais e 40 centavos e 27 reais e 90 centavos.
Observe que o intervalo não inclui o valor observado x 1  28.
C) População Exponencial Truncada
Temos n v.a.’s Exponenciais independentes X i  ExpA,  i  ; i  1, 2, . . . , n.
Observe que estas variáveis não são idênticamente distribuídas de modo que
X 1 , X 2 , . . . , X n não é uma amostra aleatória simples.
Seja: Y  minX 1 , X 2 , . . . , X n  a menor dentre as n v.a.’s.
Vamos determinar a distribuição de Y.
PY  y  PX 1  y; X 2  y; . . . ; X n  y   ni1 PX i  y

  ni1 e  i yA  e  1 yA e  2 yA . . . e  n yA
 e  1  2 ... n yA
Ou seja, colocando    1   2 . . .  n temos:
0 se y  A
F Y y;   15
1  e yA se y  A
1
Está claro assim que Y  ExpA; , com EY  A   e VY  12 .

Apesar de Y superestimar o mínimo populacional A, podemos usar uma realização

y de Y para construir um intervalo de confiança  para A.
Seguindo o caminho percorrido no item anterior, para o nível de confiança , vamos

achar os percentis e 1 e e 2 tais que:
Pe 1  Y  e 2    16
__________________________
12
1
Será fácil verificar que: PY  e 2   2

1
e e 2 A  2
Resolvendo em e 2 obtemos:
1 2
e2  A   ln 1  16  
1 1
Análogamente, PY  e 1   2
 1  e e 1 A  2
, o que dá:
1 2
e1  A   ln 1  16  
Avaliando as desigualdades em 16 para a realização amostral y e substituindo aos

percentis de 16   e 16   vem: e 1  y  e 2 
1 2 1 2
A  ln 1   y  A  ln 1  
1 2 1 2
y  ln 1   A  y  ln 1  o que leva ao intervalo:
1 2 1 2
IC  A  y   ln 1 , y  ln 1  17
Observe que o limite superior do intervalo de confiança em 17 é inferior à y. Assim

como no caso anterior, o intervalo não inclui o valor observado y, uma vez que, como
vimos acima, estatística Y superestima o mínimo populacional A.
Exemplo 5: A produtividade das lavouras de trigo do RS (ton./hectare) tem

distribuição Exponencial com produtividade mínima garantida A, a qual é desconhecida.
Para as 5 regiões produtoras do Estado, uma estimativa histórica obtida para  foi 2 e
a região menos produtiva apresentou a produção média de 2. 5 ton/hec.
Com estas informações, vamos calcular um intervalo de confiança 0. 90 para a

produção mínima garantida em cada uma das regiões do Estado.
Substituindo os valores dados em 17 obtemos:
IC  A  2. 5  12 ln 0.10

2
 , 2. 5  1
2
2
ln 1.90  ou seja:
 1. 0 , 2. 474.
Assim, a informação obtida indica que a produtividade mínima garantida no Estado

se situa entre 1 ton. e 2 ton. e 474 kg por hectare, com confiança 90%.
__________________________
13
3. Intervalos de Confiança com Aproximação Normal
A existência do Teorema Central do Limite (TCL) permite a construção de

intervalos de confiança para a média populacional à partir da média amostral extraída
de qualquer população. As restrições à sua aplicação são bastante fracas, o que
permite a sua aplicação em ampla escala.
A qualidade da aproximação normal depende em grande medida do tamanho

amostral n. Ceteris Paribus, quanto maior for este tamanho, melhor será a
aproximação.
A velocidade da convergência também depende naturalmente dos graus de

assimetria e curtose da distribuição original. Quanto menor o grau de assimetria e
quanto mais próximo de 3 estiver o grau de curtose da distribuição original, mais rápida
será a convergência para a distribuição normal.
O TCL já foi apresentado em Estatística I. Por isso vamos aqui apenas relembrar o
seu enunciado.
Teorema Central do Limite (Lindeberg,1922 ; Feller,1935)
Seja uma sequência infinita de v.a.’s independentes X 1 , X 2 , . . . , X n , . . . com fda’s

F 1 , F 2 , . . . , F n , . . . , médias  1 ,  2 , . . . ,  n , . . . e variâncias  21 ,  22 , . . . ,  2n , . . . .
Considere as somas parciais de ordem n :
S n  X 1  X 2 . . .  X n
 n   1   2 . . .   n
 2n   21   22 . . .   2n
 i  n 
Dado   0, considere também as variâncias restritas:  2
i   x   i  2 dF i x e
 i  n 
sua soma parcial:  2
n   2
1   2
2 . . .   2
n .
Por fim, construa a sequência das v.a.’s padronizadas:
Sn  n
Zn  n 18
As condições necessárias e suficientes para que:
__________________________
14
z
lim PZ n  z  1  e  12 t 2 dt 19
n 2 
são: (C1) lim  2n  

n
 2
n
(C2) lim 1   0
n  2n
Uma demonstração didática deste teorema para o caso i. i. d. envolve a função

característica da v.a.  X t  Ee itX , a qual não será vista neste curso. Por isso sua
prova será omitida.
Observações:
1. Lindeberg estabeleceu a suficiência das condições C1 e C2. Anos depois, Feller

estabeleceu sua necessidade;
2. O teorema garante a convergência das funções de distribuição das somas

padronizadas Z n para a função de distribuição de uma v.a. Normal-padrão ou seja
lim F Z n z  F Z z onde Z  N0, 1.
n
d
Isto é uma convegência em distribuição, notada : Z n  N0, 1;
n
3. O atendimento da condição C2 requer que as funções de distribuição sejam

razoávelmente "suavizadas", no sentido que não possuam fortes descontinuidades
locais, na vizinhança da média;
4. Nas situações mais usuais em que a sequência dos X i é i. i. d. como amostras

simples de uma população, as condições C1 e C2 são facilmente atendidas.
Com efeito, neste caso F i  F X i ,  i   e  2i   2 . Deste modo,  2n  n 2 e a

 i  n 
condição C1 é atendida. Por outro lado,  2
n  n  x   2 dF X x.
 i  n 
 i  n 
 x   2 dF X x
 2
n  i  n 
Assim, a condição C2 fica:  .
 2n 2
Exceção feita de casos patológicos, o numerador deste quociente converge para


 x   2 dF X x quando n  .

__________________________
15

 x   2 dF X x
 2 2
Então, n2  
2
  2  1, e a condição C2 também é atendida;
 n n  
5. O resultado anterior assegura a convergência para a v.a. normal-padrão das

médias amostrais padronizadas das populações estatísticas mais usuais. E não apenas
das médias de ordem 1, mas também das médias de ordem k, tipo
1  n X k , k  1, 2, 3, . . . desde que os momentos populacionais correspondentes
n i1 i
EX  e VX k  também existam;
k
6. Grosseiramente falando, sempre que temos um fenômeno aleatório que é

resultado da ação de inúmeros fatores independentes, a lei de probabilidade da
padronização deste fenômeno pode ser aproximada pela distribuição normal-padrão.
Em sequência aos comentários 4 e 5 acima, no caso de uma amostra simples de
uma população com média  e variância  2 , como S n  nX n a expressão
Z n em 18 fica:
nX n  n nX n   n X n  
Zn     18  
n 2  n 
Deste modo, pelo TCL em 19 teremos:
n X n   d
  N0, 1 19  
n
Na sequência, usaremos o TCL para obter intervalos de confiança aproximados

pela Normal, de parâmetros da média de algumas populações não normais.
A) Aplicações: Aproximação Normal do IC na População Gama
Vamos construir um IC aproximado para o parâmetro  da distribuição Gama e

para sua média 1/, usando o resultado 11 : 2S n   2 2n.
Como E 2 2n  2n e V 2 2n  4n temos:
2S n  2n  2nS n  1  n X n  1.

4n 2 n
Assim, pelo TCL:
__________________________
16
d
n X n  1  N0, 1 20
n
Então, dado o nível de confiança , temos pela tabela da normal-padrão z /2 tal
que:
P|Z|  z /2   .
Logo, avaliando-se 20 na estimativa amostral x para a média teremos:
| n x  1|  z /2  n |x  1|  z /2 
1  1 z /2  x  1  1 z /2
n n
de modo que os intervalos de confiança aproximados pela normal para  e para a

1 serão, respectivamente:
média populacional 
1 1
1 n
z /2 1 n
z /2
IC aprox.
   ,  20  
x x
IC aprox.

1
 x , x  20  
1 1
1 n
z /2 1 n
z /2
Estes intervalos podem ser confrontados com os intervalos obtidos em 12   e

12   da sessão anterior os quais, por serem exatos, devem exibir uma amplitude menor
que os da aproximação normal.
Exemplo 6:
Vamos calcular o intervalo 20   com os dados do Exemplo 3, para o tempo de
vida médio dos pontos de iluminação pública. Temos ali:   0. 95; n  50 ; x  180.
IC aprox.

1
 180 , 180 é
1
1 1. 96 1  1 1. 96
50 50
 140. 93 , 249. 02
A amplitude deste intervalo é de 249. 02  140. 93  108. 09 noites.
__________________________
17
Comparando-se com a amplitude do intervalo exato, calculada no Exemplo 3
( 103. 64 noites), como esperado, o intervalo aproximado apresenta uma amplitude
maior.
Apesar da distribuição gama apresentar assimetria à direita, vemos todavia que,

para o tamanho da amostra considerado n  50 a perda de acurácia na estimação
intervalar da média é relativamente modesta, na ordem de
100  108. 09  103. 64/103. 64  4, 3%.
B) Aplicações: Aproximação Normal do IC na População Poisson
Se temos a amostra X 1 , X 2 , . . . , X n de X  P e a média amostral X n então,

pelo TCL temos:
 X n     N0, 1
d
21
/n n
Dado o nível de confiança  e o percentil correspondente z /2 da Normal-padrão e

substituindo o estimador amostral da média pela estimativa amostral x, temos então:
 x     z /2  x     /n  z /2

/n
2 z2
ou: x  /n z 2   2  2x  n   x 2  0
z2
Coloquemos:    2  2x  n   x 2 .
z2 2 2
O discriminante desta quadrática é positivo:   2x  n  2  4x 2  4x zn   zn  2  0
de modo que suas raízes são reais.
Por outro lado, lim    e 0  x 2  0 de sorte que ambas as raízes são

positivas.
É fácil checar que as raízes são:
2
   x  z   z z 2  4nx
2n 2n
Deste modo, o intervalo de confiança é:
IC aprox
     ,    22
__________________________
18
2 2
IC aprox
   x  z   z z 2  4nx , x  z   z z 2  4nx  22  
2n 2n 2n 2n
Exemplo 7:
O número de veículos que diariamente ficam na estrada em um trecho de uma
rodovia movimentada é uma v.a. Poisson com média  desconhecida. Nos últimos
30 dias, o número médio de veículos que apresentaram problemas mecânicos durante o
percurso foi de 4 veículos/dia. Vamos usa o TCL para construir um Intervalo de
Confiança 95% para a média populacional. Usando estes valores na função quadrática
 obtemos:
1.96 2
   2  8  30
  4 2
As raízes são:    3. 345 5 e    4. 782 6
quadrática 15
10
0
1 2 3 4 5 6 7
lambda
O intervalo de confiança 95%, de acôrdo com 22 será:
IC aprox
.95   3, 5
Ou seja, a amostra indica, que o número médio de sinistros é de 1 ocorrência

abaixo, 1 ocorrência acima da média amostral calculada.
Método Delta
Existe um método para obter a distribuição assintótica Normal de funções contínuas

e deriváveis de variáveis aleatórias assintóticamente normais, a qual determina
explícitamente seus momentos assintóticos (Lehmann,1999).
__________________________
19
Este método é chamado "método delta" , em razão do resíduo utilizado para a
aproximação linear da função considerada. O teorema seguinte resume um dos seus
resultados principais:
Teorema:
d
Sendo X n  uma sequência infinita de v.a.’s tal que n X n    N0,  2 . Se g é
n
uma função contínua, diferenciável em  com g    0, então:
d
n gX n   g  N0,  2 g   2  23
n
Grosseiramente falando, se X n é assintóticamente normal com média  e variância

 /n, então gX n  será assintóticamente normal com média g e variância  2 g   2 /n.
2
Ou seja:
V as gX n   V as X n g   2
onde V as designa a variância assintótica.
Aplicação:
Considere novamente o processo de X  Poisson. A probabilidade que não haja

nenhuma ocorrência no intervalo de tempo unitário é: PX  0  e  . Vamos então usar
o método delta para aproximar um intervalo assintótico para esta probabilidade.
Coloque gX n   e X n . Observe que g é contínua e diferenciável, com derivada que

nunca se anula.
d
Por outro lado, de 21 sabemos que n X n    N0, . Então, pelo método
n
X n  d 2
delta obtemos: n e  e   N0, e , visto que e X n    2 X  e 2 .
n
Dado o grau de confiança  e o quantil z /2 correspondente, substituindo o

estimador de  pela sua estimativa, o intervalo assintótico para e  sai da desigualdade:
e x  e   z /2
e 2 /n
Um intervalo aproximado é obtido avaliando-se o desvio-padrão assintótico de e X
na estimativa amostral de , que é a média amostral x: |e x  e  |  z /2 e x x/n .
__________________________
20
Deste modo, o intervalo assintótico aproximado para e  , a probabilidade que não
haja sinistros no intervalo de tempo considerado, tem extremidades:
e x   x/n e x z /2
Utilizando os valores do Exemplo 7 achamos o

intervalo: e 4   4/30 e 4 1. 96  0. 01831  0. 01341 ou seja, o intervalo assintótico,
com 95% de confiança, é:

IC as
.95 e   0. 0052 , 0. 0321
Lembre que x  4 é a estimativa MV (Máxima Verossimilhança) do número médio de

sinistros. Logo e x  e 4  0. 0183 1, 83% é a estimativa MV da probabilidade que não
haja sinistros em um dia qualquer.
O intervalo acima indica que esta probabilidade se situa entre 0, 52% e 3, 21% com a
confiança 95%.
C) Aplicações: Aproximação Normal do IC para a proporção
Seja X 1 , X 2 , . . . , X n , uma amostra de X  Bernp, com EX  p e VX  p1  p.
Por outro lado, sabemos que o número de sucessos nas n provas,

S n  X 1  X 2 . . .  X n tem distribuição Binomial, com média np e variância np1  p.
O estimador MVU de p é: X n  1n S n , o qual tem valor esperado p e variância

p1  p
n .
Então, pelo TCL temos:
Xn  p d
n   N0, 1 24
p1  p n
Dado o nível de confiança  e o percentil correspondente z /2 da normal-padrão, e


substituindo o estimador amostral da proporção pela estimativa amostral p, teremos
então:

|p  p|
 z /2 
p1  p/n
__________________________
21

|p  p|  z /2 p1  p/n 25
Ou seja, os desvios absolutos entre as proporções populacional e amostral

dependem diretamente do desvio-padrão da proporção amostral e do percentil de
confiança.
A maneira como a desigualdade 25 é resolvida conduz a diferentes soluções para

o Intervalo de Confiança da proporção.
Veremos na sequência 3 tratamentos distintos dados à desigualdade acima, os

quais conduzem a três Intervalos de Confiança: o Correto, o Estimado e o Conservador.
Os dois últimos são intervalos convencionais, que figuram em todos os livros-texto

de Estatística.
1. IC Correto
Elevando-se ao quadrado de ambos os lados de 25 :

  p  p 2  1 2
n p1  pz 
2  1 1
p  p 2  2 pp  n z2p  n z2p2  0 
 
1  1
n z 2 p 2  2 p  1
n z 2 p  p 2  0 26
Vamos agora buscar as raízes da quadrática:
 
p  1  1
n z 2 p 2  2 p  1
n z 2 p  p 2 26  
  
O discriminante é   2 p  1
n z2 2  4p 2  4
n z 2 p   1n z 2  2 o qual é positivo, de modo
que as raízes são reais.
As raízes são escritas abaixo em duas formas equivalentes:
   
2 p  1n z 2    2 p  1
n z 2   2 p  1
n z2 2  4p 2
p    ou:
21  1n z 2  21  1
n z2
 1 2
2 p  n z 

2p
p   1 2
1  1   2p 1 z 2  2  27
21  n z  n
__________________________
22
A expressão 27 evidencia que as raízes são ambas positivas. Também, ambas as
raizes são menores ou iguais à 1.

Para ver isso, observe à partir de 26   que 0  p 2  0 e que
 2 
1  1  p  0. Ou seja, teremos uma raiz nula se p  0 e uma raiz unitária se

p  1.
Pela desigualdade 26 o intervalo é uma região na qual a quadrática é negativa.

Deste modo, p intercepta o eixo da abcissa no intervalo 0, 1.
Assim, o intervalo de confiança Correto para a proporção p será:
 
IC cor
 p  p  , p   28

Para ilustrar a construção do intervalo tomamos   0. 95; n  30; p  0. 8.
A quadrática
1 1
p  1  30
1. 96 2 p 2  1. 6  30
1. 96 2 p  0. 64  1. 128 1p 2  1. 728 p  0. 64
é representada abaixo:
0.10
quadrática
0.08
0.06
0.04
0.02
0.00
0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
p
-0.02

p : n  30, p  0. 8 ;   0. 95
As raízes são: p   0. 627 e p   0. 904, de modo que o intervalo é:
IC cor
.95 p  0. 627 , 0. 904
__________________________
23
Amplitude: 0. 904  0. 627  0. 277
Mantendo-se os valores   0. 95 e n  30 mas aumentando-se o valor de proporção


amostral para p  0. 9 obtemos a quadrática:
1 1
p  1  30
1. 96 2 p 2  1. 8  30
1. 96 2 p  0. 81  1. 128 1p 2  1. 928 1p  0. 81
representada abaixo:
quadrática 0.12
0.10
0.08
0.06
0.04
0.02
0.00
0.6 0.7 0.8 0.9 1.0 1.1 1.2
p

p : n  30, p  0. 9 ;   0. 95
com as raízes: p   0. 743 e p   0. 965. O intervalo correto fica:
IC cor
.95 p  0. 743 , 0. 965
A amplitude do intervalo é 0. 965  0. 743  0. 222.
2. IC Estimado
A construção de um IC estimado utiliza a estimativa amostral do desvio-padrão da

 
proporção amostral, ou seja: p1  p/n .
Assim, a desigualdade 26 fica:
  
|p  p|   p1  p/n z /2
__________________________
24
Deste modo, o IC estimado será:
     
IC est
 p   p   p1  p/n z /2 , p   p1  p/n z /2  29
Como ilustração numérica, usando os mesmos valores anteriores


  0. 95; n  30; p  0. 8 o Intervalo Estimado fica:
IC est
 p  0. 8   0. 80. 2/30 1. 96 , 0. 8   0. 80. 2/30 1. 96
IC est
 p  0. 657 , 0. 943
Amplitude: 0. 943  0. 657  0. 286
Observe que a amplitude do IC estimado é maior que a do IC correto.
3. IC Conservador
A construção do Intervalo Conservador usa o fato de que, para 0  p  1, o

termo p1  p alcança seu valor máximo  1/4 quando p  1/2.
Deste modo, para o desvio-padrão da proporção amostral teremos um limite

superior: p1  p/n  1/ 4n .
Assim, o Intervalo Conservador usa, para os desvios absolutos entre proporções

populacional e amostral, dada em 25, o maior valor possível para o desvio-padrão:
 1 z
|p  p|  /2 30
4n
Dado o desconhecimento sobre o verdadeiro valor de p, a idéia é a de adotar a

estratégia mais conservadora, tomando o intervalo de maior amplitude possível.
O Intervalo Conservador fica:
 1 z , 1 z 
IC cons
 p   p  /2 p /2 29  
4n 4n

Ilustrando numéricamente para   0. 95; n  30; p  0. 8 obtemos:
__________________________
25
IC cons 1 1. 96 , 0. 8  1 1. 96
.95 p  0. 8 
120 120
 0. 621 , 0. 979
Amplitude: 0. 979  0. 621  0. 358
Como vemos, a amplitude do intervalo Conservador é bem maior que aquela do

intervalo Estimado.
Tamanho da Amostra
Quid para o tamanho amostral n ?
Nas pesquisas empíricas envolvendo a proporção p, particularmente em sondagens

de opinião, a expressão 30 é utilizada para se determinar o tamanho da amostra
compatível com diferentes níveis de acurácia na estimativa desta proporção.
Resolvendo-se 30 em n, com igualdade, obtemos:
z /2
n  2 31
2 p  p

Lembremos que |p  p| é o erro amostral absoluto da proporção, de modo que a

igualdade |p  p|  0. 02 significa que, na estimativa de p, toleramos uma margem de
erro de 2%, para mais ou para menos.
A tabela abaixo fornece os diferentes valores de n compatíveis com as margens de

erro de 5%, 2% e 1% na estimativa de p, de acôrdo com os graus de confiança
desejados 90%, 95% e 99%, segundo a fórmula 31 :
Graus de Confiança
n 90% 95% 99%
5% 272 384 665
Erro Amostral
2% 1701 2401 4160
1% 6806 9604 16641
Observa-se na tabela que o tamanho amostral requerido cresce com a redução do

erro amostral da proporção e do grau de confiança desejados.

__________________________

VI - Intervalos de Confiança

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

VI - Intervalos de Confiança

Enviado por

Direitos autorais:

Formatos disponíveis

VI - INTERVALOS DE CONFIANÇA

Um enfoque alternativo à estimação pontual de um parâmetro populacional

No caso de um parâmetro unidimensional, a construção dos Intervalos de Confiança

Todo ao longo da exposição, trataremos o grau de confiança ( , ou tamanho da

Também, consideraremos apenas a construção de Intervalos de Confiança ou seja,

A construção dos Intervalos de Confiança para um parâmetro    requer o

Ou seja, a probabilidade que o estimador esteja no intervalo I é de 100%.

Vamos supor, sem perda de generalidade, que os limites t 1 e t 2 sejam funções

Assim, o Intervalo de Confiança  para  será:

1. Intervalos de Confiança em populações Normais

A) Intervalos de Confiança para a média

Sabemos que o estimador MVU de  é a média amostral X n .

Neste caso, de acôrdo com 2 a estatística do IC é a normal-padrão.

P|Z|  z /2    3

O gráfico abaixo ilustra o caso de um intervalo de confiança   0. 95 caso este em

ou ainda: x   z /2    x   z /2

Logo, IC     x   z /2 , x   z /2  4  

Neste caso,  2 deverá ser estimado. A estatística do IC é a v.a.T  Student padrão.

No Capítulo V vimos que o estimador MVU deste parâmetro é:

e que esta estatística é independente de X n . Vimos também, no Capítulo II, que:

Por outro lado, da Estatística I vimos que a variável aleatória T  Z tem

Combinando 2 com 5 temos então que

Comparando-se 6 com 2 vemos que o desconhecimento da variância tem

Dado , vamos determinar na tabela da Student-padrão, com n  1 graus de

P|T|  t /2    7

O gráfico abaixo ilustra o caso de um intervalo de confiança   0. 95, caso este em

A densidade da v.a. T  padrão com 20 g. l. é:

Integrando-se por partes obtemos a recorrência: x  x  1x  1.

Em particular,  12    e, se x for inteiro, n  1  n!

Então, avaliando 6 na estimativa amostral da média s n1 e usando o resultado em

A amplitude do intervalo é: 2 s t /2 .

Comparando a situação a) em que a variância é conhecida, vemos que a amplitude

(Lembre da Estatística I que o curtose da distribuição Normal é igual à 3, ao passo

Deste modo, para   s, a amplitude do IC  2 s t /2  é maior que a sua amplitude

A maior imprecisão incorrida na estimação intervalar é um custo a suportar por não

O intervalo de Confiança  é dado por 270   15 z /2 . Os percentis relevantes da

Deste modo, teremos:

Os intervalos de confiança correspondentes são:

b) Se  2 for estimada por s 2  225

O intervalo de Confiança  é dado por 270   15 t /2 . Os percentis relevantes da

Este valor é a comparar com o comprimento do mesmo intervalo quando a variância

Ou seja, o desconhecimento da variância trouxe uma perda de eficiência na

Para a interpretação, se uma sequência de amostras aleatórias de 25 farmácias for

A distribuição do estimador amostral da variância, dada em 5, permite que se

Os percentis indicados correspondem à um intervalo de confiança

Então, avaliando 5 na estimativa amostral s 2n1 e usando 9 temos:

Temos enfim o intervalo de confiança  para a variância:

Exemplo 2: No contexto do Exemplo 1 anterior, temos: n  1  24 e

confiança: 90%, 95% e 98%.

2. Intervalos de Confiança em populações Não Normais

No item anterior construimos intervalos de confiança para a média e a variância de

Em muitos casos pode-se fazer a estimação paramétrica intervalar também em

Os exemplos dados aqui ilustram como isto acontece. A racionalidade destes

Temos uma amostra X 1 , X 2 , . . . , X n de uma população X  , 1.

Temos EX   1 e VX  1 , de modo que os dois primeiros momentos desta

Vimos no Capítulo II que S  X 1  X 2 . . . X n é uma estatística suficiente para 

2S n   2 2n 11

Assim, dado o nível de confiança , e sendo os percentis q 1 e q 2 tais que

Assim, substituindo a v.a. S pela sua realização amostral s  x 1  x 2 . . . x n e

E o intervalo de confiança para a média será:

Exemplo 3: O tempo de vida de um ponto de iluminação pública em noites de 10h

Da tabela da  2 100 encontramos: q 1  74. 22 e q 2  129. 6 . O intervalo dado em

1    250180 ; 250180   138. 88 , 242. 52

A amplitude do intervalo é de 242. 52  138. 88  103. 64 noites.