Você está na página 1de 25

VI - INTERVALOS DE CONFIANÇA

Um enfoque alternativo à estimação pontual de um parâmetro populacional


desconhecido consiste em se obter uma cobertura para o parâmetro ou seja, uma
vizinhança para o seu valor que apresente elevada probabilidade de ocorrência.

No caso de um parâmetro unidimensional, a construção dos Intervalos de Confiança


constitue uma estimação intervalar para este parâmetro.

Todo ao longo da exposição, trataremos o grau de confiança ( , ou tamanho da


cobertura) como um parâmetro a ser escolhido pelo pesquisador. Normalmente, os
valores mais usuais são   0. 90; 0. 95; 0. 99.

Também, consideraremos apenas a construção de Intervalos de Confiança ou seja,


de coberturas unidimensionais de tamanho  pré-fixado.

A construção dos Intervalos de Confiança para um parâmetro    requer o



conhecimento da distribuição de probabilidade de um estimador  n , obtido à partir de
uma amostra de tamanho n.

Considere o intervalo I  t 1  , t 2  tal que P  n  I  .

Ou seja, a probabilidade que o estimador esteja no intervalo I é de 100%.

Vamos supor, sem perda de generalidade, que os limites t 1 e t 2 sejam funções


decrescentes do verdadeiro valor .

Então:
  
t 1    n  t 2   t 1 1
1  n    t2  n

Assim, o Intervalo de Confiança  para  será:


 
IC    t 1 1
1   n  ; t 2   n  1

Interpretação: O intervalo de confiança dado em 1 não significa que existe 100%
 
que o parâmetro  esteja dentro do intervalo t 1 1
1   n  ; t 2   n , pois  é um parâmetro,
não uma variável aleatória. Calcula-se probabilidades para variáveis aleatórias e não
para parâmetros !

__________________________
Hugo Boff - Estatística II 2021
2
O que a expressão 1 nos diz é que, se uma sequência de amostras forem
tomadas, todas de tamanho n, e se para cada amostra uma estimativa para  for obtida
  
e um intervalo do tipo t 1 1
1   n  ; t 2   n  para o estimador  n for calculado, então
100% destes intervalos conterão o verdadeiro valor de .

1. Intervalos de Confiança em populações Normais


Com base em amostras X 1 , X 2 , . . . , X n extraídas de populações normais
X  N,  2 , podemos calcular explícitamente intervalos de confiança  tanto para a
média  como para a variância  2 .

A) Intervalos de Confiança para a média

Sabemos que o estimador MVU de  é a média amostral X n .

Por outro lado, sabemos que X n  N,  2 /n. Padronizando a v.a. X n vem:

Xn  
Z  N0, 1 2
/ n

a)  2 conhecida

Neste caso, de acôrdo com 2 a estatística do IC é a normal-padrão.


Dado , vamos determinar na tabela da normal-padrão o valor de z /2 tal que:

P|Z|  z /2    3

O gráfico abaixo ilustra o caso de um intervalo de confiança   0. 95 caso este em


que lemos na tabela o valor z /2  1. 96, ou seja: P|Z|  1. 96  0. 95 .

Density Normal

-3 -1.96 -1 0 1 1.96 3 z

__________________________
Hugo Boff - Estatística II 2021
3
Então, avaliando 2 na estimativa amostral da média x e usando o resultado em 3
x
obtemos:  z /2 , ou seja:
/ n
|x  |   z /2 4
n

ou ainda: x   z /2    x   z /2


n n

Logo, IC     x   z /2 , x   z /2  4  


n n

Uma estimação intervalar será tanto melhor quanto menor a amplitude do intervalo
para um dado nível de confiança .

Nas expressões 4  4   acima vemos que a estimação intervalar da média será
tanto melhor quanto menor o desvio-padrão . A amplitude do intervalo  2  z /2 
n
também diminui com o aumento do tamanho da amostra n.

b)  2 desconhecida

Neste caso,  2 deverá ser estimado. A estatística do IC é a v.a.T  Student padrão.

No Capítulo V vimos que o estimador MVU deste parâmetro é:

S 2n1  1  n X i  X n  2
n1 i1

e que esta estatística é independente de X n . Vimos também, no Capítulo II, que:

n  1S 2n1
  2 n  1 5
2

Por outro lado, da Estatística I vimos que a variável aleatória T  Z tem


2
 /
distribuição T  Student com  graus de liberdade, quando Z e  2  são independentes.

Combinando 2 com 5 temos então que


Xn   n  1S 2n1 Xn  
/ 2
/n  1  tem distribuição t  Student com n  1 graus de
/ n  S n1 / n
liberdade.

Ou seja,

__________________________
Hugo Boff - Estatística II 2021
4
X n  
 Tn  1 6
S n1 / n

Comparando-se 6 com 2 vemos que o desconhecimento da variância tem


simplesmente o efeito de substituir na estatística da estimação intervalar, mutatis
mutandis, o desvio-padrão populacional  pela sua estimativa amostral s.

Dado , vamos determinar na tabela da Student-padrão, com n  1 graus de


liberdade, o valor de t /2 tal que:

P|T|  t /2    7

O gráfico abaixo ilustra o caso de um intervalo de confiança   0. 95, caso este em


que, para n  1  20, lemos na tabela o valor t /2  2. 08, ou seja: P|T|  2. 08  0. 95.

Student Density

-2.08 -1 0 1 2.08 3 t

A densidade da v.a. T  padrão com 20 g. l. é:

 21  1 1/2 1 2  21
f T t; 20  2
 12  20 
 18  1  18
t  2
2


onde, como vimos em Estatística I, x   u x1 e u du é a função gama.
0

Integrando-se por partes obtemos a recorrência: x  x  1x  1.

Em particular,  12    e, se x for inteiro, n  1  n!

Obs.:
1 1/2 1 
1 2  1
A densidade da T tabulada é: f tab. T t;    1       1   t  2 ; t 
2
. Como
2 2

ET tab   0 e a variância é VT tab    , obtemos a T  padrão fazendo a
2
transformação T  T / tab  .
2

__________________________
Hugo Boff - Estatística II 2021
5
Para o caso   20, esta expressão resulta na densidade dada acima. Esta é a
densidade que deve ser usada para comparações com a Normal-padrão.

Então, avaliando 6 na estimativa amostral da média s n1 e usando o resultado em


xn  
7 obtemos:  t /2 , ou seja:
s/ n
|x n  |  s t /2 8
n

ou ainda: xn  s t    xn  s t
/2 /2
n n

Logo, IC     x n  s t , xn  s t  8  
/2 /2
n n

Como mencionamos acima, a estimação intervalar será tanto melhor quanto menor
a amplitude do intervalo para um dado nível de confiança .

Nas expressões 8  8   acima vemos que a estimação intervalar da média será
tanto melhor quanto menor o desvio-padrão amostral.

A amplitude do intervalo é: 2 s t /2 .


n

Comparação:

Comparando a situação a) em que a variância é conhecida, vemos que a amplitude


do intervalo é aqui maior, pois para  elevado temos: t /2  z /2 .

Com efeito, sendo T leptocúrtica, as caudas da sua distribuição são mais altas que
as caudas da v.a. Normal.

(Lembre da Estatística I que o curtose da distribuição Normal é igual à 3, ao passo


que o curtose T é igual à 3  6 
4

Deste modo, para   s, a amplitude do IC  2 s t /2  é maior que a sua amplitude


n
quando  é conhecida 2  z /2 .
n

A maior imprecisão incorrida na estimação intervalar é um custo a suportar por não


se conhecer a variância populacional, havendo a necessidade de substituí-la pela sua
estimativa amostral.

Exemplo 1: A receita mensal em R$1. 000 das farmácias da Capital é uma v.a.
X com distribuição Normal com média  desconhecida e variância  2 . Uma amostragem
com 25 farmácias sorteadas aleatoriamente mostrou: x  270 ; s 2  225.

__________________________
Hugo Boff - Estatística II 2021
6
Vamos fazer a estimação intervalar de  para os níveis de confiança
90%, 95% e 99%.

a) Se  2  225 conhecida:

O intervalo de Confiança  é dado por 270   15 z /2 . Os percentis relevantes da


5
Normal padrão são: z  1. 65 90%;  1. 96 95%;  2. 58 99%.

Deste modo, teremos:

270  31. 65 para   0. 90; 270  31. 96 para   0. 95 e 270  32. 58 para
  0. 99.

Os intervalos de confiança correspondentes são:

IC .90   265. 05 , 274. 95 ; IC .95   264. 12 , 275. 88 ;
IC .99   262. 26 , 277. 74

b) Se  2 for estimada por s 2  225

O intervalo de Confiança  é dado por 270   15 t /2 . Os percentis relevantes da


5
Student padrão são: t  1. 711 90%;  2. 064 95%;  2. 797 99%.

Deste modo, teremos: 270  31. 711 para   0. 90; 270  32. 064 para   0. 95 e
270  32. 797 para   0. 99. E o intervalos de confiança correspondentes são:

IC .90   264. 87 , 275. 13 ; IC .95   263. 81 , 276. 19 ;
IC .99   261. 61 , 278. 39

Vemos que a amplitude do IC .95  é igual à 276. 19  263. 81  12, 38.

Este valor é a comparar com o comprimento do mesmo intervalo quando a variância


é conhecida, cuja amplitude é menor: 275. 88  264. 12  11. 76 reais.

Ou seja, o desconhecimento da variância trouxe uma perda de eficiência na


estimação intervalar de 5, 3%.

Para a interpretação, se uma sequência de amostras aleatórias de 25 farmácias for


tomada e para cada amostra for calculado um Intervalo com confiança 0. 95  dos quais
23. 81 , 276. 19 é um deles  95% destes intervalos conterão a receita média .

__________________________
Hugo Boff - Estatística II 2021
7
B) Intervalos de Confiança para a Variância

A distribuição do estimador amostral da variância, dada em 5, permite que se


construa intervalos de confiança para a variância, usando os percentis da v.a.  2 n  1.
Pela tabela da  2 achamos os percentis q 1 e q 2 tais que:

Pq 1   2 n  1  q 2    9

A curva abaixo representa os pontos da  2 24 ou seja, com 24 g.l. cuja densidade
é a de uma v.a. gama  12 ; n1
2
:
24 1
q 2 1
f  2 q; 24  24 e 2 q
24
2 
2
2

Os percentis indicados correspondem à um intervalo de confiança


0. 95 : q 1  12. 4 e q 2  39. 4 .
C h i- s q u a re

12.4 20 30 39.4 q

Então, avaliando 5 na estimativa amostral s 2n1 e usando 9 temos:

n  1s 2 2
q1   q2  q12   q11
2 n  1s 2

n  1s 2 2 n  1s 2
ou: q2    q1 10

Temos enfim o intervalo de confiança  para a variância:

n  1s 2 n  1s 2
IC   2    q2 , q1  10  

Exemplo 2: No contexto do Exemplo 1 anterior, temos: n  1  24 e


s  225. Vamos efetuar a estimação intervalar da variância  2 para três níveis de
2

confiança: 90%, 95% e 98%.

__________________________
Hugo Boff - Estatística II 2021
8
2
Os percentis correspondentes à estes níveis, mostrados na tabela da  24, são os
seguintes:
Confiança 0. 90 0. 95 0. 98
q1 13. 85 12. 40 10. 85
q2 36. 41 39. 36 42. 98

24225 24225
IC .90  2    ,   148. 31 , 389, 89
36. 41 13. 85

24225 24225
IC .95  2    ,   137, 19 , 435, 48
39. 36 12. 40

24225 24225
IC .98  2    ,   125, 63 , 497, 69
42. 98 10. 85

Observe que amplitude dos intervalos cresce com o aumento do nível de confiança
. O aumento na confiabilidade do intervalo tem como preço uma menor precisão da
estimativa intervalar.

2. Intervalos de Confiança em populações Não Normais

No item anterior construimos intervalos de confiança para a média e a variância de


populações normais.

Em muitos casos pode-se fazer a estimação paramétrica intervalar também em


populações não normais.

Os exemplos dados aqui ilustram como isto acontece. A racionalidade destes


intervalos é a mesma, e sua construção segue exatamente o mesmo método
empregado para a distribuição normal.

A) População Gama

Temos uma amostra X 1 , X 2 , . . . , X n de uma população X  , 1.

Temos EX   1 e VX  1 , de modo que os dois primeiros momentos desta


2
variável são funções de   0.

Vimos no Capítulo II que S  X 1  X 2 . . . X n é uma estatística suficiente para 


e que  1 é o seu estimador pontual MVU (Capítulo V).
n
S

__________________________
Hugo Boff - Estatística II 2021
9
Para obtermos um estimação intervalar de , lembramos da Estatística I que:

2S n   2 2n 11

Assim, dado o nível de confiança , e sendo os percentis q 1 e q 2 tais que


Pq 1   2 2n  q 2   , teremos:
q q
q 1  2S n  q 2  1    2
2S n 2S n

Assim, substituindo a v.a. S pela sua realização amostral s  x 1  x 2 . . . x n e


levando em conta que s  nx obtemos o intervalo desejado:

q1 q
IC     , 2  12
2nx 2nx

E o intervalo de confiança para a média será:

1    2nx , 2nx 
IC    12  
q2 q1

Exemplo 3: O tempo de vida de um ponto de iluminação pública em noites de 10h


tem distribuição Exponencial com média 1/ desconhecida. Uma amostragem aleatória
1 .
em 50 pontos mostrou o tempo de vida médio x  180. Vamos calcular IC .95  

Da tabela da  2 100 encontramos: q 1  74. 22 e q 2  129. 6 . O intervalo dado em


12  fica:

1    250180 ; 250180   138. 88 , 242. 52


IC .95  
129. 6 74. 22

Ou seja, esta amostra em particular indica que a duração média das luminárias fica
entre 138. 88 noites ( 4 meses e 18 dias) e 242. 52 noites (8 meses e 2 dias) com
95% de probabilidade.

A amplitude do intervalo é de 242. 52  138. 88  103. 64 noites.

Lembrête do significado: Se uma sequência de amostras aleatórias for realizada,


todas com 50 pontos de iluminação e se, para cada amostra, for calculada a estimativa
para a duração média das luminárias e o intervalo de confiança 0. 95 dado em 12   para
a duração média populacional, 95% destes intervalos conterão o tempo de vida médio
de todos os pontos de iluminação pública da cidade.

B) População Uniforme

Temos uma amostra X 1 , X 2 , . . . , X n de uma população X  Unif , b.

__________________________
Hugo Boff - Estatística II 2021
10
Vimos no Capítulo V que se b é conhecido, a estatística suficiente para  é o
mínimo amostral X 1 . Supondo b conhecido b  , vamos usar a distribuição desta
estatística para construir um estimação intervalar de confiança  para o mínimo
populacional .

Sabemos que PX 1  x   b  x  n ; x  , b.


b

Então, dado   0, 1, vamos buscar os percentis u 1 e u 2 tais que:

Pu 1  X 1  u 2    13

, o que implica: b  u 2  n 
1 1
Assim, u 2 é tal que PX 1  u 2   ; e então:
2 b 2

1 1
u 2  b  b   2
n 13  

1
Análogamente, u 1 é tal que PX 1  u 1   2 , o que implica:
1   b  u 1  n  2 . Ou seja:
1
b
1 1 
u 1  b  b   2  n 13 

Avaliando as desigualdades em 13 para a realização amostral x 1 e substituindo ali


os percentis dados em 13   e 13   vem: u 1  x 1  u 2 

1 1 1 1
b  b   2
 n  x 1  u 2  b  b   2
n 

b  x 1 b  x 1
b 1 1
   b 1 1
o que nos leva ao intervalo:
 2
 n  2
n

b  x 1 b  x 1
IC    b  1 1
, b 1 1
 14
 2
 n  2
n

Observe que o limite superior do intervalo de confiança em 14 é inferior à x 1 pois
b  x 1
: b  x 1  1 1 . Isto implica que o intervalo não inclui o valor observado x 1 .
 2 n
Isto ocorre porque a estatística X 1 superestima o mínimo populacional .

Com efeito, não é difícil checar que EX 1     b    .


n1

Exemplo 4: O preço da limpeza completa nos lava-jatos da cidade (em R$ é


uma v.a. Uniforme no intervalo , 100. Em 40 postos sorteados, o menor preço
observado foi de 28 reais. Calculemos um intervalo de confiança 0. 90 para o preço
mínimo .

__________________________
Hugo Boff - Estatística II 2021
11
Com base em 14, o intervalo fica:

IC    100  100  281 , 100  100  281 


 10.90
2
 40  10.90
2
 40

IC    22. 40, 27. 90

Ou seja, a amostra indica, com 90% de confiança, que o preço mínimo do lava-jato
na cidade está entre 22 reais e 40 centavos e 27 reais e 90 centavos.

Observe que o intervalo não inclui o valor observado x 1  28.

C) População Exponencial Truncada

Temos n v.a.’s Exponenciais independentes X i  ExpA,  i  ; i  1, 2, . . . , n.

Observe que estas variáveis não são idênticamente distribuídas de modo que
X 1 , X 2 , . . . , X n não é uma amostra aleatória simples.

Seja: Y  minX 1 , X 2 , . . . , X n  a menor dentre as n v.a.’s.

Vamos determinar a distribuição de Y.

PY  y  PX 1  y; X 2  y; . . . ; X n  y   ni1 PX i  y


  ni1 e  i yA  e  1 yA e  2 yA . . . e  n yA
 e  1  2 ... n yA

Ou seja, colocando    1   2 . . .  n temos:

0 se y  A
F Y y;   15
1  e yA se y  A

1
Está claro assim que Y  ExpA; , com EY  A   e VY  12 .

Apesar de Y superestimar o mínimo populacional A, podemos usar uma realização


y de Y para construir um intervalo de confiança  para A.

Seguindo o caminho percorrido no item anterior, para o nível de confiança , vamos


achar os percentis e 1 e e 2 tais que:

Pe 1  Y  e 2    16

__________________________
Hugo Boff - Estatística II 2021
12
1
Será fácil verificar que: PY  e 2   2

1
e e 2 A  2

Resolvendo em e 2 obtemos:

1 2
e2  A   ln 1  16  

1 1
Análogamente, PY  e 1   2
 1  e e 1 A  2
, o que dá:

1 2
e1  A   ln 1  16  

Avaliando as desigualdades em 16 para a realização amostral y e substituindo aos


percentis de 16   e 16   vem: e 1  y  e 2 

1 2 1 2
A  ln 1   y  A  ln 1  

1 2 1 2
y  ln 1   A  y  ln 1  o que leva ao intervalo:

1 2 1 2
IC  A  y   ln 1 , y  ln 1  17

Observe que o limite superior do intervalo de confiança em 17 é inferior à y. Assim


como no caso anterior, o intervalo não inclui o valor observado y, uma vez que, como
vimos acima, estatística Y superestima o mínimo populacional A.

Exemplo 5: A produtividade das lavouras de trigo do RS (ton./hectare) tem


distribuição Exponencial com produtividade mínima garantida A, a qual é desconhecida.
Para as 5 regiões produtoras do Estado, uma estimativa histórica obtida para  foi 2 e
a região menos produtiva apresentou a produção média de 2. 5 ton/hec.

Com estas informações, vamos calcular um intervalo de confiança 0. 90 para a


produção mínima garantida em cada uma das regiões do Estado.

Substituindo os valores dados em 17 obtemos:

IC  A  2. 5  12 ln 0.10


2
 , 2. 5  1
2
2
ln 1.90  ou seja:
 1. 0 , 2. 474.

Assim, a informação obtida indica que a produtividade mínima garantida no Estado


se situa entre 1 ton. e 2 ton. e 474 kg por hectare, com confiança 90%.

__________________________
Hugo Boff - Estatística II 2021
13
3. Intervalos de Confiança com Aproximação Normal

A existência do Teorema Central do Limite (TCL) permite a construção de


intervalos de confiança para a média populacional à partir da média amostral extraída
de qualquer população. As restrições à sua aplicação são bastante fracas, o que
permite a sua aplicação em ampla escala.

A qualidade da aproximação normal depende em grande medida do tamanho


amostral n. Ceteris Paribus, quanto maior for este tamanho, melhor será a
aproximação.

A velocidade da convergência também depende naturalmente dos graus de


assimetria e curtose da distribuição original. Quanto menor o grau de assimetria e
quanto mais próximo de 3 estiver o grau de curtose da distribuição original, mais rápida
será a convergência para a distribuição normal.

O TCL já foi apresentado em Estatística I. Por isso vamos aqui apenas relembrar o
seu enunciado.

Teorema Central do Limite (Lindeberg,1922 ; Feller,1935)

Seja uma sequência infinita de v.a.’s independentes X 1 , X 2 , . . . , X n , . . . com fda’s


F 1 , F 2 , . . . , F n , . . . , médias  1 ,  2 , . . . ,  n , . . . e variâncias  21 ,  22 , . . . ,  2n , . . . .

Considere as somas parciais de ordem n :

S n  X 1  X 2 . . .  X n
 n   1   2 . . .   n
 2n   21   22 . . .   2n

 i  n 
Dado   0, considere também as variâncias restritas:  2
i   x   i  2 dF i x e
 i  n 
sua soma parcial:  2
n   2
1   2
2 . . .   2
n .

Por fim, construa a sequência das v.a.’s padronizadas:

Sn  n
Zn  n 18

As condições necessárias e suficientes para que:

__________________________
Hugo Boff - Estatística II 2021
14
z
lim PZ n  z  1  e  12 t 2 dt 19
n 2 

são: (C1) lim  2n  


n

 2
n
(C2) lim 1   0
n  2n

Uma demonstração didática deste teorema para o caso i. i. d. envolve a função


característica da v.a.  X t  Ee itX , a qual não será vista neste curso. Por isso sua
prova será omitida.

Observações:

1. Lindeberg estabeleceu a suficiência das condições C1 e C2. Anos depois, Feller


estabeleceu sua necessidade;

2. O teorema garante a convergência das funções de distribuição das somas


padronizadas Z n para a função de distribuição de uma v.a. Normal-padrão ou seja
lim F Z n z  F Z z onde Z  N0, 1.
n

d
Isto é uma convegência em distribuição, notada : Z n  N0, 1;
n

3. O atendimento da condição C2 requer que as funções de distribuição sejam


razoávelmente "suavizadas", no sentido que não possuam fortes descontinuidades
locais, na vizinhança da média;

4. Nas situações mais usuais em que a sequência dos X i é i. i. d. como amostras


simples de uma população, as condições C1 e C2 são facilmente atendidas.

Com efeito, neste caso F i  F X i ,  i   e  2i   2 . Deste modo,  2n  n 2 e a


 i  n 
condição C1 é atendida. Por outro lado,  2
n  n  x   2 dF X x.
 i  n 

 i  n 
 x   2 dF X x
 2
n  i  n 
Assim, a condição C2 fica:  .
 2n 2

Exceção feita de casos patológicos, o numerador deste quociente converge para



 x   2 dF X x quando n  .


__________________________
Hugo Boff - Estatística II 2021
15

 x   2 dF X x
 2 2
Então, n2  
2
  2  1, e a condição C2 também é atendida;
 n n  

5. O resultado anterior assegura a convergência para a v.a. normal-padrão das


médias amostrais padronizadas das populações estatísticas mais usuais. E não apenas
das médias de ordem 1, mas também das médias de ordem k, tipo
1  n X k , k  1, 2, 3, . . . desde que os momentos populacionais correspondentes
n i1 i
EX  e VX k  também existam;
k

6. Grosseiramente falando, sempre que temos um fenômeno aleatório que é


resultado da ação de inúmeros fatores independentes, a lei de probabilidade da
padronização deste fenômeno pode ser aproximada pela distribuição normal-padrão.

Em sequência aos comentários 4 e 5 acima, no caso de uma amostra simples de
uma população com média  e variância  2 , como S n  nX n a expressão
Z n em 18 fica:

nX n  n nX n   n X n  
Zn     18  
n 2  n 

Deste modo, pelo TCL em 19 teremos:

n X n   d
  N0, 1 19  
n

Na sequência, usaremos o TCL para obter intervalos de confiança aproximados


pela Normal, de parâmetros da média de algumas populações não normais.

A) Aplicações: Aproximação Normal do IC na População Gama

Vamos construir um IC aproximado para o parâmetro  da distribuição Gama e


para sua média 1/, usando o resultado 11 : 2S n   2 2n.

Como E 2 2n  2n e V 2 2n  4n temos:

2S n  2n  2nS n  1  n X n  1.


4n 2 n

Assim, pelo TCL:

__________________________
Hugo Boff - Estatística II 2021
16

d
n X n  1  N0, 1 20
n

Então, dado o nível de confiança , temos pela tabela da normal-padrão z /2 tal
que:

P|Z|  z /2   .

Logo, avaliando-se 20 na estimativa amostral x para a média teremos:

| n x  1|  z /2  n |x  1|  z /2 

1  1 z /2  x  1  1 z /2
n n

de modo que os intervalos de confiança aproximados pela normal para  e para a


1 serão, respectivamente:
média populacional 

1 1
1 n
z /2 1 n
z /2
IC aprox.
   ,  20  
x x

IC aprox.

1
 x , x  20  
1 1
1 n
z /2 1 n
z /2

Estes intervalos podem ser confrontados com os intervalos obtidos em 12   e


12   da sessão anterior os quais, por serem exatos, devem exibir uma amplitude menor
que os da aproximação normal.

Exemplo 6:
Vamos calcular o intervalo 20   com os dados do Exemplo 3, para o tempo de
vida médio dos pontos de iluminação pública. Temos ali:   0. 95; n  50 ; x  180.

IC aprox.

1
 180 , 180 é
1
1 1. 96 1  1 1. 96
50 50

 140. 93 , 249. 02

A amplitude deste intervalo é de 249. 02  140. 93  108. 09 noites.

__________________________
Hugo Boff - Estatística II 2021
17
Comparando-se com a amplitude do intervalo exato, calculada no Exemplo 3
( 103. 64 noites), como esperado, o intervalo aproximado apresenta uma amplitude
maior.

Apesar da distribuição gama apresentar assimetria à direita, vemos todavia que,


para o tamanho da amostra considerado n  50 a perda de acurácia na estimação
intervalar da média é relativamente modesta, na ordem de
100  108. 09  103. 64/103. 64  4, 3%.

B) Aplicações: Aproximação Normal do IC na População Poisson

Se temos a amostra X 1 , X 2 , . . . , X n de X  P e a média amostral X n então,


pelo TCL temos:

 X n     N0, 1
d
21
/n n

Dado o nível de confiança  e o percentil correspondente z /2 da Normal-padrão e


substituindo o estimador amostral da média pela estimativa amostral x, temos então:

 x     z /2  x     /n  z /2


/n

2 z2
ou: x  /n z 2   2  2x  n   x 2  0

z2
Coloquemos:    2  2x  n   x 2 .

z2 2 2
O discriminante desta quadrática é positivo:   2x  n  2  4x 2  4x zn   zn  2  0
de modo que suas raízes são reais.

Por outro lado, lim    e 0  x 2  0 de sorte que ambas as raízes são

positivas.

É fácil checar que as raízes são:

2
   x  z   z z 2  4nx
2n 2n

Deste modo, o intervalo de confiança é:

IC aprox
     ,    22

__________________________
Hugo Boff - Estatística II 2021
18
2 2
IC aprox
   x  z   z z 2  4nx , x  z   z z 2  4nx  22  
2n 2n 2n 2n

Exemplo 7:
O número de veículos que diariamente ficam na estrada em um trecho de uma
rodovia movimentada é uma v.a. Poisson com média  desconhecida. Nos últimos
30 dias, o número médio de veículos que apresentaram problemas mecânicos durante o
percurso foi de 4 veículos/dia. Vamos usa o TCL para construir um Intervalo de
Confiança 95% para a média populacional. Usando estes valores na função quadrática
 obtemos:

1.96 2
   2  8  30
  4 2

As raízes são:    3. 345 5 e    4. 782 6

quadrática 15

10

0
1 2 3 4 5 6 7
lambda

O intervalo de confiança 95%, de acôrdo com 22 será:

IC aprox
.95   3, 5

Ou seja, a amostra indica, que o número médio de sinistros é de 1 ocorrência


abaixo, 1 ocorrência acima da média amostral calculada.

Método Delta

Existe um método para obter a distribuição assintótica Normal de funções contínuas


e deriváveis de variáveis aleatórias assintóticamente normais, a qual determina
explícitamente seus momentos assintóticos (Lehmann,1999).

__________________________
Hugo Boff - Estatística II 2021
19
Este método é chamado "método delta" , em razão do resíduo utilizado para a
aproximação linear da função considerada. O teorema seguinte resume um dos seus
resultados principais:

Teorema:

d
Sendo X n  uma sequência infinita de v.a.’s tal que n X n    N0,  2 . Se g é
n
uma função contínua, diferenciável em  com g    0, então:

d
n gX n   g  N0,  2 g   2  23
n

Grosseiramente falando, se X n é assintóticamente normal com média  e variância


 /n, então gX n  será assintóticamente normal com média g e variância  2 g   2 /n.
2

Ou seja:

V as gX n   V as X n g   2

onde V as designa a variância assintótica.

Aplicação:

Considere novamente o processo de X  Poisson. A probabilidade que não haja


nenhuma ocorrência no intervalo de tempo unitário é: PX  0  e  . Vamos então usar
o método delta para aproximar um intervalo assintótico para esta probabilidade.

Coloque gX n   e X n . Observe que g é contínua e diferenciável, com derivada que


nunca se anula.

d
Por outro lado, de 21 sabemos que n X n    N0, . Então, pelo método
n
X n  d 2
delta obtemos: n e  e   N0, e , visto que e X n    2 X  e 2 .
n

Dado o grau de confiança  e o quantil z /2 correspondente, substituindo o


estimador de  pela sua estimativa, o intervalo assintótico para e  sai da desigualdade:

e x  e   z /2
e 2 /n

Um intervalo aproximado é obtido avaliando-se o desvio-padrão assintótico de e X

na estimativa amostral de , que é a média amostral x: |e x  e  |  z /2 e x x/n .

__________________________
Hugo Boff - Estatística II 2021
20
Deste modo, o intervalo assintótico aproximado para e  , a probabilidade que não
haja sinistros no intervalo de tempo considerado, tem extremidades:

e x   x/n e x z /2

Utilizando os valores do Exemplo 7 achamos o


intervalo: e 4   4/30 e 4 1. 96  0. 01831  0. 01341 ou seja, o intervalo assintótico,
com 95% de confiança, é:


IC as
.95 e   0. 0052 , 0. 0321

Lembre que x  4 é a estimativa MV (Máxima Verossimilhança) do número médio de


sinistros. Logo e x  e 4  0. 0183 1, 83% é a estimativa MV da probabilidade que não
haja sinistros em um dia qualquer.

O intervalo acima indica que esta probabilidade se situa entre 0, 52% e 3, 21% com a
confiança 95%.

C) Aplicações: Aproximação Normal do IC para a proporção

Seja X 1 , X 2 , . . . , X n , uma amostra de X  Bernp, com EX  p e VX  p1  p.

Por outro lado, sabemos que o número de sucessos nas n provas,


S n  X 1  X 2 . . .  X n tem distribuição Binomial, com média np e variância np1  p.

O estimador MVU de p é: X n  1n S n , o qual tem valor esperado p e variância


p1  p
n .

Então, pelo TCL temos:

Xn  p d
n   N0, 1 24
p1  p n

Dado o nível de confiança  e o percentil correspondente z /2 da normal-padrão, e



substituindo o estimador amostral da proporção pela estimativa amostral p, teremos
então:

|p  p|
 z /2 
p1  p/n

__________________________
Hugo Boff - Estatística II 2021
21

|p  p|  z /2 p1  p/n 25

Ou seja, os desvios absolutos entre as proporções populacional e amostral


dependem diretamente do desvio-padrão da proporção amostral e do percentil de
confiança.

A maneira como a desigualdade 25 é resolvida conduz a diferentes soluções para


o Intervalo de Confiança da proporção.

Veremos na sequência 3 tratamentos distintos dados à desigualdade acima, os


quais conduzem a três Intervalos de Confiança: o Correto, o Estimado e o Conservador.

Os dois últimos são intervalos convencionais, que figuram em todos os livros-texto


de Estatística.

1. IC Correto

Elevando-se ao quadrado de ambos os lados de 25 :


  p  p 2  1 2
n p1  pz 
2  1 1
p  p 2  2 pp  n z2p  n z2p2  0 

 
1  1
n z 2 p 2  2 p  1
n z 2 p  p 2  0 26

Vamos agora buscar as raízes da quadrática:

 
p  1  1
n z 2 p 2  2 p  1
n z 2 p  p 2 26  

  
O discriminante é   2 p  1
n z2 2  4p 2  4
n z 2 p   1n z 2  2 o qual é positivo, de modo
que as raízes são reais.

As raízes são escritas abaixo em duas formas equivalentes:

   
2 p  1n z 2    2 p  1
n z 2   2 p  1
n z2 2  4p 2
p    ou:
21  1n z 2  21  1
n z2

 1 2
2 p  n z 

2p
p   1 2
1  1   2p 1 z 2  2  27
21  n z  n

__________________________
Hugo Boff - Estatística II 2021
22
A expressão 27 evidencia que as raízes são ambas positivas. Também, ambas as
raizes são menores ou iguais à 1.


Para ver isso, observe à partir de 26   que 0  p 2  0 e que
 2 
1  1  p  0. Ou seja, teremos uma raiz nula se p  0 e uma raiz unitária se

p  1.

Pela desigualdade 26 o intervalo é uma região na qual a quadrática é negativa.


Deste modo, p intercepta o eixo da abcissa no intervalo 0, 1.

Assim, o intervalo de confiança Correto para a proporção p será:

 
IC cor
 p  p  , p   28


Para ilustrar a construção do intervalo tomamos   0. 95; n  30; p  0. 8.

A quadrática

1 1
p  1  30
1. 96 2 p 2  1. 6  30
1. 96 2 p  0. 64  1. 128 1p 2  1. 728 p  0. 64

é representada abaixo:

0.10
quadrática
0.08

0.06

0.04

0.02

0.00
0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
p
-0.02


p : n  30, p  0. 8 ;   0. 95

As raízes são: p   0. 627 e p   0. 904, de modo que o intervalo é:

IC cor
.95 p  0. 627 , 0. 904

__________________________
Hugo Boff - Estatística II 2021
23
Amplitude: 0. 904  0. 627  0. 277

Mantendo-se os valores   0. 95 e n  30 mas aumentando-se o valor de proporção



amostral para p  0. 9 obtemos a quadrática:

1 1
p  1  30
1. 96 2 p 2  1. 8  30
1. 96 2 p  0. 81  1. 128 1p 2  1. 928 1p  0. 81

representada abaixo:

quadrática 0.12

0.10

0.08

0.06

0.04

0.02

0.00
0.6 0.7 0.8 0.9 1.0 1.1 1.2
p

p : n  30, p  0. 9 ;   0. 95

com as raízes: p   0. 743 e p   0. 965. O intervalo correto fica:

IC cor
.95 p  0. 743 , 0. 965

A amplitude do intervalo é 0. 965  0. 743  0. 222.

2. IC Estimado

A construção de um IC estimado utiliza a estimativa amostral do desvio-padrão da


 
proporção amostral, ou seja: p1  p/n .

Assim, a desigualdade 26 fica:

  
|p  p|   p1  p/n z /2

__________________________
Hugo Boff - Estatística II 2021
24
Deste modo, o IC estimado será:

     
IC est
 p   p   p1  p/n z /2 , p   p1  p/n z /2  29

Como ilustração numérica, usando os mesmos valores anteriores



  0. 95; n  30; p  0. 8 o Intervalo Estimado fica:

IC est
 p  0. 8   0. 80. 2/30 1. 96 , 0. 8   0. 80. 2/30 1. 96

IC est
 p  0. 657 , 0. 943

Amplitude: 0. 943  0. 657  0. 286

Observe que a amplitude do IC estimado é maior que a do IC correto.

3. IC Conservador

A construção do Intervalo Conservador usa o fato de que, para 0  p  1, o


termo p1  p alcança seu valor máximo  1/4 quando p  1/2.

Deste modo, para o desvio-padrão da proporção amostral teremos um limite


superior: p1  p/n  1/ 4n .

Assim, o Intervalo Conservador usa, para os desvios absolutos entre proporções


populacional e amostral, dada em 25, o maior valor possível para o desvio-padrão:

 1 z
|p  p|  /2 30
4n

Dado o desconhecimento sobre o verdadeiro valor de p, a idéia é a de adotar a


estratégia mais conservadora, tomando o intervalo de maior amplitude possível.

O Intervalo Conservador fica:

 1 z , 1 z 
IC cons
 p   p  /2 p /2 29  
4n 4n


Ilustrando numéricamente para   0. 95; n  30; p  0. 8 obtemos:

__________________________
Hugo Boff - Estatística II 2021
25
IC cons 1 1. 96 , 0. 8  1 1. 96
.95 p  0. 8 
120 120

 0. 621 , 0. 979

Amplitude: 0. 979  0. 621  0. 358

Como vemos, a amplitude do intervalo Conservador é bem maior que aquela do


intervalo Estimado.

Tamanho da Amostra

Quid para o tamanho amostral n ?

Nas pesquisas empíricas envolvendo a proporção p, particularmente em sondagens


de opinião, a expressão 30 é utilizada para se determinar o tamanho da amostra
compatível com diferentes níveis de acurácia na estimativa desta proporção.

Resolvendo-se 30 em n, com igualdade, obtemos:

z /2
n  2 31
2 p  p


Lembremos que |p  p| é o erro amostral absoluto da proporção, de modo que a

igualdade |p  p|  0. 02 significa que, na estimativa de p, toleramos uma margem de
erro de 2%, para mais ou para menos.

A tabela abaixo fornece os diferentes valores de n compatíveis com as margens de


erro de 5%, 2% e 1% na estimativa de p, de acôrdo com os graus de confiança
desejados 90%, 95% e 99%, segundo a fórmula 31 :

Graus de Confiança
n 90% 95% 99%
5% 272 384 665
Erro Amostral
2% 1701 2401 4160
1% 6806 9604 16641

Observa-se na tabela que o tamanho amostral requerido cresce com a redução do


erro amostral da proporção e do grau de confiança desejados.


__________________________
Hugo Boff - Estatística II 2021

Você também pode gostar