Você está na página 1de 9

Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

Estimação Pontual e Intervalar


1. – Estimação Pontual
Uma parte da inferência estatística trata da estimação de parâmetros
desconhecidos, i.e., atribuição de valores “razoáveis” a esses parâmetros
desconhecidos de uma população. Iremos apresentar duas abordagens
possíveis: a estimação pontual e a estimação intervalar.

O objetivo da estimação pontual é usar toda a informação disponível na


amostra, por forma a selecionar um único número que seja o mais plausível
para o parâmetro a estimar.

Seja X é uma variável aleatória com função densidade ou probabilidade f(x),


caracterizada por um parâmetro  , e ( X1,X2 ,...,X n ) uma amostra aleatória

de dimensão n. Um estimador pontual de  , simbolizado por ̂ , é qualquer


estatística T ( X1,X2 ,...,Xn ) que tome valores apenas em  (conjunto de

valores que os parâmetros podem tomar  ).

Depois de observada uma amostra particular ( x1,x 2 ,...,x n ) , obtém-se uma

estimativa pontual para  , seja T ( x1, x 2 ,..., x n ) .

Existem métodos específicos que permitem escolher o estimador para cada


parâmetro populacional que tenhamos de estimar, como sejam o método de
máxima verosimilhança, o método dos momentos, etc..

Pelo facto de existirem vários estimadores para o mesmo parâmetro de uma


população, vamos considerar algumas propriedades que os estimadores

SGC 1
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

idealmente devem possuir, e que servem de orientação de como escolher


o “melhor”.

1.1 – Propriedades dos Estimadores


Estimador Centrado (não enviesado): Um estimador ̂ diz-se centrado,

ou não enviesado, para o parâmetro θ se E  ˆ  =  .

O estimador ̂ diz-se um estimador não centrado ou enviesado para o

parâmetro θ, se existir um valor de θ, tal que: E  ˆ    .

O enviesamento do estimador ̂ é medido por: Env ˆ  = E ˆ  − .

Iremos debruçar o nosso estudo na classe dos estimadores centrados. No caso


de existirem vários estimadores centrados, como escolher o melhor?

Estimador Eficiente (eficiência relativa de estimadores centrados):


Sejam ̂ e  , dois estimadores centrados para θ. O estimador ̂ é mais
eficiente do que  se:

Var ˆ 
Var ˆ   Var  →  1.
Var 

Estimador Consistente (ou simplesmente consistente): As condições


suficientes para que um estimador pontual seja consistente são dadas por:

i) lim E ˆ n  =  e ii) lim Var ˆ n  = 0.


n → n →

SGC 2
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

2. – Estimação Intervalar – Intervalos de Confiança

Devido à variabilidade amostral, raramente a estimativa que obtemos para


o parâmetro que queremos estimar, coincide com ele próprio, i.e., a cada
estimador estão associadas tantas estimativas diferentes quantas as amostras
utilizadas para a sua determinação. Assim, talvez tivesse interesse obtermos
um intervalo de valores possíveis para o parâmetro a estimar, em vez de um
único ponto.

Selecionada uma amostra aleatória da população, a estimação intervalar


permite obter um intervalo que, com um certo grau de certeza, contenha o
verdadeiro parâmetro (estimativa intervalar para θ).

Metodologia de construção de um intervalo de confiança:

− Encontrar um “bom” estimador pontual;


− Estabelecer um nível de confiança (mais vulgares 90%, 95% e 99%);
− Conhecer a dimensão da amostra;
− Conhecer a distribuição por amostragem do estimador (Tema 1.).

Na escolha do estimador deve atender-se ao Método da Variável Fulcral.

De acordo com este método, a estatística de teste:

− Deve conter o parâmetro a estimar na sua expressão;


− A sua distribuição por amostragem (exata ou aproximada) não depende
do parâmetro, nem de outro fator desconhecido.

SGC 3
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

2.1 – Intervalo de Confiança para a média da população, 

1ª Caso: População Normal com variância conhecida


Selecionada uma amostra aleatória ( X1,X2 ,...,Xn ) de uma população

Normal, N ( ,  ) , com 2 conhecido, pretende-se construir um intervalo de

confiança a (1 −  )  100% para  :

A média amostral, X , é um bom estimador para a média da população,  ,


porque é eficiente, centrado, e a sua distribuição é, em geral, conhecida.

X−
− Escolha da variável fulcral e sua distribuição: Z = ~ N ( 0,1) .

n

− Para um nível de confiança a (1 −  ) 100% , escolha dos quantis de

probabilidade z 2 = −z 2 (simetria da Normal).

f(z)=φ(z)

1− 

−z  2 μ=0 z 2

 
 X− 
Tem-se: P ( −z  2  Z  z  2 ) = 1 −   P  −z  2   z 2  = 1 −  ,
  
 n 

SGC 4
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

Resolvendo as desigualdades em ordem a  :

   
P  −z  2  X− z 2  = 1 −  
 n n 

   
 P  −X − z  2  −  −X + z 2  = 1 − 
 n n 

   
 P  X − z 2    X + z 2  = 1 − .
 n n

Obtém-se o intervalo de confiança a (1 −  )  100% para μ:

σ σ
IC(1−α)×100%(μ) = (x̅ − zα⁄2 , x̅ + zα⁄2 )
√n √n

O intervalo é simétrico, pelo que o ponto médio coincide com o estimador



pontual, X , e  x = representa o erro/desvio padrão do estimador.
n

O erro de estimativa corresponde ao erro máximo cometido que não deve



ultrapassar um valor ε desejado: X −    → X −   z 2 .
n

Notas:
1. A amplitude do IC varia diretamente com o nível de confiança. Se o nível
de confiança aumenta, a amplitude do IC também aumenta, e a inferência
realizada torna-se menos precisa. O inverso também é verdadeiro.

SGC 5
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

2. Quanto maior a variância, maior a amplitude do intervalo, uma vez que


aumenta o erro padrão do estimador.
3. Quanto maior a dimensão da amostra, menor a amplitude do intervalo,
aumentando a precisão da inferência.

2ª Caso: População Normal com variância desconhecida


População: X ~ N ( ,  ) , com  2 desconhecida.

X−
Variável fulcral e sua distribuição: T = ~ t ( n −1) .
S'
n

Intervalo de confiança a (1 −  )  100% para μ:

 s' s' 
IC(1−)100% (  ) =  x − t  2 ; x + t 2 .
 n n 

Obs. Tratando-se duma grande amostra (n > 30), pelo TLC tem-se:

Variável fulcral e sua distribuição por amostragem aproximada:

X− a
Z= ~ N ( 0,1) .
S'
n
Intervalo de confiança aproximado a (1 −  )  100% para μ:

 s' s' 
IC(1−)100% (  )   x − z 2 ; x + z 2 .
 n n 

SGC 6
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

3º Caso:
População desconhecida (populações não normais) e n > 30
Variável fulcral e sua distribuição por amostragem aproximada:

X− a
Z= ~ N ( 0,1) .

n

Tratando-se duma grande amostra, pelo TLC, obtém-se a distribuição por


amostragem aproximada.

Intervalo de confiança aproximado a (1 −  )  100% para μ:

   
IC(1−)100% (  )   x − z 2 ; x + z 2 .
 n n 

Obs. No caso da variância populacional ser desconhecida, e tratando-se


duma grande amostra (n > 30), pelo TLC tem-se:

Variável fulcral e sua distribuição por amostragem aproximada:

X− a
Z= ~ N ( 0,1) .
S'
n
Intervalo de confiança aproximado a (1 −  )  100% para μ:

 s' s' 
IC(1−)100% (  )   x − z 2 ; x + z 2 .
 n n

SGC 7
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

2.2 – Intervalo de Confiança para a variância da população 2

População: X ~ N ( ,  ) , com  desconhecido.

Descrição da estimativa:
Intervalo de confiança a (1 −  )  100% para o parâmetro 2 , variância

populacional, a partir de uma amostra de dimensão n.

Variável fulcral e sua distribuição: Q =


( n − 1) S'2 2
~ ( n −1) .
2

Intervalo de confiança a (1 −  )  100% para 2 :

 ( n − 1) s'2 ( n − 1) s'2 
IC(1− )100% (  )  
2
;  .
 q q
 sup inf 


Definem-se os quantis qinf e qsup , através de P ( Q  qinf ) = P ( Q  q sup ) = .
2

2.3 – Intervalo de Confiança para a proporção da população, p


(grandes amostras)

População: X ~ Bernoulli (1,p ).

Descrição da estimativa:
Intervalo de confiança a (1 −  )  100% para a proporção de sucessos na

população, p, a partir de uma amostra aleatória ( X1,X2 ,...,X n ) .

SGC 8
Estatística II Ano Letivo 2019/2020

Estimação Pontual e Intervalar

Variável fulcral e sua distribuição:

p̂ − p a Y
Z= ~ N ( 0,1) onde p̂ = X = é a proporção de sucessos na amostra.
pq n
n

A variância de p̂ não é conhecida, pois depende do parâmetro p. Com base


ˆˆ
pq
na amostra, estima-se a variância da população .
n

p̂ − p a
A estatística (variável fulcral) a utilizar será: Z = ~ N ( 0,1) .
ˆˆ
pq
n

Para um nível de confiança a (1 −  )  100% , escolha de z 2 = −z 2 :

 
 p̂ − p 
P ( −z  2  Z  z  2 ) = 1 −   P −z  2 
  z 2  = 1 −  ,
 ˆ
pqˆ 
 
 n 

Resolvendo as desigualdades em ordem a “p”:

 ˆˆ
pq ˆˆ 
pq
P  pˆ − z  2  p  pˆ + z  2  =1−  ,
 n n 

obtém-se o intervalo de confiança aproximado a (1 −  )  100% , para p:

 ˆˆ
pq ˆˆ 
pq
IC(1− )100% ( p )   pˆ − z  2 ; pˆ + z  2 .
 n n 

SGC 9

Você também pode gostar