Você está na página 1de 27

Estatı́stica Econômica II

Propriedades dos estimadores

Douglas Mateus da Silva

2021/01

Douglas Mateus (UFMG) 2021/01 1 / 27


Estimação

A Inferência Estatı́stica tem por objetivo fazer generalizações sobre


uma população, com base nos dados de uma amostra.
Dois problemas básicos nesse processo são:
estimação de parâmetros,
teste de hipóteses sobre parâmetros.
Vale lembrar: Parâmetro é uma medida usada para descrever uma
caracterı́stica da população.
Vamos estudar sobre estimação de parâmetros.

Douglas Mateus (UFMG) 2021/01 2 / 27


Estimação

Exemplo: Uma amostra de 500 pessoas de uma cidade é escolhida e a


cada pessoa da amostra é feita uma pergunta a respeito de um
problema municipal, para o qual foi apresentada uma solução pela
prefeitura. A resposta à pergunta poderá ser “sim” (favorável à
solução) e “não” (contrária à solução). Deseja-se estimar a proporção
de pessoas na cidade favoráveis à solução apresentada.

Douglas Mateus (UFMG) 2021/01 3 / 27


Estimação

Se 300 pessoas respondem “sim”, então uma estimativa natural da


proporção de pessoas favoráveis à solução da prefeitura seria 300/500
= 0,60.
Nossa resposta é baseada nessa amostra particular e que essa amostra
represente a população de interesse.
Outra amostra poderia levar a outra estimativa.
Dessa forma, conhecer as propriedades dos estimadores é um dos
propósitos mais importantes em Inferência Estatı́stica.

Douglas Mateus (UFMG) 2021/01 4 / 27


Estimação

Definamos as variáveis aleatórias X1 , ..., Xn , tais que:


Xi = 1 se a i-ésima pessoa na amostra responder “sim”.
Xi = 0 se a i-ésima pessoa na amostra responder “não”.
e seja p = P(Sucesso), em que o sucesso é a pessoa responder “sim”.
Pn
Xi
Um possı́vel estimador de p é dado por p̂ = i=1
n .
Para uma amostra suficientemente grande, vimos que a distribuição
amostral de p̂ é aproximadamente normal com

E [p̂] = p, Var [p̂] = p(1 − p)/n.

Esses resultados nos ajudam a avaliar as qualidades desse estimador.

Douglas Mateus (UFMG) 2021/01 5 / 27


Estimação

Por exemplo, o valor esperado de p̂ ser igual a p significa que, em


média, o estimador p̂ acerta p.
Nesse caso, dizemos que o estimador é não viesado (ou não viciado).
A variância de p̂ indica que, para amostras grandes, a diferença entre
p̂ e p tende ser pequena, pois a variância tende para zero.
Nesse caso, dizemos que p̂ é um estimador consistente de p.
Observe que essas propriedades são validas para o estimador no
conjunto de todas as amostras que poderiam ser extraı́das da
população.
Para uma particular amostra, p̂ pode estar distante de p.

Douglas Mateus (UFMG) 2021/01 6 / 27


Estimação

Em algumas situações, podemos ter mais de um estimador para um


mesmo parâmetro e desejamos saber qual deles é “melhor”.
O julgamento pode ser feito analisando as propriedades desses
estimadores.
Exemplo: Desejamos comprar um rifle e, após algumas seleções,
restaram quatro alternativas, que chamaremos de rifles A, B, C e D.
Foi feito um teste com cada rifle, que constituiu em fixá-lo num
cavalete, mirar o centro de um alvo e disparar 15 tiros.

Douglas Mateus (UFMG) 2021/01 7 / 27


Estimação

Douglas Mateus (UFMG) 2021/01 8 / 27


Estimação

Podemos fixar critérios para analisar qual a melhor arma.


Segundo o critério “em média acertar o alvo”, escolherı́amos as armas
A e C.
Segundo o critério “não ser muito dispersivo”, a escolha recairia nas
armas C e D.
A arma C reúne as duas propriedades e seria a melhor arma.
Se outro critério fosse avaliado, outra arma poderia ser escolhida.
Logo, a melhor arma depende dos critérios analisados.
Veremos que o equivalente ocorre na escolha dos melhores
estimadores.

Douglas Mateus (UFMG) 2021/01 9 / 27


Estimação

No exemplo, podemos introduzir os conceitos de acurácia e de


precisão.
A acurácia mede a proximidade de cada observação do valor alvo que
se procura atingir.
A precisão mede a proximidade de cada observação da média de
todas as observações.
Desse modo, classificamos as armas como
Arma A: não viesada, pouco acurada e baixa precisão.
Arma B: viesada, pouco acurada e baixa precisão.
Arma C: não viesada, muito acurada e boa precisão.
Arma D: viesada, pouco acurada e alta precisão.

Douglas Mateus (UFMG) 2021/01 10 / 27


Propriedades dos estimadores

Propriedades dos estimadores

Ficou clara a importância de se definir propriedades desejáveis para


estimadores.
Vamos formalizar alguns conceitos.
Considere uma amostra (X1 , X2 , ..., Xn ) de uma variável aleatória que
descreve uma caracterı́stica de interesse da população.
Seja θ uma parâmetro que desejamos estimar, como por exemplo a
média µ = E [X ] ou a variância σ 2 = Var [X ].

Douglas Mateus (UFMG) 2021/01 11 / 27


Propriedades dos estimadores

Definição: um estimador T do parâmetro θ é qualquer função da


amostra, ou seja, T = g (X1 , X2 , ..., Xn ).

Um estimador é uma estatı́stica que está associada a um parâmetro.


O problema da estimação é determinar uma função
T = g (X1 , X2 , ..., Xn ) que seja próxima de θ sob algum critério.
O primeiro critério que iremos abordar é o vı́cio de um estimador.

Douglas Mateus (UFMG) 2021/01 12 / 27


Propriedades dos estimadores

Definição: O estimador T é não viciado para θ se E [T ] = θ para todo θ.


Caso contrário, o estimador é viciado para θ.

A diferença V [T ] = E [T ] − θ é chamado de viés do estimador.


O valor esperado de T é calculado sobre a distribuição amostral do
estimador, por isso a importância de se conhecer o comportamento do
estimador.
Definição: Estimativa é o valor assumido pelo estimador em uma
particular amostra.

No exemplo de pessoas favoráveis à solução apresentada pela


prefeitura, p̂ é um estimador de p, enquanto que 60% é a estimativa
de p.

Douglas Mateus (UFMG) 2021/01 13 / 27


Propriedades dos estimadores

Exemplo: a média amostral X̄ é um estimador não viciado para a


média populacional µ. A proporção amostral p̂ é um estimador não
viciado para a proporção populacional p.
Exemplo: Considere uma população com N elementos e a variância
populacional dada por
N
2 1 X
σ = (Xi − µ)2 .
N
i=1

Um possı́vel estimador para σ 2 , baseado em uma amostra aleatória de


tamanho n extraı́da dessa população, é
n
2 1X
σ̂ = (Xi − X̄ )2 .
n
i=1

Douglas Mateus (UFMG) 2021/01 14 / 27


Propriedades dos estimadores

Vamos mostrar que esse estimador é viciado.

Douglas Mateus (UFMG) 2021/01 15 / 27


Propriedades dos estimadores

Douglas Mateus (UFMG) 2021/01 16 / 27


Propriedades dos estimadores

Como o viés de σ̂ 2 é negativo, o estimador em geral subestima o


verdadeiro valor do parâmetro σ 2 .
Por outro lado, o viés diminui com o aumento do tamanho da
amostra, ou seja, o viés de σ̂ 2 tende a zero quando n → ∞.
Para obter um estimador não viciado para σ 2 , basta considerar
(n/n − 1)σ̂ 2 , pois  
n
E σ̂ = σ 2 .
n−1
Logo, se definirmos
n
1 X
S2 = (Xi − X̄ )2 ,
n−1
i=1

então S 2 é um estimador não viciado para σ 2 .

Douglas Mateus (UFMG) 2021/01 17 / 27


Propriedades dos estimadores

Vimos que o estimador p̂ é não viciado e tem variância que tende a


zero quando n → ∞. Dizemos que p̂ é consistente.

Definição: Uma sequência {Tn } de estimadores de um parâmetro θ é


consistente se, para todo  > 0, P{|Tn − θ| > } → 0, n → ∞.

Proposição: Uma sequência {Tn } de estimadores de θ é consistente se


1. lim E [Tn ] = θ,
n→∞

2. lim Var [Tn ] = 0.


n→∞

Exemplo: Considere o experimento de jogar n dados, de forma


independente, e calcular a média dos n valores obtidos.

Douglas Mateus (UFMG) 2021/01 18 / 27


Propriedades dos estimadores
Distribuição da média amostral.
Um dado Dois dados Três dados

0.12
0.16
0.22
Probabilidade

Probabilidade

Probabilidade
0.12

0.08
0.18

0.08
0.14

0.04
0.04
0.10

0.00
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

X X X

Quatro dados Cinco dados Dez dados

0.06
0.08
0.08
Probabilidade

Probabilidade

Probabilidade

0.04
0.04
0.04

0.02
0.00
0.00
0.00

1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

X X X

Douglas Mateus (UFMG) 2021/01 19 / 27


Propriedades dos estimadores

Vimos que o estimador S 2 é não viciado para σ 2 . Logo, a primeira


condição da Proposição é satisfeita.
Se consideramos que as observações X1 , X2 , ...Xn tem distribuição
Normal(µ,σ 2 ), então
2σ 4
Var [S 2 ] = .
n−1
Como Var [S 2 ] tende a zero quando n → ∞, a segunda condição da
Proposição é satisfeita e S 2 é um estimador consistente.

Douglas Mateus (UFMG) 2021/01 20 / 27


Propriedades dos estimadores

Vimos que o estimador σ̂ 2 é viciado para σ 2 .


Porém, lim E [σ̂ 2 ] = σ 2 . Logo, a primeira condição da Proposição é
n→∞
satisfeita.
Se consideramos que as observações X1 , X2 , ...Xn tem distribuição
Normal(µ,σ 2 ), então

n−1
Var [σ̂ 2 ] = (2σ 4 ).
n2
Como Var [σ̂ 2 ] tende a zero quando n → ∞, a segunda condição da
Proposição é satisfeita e σ̂ 2 é um estimador consistente.

Douglas Mateus (UFMG) 2021/01 21 / 27


Propriedades dos estimadores

Obtemos dois estimadores consistentes para σ 2 : S 2 e σ̂ 2 . Qual deles


escolher?
Observe que Var [σ̂ 2 ] < Var [S 2 ].
Se usamos apenas como critério o estimador “ter menor variância” na
comparação dos estimadores, σ̂ 2 seria um melhor estimador para σ 2
comparado a S 2 .
Porém, σ̂ 2 é um estimador viciado ao passo que S 2 não o é. Como
considerar essa informação na escolha dos estimadores?

Douglas Mateus (UFMG) 2021/01 22 / 27


Propriedades dos estimadores

Definição: Chamamos de Erro Quadrático Médio (EQM) do estimador T


o valor
EQM[T ] = E [(T − θ)2 ].

Douglas Mateus (UFMG) 2021/01 23 / 27


Propriedades dos estimadores

Logo, podemos escrever

EQM[T ] = Var [T ] + V 2 [T ].

Se um estimador é não viciado, então o vı́cio V [T ] = 0 e


EQM[T ] = Var [T ].
Quando estamos comparando dois estimadores não viciados para um
mesmo parâmetro, o estimador com menor variância é dito ser mais
eficiente.
Quando o estimador possui viés, o EQM deve ser levado em conta,
pois o estimador pode possuir pequena variância mas um grande viés,
resultando em um valor alto de EQM.

Douglas Mateus (UFMG) 2021/01 24 / 27


Estimação

Douglas Mateus (UFMG) 2021/01 25 / 27


Propriedades dos estimadores

O estimador S 2 é não viciado para σ 2 , logo

2σ 4
EQM[S 2 ] = Var [S 2 ] = .
n−1

O estimador σ̂ 2 é viciado para σ 2 . Logo,

EQM[σ̂ 2 ] = Var [σ̂ 2 ] + V 2 [σ̂ 2 ]


 2 2
n−1 4 σ
= 2
(2σ ) + −
n n
2n − 1 4
= σ .
n2

Douglas Mateus (UFMG) 2021/01 26 / 27


Estimação

EQM ^2
Vício de σ
2.0

0.1
S2
^2
σ
1.5

−0.1
1.0

−0.3
0.5

−0.5
0.0

10 20 30 40 50 10 20 30 40 50

Tamanho da amostra: n Tamanho da amostra: n

Douglas Mateus (UFMG) 2021/01 27 / 27

Você também pode gostar