Você está na página 1de 35

TEOREMA DE GAUSS

MARKOV
Profa. Samira Schatzmann
Uso de
informações

Inferência amostrais para


fazer

estatística afirmações
sobre as
características
populacionais.
Desconhecemos os parâmetros
populacionais

Mas podemos obter estimativas


Estimação a partir de amostras

Mas quão bons são nossos


estimadores?
Propriedades dos
estimadores
■ Viés – em média acertar o alvo
■ Acurácia – proximidade do alvo
■ Precisão – proximidade da media das observações
Propriedades dos
estimadores

A. Não viesada, pouco


acurada, baixa precisão
B. Viesada, pouco acurada,
baixa precisão
C. Não viesada, muito
acurada, boa precisão
D. Viesada, pouco acurada,
alta precisão
1) O estimador do parâmetro é qualquer função das observações da amostra, ou
seja 1 2 n

2) O estimador é não viesado para se

Se , diz-se viesado e a diferença é chamado o viés de

3) Estimativa é o valor assumido pelo estimador em uma particular amostra.

Propriedades dos estimadores - definições


4) Uma sequência {Tn} de estimadores de θ é consistente se
lim 𝐸 𝑇 = 𝜃

lim 𝑉𝑎𝑟 𝑇 =0

Note que se Tn for não viesado, a primeira condição estará satisfeita.


Também conhecida como propriedades assintóticas, ou seja, para grandes amostras.

5) Se T e T’ são dois estimadores não viesados de um mesmo parâmetro θ, e ainda


𝑉𝑎𝑟 𝑇 < 𝑉𝑎𝑟 (𝑇 ),
Então T diz-se mais eficiente que T’

Propriedades dos estimadores - definições


6) Chamaremos de

O erro amostral que cometemos ao estimar o parâmetro


1 2 n

Chama-se erro quadrático médio (EQM) do estimador T ao valor

Propriedades dos estimadores - definições


Continuação...

𝐸𝑄𝑀 𝑇; 𝜃 = 𝐸 𝑒 = 𝐸(𝑇 − 𝜃)²


=𝐸 𝐸−𝐸 𝑇 +𝐸 𝑇 −𝜃 ²
= 𝐸{ 𝑇 − 𝐸 𝑇 +2 𝑇−𝐸 𝑇 𝐸 𝑇 −𝜃 + 𝐸 𝑇 − 𝜃 }²
=𝐸 𝑇−𝐸 𝑇 + 2𝐸 𝑇 − 𝐸 𝑇 𝐸 𝑇 −𝜃 + 𝐸 𝐸 𝑇 − 𝜃 }²
=𝐸 𝑇−𝐸 𝑇 + 𝐸(𝐸 𝑇 − 𝜃)²
Já que E 𝑇 − 𝐸 𝑇 =0
Podemos, pois, escrever,
𝐸𝑄𝑀 𝑇; 𝜃 = 𝑉𝑎𝑟 𝑇 + 𝑉(𝑇)²
Onde 𝑉(𝑇) é o viés de T
Inferência

■ O estabelecimento de uma ponte entre os valores observados na


amostra e os modelos postulados para a população objeto da
inferência estatística, exige a adoção de princípios teóricos muito
bem especificados.
■ Nós temos usado a chamada teoria frequentista, também
chamada de clássica.
■ A crítica que se faz à teoria frequentista é a possibilidade de
“replicar dados”, bem como o recurso à teoria assintótica.
■ Uma teoria que não faz uso de tais argumentos é a inferência
bayesiana.
Estimadores de momentos –
média e variância, os dois
primeiros momentos amostrais

Estimadores de Mínimos
Estimadores Quadrados

Estimadores de Máxima
Verossimilhança
Estimadores ■ Um dos procedimentos mais usados para obter
estimadores é aquele que se baseia no princípio

de Mínimos dos mínimos quadrados, introduzido por Gauss em


1794, mas que primeiro apareceu com esse nome
no apêndice do tratado de Legendre, Nouvelles
Quadrados Méthodes pour la Determination des Orbites des
Comètes, publicado em Paris em 1806. Gauss
comente viria a publicar seus resultados em 1809,
em Hamburgo. Ambos utilizaram o princípio em
conexão com problemas de Astronomia e Física.
■ Utilizados quando não esperamos uma relação
perfeita entre duas (ou mais) variáveis, já que X,
por exemplo, não é a única responsável por Y;
outros fatores não controlados afetam o resultado.
MODELO DE
REGRESSÃO
LINEAR
Usado para estudar a
relação entre variáveis
■ A desvantagem de usar a RLS em trabalhos
empíricos é o fato de ser muito difícil obter
conclusões ceteris paribus como X afeta o Y

Modelo de ■ RLM permite controlar explicitamente muitos


outros fatores que, de maneira simultânea,

Regressão
afetam a variável dependente.
■ Importante para testar teorias econômicas e
avaliar efeitos da política
Linear ■ Como os modelos de RLM acomodarem
muitas variáveis explicativas que podem

Múltipla estar correlacionadas, esperamos inferir


causalidade nos casos em que a análise da
regressão simples seria enganosa – ou seja,
os parâmetros a serem estimados estariam
incorretos.
Modelo de ■ Naturalmente, se adicionarmos ao nosso
modelo mais fatores que são úteis para

Regressão
explicar Y, então mais da variação de Y pode
ser explicadas. Permite, portanto, a
construção de modelos melhores.

Linear ■ O método de Mínimos Quadrados Ordinários


(Ordinary Least Squares – OLS) é o

Múltipla
popularmente mais usado para estimar os
parâmetros do modelo de RLM
Modelo de Regressão Linear Múltipla

𝑌 = 𝛽 +𝛽 𝑋 + 𝛽 𝑋 + ⋯ + 𝛽 𝑋 + 𝑢

Genericamente, como nos referimos a isso?


“rodamos uma regressão de MQO de Y sobre X1, X2..., Xk”
“regredimos Y sobre X1, X2..., Xk”

Assim como na regressão simples, temos que fazer hipóteses sobre 𝑢 – termo de erro ou
perturbação. Contém outros fatores, além de X1, X2..., Xk , que afetam Y. Não importa
quantas variáveis explicativas incluímos em nosso modelo, pois sempre haverá fatores que
não podemos incluir, e estão contidos, coletivamente, em 𝑢.
Estimativas de MQO

Reta de Regressão de MQO ou Função de Regressão Amostral

 é a estimativa de intercepto de MQO


 são as estimativas de inclinação de MQO – correspondente às variáveis

Interpretação:
Sobre o significado de “manter outros
fatores fixos” na RLM
■ A interpretação de efeito parcial dos
coeficientes de inclinação na análise de RM
pode causar alguma confusão
■ O poder da análise de RLM é que ele
proporciona uma interpretação ceteris paribos
mesmo que os dados não sejam coletados de
uma maneira ceteris paribus (ou seja, fixos)
■ Ideia de “controlar” pelos fatores observáveis
Propriedades Estatísticas dos
Estimadores de MQO
■ Lembrando que propriedades estatísticas não têm nada a ver com
uma amostra particular, mas sim, com a propriedade dos
estimadores quando a amostragem aleatória é feita
repetidamente.
Propriedades Estatísticas dos
Estimadores de MQO
RLM1 – Linear nos parâmetros Hipóteses de
RLM2 – Amostragem aleatória Não Gauss-Markov
Viesado para regressão
RLM3 – Colinearidade não perfeita de corte
transversal
RLM4 – Média condicional zero
RLM5 – Homocedasticidade Menor Hipóteses
RLM6 – Ausência de correlação serial Variância adicionais para
séries temporais
RLM7 – Normalidade dos erros
Teorema de Gauss-Markov

■ Sob as hipóteses do MRL, são os melhores estimadores lineares não


viesados (BLUEs) de , respectivamente.
Hipóteses da RLM
RLM1 – Linear nos parâmetros

■ O modelo populacional (ou modelo verdadeiro) pode ser escrito como

Modelo populacional, ou verdadeiro, implica que todos os fatores relevantes (X) para
entender Y estão listados
são os parâmetros desconhecidos (constantes) de interesse e é um erro
aleatório não observável ou um termo de perturbação aleatória
Os são lineares – e as variáveis independentes podem ser funções de variáveis de
interesse, como quadrados e logaritmos naturais.
RLM2 – Amostragem aleatória

■ Temos uma amostra aleatória de observações 1i 2i ki i , do


modelo populacional descrito por RLM1

Onde refere-se à observação


O termo contém os fatores não observáveis para a observação que afeta o seu Y.
Sabemos que MQO determina as estimativas de intercepto e inclinação de uma
amostra particular, de modo que os resíduos tenham como média zero e a correlação
amostral entre cada variável independente e os resíduos seja zero.
Ainda assim, não incluímos condições sob as quais as estimativas de MQO são bem
definidas para determinada amostra.
RLM3 – Colinearidade não perfeita

■ Na amostra (e, portanto, na população), nenhuma das variáveis independentes é


constante, e não há relações lineares exatas entre as variáveis independentes.
■ Nos fenômenos que estudamos, é praticamente impossível que as variáveis Xk que
escolhamos para explicar Y sejam independentes umas das outras. Alguma
correlação entre elas há de ter. O que não pode é haver uma correlação exata entre
elas.
RLM4 – Média
condicional zero
■ O erro tem um valor esperado igual a zero,
dados quaisquer valores das variáveis
independentes.

Nunca saberemos com certeza se o valor médio das


não observáveis é não correlacionado com as
variáveis explicativas. Contudo, trata-se de uma
hipótese crítica.
RLM5 - Homocedasticidade

■ O erro u tem a mesma variância condicionada


a quaisquer valores das variáveis explicativas.
𝑣𝑎𝑟 𝑢|𝑥 , … , 𝑥 = 𝜎

Também usamos X para designar o conjunto das


variáveis independentes, na forma matricial
𝑣𝑎𝑟 𝑢|𝐗 = 𝜎
RLM6 – Inexistência
de Correlação
Serial/Autocorrelação

■ Condicional em , os erros
em duas observações
diferentes não são
correlacionados
RLM7 – Erro normalmente distribuído

■ Os erros u são independentes de X e são


idêntica e independentemente distribuídos
como Normal(0, σ²)
Inexistência de Viés em MQO

■ Sob as hipóteses RLM1 a RLM4,

𝐸 𝛽 = 𝛽 , 𝑗 = 0, 1, … , 𝑘

■ Para qualquer valor do parâmetro populacional


𝛽 . Em outras palavras, os estimadores de MQO
são estimadores não viesados dos parâmetros da
população.
■ Reforçando: estamos dizendo que o
procedimento pelo qual as estimativas de MQO
foram obtidas é não viesado. Esperamos que
tenhamos obtido uma amostra que nos dê uma
estimativa próxima do valor da população, mas,
infelizmente, isso não pode ser garantido.
Variância dos
estimadores de
MQO
■ As variâncias dos 𝛽 estão
condicionadas aos valores
amostrais das variáveis
independentes.
■ O tamanho de 𝑉𝑎𝑟(𝛽 ) é
importante na prática. Uma
variância maior significa um
estimador menos preciso, e isso se
traduz em intervalos de confiança
maiores e testes de hipóteses
menos acurados.
Variância dos estimadores de MQO

, onde

Então vejamos...
Estimadores de
MQO
Para efeito das
demonstrações que
faremos acerca das
violações dos
pressupostos,
utilizaremos as
definições dos
estimadores da RLS.

Você também pode gostar