Escolar Documentos
Profissional Documentos
Cultura Documentos
INSTITUTO DE MATEMÁTICA
DEPARTAMENTO DE ESTATÍSTICA
APOSTILA:
MAT02207 -
ESTATÍSTICA ECONÔMICA
Março de 2012.
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
ÍNDICE
3
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Método de ajustamento de uma reta para análise da relação entre uma variável independente
(explicativa ou regressora) e uma variável dependente (explicada ou resposta). Ambas as variáveis
são quantitativas. Este modelo também é conhecido como modelo de duas variáveis.
4
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
E Y | X i 1 2 X i
5
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
[1]: Yi 1 2 X i ei , i
Estabelece que, para cada observação i, existe uma relação linear de dependência entre uma
variável explicada observável, Y, uma variável explicativa observável, X e um termo de perturbação
aleatório não observável, e.
Ou seja, o modelo é linear nos parâmetros e nas variáveis.
Um exemplo de modelo não linear nas variáveis é Yi 1 2 X i2 ei , e veremos que alguns
casos desse tipo podem ser resolvidos através do modelo acima.
Tipos de não-linearidade nas variáveis:
[3]: E ei | X i 0, i
O valor médio do termo de erro é zero. Isso significa que fatores não incluídos no modelo e,
portanto, agrupados em e, não afetam sistematicamente o valor médio de Y.
6
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
[7]: O número de observações (n) deve ser maior que o número de parâmetros a serem estimados;
Ou seja, são necessários no mínimo 2 pares de observações para ajustar o modelo postulado em 1.
[8]: A variável explicativa X assume, no conjunto das observações, valores não todos iguais, ou
seja, a variável X não é constante na amostra.
Resulta destas hipóteses que Y é uma variável aleatória que tem, para todo i, média dada por:
E(Yi |Xi) = β1 + β2Xi (Implica de 3)
E variância:
Var(Yi|Xi) = σ2 (Implica de 4)
7
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Assim, através do cálculo diferencial (ver demonstração em Gujarati) o método de MQO nos
2
fornece as estimativas únicas de 1 e 2 que resultam no menor valor possível de eˆi . O
processo de diferenciação resulta na resolução do seguinte sistema de equações normais:
ˆ2
X i
X Yi Y xy
X
2 2
i X x
e,
ˆ1 Y ˆ 2 X ,
8
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
As estimativas de MQO são uma função dos dados amostrais. Mas, como os dados tendem a
mudar de amostra para amostra, as estimativas também mudarão. Portanto, é necessária alguma
medida da confiabilidade ou precisão dos estimadores ̂1 e ̂ 2 . Em estatística, a precisão de uma
estimativa é medida pelo seu erro-padrão, que nada mais é do que a raiz quadrada da variância.
Pode ser mostrado que as variâncias e os erros-padrão dos estimadores de MQO podem ser
obtidos por:
1 X 2 1 X2
2ˆ1 Var ˆ1 2 2
ˆ1
Ep ˆ
1
n x2
n x
2
2ˆ Var ˆ2 2
ˆ Ep ˆ2
2
x 2
x 2
onde 2 é a variância de ei, segundo a premissa 4, que pode ser estimada através da fórmula:
ˆ
2 eˆ 2 2 2 ˆ 2 2
, onde e y 2 x y
ˆ 2
xy
2
.
n2 x2
Assim, a partir de uma amostra, podemos estimar as variâncias e erros-padrão dos
estimadores de MQO apenas substituindo 2 por ˆ 2 nas expressões acima:
1 X 2 1 X2
ˆ 2ˆ1 var ˆ1 ˆ 2 2
ˆ ˆ1
ep ˆ
1
ˆ
n x2
n x
ˆ 2 ˆ
ˆ 2ˆ var ˆ2 2
ˆ ˆ ep ˆ2
2
x 2
x 2
4. São consistentes, pois quanto maior o n, menor sua variância, ou seja, maior sua precisão.
9
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 1. Utilize o método dos mínimos quadrados para estimar a reta de regressão entre número
de pizzarias (Y) e renda (X) per capita, baseado numa amostra observada de cinco cidades.
Interprete os valores do intercepto e coeficiente angular. Estime também as variâncias e erros-
padrão dos estimadores.
i X Y x y x² y² xy
1 8 40
2 4 30
3 6 28
4 12 46
5 15 59
Total
55
50
45
Y
40
35
30
25
4 6 8 10 12 14
X
10
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exercício 1. A tabela a seguir informa quantas semanas (X) seis pessoas trabalharam em um posto
de inspeção de automóveis e quantos automóveis (Y) cada pessoa inspecionou entre 12hs e 14hs, em
determinado dia.
a) Ajuste o modelo de regressão linear para esses dados, interpretando as estimativas obtidas;
b) Estime as variâncias e erros-padrão dos estimadores.
X Y
2 13
7 19
9 20
1 13
5 16
12 21
11
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Supondo que exista algum tipo de relação linear entre as variáveis X e Y na população, uma
medida utilizada para verificar o grau de correlação entre elas é o coeficiente de correlação linear
de Pearson, cujo valor amostral é dado por:
r
xy
x2 y2
Este coeficiente tem a propriedade de que: 1 r 1 .
12
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
onde SQT é a soma de quadrados total, SQE é a soma de quadrados explicados pela regressão e
SQR é a soma de quadrados de resíduos. Ou seja, a variação total dos valores observados de Y em
torno de sua média pode ser divida em duas partes: uma atribuível à linha de regressão e a outra, a
forças aleatórias porque nem todas as observações de Y se situam sobre a linha.
13
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Fórmulas alternativas:
2 ˆ
r 2
x2
2
xy
2
y2 x2 y2
14
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Para poder fazer inferências sobre os parâmetros do modelo de regressão, devemos fazer
alguma pressuposição sobre a distribuição de probabilidades dos resíduos ei. Geralmente se supõe
que:
[11]: ei ~ NID (0, 2 )
Isso implica que:
ˆ1 ~ N 1 , 2ˆ ; 1
ˆ2 ~ N , ;
2
2
ˆ
2
2
ˆ
n 2 2 ~ 2n2 e
Yi ~ N 1 2 X i , 2 .
Vimos anteriormente a estimação pontual dos coeficientes de regressão por MQO. Podemos
nos perguntar: até que ponto essas estimativas são confiáveis? Em decorrência de variações
amostrais, uma única estimativa possivelmente será diferente do verdadeiro valor, embora se espere
que, em amostras repetidas, seu valor médio seja igual ao verdadeiro valor. Agora, na estatística, a
confiabilidade de um estimador é medida por seu erro-padrão. Portanto, em vez de nos embasar
apenas na estimativa pontual, podemos construir um intervalo em torno do estimador pontual,
digamos, de dois ou três erros-padrão de cada lado, de tal modo que esse intervalo tenha, digamos,
95% de probabilidade de incluir o verdadeiro valor do parâmetro. Essa é a idéia que está por trás
dos intervalos de confiança.
Não podemos dizer que o verdadeiro valor do parâmetro possui tal probabilidade de estar
contido no intervalo. Ele é um número fixo, então ou está ou não está no intervalo (probabilidade 0
ou 1).
Depois de observarmos a amostra e calcularmos o intervalo para ela, ele deixa de ser aleatório
e passa a ser fixo, e então não podemos mais falar em probabilidade. Trocamos então a palavra
probabilidade por confiança. Assim, dizemos que tal intervalo possui “x” de confiança de conter o
verdadeiro valor do parâmetro.
15
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Substituindo-se em t, temos
ˆ i
P t i t 1
n 2; 2 ˆ ˆi n 2;
2
o qual é o intervalo de confiança para βi, e pode ser escrito mais concisamente como:
IC 100 1 % para i : ˆi t ˆ ˆ .
n 2; i
2
Exercício 4. Calcule e interprete os IC com 90% e 99% para os coeficientes de regressão para os
dados do Exercício 1.
16
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
q2
n 2ˆ 2 ~ 2 n 2 .
2
Podemos usar essa variável para estabelecer um intervalo de confiança para a variância
residual da seguinte forma:
P 2 q 2 2 1
n 2;1 n 2;
2 2
ˆ 2 ˆ 2
Ou IC 100 1 % para : n 2 2
2
; n 2 2 .
n 2; n 2;1
2 2
Exercício 5. Calcule e interprete os IC com 90% e 99% para a variância residual do Exercício 1.
17
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
O problema do teste estatístico de hipóteses pode ser resumido assim: uma dada observação
ou resultado é compatível com alguma hipótese feita ou não? Assim temos a hipótese nula (H0) que
é testada contra a hipótese alternativa (H1), e decidimos sobre a veracidade ou a falsidade da
hipótese nula através dos resultados amostrais. Ou seja, a teoria do teste de hipóteses cuida da
formulação de regras ou procedimentos a serem adotados para decidir se a hipótese nula deve ser
rejeitada ou não rejeitada. Há duas abordagens complementares para a elaboração dessas regras: o
intervalo de confiança e o teste de significância.
2. A inclinação do modelo (coeficiente angular) é nula? Ou, não existe relação linear entre X e Y?
H 0 : 2 0
H 1 : 2 0
Em ambos os casos acima, i* 0 .
Veremos a seguir que um teste de hipótese pode ser realizado através de duas abordagens: a
do intervalo de confiança e a do teste de significância. Por questões de facilidade, veremos testes
unilaterais apenas através da abordagem dos testes de significância.
18
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 6: Usando um nível de significância de 5%, teste, através dos intervalos de confiança, as
hipóteses de que o intercepto e o coeficiente angular são diferentes de zero para os dados do
Exemplo 1.
Exercício 6: Usando um nível de significância de 10%, teste, através dos intervalos de confiança, as
hipóteses de que o intercepto e o coeficiente angular são significativamente diferentes de zero para
os dados do Exercício 1.
19
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 7: Usando um nível de significância de 5%, teste, através dos testes de significância, as
hipóteses de que o intercepto e o coeficiente angular são diferentes de zero para os dados do
Exemplo 1.
Exemplo 8: Para os dados do exemplo 1, usando um nível de significância de 5%, teste a hipótese
de que o coeficiente angular é maior que 1.
20
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
- O valor-p: é definido como o menor nível de significância ao qual a hipótese nula pode ser
rejeitada. Só pode ser calculado exatamente através de métodos computacionais.
A relação entre o valor-p e o nível de significância é: se valor-p < , rejeita-se H0, caso
contrário não se rejeita.
1.9 Previsão
1. Previsão para a estimativa média de Y dado X=X0: Exemplo: Estimar o consumo médio de pizza
para cidades com renda igual a 7.
Yˆ0 estimador de E Y | X X 0 ˆ1 ˆ2 X 0
2. Previsão para a estimativa individual de Y dado X=X0: Exemplo: Estimar o consumo de pizza
para uma cidade com renda igual a 7.
Yˆ0 estimador de Y | X X 0 ˆ1 ˆ2 X 0
1 ( X X )2
IC 100 1 % para E Y | X X 0 : Yˆ0 t ˆ m e ˆ m2 ˆ 2 0 2
n 2; n x
2
Exemplo 9. Calcular um intervalo com 95% de confiança para o valor médio de Y, quando X = 100,
para a regressão Yˆ 24,4525 0,5091X , obtida de uma amostra de 10 observações, com X 170 ,
x 2 33.000 e ˆ 2 42,159 .
21
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
1 ( X X )2
IC 100 1 % para Y | X X 0 : Yˆ0 t ˆ i e ˆ i2 ˆ 2 1 0 2
n
n 2;
2 x
Exemplo 10. Calcular um intervalo com 95% de confiança para o valor individual de Y, quando X =
100, para a regressão do Exemplo 9.
2. Ao extrapolar as estimativas para valores fora do intervalo dos dados amostrais, não
existem garantias de que a relação entre as variáveis manterá o mesmo padrão
observado na amostra.
Exercício 9. Calcular os intervalos com 90% de confiança para a estimativa média e individual de Y
dado que X = 10 para os dados do Exercício 1.
22
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Ou seja:
SQT: soma de quadrados total, com (n-1) g.l.;
SQE: soma de quadrados explicada pela regressão, com 1 g.l.;
SQR: soma de quadrados dos resíduos, com (n-2) g.l..
As somas de quadrados também podem ser calculadas através das seguintes expressões:
SQT Yi Y yi2
2
ˆ x
SQE Yˆi Y
2 2
2
2
i
SQR Y Yˆ eˆ y
2 2 2
ˆ 2 2
xy 2
2
i i i 2 x y x 2
A ANOVA utiliza essa relação entre as somas de quadrados é geralmente resumida e
analisada através da seguinte tabela:
ANOVA
Causas de Variação GL SQ QM F
Devida à regressão 1 ˆ 2
2 x 2
i ˆ22 xi2 QME
QME QMR
1
Devido aos resíduos n-2 eˆ i
2 2
eˆi ˆ 2
QMR
n2
Total n-1 y 2
i
No caso de apenas duas variáveis, deve-se observar que a relação entre as estatísticas t e f é
t2 f .
23
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 11. Utilizando os dados do Exemplo 1, construa a tabela da análise de variância e analise
os resultados, considerando um nível de significância de 5%.
Através de manipulações algébricas, a tabela ANOVA pode ser re-escrita em termos desse
coeficiente da seguinte forma:
ANOVA
CV GL SQ QM F
Regressão 1 r 2
y 2
i
r y i2 1
2
n 2r 2
1 r2
Resíduos n-2 1 r y 1 r y n 2
2 2
i
2 2
i
Total n-1 y 2
i
24
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exercício 10.
a) Faça a ANOVA para os dados do Exercício 1 e analise os resultados.
b) Refaça a ANOVA em termos do coeficiente de determinação e compare os resultados com o item
a).
Nesse modelo, o termo do intercepto está ausente ou é nulo. Aplicando então o método de
MQO, obtemos as seguintes fórmulas para ̂ 2 e sua variância:
ˆ2
XY , ˆ 2ˆ ˆ 2 , ˆ 2 eˆ 2 , 2 2
XY 2
eˆ Y X 2
X 2 2 X 2 n 1
A primeira diferença entre o modelo de regressão pela origem e o modelo com intercepto é
que as fórmulas para o primeiro envolvem somas brutas das variáveis, e não no formato desvio.
A segunda diferença são os graus de liberdade, que passam a ser n – 1.
Outra diferença é que, no modelo com intercepto eˆi 0 , já na regressão pela origem, isto
nem sempre acontece.
Além disso, o r2 conforme definido anteriormente pode ser negativo nos modelos com
intercepto ausente. Portanto, ele não pode ser usado diretamente nesse caso e também é necessário
ajustar os cálculos, obtendo o que se chama de r2 bruto, definido como:
r 2
XY
2
.
bruto 2 2
X Y
O r2 bruto está sempre entre 0 e 1, mas não pode ser comparado diretamente ao valor do r2
convencional.
Em decorrência das características especiais deste modelo, é preciso ter grande cautela ao
empregá-lo. A menos que exista uma expectativa a priori muito forte, seria preferível ater-se ao
modelo com intercepto.
Exemplo 13. Ajustar o modelo de regressão pela origem aos dados do Exemplo 1, calcular o r2
bruto e testar a hipótese de que existe influência linear de X em Y, para uma significância de 5%.
25
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exercício 11. Ajustar o modelo de regressão pela origem aos dados do Exercício 1, calcular o r2
bruto e testar a hipótese de que existe influência linear de X em Y, para uma significância de 5%.
Trabalhamos até agora com um modelo linear nos parâmetros e nas variáveis. Entretanto,
alguns modelos de regressão bastante usados não são lineares nas variáveis, mas o são nos
parâmetros. Esses modelos podem ser tornados lineares por meio de transformações nas variáveis.
Se escrevermos ln1 , temos o modelo log-linear, que é linear nos parâmetros mas não
nas variáveis:
ln Yi 2 ln X i ei
Se fizermos, Yi* lnYi e X i* ln X i , teremos o MRLS Yi* 2 X i* ei , que pode ser
estimado por MQO.
A utilidade desse modelo é que 2 mede a elasticidade de Y em relação a X, isto é, a
variação percentual de Y correspondente a variação de 1% em X. Assim, se Y representa a
quantidade demandada de um bem e X seu preço unitário, 2 mede a elasticidade preço da
demanda.
Desenhos:
No modelo de 2 variáveis, para verificar se o modelo log-linear se ajusta aos dados, traça-se
o diagrama de dispersão de lnYi contra ln X i e verifica-se se os pontos se aproximam de uma
reta.
- Modelo Log-Lin
Muitas vezes é interessante conhecer a taxa de crescimento de algumas variáveis como
população, PNB, etc. Imagine que desejamos conhecer a taxa de crescimento de uma população no
período t. Denotemos por Yt a população no final do período e Y0 no início do período.
26
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
- Modelo Lin-Log:
No modelo anterior (Log-lin) queremos conhecer o crescimento percentual de Y para uma
variação absoluta em X. O modelo Lin-log serve para conhecermos a variação absoluta em Y para
uma variação percentual em X. Assim,
Yi 1 2 ln X i ei
27
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 14: Na tabela a seguir, tem-se parte de um conjunto de dados que mostra as despesas com
serviços por trimestre, no período de 1993 até o 3° trimestre de 1998.
Ano-trimestre t Desp. Serv. (Y) Y*=ln(Y)
1993-I 1 2445,3 7,802
1993-II 2 2455,9 7,806
1993-III 3 2480,0 7,816
1993-IV 4 2494,4 7,822
... ... ... ...
1998-I 21 2829,3 7,948
1998-II 22 2866,8 7,961
1998-III 23 2904,8 7,974
Exercício 15. Os dados a seguir mostram as despesas com propaganda (X), expressas em
percentagem das despesas totais, e o lucro operacional líquido (Y), expresso em percentagem do
total de vendas, em uma amostra de seis drogarias.
X Y
1,5 3,6
1,0 2,8
2,8 5,4
0,4 1,9
1,3 2,9
2,0 4,3
a) Ajuste a reta de mínimos quadrados que permita predizer o lucro operacional líquido em termos
das despesas com propaganda.
b) Calcule o coeficiente de correlação e interprete.
c) Qual o grau de ajuste do modelo? Interprete.
d) Teste a hipótese nula β2 1,6 contra a hipótese β2 < 1,6, ao nível de 0,01 de significância.
e) Construa um intervalo de 99% de confiança para β2.
f) Construa um intervalo de 90% de confiança para a variância residual.
g) Construa um intervalo de 95% de confiança para o lucro operacional líquido médio quando as
despesas com propaganda são de 2,5% da despesa total.
h) É possível utilizar o modelo ajustado para prever o lucro quando as despesas são iguais a 5%?
i) Ajuste um modelo de regressão que passe pela origem do sistema coordenado.
28
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Yi 1 2 X 2i 3 X 3i ei
Yi 1 2 X 2i 3 X 3i k X ki ei , com i = 1, 2, ..., n.
Nesse modelo:
- As k-1 variáveis explicativas são X2, X3, ..., Xk, e Y é a variável dependente ou explicada;
- Os ei são os erros aleatórios (resíduos) que seguem as hipóteses clássicas;
- β1 é o intercepto;
- Os coeficientes parciais de regressão, desconhecidos, são β2, β3, ..., βk.
Y1 1 2 X 21 3 X 31 k X k1 e1
Y2 1 2 X 22 3 X 32 k X k 2 e2
...
Yn 1 2 X 2 n 3 X 3n k X kn en
Y1 1 X 21 X k1 1 e1
Y 1 X X k 2 2 e2
2 22
Yn 1 X 2 n X kn k en
Y X β e
29
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
onde:
Y: é o vetor coluna de dimensão (n x 1) de valores observados;
X: é a matriz (n x k) de valores observados para as variáveis explicativas;
β : é o vetor (k x 1) de parâmetros desconhecidos;
e : representa o vetor (n x 1) de perturbações (erros) aleatórias.
Obs: as notações negrito representam formas matriciais.
Da mesma forma que no modelo de duas variáveis, os estimadores de MQO podem ser
obtidos através da minimização da soma dos quadrados dos resíduos, isto é:
eˆ i
2
Yi ˆ1 ˆ 2 X 2i ˆ3 X 3i ˆ k X ki
2
.
eˆ1
eˆ
eˆ ' eˆ eˆ1 e n eˆ1 eˆ2 eˆn eˆi
2 2 2 2 2
eˆ2 ˆ
eˆn
30
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
βˆ X' X X' Y
1
n
X 2i X 3i X ki
Yi
2
X 2 i X 2i X X 2i 3i X X
2i ki X 2i Yi
2
X' X X 3i X X 2i 3i X 3i X X
3i ki
e X'Y X 3i Yi .
X 2 X Y
ki X 2i X ki X 3i X ki ki
X ki i
que é a matriz de variâncias e covariâncias dos estimadores de MQO, que só e conhecida se 2 for
conhecido.
Entretanto, a variância residual pode ser estimada por:
eˆ ' eˆ Y' Y βˆ ' X' Y
ˆ 2 ,
nk nk
onde Y' Y Yi 2 .
1
onde aii é o elemento da linha i, coluna i, da matriz X' X .
31
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 1. Uma empresa de tele-entrega quer estimar o tempo que seus funcionários devem levar
até que retornem com uma lista de tarefas concluída. Assim, coletou o tempo de viagem (Y), a
quantidade de km percorridos (X2) e o número de entregas (X3) de cinco de seus moto-boys. Com
os dados a seguir, estime o modelo de regressão linear múltipla, bem como os erros-padrão dos
estimadores.
32
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exercício 1. Seja a amostra abaixo. Estime o MRLM de três variáveis, bem como as variâncias e
erros-padrão dos estimadores.
Y X2 X3
5 1 1
6 2 1
7 3 2
8 4 2
8 5 2
2
2 βˆ ' X' Y n Y SQE e' e SQR
R 2
1 2
1
Y' Y nY SQT Y' Y nY SQT
Obs.: No modelo de duas variáveis definimos o coeficiente de correlação (r) como uma medida do
grau da relação entre as variáveis. No caso de três ou mais variáveis, há um coeficiente análogo, o
coeficiente de correlação múltipla ( R R 2 ), que mede a associação entre Y e todas as variáveis
explanatórias em conjunto. Embora r possa ser positivo ou negativo, R sempre será positivo (pois
nem todas as variáveis explicativas podem ter relação no mesmo sentido com a variável resposta).
Na prática, porém, R tem pouca importância. A quantidade mais significativa é R2.
2
2.6 Coeficiente múltiplo de determinação ajustado: R
Uma propriedade importante do R2 é que ele é uma função não-decrescente do número de
variáveis explicativas. O R2 quase invariavelmente aumenta e nunca diminui quando o número de
regressores aumenta.
Em vista disto, ao comparar dois modelos de regressão com a mesma variável dependente,
mas com número diferente de variáveis X, deveríamos escolher o modelo com o R² mais alto. Para
comparar dois termos R², é preciso levar em conta o número de variáveis X presentes no modelo.
Isto pode ser feito se considerarmos o coeficiente múltiplo de determinação ajustado, que é dado
por:
SQR
n 1
R2 1 n k 1 1 R2
SQT
nk
n 1
O R 2 pode ser negativo, e neste caso, na prática, seu valor será tomado como zero.
Obs.: o R 2 , não é a única forma de correção do R2 e nem a única medida para julgar a adequação
de um modelo de regressão, outras medidas conhecidas são o R2 Modificado, o critério de
Informação de Akaike e os critérios de Predição de Amemiya.
33
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
r12.3, r12.3 e r12.3 são os coeficientes de primeira ordem. Se houvessem mais variáveis no
modelo, ocorreriam também coeficientes de correlação de segunda ordem (r12.34), terceira ordem
(r12.345) e assim por diante.
34
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Então, R 2 r122 desde que r132 .2 0 . Ou seja, R2 sempre cresce com a inclusão de uma nova
variável, a menos que r132 .2 0 , onde teríamos R 2 r122 .
Exemplo 3. Dados r12 = 0,8822, r13 = 0,8089 e r23 = 0,4564 para o Exemplo 1, calcular e interpretar
os coeficientes de determinação parciais.
Exercício 3. Ao se ajustar um modelo de três variáveis, encontrou-se r12 = 0,3048, r13 = 0,1391 e
r23=-0,7043. Calcule e interprete os coeficientes de determinação parciais.
Para podermos realizar inferências, supomos que e ~ N 0; 2 I n . Isso implica que, sob as
hipóteses clássicas, β̂ tem distribuição normal multivariada, isto é:
βˆ ~ N β; 2 X' X
1
35
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
2 2 2
com ˆ ˆ
σ a ii e ˆ ˆ σ a ii .
i i
Além disso, utilizamos o procedimento idêntico do teste de hipóteses para o modelo de duas
variáveis para testar a significância individual dos coeficientes.
Por exemplo, seja o modelo de 3 variáveis. Poderia ser interessante testar as hipóteses
H 0 : 2 0
H 1 : 2 0 .
Neste caso, estaríamos avaliando se X2 tem alguma influência linear sobre Y, mantendo-se
X3 constante.
A tabela abaixo nos dá a área de rejeição de cada teste:
36
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exercício 4.
a) Teste se os coeficientes do modelo de regressão estimado no Exercício 1 são significativamente
diferentes de zero, para um nível de significância de 5%.
b) Construa um IC de 90% para o coeficiente de X2 e teste se ele é diferente de 1.
c) Teste, a 5% de significância, se o intercepto é maior que 2.
Esta hipótese não pode ser testada fazendo-se um teste de significância para cada coeficiente
parcial. Isto porque, se para cada teste adotamos um nível de significância (probabilidade de erro
tipo I), a probabilidade de erro tipo I de todos os testes simultaneamente é maior que .
Entretanto, através da ANOVA, podemos testar as hipóteses abaixo de uma única vez:
H 0 : 2 3 k 0
H 1 : ao menos um dos i é diferente de zero.
CV GL SQ QM F
^ 2 SQE QME
Regressão k-1 β' X' Y nY k 1 QMR
^ SQR
Resíduos n-k Y ' Y β ' X' Y nk
2
Total n-1 Y ' Y nY
Regra de decisão: Se F F ;k 1;n k , rejeita-se H0, caso contrário não se rejeita.
CV GL SQ QM F
n k R 2
Regressão k-1
R 2 Y' Y nY
2
SQE
k 1
k 1 1 R 2
Resíduos n-k 1 R Y' Y nY
2 2
SQR
nk
2
Total n-1 Y ' Y nY
37
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
38
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Seja um modelo de três variáveis. Imagine que façamos a inclusão seqüencial de X2 e X3,
isto é, primeiro fazemos a regressão entre Y e X2 e avaliamos sua significância e então
acrescentamos X3 ao modelo para verificar se este contribui com algo (obviamente, a ordem de
entrada pode ser invertida). Com contribuição, queremos dizer que desejamos saber se a inclusão da
variável no modelo aumenta a SQE (e, por conseqüência, R²) “significativamente” em relação à
SQR. Essa é a contribuição marginal ou incremental de uma variável explicativa.
A questão da contribuição marginal é importante na prática. Na maioria das pesquisas, o
pesquisador pode não estar totalmente convencido de que valha a pena acrescentar uma variável X
ao modelo sabendo que várias outras variáveis X já estão presentes no modelo. Não se quer incluir
variáveis que contribuam muito pouco para a SQE. Contudo, também não se quer excluir variáveis
que aumentem substancialmente a SQE. Mas como decidir se uma variável X reduz
significativamente a SQR? A técnica da ANOVA pode ser empregada para responder essa pergunta.
Primeiramente, fazemos a regressão entre Y e X2, produzindo a tabela de ANOVA abaixo:
CV GL SQ QM
Regressão (devido a X2) 1 Q1=SQE QME
Resíduos n-2 SQR QMR
Total n-1 SQT
CV GL SQ QM
Regressão (devido a X2 e X3) 2 Q3=SQE QME
Resíduos n-3 Q4=SQR QMR
Total n-1 Q5=SQT
CV GL SQ QM F
Regressão (devido a X2) 1 Q1 Q1 /1
Regressão (devido a X3) 1 Q2 = Q3 – Q1 Q2 /1 (n-3)Q2 /Q4
Regressão (devido a X2 e X3) 2 Q3 Q3 /2
Resíduos n-3 Q4 = Q5 – Q3 Q4 /(n-3)
Total n-1 Q5
A estatística F segue distribuição F com “1” e “n-3” graus de liberdade. Se seu valor for
maior que F ;1;n 3 , concluímos que o acréscimo de X3 ao modelo aumenta significativamente a
SQE, e portanto, R². Assim, deve-se acrescentar X3 ao modelo.
Este teste também poderia ser reformulado em termos dos valores R²:
F
R 2
novo
R 2 velho n de novos regressores
.
1 R 2
novo n n de parâmetros do novo modelo
Observação: o mesmo procedimento poderia ser usado para testar a adição de um grupo de
variáveis simultaneamente, com as devidas correções dos graus de liberdade.
39
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 6. Para se estudar o comportamento do consumo pessoal nos EUA em certo período,
observou-se as variáveis despesa de consumo pessoal (Y), renda pessoal disponível (X2) e tempo
medido em anos (X3). Observou-se 15 anos (1956 a 1970).
Primeiramente, regrediu-se Y contra X2, obtendo-se os seguintes resultados:
CV GL SQ QM F
Regressão 1 65898,2353 65898,2353 5947,494
Resíduos 13 144,0340 11,0800
Total 14 66042,2693
CV GL SQ QM F
Regressão 2 65965,1000 32982,5500 5129,319
Resíduos 12 77,1693 6,4302
Total 14 66042,2693
40
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exercício 6. Com os dados do Exemplo 1, construa a tabela ANOVA para analisar se a inclusão de
variável X3 na regressão que já possui X2 é significativa a 5% e interprete o resultado.
desejamos prever
Yˆ0 ˆ1 ˆ2 X 02 ˆ3 X 03 ˆk X 0 k
Este é o valor estimado para Y tanto na previsão média como individual. A diferença está
nas variâncias para os dois tipos de previsão:
IC para previsão individual: IC 100 1 % para Y | X X 0 : Yˆ0 t ˆ i
n k ;
2
41
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 8. No Exemplo 1, a empresa quer saber quanto tempo deveria esperar em média para que
um moto-boy retorne de uma tarefa com 3 entregas e 80km a percorrer. Calcule o IC 99% para
E(Y|X=X0).
Exercício 7. Para o Exemplo 1, construa um intervalo com 95% de confiança para o tempo médio
que a empresa deve esperar no caso de um moto-boy sair com 4 entregas e 70km a percorrer.
Suponha que desejamos relacionar custo marginal de produção (Y) com quantidade
produzida (X). Poderíamos ajustar uma parábola a esta relação, como abaixo:
que é a regressão polinomial de 2° grau, e pode ser ajustada normalmente por MQO.
A forma geral da regressão polinomial de k-ésimo grau é:
Yi 0 1 X i 2 X i2 k X ik ei
42
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Este modelo nos permite saber se o sexo faz alguma diferença no salário dos professores
universitários, obviamente desconsiderando a influência de variáveis como idade, cursos de pós-
graduação e anos de experiência. Fazendo as suposições clássicas sobre os resíduos, obtém-se que:
O coeficiente 2 será a diferença de salário dos homens em relação às mulheres, por isso é
chamado de coeficiente diferencial de intercepto, e o teste para verificar se há diferença nos salários
médios para homens e mulheres é:
H 0 : 2 0
H1 : 2 0
que pode ser verificado pelo teste t usual.
43
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Estimar o modelo, e testar se existe diferença nos salários médios entre os sexos, a 5%.
Para se inserir uma variável qualitativa com mais de duas categorias, deve-se criar mais de
uma variável dummy. Por exemplo, suponha que se queira verificar se existe diferença entre os
salários dos professores segundo o nível de pós-graduação (mestrado, doutorado e pós-doutorado).
O modelo seria:
Yi 1 2 D2i 3 D3i ei
Observe que assim, a categoria “mestrado” já está expressa nas duas variáveis dummies,
sendo que o valor correspondente a essa categoria é o par (0,0), por isso ela é chamada de categoria
de referência.
44
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 10. A partir de uma amostra de 528 americanos, foi calculada uma regressão com os
seguintes resultados.
Yˆi 8,8148 1,0997 D2i 1,6729 D3i
ep 0,4015 0,4642 0,4854
t 21,9528 2,3688 3,4462
p 0,0000 0,0182 0,0006
45
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Graficamente:
Exemplo 11. Suponha que você gostaria de regredir despesas anuais com saúde (Y), renda anual
(X) e nível de escolaridade (fundamental, médio e superior). Como seria o modelo? Faça o gráfico.
Em muitas aplicações, premissas desse tipo são insustentáveis. Uma mulher graduada pode
gastar mais com roupas que um homem graduado. Em outras palavras, pode haver uma interação
entre as duas variáveis qualitativas. Portanto, seu efeito sobre Y pode não ser apenas aditivo, como
no modelo acima, mas também multiplicativo, como no modelo a seguir:
Nesse caso, o modelo com a interação das variáveis qualitativas é representado por:
Exemplo 12. Regrediu-se salários-hora (Y), contra anos de escolaridade (X), sexo (D2, 1 se mulher)
e raça (D3, 1 se não branco e não hispânico), para 528 americanos. Os resultados estão abaixo:
Yˆi 0,26100 2,3606 D2i 1,7327 D3i 2,1289 D2i D3i 0,8028 X i
p 0,05 0,05 0,05 0,05( 0,08) 0,05
Observação: Neste exemplo, estamos supondo que a taxa de aumento dos salários-hora em relação
à escolaridade (de cerca de 80 centavos de dólar por ano adicional de escolaridade) não varia com o
gênero e raça. Mas pode ser que não seja este o caso. Para testar isso, pode-se incluir coeficientes
diferenciais angulares:
Yi 1 2 D2i 3 D3i 4 D2i D3i 1 X i 2 D2i X i 3 D3i X i ei
47
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 14. A certo conjunto de dados ajustou-se o modelo de regressão linear múltipla:
ln(Y ) 2, 9298 0, 0546 X 0,1341D
t = (481,524) (48,3356) (27,2250) n = 15
48
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exercício 8: (ANPEC – 2003) O método dos mínimos quadrados ordinários foi empregado para
estimar o modelo de regressão abaixo, cujo objetivo é explicar as variações de renda entre 526
indivíduos:
log(renda) 0,417 0,297 sexo 0,080 educ 0,029 exper 0,00058 exper 2 u ,
( 0, 099) ( 0 , 036) ( 0 , 007 ) ( 0 , 005) ( 0, 00010)
R 2 0,441, n 526,
em que sexo é uma variável dicotômica (valor 1, se for homem e 0, caso contrário), educ é o
número de anos de escolaridade, exper é experiência profissional, também medida em anos. Os
números entre parênteses são os erros-padrão das estimativas ( sb i 0,,.,..
1 .,4) . Com base nos
i
49
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Vimos que os testes de hipóteses e intervalos de confiança que estudamos somente podem
ser aplicados supondo-se normalidade aos resíduos. Entretanto, essa suposição deve ser verificada,
para se avaliar se essas técnicas de inferência podem ser realmente aplicadas ou não.
3.1.1 Detecção
Para fazer a verificação da normalidade dos resíduos, três técnicas são mais conhecidas:
histograma dos resíduos, gráfico de probabilidade normal e testes não-paramétricos.
- Histograma dos resíduos: Trata-se de um simples gráfico que é usado para conhecer algo da
forma da função de densidade de probabilidade de uma variável aleatória. No eixo horizontal,
dividimos os valores da variável (no caso, dos resíduos) em intervalos adequados e, em cada um,
traçamos retângulos cuja altura é dada pelo número de observações (isto é, sua freqüência) nesse
intervalo de classe. A partir desse gráfico, devemos tentar verificar se a forma de sino na Normal se
aproxima da forma encontrada no histograma.
0,35
0,6
0,3
0,5
0,25
0,4
Densidade
Densidade
0,2
0,3
0,15
0,2
0,1
0,1
0,05
0 0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
uhat1 uhat2
- Gráfico de probabilidade normal (ou Q-Q Plot): No eixo vertical, marcamos os valores da
variável que nos interessam (no caso, os resíduos) e no eixo horizontal representamos o valor
esperado para essa variável caso ela fosse normalmente distribuída. Se a variável for, de fato,
normalmente distribuída, o gráfico tomará a forma de uma reta.
50
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
3 4
y=x y=x
3
2
-1
-1
-2
-2
-3 -3
-3 -2 -1 0 1 2 3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5
Quantis normais Quantis normais
- Testes não-paramétricos: Existem vários testes utilizados para verificar se um conjunto de dados é
normalmente distribuído, e estão disponíveis na maioria dos programas estatísticos. Alguns deles
são: Anderson-Darlin, Qui-quadrado, Jarque-Bera, Kolmogorov-Smirnov, Lilliefors, Doornik-
Hansen e Shapiro-Wilk. A hipótese nula desses testes é que os dados provêm de uma distribuição
normal, contra a alternativa de que os dados não provêm de uma distribuição normal.
Ao pedir esses testes no Gretl, devemos observar se o valor-p é menor que o nível de
significância adotado. Se for, a suposição de normalidade não está satisfeita.
Teste de Doornik-Hansen = 0,942923, com p-valor Teste de Doornik-Hansen = 68,6476, com p-valor
0,62409 1,23983e-015
Shapiro-Wilk W = 0,99156, com p-valor 0,78854 Shapiro-Wilk W = 0,83696, com p-valor 4,02623e-009
Teste de Lilliefors = 0,0550418, com p-valor ~= 0,64 Teste de Lilliefors = 0,15247, com p-valor ~= 0
Teste de Jarque-Bera = 1,01753, com p-valor Teste de Jarque-Bera = 61,2039, com p-valor
0,601239 5,12548e-014
3.1.2 Conseqüências
Já vimos que a premissa de normalidade não é essencial se o objetivo for apenas estimar o
modelo. Além disso, demonstra-se que os estimadores de MQO são os melhores estimadores
lineares não tendenciosos quer os resíduos sejam normais quer não.
Entretanto, se os resíduos não forem normais, os testes e intervalos de confiança baseados
nas distribuições t, F e Qui-quadrado serão inválidos.
Demonstra-se que, mesmo se os resíduos não forem normais, mas forem homocedásticos, os
estimadores de MQO seguem distribuição assintoticamente normal. Ou seja, se a amostra for
grande, os habituais procedimentos de inferência ainda são válidos.
Infelizmente, não se tem um consenso sobre quão grande uma amostra deve ser para que a
normalidade assintótica seja válida. Alguns autores consideram n = 30 como sendo um tamanho de
amostra mínimo satisfatório.
51
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 1. Procedeu-se um estudo sobre gastos com pesquisa e desenvolvimento (PD) e as vendas
(VENDAS) de 20 setores industriais dos EUA. Ajustou-se o modelo PD 1 2VENDAS e no
Gretl, os resultados estão abaixo.
0,0002 6000
4000
0,00015
Densidade
2000
0,0001 0
-2000
5e-005
-4000
0 -6000
-8000 -6000 -4000 -2000 0 2000 4000 6000 8000 -5000 -4000 -3000 -2000 -1000 0 1000 2000 3000 4000 5000
uhat1 Quantis normais
52
0,4
uhat2 Gráfico Q-Q para uhat2
Estatística de teste para normalidade:
N(4,4409e-017 1,0964) 2,5
Qui-quadrado(2) = 1,893 [0,3881]
y=x
0,35
2
0,3 1,5
1
0,25
0,5
Densidade
0,2
0
0,15 -0,5
-1
0,1
-1,5
0,05
-2
0 -2,5
-3 -2 -1 0 1 2 3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5
uhat2 Quantis normais
3.2 Multicolinearidade
Uma das premissas do modelo de regressão é que: “não existe multicolinearidade perfeita,
ou seja, não há relações lineares perfeitas entre as variáveis explicativas”. No caso da regressão com
k variáveis envolvendo as variáveis explanatórias X 1 , X 2 ,, X k (onde X 1 1 para todas as
observações a fim de levar em conta o intercepto), diz-se que existe uma relação linear exata se a
seguinte condição for atendida:
1 X 1 2 X 2 k X k 0 ,
onde os i são constantes tais que nem todas são zero simultaneamente.
Entretanto, a multicolinearidade não ocorre apenas com relações perfeitas, e também ocorre
quando as variáveis X são intercorrelacionadas, mas de um modo menos que perfeito, como a
seguir:
1 1
X 2i X 1i 3 X 3i k X k i 0
2 2 2 2
X 2i 1 2 X 1i 3 X 3i k X ki u i .
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
X2 X3 X4
10 50 52
15 75 75
18 90 97
24 120 129
30 150 152
3.2.1 Conseqüências
Y X2 X3= X2
10 2 2
15 3 3
18 4 4
30 4 4
Onde é uma constante não nula.
4 13 13
Nesse caso, a matriz X ' X 13 45 45 tem determinante:
13 45 45 ²
det X ' X 8100 ² 7605 ² 7605 ² 7605 ² 8100 ² 7605 ² 0
e por isso a sua inversa não existe, o que nos impede de estimar o modelo.
Há uma razão intuitiva para isto. Lembrando o significado de ̂ 2 : ele nos dá a taxa de
variação de Y quando X2 varia uma unidade, mantendo-se X3 constante. Mas se as duas variáveis
independentes foram perfeitamente colineares, não há modo de manter X3 constante: quando X2
variar, X3 também o fará, a uma taxa de . O que quer dizer, então, que não há forma de isolar as
influências das duas variáveis na amostra dada.
54
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
2
2ˆ .
3
x 1 r
2
3i
2
23
Assim, percebe-se que, quando r23 tende (em termos absolutos) a 1, ou seja, quando a
colinearidade entre as variáveis X aumenta, as variâncias dos dois estimadores aumentam até o
limite, que é o infinito.
A velocidade com que as variâncias aumentam pode ser mensurada através do Fator de
Inflação de Variância (FIV), definido por:
1
FIV
1 r232
Se não há colinearidade, então FIV = 1, e quanto maior a colinearidade maior o FIV.
A figura abaixo mostra o quanto as variâncias dos estimadores aumentam à medida que a
correlação entre as variáveis independentes aumenta.
55
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
6. As estimativas dos coeficientes e dos erros-padrão podem ser muito sensíveis a pequenas
variações nos dados.
Y1 X2 X3 Y2 X2 X3
1 2 4 1 2 4
2 0 2 2 0 2
3 4 12 3 4 0
4 6 0 4 6 12
5 8 16 5 8 16
3.2.2 Detecção
Primeiramente, deve-se ter em mente que a multicolinearidade é uma questão de grau, e não
de tipo. A distinção significativa não é entre a presença e ausência de multicolinearidade, mas entre
56
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
seus vários graus. Além disso, ela é uma característica da amostra, e não da população. Portanto,
medimos seu grau em uma amostra específica.
Não há um método único para detectar multicolinearidade, e sim algumas regras práticas.
4. Regressões auxiliares.
Como a multicolinearidade decorre do fato de que um ou mais regressores são combinações
lineares exatas ou aproximadas de outros regressores, uma forma de verificar qual das variáveis X
se relaciona a outras X é fazer regressões de cada Xi contra os demais X e calcular os respectivos R²,
que aqui designamos por Ri2 . Então, pode-se calcular a estatística de teste
Ri2 / k 2
Fi ~ Fk 2;n k 1
1 Ri2 / n k 1
57
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 2. Considere uma regressão do consumo (Y) em função da renda (X2) e riqueza (X3), com
os dados abaixo:
Y X2 X3
70 80 810
65 100 1009
90 120 1273
95 140 1425
110 160 1633
115 180 1876
120 200 2052
140 220 2201
155 240 2435
150 260 2686
Através do Gretl, obtemos os seguintes resultados:
X2 482,128
X3 482,128
Norma-1 = 37022026
Determinante = 2,35068e+009
Número de condição recíproca = 2,727131e-008
- Regressão entre Y e X2
Modelo 2: MQO, usando as observações 1-10
Variável dependente: Y
58
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
- Regressão entre Y e X3
Modelo 3: MQO, usando as observações 1-10
Variável dependente: Y
59
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
A informação a priori pode vir de trabalhos anteriores nos quais o problema de colinearidade
é menos grave ou da teoria do campo de estudo.
3. Excluir variáveis.
Deve-se tomar o cuidado para não cair em um “viés de especificação”, que decorre da
especificação incorreta do modelo empregado. As conseqüências do viés de especificação são que
as estimativas de MQO se tornam viesadas.
4. Transformação de variáveis.
Seja uma série temporal do consumo versus renda e riqueza:
Yt 1 2 X 2t 3 X 3t et
5. Dados novos.
Ou seja, aumentar o tamanho da amostra. Deve-se cuidar se a conjuntura econômica não se
modificou.
6. Regressões polinomiais.
Exemplo: Yi 0 1 X i 2 X i2 ei .
Pode-se ajustar o modelo: Yi 0 1 X i X 2 X i X ei .
2
7. Outras técnicas.
Há muitas outras técnicas sugeridas e ainda sendo pesquisadas para resolver
multicolinearidade, como análise fatorial e regressão de cumeeira.
Exercício 1. Foi feito um estudo com 20 mulheres saudáveis relacionando quantidade de gordura
corporal (Y), com medidas do tríceps (X1), circunferência da coxa (X2) e circunferência do
antebraço (X3). A regressão resultou nos seguintes resultados:
X1 708,843
X2 564,343
X3 104,606
Norma-1 = 108567,11
Determinante = 1767107,7
Número de condição recíproca = 5,3078777e-009
3.3 Heterocedasticidade
Uma das premissas do modelo de regressão linear clássico é a de que os termos de erro ei
da FRP sejam homocedásticos; isto é, devem ter todos a mesma variância. Simbolicamente:
Homocedasticidade: Var ei 2 , i
Heterocedasticidade: Var ei i2
Graficamente, temos:
Essa característica pode ser observada em diversos tipos de dados, por exemplo: a
variabilidade do número de erros de digitação que um operador comete tende a diminuir com o
passar do tempo; a variabilidade dos valores depositados numa conta poupança tende a aumentar
com o aumento da renda dos clientes; presença de outliers (valores discrepantes).
ˆ2
xy
x2
mas agora a sua variância é dada por:
xi2 i2
2ˆ 2
2
x i
2
ao invés da expressão na presença da homocedasticidade: 2ˆ 2
.
2
x
Estudamos que, na presença de homocedasticidade, o estimador de MQO é o melhor
estimador linear não-tendencioso. Pode-se demonstrar que, na presença de heterocedasticidade, o
estimador de MQO ainda é linear e não-tendencioso. Além disso, é consistente e segue distribuição
normal assintótica. Mas é o “melhor” estimador, isto é, possui a variância mínima dentre todos os
estimadores não-tendenciosos? A resposta é não e a justificativa é dada a seguir.
62
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Ou seja, a variância dos resíduos do modelo transformado é uma constante, o que implica que o
modelo é homocedástico. Assim, se aplicarmos MQO ao modelo transformado, ele gerará
estimadores que são os melhores estimadores lineares não tendenciosos. Por isso os estimadores de
MQO no modelo original não são os “melhores”, e sim os estimadores de MQO do modelo
transformado.
O MQG são os MQO aplicados a variáveis transformadas que satisfazem as premissas do
modelo clássico.
Para obter os estimadores de MQG, minimizamos e , obtendo-se: * 2
i
e sua variância é:
Var ˆ2*
i
3.3.2 Conseqüências
63
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
3.3.3 Detecção
- Método gráfico:
Faz-se um gráfico de dispersão entre Yˆ e ê . Se não for observado algum padrão
sistemático, então se pode assumir que não há heterocedasticidade:
Pode-se fazer também gráficos entre cada variável X e os resíduos. A maneira de concluir
sobre a heterocedasticidade é a mesma.
- Teste de Goldfeld-Quandt:
SQR2 / gl n c 2k n c 2k
Fcalc ~ F ; gl
SQR1 / gl 2 2
64
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Exemplo 3. Sejam as despesas de consumo (Y) e a renda (X) de 30 famílias. A análise desses dados
pelo Gretl forneceu os seguintes resultados:
20
15
10
5
resíduo
-5
-10
-15
-20
80 100 120 140 160 180 200 220 240 260
X
65
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
- Teste de Breusch-Pagan:
Exemplo 4. Sejam os dados de consumo e renda para as 30 famílias. Para fazer o teste de Breusch-
Pagan, ajustou-se o seguinte modelo:
eˆi2 1 2 X i ui
obtendo-se um R² de 0,17574. Conduza o teste de Breusch-Pagan para heterocedasticidade, a 5% de
significância.
O Gretl realiza o teste de Breusch-Pagan, com uma pequena modificação nos passos 2 e 3,
pois considera como variável independente eˆi2 dividido pela sua média (“escalada”). Os resultados
para o exemplo anterior são:
66
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
- Teste de White:
O teste de White pressupõe que as variâncias dos resíduos se relacionam funcionalmente aos
regressores, aos seus quadrados ou a seus produtos cruzados.
Seja o modelo de 3 variáveis: Yi 1 2 X 2i 3 X 3i ei .
O teste de White é conduzido do seguinte modo:
1. Com os dados pertinentes, estimar o modelo acima e obter os resíduos estimados, êi .
2. Calcular a seguinte regressão (auxiliar):
eˆi2 1 2 X 2i 3 X 3i 4 X 22i 5 X 32i 6 X 2i X 3i ui
Isto é, uma regressão dos quadrados dos resíduos da regressão original contra os regressores
X originais, seus quadrados e seus produtos cruzados. Para um modelo de k variáveis, é análogo.
3. Obter o R² da regressão anterior (que chamaremos de RW2 ), e calcular a estatística de teste
W nRW2 , onde n é o tamanho de amostra. Demonstra-se que W ~ gl2 assintoticamente, onde gl =
n° de regressores (excluindo o intercepto) da regressão auxiliar.
4. Se o valor de W gl2 ; , conclui-se que há heterocedasticidade. Caso contrário, não há
evidências de heterocedasticidade.
Exemplo 5. Sejam os dados de consumo e renda para as 30 famílias. Para fazer o teste de White,
ajustou-se o seguinte modelo:
eˆi2 1 2 X i 3 X i2 ui
obtendo-se um R² de 0,1777. Conduza o teste de White para heterocedasticidade, a 5% de
significância.
67
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
6000
4000
2000
resíduo
-2000
-4000
-6000
0 50000 100000 150000 200000 250000 300000
VENDAS
68
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Há duas abordagens para a correção: quando os i2 são conhecidos e quando não são.
Exemplo 6. Imagine que desejamos estudar a relação entre remuneração média por empregado (Y)
e o tamanho da empresa (X), medido através das classes de n° de empregados: 1 (1 a 4
empregados), ..., 9 (1000 a 2499 empregados).
Os dados estão abaixo:
Y X i Yi * Yi i X 0*i 1 i X i* X i i
3396 1 743,7 4,5664 0,0013 0,0013
3787 2 851,4 4,4480 0,0012 0,0023
4013 3 727,8 5,5139 0,0014 0,0041
4104 4 805,06 5,0978 0,0012 0,0050
4146 5 929,9 4,4585 0,0011 0,0054
4241 6 1080,6 3,9247 0,0009 0,0056
4387 7 1243,2 3,5288 0,0008 0,0056
4538 8 1307,7 3,4702 0,0008 0,0061
4834 9 1112,5 4,3452 0,0009 0,0081
Seja o modelo: Yi 1 2 X i ei :
Yi e 1
1 2 i 1 2 ui
Xi Xi Xi Xi
69
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
e 2 1
Assim, Var ui E i 2 E ei
Xi Xi
2 2
, ou seja, tem-se homocedasticidade.
Yi 1 ei 1
2 X i 1 2 X i ui
Xi Xi Xi Xi
e 2
Assim, Var ui E i
1
X i X i
E ei 2 2
.
Essa transformação só pode ser utilizada se os valores de X forem positivos. Observe que o
modelo transformado não tem intercepto. Para voltar ao modelo original, deve-se multiplicar por
X.
c) Em geral, ajustar um modelo log-log lnYi 1 2 ln X i ei ao invés das variáveis em suas
escalas originais, reduz a heterocedasticidade.
Exemplo 7: Voltando aos dados do Exercício 2, temos os seguintes resultados produzidos no Gretl
utilizando estimadores robustos:
70
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
3.4 Autocorrelação
Dito de forma simples, o modelo clássico pressupõe que o termo de erro relacionado a
qualquer das observações não é influenciado pelo termo de erro de qualquer outra observação.
Quando há autocorrelação, então:
E ei e j 0, i j
Há dois tipos de autocorrelação: no tempo (em dados de séries temporais) e no espaço (em
dados de corte transversal), embora ela seja mais comum no primeiro caso. Exemplos: observando-
se índices de preços de ações diariamente, não é raro verificar que esses índices sobem ou descem
por vários dias seguidos (autocorrelação no tempo); ao regredir despesas de consumo com renda das
famílias, o aumento de despesa de consumo de uma família pode levar a vizinha a aumentar o
consumo também, para não ficar para trás (autocorrelação no espaço).
Os gráficos abaixo apresentam alguns padrões plausíveis de presença e de ausência de
autocorrelação serial:
Além de ser classificada como no tempo e no espaço, a autocorrelação também pode ser
positiva ou negativa. A autocorrelação positiva se caracteriza quando os resíduos evoluem para
cima ou para baixo durante longos períodos, já na negativa, há oscilações constantes. Os gráficos a
seguir ilustram os dois processos.
71
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
O subscrito t está sendo usado para destacar que estamos lidando com séries temporais.
Para avançar, precisamos imaginar o mecanismo que gera et . Como ponto de partida,
podemos supor que o termo de erro seja gerado pelo seguinte mecanismo:
et et 1 ut , com 1 1 ,
ˆ 2
xt y t
xt2
Mas sua variância é:
Var ˆ2
2
1 2
x x t t 1
2 2
x x t t 2
2 n1
x1 xn
AR1 2 2 2
x
t x t x t xt2
Lembrando que, no modelo tradicional essa variância era:
2
Var ˆ2
xt2
Percebe-se que a primeira é igual a segunda multiplicada por um termo que depende de .
Obviamente, se 0 , as duas coincidem.
Imagine que continuamos a empregar o estimador de MQO, ̂ 2 , e que ajustamos a variância
habitual levando em conta o esquema AR(1). Quais são, agora, as propriedades de ̂ 2 ? Pode-se
demonstrar que ele ainda é linear e não tendencioso. Também é consistente e com distribuição
normal assintótica. Entretanto, ele não é mais o MELNT (não é eficiente), assim como na
heterocedasticidade.
Para encontrar o MELNT na presença de autocorrelação, devemos novamente recorrer ao
MQG. Continuando com o modelo de duas variáveis, e admitindo o processo AR(1), podemos
mostrar que o MELNT é dado pela expressão:
n
x x y y
t t 1 t t 1
ˆ2 MQG t 2
n
C
2
x x
t 2
t t 1
3.4.1 Conseqüências
3.4.2 Detecção
- Método gráfico:
1. Plotagem seqüencial no tempo: Faz-se um gráfico de dispersão com o tempo ou n° da
observação do eixo X e os resíduos no eixo Y. Se observar que os resíduos seguem algum padrão
não-aleatório, há indícios de autocorrelação.
2. Plotar et versus et 1 : Ou seja, os resíduos no período t contra seu valor em t-1. Se houver
autocorrelação, observaremos padrões como estes:
73
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
- O teste de Durbin-Watson:
Esse teste é muito popular e já está incorporado na maioria dos pacotes estatísticos, como o
SPSS. A estatística d de Durbin-Watson é definida por:
n
eˆ
t 2
t eˆt 1
2
d n
2
eˆ
t 1
t
eˆ eˆ
t 2
t t 1
Seja o estimador do coeficiente de autocorrelação: ̂ n
. Demonstra-se que:
eˆt2
t 1
74
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
Caso a estatística do teste seja encontrada em alguma das regiões de indecisão, pode-se
recorrer ao teste d modificado. Dado o nível de significância :
Exemplo 8. Têm-se dados relativos a índices de remuneração real por hora (Y) e produção por hora
(X), anualmente, no período de 1959 a 1998 nos EUA (n=40). A análise no Gretl forneceu:
Resíduos da regressão (= observados - ajustados Y) uhat1 versus uhat1_1 (com ajustamento por mínimos quadrados)
4 4
Y = 0,0438 + 0,914X
3 3
2 2
1 1
0
0
uhat1
resíduo
-1
-1
-2
-2
-3
-3
-4
-4
-5
-5
-6
-6 -5 -4 -3 -2 -1 0 1 2 3
1960 1965 1970 1975 1980 1985 1990 1995 uhat1_1
75
MAT02207 – Estatística Econômica – Prof. Vanessa Leotti
3. Se se tratar de autocorrelação pura, e ρ não for conhecido, deve-se usar técnicas de séries
temporais.
76