Texto Base

MODELOS ECONOMÉTRICOS
Francisco Gildemir Ferreira da Silva

UFC/CAEN
.
1. INTRODUÇÃO
Existem muitas técnicas para estimação de modelos lineares aplicáveis em transportes (ver
Wooldridge, 2010; Pindyck e Rubinfeld, 2004; e Washington, et al., 2011). Na
comunidade de transportes brasileira, notoriamente para o caso do congresso de
transportes da ANPET, a técnica de regressão simples e múltipla (daqui para frente com o
sinônimo de Mínimos Quadrados Ordinários – MMO) é utilizada largamente, talvez por
sua comodidade e praticidade, uma vez que a mesma encontra-se disponível em
praticamente todos os pacotes computacionais comercial e não comercial. Embora seja
fácil de calibrar, a técnica de MMO repousa sobre premissas que devem ser avaliadas com
esmero para a escolha coerente do modelo linear a utilizar, pois modelos para previsão
apresentam tolerâncias diferentes de modelos feitos para análise de comportamento de
usuários/consumidores e existem vários remédios para problemas como erros de medida,
omissão de variáveis, presença de correlação entre os resíduos entre outros.
No sentido de apresentar técnicas diferentes para modelar geração de viagem e tratar

problemas decorrentes do uso do MMQ, este trabalho faz um exercício metodológico de
estimação de diferentes modelos lineares. Os dados são de um corte transversal de... e são
feitos testes estatísticos apresentados na revisão da literatura para diagnósticas problemas
de homocedasticidade, variável omitida, correlação dos erros e endogeneidade. Para
correção dos problemas encontrados utiliza-se das técnicas de mínimos quadrados
ponderados, mínimos quadrados em dois estágios e váriáveis instrumentais, apresentando
suas vantagens e desvantagens. Finalmente, compara-se os resultados dos modelos e faz-se
uma digressão dos avanços que poderiam ser obtidos com a adoção das técnicas mais
modernas.
De forma objetiva, este artigo está dividido em uma revisão bibliográfica onde é feita uma
visita na técnica de MMQ com apresentação de suas hipóteses, dos problemas decorrentes
da quebra dessas hipóteses, dos testes para detectar essas falhas nas hipóteses e das
técnicas que podem ser adotadas para sanar os efeitos das inadequações do MMQ a
estimação de modelos lineares dos dados. Na sequência se apresenta a metodologia
utilizada neste artigo com as estimações dos modelos com as diferentes técnicas e
apresentação de um quadro comparativo dos resultados e das vantagens e desvantagens de
cada abordagem. Por fim, faz-se uma discussão e conclusão do trabalho.
2. REVISÃO DA LITERATURA
Neste item, faz-se a revisão da literatura de modelos lineares, apresentando testes de
aderência do modelo aos pressupostos do MMQ e de técnicas utilizadas para melhorar as
estimativas de um modelo linear que apresente problemas quanto as hipóteses necessárias
para o uso efetivo do modelo linear.
2.1 Mínimos Quadrados Ordinários e seus pressupostos
Seja a Equação 1, a técnica de MMQ ou Regressão Simples/Múltipla repousa sobre os

pressupostos 1 a 11 com Y : Variável observada (variável endógena ou dependente), X2i,
…., Xki: variáveis predeterminadas (variável exógenas ou explicativas), i: variável
aleatória não observada (variável estocástica), n é o número de observações.
Yi   1   2 X 2i  ....   k X ki   i , para i  1,...n (1)
1. Linearidade nos parâmetros (não necessariamente nas variáveis)

2. X não estocástico (constante em amostragens repetidas)
3. E (i| Xi) = 0 (média zero nos distúrbios)
4. E(i2|Xi) = σ2 (Homoscedasticidade)
5. cov (i, j | Xi, Xj) = 0 (erros não correlacionados)
6. cov (i ,Xi) = 0 (Covariância zero entre o erro e a variável explicativa i e Xi)
7. n > k (número de observações maior que o número de parâmetros)
8. var(X) > 0 (variabilidade nos valores de X)
9. Especificação correta (Forma funcional correta)
10. Multicolineridade não perfeita ou independência entre os Xs
11. i ~ N (0, σ2I)
Matricialmente a Equação (1) pode ser escrita conforme a Equação (2) e no processo de
minimizar o quadrado dos erros, feitas as manipulações necessárias se obtém a Equação
(3) para o vetor de s1.
Y   X   (2)
ˆ  ( X ´ X ) 1 X Ý (3)
O vetor de s possui propriedades elencadas abaixo e que fazem dele um ótimo estimador
de parâmetros, conhecido como um estimador BLUE – Best: estimador com menor
variância; Linear: melhor estimador entre os estimadores lineares; Unbiased: dado
amostragens repetidas média de s é igual aos s reais; e Estimates: estimador de
parâmetros populacionais. No geral, modelos de geração de viagem utilizam a estatística
R2 para avaliar a aderência do modelo estimado aos dados (Gasparini et.al., 2010; Pereira
e Oliveira, 2014; Silva e Waisman, 2007; Souza et. al, 2010; entre outros), conforme
Equação (4).
ˆ´ X Ý  n Y 2
R2  (4)
Y Ý  n Y 2
É fácil ver que ao aumentarmos a quantidade de variáveis (colunas na matriz X) pode

resultar em um R2 maior, logo comparar modelos com diferentes números de variáveis
tende a ser inadequado, devendo para tanto utilizar outra medida que corrige este
problema conforme Equação (5), conhecida como R2 ajustado. Também não é adequado
comparar modelos com formas funcionais diferentes, por exemplo com variáveis elevadas
ao quadrado ou logaritimizadas.
2 n 1
R  1 (1  R 2 ) (5)
nk
1
para o processo de minimização do quadrado dos erros matricialmente sugere-se a leitura do
livro do Pindyck e Rubenfeld (2004) páginas XXXXX
Além do R2 e o R2 ajustado, outras estatísticas devem ser utilizadas para avaliar o modelo,
pois podem haver erros de medida nos valores da matriz X, o erro encontrado pode
apresentar um comportamento inadequado, entre outras possibilidades que serão
detalhadas no próximo item.
2.2 Testando as propriedades dos estimadores além do R2

Ao quebrar de uma ou alguma das 11 hipóteses apresentadas acima geram problemas e
fazem do estimador da Equação (3) ser não BLUE. A hipótese 9 norteia todo o processo
de modelagem, pois se faz necessário bem delimitar as variáveis que explicam o fenômeno
e se a relação entre as variáveis explicativas e a dependente é ou não linear nos
parâmetros, ou seja, posso ter variáveis logaritimizadas, quadráticas cúbicas, etc., contanto
que meus parâmetros não tenham relações quadráticas, logarítmicas, etc. entre eles. Da
hipótese 11, i ser normal multivariado i ~ N(0, σ2I), tem-se a Equação (6) (combinação
da Equação (3) com a Equação (2)) que é linear com o erro e que gera um ̂ ~ N( ̂ ,σ2I
[(ˆ   )´ X ´ X ( ˆ   )] / k
(X’X)-1), desta distribuição, tem-se que F  ~ F( k , n  k )
S e2
ˆ  ( X ´ X ) 1 X Ý    ( X ´ X ) 1 X ´ (6)
Pode-se testar se H 0 :  i   i* H 1 :  i   i* , utilizando o fato de

( ˆ   i )
*
T i ~ t ( n k ) e testar o modelo completo H 0 :    0 H 1 :    0 , com o
S e aii
[(ˆ   )´ X ´ X ( ˆ   )] / k
vetor de s seguindo a distribuição F  ~ F( k , n  k ) .
S e2
Estes testes são clássicos e partem da hipótese 11, logo é muito importante para garantir a
propriedade do estimador ser BLUE que i ~ N(0, σ2I), caso não o siga, então os
estimadores não serão BLUE e os testes acima serão inadequados para verificar se o
modelo é relevante estatisticamente para o objetivo do analista. Não obstante o acima
apresentado, pode haver uma relação entre os s do vetor de s, assim, pode-se testar
H 0 : R  r frente a H 0 : R  r , nesta situação a Restrição apontada frente vetor de s
{( Rˆ  r )´[R ( X ´ X ) 1 R´]1 ( Rˆ  r )} / q
segue uma distribuição F  ~ F( q ,n  k ) . Tal teste é
eé /(n  k )
pouco aplicado em estudos de transportes no Brasil Da Silva et.al. (2011) utiliza este teste
para avaliar retornos de escala em funções de produção pré aplicação de uma modelagem
não paramétrica para medição de eficiência de portos.
A hipótese 10 exige que não haja forte correlação entre as variáveis independentes, além
disso, importante é medir quão relacionado é a variável dependente com as variáveis
independentes, elimina, assim, os efeitos das outras variáveis no modelo que são carreadas
nos erros e que podem resultar na quebra das hipóteses 3 a 6, além de fazer com que a
variável Y não seja exógena, surgindo o problema de endogeneidade que será explicado na
próxima seção.
As hipóteses do modelo clássico são restritivas, podendo incorrer em problemas
proveniente dos dados. Os problemas devem ser tratados de tal sorte que se mantenha ás
hipóteses do modelo clássico atendidas. Na impossibilidade de manutenção do modelo
clássico, deve-se apelar para outra estrutura de modelo, o que poderá incorrer na utilização
de outro método de estimação. A quebra das hipóteses do MMQ geram os seguintes
problemas de: Multicolinearidade; Heterocedasticidade; Erros normais IID; Erros de
Medida; Endogeneidade e Autocorrelação Serial que podem ser tratados com modelos ou
procedimentos que minimizem os efeitos conforme explicado na próxima seção.
2.3 Consequências da quebra dos pressupostos
O problema o de multicolineariedade ocorre se alguma coluna da matriz X é uma

combinação linear das outras, isto resulta em Posto( X ´ X )  K , logo não é possível
estimar o vetor completo de s, entretanto, como não existe colinearidade perfeita, mas
correlações altas, isto implicaria estimadores pouco precisos, ou seja o B do BLUE não
seria adequado, pois suas variâncias seriam elevadas. Neste problema, o teste t falha, mas
o teste F indica que o modelo é bom. Para diagnosticar o problema, ao examinar a matriz
de correlação das variáveis explicativas se encontra o i-ésimo elemento da diagonal
principal da matriz e adota ele é o fator de inflação da variância (FIV) do coeficiente da
variável Xi, conforme Equação (7).
1
tii  FIV ( X i )   10 (7)
1  Ri2
Alternativamente, pode-se apelar para o teste de Teste de Farrar Glauber que mede a
ortogonalidade das variáveis ou o calcular o Índice de condicionamento para diagnosticar
este problema. Para mitigar a multicolinearidade pode-se adotar dois procedimentos:
eliminar ou excluir variáveis do modelo, elegendo os que tem FIV > 10; utilizar
informações externas aos dados de maneira que se quebre o problema de
multicolinearidade ( “problema de amostra pequena”); utilizar restrições lineares para os
coeficientes; utilizar um modelo de componentes principais; utilizar um modelo
multiequação; ou estimar os coeficientes utilizando um método exploratório que consiste
em utilizar una modificação da matriz (X´X), tipo ( X ´ X )   I .
A Heterocedasticidade é característica pelo erro não possuir variância constante,

acarretando que o resíduo da regressão em relação à variável dependente ou independente
tem forma de funil ou uma forma não definida, tal como apresentado na Figura 01.
Figura 01: Estrutura de resíduos com Heterocedasticidade e homocedasticidade
Fonte: Fahrmeir et.al. (2013)
Como consequência da heterocedasticidade, os s são não viesados, mas não são BLUE,
pois a variância não é mínima, logo não eficiente. De qualquer forma, o parâmetro é
consistente, os estimadores de variância não são assintoticamente eficiente e são viesados,
o que gera os intervalos de confiança inválidos, pois se Yi for positivamente
correlacionado com i, então, conforme Equação (6) o viés será negativo, logo as
estatísticas t serão altas valendo a negativa para viés positivos, ou seja as estatísticas t's
serão pequenas nesse caso. Podem surgir três tipos de heterocedasticidade: Aditiva;
Multiplicativa; ARCH (Autoregressive conditional heteroskedastic) – um problema de
séries temporais. As causas da heterocedasticidade são: causas: Mal especificação do
modelo – omissão de variáveis ou forma funcional imprópria; processo de aprendizagem
durante o tempo; mudanças nos dados ou na definição dos dados; valores extremos ou
pontos de quebra no modelo. Para se avaliar a existência de heterocedasticidade, pode-se
apelar para análise gráfica, procurando um padrão semelhante ao da Figura 01a, ou então
aplicar o teste de Park, fazendo uma regressão (MMQ), tal como na Equação (8), onde se
testa a significância estatística de B, em sendo estatísticamente significante, então a
heterocedasticidade é um problema.
ln uˆ i2    B ln X i  vi (8)
Existem testes derivados do teste de Park, por exemplo: o teste de Glejser que utiliza o
valor absoluto dos resíduos e várias transformações dos X’s. E testes procedimentais como
o teste de Goldfeld-Quandt que segue do seguinte algoritmo: ordene os n casos por X que
você acha correlacionado com i2; retire uma subamostra do centro (~1/5); regrida para as
amostras das subamostras acima e abaixo da subamostra retirada; faça o teste F para a
diferença entre a variância dos erros F tem (n - c - 2k)/2 graus de liberdade. Restando
dúvida, podem ser executadas os testes Breusch-Pagan-Godfrey ou o teste de White
Generalizado que exigem um pouco mais de esforço computacional. Todos estes testes
podem ser vistos com mais detalhe em Wooldridge (2010). Para solucionar o problema de
Heterocedasticidade, sugere-se uma das seguintes alternativas: estimar por Mínimos
Quadrados Generalizado – GLS; ou Mínimos Quadrados Ponderados; ou Mínimos
Quadrados Ponderados Interativo; ou estimar via Correção padrão de erros de White.
Caso ocorram erros que não sejam IID - Independentemente Identicamente Distribuídos,
então há Autocorrelação, ou seja, existe a presença de uma correlação padrão entre os
erros adjacentes. Se o resíduo é negativo, então seu sucessor ou predecessor tende a ser
negativo também e vice-versa. Ocorre geralmente entre observações adjacentes, mas
podendo incorporar diferentes defasagens ou sazonalidades. A Autocorrelação é,
geralmente, função do tempo, em transporte ver a aplicação de correção de autocorrelação
em estimativas em painel feitas por Silva (2016). Mas pode ocorrer em outras dimensões,
destacando-se a geográfica, para o caso de autocorrelação geográfica Fotheringham, et. al.
(2002) apresenta formalmente como utilizar o modelo e várias aplicações em transportes no
Brasil do uso de modelos para correção da autocorrelação geográfica são apresentados por
Loureiro et. al. (2006), Silva (2006) e Carvalho et. al. (2006). A hipótese 5 é quebrada, logo
cov (i, j | Xi, Xj) ≠ 0. Classificam-se a autocorrelação pela relação que se mantêm com o
erro vizinho: se a relação se dá entre resíduos vizinhos, então se tem a autocorrelação de
primeira ordem; podendo ocorrer de segunda, terceira, etc., conforme se distancie do
vizinho. Ao quebrar a hipótese 5 obtém-se coeficientes são não viesados, mas não BLUE,
pois as variâncias são baixas e os testes de hipótese (t’s e F) não são confiáveis, uma vez
que os s, conforme a Equação (6) possuem uma relação determinada pela presença do i
no viés. A autocorrelação serial pode ser decorrente de: erro de especificação (variáveis
omitidas); forma funcional errada; efeitos retardados; transformação de dados
(interpolação de dados faltantes e diferenças). Para diagnosticar esse problema devem-se
observar os resíduos no gráfico, verificação de sinais (teste de Geary) e teste de Durbin-
Watson – d, conforme Equação (9)
t n
 uˆ  uˆt 1 
2
t
d t 2 (9)
t n
 uˆ
t 2
2
t
Procedimento do Teste é: Se d < dL, rejeita a H0: que é a presença de autocorrelação de

primeira ordem; Se d > dU , então não rejeita; Se dL < d < dU, então é inconclusivo.
Onde dL e dU são limites inferior e superior do teste tabelados em livros como o Pindyck
e Rubenfeld (2004) e Washington et. al (2011). Além do teste de Durbin-Watson, podem
ser utilizados os testes de Durbin – h, Ljung-Box - Q, Portmanteau e ou Breusch-Godfrey
para retirar a dúvida da inconclusividade apresentada no teste de Durbin-Watson. Para
solucionar o problema, recomenda-se o uso das seguintes técnicas: Método dos Mínimos
Quadrados Generalizados, primeiras diferenças, Diferenças generalizadas e/ou Cochran-
Orcutt.
Notoriamente, todo modelo é mal especificado. Contudo, um modelo deve ser bom,
confiável para explicar o que estamos estudando e ter fundamento teórico. Existem quatro
tipos de más especificações: forma funcional; inclusão de variáveis irrelevantes; exclusão
de variáveis relevantes; erros de medida nas variáveis; e mal especificação do termo erro.
Se há uma variável omitida e está é correlacionada com uma variável incluída, então
teremos estimadores viesados, inconsistentes, a variância do erro é incorreta e usualmente
superestimada. Por outro lado, se não ha correlação entre a variável omitida e a variável
inclusa, o erro continua viesado, mas os parâmetros não. Ou então, se a forma funcional é
incorreta, então pode ocorrer autocorrelação ou heterocedasticidade. O modelador deve se
questionar: Há algo omitido? Há algo irrelevantemente incluso?; Há variável não
mensurável?; e/ou Há não lineariedade?. As formas funcionais lineares ou linearizadas
mais utilizadas são apresentadas na Tabela 1.
Tabela 1: Formas Funcionais Lineares comumente utilizadas.

Forma original Forma linearizada Observações Elasticidade
Linear Y = b0 + b1 X Y = b0 + b1 X b1 X/Y
Log-log ou Cobb Douglas ou Potência Y = b0 X b1 ln(Y) = B 0 + b1 B 0 = ln(b0) b1
ln(X)
Log-linear ou Exponencial Y = b0 b1 X ln(Y) = B 0 + B 0 = ln(b0) b1 X
B1*X
B 1 = ln(b1)
Linear-log ou Semi-log ou Logaritmo-X Y = b0 + b1 ln(X) b1 1/Y
Log-inverso ln(Y) = b0 + b1 b1 1/X

1/X
Inverso ou Recíproco-X (hipérbole) Y = b0 + b1 Y = b0 + b1 W W = 1/X
1/X
Recíproco-Y 1/Y = b0 + b1 Z = b0 + b1 X Z = 1/Y
X
Recíproco-dupla 1/Y = b0 + b1 Z = b0 + b1 W W = 1/X;
1/X Z= 1/Y
Quadrática Y = b0 + b1 Y = b0 + b1 X1 + W = X22
X1 + b2 X22 b2 W
Fonte: adaptado pelos autores.
Para diagnosticar a má especificação o analista deve testar a especificação, recorrendo a

testes de restrição, explicado na Seção 2.2, fazer testes de autocorrelação dos resíduos,
conforme acima explicado ou então avaliar critérios de defasagens que devem ser
minimizados para indicar uma especificação de modelo melhor, como: Critério de
Schwartz, AIC (Critério de Informação de Akaike). Ambos são função do tamanho da
amostra e do número de parâmetros. Para solucionar más especificações pode-se utilizar:
Theory Trimming (McPherson, 1976), Hendry and the LSE school of top-down modeling
(Hendry, 2000); Nested Models (Rigdon, 1999); Stepwise Regression (Flom e Cassell,
2007).
Vale nota o fato de Stepwise Regression ser utilizado em estimações de transporte para
especificações de formas funcionais ou variáveis a inserir, entretanto o método apresenta:
modelos completamente “ateóricos”; modelos sujeitos a correlações espúrias; processo
computacional sobrepõe ao científico, dentre outros. Portanto, faz-se necessário utilizá-lo
com parcimônia. Há a possibilidade de erros de medida das variáveis, decorrentes de má
digitação, de métricas más estipuladas, entre outras. Se o erro de medida é aleatório, os
estimadores são não viesados, mas os resultados são fracos. Se as medidas forem viesadas,
os resultados serão viesados, sendo a solução para tal problema a utilização de dados em
painel.
2.4 Técnicas alternativas ao MMQ para mitigar problemas de quebra das hipóteses
Muitas técnicas alternativas ao MMQ podem ser utilizadas para mitigar os problemas
apresentados na seção 2.3. tipo: Variáveis Instrumental - VI; Método Generalizado dos
Momentos - MMG; Máxima verossimilhança - MV; Mínimos Quadrados Generalizados –
MQG; e Mínimos Quadrados Ponderados - MQP.
A técnica de VI é utilizada quando a hipótese 3 E (i| Xi) = 0 é quebrada. De forma

simplificada, Quando temos certeza de que os coeficientes calibrados da Equação (1) não
estão correlacionados com os erros podemos aplicar o método convencional de OLS, mas
caso tenhamos motivos para acreditar que um ou mais destes coeficientes sejam
endógenos (tenham correlação não nula com termo de erro da equação) temos que aplicar
VI, mas pode acontecer que os resíduos do modelo não sejam homocedásticos, logo, tem-
se que aplicar o VI articulado com o MMG que será explicado adiante. O método de
MMG foi apresentado por Hansen (1982) com base em Karl Pearson que desenvolveu o
método dos momentos em 1895 e Neyman e Egon (1928) apud Hayashi (2000). De forma
simplificada, estimações em MMG seguem os seguintes passos:
1. Estimar uma equação usando IV.

2. Calcule os resíduos û. Use estes resíduos para calcular a matriz de ponderação
ótima conforme Equação (10) e Equação (11)
1
Wˆ  Sˆ 1  ( ( Z ' Z ) 1 ) (10)
n
uˆ12 . . . 0 
 2 
 . uˆ 2 . . . 
 . . . . .  (11)
 
 . . . . . 
0 . . . uˆ n2 

3. Calcule o estimador MMG eficiente MMG e sua matriz de variância-covariância

usando a matriz de ponderação ótima estimada, conforme Equação (12).
ˆ MMG  ( X ' ZS 1 Z ' X ) X ' ZS 1 Z ' Z ' y ) (12)
Na presença de heterocedasticidade o estimador VI é ineficiente, mas consistente,

enquanto a matriz padrão estimada de covariância é inconsistente. A vantagem do MMG
sobre VI é clara: se a heterocedasticidade está presente, o estimador MMG é mais eficiente
que o estimador simples VI, enquanto que se não existe heterocedasticidade o estimador
MMG não é pior assintoticamente que o estimador VI. No entanto, o uso do MMG tem
um preço. A matriz de ponderação ótima é uma função dos quartos momentos e a
obtenção de uma estimativa razoável para estes requer amostras muito grandes. Se o erro é
homocedástico, VI é preferível ao MMG eficiente. O Método de MV é largamente
aplicado para estimações de modelos não lineares, tal como modelos logit e probit. Em
modelos lineares, o uso de MV não gera ganhos significativos frente a computação
exigida. Por tal, não trataremos deste processo de estimação aqui. O Método Bayesiano
tem apelo semelhante, embora utilizado em transportes recentemente para a estimação de
matrizes OD sintéticas (Oliveira Neto et. al., 2016 e Pitombeira Neto et. al., 2016), para
modelos lineares não há grande ganho frente a computação envolvida.
A técnica do MQG e MQP, aceitam de forma mais geral ou específica, respectivamente, a

hipótese de covariação, ou seja: y~ N(,C) onde C é uma matriz de variância e covariância
positiva definida; y=X+u onde u é um vetor de erros aleatórios com média 0 e variância e
covariância C; Assim, o estimador de MQG e MQP vão assumir as estruturas da Equação
(13) com variância de acordo com a Equação (14). E a escolha do modelo se faz pelo A
escolha entre dois modelos se faz pelo critério de informação de Akaike - AIC
ˆ MQG  ( XC 1 X ' ) 1 X ' C 1 y (13)
V ( ˆ MQG )  ( X ' C 1 X ' ) 1 (14)
Logo o MQG e MQP apresentam uma estrutura de covariância, assumida ou ad hoc ou

com base no conhecimento do analista que serve para corrigir, principalmente problemas
no i e na matriz de variância e covariância, reduzindo o viés de estimação e melhorando a
eficiência no modelo.
REFERÊNCIAS
Carvalho, Luís Eduardo Ximenes; Silva, Henrique Nogueira; Loureiro, C. F. G. ; Meneses,
Hamifrancy Brito. Regressão linear geograficamente ponderada em ambiente SIG.
Transportes (Rio de Janeiro), v. 14, p. 18-26, 2006.
DaSILVA, F. G. F.. (2012) Resenha do Livro Statistical and Econometric Methods for
Transportation Data Analysis por Simon P. Washington, Fred l. Mannering , Matthew G.
Karlaftis .. Revista ANTT, v. 4, p. 20-40.
DaSILVA, F. G. F.; MARTINS, Francisco Giusepe Donato; ARAUJO, Carlos Eduardo
Freire ; ROCHA, C. H. (2011) Análise Exploratória da Eficiência Produtiva dos Portos
Brasileiros. Transportes, v. 19, p. 6-12.
Fahrmeir L., Kneib T., Lang S., Marx B. (2013) The Classical Linear Model. In:
Regression. Springer, Berlin, Heidelberg
Flom, P. L. and Cassell, D. L. (2007) "Stopping stepwise: Why stepwise and similar
selection methods are bad, and what you should use," NESUG 2007.
Fotheringham, A. S., Brunsdon, C., & Charlton, M (2002). Geographically weighted
Regression: the analysis of spatially varying relationships . Chichester: John Wiley &
Sons
Hansen, Lars Peter. (1982) Large Sample Properties of Generalized Method of Moments
Estimators. Econometrica 50, no. 4: 1029-054. doi:10.2307/1912775.
HAYASHI, Fumio. Econometrics. Princeton University Press. 2000. ISBN 978-0-691-
01018-2. Capítulo 3.
Hendry, D. F. (2000) Epilogue: The Success of General-to-specific Model Selection,
Chapter20 in D.F.Hendry(ed.) Econometrics: Alchemy or Science? Essays in Econometric
Methodology, Oxford University Press, Oxford, New Edition, 467— 490.
Loureiro, C.F.G.; Silva H. N.; Carvalho, L. E. X. (2006) Metodologia de análise de regressão
geograficamente ponderada aplicada ao fenômeno das viagens intermunicipais. Anais do XX
Congresso de Pesquisa e Ensino em Transportes. ANPET - Associação Nacional de Pesquisa e
Ensino em Transportes, Brasília, DF, 479-491.
OLIVEIRA NETO, Francisco Moraes ; PITOMBEIRA NETO, A. R. ; LOUREIRO, C. F.

G. ; BERTONCINI, B. V. . (2016) Discussão conceitual sobre métodos de reconstrução de
matrizes origem-destino estáticas em redes de transportes. TRANSPORTES (RIO DE
JANEIRO), v. 24, p. 107-119,
McPherson, J.Miller .(1976) Theory Trimming, Social Science Research, Volume 5, Issue
2, Pages 95-105, ISSN 0049-089X, https://doi.org/10.1016/0049-089X(76)90006-5.
(http://www.sciencedirect.com/science/article/pii/0049089X76900065)
Pindyck, Robert S; Rubinfeld, Daniel L. (2004) Econometria: modelos e previsões. Rio de
Janeiro: Elsevier, 726 p. ISBN 8525213430
PITOMBEIRA NETO, A. R. ; LOUREIRO, C. F. G. ; OLIVEIRA NETO, Francisco
Moraes . (2017) Statistical models for the estimation of the origin-destination matrix from
traffic counts. TRANSPORTES (RIO DE JANEIRO), v. 25, p. 1-13, 2017.
Rigdon, E.E. (1999). Using the Friedman method of ranks for model comparison in
structural equation modeling. Structural equation modeling, 6(3), 219-232
Silva, A.R. (2006) Avaliação de modelos de regressão espacial para análise de cenários do
transporte rodoviário de carga. Dissertação de Mestrado. Faculdade de Tecnologia,
Universidade de Brasília, DF, 122p.
Silva, M. C. ; Fernandes, e. ; Balassiano, R. ; Santos, M. P. S. . (2016) Modelo para o
fluxo aéreo de carga transportada entre as cidades brasileiras: abordagem com dados em
painel. In: XXX ANPET, Rio de Janeiro. XXX ANPET. Rio de Janeiro: ANPET,. v. 1. p.
1-12.
Souza, C. D. R., S. D. Silva e M. A. D’Agosto (2010) Modelos de geração de viagens para
pólos geradores de viagens de carga. Transportes, v. 18, n. 1, 46-57. doi:
http://dx.doi.org/10.14295/transportes.v18i.396
Washington, Simon P., Karlaftis, Matthew G., and Mannering, Fred. L. (2011) Statistical
and Econometric Methods for Transportation Data Analysis, 2nd ed. Boca Raton,
London & New York: CRC Press, ISBN 9781420082869.
Wooldridge, Jeffrey M. (2010) Econometric Analysis of Cross Section and Panel Data. 2.
ed. Cambridge, Mass.: MIT Press, 1064 p. ISBN 9780262232586.

Texto Base

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Texto Base

Enviado por

Direitos autorais:

Formatos disponíveis

MODELOS ECONOMÉTRICOS

Francisco Gildemir Ferreira da Silva

No sentido de apresentar técnicas diferentes para modelar geração de viagem e tratar

2.1 Mínimos Quadrados Ordinários e seus pressupostos

Seja a Equação 1, a técnica de MMQ ou Regressão Simples/Múltipla repousa sobre os

Yi   1   2 X 2i  ....   k X ki   i , para i  1,...n (1)

1. Linearidade nos parâmetros (não necessariamente nas variáveis)

É fácil ver que ao aumentarmos a quantidade de variáveis (colunas na matriz X) pode

2.2 Testando as propriedades dos estimadores além do R2

Pode-se testar se H 0 :  i   i* H 1 :  i   i* , utilizando o fato de

2.3 Consequências da quebra dos pressupostos

O problema o de multicolineariedade ocorre se alguma coluna da matriz X é uma

A Heterocedasticidade é característica pelo erro não possuir variância constante,

Procedimento do Teste é: Se d < dL, rejeita a H0: que é a presença de autocorrelação de

Tabela 1: Formas Funcionais Lineares comumente utilizadas.

Log-inverso ln(Y) = b0 + b1 b1 1/X

Fonte: adaptado pelos autores.

Para diagnosticar a má especificação o analista deve testar a especificação, recorrendo a

A técnica de VI é utilizada quando a hipótese 3 E (i| Xi) = 0 é quebrada. De forma

1. Estimar uma equação usando IV.

3. Calcule o estimador MMG eficiente MMG e sua matriz de variância-covariância

ˆ MMG  ( X ' ZS 1 Z ' X ) X ' ZS 1 Z ' Z ' y ) (12)

Na presença de heterocedasticidade o estimador VI é ineficiente, mas consistente,

A técnica do MQG e MQP, aceitam de forma mais geral ou específica, respectivamente, a

ˆ MQG  ( XC 1 X ' ) 1 X ' C 1 y (13)

V ( ˆ MQG )  ( X ' C 1 X ' ) 1 (14)

Logo o MQG e MQP apresentam uma estrutura de covariância, assumida ou ad hoc ou

OLIVEIRA NETO, Francisco Moraes ; PITOMBEIRA NETO, A. R. ; LOUREIRO, C. F.

Você também pode gostar