Você está na página 1de 4

8.

1 Imagine que você deseja estudar o comportamento das vendas de um produto, por exemplo,
automóveis, ao longo de alguns anos e suponha que alguém lhe sugira testar os seguintes modelos:
Y t =β 0 + β 1 t e Y t =α 0 + α 1 t +α 2 t 2 em que Y t = vendas no ano e t= tempo, medido em anos. O primeiro
modelo postula que as vendas são uma função linear do tempo, enquanto o segundo considera que sejam
uma função quadrática do tempo.
a. Discuta as propriedades desses modelos (a) No primeiro modelo, em que vendas é uma função linear
de tempo, foi postulado que a taxa de mudança daquela (dY/dt) é constante e igual a β1, qualquer que seja
o tempo t. No segundo modelo, a taxa de mudança não é constante porque (dY/dt) = α1 + 2 α2t, que
depende de t.
b.Como você decidiria entre os dois modelos?O mais simples é representar Y em relação ao tempo. Se o
gráfico resultante ficar parecido com uma parábola, talvez o modelo quadrático seja adequado.
c. Em que situações o modelo quadrático seria útil? Esse modelo pode ser apropriado para descrever o
perfil dos ganhos de um indivíduo. Tipicamente, quando se entra no mercado de trabalho, os ganhos
iniciais são baixos. Aumentam em seguida devido à experiência acumulada com o tempo, mas começam a
diminuir depois de certa idade.
d. Procure dados sobre as vendas de automóveis nos Estados Unidos nos últimos 20 anos e verifique qual
dos modelos ajusta-se melhor aos dados. sites de fabricantes de automóveis, revistas especializadas como
a Motor Magazine ou associações como a American Automobile Association para encontrar os dados
relativos à venda de automóveis nos Estados Unidos nos últimos 20 anos.
β β
8.5 Considere a função de produção Cobb-Douglas Y = β1 L K em que Y D produto, L D insumo trabalho
2 3

β β + β −1
e K D insumo capital. Dividindo (1) por K, obtemos: (Y/K)= β 1 ( L/ K) K 2 2 3
Tomando o logaritmo natural
de (2) e acrescentando o termo de erro, obtemos: ln(Y/K)= β 0 β 2 ln ⁡( L/K )+¿ em que β0 D ln β1
a. Imagine que você tenha os dados para calcular a regressão (3). Como testaria a hipótese de retornos
constantes de escala, isto é, (β2+β3)= 1? (a) Seja β* = ( B2 + B3 – 1) o coeficiente de log K. Teste a hipótese
nula de que β* = 0 com o teste t habitual. Se houver mesmo retornos de escala constantes, o valor t será
pequeno.
b. Se os retornos de escala forem constantes, como você interpretará a regressão (3)? (b) Se definirmos que
a relação produção/capital, medida da produtividade do capital, é (Y/K), e que a relação
mão-de-obra/capital é (L/K), o coeficiente angular dessa regressão dará a variação média percentual da
produtividade do capital para um percentual de variação da relação mão-de-obra/capital.
c. Faz diferença dividir (1) por L no lugar de K? (c) Embora a análise seja simétrica, se assumirmos que há
retornos de escala constantes, então o coeficiente angular dará a variação média percentual da
produtividade da mão-de-obra (Y/L) para um percentual de variação da relação capital/mão-de-obra (K/L).
O que distingue os países desenvolvidos daqueles em desenvolvimento é a elevada relação capital/mão-de-
obra existente nas economias dos primeiros.
8.11 Com base no que dissemos sobre o uso dos testes t e F para testar hipóteses, individual e
conjuntamente, quais das seguintes situações seriam possíveis?
1. Rejeição da hipótese nula com base na estatística F, sem, contudo, rejeitar cada hipótese nula isolada
com base no teste t individual. Improvável, a não ser para o caso de colinearidade muito alta.
2. Rejeitar a hipótese nula conjunta com base na estatística F, rejeitar uma hipótese individual com base no
teste t e não rejeitar as demais hipóteses individuais com base no mesmo teste t. Provável. Casos como
esse ocorrem freqüentemente no trabalho prático.
3. Rejeitar a hipótese nula conjunta com base na estatística F, rejeitar uma das hipóteses individuais com
base nos testes t individuais. Provável. Essa seria, em verdade, uma situação ideal.
4. Não rejeitar a hipótese nula conjunta com base na estatística F, rejeitar uma das hipóteses nulas
individuais com base nos testes t Provável. O modelo de regressão é inútil nessa situação.
5. Não rejeitar a hipótese nula conjunta com base na estatística F, rejeitar uma das hipóteses individuais
com base no teste t e não rejeitar as demais com base no mesmo teste Provavel, poderia ocorrer no caso
de a significância de um coeficiente ser insuficiente para compensar a insignificância do outro1.
6. Não rejeitar a hipótese nula conjunta com base na estatística F, mas rejeitar todas as hipóteses nulas
individuais com base nos testes t Improvável.
9.5 Considere o seguinte modelo:Y i=α i +α 2 Di + β X i +ui em que Y= salário anual de um professor
universitário X= anos de experiência de ensino D= variável dummy para gênero Considere três maneiras
de definir a variável dummy: a. D= 1 para homens, 0 para mulheres b. D=1 para mulheres, 2 para
homens. c. D= 1 para mulheres, -1 para homensInterprete o modelo de regressão anterior para cada
definição de variável dummy. Um método é preferível a outro? Justifique sua resposta (a) Homens: E(Y i
)=(α 1 +α 2)+ βX i . Mulheres: E(Y i)= α 1 + βX i. Mantendo X constante, o salário médio dos homens é diferente
por α2 .
(b) Homens: E(Yi)=(α1 +2α2)+βXi. Mulheres: E(Yi)=(α1 +α2)+βXi. Mantendo X constante, o salário médio
dos homens também neste caso é diferente por α2 .
(c) Homens: E(Yi)=(α1 −α2)+βXi . Mulheres: E(Yi)=(α1 +α2)+βXi . Mantendo X constante, a diferença entre o
salário médio das mulheres e dos homens é 2α2 . Como a escala da variável binária é arbitrária, a escolha
não afetará a resposta, pois nenhum método apresenta vantagens sobre o outro.
9.6 Retome a regressão (9.7.3). Como seria possível testar a hipótese de que os coeficientes de D2 e D3
são iguais? E que os coeficientes de D2 e D4 são iguais? Se o coeficiente de D3 for estatisticamente
diferente daquele de D2 e o coeficiente de D4 for diferente de D2, isso significa que os coeficientes de D3
e D4 também são diferentes? Dica: var (A± B)= VAR (A)+ var (B) ± 2 cov (A, B) Conforme o Capítulo 8,
( β 2−β 3)−(β 2−β 3)
podemos usar o seguinte teste t: t = Mas sob a hipótese nula de que β2 = β3 , o
ep(β 2−β 3)
segundo termo do numerador dessa equação passa a ser zero. Repare também que ep(β2 − β3 ) =
√[var (β 2)+var (β 3)−2 cov ( β 2 , β 3)]. Pode-se mostrar, para o nosso exemplo,que ep(β2 −β3)=84,8392.
245 ,3750−347 , 6250
Portanto, a estatística anterior torna-se t = = −1, 2055 , valor que não é significativo e
84,8392
leva à conclusão de que os coeficientes de D2 e D3, embora sejam ambos em termos estatísticos
significativamente diferentes do intercepto do primeiro trimestre, não o são um do outro.
Exatamente pelas mesmas razões, para testar a hipótese de que os coeficientes de D2 e D4 são iguais,
245 ,3750−(−62,1250)
obtemos t = = 3, 6245 , valor estatisticamente significativo, indicando que os
84 , 8392
coeficientes de D2 e D4 são diferentes.
A resposta à última parte da pergunta é, em geral, não. Em termos lógicos, se A for diferente de B e
também for diferente de C, isso não implica necessariamente que B e C sejam diferentes. Pode-se, é claro,
aplicar o teste t para responder a essa pergunta numericamente.
9.8 Em seu estudo sobre horas de trabalho gastas pela FDIC (Federal Deposit Insurance Corporation) em
91 auditorias bancárias, R. J. Miller estimou as seguintes funções: em que Y= horas trabalhadas pelos
auditores da FDIC X1=ativos totais do banco X2=número total de agências do banco X3=razão de
empréstimos duvidosos em relação ao total dos empréstimos concedidos pelo banco D1=1 se a
administração do banco foi classificada como “ótima” D2=1 se a administração do banco foi classificada
como “boa” D3=1 se a administração do banco foi classificada como “satisfatória” D4=1 se o exame foi
conduzido em conjunto com órgão estadual Os dados entre parênteses são os erros padrão estimados. a.
Interprete esses resultados (a) Desprezando por enquanto as variáveis binárias, cada coeficiente angular
estimado representa uma elasticidade, pois essa regressão é duplo-log. Então, mantendoX1 eX3 constante
se X2 (número total de agências do banco) subir em média 1%, as horas trabalhadas pelos auditores do
FDIC sobem cerca de 0,22%, refletindo talvez alguma economia de escala. Deve-se interpretar da mesma
forma os outros coeficientes das variáveis X logarítmicas que, a priori, espera-se que sejam positivos, e são
mesmo (X1=0,37% , X3=0,08%)
b. Há algum problema em interpretar as variáveis binárias neste modelo uma vez que Y está em forma
logarítmica? c. Como você interpretaria os coeficientes binários? (b) & (c) Como o regressando está em
forma logarítmica, temos de interpretar os coeficientes das variáveis binárias de acordo com a sugestão de
Halvorsen e Palmquist. Dado o coeficiente de D4, que é –0,2572. Tirando seu antilogaritmo (Shift,Ln),
achamos 0,7732; subtraindo-lhe um e multiplicando o resultado por 100, obteremos -22,68%. Então, se a
auditoria for realizada em conjunto com o órgão estadual competente, as horas trabalhadas pelos
auditores da FDIC caem cerca de 23%. Deve-se interpretar da mesma forma os outros coeficientes das
variáveis binárias.D1=-16%(caem) D2=32% (aumentam) D3=76% (aumentam)
10.12 Informe, justificando, se as seguintes afirmações são verdadeiras, falsas ou incertas:
a. Apesar da multicolinearidade perfeita, os estimadores de MQO são os melhores estimadores lineares
não viesados. Falsa.Se existir relação linear exata entre variáveis, não poderemos sequer estimar os
coeficientes ou seus erros-padrão.
(b) Em casos de alta multicolinearidade, não é possível avaliar o significado individual de um ou mais
coeficientes parciais de regressão Falsa. Deve-se conseguir obter um ou mais valores t significativos.
(c) Se uma regressão auxiliar mostra que determinado R2 i é alto, há evidências incontestáveis de elevada
colinearidade. Falsa. Conforme observado no texto (veja a Equação 7.5.6), a variância de estimador de
2
σ 1
MQO é dada pela fórmula var(βj)= ( ), e dela se pode deduzir que um R2 elevado pode ser
∑ x j 1−R2j
2

contrabalançado por um baixo σ2 ou um alto ∑ x 2j .


(d) As altas correlações de pares de variáveis não sugere que haja multicolinearidade Incerta. Se houver
somente dois regressores no modelo, um alto coeficiente de correlação entre pares de variáveis pode
indicar multicolinearidade. Se um ou mais regressores entrarem de forma não-linear, as correlações entre
pares podem levar a respostas enganosas.
(e) A multicolinearidade é inofensiva se o objetivo da análise for apenas de previsãoIncerta. Não há mal
nenhum se a colinearidade observada persistir nos valores das amostras futuras. Mas se esse não for o
caso ou se o objetivo for uma estimação precisa, então a multicolinearidade pode ser um problema.
(f) Ceteris paribus, quanto mais alto for o FIV, maior a variância dos estimadores de MQO Falsa. Veja a
resposta (c).
(g) A tolerância (TOL) é uma medida melhor de multicolinearidade que o FIV.Falsa. FIV e TOL fornecem a
mesma informação.
(h) Não obteremos um valor alto de R2 em uma regressão múltipla se todos os coeficientes angulares
parciais forem individualmente insignificantes, do ponto de vista estatístico, com base no teste t usual
Falsa. Normalmente se obtêm R2 elevados em modelos com muita correlação entre os regressores.
(i) Na regressão de Y contra X2 e X3, suponha que haja pouca variabilidade nos valores de X3. Isso
aumentaria a var (ØO 3). No extremo, se todos os X3 forem idênticos, a var (ØO 3) será infinita. Verdadeira.
Como se pode ver pela fórmula dada em (c), se a variabilidade de X3 for pequena, R2j tenderá a ser
pequeno e no caso extremo de não haver variabilidade em X3, ∑ x 23 i será igual a zero, caso em que a
variância de β3 estimado será infinita.
10.14 Suponha que todos os coeficientes de correlação de ordem zero de X1(D Y), X2, ...., Xk sejam iguais
a r. a. Qual o valor de R2 1,2,3 . . . k? (a) Se todas as correlações de ordem zero, ou simples, forem iguais a
2
2r (1−r ) 2 r 2
r, a Equação (7.11.5) se reduz a =
(1−r 2) 1+r
(b) Quais os valores dos coeficientes de correlação de primeira ordem?Pela Equação (7.11.1), pode-se ver,
r (1−r ) r
por exemplo, que r = 2
=
1−r 1+ r
10.25. Avalie criticamente as seguintes afirmações: a. “De fato, a multicolinearidade não é um erro de
modelagem. É uma condição de dados deficientes. B.“Se não for viável obter mais dados, então deve-se
aceitar o fato de que os dados que se tem contêm uma quantidade limitada de informações e devem
simplificar o modelo de acordo. Tentar estimar modelos que sejam complicados demais é um dos erros
mais comuns entre econometristas inexperientes. c. “É comum os pesquisadores afirmarem que a
multicolinearidade está presente sempre que os sinais esperados não aparecerem nos resultados da
regressão, quando as variáveis que eles sabem, a priori, que são importantes têm valores t insignificantes
ou quando vários resultados de regressão são substancialmente alterados sempre que uma variável
explanatória é suprimida. Infelizmente, nenhuma dessas situações é necessária ou suficiente para a
existência de colinearidade e, além disso, nenhuma prevê sugestões úteis quanto ao tipo de informações
adicionais que podem ser necessárias para resolver o problema de estimação que apresentam.”*51 d.
“[...] qualquer regressão de séries temporais que contenha mais de quatro variáveis independentes
resulta em lixo.” (a), (b), (c) & (d) Em essência, todas essas opiniões nos dizem que a multicolinearidade é,
muito freqüentemente, um problema de deficiência de dados.

Você também pode gostar