39
𝒂)
A estatística 𝑡, utilizada para o teste da hipótese 𝐻0 : 𝛽𝑗 = 𝑏, é dada por
𝑡 = (𝛽̂𝑗 − 𝑏)⁄se(𝛽̂𝑗 ),
em que se(𝛽̂𝑗 ) (standard error) denota o erro-padrão de 𝛽̂𝑗 , isto é, o estimador do desvio-padrão
de 𝛽̂𝑗 , sd(𝛽̂𝑗 ) (standard deviation). Se 𝐻0 é verdadeira, a estatística 𝑡 segue uma distribuição 𝓉-
Student com 𝑛 − 𝑘 − 1 graus de liberdade. Simbolicamente,
𝑡 ~ 𝓉𝑛−𝑘−1 .
𝐻0
A fórmula habitual de sd(𝛽̂𝑗 )—logo, do denominador de 𝑡, se(𝛽̂𝑗 )—é deduzida a partir de todas
as hipóteses do modelo linear clássico (CLM); entre elas, a hipótese (5)—homoscedasticidade.
Se (5) não é válida—isto é, se ocorre heteroscedasticidade—o denominador da fórmula usual
da estatística 𝑡 já não corresponde ao erro-padrão de 𝛽̂𝑗 , porque a fórmula do desvio-padrão de
𝛽̂𝑗 é diferente da habitual (mesmo que as restantes hipóteses CLM sejam válidas). Em
consequência, a estatística 𝑡, na sua fórmula usual (isto é, com o denominador usual), já não
segue uma distribuição 𝓉𝑛−𝑘−1.
𝒃)
A hipótese (3) do modelo CLM—ausência de multicolinearidade—impede que haja variáveis
explicativas linearmente dependentes entre si. Esta situação corresponderia a correlações
iguais a ±1 entre as variáveis em causa (e o modelo estaria, simplesmente, mal formulado).
Desde que não haja multicolinearidade, nada impede, do ponto de vista da distribuição da
estatística 𝒕 usual—v. alínea 𝒂)—que as variáveis explicativas tenham correlações elevadas
entre si.
Note-se que, do ponto de vista da precisão (= inverso da variância) dos estimadores OLS, não é
desejável que haja correlações elevadas entre variáveis explicativas: porque, quanto mais
elevadas são estas correlações (em valor absoluto), menor é a precisão dos estimadores (isto é,
maiores são as suas variâncias). Mas não é este o ponto aqui: a distribuição amostral da
estatística 𝑡 usual não é afectada por correlações elevadas (menores que 1, em valor absoluto)
entre variáveis explicativas.
𝒄)
Vulgarmente, se se omite uma variável explicativa relevante da regressão, a hipótese CLM, (4)—
E(𝑢|𝒙) = 0 (𝒙: variáveis explicativas), torna-se inválida: em geral, E(𝑢|𝒙) passa a ser função de
𝒙— E(𝑢|𝒙) = ℎ(𝒙). O erro só mantém média condicional nula se a variável omitida não é
correlacionada com as restantes variáveis explicativas (o que é raro).
Em consequência, os estimadores OLS passam a ser enviesados— E(𝛽̂𝑗 ) ≠ 𝛽𝑗 —e, por esta
razão, sob 𝐻0 : 𝛽𝑗 = 𝑏, o numerador da estatística 𝑡 usual deixa de ter valor esperado nulo. Por
este motivo, a distribuição da estatística 𝑡 habitual já não é 𝓉𝑛−𝑘−1.
41
Regressão populacional 𝑟𝑑𝑖𝑛𝑡𝑒𝑛𝑠 = 𝛽0 + 𝛽1 log(𝑠𝑎𝑙𝑒𝑠) + 𝛽2 𝑝𝑟𝑜𝑓𝑚𝑎𝑟𝑔 + 𝑢
Regressão estimada
̂ = 0,472 + 0,321 log(𝑠𝑎𝑙𝑒𝑠) + 0,050𝑝𝑟𝑜𝑓𝑚𝑎𝑟𝑔 𝑛 = 32 𝑅 2 = 0,099
𝑟𝑑𝑖𝑛𝑡𝑒𝑛𝑠
(1,369) (0,216) (0,046)
𝒂)
𝛽̂1 = 0,321: se 𝑠𝑎𝑙𝑒𝑠 aumenta 100% (variação relativa), ceteris paribus (cp), estima-se que
𝑟𝑑𝑖𝑛𝑡𝑒𝑛𝑠 cresce 0,321 unidades (= pontos percentuais). Donde, se 𝑠𝑎𝑙𝑒𝑠 aumenta 10%, cp,
estima-se que 𝑟𝑑𝑖𝑛𝑡𝑒𝑛𝑠 cresce 0,0321 pontos percentuais.
O efeito estimado não parece muito elevado (atendendo apenas à estimativa do coeficiente).
𝒃)
𝐻0 : 𝛽1 = 0, 𝐻1 : 𝛽1 > 0 (escolhe-se alternativa unilateral direita, porque se supõe que, se 𝑠𝑎𝑙𝑒𝑠
tem algum efeito sobre 𝑟𝑑𝑖𝑛𝑡𝑒𝑛𝑠, o efeito é positivo).
Estatística de teste: 𝑡 = 𝛽̂1⁄se(𝛽̂1 ); distribuição de 𝑡 sob 𝐻0 : 𝑡 ~ 𝓉32−2−1 ≡ 𝓉29 .
𝐻0
𝒄)
𝐻0 : 𝛽2 = 0, 𝐻1 : 𝛽2 ≠ 0 (escolhe-se alternativa bilateral, porque se supõe que, se 𝑝𝑟𝑜𝑓𝑚𝑎𝑟𝑔 tem
algum efeito sobre 𝑟𝑑𝑖𝑛𝑡𝑒𝑛𝑠, este efeito pode ser positivo ou negativo).
Estatística de teste: 𝑡 = 𝛽̂2⁄se(𝛽̂2 ); distribuição de 𝑡 sob 𝐻0 : 𝑡 ~ 𝓉29 .
𝐻0
43
Regressão populacional 𝑚𝑢 = 𝛽0 + 𝛽𝑚𝑠 𝑚𝑠 + 𝛽𝑎𝑑𝑚 𝑎𝑑𝑚 + 𝛽𝑓𝑎𝑙𝑡𝑎𝑠 𝑓𝑎𝑙𝑡𝑎𝑠 + 𝑢
Regressão estimada
𝑚𝑢
̂ = 1,39 + 0,412𝑚𝑠 + 0,015𝑎𝑑𝑚 − 0,083𝑓𝑎𝑙𝑡𝑎𝑠 𝑛 = 141 𝑅 2 = 0,234
(0,33) (0,094) (0,011) (0,026)
𝒂)
Variável fulcral e distribuição assintótica: (𝛽̂𝑚𝑠 − 𝛽𝑚𝑠 )⁄se(𝛽̂𝑚𝑠 ) ~ 𝓉141−3−1 ≈ 𝒩(0,1)—pede-
se para utilizar a distribuição assintótica que, para 𝑛 “grande” (𝑛 = 141), aproxima a verdadeira
distribuição da variável fulcral, 𝓉𝑛−4 .
Extremos do intervalo de confiança para 𝛽𝑚𝑠 , com o grau de confiança (1 − 𝛼) × 100% = 95%
GRETL
[Ferramentas → Tabelas Estatísticas → normal (média: 0, desvio padrão: 1, probabilidade da
cauda direita: 0,025) → OK]
Output:
Distribuição normal padrão
probabilidade da cauda direita = 0,025
probabilidade do complementar = 0,975
probabilidade bilateral = 0,05
Valor crítico = 1,95996
𝒃)
𝐻0 : 𝛽𝑚𝑠 = 0,4, 𝐻1 : 𝛽𝑚𝑠 ≠ 0,4; nível de significância 𝛼 = 5%. Dado que a hipótese alternativa é
bilateral e o nível de significância corresponde ao grau de confiança utilizado no IC em 𝒂), basta
verificar se o valor de 𝛽𝑚𝑠 sob 𝐻0 pertence ao IC.
Conclusão do teste: 0,4 ∈ IC → aceita-se 𝐻0 .
𝒄)
𝐻0 : 𝛽𝑚𝑠 = 1, 𝐻1 : 𝛽𝑚𝑠 ≠ 1; nível de significância 𝛼 = 5%. Dado que a hipótese alternativa é
bilateral e o nível de significância corresponde ao grau de confiança utilizado no IC em 𝒂), basta
verificar se o valor de 𝛽𝑚𝑠 sob 𝐻0 pertence ao IC.
Conclusão do teste: 1 ∉ IC → rejeita-se 𝐻0 .
45
𝒂)
𝛽1: variação absoluta (da média) de 𝑣𝑜𝑡𝑒𝐴 (em pontos percentuais), resultante de um acréscimo
relativo de 100% de 𝑒𝑥𝑝𝑒𝑛𝑑𝐴, cp.
𝒃)
Impacto do acréscimo relativo de 1% em 𝑒𝑥𝑝𝑒𝑛𝑑𝐴, cp: 𝛽1⁄100—v. 𝒂); impacto de um acréscimo
relativo de 1% em 𝑒𝑥𝑝𝑒𝑛𝑑𝐵, cp: 𝛽2⁄100;
A hipótese nula de que os dois efeitos se anulam corresponde a
𝐻0 : 𝛽2⁄100 = − 𝛽1⁄100 ⇔ 𝛽1 + 𝛽2 = 0.
𝒄)
Regressão estimada
̂ = 45,086 + 6,081 log(𝑒𝑥𝑝𝑒𝑛𝑑𝐴) − 6,615 log(𝑒𝑥𝑝𝑒𝑛𝑑𝐵) + 0,152𝑝𝑟𝑡𝑦𝑠𝑡𝑟𝐴
𝑣𝑜𝑡𝑒𝐴
(3,927) (0,382) (0,379) (0,062)
𝑛 = 173 𝑅 2 = 0,792
GRETL
[Abrir a base de dados VOTE1.gdt: no painel inicial,
Ficheiro → Abrir Dados → Ficheiro de Exemplos → separador Wooldridge → escolher ficheiro
vote1 Voting outcomes and campaign expenditures.
Estimação do modelo: no painel inicial, após abrir a base de dados,
Modelo → Mínimos Quadrados (“Ordinary Least Squares”) → escolha da Variável dependente e
dos Regressores → OK]
Output da estimação OLS:
Modelo 1: Mínimos Quadrados (OLS), usando as observações 1-173
Variável dependente: voteA
Nota
A variável l_expendA [= log(𝑒𝑥𝑝𝑒𝑛𝑑𝐴)] não consta da base de dados VOTE1.gdt; foi criada a
partir da variável expendA. Para o efeito,
seleccionar a variável expendA, clicar o botão direito do rato → Acrescentar log OU
seleccionar a variável expendA → Acrescentar → Logaritmos das variáveis seleccionadas.
𝐻0 : 𝛽1 = 0, 𝐻0 : 𝛽1 > 0;
𝑡obs = 6,081⁄0,382 ≈ 15,91; valor-𝑝 = Pr(𝑡 > 𝑡obs |𝐻0 ) ≈ 0 → rejeita-se 𝐻0 : os gastos de
campanha do partido A influenciam positivamente os seus resultados eleitorais.
Nota: o valor-𝑝 é a área para a direita de 𝑡obs —Pr(𝑡 > 15,91|𝐻0 )—porque a hipótese
alternativa é unilateral direita—𝐻1 : 𝛽2 ≠ 0 (v. c222, síntese, pág. 4).
𝐻0 : 𝛽2 = 0, 𝐻0 : 𝛽2 < 0.
𝑡obs = − 6,615⁄0,379 ≈ −17,46; valor-𝑝 = Pr(𝑡 < 𝑡obs |𝐻0 ) ≈ 0 → rejeita-se 𝐻0 : os gastos de
campanha do partido B influenciam negativamente os resultados eleitorais do partido A.
Nota: o valor-𝑝 é a área para a esquerda de 𝑡obs —Pr(𝑡 < −17,46|𝐻0 )—porque a hipótese
alternativa é unilateral esquerda—𝐻1 : 𝛽2 ≠ 0 (v. c222, síntese, pág. 4).
Nota: dado 𝑛 = 173, pode-se utilizar a distribuição 𝒩(0,1); os valores de 𝑡obs constam da coluna
“rácio-t” do output.
Para testar a hipótese nula da alínea 𝒃), 𝐻0 : 𝛽1 + 𝛽2 = 0, contra alternativa bilateral, 𝐻1 : 𝛽1 +
𝛽2 ≠ 0, a estatística de teste é 𝑡 = (𝛽̂1 + 𝛽̂2 )⁄se(𝛽̂1 + 𝛽̂2 ), aproximadamente distribuída de
acordo com uma 𝒩(0,1), se 𝐻0 é verdadeira. O numerador obtém-se facilmente do output
(coluna “Coeficiente”); mas, para calcular o denominador,
se(𝛽̂1 + 𝛽̂2 ) = √V
̂(𝛽̂1 + 𝛽̂2 ) = √V
̂(𝛽̂1 ) + V
̂ (𝛽̂2 ) + 2COV
̂(𝛽̂1 , 𝛽̂2 ) =
̂(𝛽̂1 , 𝛽̂2 ) ,
√0,3822 + 0,3792 + 2COV
é necessário a estimativa de COV(𝛽̂1, 𝛽̂2 ), que não é fornecida no output da estimação OLS
(pode-se obter esta estimativa no GRETL, como segue: a partir do painel de output da estimação
OLS do modelo, seleccionar Análise → Matriz de covariâncias dos coeficientes). A estimativa de
̂(𝛽̂1 , 𝛽̂2 ) é o elemento (2,3) da matriz: COV
COV ̂(𝛽̂1 , 𝛽̂2 ) = −0,00267833. Resulta 𝑡obs ≈ −1,002,
valor-𝑝 ≈ 0,318 (elevado—área das duas caudas, porque 𝐻1 é bilateral), o qual conduz à
aceitação de 𝐻0 (o efeito dos gastos de campanha de B sobre os resultados eleitorais de A anula
o efeito dos gastos de campanha deste partido sobre os seus próprios resultados eleitorais).
𝒅)
Seja 𝛽1 + 𝛽2 = 𝜃 ⇔ 𝛽2 = 𝜃 − 𝛽1; a hipótese nula de 𝒃) equivale agora a 𝐻0 : 𝜃 = 0.
Substituindo no modelo, vem
𝑣𝑜𝑡𝑒𝐴 = 𝛽0 + 𝛽1 log(𝑒𝑥𝑝𝑒𝑛𝑑𝐴) + 𝛽2 log(𝑒𝑥𝑝𝑒𝑛𝑑𝐵) + 𝛽3 𝑝𝑟𝑡𝑦𝑠𝑡𝑟𝐴 + 𝑢 ⇔
𝑣𝑜𝑡𝑒𝐴 = 𝛽0 + 𝛽1 log(𝑒𝑥𝑝𝑒𝑛𝑑𝐴) + (𝜃 − 𝛽1 ) log(𝑒𝑥𝑝𝑒𝑛𝑑𝐵) + 𝛽3 𝑝𝑟𝑡𝑦𝑠𝑡𝑟𝐴 + 𝑢 ⇔
𝑣𝑜𝑡𝑒𝐴 = 𝛽0 + 𝛽1 [log(𝑒𝑥𝑝𝑒𝑛𝑑𝐴) − log(𝑒𝑥𝑝𝑒𝑛𝑑𝐵)] + 𝜃 log(𝑒𝑥𝑝𝑒𝑛𝑑𝐵) + 𝛽3 𝑝𝑟𝑡𝑦𝑠𝑡𝑟𝐴 + 𝑢:
modelo reparametrizado.
A hipótese a testar é a da nulidade do coeficiente de 𝐥𝐨𝐠(𝒆𝒙𝒑𝒆𝒏𝒅𝑩) no modelo
reparametrizado: regressão de 𝑣𝑜𝑡𝑒𝐴 sobre termo independente e as variáveis explicativas
𝑧 = log(𝑒𝑥𝑝𝑒𝑛𝑑𝐴) − log(𝑒𝑥𝑝𝑒𝑛𝑑𝐵), log(𝑒𝑥𝑝𝑒𝑛𝑑𝐵) e 𝑝𝑟𝑡𝑦𝑠𝑡𝑟𝐴.
Estimativa do modelo reparametrizado
̂ = 45,086 + 6,081𝑧 − 0,534𝑙𝑜𝑔(𝑒𝑥𝑝𝑒𝑛𝑑𝐵) + 0,152𝑝𝑟𝑡𝑦𝑠𝑡𝑟𝐴.
𝑣𝑜𝑡𝑒𝐴
(3,927) (0,382) (0,533) (0,062)
46
𝒂)
A amostra contém 2017 agregados com um único indivíduo.
GRETL
[Restrição da amostra a agregados com um só indivíduo: no painel inicial, após abrir a base de
dados 401KSUBS.gdt,
Amostra → Restringir, baseado em critérios… → introduzir: fsize=1 → OK]
Output da estimação OLS:
Modelo 1: Mínimos Quadrados (OLS), usando as observações 1-2017
Variável dependente: nettfa
𝛽̂0 = −43,0398: estimativa do valor médio de 𝑛𝑒𝑡𝑡𝑓𝑎 para 𝑖𝑛𝑐 = 𝑎𝑔𝑒 = 0—não tem interesse
económico (a população-alvo não engloba indivíduos nestas condições).
𝛽̂1 = 0,799317: se o rendimento anual aumenta 1 unidade (= 1000 USD), cp, estima-se que a
riqueza financeira líquida cresce cerca de 799 USD.
𝛽̂2 = 0,842656: se a idade do indivíduo aumenta 1 ano, cp, estima-se que a riqueza financeira
líquida cresce cerca de 843 USD.
𝒃)
V. 𝒂).
𝒄)
𝐻0 : 𝛽2 = 1, 𝐻0 : 𝛽2 < 1.
Estatística de teste: 𝑡 = (𝛽̂2 − 1)⁄se(𝛽̂2 ); distribuição de 𝑡 sob 𝐻0 : 𝑡 ~ 𝓉2017−3 ≈ 𝒩(0,1).
𝐻0
𝑡obs = (0,842656 − 1)⁄0,0920169 ≈ −1,710; valor-𝑝 = Pr(𝑡 < −1,710|𝐻0 ) ≈ 0,044 → não se
rejeita 𝐻0 , ao nível de significância de 1% (valor-𝑝 > 0,01).
Nota: o valor-𝑝 é a área à esquerda do valor 𝑡obs —Pr(𝑡 < −1,710|𝐻0 )—porque a hipótese
alternativa é unilateral esquerda—𝐻1 : 𝛽2 < 1 (v. c222, síntese, pág. 4).
𝒅)
(c221, pp. 12-14, Regressão simples vs. regressão com duas variáveis explicativas:
relação entre estimadores OLS)
A estimativa do coeficiente de 𝑖𝑛𝑐 é agora igual a 0,820681, não muito diferente da estimativa
anterior (0,799317). O valor reduzido da correlação CORR(𝑖𝑛𝑐, 𝑎𝑔𝑒) = 0,03905864, na sub-
amostra com agregados de um só indivíduo, pode ajudar a explicar a proximidade das duas
estimativas (dada a relação algébrica entre as estimativas do mesmo coeficiente, a partir da
regressão simples e a partir da regressão com duas variáveis explicativas).
GRETL
[Obtenção de CORR(𝑖𝑛𝑐, 𝑎𝑔𝑒): no painel inicial,
seleccionar as duas variáveis inc e age (usando a tecla Ctrl) → clicar com o botão direito do
rato sobre uma das variáveis → Matriz de correlação]
Output:
corr(inc, age) = 0,03905864
De acordo com a hipótese nula de não correlação:
t(2015) = 1,75463, com valor p bilateral 0,0795
47
𝒂)
𝐻0 : 𝛽0 = 0, 𝐻1 : 𝛽0 ≠ 0.
Estatística de teste: 𝑡 = 𝛽̂0⁄se(𝛽̂0 ); distribuição de 𝑡 sob 𝐻0 : 𝑡 ~ 𝓉86 ≈ 𝒩(0,1).
𝐻0
𝑡obs = (0,976 − 1)⁄0,049 ≈ −0,490, valor-𝑝 = Pr(|𝑡| > 0,490|𝐻0 ) ≈ 0,624 → Aceita-se 𝐻0 .
Aceita-se cada uma das hipóteses, individualmente consideradas. Nada se diz, para já, a respeito
do teste da hipótese conjunta das duas restrições—com base nos testes das restrições
individuais, não se pode concluir se a avaliação é racional ou não.
𝒃)
Teste da hipótese conjunta
𝐻0 : 𝛽0 = 0 ∧ 𝛽1 = 1 (avaliação racional), 𝐻1 : 𝛽0 ≠ 0 ∨ 𝛽1 ≠ 1.
Estatística de teste e respectiva distribuição, sob a hipótese de avaliação racional:
(SQR 𝑟 − SQR 𝑢𝑟 )⁄2
𝐹= ~ℱ .
SQR 𝑢𝑟 ⁄(88 − 2) 𝐻0 2,86
Conclusão do teste:
(209448,99 − 165644,51)⁄2
𝐹obs = ≈ 11,37;
165644,51⁄86
Valor-𝑝 = Pr(𝐹 > 11,37|𝐻0 ) = 4,15616 × 10−5 ≈ 0 → Rejeita-se 𝐻0 , isto é, rejeita-se a
hipótese de que a avaliação é racional—apesar da aceitação das hipóteses individuais—v. 𝒂).
GRETL
[Ferramentas → Localizador de valor p → F (gln: 2, gld: 86, valor: 11,37) → OK]
Output:
F(2, 86): área à direita de 11,37 = 4,15616e-005
(à esquerda: 0,999958)
Nota: o valor-𝑝 é a área à direita do valor 𝐹obs —Pr(𝐹 > 11,37|𝐻0 )—porque se trata de um teste
𝐹 (no qual se avalia simplesmente se a estatística de teste é “grande”, ou não) (v. c222, síntese,
pág. 8).
𝒄)
Ao acrescentar as variáveis explicativas 𝑠𝑞𝑟𝑓𝑡, 𝑙𝑜𝑡𝑠𝑖𝑧𝑒 e 𝑏𝑑𝑟𝑚𝑠 à regressão inicial, a variável
dependente mantém-se, logo, pode-se realizar o teste 𝐹 utilizando os 𝑅 2 dos modelos 𝑟 e 𝑢𝑟.
Modelo 𝑢𝑟: 𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1 𝑎𝑠𝑠𝑒𝑠𝑠 + 𝛽2 𝑠𝑞𝑟𝑓𝑡 + 𝛽3 𝑙𝑜𝑡𝑠𝑖𝑧𝑒 + 𝛽4 𝑏𝑑𝑟𝑚𝑠 + 𝑢; 2
𝑅𝑢𝑟 = 0,829;
Modelo 𝑟: 𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1 𝑎𝑠𝑠𝑒𝑠𝑠 + 𝑢; 𝑅𝑟2 = 0,820.
Hipótese nula, que corresponde ao modelo 𝑟: 𝐻0 : 𝛽2 = 𝛽3 = 𝛽4 = 0;
Hipótese alternativa, que corresponde ao modelo 𝑢𝑟: 𝐻1 : 𝛽2 ≠ 0 ∨ 𝛽3 ≠ 0 ∨ 𝛽4 ≠ 0.
Estatística de teste e respectiva distribuição, sob a hipótese de avaliação racional:
2
(𝑅𝑢𝑟 − 𝑅𝑟2 )⁄3
𝐹= ~ ℱ3,83 .
2 )⁄(88 − 5) 𝐻
(1 − 𝑅𝑢𝑟 0
Conclusão do teste:
(0,829 − 0,820)⁄3
𝐹obs = ≈ 1,46; Valor-𝑝 = Pr(𝐹 > 1,46|𝐻0 ) ≈ 0,23 → Aceita-se 𝐻0 .
(1 − 0,829)⁄(88 − 5)
Nota: o valor-𝑝 é a área à direita do valor 𝐹obs —Pr(𝐹 > 1,46|𝐻0 )—porque se trata de um teste
𝐹 (no qual se avalia simplesmente se a estatística de teste é “grande”, ou não) (v. c222, síntese,
pág. 8).
𝒅)
Se ocorre heteroscedasticidade (= variância condicional de 𝑝𝑟𝑖𝑐𝑒, dadas as variáveis
explicativas, função destas variáveis explicativas), então a estatística 𝐹 não segue a distribuição
ℱ, sob 𝐻0 (porque a obtenção desta distribuição supõe, além de 𝐻0 , a validade de todas as
hipóteses CLM—incluindo a hipótese de homoscedasticidade). Logo, os testes anteriores não
seriam fiáveis.
49
Modelo 𝑢𝑟: 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝑧 + 𝑢;
Modelo 𝑟: 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝑢, que resulta de impor a restrição 𝛽2 = 0, no modelo 𝑢𝑟.
Para testar 𝐻0 : 𝛽2 = 0, pode-se utilizar o teste 𝐹.
Estatística de teste
2
(𝑅𝑢𝑟 − 𝑅𝑟2 )⁄1 0,291 − 0,183
𝐹obs = 2 )⁄(680 − 3)
= ≈ 103,126.
(1 − 𝑅𝑢𝑟 (1 − 0,291)⁄677
Quando só há uma restrição em 𝐻0 , 𝐹 = 𝑡 2 (v. c222, síntese, pág. 8), donde, 103,126 = 𝑡𝑧2 ⇒
𝑡𝑧 = −√103,126 = −10,155. O valor de 𝑡𝑧 é negativo, porque 𝑡𝑧 = 𝛽̂2⁄𝑠𝑒(𝛽̂2 ) e 𝛽̂2 é negativo.
51
Regressão populacional log(𝑠𝑎𝑙) = 𝛽0 + 𝛽1 log(𝑎𝑐𝑡) + 𝛽2 log(𝑡𝑟) + 𝛽3 log(𝑝𝑟) + 𝑢
𝒂)
Três testes individuais (não é um teste conjunto) 𝐻0 : 𝛽𝑗 = 0, 𝐻1 : 𝛽𝑗 ≠ 0, 𝑗 = 1,2,3.
𝛼 = 5%; 𝑞97,5% = 2,021 ← 𝑡46−4 . Rejeita-se 𝐻0 ao nível de 5%, se |𝑡obs | > 2,021.
𝛽1
𝑡obs = −0,005⁄0,032 ≈ −0,156 → Aceita-se 𝐻0 —log(𝑎𝑐𝑡) estatisticamente não significativo.
𝛽2
𝑡obs = −0,438⁄0,073 ≈ −6 → Rejeita-se 𝐻0 —log(𝑡𝑟) estatisticamente significativo.
𝛽3
𝑡obs = 0,501⁄0,083 ≈ 6,036 → Rejeita-se 𝐻0 —log(𝑝𝑟) estatisticamente significativo.
𝒃)
IC = ]−0,005 − 2,021 × 0,032; −0,005 + 2,021 × 0,032[ = ]−0,0697; 0,0597[ ;
0 ∈ IC → Aceita-se 𝐻0 : 𝛽1 = 0.
𝒄)
O teste de significância global é o teste da nulidade conjunta de todos os coeficientes das
variáveis explicativas, isto é, o teste de 𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 0, contra a hipótese alternativa,
𝐻1 : 𝛽1 ≠ 0 ∨ 𝛽2 ≠ 0 ∨ 𝛽3 ≠ 0.
Estatística de teste
𝑅 2 ⁄3
𝐹= ~ℱ .
(1 − 𝑅 2 )⁄(46 − 4) 𝐻0 3,42
Conclusão do teste:
0,567⁄3
𝐹obs = ≈ 18,333;
(1 − 0,567)⁄(46 − 4)
𝑞0,95 = 2,827 ← 𝐹3,42 ; 18,333 > 2,827 → Rejeita-se 𝐻0 .
GRETL
[Ferramentas → Tabelas Estatísticas → F (gln: 3, gld: 42, probabilidade da cauda direita: 0,05)
→ OK]
Output:
F(3, 42)
probabilidade da cauda direita = 0,05
probabilidade do complementar = 0,95
Valor crítico = 2,82705
𝒅)
O modelo original, log(𝑠𝑎𝑙) = 𝛽0 + 𝛽1 log(𝑎𝑐𝑡) + 𝛽2 log(𝑡𝑟) + 𝛽3 log(𝑝𝑟) + 𝑢, é equivalente a
log(𝑠𝑎𝑙) = 𝛽0 + 𝛽1 log(𝑎𝑐𝑡) + (𝛽2 + 𝛽3 ) log(𝑡𝑟) + 𝛽3 [log(𝑝𝑟) − log(𝑡𝑟)] + 𝑢 ⇔
log(𝑠𝑎𝑙) = 𝛽0 + 𝛽1 log(𝑎𝑐𝑡) + 𝛾 log(𝑡𝑟) + 𝛽3 log(𝑝𝑟⁄𝑡𝑟) + 𝑢.
Neste modelo, a hipótese de interesse é
𝐻0 : 𝛽3 = 0,
isto é, a hipótese de nulidade do coeficiente de 𝐥𝐨𝐠(𝒑𝒓⁄𝒕𝒓) na regressão de log(𝑠𝑎𝑙) sobre
constante, log(𝑎𝑐𝑡), log(𝑡𝑟) e log(𝑝𝑟⁄𝑡𝑟). Da sua estimação obtém-se 𝑡 = 𝛽̂3⁄𝑠𝑒(𝛽̂3 ).
Note-se que não se trata de testar 𝐻0 : 𝛽3 = 0 no modelo inicial.
52
Modelo estimado ̂
log(𝑝𝑟𝑖𝑐𝑒) = 4,766 + 0,000379𝑠𝑞𝑟𝑓𝑡 + 0,0289𝑏𝑑𝑟𝑚𝑠
(0,097) (0,00004) (0,0296)
𝑛 = 88 𝑅 2 = 0,588
GRETL
Output:
Modelo 1: Mínimos Quadrados (OLS), usando as observações 1-88
Variável dependente: lprice
54
(c222, pp. 30-33, Previsão)
𝒂)
̂= 1) = 0,35 + 1 = 1,35.
𝐸(𝑦|𝑥
𝒃)
Intervalo de previsão (IP) para o valor individual de 𝑦 para 𝑥 = 1
𝑦̂ = 1,35 + (𝑥 − 1); 𝑦̂0 = 1,35; se(𝑦̂0 ) = 0,45; 𝜎̂ 2 = 2,25.
(0,45)
Extremos do IP: 𝑦̂0 ± √[se(𝑦̂0 )]2 + 𝜎̂ 2 × 𝑞0,975 = 1,35 ± √0,452 + 2,25 × 1,987, ou seja,
IP = ]−1,762 ; 4,462[ .
55
(c222, pp. 30-33, Previsão)
𝒂)
Preço estimado
𝑝𝑟𝑖𝑐𝑒
̂ 0 = −21,7703 + 0,00206771 × 10000 + 0,122778 × 2300 + 13,8525 × 4 ≈
336,702 ≈ 337; 𝜎̂ = 59,83348.
GRETL
Output:
Modelo 1: Mínimos Quadrados (OLS), usando as observações 1-88
Variável dependente: price
𝑝𝑟𝑖𝑐𝑒 ̂ 0 ) = 7,37447.
̂ 0 ≈ 336,707, se(𝑝𝑟𝑖𝑐𝑒
GRETL
Output:
Modelo 2: Mínimos Quadrados (OLS), usando as observações 1-88
Variável dependente: price
Resolução
Comece-se por escrever o modelo populacional 𝑦 = 𝛽0 + 𝛽1 log 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + 𝑢;
suponha-se, como habitualmente, que E(𝑢|𝒙) = 0, de modo que
E(𝑦|𝒙) = 𝛽0 + 𝛽1 log 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 .
𝒂)
Nota média de estudantes que não faltam a nenhuma aula e estudam, no total, uma hora:
E(𝑦|𝑥1 = 1, 𝑥2 = 0, 𝑥3 = 0) = 𝛽0 + 𝛽1 log 1 + 𝛽2 × 0 + 𝛽3 × 0 = 𝛽0 .
Estimativa pontual (=previsão) da nota média dos alunos nestas condições: 𝛽̂0 = 7,31.
𝒃)
IP a 95% para a média das notas dos alunos nas condições referidas em 𝒂) (=IC para 𝛽0):
7,31 ± 3,26 × 1,97993
⏟ → IP ≈ ] 0,86 ; 13,76 [ .
𝑞0,975 𝓉124−4
𝒄)
IP a 95% para a nota de um aluno particular nas condições referidas em 𝒂).
Considere-se a nota de um aluno particular para o qual 𝑥1 = 1, 𝑥2 = 0, 𝑥3 = 0:
𝑦|𝑥1=1,𝑥2 =𝑥3 =0 = 𝛽0 + 𝛽1 log 1 + 𝛽2 × 0 + 𝛽3 × 0 + 𝑢 = 𝛽0 + 𝑢;
ou seja, agora quer-se obter o IC, não simplesmente para 𝛽0 mas para 𝛽0 “perturbado” pela
presença do erro, 𝑢 (só em média este é nulo): 𝛽0 + 𝑢. O IC deve ter esta aleatoriedade em
conta—a amplitude do intervalo é maior do que em 𝒃):
7,31 ± 3,262 + ⏟
⏟ 345,88⁄(124 − 4) × 1,97993
⏟ → IP ≈ ] 0,03 ; 14,59 [ .
√ 2 ̂2
𝜎 𝑞0,975 𝓉124−4
̂0 )
se(𝛽
𝒅)
Teste da hipótese 𝐻0 : E(𝑦|𝒙 = 𝒙𝟎 ) = 14 (⇔ 𝛽0 = 14) contra 𝐻0 : E(𝑦|𝒙 = 𝒙𝟎 ) ≠ 14.
𝛼 = 10%: o nível de significância adoptado é superior ao nível de significância subjacente ao IP
construído em 𝒃) (5%). Logo, o IP para E(𝑦|𝒙 = 𝒙𝟎 ) com grau de confiança 𝟗𝟎% será de menor
amplitude do que ]0,86 ; 13,76[.
Portanto, dado que 14 ∉ IP a 90% (porque também não pertence ao IP a 95%), rejeita-se 𝐻0 .
𝒆)
𝑥1 = 30, 𝑥2 = 100 (100 pp—faltar a todas as teóricas), 𝑥3 = 0 (não faltar a nenhuma prática);
regressão adequada ao que se pretende
𝑦 = 𝛿0 + 𝛿1 (log 𝑥1 − log 30) + 𝛿2 (𝑥2 − 100) + 𝛿3 𝑥3 + 𝑢.
O parâmetro de interesse é 𝛿0 .