Escolar Documentos
Profissional Documentos
Cultura Documentos
parmetros variveis
Resumo
Abstract
111
1. Introduo
Na anlise de regresso, a varivel dependente pode ser influenciada por variveis quantitativas e qualitativas. As variveis quantitativas so
facilmente mensuradas em alguma escala o que no ocorre com as variveis
qualitativas, uma vez que essas indicam a presena ou a ausncia de uma
qualidade ou atributo.
Dessa forma, um mtodo para "quantificar" esses atributos construir variveis artificiais que assumam valores de 1 ou 0 ( indicando ausncia de um atributo e indicando a sua presena) que so conhecidas pela
literatura existente de "variveis dummy". A rigor, no essencial que as
variveis dummy assumam os valores de 0 e 1. O par (0,1) pode ser
transformado em qualquer outro par por uma funo linear tal que
Z = a + bD (b 0) em que a e b so constantes e em que D = 1 ou 0. Quando D = 1 , tem-se Z = a + b ; e quando D = 0 , tem-se Z = a . Assim, o
par (0,1) se torna (a, a + b). Observa-se que a atribuio de valores puramente arbitrria, exigindo cuidado na hora de interpretar os resultados.
A introduo de variveis qualitativas (dummy) torna o modelo
de regresso linear uma ferramenta extremamente flexvel capaz de lidar
com muitos problemas encontrados, principalmente, em estudos empricos.
Os modelos que incluem como variveis explicativas somente variveis
qualitativas so chamados de modelos de anlise de varincia (ANOVA),
enquanto que os que incluem tambm variveis quantitativas so chamados
de modelos de anlise de covarincia (ANCOVA). Do ponto de vista econmico, as variveis dicotmicas dummy so introduzidas no modelo para
representar adequadamente os efeitos diferenciais produzidos pelo comportamento dos agentes (econmicos) devido, principalmente, a diferentes causas, dentre as quais se destacam as de tipo temporal (estacionrias,
etc), de carter espacial (estado, pas, etc), de carter puramente qualitativo
(sexo, etc).
Quanto sua aplicao, este tipo de varivel pode ser usado em
modelos simples, em que a nica varivel explicativa a prpria dummy, e
em modelos mais complexos, em que uma varivel categrica desdobrada
em duas ou mais variveis dummies. Ateno especial requer a especificao
de modelos que combinam dummies para diferentes categorias e para modelos que combinam dummies e variveis quantitativas. Neste ltimo caso,
duas anlises so possveis: incorporar mudanas no intercepto e/ou na
declividade de uma funo; possibilitar a identificao de mudanas estruturais.
A literatura especializada referente abordagem da anlise de regresso sobre variveis dummy desenvolveu-se, principalmente, a partir das
dcadas de 70 e 80 do sculo passado, embora j tenha sido objeto de estu112
113
(2.1)
Yi
( Terceiro grupo)
( Segundo grupo)
( Primeiro grupo)
Xi
Figura 1: Formato das observaes do estudo economtrico.
( ) . Em termos formais;
Yi = 1 + X i + ui
(2.2)
Yi = 2 + X i + ui
(2.3)
Yi = 3 + X i + ui
(2.4)
115
(2.5)
(2.6)
onde: 2 = ( 2 1 ) e 3 = ( 3 1 ) .
Pela equao anterior possvel se obter uma nica estimativa para
o parmetro e, simultaneamente, trs ordenadas, na origem, distintas.
A traduo geomtrica da estrutura estimada neste modelo pode ser representada conforme a Figura 2:
Yi
a1 + d3
a1 + d2
y i = (a1 + d3 ) + bX i
y i = (a1 + d2 ) + bX i
y = a + bX
i
a1
Fonte: REBELO & VALLE (2002)
Figura 2: Estrutura geomtrica do modelo (2.6).
116
Xi
Yi = + 1 X i + ui
(2.10)
Yi = + 2 X i + ui
(2.11)
Yi = + 3 X i + ui
(2.12)
Yi = + 1 X i + ( 2 1 )(D2i X i ) + ( 3 1 )(D3i X i ) + ui ;
i = 1, 2 ...,n
ui ~ NID 0, 2
(2.13),
Yi = + 1 X i + 2 (D2i X i ) + 3 (D3i X i ) + ui
ui ~ NID (0, 2 ) ;
i = 1, 2,...,n;
(2.14),
117
onde: 2 = ( 2 1 ) e 3 = ( 3 1 ) .
Assim, a utilizao de variveis dummy permite determinar a equao relativa a cada grupo2 ;
Yi = + 1 X i + ui se D2i = D3i = 0
(primeiro grupo)
(2.15)
Yi
y i = a + ( b1 + g3 ) X i
y i = a + ( b1 + g2 ) X i
y i = a + b1 X i
Xi
Fonte: REBELO & VALLE (2002)
Figura 3: Estrutura geomtrica do modelo (2.14).
118
Yi
c1
Xi
c2
Yi = 1 + 1 X i + ui
para
X i c1
(3.1)
Yi = 2 + 2 X i + ui
para
c1 X i c2
(3.2)
Yi = 3 + 3 X i + ui
para
X i c2
(3.3)
1, Se c1 Xi c2
D2i =
0, Caso contrrio
1, Se Xi c2 ;
D3i =
0, Caso contrrio;
Logo, a especificao do modelo correta seria semelhante a que se
segue, permitindo uma aproximao adequada do problema em questo:
Cincia e Natura, UFSM, 29 (1): 111 - 135, 2007
119
Yi = 1 + ( 2 1 )D2i + ( 3 1 )D3i + 1 X 1 +
( 2 1 )(D2i X i ) + ( 3 1 )(D3i X i ) + ui
(3.4)
1 + 1c1 = 2 + 2 c1
2 + 2 c2 = 3 + 3 c2
que, por simples manipulaes algbricas, tornam-se:
2 1 = c1 ( 2 1 )
3 2 = c2 ( 3 2 )
Impondo-se essas restries ao modelo (3.4), ele se transforma em;
Yi = 1 + 1 X 1 + ( 2 1 )D2i (X i c1 ) +
( 3 1 )D3i (X i c2 ) + ui
(3.5)
Yi = 1 + 1 X 1 + 2 D2i (X i c1 ) + 3 D3i (X i c2 ) + ui
(3.6)
Logo, para cada segmento da reta de regresso, tm-se as seguintes combinaes de valores das variveis dummy, observando-se que para o
primeiro caso a reta de regresso vale para o intervalo X i c1 , a segunda
para o intervalo c1 X i c2 e a terceira para o intervalo X i c2 .
1 + 1 X 1 + ui
Yi = 1 c1 2 + (1 + 2 )X 1 + ui
c + ( + )X + u
1
3
i
i
1 2 3
(3.7)
121
yi = + Di + ui
(4.1)
Professores
a+ b
^
=b
Professoras
Figura 5: Funes salrios (mdios).
122
(X X )
,
c) Calcular X ,Y ;
De posse desses clculos pode-se obter as estimativas dos
parmetros do modelo de regresso atravs da frmula:
^
1
B=
= (X , X ) X ,Y
CV
Regresso
Resduo
Total
OBS:
GL
K 1
nK
n 1
SQ
^,
QM
_2
b X y nY
,
^,
y, y b X , y
_2
^,
b X , y nY
K 1
^,
y, y b X , y
nK
_2
y, y nY
A partir da anlise de varincia pode-se determinar o grau de ajuste do modelo, bem como realizar o teste de significncia dos parmetros.
Logo, o coeficiente de determinao (ou grau de ajuste do modelo) dado
SQE K 1
2
por R = SQT n 1 .
Observa-se que a hiptese alternativa pode ser especificada de forma diferente,
como por exemplo, H1 : 0 . Neste caso, ela foi definida como sendo maior que
zero dado a hiptese implcita de que poderia haver um diferencial positivo entre
os salrios mdios recebidos pelos professores universitrios em comparao aos
salrios recebidos pelas professoras universitrias.
5
123
_2
^,
b X , y n y K 1
^,
y, y b X , y n K
Clculo da varincia: =
SQR
. Logo, a matriz de varincianK
^ ^
var cov b = X , X
2
representam as
t=
^
ep
(4.2)
Logo, pela regra de deciso sabe-se que, tcal > tcrtico t / 2 ,(n K ) ,
rejeita-se a hiptese nula. Neste caso, se o valor observado da estatstica
calculada superar o seu valor crtico, no se pode afirmar que o coeficiente
^
estudo da regresso sobre uma varivel quantitativa e uma varivel qualitativa com apenas duas classes6. Para exemplificar, apresenta-se o seguinte
modelo de regresso:
Yi = i + 2 D1 + X i + u1
(4.3)
E (Yi X i , Di = 0 ) = 1 + X i
E (Yi X i , Di = 1) = (1 + 2 ) + X i
Salrio anual
a2
^
a1
Anos de experincia
Logo, a partir do modelo (4.3) para estimar o salrio dos professores a relao fica;
Yi = (1 + 2 ) + X + ui
125
Yi = 1 + X i + ui
Os clculos de "a" a "c", citados anteriormente, devem ser realizados. O vetor das estimativas dos parmetros neste caso dado por:
1
B = 2
= X ,X
X ,Y
Falta-se avaliar se o valor estimado para o parmetro estatisticamente significativo, para tanto, calcula-se a anlise de varincia de regresso como apresentado na Tabela 1. Os mesmos clculos podem ser
realizados para se obter o grau de ajuste do modelo e/ou para testar a
significncia global dos parmetros da regresso.
^
2
1
^ ^
var cov b = (X , X ) =
var (1 )
cov(1 , 2 )
cov(1 , )
cov(1 , 2 )
var( 2 )
cov( 2 , )
cov(1 , )
cov( 2 , )
var( )
varincias de 1 , 2 e , respectivamente, pode-se obter seus correspondentes erros padres. De posse destes dados utiliza-se o teste t , como
mostrado em (4.2), para testar a significncia dos parmetros. Ressalta-se a
necessidade de se fazer uma anlise dos resduos do modelo, a fim de que,
2
II
III
IV
Professor
Salrio Inicial
(Y)
Sexo
(D1)
Xi (anos de
experincia)
D2
D3
22
19
18
21,7
18,5
21
20,5
17
17,5
10
21,2
Utilizando-se o programa Statistica 5.1 para realizar este exemplo, os seguintes passos devem ser efetuados:
(1) Ao se iniciar o programa, escolhe-se a opo Multiple
Regression e em seguida cliqua-se em Switch to Figura 7; em seguida, digitase os dados conforme mostra Figura 8;
127
129
Figura 12: Tela com o resultado das estimativas para o modelo e suas significncias.
130
131
132
6. Consideraes finais
A introduo das variveis dummy na anlise de regresso, como
mostrado no presente trabalho, constitui-se em importante instrumento
que amplia, de certa forma, o poder de anlise dos modelos. Isso se deve ao
fato de que este instrumental permite incorporar nos modelos variveis
importantes no contexto que se pretende analisar, e que no podem ser
medidas quantitativamente.
Nesse sentido, o presente trabalho teve por objetivo apresentar,
resumidamente, situaes em que as variveis dummy podem ser inseridas
na anlise, em especial, no caso em que estas so consideradas variveis
independentes. Observou-se, neste caso, que o software estatstico Statistica
verso 5.1 uma ferramenta computacional til nas estimativas de equaes que levam em considerao este tipo de variveis.
Ressalta-se, no entanto, que o trabalho limitou-se estudar a incluso da varivel dummy na anlise de regresso como uma varivel independente. Neste caso, como sugesto para trabalhos futuros, recomenda-se o
estudo de modelos de regresso que utilizem a varivel dummy como uma
varivel dependente, especificamente, o estudo dos modelos logit, probit,
tobit e/ou o modelo de probabilidade linear.
Observa-se, ainda, que o mesmo limitou-se tambm situao
em que o ajuste do modelo de regresso leva em considerao uma nica
varivel independente quantitativa e que o uso de variveis dummy pode
ser estendido, com as devidas adaptaes, para o caso da presena de duas
ou mais variveis independentes quantitativas no modelo.
133
7. Referncias bibliogrficas
CHOW, G. C. "Tests of Equality Between sets of coefficients in two
Linear Regressions". Econometrica, V. 28, n. 3, pp. 591-605, 1960.
DUFOUR, J. M. Dummy Variables and Predictive Tests for Structural
Changes: A coordinate Free Approach. International Economic
Review, Vol. 23, pp. 565-575, 1980.
___. Dummy Variables and Predictive Tests for Structural Change.
Economic Letters, Vol. 6, pp. 241-247, 1981.
___. Generalized Chow Tests for Structural Change: A Coordinate- Free
Approach. International Economic Review, Vol. 23, n. 3, pp.565-575, 1982.
ERLAT, H. "On the Chow Test when the Degrees of Freedom are
Inadequate", METU Studies in Development, n. 21, pp. 17-48, 1978.
___. Testing for Structural Change at More than One Switch Point:
Inadequate Degrees of Freedom and Dummy Variables. Oxford Bulletin
of Economics and Statistics, Vol. 47, n. 3, pp 293-302, 1985.
GUJARATI, D. Use of Dummy Variables in Testing for Equality
between Sets of Coefficients in Two Linear Regressions: A Note. The
American Statistician, Vol. 24, n. 1, pp. 50-52, 1970a.
___.Use of Dummy Variables in Testing for Equality between Sets of
Coefficients in Two Linear Regressions: A Generalisation, The
American Statistician, Vol. 24, n. 5, pp 18-21, 1970b.
___. Econometria bsica. So Paulo: Makron Boooks, 2000.
GREENE, W. H. Econometric Analysis. New York: Macmillan
Publishing Company, 1993.
HARDY, M. A. Regression With Dummy Variables. Newbury Park:
Sage Publications, 1993.
HILL, C. et al. Econometria. So Paulo: Saraiva, 1999.
HOFFMAN, R. Estatstica para Economistas. So Paulo, Pioneira, 1998.
KENNEDY, P. Interpreting Dummy Variables. The Review of
Economics and Statistics, Vol. 68(1), pp. 174-175, 1986.
KOOYMAN, M. A. Dummy Variables in Econometrics. Netherlands:
Tilburg University Press, 1976.
MADDALA, G.S. Introduo Econometria. Rio de Janeiro, LTC,
2003.
134
135