Econi

ECN 2160: conomtrie 2
Slvia Gonalves
Universit de Montral
Hiver 2015 - cours 2
1 / 30
Le plan pour aujourdhui
1. Exemples de rgression simple.

2. Proprits algbriques des MCO.
3. Units de mesure et forme fonctionnelle.
2 / 30
Rappel: le modle de rgression simple

I
Soit
= 0 + 1 x + u,
E (u jx ) = 0.
y
Alors
E (y jx ) = 0 + 1 x
est la droite de rgression dans la population.
On peut crire
y = E (y jx ) + u,
o E (y jx ) dnote la partie systmatique et u la partie rsiduelle.
3 / 30
The Simple
Regression Model
Population regression function
For individuals with

average value of
is
, the
2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4 / 30
Les donnes
I
Pour estimer la droite de rgression nous avons besoin de donnes.
Soit
f(yi , xi ) : i = 1, . . . , ng
un chantillon alatoire de n observations:
yi est la valeur de la variable y pour lobservation i
xi est la valeur de la variable x pour lobservation i
I
Les donnes peuvent tre organises comme suit:
(y1 , x1 ) !
(y2 , x2 ) !
(yn , xn ) !
premire observation
deuxime observation
..
.
`
neme
observation
5 / 30
Estimation par MCO: les conditions de moments

I
La condition E (u jx ) = 0 implique
E (u ) = 0
(1)
E (xu ) = 0.
(2)
appliquer la Loi des Esperances Itres (LEI).
Lanalogue empirique de ui = yi
i, est le rsidu:
u i = yi
0
0
1 xi , lerreur pour lobservation

1 xi .
Donc, les analogues empiriques des conditions de moments (1) et (2)

sont
n
u i
= 0
xi u i
= 0.
i =1
i =1
6 / 30
Lestimateur de MCO dans la rgression simple

I
En remplaant u i par sa dnition,

0 = y
1 =
ni=1 (xi
ni=1
x ) (yi
(xi
x )
y )
2
Nous pouvons alors crire

y = y + u,
o
y = 0 + 1 x
est la valeur ajuste de y , et
u = y
est le rsidu.
7 / 30
The Simple
Regression Model
Fit as good as possible a regression line through the data points:
For example, the i-th

data point
Fitted regression line
8 / 30
Exemple 1: salaire de CEO et rendement de lenterprise

I
I
I
Soit y le salaire annuel en milliers de dollars dun prsident denterprise:

I Si y = 856.3, alors le CEO gagne $856,300 par ans.
Soit x le rendement (en pourcentage) dactions de lenterprise:
I Si x = 10, le rendement est de 10%.
La rgression estime est
y = 963.191 + 18.501x.
Comment intrprter les coe cients estims?

= 963.191: le CEO dune enterprise avec rendement nul aurait un
I
0
I
salaire annuel de $963,191 par ans.

1 = 18.501: si le rendement augmente de 1 point de pourcentage, alors
le salaire annuel augmente de 18.501 mil dollars.
Le salaire moyen prvu pour un CEO dune enterprise ayant un

rendement de 30% est de
y = 963.191 + 18.501
30 = 1, 518.221,
i.e. approximativement gal 1.5 million de dollars par ans.

9 / 30
The Simple
Regression Model
Fitted regression line

(depends on sample)
Unknown population regression line
10 / 30
Exemple 2: les rendements dducation

I
Soit y le salaire (en dollars/heure) et x le niveau dducation (en

nombres dannes dtude) pour un chantillon de personnes en 1976.
Nous obtenons
y =
0.90 + 0.54x, n = 526.
Comment intrprter les paramtres?

I
I
I
0 = 0.90 : le salaire moyen pour quelquun qui aurait zro annes

dducation est de $0.90 /heure.
1 = 0.54 : une anne additionnelle dducation augmente le salaire de
$0.54, ou de faon quivalente, de 54 cents.
4 ans dducation additionnels augmentent le salaire de 4 0.54 = 2.16
dollars par heure. Puisque les donnes sont de 1976, ceci est un eet
assez grand: le salaire moyen dans cet chantillon est de $5.90.
11 / 30
Exemple 3: rsultats dlections et dpenses de campagne

lectoral
I
Supposez des donnes dlections avec deux candidats: A et B.
Soit y le pourcentage de vote reu par le candidat A et soit x le

pourcentage des dpenses totales correspondant ce mme candidat.
Le modle estim est

y = 26.81 + 0.464x, n = 173.
I
I
0 = 26.81: zro dpenses seraient associes un vote de 26.81%.

1 = 0.464: augmenter les dpenses du candidat A de 1 point de
pourcentage augmente son vote de 0.464 points de pourcentages.
12 / 30
Exemple 4: quel est leet de la taille dune classe au

primaire sur les rsultats dun test standardis?
De combien changent les rsultats lorsque on rduit la taille dune classe

dun lve?
Les donnes observes sont sur n = 420 commissions scolaires en

`
Californie qui regroupent des lves jusqu la 8eme
anne.
Variables:
I
I
Test score = moyenne dans un test standardis par commission scolaire.

STR = nombres dlves dans la commission scolaire diviss par le
nombre de professeurs.
13 / 30
Initial look at the data:
(You should already know how to interpret this table)
This table doesn

t tell us anything about the relationship
between test scores and the STR.
Copyright 2011 Pearson Addison-Wesley. All rights reserved.
Supposons que le gouvernement envisage rduire le ratio

lves-enseignants de 2.
I
1-7
Pour la commission scolaire mdiane, ce ratio est de 19.3. Une telle

intervention placerait cette commission parmi la catgorie des classes les
10% plus petites en Californie. Il sagit dun changement trs signicatif...
Quel serait limpact dune telle politique?
14 / 30
Application to the California Test Score

Class Size data
Estimated slope =
= 2.28
Estimated intercept = = 698.9
Estimated regression line: TestScore
= 698.9 2.28STR
4-12
15 / 30
Interprtation des coe cients estims

I
Les comissions scolaires qui ont un tudiant de moins par professeur ont
un rsultat plus lev de 2.28:
Test
=
2 =
STR
2.28.
Donc, rduire le ratio STR de 2 implique une augmentation de

2 2 = 2 2.28 = 4.65 points.
Est-ce que cet eet est important?

I
I
I
Pour la commission mdiane, la valeur du test est de 654.5.

Ce rsultat passerait 659.1 aprs lintervention.
`
`
Ceci correspond passer du 50eme
prcentile au 60eme
prcentile. Pas
trs impressionnant...Mais cependant signicatif du point de vue
statistique, comme le montre le tableau suivant.
16 / 30
OLS regression: STATA output

regress testscr str, robust
Regression with robust standard errors
Number of obs =
420
F( 1,
418) =
19.26
Prob > F
= 0.0000
R-squared
= 0.0512
Root MSE
= 18.581
------------------------------------------------------------------------|
Robust
testscr |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
--------+---------------------------------------------------------------str | -2.279808
.5194892
-4.39
0.000
-3.300945
-1.258671
_cons |
698.933
10.36436
67.44
0.000
678.5602
719.3057
-------------------------------------------------------------------------
TestScore
= 698.9 2.28STR
(We
ll discuss the rest of this output later.)
4-15
17 / 30
Proprits algbriques des MCO

I
Les conditions de moments empiriques (ou les conditions de premier

ordre) qui donnent les MCO dans le modle de rgression simple avec
une constante sont
n
u i
= 0
xi u i
= 0,
i =1
n
i =1
o
u i
yi
= yi yi : les rsidus
= 0 + 1 xi : les valeurs ajustes.
18 / 30
Proprit 1: la somme (et donc la moyenne chantillonnale) des

rsidus de MCO est zro si le modle contient une constante.
Proprit 2: la covariance chantillonnale entre les variables

explicatives et les rsidus est nulle.
Proprit 3: le point (x,

y ) est toujours sur la droite de rgression, i.e.
si x = x alors y = 0 + 1 x = y .
19 / 30
Mesure dajustement
I
Puisque yi = yi + u i , nous pouvons montrer que pour un modle avec

constante,
n
(yi
i =1
Alors
y )2 =
{z
SST
(yi
i =1
{z
SSE
y )2 + u i2 .
}
i =1
| {z }
SSR
SST
SSE
SSR
=
+
,
SST
SST
SST
ce qui implique
R2
SSE
=1
SST
SSR
.
SST
20 / 30
Mesure dajustement: proprits

I
Le R 2 est la fraction de la variation totale dans la variable y qui est

explique par la variable x.
100
I
R 2 est le pourcentage de variation totale de y explique par x.

dans lexemple 1, R 2 = 0.0132 ) x explique 1.32% de la variation totale
de y .
Si le modle contient une constante, alors

0
R2
1.
Nous pouvons montrer que

R 2 = Corr 2 (yi , yi ) .
I
dans la rgression simple,

R 2 = Corr 2 (yi , xi ) .
21 / 30
Units de mesure
I
I
Quarrive-t-il aux MCO et R 2 lorsque on change les units de mesure?

Revenons lexemple 1:
y = 963.191 + 18.501x.
Cette estimation a t faite avec
=
x =
y
I
salaire en milliers de dollars

rendement en pourcentage.
Supposez maintenant que

y = salaire en dollars.
Dans la rgression de y sur x,
y = 0 + 1 x,
cest quoi 0 et 1 (ainsi que le nouveau R 2 )?
22 / 30
Le changements dunits de mesure peut se traduire par

y = 1000
I
I
y.
si y = 856.3, alors le CEO gagne 856.300 mil dollars par ans.

ceci est quivalent y = $856300.
Cest assez clair quon devrait trouver

0 = 1000 0
1 = 1000 1 ,
i.e. la nouvelle droite de rgression est
yb = 963191 + 18501x.
y = 18501x, i.e. si x = 1 alors le salaire change de $18501.
Ceci est consistant avec y = 18.501x, qui impliquait un changement

de 18.501 mil dollars par ans suite un changement de x = 1.
23 / 30
Supposons maintenant quau lieu de mesurer x en pourcentage, on

mesure x en dcimal:
x
x = 10 ! x = 0.01x =
.
100
Quand on rgresse y sur x , on obtient

y = 0 + 1 x .
Cest quoi 0 et 1 ?
Nous pouvons montrer que
= = 963.191
I
I
1 = 100 1 = 100
I
I
18.501 = 1850.1.
0 = 0 puisque x = x = 0.
1 : si x = 1 alors y = 1 x = 1 = 18.501 mil dollars. Dans la
nouvelle rgression, un changement dun point de pourcentage dans x est
quivalente un changement de 0.01 dans x . Donc, si on multiplie 1
par 100, on obtient la mme rponse:
y = 1850.1x = 1850.1
0.01 = 18.501.
24 / 30
Mesure dajustement et units de mesure
Dans les deux cas, le R 2 ne change pas lorsquon change les units de
mesure!
25 / 30
Comment introduire des nonlinarits dans le modle de

rgression linaire?
I
Le modle
y = 0 + 1 x + u
est linaire par rapport aux paramtres.

Exemple de modles qui ne sont pas linaire par rapport aux paramtres:
y
= exp ( 0 + 1 x + u ) .
1
+u
0 + 1 x
(4)
Le modle suivant est linaire par rapport aux paramtres mme sil
nest pas linaire par rapport x :
y = 0 + 1 x 2 + u.
(3)
(5)
(3) peut facilement tre transform dans un modle linaire en prennant

la transformation logarithmique:
log y = 0 + 1 x + u
26 / 30
Comment intrprter les paramtres dans le modle

log-niveau
I
Soit la rgression estime suivante:

log\
(salaire ) = 0.584 + 0.083educ
n = 526, R 2 = 0.186.
I
I
Comment intrprter 1 = 0.083?

Soit
log (y ) = 0 + 1 x + u.
Alors
log (y )
1 =
x
100 y
y
100x
%y
,
100x
ce qui implique
%y = 1001 x.
I
Donc, si educ = 1, alors le salaire change de 8.3 = 100

pourcent, tout le reste constant.
0.083
27 / 30
The Simple
Regression Model
Fitted regression
The wage increases by 8.3 % for

every additional year of education
(= return to education)
For example:
Growth rate of wage is 8.3 %

per year of education
28 / 30
Le modle log-log
I
Soit le modle de rgression linaire

log (y ) = 0 + 1 log (x ) + u.
I
I
Ce modle est toujours linaire par rapport aux paramtres.

On peut montrer que
1 =
d log y
dy /y
100dy /y
%y
=
=
=
.
d log x
dx /x
100dx /x
%x
Donc, 1 est une lasticit.

Exemple: on rgresse le log du salaire des CEO sur le log des ventes de
la rme:
log (salaire ) = 0 + 1 log (ventes ) + u.
Nous obtenons
log\
(salaire ) = 4.822 + 0.257 log (ventes ) .
1 = 0.257 : si les ventes augmentent de 1% alors le salaire annuel du

CEO augmente de 0.257%.
29 / 30
Le modle niveau-log
I
Soit le modle de rgression linaire

y = 0 + 1 log (x ) + u.
On peut montrer que

1 =
dy
dy
100dy
100y
=
=
=
.
d log x
dx /x
100dx /x
%x
Donc,
y =
I
1
(%x )
100 1
Exemple: on rgresse le nombre dheures travailles sur le log du salaire:

heures = 0 + 1 log (salaire ) + u.
Nous obtenons
\ = 33 + 45.1 log (salaire ) .

heures
I
1 = 45.1 : si le salaire augmente de 1% alors le nombre dheures

augmente de 45.1/100 = 0.45 heures, donc presque dune demie heure.
30 / 30

Econi

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Econi

Enviado por

Direitos autorais:

Formatos disponíveis

ECN 2160: conomtrie 2

Hiver 2015 - cours 2

Le plan pour aujourdhui

1. Exemples de rgression simple.

Rappel: le modle de rgression simple

Population regression function

For individuals with

Pour estimer la droite de rgression nous avons besoin de donnes.

Les donnes peuvent tre organises comme suit:

Estimation par MCO: les conditions de moments

appliquer la Loi des Esperances Itres (LEI).

1 xi , lerreur pour lobservation

Donc, les analogues empiriques des conditions de moments (1) et (2)

Lestimateur de MCO dans la rgression simple

En remplaant u i par sa dnition,

Nous pouvons alors crire

For example, the i-th

Fitted regression line

Exemple 1: salaire de CEO et rendement de lenterprise

Soit y le salaire annuel en milliers de dollars dun prsident denterprise:

Comment intrprter les coe cients estims?

salaire annuel de $963,191 par ans.

Le salaire moyen prvu pour un CEO dune enterprise ayant un

i.e. approximativement gal 1.5 million de dollars par ans.

Fitted regression line

Unknown population regression line

Exemple 2: les rendements dducation

Soit y le salaire (en dollars/heure) et x le niveau dducation (en

0.90 + 0.54x, n = 526.

Comment intrprter les paramtres?

0 = 0.90 : le salaire moyen pour quelquun qui aurait zro annes

Exemple 3: rsultats dlections et dpenses de campagne

Supposez des donnes dlections avec deux candidats: A et B.

Soit y le pourcentage de vote reu par le candidat A et soit x le

Le modle estim est

0 = 26.81: zro dpenses seraient associes un vote de 26.81%.

Exemple 4: quel est leet de la taille dune classe au

De combien changent les rsultats lorsque on rduit la taille dune classe

Les donnes observes sont sur n = 420 commissions scolaires en

Test score = moyenne dans un test standardis par commission scolaire.

Initial look at the data:

(You should already know how to interpret this table)

This table doesn

Copyright 2011 Pearson Addison-Wesley. All rights reserved.

Supposons que le gouvernement envisage rduire le ratio

Pour la commission scolaire mdiane, ce ratio est de 19.3. Une telle

Quel serait limpact dune telle politique?

Application to the California Test Score

Interprtation des coe cients estims

Donc, rduire le ratio STR de 2 implique une augmentation de

Est-ce que cet eet est important?

Pour la commission mdiane, la valeur du test est de 654.5.

OLS regression: STATA output

Copyright 2011 Pearson Addison-Wesley. All rights reserved.

Proprits algbriques des MCO

Les conditions de moments empiriques (ou les conditions de premier

Proprit 1: la somme (et donc la moyenne chantillonnale) des

Proprit 2: la covariance chantillonnale entre les variables

Proprit 3: le point (x,

Puisque yi = yi + u i , nous pouvons montrer que pour un modle avec

Mesure dajustement: proprits

Le R 2 est la fraction de la variation totale dans la variable y qui est

R 2 est le pourcentage de variation totale de y explique par x.