Você está na página 1de 30

ECN 2160: conomtrie 2

Slvia Gonalves
Universit de Montral

Hiver 2015 - cours 2

1 / 30

Le plan pour aujourdhui

1. Exemples de rgression simple.


2. Proprits algbriques des MCO.
3. Units de mesure et forme fonctionnelle.

2 / 30

Rappel: le modle de rgression simple


I

Soit

= 0 + 1 x + u,
E (u jx ) = 0.
y

Alors
E (y jx ) = 0 + 1 x
est la droite de rgression dans la population.

On peut crire
y = E (y jx ) + u,
o E (y jx ) dnote la partie systmatique et u la partie rsiduelle.

3 / 30

The Simple
Regression Model

Population regression function

For individuals with


average value of
is

, the

2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

4 / 30

Les donnes
I

Pour estimer la droite de rgression nous avons besoin de donnes.

Soit

f(yi , xi ) : i = 1, . . . , ng
un chantillon alatoire de n observations:
yi est la valeur de la variable y pour lobservation i
xi est la valeur de la variable x pour lobservation i
I

Les donnes peuvent tre organises comme suit:

(y1 , x1 ) !
(y2 , x2 ) !
(yn , xn ) !

premire observation
deuxime observation
..
.
`
neme
observation
5 / 30

Estimation par MCO: les conditions de moments


I

La condition E (u jx ) = 0 implique

E (u ) = 0

(1)

E (xu ) = 0.

(2)

appliquer la Loi des Esperances Itres (LEI).

Lanalogue empirique de ui = yi
i, est le rsidu:
u i = yi

0
0

1 xi , lerreur pour lobservation


1 xi .

Donc, les analogues empiriques des conditions de moments (1) et (2)


sont
n

u i

= 0

xi u i

= 0.

i =1

i =1

6 / 30

Lestimateur de MCO dans la rgression simple


I

En remplaant u i par sa dnition,


0 = y
1 =

ni=1 (xi
ni=1

x ) (yi

(xi

x )

y )
2

Nous pouvons alors crire


y = y + u,

o
y = 0 + 1 x
est la valeur ajuste de y , et
u = y

est le rsidu.
7 / 30

The Simple
Regression Model
Fit as good as possible a regression line through the data points:

For example, the i-th


data point

Fitted regression line

2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

8 / 30

Exemple 1: salaire de CEO et rendement de lenterprise


I
I
I

Soit y le salaire annuel en milliers de dollars dun prsident denterprise:


I Si y = 856.3, alors le CEO gagne $856,300 par ans.
Soit x le rendement (en pourcentage) dactions de lenterprise:
I Si x = 10, le rendement est de 10%.
La rgression estime est
y = 963.191 + 18.501x.

Comment intrprter les coe cients estims?


= 963.191: le CEO dune enterprise avec rendement nul aurait un
I
0
I

salaire annuel de $963,191 par ans.


1 = 18.501: si le rendement augmente de 1 point de pourcentage, alors
le salaire annuel augmente de 18.501 mil dollars.

Le salaire moyen prvu pour un CEO dune enterprise ayant un


rendement de 30% est de
y = 963.191 + 18.501

30 = 1, 518.221,

i.e. approximativement gal 1.5 million de dollars par ans.


9 / 30

The Simple
Regression Model

Fitted regression line


(depends on sample)

Unknown population regression line

2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

10 / 30

Exemple 2: les rendements dducation


I

Soit y le salaire (en dollars/heure) et x le niveau dducation (en


nombres dannes dtude) pour un chantillon de personnes en 1976.

Nous obtenons
y =

0.90 + 0.54x, n = 526.

Comment intrprter les paramtres?


I
I
I

0 = 0.90 : le salaire moyen pour quelquun qui aurait zro annes


dducation est de $0.90 /heure.
1 = 0.54 : une anne additionnelle dducation augmente le salaire de
$0.54, ou de faon quivalente, de 54 cents.
4 ans dducation additionnels augmentent le salaire de 4 0.54 = 2.16
dollars par heure. Puisque les donnes sont de 1976, ceci est un eet
assez grand: le salaire moyen dans cet chantillon est de $5.90.

11 / 30

Exemple 3: rsultats dlections et dpenses de campagne


lectoral
I

Supposez des donnes dlections avec deux candidats: A et B.

Soit y le pourcentage de vote reu par le candidat A et soit x le


pourcentage des dpenses totales correspondant ce mme candidat.

Le modle estim est


y = 26.81 + 0.464x, n = 173.

I
I

0 = 26.81: zro dpenses seraient associes un vote de 26.81%.


1 = 0.464: augmenter les dpenses du candidat A de 1 point de
pourcentage augmente son vote de 0.464 points de pourcentages.

12 / 30

Exemple 4: quel est leet de la taille dune classe au


primaire sur les rsultats dun test standardis?

De combien changent les rsultats lorsque on rduit la taille dune classe


dun lve?

Les donnes observes sont sur n = 420 commissions scolaires en


`
Californie qui regroupent des lves jusqu la 8eme
anne.

Variables:
I
I

Test score = moyenne dans un test standardis par commission scolaire.


STR = nombres dlves dans la commission scolaire diviss par le
nombre de professeurs.

13 / 30

Initial look at the data:

(You should already know how to interpret this table)

This table doesn


t tell us anything about the relationship
between test scores and the STR.

Copyright 2011 Pearson Addison-Wesley. All rights reserved.

Supposons que le gouvernement envisage rduire le ratio


lves-enseignants de 2.
I

1-7

Pour la commission scolaire mdiane, ce ratio est de 19.3. Une telle


intervention placerait cette commission parmi la catgorie des classes les
10% plus petites en Californie. Il sagit dun changement trs signicatif...

Quel serait limpact dune telle politique?

14 / 30

Application to the California Test Score


Class Size data

Estimated slope =
= 2.28
Estimated intercept = = 698.9
Estimated regression line: TestScore
Copyright 2011 Pearson Addison-Wesley. All rights reserved.

= 698.9 2.28STR
4-12
15 / 30

Interprtation des coe cients estims


I

Les comissions scolaires qui ont un tudiant de moins par professeur ont
un rsultat plus lev de 2.28:
Test
=
2 =
STR

2.28.

Donc, rduire le ratio STR de 2 implique une augmentation de


2 2 = 2 2.28 = 4.65 points.

Est-ce que cet eet est important?


I
I
I

Pour la commission mdiane, la valeur du test est de 654.5.


Ce rsultat passerait 659.1 aprs lintervention.
`
`
Ceci correspond passer du 50eme
prcentile au 60eme
prcentile. Pas
trs impressionnant...Mais cependant signicatif du point de vue
statistique, comme le montre le tableau suivant.

16 / 30

OLS regression: STATA output


regress testscr str, robust
Regression with robust standard errors

Number of obs =
420
F( 1,
418) =
19.26
Prob > F
= 0.0000
R-squared
= 0.0512
Root MSE
= 18.581
------------------------------------------------------------------------|
Robust
testscr |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
--------+---------------------------------------------------------------str | -2.279808
.5194892
-4.39
0.000
-3.300945
-1.258671
_cons |
698.933
10.36436
67.44
0.000
678.5602
719.3057
-------------------------------------------------------------------------

TestScore

= 698.9 2.28STR

(We
ll discuss the rest of this output later.)

Copyright 2011 Pearson Addison-Wesley. All rights reserved.

4-15
17 / 30

Proprits algbriques des MCO


I

Les conditions de moments empiriques (ou les conditions de premier


ordre) qui donnent les MCO dans le modle de rgression simple avec
une constante sont
n

u i

= 0

xi u i

= 0,

i =1
n

i =1

o
u i
yi

= yi yi : les rsidus
= 0 + 1 xi : les valeurs ajustes.
18 / 30

Proprit 1: la somme (et donc la moyenne chantillonnale) des


rsidus de MCO est zro si le modle contient une constante.

Proprit 2: la covariance chantillonnale entre les variables


explicatives et les rsidus est nulle.

Proprit 3: le point (x,


y ) est toujours sur la droite de rgression, i.e.

si x = x alors y = 0 + 1 x = y .

19 / 30

Mesure dajustement
I

Puisque yi = yi + u i , nous pouvons montrer que pour un modle avec


constante,
n

(yi

i =1

Alors

y )2 =

{z

SST

(yi

i =1

{z

SSE

y )2 + u i2 .
}

i =1

| {z }
SSR

SST
SSE
SSR
=
+
,
SST
SST
SST
ce qui implique
R2

SSE
=1
SST

SSR
.
SST

20 / 30

Mesure dajustement: proprits


I

Le R 2 est la fraction de la variation totale dans la variable y qui est


explique par la variable x.

100
I

R 2 est le pourcentage de variation totale de y explique par x.


dans lexemple 1, R 2 = 0.0132 ) x explique 1.32% de la variation totale
de y .

Si le modle contient une constante, alors


0

R2

1.

Nous pouvons montrer que


R 2 = Corr 2 (yi , yi ) .
I

dans la rgression simple,


R 2 = Corr 2 (yi , xi ) .
21 / 30

Units de mesure
I
I

Quarrive-t-il aux MCO et R 2 lorsque on change les units de mesure?


Revenons lexemple 1:
y = 963.191 + 18.501x.
Cette estimation a t faite avec

=
x =

y
I

salaire en milliers de dollars


rendement en pourcentage.

Supposez maintenant que


y = salaire en dollars.
Dans la rgression de y sur x,
y = 0 + 1 x,
cest quoi 0 et 1 (ainsi que le nouveau R 2 )?
22 / 30

Le changements dunits de mesure peut se traduire par


y = 1000
I
I

y.

si y = 856.3, alors le CEO gagne 856.300 mil dollars par ans.


ceci est quivalent y = $856300.

Cest assez clair quon devrait trouver


0 = 1000 0
1 = 1000 1 ,
i.e. la nouvelle droite de rgression est
yb = 963191 + 18501x.

y = 18501x, i.e. si x = 1 alors le salaire change de $18501.

Ceci est consistant avec y = 18.501x, qui impliquait un changement


de 18.501 mil dollars par ans suite un changement de x = 1.
23 / 30

Supposons maintenant quau lieu de mesurer x en pourcentage, on


mesure x en dcimal:
x
x = 10 ! x = 0.01x =
.
100

Quand on rgresse y sur x , on obtient


y = 0 + 1 x .
Cest quoi 0 et 1 ?
Nous pouvons montrer que
= = 963.191

I
I

1 = 100 1 = 100
I
I

18.501 = 1850.1.

0 = 0 puisque x = x = 0.
1 : si x = 1 alors y = 1 x = 1 = 18.501 mil dollars. Dans la
nouvelle rgression, un changement dun point de pourcentage dans x est
quivalente un changement de 0.01 dans x . Donc, si on multiplie 1
par 100, on obtient la mme rponse:
y = 1850.1x = 1850.1

0.01 = 18.501.
24 / 30

Mesure dajustement et units de mesure

Dans les deux cas, le R 2 ne change pas lorsquon change les units de
mesure!

25 / 30

Comment introduire des nonlinarits dans le modle de


rgression linaire?
I

Le modle
y = 0 + 1 x + u

est linaire par rapport aux paramtres.


Exemple de modles qui ne sont pas linaire par rapport aux paramtres:
y

= exp ( 0 + 1 x + u ) .

1
+u
0 + 1 x

(4)

Le modle suivant est linaire par rapport aux paramtres mme sil
nest pas linaire par rapport x :
y = 0 + 1 x 2 + u.

(3)

(5)

(3) peut facilement tre transform dans un modle linaire en prennant


la transformation logarithmique:
log y = 0 + 1 x + u

26 / 30

Comment intrprter les paramtres dans le modle


log-niveau
I

Soit la rgression estime suivante:


log\
(salaire ) = 0.584 + 0.083educ
n = 526, R 2 = 0.186.

I
I

Comment intrprter 1 = 0.083?


Soit
log (y ) = 0 + 1 x + u.
Alors
log (y )
1 =
x

100 y
y
100x

%y
,
100x

ce qui implique
%y = 1001 x.
I

Donc, si educ = 1, alors le salaire change de 8.3 = 100


pourcent, tout le reste constant.

0.083
27 / 30

The Simple
Regression Model
Fitted regression

The wage increases by 8.3 % for


every additional year of education
(= return to education)
For example:

Growth rate of wage is 8.3 %


per year of education
2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

28 / 30

Le modle log-log
I

Soit le modle de rgression linaire


log (y ) = 0 + 1 log (x ) + u.

I
I

Ce modle est toujours linaire par rapport aux paramtres.


On peut montrer que
1 =

d log y
dy /y
100dy /y
%y
=
=
=
.
d log x
dx /x
100dx /x
%x

Donc, 1 est une lasticit.


Exemple: on rgresse le log du salaire des CEO sur le log des ventes de
la rme:
log (salaire ) = 0 + 1 log (ventes ) + u.
Nous obtenons
log\
(salaire ) = 4.822 + 0.257 log (ventes ) .

1 = 0.257 : si les ventes augmentent de 1% alors le salaire annuel du


CEO augmente de 0.257%.
29 / 30

Le modle niveau-log
I

Soit le modle de rgression linaire


y = 0 + 1 log (x ) + u.

On peut montrer que


1 =

dy
dy
100dy
100y
=
=
=
.
d log x
dx /x
100dx /x
%x

Donc,
y =
I

1
(%x )
100 1

Exemple: on rgresse le nombre dheures travailles sur le log du salaire:


heures = 0 + 1 log (salaire ) + u.
Nous obtenons

\ = 33 + 45.1 log (salaire ) .


heures
I

1 = 45.1 : si le salaire augmente de 1% alors le nombre dheures


augmente de 45.1/100 = 0.45 heures, donc presque dune demie heure.
30 / 30

Você também pode gostar