Escolar Documentos
Profissional Documentos
Cultura Documentos
Slvia Gonalves
Universit de Montral
1 / 30
2 / 30
Soit
= 0 + 1 x + u,
E (u jx ) = 0.
y
Alors
E (y jx ) = 0 + 1 x
est la droite de rgression dans la population.
On peut crire
y = E (y jx ) + u,
o E (y jx ) dnote la partie systmatique et u la partie rsiduelle.
3 / 30
The Simple
Regression Model
, the
2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4 / 30
Les donnes
I
Soit
f(yi , xi ) : i = 1, . . . , ng
un chantillon alatoire de n observations:
yi est la valeur de la variable y pour lobservation i
xi est la valeur de la variable x pour lobservation i
I
(y1 , x1 ) !
(y2 , x2 ) !
(yn , xn ) !
premire observation
deuxime observation
..
.
`
neme
observation
5 / 30
La condition E (u jx ) = 0 implique
E (u ) = 0
(1)
E (xu ) = 0.
(2)
Lanalogue empirique de ui = yi
i, est le rsidu:
u i = yi
0
0
u i
= 0
xi u i
= 0.
i =1
i =1
6 / 30
ni=1 (xi
ni=1
x ) (yi
(xi
x )
y )
2
o
y = 0 + 1 x
est la valeur ajuste de y , et
u = y
est le rsidu.
7 / 30
The Simple
Regression Model
Fit as good as possible a regression line through the data points:
2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
8 / 30
30 = 1, 518.221,
The Simple
Regression Model
2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
10 / 30
Nous obtenons
y =
11 / 30
I
I
12 / 30
Variables:
I
I
13 / 30
1-7
14 / 30
Estimated slope =
= 2.28
Estimated intercept = = 698.9
Estimated regression line: TestScore
Copyright 2011 Pearson Addison-Wesley. All rights reserved.
= 698.9 2.28STR
4-12
15 / 30
Les comissions scolaires qui ont un tudiant de moins par professeur ont
un rsultat plus lev de 2.28:
Test
=
2 =
STR
2.28.
16 / 30
Number of obs =
420
F( 1,
418) =
19.26
Prob > F
= 0.0000
R-squared
= 0.0512
Root MSE
= 18.581
------------------------------------------------------------------------|
Robust
testscr |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
--------+---------------------------------------------------------------str | -2.279808
.5194892
-4.39
0.000
-3.300945
-1.258671
_cons |
698.933
10.36436
67.44
0.000
678.5602
719.3057
-------------------------------------------------------------------------
TestScore
= 698.9 2.28STR
(We
ll discuss the rest of this output later.)
4-15
17 / 30
u i
= 0
xi u i
= 0,
i =1
n
i =1
o
u i
yi
= yi yi : les rsidus
= 0 + 1 xi : les valeurs ajustes.
18 / 30
si x = x alors y = 0 + 1 x = y .
19 / 30
Mesure dajustement
I
(yi
i =1
Alors
y )2 =
{z
SST
(yi
i =1
{z
SSE
y )2 + u i2 .
}
i =1
| {z }
SSR
SST
SSE
SSR
=
+
,
SST
SST
SST
ce qui implique
R2
SSE
=1
SST
SSR
.
SST
20 / 30
100
I
R2
1.
Units de mesure
I
I
=
x =
y
I
y.
I
I
1 = 100 1 = 100
I
I
18.501 = 1850.1.
0 = 0 puisque x = x = 0.
1 : si x = 1 alors y = 1 x = 1 = 18.501 mil dollars. Dans la
nouvelle rgression, un changement dun point de pourcentage dans x est
quivalente un changement de 0.01 dans x . Donc, si on multiplie 1
par 100, on obtient la mme rponse:
y = 1850.1x = 1850.1
0.01 = 18.501.
24 / 30
Dans les deux cas, le R 2 ne change pas lorsquon change les units de
mesure!
25 / 30
Le modle
y = 0 + 1 x + u
= exp ( 0 + 1 x + u ) .
1
+u
0 + 1 x
(4)
Le modle suivant est linaire par rapport aux paramtres mme sil
nest pas linaire par rapport x :
y = 0 + 1 x 2 + u.
(3)
(5)
26 / 30
I
I
100 y
y
100x
%y
,
100x
ce qui implique
%y = 1001 x.
I
0.083
27 / 30
The Simple
Regression Model
Fitted regression
28 / 30
Le modle log-log
I
I
I
d log y
dy /y
100dy /y
%y
=
=
=
.
d log x
dx /x
100dx /x
%x
Le modle niveau-log
I
dy
dy
100dy
100y
=
=
=
.
d log x
dx /x
100dx /x
%x
Donc,
y =
I
1
(%x )
100 1