Escolar Documentos
Profissional Documentos
Cultura Documentos
__________________
Bibliografa: Tema 10 (pg. 185-210)
Ejercicios recomendados del libro: 1, 2, 3, 5, 6, 8, 11, 12, 13,
16, 17, 19 y 24..
Carmen Ximnez
Anlisis de Datos I
1. INTRODUCCIN
OBJETIVO: Hacer predicciones o pronsticos en una variable (Y) a partir de otra (X):
Regresin de Y sobre X
Variable predictora: X (o variable independiente, VI) La que se utiliza para hacer pronsticos
Variable criterio:
Y (o variable dependiente, VD) Sobre la que se pronostica
Para ello, se crea un modelo (la recta de regresin Y = A + B X) que se aproxime o ajuste
lo ms posible a los datos observados en X y en Y.
(Y i - Y i)2
(Y
Modelo en Directas:
YX
Yi ' ) 2
n
- Pendiente: B
Yi = A + B Xi
n Xi Yi
X Y
n X -( X )
i
2
2
i
O Tambin:
BYX = rXY
SY
SX
- Origen: A YX = Y - B YX X
Modelo en Diferenciales: yi = a + b xi
Modelo en Tpicas: zy = a* + b* ZX
*
- Origen: no hay (a = 0)
- Pendiente: b = BYX
- Origen: no hay ( a = 0 )
*
- Pendiente: b = rxy
Por tanto: y = b x
Por tanto: zy = b* Zx
Yi
Puntuacin
emprica
Carmen Ximnez
Yi
Puntuacin
pronosticada
(Yi Yi)
Error en el
pronstico
Anlisis de Datos I
SY2 ' =
Donde:
(Y
2
S Y-Y
' =
'
Y' )2
n
(Yi Yi' ) 2
n
= S Y2 X
S Y(Y-Y) = 0
Sustituyendo:
S Y2 = S Y2 ' + S Y2 X
2
SY2 X = SY2 (1 rXY
)
S Y2 '
=
............. Proporcin de varianza explicada por el modelo
S Y2
1 r2 =
S Y2 X
S Y2
4. EJEMPLO (resuelto)
X: Auto-registro del n cigarrillos fumados al da
Y: Deseos de comenzar una terapia contra el tabaco
5
8
X
Y
7
6
9
7
13
5
6
9
10
8
6
4
2
0
0
10 12 14
rxy =
X Y
n X (X ) n Y (Y )
n Xi Yi
2
i
2
i
5 264 40 35
5 360 402 5 255 352
= 0,80
Carmen Ximnez
Anlisis de Datos I
:
Media
Varianza
Desv. tp.
X
5
7
9
13
6
40
8
8
2,83
X2
25
49
81
169
36
360
Y
8
6
7
5
9
35
7
2
1,41
Y2
64
36
49
25
81
255
XY
40
42
63
65
54
264
B=
n Xi Yi
n X
X Y
- ( X )
2
i
5 264 40 35 80
=
= 0,40
5 360 402
200
A = Y - BX = 7 - (-0,40)(8) = 10,2
Diferenciales yi = -0,40 xi
Tpicas zyi = -0,80 zxi
10
8
6
Y - Y (Y - Y)2
-0,20
0,04
-1,40
1,96
0,40
0,16
0
0
1,20
1,44
0
3,6
0
0,72
0,72
Y
8,20
7,40
6,60
5
7,80
:
35
Media
7
Varianza 1,28
4
2
0
0
8 10 12 14
S Y2 = S Y2 ' + S Y2 X
2
S Y2 = 2 .... S Y2 X = S Y2 (1 rXY
) = 2 (1 0 , 64 ) = 0 , 72
S Y2 ' = S Y2 S Y2 X = 2 0 , 72 = 1 , 28
III. Aplicacin del modelo
Carmen Ximnez
Anlisis de Datos I
5. EJERCICIOS
EJERCICIO 1
Xi
4
5
2
Yi
8
7
4
X: Horas de estudio
Y: Calificacin obtenida
Y
0,85
V
0,62
-0,93
Medias:
15
21
12
Varianzas:
14
R=
X
Y
V
Carmen Ximnez