Escolar Documentos
Profissional Documentos
Cultura Documentos
225-sep-15
Qu vamos a estudiar
En este captulo vamos a tratar diferentes formas de describir la
relacin entre dos variables cuando estas son numricas.
Estudiar si hay relacin entre la altura y el peso.
Haremos mencin de pasada a otros casos:
Alguna de las variables es ordinal.
Estudiar la relacin entre el sobrepeso y el dolor de espalda (ordinal)
Variable
Independiente
(X)
Tipos de Variables
Variable
Dependiente
(Y)
225-sep-15
Conceptos bsicos
225-sep-15
ANLISIS DE REGRESIN
Qu es el anlisis de
regresin lineal ?
225-sep-15
Yi 0 1 X i i
para i=1,N
Yi 0 1 X iei
Yi = Variable dependiente
Xi = Variable independiente
0= intercepto (ordenada en le origen
1= pendiente
ei= error aleatorio
Luego el modelo
ajustado (estimado)
Yi 0 1 X i
225-sep-15
Datos de la muestra
x
x1
x2
.
.
.
xn
poblacional
y=0+1x+
Parmetros desconocidos
0.1
Ecuacin estimada de
regresin
Yi 0 1 X i
0 1
Material de Clases Germn Pomachagua Perez
225-sep-15
y
y1
y2
.
.
.
yn
El modelo de regresin
y el modelo ajustado es
yi 0 1 xi i
i 0 1 xi
y
i yi y i yi (0 1 xi ) i 1....n
Material de Clases Germn Pomachagua Perez
225-sep-15
SCE L
i 1
2
i
( yi 0 1 xi )
i 1
n xy x y
1
2
2
n x x
y
x
225-sep-15
Seccin A
Relacin lineal positiva
Seccin B
Relacin lineal negativa
y
Lnea de regresin
La pendiente
positiva
La pendiente
Lnea de regresin
* Ordenada al origen
es
La pendiente
1
0
es negativa
es
Seccin C
No hay relacin
*
Lnea de regresin
225-sep-15
10
EJEMPLO: Se lleva a cabo un experimento, para estudiar el efecto de cierto medicamento que
disminuya la frecuencia cardiaca en adultos. La variable independiente (X1) es la dosis en miligramos
( mg.) del producto y la variable dependiente (Y) es la diferencia despus de la administracin del
medicamento.
Y = reduccin del ritmo cardiaco (latidos por minuto)
X = dosis (mg.)
a.
b.
c.
i
1
2
3
4
5
6
7
8
9
10
X
0.50
0.75
1.00
1.25
1.50
2.00
2.50
3.00
3.25
3.50
Y
10
8
12
14
16
17
20
18
20
21
225-sep-15
12
Solucin: b)
i
1
2
3
4
5
6
7
8
9
10
TOTAL
X
0.50
0.75
1.00
1.25
1.50
2.00
2.50
3.00
3.25
3.50
19.25
Y
10
8
12
14
16
17
20
18
20
21
156
XY
5
6
12
17.5
24
34
50
54
65
73.5
341
X2
0.25
0.56
1.00
1.56
2.25
4.00
6.25
9.00
10.56
12.25
47.69
225-sep-15
Y2
100
64
144
196
256
289
400
324
400
441
2614
13
Reemplazando tenemos:
n xy x y
1
2
2
n x x
10(341) (19.25)(156)
1
3.828
2
10(47.69) (19.25)
y x
n
156
19.25
0
3.823
8.23
10
10
y 8.23 3.828x
225-sep-15
14
225-sep-15
15
COEFICIENTE DE
CORRELACION
Modelo
1
R cuadrado
,929a
R cuadrado corregida
,864
,847
Error tp. de la
estimacin
1,753
Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo
B
Error tp.
Beta
1
(Constante)
8,230
1,174
DOSIS
3,828
,538
,929
a. Variable dependiente: REDUCCION
y 8.23 3.828 x
Material de Clases Germn Pomachagua Perez
225-sep-15
t
7,010
7,120
Sig.
,000
,000
DIAGRAMA DE DISPERSIN
225-sep-15
COEFICIENTE DE DETERMINACION r2
(
y
i yi ) 2
Interpretacin: El 86.4% de la
r
2
i 1
n
(y
i 1
yi )
SC R
S yy
r 0.864
2
225-sep-15
19
n XY X Y
n X X
2
r r2
n Y Y
2
PROPIEDADES
Est dentro de -1 r 1
Si r > 0 entonces existe correlacin directa
Si r < 0 entonces existe correlacin inversa
Si r = 1 entonces existe correlacin perfecta positiva
Si r = -1 entonces existe correlacin perfecta inversa
Si r = 0 entonces no existe correlacin lineal (x no ayuda predecir y).
Tema Pomachagua
3: Estadstica bivariante
Material de Clases Germn
Perez
225-sep-15
20
225-sep-15
21
i
1
2
3
4
5
6
7
8
9
10
TOTAL
X
0.50
0.75
1.00
1.25
1.50
2.00
2.50
3.00
3.25
3.50
19.25
Y
10
8
12
14
16
17
20
18
20
21
156
XY
X2
5
0.25
6
0.56
12 1.00
17.5 1.56
24 2.25
34 4.00
50 6.25
54 9.00
65 10.56
73.5 12.25
341 47.69
Y2
100
64
144
196
256
289
400
324
400
441
2614
n XY X Y
n X X
2
n Y Y
2
10341 19.25156
0.92936
Tema Pomachagua
3: Estadstica bivariante
Material de Clases Germn
Perez
225-sep-15
22
Preguntas frecuentes
225-sep-15
225-sep-15
ei yi y i
i 1,2....n
225-sep-15
3) Los outliers (datos discordantes) afectan seriamente el ajuste por mnimo cuadrados
ordinarios. La observacin pareciera ser un outlier porque cae lejos del resto de datos.
225-sep-15
225-sep-15
225-sep-15
225-sep-15
por qu?
Qu hemos visto?
Relacin entre variables
Diagrama de dispersin
Covarianza
Relacin directa, inversa e incorrelacin
Correlacin lineal
Relacin directa, inversa e incorrelacin
grado de relacin lineal entre variables
Regresin, prediccin
Variable dependiente
Variable(s) independientes
Modelo lineal de regresin
Ordenada en el origen
Pendiente
Residuo, error
Bondad del ajuste, coef. determinacin
En el modelo lineal simple: r2
32