Você está na página 1de 32

350

300

250

200

150
0

100

50

f(x)=ax+b
R2=0.99

Moving average trend line with period = %PERIOD


R = NaN

REGRESIN
5

10

15

20

25

1
2
4
6
8
0

REGRESIN
Es una forma de estudiar la asociacin o relacin, entre
una variable dependiente (Y) y la variable que es la base de
la prediccin a la que se le denomina variable
independiente (X)
Y

El propsito del anlisis de regresin es usar los datos


o valores observados de las variables, para realizar
estimaciones, en base a una relacin funcional.

Regresin Simple, cuando en el


anlisis de regresin, se utiliza slo
una variable independiente.

Regresin Mltiple. cuando se considera


dos o ms variables independientes .
y=f(X1,X2)

y=f(x)

X2

X1

Donde:

y ... es la variable dependiente,


x, x1, x2, . . . , xk, .son variables independientes.
Tambin se clasifica en lineal y no lineal, segn el comportamiento
de las variables.

Qu vamos a estudiar
En esta unidad estudiaremos la Regresin Lineal simple, es
decir, vamos a tratar diferentes formas de describir la relacin
entre dos variables cuando estas son numricas.
Ejemplo:
Estudiar si hay relacin
entre la altura (X ) y el peso (Y ).
y=f(x)

El tiempo de estudio dedicado


a un curso (X) , esta relacionado
con la calificacin obtenida (Y)

2
0

MODELO DE REGRESIN LINEAL SIMPLE


Se busca encontrar una funcin de X muy simple (lineal) que
nos permita aproximar Y mediante la siguiente formula:
Y = 0 + 1 X

De
pe
nd
i

en
te
s

0 (ordenada en el origen,
constante)
1 (pendiente de la recta)
X

Esta
determinado
por 2
variables:

ientes
Independ
s
Explicativa
s
Predictora

Y e Y rara vez coincidirn


por muy bueno que sea el
modelo de regresin. A la
cantidad e=Y-Y se le
denomina residuo o error
residual.

Qu hacer para realizar una regresin

El paso inicial que


generalmente se realiza, es la
construccin del Diagrama De
Dispersin.
El 2 paso es, a travs del
Mtodo
de
los
Mnimos
Cuadrados,
estimar
los
Coeficientes de Regresin ( 0
y 1) para establecer la recta de
regresin.

X
Y = 0 + 1 X
0 (ordenada en el origen,
constante)
1 (pendiente de la recta)

Finalmente, cuando se realiza una prediccin estadstica, siempre


ser til calcular una medida que indique que tan preciso es el
pronstico de Y sobre X. A esta medida se le llama Error
Estndar de Estimacin.

DIAGRAMA DE DISPERSION
Es la representacin de los puntos o datos de cada una
de las variables en el plano cartesiano.
100
90
80
70
60
50
40
30
140

150

160

170

180

190

200

Es recomendable en todo estudio de regresin pues


permite tener una idea, sobre la existencia o no de la
regresin.

Modelos de Diagrama de Dispersin

Ejemplo: Estudio del conjunto de dos variables

A la derecha tenemos una posible manera de recoger los


datos obtenidos, observando dos variables en varios
individuos de una muestra.
En cada fila tenemos los datos de un individuo
Cada columna representa los valores que toma una
variable sobre los mismos.
Las individuos no se muestran en ningn orden
particular.

Dichas observaciones pueden ser representadas en un


diagrama de dispersin o nube de puntos.
En ellos, cada individuos es un punto cuyas coordenadas
son los valores de las variables.
Nuestro objetivo ser intentar reconocer a partir del mismo
si hay relacin entre las variables, de qu tipo, y si es
posible predecir el valor de una de ellas en funcin de la
otra.

Altura Peso
en cm. en Kg.
161

50

187

76

197

85

179

65

171

66

169

60

166

54

176

84

163

68

...

...

Diagramas de dispersin o nube de puntos


Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersin. Observar datos del cuadro anterior
100
90
80

Pesa 85 kg.
Pesa 76 kg.

Mide 187 cm.

60
50

Pesa 50 kg.
Mide
161 cm.

40
30
140

150

160

Mide 197cm

70

170

180

190

200

Relacin entre las variables altura (X) y peso (Y) de los 30


individuos vistos en el ejemplo anterior.
Peso (Kg.)
100
90
80
70
60

um
a
u ra
t
l
A

a
en t

au
o
es

nt
e
m

50
40
30
140

150

160

170

180

190

200
Altura (cm)

METODO DE LOS MINIMOS CUADRADOS


Este mtodo consiste en hallar los valores de 0 Y 1,
haciendo mnima la suma de los cuadrados de los errores.
Siendo la tarea principal en el anlisis de regresin lineal
simple.
Una vez obtenidos estos valores nos permitir establecer
la recta de regresin que mejor se ajuste a los datos o la recta
de mnimos cuadrados. Veamos las formulas a aplicar
Hallaremos la Suma Cruzada de X, Y con la siguiente formula:

SC xy

( Xi )( Yi )
X iYi
n

Luego, la Suma de Cuadrados de X de la siguiente manera:

SC x

X i2

( Xi ) 2
n

Con las formulas anteriores, obtenemos la pendiente de la recta:


1, haciendo la siguiente divisin:

B1

SC xy
SC x

El siguiente paso es hallar la ordenada en el origen: 0, con la


siguiente formula:
_

B0 y B 1 x

Xi
Yi

x
,y
_

donde:

Y obtenemos la ecuacin de regresin:

Y = 0+ 1(X)

EJEMPLO:
En un estudio de la relacin entre la publicidad de una nueva
Clnica de Salud por radio y el nmero de consultas realizadas
durante 10 semanas, se han recopilado los tiempos de duracin
en minutos de la publicidad por semana (X), y el nmero de
consultas realizadas(Y).
Semana

10

Publicidad X

20

30

30

40

50

60

60

60

70

80

Consultas
Realizadas Y

50

73

69

87

108

128

135

132

148

170

Solucin
X

XY

X2

Y2

20
30
30
40
50
60
60
60
70
80

50
73
69
87
108
128
135
132
148
170

1000
2190
2070
3480
5400
7680
8100
7920
10360
13600

400
900
900
1600
2500
3600
3600
3600
4900
6400

2500
5329
4761
7569
11664
16384
18225
17424
21904
28900

500

1100

61800

28400

134660

Tambin se utilizara los


promedios de las variables:

X Xi / n ,

Y Yi / n

Solucin
Reemplazando en las formula de los coeficientes de regresin, se tiene lo
siguiente:

( Xi)( Yi )
500 x 1100
X
Y

61800

ii
n
10
1

2
2
2
(500)
2 ( Xi )
28400

Xi n
10
_

0 y b x 110 2 (50) 10
Por lo tanto la recta de regresin Y = 0+ 1(X), estar determinada de la
siguiente manera Y = 10+ 2x.
Interpretacin
B0: El Nmero real de consultas realizadas es de 10.
B1: Por cada minuto de publicidad que se realice en la semana, el nmero de
consultas realizadas aumenta en 2.

Error Estndar y Error de Estimacin


Cuando se realiza una prediccin, es importante determinar
el error estndar, el cual se representa por Sy.x y mide la
dispersin de los datos observados con respecto a la lnea
de regresin.

Error de
prediccin

Sy.x

2
y
B0 y B1 xy

n2

134660 10(1100 ) 2(61800)


Sy.x
2.74
10 2
El error de estimacin,
que esta representado: e = y y

COEFICIENTE DE CORRELACIN

: se lee ro

TIPOS DE CORRELACIN

Correlacin de Pearson:

Los estadsticos a usar para estimar la


correlacin para datos cuantitativos son :
CORRELACIN DE PEARSON :
Cuando los datos se distribuyen con una distribucin
normal .
El coeficiente de correlacin se expresa como:

SC xy
SC x SC y

INTERPRETACIN DEL COEFICIENTE DE


CORRELACIN DE PEARSON
R

INTERPRETACIN

De 0.01 a 0.19

Correlacin Muy Baja

De 0.20 a 0.39

Correlacin Baja

De 0.40 a 0.69

Correlacin Moderada

De 0.70 a 0.89

Correlacin Alta

De 0.90 a 0.99

Correlacin Muy Alta

+1

Perfecta Positiva

-1

Perfecta Negativa

Correlacin Nula

Y=48+0.0514x

R2=0.3768

R=0.61384037

Você também pode gostar