Você está na página 1de 30

UNIVERSIDAD PRIVADA ANTENOR ORREGO

ESTADSTICA APLICADA

REGRESION Y
CORRELACION LINEAL
SIMPLE

DOCENTE: MSc. SELENE YENGLE DEL CASTILLO


Tcnica
estadstica:

Relacin entre CLASES


utilizada
variables

Para estudiar: Regresin lineal simple


Anlisis de
Se adapta a una
regresin lineal
En lo social: amplia variedad
de situaciones
Regresin lineal mltiple

Para predecir un
amplio rango de Medidas
fenmenos econmicas,
hasta diferentes
aspectos del
comportamient
Comenzando
o humano
por:
IMPORTANCIA DE LA REGRESIN Y CORRELACIN EN
LA ARQUITECTURA

La regresin lineal va muy de la mano de la arquitectura ya que sus modelos se pueden utilizar
para diferentes fines: descripcin de datos, estimacin de parmetros por mtodos de regresin
al ajustar un modelo a los datos que se obtienen en un experimento, prediccin y estimacin de
la variable respuesta tiles para la programacin de actividades y correcciones en un proceso
determinando; y control cuando se utiliza una ecuacin de estimacin.
Por ejemplo:
En construccin, mediante tcnicas de regresin lineal se caracterizarn diversas cualidades del
hormign. A partir del mdulo de elasticidad es posible predecir la resistencia a la compresin
de una determinada composicin de un hormign. Tambin se puede determinar la succin
capilar a partir del volumen absorbido por una muestra y el tiempo que ha durado la succin.
EN LA LITERATURA APARECE CIERTA DIVERSIDAD EN LA
FORMA EN QUE ESTOS DOS TIPOS DE VARIABLES SON
NOMBRADOS, TAL COMO:

Variable explicativa
Variable independiente (VI)
Variable predictora
Variable X
Variable de respuesta
Variable dependiente (VD)
Variable criterio
Variable Y
Es cuando una variable independiente ejerce influencia sobre otra variable dependiente.
Variable dependiente: la variable que se pronostica o estima.
Variable independiente: la variable que proporciona la base para la estimacin. Es la variable predictora.

FORMA GENERAL DE LA ECUACION DE


REGRESIN SIMPLE
Y=a+bx

Donde:
Y se lee Y prima, es el valor pronosticado de la
variable Y para un valor seleccionador de X.
a es la ordenada de la interseccin con el eje Y, es X es cualquier valor seleccionado de la variable
decir, el valor estimado de Y cuando X=0, es decir, independiente. En general, los valores de a y b
donde la recta de regresin cruza el eje Y. en la ecuacin de regresin se denominan
coeficientes de regresin estimados, o tambin
b es la pendiente de la recta, o el cambio promedio coeficientes de regresin.
en Y por unidad de cambio en la variable
independiente X.
X es cualquier valor seleccionado de la variable
independiente.
QU ES UN GRAFICO DE DISPERSION?
Se trata de una representacin grfica del grado de relacin
entre dos variables cuantitativas.

IMPACTO VISUAL
Un Diagrama de Dispersin muestra la
posibilidad de la existencia de
correlacin entre dos variables de un
vistazo. Es un tipo de diagrama matemtico que
utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un
COMUNICACIN conjunto de datos. Los datos se muestran
Simplifica el anlisis de como un conjunto de puntos, cada uno con
situaciones numricas el valor de una variable que determina la
complejas. posicin en el eje horizontal y el valor de la
otra variable determinado por la posicin
en el eje vertical.
GUA EN LA INVESTIGACIN
El anlisis de datos mediante esta herramienta proporciona
mayor informacin que el simple anlisis matemtico de
correlacin, sugiriendo posibilidades y alternativas de estudio,
basadas en la necesidad de conjugar datos y procesos en su
utilizacin.
El coeficiente de correlacin ( r ) es una medida de la
intensidad de la relacin entre dos variables.
Requiere datos con escala de intervalo o de razn
(variables).
Puede tomar valores entre -1.00 y 1.00.
Valores de -1.00 o 1.00 indican correlacin fuerte y
perfecta.
Valores cercanos a 0.0 indican correlacin dbil.
Valores negativos indican una relacin inversa y valores
positivos indican una relacin directa.

NUBE DE PUNTOS O DIAGRAMA DE DISPERSIN.

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada
recta de regresin.
Correlacin directa Correlacin inversa Correlacin nula

La recta correspondiente a la nube del En este caso se dice que las variables
La recta correspondiente a la de la
puntos de la distribucin es una recta son encorraladas y la nube de puntos
distribucin es una recta decreciente.
creciente. tiene una forma redondeada.
Correlacin no lineal

Correlacin positiva perfecta


Correlacin negativa perfecta
FORMULA QUE NOS PERMITE HALLAR EL COEFICIENTE DE
CORRELACIN R DE PEARSON

n(XY ) (X )(Y )
R
n(X 2

) (X ) 2 n Y 2 Y
2

8(397,200) ( 4,900)(636)
n = es el nmero de paresde observaciones.

8 ( 3 ,150 , 000
X = es la suma de los valores de la variable X. ( 4, 900 ) 2
8(51,606) (636)
2

Y = es la suma de los valores


0.de614la variable Y.
(X2) = es la suma de los cuadrados de los valores de la variable X.
(X)2 = es el cuadrado de la suma de los valores de la variable X.
(Y2) = es la suma de los cuadrados de los valores de la variable Y.
(Y)2 = es el cuadrado de la suma de los valores de la variable Y.
XY = suma de los productos de X y Y.
Regla para la interpretacion del valor del coeficiente de correlacion R":
R =0 la correlacin es nula.
R < 0 a 0.20> la correlacin es positiva pero casi nula
R < -0.20 a 0 > la correlacion es negativa (inversa) pero casi nula
R < 0.20 a 0.40> la correlacion es positiva y baja
R < -0.20 a -0.40 > la correlacin es negativa (inversa) y baja
R < 0.40 a 0.70> la correlacin es positiva y buena o significativa
R < -0.40 a -0.70 > la correlacin es negativa (inversa) y buena o significativa
R < 0.70 a 1 > la correlacin es positiva y muy buena o muy significativa
R < -0.70 a -1 > la correlacin es negativa (inversa) y muy buena o muy significativa
R =1 la correlacin es perfecta positiva
R = -1 la correlacin es perfecta y negativa(inversa)
Mide la dispersin de los valores observados alrededor de la recta de regresin.

La desviacin estndar se basa es los cuadrados de las desviaciones respecto a la media, mientras que el error estndar
de estimacin se basa en los en los cuadrados de las desviaciones respecto a la lnea de regresin. Si la suma de los
cuadrados de las desviaciones es pequea esto significa que la lnea de regresin es representativa de los datos. Si los
cuadrados son grandes, entonces la recta de regresin puede no representar a los datos.

Frmulas usadas para calcular el error estndar:

El error de estndar de estimacin sirve para


mostrar la semejanza que existe en concepto y
calculo entre la desviacin estndar y el error
estndar de estimacin.
n: numero de la muestra
X: total de x
y : total y
a : ordenada de la y en la muestra
b: pendiente de la muestra
Regresin lineal mltiple

Este tipo se presenta cuando dos o ms


variables independientes influyen sobre
una variable dependiente. Ejemplo: Y
= f(x, w, z).

El modelo de regresin lineal mltiple


es idntico al modelo de regresin
lineal simple, con la nica diferencia de
que aparecen ms variables
explicativas.
CALCULOS NECESARIOS PARA DETERMINAR LA
ECUACIN DE REGRESION LINEAL SIMPLE DE MINIMOS
CUADRADOS
EJEMPLO

En la empresa COPIER SALES OF AMRICA, la gerente de


ventas recopilo informacin respecto al numero de llamadas
telefnicas hechas y la cantidad de copiadoras vendidas, para
una muestra de 10 representantes de ventas. A la seorita
Madeleine, gerente de esa rea, le gustara ofrecer informacin
especifica referente a la relacin entre el numero de llamadas
y la cantidad de productos vendidos. Utilice el mtodo de
mnimos cuadrados para determinar la ecuacin lineal.
Representant Llamadas de Copiadoras
X Y XY
es de ventas ventas (X) vendidas (Y)
CINTHIA 20 30 400 900 600

CAROLINA 40 60 1600 3600 2400

JOSE LUIS 20 40 400 1600 800

CARLOS 30 60 900 3600 1800

MILAGROS 10 30 100 900 300

MALENA 10 40 100 1600 400

BRYAN 20 40 400 1600 800

ANGEL 20 50 400 2500 1000

BEATRIZ 20 30 400 900 600

ANTONIO 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800


Encontrando b: Luego a:

()()
b= a= b Por tanto, la ecuacin de
2 ()
regresin es:
450 220
b=
10 10800 (220)(450) a= (1.1842) Y = a+b (x)
10 5600 (220) 10 10

10800099000 a= 45 1.1842 22 Y = 18.9476 + 1.1842(x)


b=
5600048400
a= 18.9476
9000
b=
7600

b= 1.1842
DE MODO QUE SI UN VENDEDOR HACE 20 LLAMADAS
TELEFNICAS, PUEDE ESPERARSE QUE VENDA :

Y=18.9476+1.1842(X)
Y=18.9476+1.1842(20)
Y=42.6316

valor
b=1.1842 , significa que para cada llamada adicional que realizan los representantes de ventas pueden esperar
aumentar en casi 1.2 el numero de copiadoras vendidas.

El valor
a=18.9476 es el punto donde la ecuacin cruza el eje Y. Una traduccin literal es que si no se hacen llamadas,
esto es, X=0, se vendern 18.9476 copiadoras. Obsrvese que X=0 se encuentra fuera del intervalo de valores
incluidos en la muestra, las llamadas a clientes fueron de 10 a 40, as que los clculos deben hacerse dentro de
esa gama de valores.
ANLISIS DE CORRELACIN

Sirve para medir la adecuacin del modelo hallado (bondad del


ajuste de la recta de regresin al conjunto de observaciones), en
el caso de tener una variable dependiente y varias
independientes.
Dicha medida nos la da el coeficiente de determinacin R2 ,
que verifica 0 R2 1.
Cuanto ms cercano a uno sea su valor, mayor es el grado de
asociacin lineal que existe entre la variable dependiente y las
independientes o predictoras.
Nos mide la proporcin de la variacin total de las
observaciones que se explican mediante la ecuacin (recta) de
regresin
Ejemplo
Juan Escobedo, presidente de la Biblioteca UPAO, se ocupa de estudiar el costo de los libros de texto para los
estudiantes de Arquitectura. l cree que hay una relacin entre el nmero de pginas en el texto y el precio de
venta del libro. Para proporcionar una prueba, selecciona una muestra de ocho libros de texto actualmente
existentes en la librera. Dibujar un diagrama de dispersin. Comprobar el coeficiente de correlacin.

Libro Pginas Precio ($)


Intr. a la Historia de la arquitectura 500 84
Anlisis estructural 700 75
Arte de proyectar 800 99
Arquitectura. Forma, espacio y orden 600 72
Arquitectura sostenible 400 69
Arquitectura e Interiores En Madera 500 81
La cuidad moderna 600 63
Color, espacio y estilo 800 93
Construya un diagrama de dispersin

100
800, 99

800, 93
90
Precio de libros (en $)

500, 84
500, 81
80

700, 75
600, 72
70
400, 69

600, 63
60
0 100 200 300 400 500 600 700 800 900

Pginas de libros
Calcule el coeficiente de correlacin

Libro Pginas Precio ($)


X Y XY X2 Y2
Intr. a la Historia Arq. 500 84 42,000 250,000 7,056
nalisis Estr. 700 75 52,500 490,000 5,625
Arte de Proyectar 800 99 79,200 640,000 9,801
Arq. Forma espacio y orden 600 72 43,200 360,000 5,184
Arq. sostenible 400 69 27,600 160,000 4,761
Arq. e interiores en madera 500 81 40,500 250,000 6,561
La cuidad moderna 600 63 37,800 360,000 3,969
Color, espacio y estilo 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606
Sustituyendo en la formula los valores encontrados y realizando los clculos
obtenemos:

n(XY ) (X )( Y )
R
n(X 2
) (X ) 2
nY Y
2 2

8(397,200) ( 4,900)( 636)



8(3,150,000 (4,900) 8(51,606) (636)
2 2

0.614

El coeficiente de correlacin de 0.614 indica una relacin muy


intensa entre la cantidad de pginas y el precio de los libros.
Calcule e interprete los coeficientes
de determinacin y no determinacin.
Coeficiente de Determinacin: Es el cuadrado del valor del coeficiente de correlacin (r).
El coeficiente de determinacin se simboliza por R2 y toma valores entre 0 y 1.
R2 = ( r )2 = (0.614)2 = 0.37
37% de la variacin en los precios fue debido a la variacin en las pginas de los libros.
Coeficiente de No Determinacin:
1- R2 = 1-0.37 = 0.63
63% de la variacin en los precios no fue debido a la variacin en las pginas de los libros.
ANLISIS DE REGRESIN

La ecuacin de regresin es: Y' = a + bX, donde:


Y' es el valor pronosticado de la variable Y para un valor seleccionado de X.
a es la ordenada de la interseccin con el eje Y cuando X = 0. Es el valor estimado de Y cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para cada cambio de una unidad en X.
el principio de mnimos cuadrados se utiliza para obtener a y b.

El principio de mnimos cuadrados se utiliza para obtener a y b. Las ecuaciones para


determinar a y b son:

n( XY ) ( X )( Y )
b
n( X 2 ) ( X ) 2
Y X
a b
n n
EJEMPLO

Desarrolle una ecuacin de regresin para la informacin dada en el ejemplo anterior que se puede utilizar para
estimar el precio de venta basado en el nmero de pginas.

8(397 ,200 ) (4,900 )( 636 )


b .05143
8(3,150 ,000 ) (4,900 ) 2

636 4,900
a 0.05143 48 .0
8 8
La ecuacin de regresin es:
Y' = 48.0 + .05143X
La ecuacin cruza al eje Y en $48. Un libro sin las pginas costara $48.
La pendiente de la lnea es .05143. El costo de cada pgina adicional es de cinco cntimos.
El signo del valor de b y el signo del valor de r sern siempre iguales.
Podemos utilizar la ecuacin de regresin para
estimar valores de Y.

El precio de venta estimado de un libro de 800 pginas es $89.14, encontrado por


Y 48 .0 0.05143 X
48 .0 0.05143 (800 ) 89 .14

100
Precio de libros (en $)

90 y = 0.0514x + 48
R = 0.3768

80
Precio
Linear (Precio)

70

60
0 100 200 300 400 500 600 700 800 900
Pginas de libros
EL ERROR ESTNDAR DE ESTIMACIN

El error estndar de estimacin mide la


EN EL EJEMPLO ANTERIOR:
dispersin de los valores observados alrededor
Encuentre el error estndar de estimacin para el problema que
de la lnea de regresin. implica el nmero de pginas en un libro y el precio de venta.
Las frmulas que se utilizan para comprobar el
error estndar son:
(Y Y ) 2 Y aY bXY
2
s y. x s y. x
n2 n2
51,606 48 (636 ) 0.05143 (397 , 200 )
Y aY bXY
2
82
n2 10 .408
CASO PRACTICO:
La Ferretera Lorito desea estimar sus ventas X:Inversin Semanal en Y:Ventas Semanales
semanales en soles, teniendo como variable Publicidad en soles en soles
independiente la inversin semanal en 110 3338
publicidad en soles, los datos se presentan a
145 3685
continuacin en la tabla adjunta.
169 3805
Calcular e interpretar:
a) Ecuacin de regresin lineal.
145 3805
b) Diagrama de dispersin. 129 3872
c) Coeficiente de correlacin.
d) Coeficiente de determinacin. 123 3471
e) Coeficiente de no determinacin.
f) Error estndar de estimacin. 166 3738
163 4032
172 4205
190 4406

Você também pode gostar