Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTADSTICA APLICADA
REGRESION Y
CORRELACION LINEAL
SIMPLE
Para predecir un
amplio rango de Medidas
fenmenos econmicas,
hasta diferentes
aspectos del
comportamient
Comenzando
o humano
por:
IMPORTANCIA DE LA REGRESIN Y CORRELACIN EN
LA ARQUITECTURA
La regresin lineal va muy de la mano de la arquitectura ya que sus modelos se pueden utilizar
para diferentes fines: descripcin de datos, estimacin de parmetros por mtodos de regresin
al ajustar un modelo a los datos que se obtienen en un experimento, prediccin y estimacin de
la variable respuesta tiles para la programacin de actividades y correcciones en un proceso
determinando; y control cuando se utiliza una ecuacin de estimacin.
Por ejemplo:
En construccin, mediante tcnicas de regresin lineal se caracterizarn diversas cualidades del
hormign. A partir del mdulo de elasticidad es posible predecir la resistencia a la compresin
de una determinada composicin de un hormign. Tambin se puede determinar la succin
capilar a partir del volumen absorbido por una muestra y el tiempo que ha durado la succin.
EN LA LITERATURA APARECE CIERTA DIVERSIDAD EN LA
FORMA EN QUE ESTOS DOS TIPOS DE VARIABLES SON
NOMBRADOS, TAL COMO:
Variable explicativa
Variable independiente (VI)
Variable predictora
Variable X
Variable de respuesta
Variable dependiente (VD)
Variable criterio
Variable Y
Es cuando una variable independiente ejerce influencia sobre otra variable dependiente.
Variable dependiente: la variable que se pronostica o estima.
Variable independiente: la variable que proporciona la base para la estimacin. Es la variable predictora.
Donde:
Y se lee Y prima, es el valor pronosticado de la
variable Y para un valor seleccionador de X.
a es la ordenada de la interseccin con el eje Y, es X es cualquier valor seleccionado de la variable
decir, el valor estimado de Y cuando X=0, es decir, independiente. En general, los valores de a y b
donde la recta de regresin cruza el eje Y. en la ecuacin de regresin se denominan
coeficientes de regresin estimados, o tambin
b es la pendiente de la recta, o el cambio promedio coeficientes de regresin.
en Y por unidad de cambio en la variable
independiente X.
X es cualquier valor seleccionado de la variable
independiente.
QU ES UN GRAFICO DE DISPERSION?
Se trata de una representacin grfica del grado de relacin
entre dos variables cuantitativas.
IMPACTO VISUAL
Un Diagrama de Dispersin muestra la
posibilidad de la existencia de
correlacin entre dos variables de un
vistazo. Es un tipo de diagrama matemtico que
utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un
COMUNICACIN conjunto de datos. Los datos se muestran
Simplifica el anlisis de como un conjunto de puntos, cada uno con
situaciones numricas el valor de una variable que determina la
complejas. posicin en el eje horizontal y el valor de la
otra variable determinado por la posicin
en el eje vertical.
GUA EN LA INVESTIGACIN
El anlisis de datos mediante esta herramienta proporciona
mayor informacin que el simple anlisis matemtico de
correlacin, sugiriendo posibilidades y alternativas de estudio,
basadas en la necesidad de conjugar datos y procesos en su
utilizacin.
El coeficiente de correlacin ( r ) es una medida de la
intensidad de la relacin entre dos variables.
Requiere datos con escala de intervalo o de razn
(variables).
Puede tomar valores entre -1.00 y 1.00.
Valores de -1.00 o 1.00 indican correlacin fuerte y
perfecta.
Valores cercanos a 0.0 indican correlacin dbil.
Valores negativos indican una relacin inversa y valores
positivos indican una relacin directa.
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada
recta de regresin.
Correlacin directa Correlacin inversa Correlacin nula
La recta correspondiente a la nube del En este caso se dice que las variables
La recta correspondiente a la de la
puntos de la distribucin es una recta son encorraladas y la nube de puntos
distribucin es una recta decreciente.
creciente. tiene una forma redondeada.
Correlacin no lineal
n(XY ) (X )(Y )
R
n(X 2
) (X ) 2 n Y 2 Y
2
8(397,200) ( 4,900)(636)
n = es el nmero de paresde observaciones.
8 ( 3 ,150 , 000
X = es la suma de los valores de la variable X. ( 4, 900 ) 2
8(51,606) (636)
2
La desviacin estndar se basa es los cuadrados de las desviaciones respecto a la media, mientras que el error estndar
de estimacin se basa en los en los cuadrados de las desviaciones respecto a la lnea de regresin. Si la suma de los
cuadrados de las desviaciones es pequea esto significa que la lnea de regresin es representativa de los datos. Si los
cuadrados son grandes, entonces la recta de regresin puede no representar a los datos.
()()
b= a= b Por tanto, la ecuacin de
2 ()
regresin es:
450 220
b=
10 10800 (220)(450) a= (1.1842) Y = a+b (x)
10 5600 (220) 10 10
b= 1.1842
DE MODO QUE SI UN VENDEDOR HACE 20 LLAMADAS
TELEFNICAS, PUEDE ESPERARSE QUE VENDA :
Y=18.9476+1.1842(X)
Y=18.9476+1.1842(20)
Y=42.6316
valor
b=1.1842 , significa que para cada llamada adicional que realizan los representantes de ventas pueden esperar
aumentar en casi 1.2 el numero de copiadoras vendidas.
El valor
a=18.9476 es el punto donde la ecuacin cruza el eje Y. Una traduccin literal es que si no se hacen llamadas,
esto es, X=0, se vendern 18.9476 copiadoras. Obsrvese que X=0 se encuentra fuera del intervalo de valores
incluidos en la muestra, las llamadas a clientes fueron de 10 a 40, as que los clculos deben hacerse dentro de
esa gama de valores.
ANLISIS DE CORRELACIN
100
800, 99
800, 93
90
Precio de libros (en $)
500, 84
500, 81
80
700, 75
600, 72
70
400, 69
600, 63
60
0 100 200 300 400 500 600 700 800 900
Pginas de libros
Calcule el coeficiente de correlacin
n(XY ) (X )( Y )
R
n(X 2
) (X ) 2
nY Y
2 2
0.614
n( XY ) ( X )( Y )
b
n( X 2 ) ( X ) 2
Y X
a b
n n
EJEMPLO
Desarrolle una ecuacin de regresin para la informacin dada en el ejemplo anterior que se puede utilizar para
estimar el precio de venta basado en el nmero de pginas.
636 4,900
a 0.05143 48 .0
8 8
La ecuacin de regresin es:
Y' = 48.0 + .05143X
La ecuacin cruza al eje Y en $48. Un libro sin las pginas costara $48.
La pendiente de la lnea es .05143. El costo de cada pgina adicional es de cinco cntimos.
El signo del valor de b y el signo del valor de r sern siempre iguales.
Podemos utilizar la ecuacin de regresin para
estimar valores de Y.
100
Precio de libros (en $)
90 y = 0.0514x + 48
R = 0.3768
80
Precio
Linear (Precio)
70
60
0 100 200 300 400 500 600 700 800 900
Pginas de libros
EL ERROR ESTNDAR DE ESTIMACIN