Escolar Documentos
Profissional Documentos
Cultura Documentos
WLADIMIR ORTEGA
ALEX HERRERA
BLADIMIR ANGAMARCA
TEORA DE LA CORRELACIN
A la correlacin se le puede definir como el grado de interconexin entre las variables,
que intenta determinar con que precisin describe o explica la relacin entre variables
en una ecuacin lineal o de cualquier otro tipo.
Si todos los valores de la ecuacin satisfacen una ecuacin exactamente, entonces se
dice que las variables estn perfectamente correlacionadas, o que hay correlacin
perfecta entre ellas. Por ejemplo las circunferencias C y los radios r de todos los
crculos estn perfectamente correlacionados porque C 2r , pero si se lanzan dos
dados 100 veces, no hay relacin entre las puntuaciones de ambos dados, entonces no
existe correlacin.
Cuando slo se estn manejando dos variables, se habla de correlacin simple y
regresin simple. Si se manejan ms variables se habla de correlacin mltiple y
regresin mltiple.
CORRELACIN LINEAL
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o
tambin llamado diagrama de dispersin) generada por una distribucin binomial.
Matemticamente, son posibles dos rectas de mximo ajuste:
Y a 0 a1 X
Si X e Y son las dos variables con las que se va atrabajar, un diagrama de dispersin
muestra la localizacin de los puntos (X,Y) sobre un sistema rectangular de coordenadas.
MEDIDAS DE CORRELACIN
Se puede determinar de forma cualitativa con qu precisin describe una curva dada la
relacin entre variables por observacin directa del propio diagrama de dispersin.
Si se desea determinar de manera cuantitativa entonces se define medidas de
correlacin.
RECTA DE REGRESIN DE MNIMOS CUADRADOS
Para observar la calidad de relacin entre dos variables se analiza la recta de regresin
de mnimos cuadrados, entonces la recta de regresin de mnimos cuadrados de Y sobre
X es:
Y a 0 a1 X
Y a X
XY
XY
X a X
( X )( Y ) a1 ( X ) 2
a1 X 2
( X )( Y ) a1 ( X ) 2 a1 N X 2
XY
N XY ( X )( Y ) a1 ( X ) 2 a1 N X
a1
N XY ( X )( Y )
N X
Despejando de (2) a1 :
a1
Reemplazando en (1)
Y a
Y a
( X ) 2
XY a X
X
0
XY a X X
( XY )( X ) a ( X )
N
X
( X 2 )( Y ) a 0 N ( X 2 ) ( XY )( X ) a 0 ( X ) 2
a0
( Y )( X 2 ) ( X )( Y )
N X 2 ( X ) 2
b1
( X )( Y 2 ) ( Y )( X )
N Y 2 ( Y ) 2
N XY ( X )( Y )
N Y 2 ( Y ) 2
Las ecuaciones de regresin son idnticas si y solo si todos los puntos del diagrama de
dispersin estn en una recta, entonces existe una correlacin lineal perfecta entre X e Y.
TEORIA MUESTRAL DE LA REGRESIN
La ecuacin Y=ao +a1 X se obtiene a partir de los datos de la muestra. A menudo estamos
interesados en la correspondiente ecuacin de regresin para la poblacin de la que
procede el muestreo. He aqu tres contrastes relativos a dicha poblacin:
1. Contraste de hiptesis a1=A1.- Para contrastar la hiptesis de que el
coeficiente de regresin a1 es igual a cierto valor A1 especificado, usamos el
hecho de que el estadstico tiene distribucin de student con N-2 grados de
libertad. Esto se puede tambin utilizar para hallar intervalos de confianza para
los coeficientes de regresin de la poblacin a partir de los valores de la muestra.
X2j, o simplemente
notacin.
ECUACIONES DE REGRESION Y PLANOS DE REGRESION
Una ecuacin de regresin es una ecuacin para estimar una variable dependiente,
digamos X1, a partir de las variables independientes X2,X3,.. y se llama una ecuacin de
regresin de X1sobre X2, X3, .. En notacin funcional eso se escribe a veces brevemente
como X1=F(X2,X3,..).
Para el caso de tres variables, la ecuacin de regresin mas simple de X1 sobre X2 y X3
tinene la forma:
X1=b1.23+b12.3X2+b13.2X3
La ecuacin se llama una ecuacin de regresin lineal de X1 sobre X2 y X3. En un
sistema rectangular tridimensional de coordenadas representa un plano llamado plano de
regresin y es generalizacin de la recta de regresin en dos variables.
ECUACIONES NORMALES PARA EL PLANO DE REGRESION DE MINIMOS
CUADRADOS
Asi como existen rectas de regresin de minimos cuadrados que aproximan un conjunto
de n puntos dato (X,Y) en un diagrama de dispersin, existe tambin planos de
regresin minimos cuadrados que ajustan un conjunto de n puntos dato (X1,X2, X3) en
un diagrama de dispersion tridimensional.
Las ecuaciones son las siguientes:
Donde
sobre
como
Donde
indica los valores estimados de tal como se calcula mediante las
ecuaciones de regresin.
En trminos de los coeficientes de correlacin
el error tpico de estimacin se puede calcular tambin a partir del resultado
La interpretacin muestral del error tpico de estimacin para dos variables, para que el
caso en que N es grande, puede extenderse a tres dimensiones sustituyendo las rectas
paralelas a la de regresin por planos paralelos al plano de regresin. Una estima mejor
del error tpico de estimacin de la poblacin viene dada por
sobre
seria
De la misma manera si
manteniendo
constantes entonces
sobre
de
sobre
=
Esto se puede adoptar como punto de partida para una definicin de los coeficientes de
correlacin parcial lineales.
RELACIONES ENTRE COEFICIENTES DE CORRELACION PARCIAL Y
MULTIPLE
Hay interesantes resultados que conectan los coeficientes de correlacin mltiple. Como
ejemplo: