Você está na página 1de 8

CARLOS PLASENCIA

WLADIMIR ORTEGA
ALEX HERRERA
BLADIMIR ANGAMARCA

TEORA DE LA CORRELACIN
A la correlacin se le puede definir como el grado de interconexin entre las variables,
que intenta determinar con que precisin describe o explica la relacin entre variables
en una ecuacin lineal o de cualquier otro tipo.
Si todos los valores de la ecuacin satisfacen una ecuacin exactamente, entonces se
dice que las variables estn perfectamente correlacionadas, o que hay correlacin
perfecta entre ellas. Por ejemplo las circunferencias C y los radios r de todos los
crculos estn perfectamente correlacionados porque C 2r , pero si se lanzan dos
dados 100 veces, no hay relacin entre las puntuaciones de ambos dados, entonces no
existe correlacin.
Cuando slo se estn manejando dos variables, se habla de correlacin simple y
regresin simple. Si se manejan ms variables se habla de correlacin mltiple y
regresin mltiple.
CORRELACIN LINEAL
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o
tambin llamado diagrama de dispersin) generada por una distribucin binomial.
Matemticamente, son posibles dos rectas de mximo ajuste:

La recta de regresin de Y sobre X:

Y a 0 a1 X

La recta de regresin de X sobre Y:


X b0 b1Y

Si X e Y son las dos variables con las que se va atrabajar, un diagrama de dispersin
muestra la localizacin de los puntos (X,Y) sobre un sistema rectangular de coordenadas.

Si Y tiende a crecer cuando X crece, la correlacin es positiva o directa. Si Y tiende a


decrecer cuando X crece, la correlacin es negativa o inversa.
Si todos los puntos parecen estar sobre una cierta curva la correlacin se llama no lineal,
y una ecuacin no lineal ser apropiada para la regresin.
Si no hay relacin entre las variables, entonces no existe correlacin.

MEDIDAS DE CORRELACIN
Se puede determinar de forma cualitativa con qu precisin describe una curva dada la
relacin entre variables por observacin directa del propio diagrama de dispersin.
Si se desea determinar de manera cuantitativa entonces se define medidas de
correlacin.
RECTA DE REGRESIN DE MNIMOS CUADRADOS
Para observar la calidad de relacin entre dos variables se analiza la recta de regresin
de mnimos cuadrados, entonces la recta de regresin de mnimos cuadrados de Y sobre
X es:
Y a 0 a1 X

Realizando la derivada respecto a a 0 y a1 respectivamente se obtiene las ecuaciones


normales:
(1) Y a 0 N a1 X
2
(2) XY a 0 X a1 X
Para encontrar a 0 y a1 se despeja y se obtienen las relaciones:
Despejando de (1) a 0 :
Y a1 X
a0
N
Reemplazando en (2)

Y a X

XY

XY

X a X

( X )( Y ) a1 ( X ) 2

a1 X 2

( X )( Y ) a1 ( X ) 2 a1 N X 2

XY

N XY ( X )( Y ) a1 ( X ) 2 a1 N X

a1

N XY ( X )( Y )
N X

Despejando de (2) a1 :
a1

Reemplazando en (1)

Y a

Y a

( X ) 2

XY a X
X
0

XY a X X

( XY )( X ) a ( X )
N
X

( X 2 )( Y ) a 0 N ( X 2 ) ( XY )( X ) a 0 ( X ) 2
a0

( Y )( X 2 ) ( X )( Y )
N X 2 ( X ) 2

Anlogamente, la recta de regresin de X sobre Y es:


X b0 b1Y

De donde b0 y b1 se obtienen de las ecuaciones normales:


(1) X b0 N b1 Y
2
(2) XY b0 X b1 Y
Y se obtiene:
b0

b1

( X )( Y 2 ) ( Y )( X )
N Y 2 ( Y ) 2

N XY ( X )( Y )
N Y 2 ( Y ) 2

Las ecuaciones de regresin son idnticas si y solo si todos los puntos del diagrama de
dispersin estn en una recta, entonces existe una correlacin lineal perfecta entre X e Y.
TEORIA MUESTRAL DE LA REGRESIN
La ecuacin Y=ao +a1 X se obtiene a partir de los datos de la muestra. A menudo estamos
interesados en la correspondiente ecuacin de regresin para la poblacin de la que
procede el muestreo. He aqu tres contrastes relativos a dicha poblacin:
1. Contraste de hiptesis a1=A1.- Para contrastar la hiptesis de que el
coeficiente de regresin a1 es igual a cierto valor A1 especificado, usamos el
hecho de que el estadstico tiene distribucin de student con N-2 grados de
libertad. Esto se puede tambin utilizar para hallar intervalos de confianza para
los coeficientes de regresin de la poblacin a partir de los valores de la muestra.

2. Contraste de hiptesis para valores de prediccin.- Sea Yo la prediccin para

el valor de Y correspondiente a X=Xo tal como se estima a partir de la ecuacin


de regresin muestral (Yo=ao+a1Xo). Sea yp la prediccin del valor de Y
correspondiente a X-Xo.
Entonces el estadstico tiene distribucin de student con N-2grados de libertad.
De donde pueden hallarse los lmites de confianza para las predicciones de los
valores poblacionales.

3.-Contraste de hiptesis para predicciones de valores medios.- Sea Yo el valor


de prediccin de Y correspondiente a X=Xo estimado a partir de la ecuacin de

regresin muestral ((Yo=ao+a1Xo). Denotemos por Yp la prediccin del valor medio


de Y correspondiente a X=Xo para la poblacin. Entonces el estadstico tiene
distribucin de student con N-2 grados de libertad. De ah se pueden reducir lmites
de confianza para las predicciones de los valores medios de la poblacin.

CORRELACION MULTIPLE Y PARCIAL


Correlacin Mltiple.- El grado de correlacin existente entre tres o ms variables se
llama correlacin mltiple. Los principios fundamentales implicados en los problemas
de correlacin mltiple son anlogos a la correlacin simple.
Notacin de subndices
Para permitir generalizaciones a nmeros grandes de variables, conviene adoptar una
notacin de subndices.
Denotaremos por X1 , X2 ,X3,.. las variables bajo consideracin. Entonces
denotaremos por X11, X12, X13,. los valores que toma la variable X1, y X21, X22,
X23,.. los que toma la variable X2, etctera. Con esta notacin, una suma tal como
X21+ X22+ X23+....+X2n se escribir
X2j,

X2j, o simplemente

X2. Cuando no haya anbiguedad, usaremos la ultima

notacin.
ECUACIONES DE REGRESION Y PLANOS DE REGRESION
Una ecuacin de regresin es una ecuacin para estimar una variable dependiente,
digamos X1, a partir de las variables independientes X2,X3,.. y se llama una ecuacin de
regresin de X1sobre X2, X3, .. En notacin funcional eso se escribe a veces brevemente
como X1=F(X2,X3,..).
Para el caso de tres variables, la ecuacin de regresin mas simple de X1 sobre X2 y X3
tinene la forma:
X1=b1.23+b12.3X2+b13.2X3
La ecuacin se llama una ecuacin de regresin lineal de X1 sobre X2 y X3. En un
sistema rectangular tridimensional de coordenadas representa un plano llamado plano de
regresin y es generalizacin de la recta de regresin en dos variables.
ECUACIONES NORMALES PARA EL PLANO DE REGRESION DE MINIMOS
CUADRADOS
Asi como existen rectas de regresin de minimos cuadrados que aproximan un conjunto
de n puntos dato (X,Y) en un diagrama de dispersin, existe tambin planos de
regresin minimos cuadrados que ajustan un conjunto de n puntos dato (X1,X2, X3) en
un diagrama de dispersion tridimensional.
Las ecuaciones son las siguientes:

PLANOS DE REGRESION Y COEFICIENTES DE CORRELACION


Si los coeficientes de correlacion entre variables X1 y X2, X1 y X3 y X2 y X3, se denotan
respectivamente po r12, r13 y r23 (llamados a veces oeficientes de correlacion de orden
cero), entonces el plano de regresin de minimos cuadrados tiene la ecuacin:

Donde

y donde S1, S2, S3 son la desviacin

tpica de X1, X2, X3, respectivamente.


ERROR TIPICO DE LA ESTIMACION
Podemos definir el error tpico de estimacin de

sobre

como

Donde
indica los valores estimados de tal como se calcula mediante las
ecuaciones de regresin.
En trminos de los coeficientes de correlacin
el error tpico de estimacin se puede calcular tambin a partir del resultado

La interpretacin muestral del error tpico de estimacin para dos variables, para que el
caso en que N es grande, puede extenderse a tres dimensiones sustituyendo las rectas
paralelas a la de regresin por planos paralelos al plano de regresin. Una estima mejor
del error tpico de estimacin de la poblacin viene dada por

COEFICIENTE DE CORRELACION MULTIPLE


En el caso de dos variables de dos variables independientes, por ejemplo, el coeficiente
de correlacin mltiple viene dado por

Un coeficiente de correlacin mltiple tal como


cuando esta mas cerca de 1 es mas
precisa la relacin entre las variables, y cuando esta mas cerca de 0 peor es la relacin
lineal cuando es uno es perfecta y 0 no hay relacin lineal.
CAMBIO DE VARIABLE DEPENDIENTE
Los resultados anteriores son validos cuando se considera a como variable
dependiente. Sin embargo, si queremos considerar a
dependiente en vez de

(por ejemplo) como la variable

solo tendramos que reemplazar los subndices 1 por 3 y 3 por

1 en las formulas ya obtenidas. Por ejemplo, la ecuacin de regresin de

sobre

seria

Que se deduce haciendo uso de


GENERALIZACION A MAS DE TRES VARIABLES
Estas se obtienen por analoga con los resultados precedentes. As las ecuaciones de
regresin lineal de sobre
, y
puede escribirse
Y representa un hiperplano en el espacio de cuatro dimensiones. Con esta ecuacin nos
da la ecuacin de regresin de mnimos cuadrados.
CORRELACION PARCIAL
A menudo es importante medir la correlacin entre una variable dependiente e
independiente particular, cuando todas las variables se suprimen (indicado con
frecuencia con la frase quedando igual las restantes). Esto se consigue definiendo un
coeficiente de correlacin parcial, excepto que hemos de considerar la variacin
explicada y la variacin inexplicada que aparecen tanto como sin la variable
independiente particular.
Si denotamos por

De la misma manera si
manteniendo

es el coeficiente de correlacin parcial entre

constantes entonces

En el caso de dos variables X y Y si dos rectas de regresin tienen ecuaciones


hemos visto que
generalizacin:

. Este resultado admite

Son ecuaciones de regresin lineales de


respectivamente entonces

sobre

de

sobre

=
Esto se puede adoptar como punto de partida para una definicin de los coeficientes de
correlacin parcial lineales.
RELACIONES ENTRE COEFICIENTES DE CORRELACION PARCIAL Y
MULTIPLE
Hay interesantes resultados que conectan los coeficientes de correlacin mltiple. Como
ejemplo:

REGRESION MULTIPLE NO LINEAL


Los resultados anteriores para regresin mltiple lineal. Se puede definir coeficientes de
correlacin parcial y mltiple por mtodos similares a los ya vistos.

Você também pode gostar