Você está na página 1de 47

ESTADISTICA DE PRONOSTICOS Y MODELOS

MULTIVARIABLES
GUIA DE CLASE N 1
CORRELACIN
PRUEBAS DE CORRELACIN ENTRE VARIABLES.
PROPIEDADES DE COEFICIENTE DE CORRELACIN.
COEFICIENTE R DE PEARSON
COEFICIENTE RHO DE SPERMAN

Mg. JUANA SEGURA MARQUEZ


LIC. ESTADISTICA , MATEMATICA Y COMPUTACION
Mg. JUANA SEGURA MARQUEZ 1
COMPETENCIA
CORRELACION: mide la fuerza de la relacin
lineal entre dos variables aleatorias.

Mg. JUANA SEGURA MARQUEZ 2


DIAGRAMA DE ESPARCIMIENTO
(Grfica de Calibracin)
Si tenemos n observaciones bidimensionales,
cada par de datos (X, Y) puede representarse en
un sistema de eje de coordenadas cartesianas.
Cada pareja de observaciones se representa por
un punto sobre el plano y la totalidad de puntos
registrados se denomina diagrama de dispersin
o, para casos de equipos, grficas de calibracin.
Mg. JUANA SEGURA MARQUEZ 3
DIAGRAMA DE DISPERSION

Mg. JUANA SEGURA MARQUEZ 4


ANALISIS DE CORRELACION SIMPLE
Es una herramienta estadstica que nos
permite describir el grado de relacion
que hay entre dos variables:

1.Coeficiente de determinacin
2 coeficiente de correlacin

Mg. JUANA SEGURA MARQUEZ 5


ANALISIS DE CORRELACION SIMPLE

El coeficiente de correlacin mide el grado o

fuerza de la relacion que existe entre dos

variables.

Mg. JUANA SEGURA MARQUEZ 6


CORRELACIN ENTRE
VARIABLES CUANTITATIVAS

Los componentes fundamentales de una


relacin entre dos variables cuantitativas son:

La Fuerza El Sentido La Forma

Mg. JUANA SEGURA MARQUEZ 7


FUERZA, SENTIDO Y FORMA DE
LA CORRELACIN

La relacin entre dos variables


cuantitativas queda representada
mediante la lnea de mejor ajuste,
trazada a partir de la nube de puntos.
Los principales componentes
elementales de una lnea de ajuste y, por
lo tanto, de una correlacin, son la
fuerza, el sentido y la forma:
Mg. JUANA SEGURA MARQUEZ 8
ANALISIS DE CORRELACION
LA FUERZA
Mide el grado en que la lnea representa a la
nube de puntos: si la nube es estrecha y
alargada, se representa por una lnea recta, lo
que indica que la relacin es fuerte; si la nube
de puntos tiene una tendencia elptica o
circular, la relacin es dbil.

Mg. JUANA SEGURA MARQUEZ 9


ANALISIS DE CORRELACION
EL SENTIDO
Mide la variacin de los valores de Y con
respecto a X: si al crecer los valores de X
lo hacen los de Y, la relacin es directa
(pendiente positiva); si al crecer los
valores de X disminuyen los de Y, la
relacin es inversa (pendiente negativa).

Mg. JUANA SEGURA MARQUEZ 10


ANALISIS DE CORRELACION
LA FORMA
Establece el tipo de lnea que define el mejor
ajuste: la lnea recta, la curva monotona o la
curva no monotona
LINEA RECTA
y = B0 + B1x

Mg. JUANA SEGURA MARQUEZ 11


CURVA MONOFNICA CURVA NO MONOFNICA

En el caso de usar una curva monofnica, ese factor de proporcin


entre las dos variables no es constante a lo largo de toda la recta, y
por lo tanto la pendiente de la misma es variable en su recorrido. Se
dice que la lnea de ajuste es no lineal puesto que es una curva.

Por ltimo, en el caso de usar una curva no monofnica vara


tanto la pendiente de la curva como el sentido de la relacin, que
en unos sectores puede ser positiva (ascendente) y en otros
Mg. JUANA SEGURA MARQUEZ 12
negativa (descendente).
ASUNCIONES PARA QUE UN ESTUDIO DE CORRELACION
SIEMPRE TENGA VALIDEZ
Entre X e Y hay una asociacin de
proporcionalidad en lnea recta.
En la distribucin invariada, a un valor dado de la
variable X le corresponde una distribucin normal
de valores de X.
cada una de las distribuciones de y tiene una
varianza que representamos por xy
2

Asumimos que estas varianzas son homogneas e igualmente


asumimos que hay homogeneidad entre las varianzas
Mg. JUANA SEGURA MARQUEZ 13
correspondientes a la distribucin de X.
EL COEFICIENTE DE CORRELACIN
El coeficiente de correlacin ( r ) es una medida
relativa de la relacin entre las variables. Vara de
cero ( no hay correlacin ) hasta 1 ( correlacin
perfecta ).
El coeficiente de correlacin puede definirse
como una medida del grado en que la variable
independiente es responsable de la variabilidad
en la variable dependiente.
Mg. JUANA SEGURA MARQUEZ 14
COEFICIENTE DE CORRELACION
LINEAL DE PEARSON
S XY
r
S X * SY
S x: desviacin estndar de la variable X
S y: desviacin estndar de la variable y

SXY: La covarianza mide el grado en que X e Y


varan entre s, y la desviacin estndar de X e
Y mide la Variacin individual.
Mg. JUANA SEGURA MARQUEZ 15
COEFICIENTE DE CORRELACION
COV ( XY )
r
SxSy
DONDE :

COV ( XY )
( Xi x )(Yi y )
n 1

Sx
( Xi X ) 2

Sy
(Yi Y ) 2

n 1 Mg. JUANA SEGURA MARQUEZ


n 1 16
COEFICIENTE DE CORRELACION

c ov ( x, y ) r
SPdeXY
r
S X * SY SCX * SCY

r
( xi x )( yi y)
( xi x ) 2
( yi y ) 2

Mg. JUANA SEGURA MARQUEZ 17


COEFICIENTE DE CORRELACION

Mg. JUANA SEGURA MARQUEZ 18


EL COEFICIENTE DE CORRELACIN

De r= 0.2 a r= 0.3 coeficiente muy bajo


De r= 0.4 a r= 0.5 coeficiente bajo
De r= 0.6 a r= 0.7 coeficiente alto
De r= 0.8 a r= 1.0 coeficiente muy alto

Mg. JUANA SEGURA MARQUEZ 19


CARACTERISTICAS DEL COEFICIENTE DE
CORRELACION
1. Los coeficientes son nmeros abstractos.
2.El valor de estos coeficientes no pueden ser
mayor que + 1, ni menor de - 1.
3.Si el coeficiente tiene signo positivo, quiere decir
que las dos caractersticas estudiadas tienden a
variar en el mismo sentido, esto es , si se
incrementa el valor de una caracterstica , se
incrementa el valor de la otra. Si el signo es
negativo, esto quiere decir que las caractersticas
Mg. JUANA SEGURA MARQUEZ 20
CARACTERISTICAS DEL COEFICIENTE DE CORRELACION
4. La relacin entre las variables es tanto ms
estrecha , cuando el valor del coeficiente de
correlacin se acerque a +1 -1.
5. Si la relacin es perfecta, el valor de r ser
igual a +1 -1 segn sea positiva o negativa
la relacin Pero si no hay relacin alguna , el
valor de r deber ser cero.
6. El valor de r no est influenciado por el
tamao de las unidades de medidas
Mg. JUANA SEGURA MARQUEZ 21
empleadas para medir las caractersticas.
EL COEFICIENTE DE CORRELACIN LINEAL DE
PEARSON
Si el coeficiente de correlacin de Pearson (r) es
cercano a 0, las dos variables no tienen mucho
que ver entre s (no tienen casi ninguna
covariacin lineal). Si su valor es cercano a +/-1,
esto significa que la relacin entre las dos
variables es lineal y est bien representada por
una lnea.

Mg. JUANA SEGURA MARQUEZ 22


CORRELACION

Correlacin perfecta Correlacin perfecta


negativa positiva
-1 +1
fuerte fuerte
negativa positiva

-0.5 +0.5
dbil dbil
negativa positiva
0

Sin Correlacin

Mg. JUANA SEGURA MARQUEZ 23


EJEMPLO:
Si queremos medir la correlacin entre puntajes
de prueba de habilidad manual y clasificaciones
de produccin para 20 trabajadores.
1. El coeficiente de correlacin nos indica la
cantidad promedio de cambio en la produccin
por cada cambio unitario en el puntaje de la
prueba.
2. El error estndar del estimado nos dice hasta
qu punto es inexacto nuestro estimado de la
produccin. Mg. JUANA SEGURA MARQUEZ 24
Nivel de significacin del
coeficiente de correlacin
Cundo debemos confiar en que la correlacin en la
muestra es una buena estimacin de la correlacin en la
poblacin?.
Esto depende de dos factores:
1- del tamao del coeficiente, a mayor r menor
probabilidad de que haya sido elegido por error.
2- el tamao de la muestra, cuanto mayor el tamao
muestra, mayor ser la probabilidad de encontrar un
coeficiente de correlacin similar en otras muestras, y en la
poblacin general como un todo. 1
Mg. JUANA SEGURA MARQUEZ 25
INTERVALO DE CONFIANZA PARA R
Podemos obtener intervalos de
confianza (IC) para la correlacin en la
poblacin, con la frmula:
IC = r + z/2 *

/2 1- /2
r - z/2* R r - z/2*
Mg. JUANA SEGURA MARQUEZ 26
INTERVALO DE CONFIANZA PARA R

Donde:
r: Coeficiente de correlacin
z/2: Limite de confianza

ee: Error estndar


=1-(+r)2
n
Mg. JUANA SEGURA MARQUEZ 27
Prueba acerca del Coeficiente de
Correlacin
Si queremos ver si realmente existe una medida de
relacin lineal entre dos variables X y Y en una
poblacin que tiene una distribucin bivariada
normal, la hiptesis ser :

Mg. JUANA SEGURA MARQUEZ 28


PRUEBA DE HIPOTESIS
PARA R
H0: La hiptesis nula es de que no hay asociacin entre las
variables en la poblacin, la correlacin es 0.
H0: r=0
HA: La hiptesis alternativa es de que hay asociacin entre
las variables en la poblacin, la correlacin es 0.
H0: r0
Usamos la
estadstica
de prueba:
Mg. JUANA SEGURA MARQUEZ 29
COEFICIENTE DE CORRELACION
DE SPERMAN: p (SPSS)
Spearman: Versin no paramtrica del coeficiente
de correlacin de Pearson, que se basa en los rangos
de los datos en lugar de hacerlo en los valores reales.
Resulta apropiada para datos ordinales, o los de
intervalo que no satisfagan el supuesto de
normalidad. Los valores del coeficiente van de -1 a
+1. El signo del coeficiente indica la direccin de la
relacin y el valor absoluto del coeficiente de
correlacin indica la fuerza de la relacin entre las
variables. Los valoresMg.absolutos mayores indican que30
JUANA SEGURA MARQUEZ
la relacin es mayor.
CORRELACION
P1. Las estaturas y pesos de 12 estudiante de Ing
EST: PESO: Y (xi-x) (yi-y) (xi-x)(yi-y) (xi-x)2 (yi-y)2
x
1.60 80
1.68 87
1.69 88
1.70 95
1.88 87
1.89 86
1.79 59
1.68 84
1.69 99
1.70 88
1.88 77
Mg. JUANA SEGURA MARQUEZ 31
1.67 82
CORRELACION
Se pide:
a. Estatura promedio
b. Peso promedio
c. Varianza de las estaturas
d. Varianza de los pesos
e. Variacion del peso
f. Variacin de la estatura
g. Se trata de una relacion lineal?. (Analizar el diagrama
de dispersin)
h. Coeficiente de correlacin
i. Interpretar resultados
j. Estimar r mediante un IC.
k. Mediante PH verifique si los pesos y las
Mg. JUANA SEGURA MARQUEZ 32
estaturas estn correlacionadas
SOLUCION USANDO SPSS
EJEMPLO2: Se da una muestra de 10 empresas
del rubro licorera donde se indica el gasto en
publicidad mensual en soles y la ganancia neta
mensual en soles a. Se trata de una relacion
G.P G.M lineal?. (Analizar el diagrama
de dispersin)
1870 14900
1600 9300 b. Calcular el coeficiente de
1750 13300 correlacin lineal
1930 15500 c. Mediante una PH. Verifique si
1500 9000
1950 18200 el gasto en P y las ganancias
1870 16000 netas estn correlacionadas
1690 12300
1790 14200
Mg. JUANA SEGURA MARQUEZ 33
1870 15000
SOLUCION USANDO SPSS
PASO 1: CREAR LA BASE DE DATOS

Mg. JUANA SEGURA MARQUEZ 34


Mg. JUANA SEGURA MARQUEZ 35
Se evidencia un patrn lineal, medida que los gastos en
publicidad aumentan, tambin lo hacen las ganancias
netas.
Es decir hay una relacion lineal entre los gastos y las
ganancias netas.
Mg. JUANA SEGURA MARQUEZ 36
PASO 3.
Para probar si existe una relacion lineal entre las
variable independiente y dependiente determinamos
el coeficiente de correlacin de pearson y de
Sperman y contrastamos
H0: R=0 H0: P0=0
H0: R0 H0: P00
Donde R Y PO es la correlacin poblacional entre los
gastos en publicidad y ganancias netas

Mg. JUANA SEGURA MARQUEZ 37


En este caso, variable dependiente es
GANANCIA, que es la que queremos
predecir, y la independiente o predectora
es GASTOS
ESCOGEMOS:
Analizar/ correlacin / Bivariadas
VARIABLES: GANANCIA, GASTOS
Marcamos: Pearson, Sperman
prueba bilateral

Mg. JUANA SEGURA MARQUEZ 38


H0: R=0
H0: R0
Valor de r
Valor de p

El valor de la correlacin lineal muestral es 0.966


La hiptesis nula se rechaza, pues la significancia es
(0.000 es menor a 0.05
Luego concluimos que los gastos y la ganancia si
estn relacionados linealmente de manera positiva
Mg. JUANA SEGURA MARQUEZ 39
H0: P0=0
H0: P00

Valor de P0
Valor de p

El valor de la correlacin lineal muestral es 0.963


La hiptesis nula se rechaza, pues la significancia es
(0.000 es menor a 0.05
Luego concluimos que los gastos y la ganancia si
estn relacionados linealmente de manera positiva
Mg. JUANA SEGURA MARQUEZ 40
LABORATORIO N 2

Mg. JUANA SEGURA MARQUEZ 41


CORRELACION

P3. Una compaa desea hacer predicciones del


valor anual de sus ventas totales en cierto pas a
partir de la relacin de stas y la renta nacional.
Para investigar la relacin cuenta con los siguientes
datos:

Mg. JUANA SEGURA MARQUEZ 42


CORRELACION
X Y
289 502
290 504
308 512
327 525
339 529
352 536
357 540
374 547
393 558
408 569
416 569
Mg. JUANA SEGURA MARQUEZ 43
CORRELACION
X representa la renta nacional en millones de euros e Y
representa las ventas de la compaa en miles de euros en
el periodo que va desde 2010 hasta 2011 (ambos
inclusive). Calcular:
1. Se trata de una relacion lineal?. (Analizar el diagrama
de dispersin)
2. El coeficiente de correlacin lineal e interpretarlo.
3. IC, AL 95% de confianza
4. Determine mediante una PH SI las rentas nacionales y
ventas estn correlacionadas.

Mg. JUANA SEGURA MARQUEZ 44


CORRELACION

P4.En una empresa de transportes


trabajan 10 conductores. Los aos de
antigedad de permisos de conducir y el
nmero de infracciones cometidas en el
ltimo ao por cada uno de ellos son los
siguientes:

Mg. JUANA SEGURA MARQUEZ 45


CORRELACION

AOS: X 1 2 3 4 5 6 7 8 9 10
INFRACCI 4 3 2 5 1 6 8 5 9 7
ON: Y

Se pide:
1. Se trata de una relacion lineal?. (Analizar el diagrama de
dispersin)
2. coeficiente de correlacin lineal e interpretarlo.
3. IC, AL 95% de confianza
4. Determine mediante una PH SI Los aos de antigedad
de permisos de conducir y el nmero de infracciones
cometidas en el ltimo ao estn correlacionadas
Mg. JUANA SEGURA MARQUEZ 46
Hay una fuerza motriz mas
poderosa que el vapor, la
electricidad y la energa
atmica: La voluntad

ALBERT EINSTEIN
Mg. JUANA SEGURA MARQUEZ 47

Você também pode gostar