Você está na página 1de 40

Estadstica de dos variables (X, Y) en parejas

El objetivo es:
1. Hallar una lnea de recta: Y=bX+a que mejor
se ajuste a la muestra de n pares de datos a fin de
pronosticar Y a partir de X .
Esto se denomina regresin lineal

2. Medir el nivel de asociacin entre las variables X, Y.


Esto se denomina Correlacin

25/05/17
1
COVARIANZA ENTRE DOS VARIABLES 1

25/05/17 2
COVARIANZA ENTRE DOS VARIABLES 2

En teora de la probabilidad y la estadstica la


Covarianza es una medida estadstica inicial que
te permite analizar si existe o no una relacin
lineal entre dos variables.

Ambas variables utilizan una escala de medida a


nivel de intervalo/razn

25/05/17 3
COVARIANZA ENTRE DOS VARIABLES 3

Una covarianza alta, indica que el valor de una


variable est muy relacionada al valor de la otra
variable.

La covarianza presenta el inconveniente de que


su valor depende de la escala elegida para los
ejes, es decir variar si por ejemplo la altura lo
expresamos en metros o centmetros.

25/05/17 4
COVARIANZA ENTRE DOS VARIABLES 4

El resultado numrico flucta entre los rangos -


a +, al no tener los lmites establecidos no puede
determinarse el grado de relacin lineal, slo es
posible ver la tendencia.

1.- Si SXY >0 Existe relacin lineal positiva


entre las dos variables.
2.- Si SXY < 0 Existe relacin lineal negativa
entre las dos variables.
3.- Si SXY = 0 No existe relacin lineal entre las
dos variables.

25/05/17 5
COVARIANZA ENTRE DOS VARIABLES 5

Ejemplo 1: Los valores de dos variables X e Y se


distribuyen segn la siguiente tabla:

Hallar la covarianza de la distribucin


Procedemos a desarrollar los clculos:

25/05/17 6
COVARIANZA ENTRE DOS VARIABLES 6

25/05/17 7
COVARIANZA ENTRE DOS VARIABLES 7

Media X= 19/9 , Media y= 18/9 = 2 , X*Y = 39

SXY = 39/9 19/9*2 = 1/9= 0.11

25/05/17 8
COVARIANZA ENTRE DOS VARIABLES 8

Ejemplo 2: Los valores de dos variables X e Y se


distribuyen segn la siguiente tabla:

Hallar la covarianza de la distribucin

25/05/17 9
COVARIANZA ENTRE DOS VARIABLES 9

25/05/17 10
COVARIANZA ENTRE DOS VARIABLES 10

25/05/17 11
COVARIANZA ENTRE DOS VARIABLES 11

Media X = 40/20=2 , Media y = 41/20 = 2.05 ,


X*Y*fi = 76

SXY = 76/20 (2)(2.05)= -0.3

25/05/17 12
COVARIANZA ENTRE DOS VARIABLES 12

Una compaa de seguros considera que el


nmero de vehculos (y) que circulan por una
determinada autopista a ms de 120 km/h ,
puede ponerse en funcin del nmero de
accidentes (x) que ocurren en ella. Durante 5
das obtuvo los siguientes resultados:

Calcular la covarianza.

25/05/17 13
Coeficiente de Correlacin 1

La correlacin trata de establecer la relacin o


dependencia que existe entre dos variables que
intervienen en una distribucin bidimensional.
Debemos determinar si los cambios en una de
las variables influyen en los cambios de la otra.
En caso de que suceda, diremos que las
variables estn correlacionadas o que hay
correlacin entre ellas.
La correlacin entre dos variables no implica, por
si misma, ninguna relacin de causalidad.

25/05/17 14
Coeficiente de Correlacin 2

25/05/17 15
Coeficiente de Correlacin 3

La relacin entre dos variables cuantitativas


queda representada mediante la lnea de menor
ajuste, trazada a partir de la nube de puntos.
Los principales componentes elementales de una
lnea de ajuste y por tanto de una correlacin,
son la fuerza, el sentido y la forma.
La fuerza extrema, mide el grado en que la lnea
representa a la nube de puntos: nube estrecha y
alargada relacin fuerte, nube con tendencia
elptica o circular relacin dbil

25/05/17 16
Coeficiente de Correlacin 4

El sentido mide la variacin de los valores de X con respecto a


Y:

si X Y , la relacin es positiva
si X Y , la relacin es positiva
si X Y , la relacin es negativa
si X Y , la relacin es negativa

La forma establece el tipo de lnea que define el mejor ajuste

25/05/17 17
Coeficiente de Correlacin 5
Interpretacin

El valor del ndice vara en el intervalo 1 r 1


r= +1 indica correlacin positiva perfecta.
Si 0 < r < 1 , existe una correlacin positiva.
r= -1 indica correlacin negativa perfecta.
Si -1 < r < 0 , existe una correlacin negativa.
r= 0 indica que no existe correlacin, pero no
necesariamente implica que las variables son
independientes , ejemplo los valores de una
circunferencia
Se acepta ll r ll 0.75 como un coeficiente de
correlacin aceptable

25/05/17 18
Coeficiente de Correlacin 6

25/05/17 19
Coeficiente de Correlacin 7

25/05/17 20
Coeficiente de Correlacin 8

25/05/17 21
Coeficiente de Correlacin 9

Clculos para el coeficiente de regresin:

25/05/17 22
Coeficiente de Correlacin 10

PromX =500/10=50 , PromY = 1100/10=110


Sxy = 61800/10 (50)(110) = 680
Sx = (28400/10 - 50)^ = 18.43
Sy = (134660/10 - 110)^ = 36.95

r = 680/(18.43*36.95) = 0.99

25/05/17 23
Coeficiente de Correlacin 11

Ejercicio 1.- Las estaturas y pesos de 10 jugadores


de baloncesto de un equipo son las siguientes:

Calcular el coeficiente de correlacin.

25/05/17 24
Coeficiente de Correlacin 12

Clculos:

25/05/17 25
Coeficiente de Correlacin 12

PromX =1950/10=195 , PromY = 921/10=92.1


Sxy = 179971/10 (195)(92.1) = 37.6
Sx = (380618/10 - 195)^ = 6.0663
Sy = (85255/10 92.1)^ = 6.5642

r = 37.6/(6.0663*6.5642) = 0.94

25/05/17 26
25/05/17 27
Regresin Lneal Simple
El objetivo es:
Hallar una lnea de recta: Y=bX+a que mejor se
ajuste a la muestra de n valores (xi,yi) de (X, Y)

Si el modelo es adecuado nos permitir realizar


pronsticos de Y a partir de X .

El mtodo para hallar la recta es el de Mnimos


cuadrados

25/05/17 28
Mtodo de mnimos cuadrados
Y Y = a + bX
^
yi
di
^
yi

>X
xi
n n n
SCE
25/05/17

i 1
d i2
i 1
( y i y i ) 2
i =1
( y i a bxi ) 2
29
Mtodo de mnimos cuadrados
Consiste en hallar los valores de a y b de manera
que hagan mnima, la suma:
n
SCE
i =1
[ y i ( a bxi )] 2

a y b se obtienen de las ecuaciones normales:


n n

y
i =1
i na + b x
i =1
i

n n n


i =1
xi y i a
i =1
xi + b
i =1
xi2
25/05/17 30
Mtodo de mnimos cuadrados

b
n x y x y
i i i i
, o b
s XY
n x x
2
2
i i
s X2

a y bx

NOTA. De a y bx e Y a bX resulta,
Y y b( X x )
25/05/17 31
Ejemplo
X: Duracin en minutos de la publicidad
Y: nmero de artculos vendidos (Y), resultando:

Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Ventas Y 50 73 69 87 108 128 135 132 148 170

a) Trace el diagrama de dispersin, e indique la


tendencia.
b) Halle la recta de regresin de mnimos
cuadrados con el fin de predecir las ventas.
25/05/17 32
Ejemplo

Continuando con el ejemplo anterior


c) Estime la venta si en una semana se hacen
100 minutos de propaganda.
d) Calcule el coeficiente de correlacin.
e) Si en la novena semana se incrementara la
publicidad en 5 minutos, en cuanto se estima
se incrementa la venta?.

25/05/17 33
Particin de la varianza
n

i
( y y ) 2

sY2 i 1
La varianza de Y es : n .
Y yi

^
yi

_
y

_ X
x
yi y ( yi y i ) ( y i y )
Error total Error no Explicado Error explicado
25/05/17 34
Coeficiente de determinacin
n n n


i 1
(yi y ) 2
i 1
(y i y i ) 2
i 1
(y i y ) 2

SCT SCE SCR


SCR
El coef. de determinacin es : r 2

SCT
SCE
1 r 2

SCT

25/05/17 35
Coeficiente de determinacin

SCE
1 r 2
0 r 2 1.
1. De SCT se tiene

Entonces, 1 r 1.

2) r2 =1, slo si, SCE=0, o slo si, y i y i

Entonces, todos los yi estn en la recta de


regresin.

Existe correlacin perfecta entre X e Y.


25/05/17 36
Coeficiente de determinacin

3) r2 = 0, slo si, SCR=0, o slo si, y i y

Entonces, no hay correlacin ni regresin.

4) El coeficiente de determinacin r2, es una


medida de la proximidad del ajuste de la recta de
regresin. Cuanto mayor sea el valor de r2, mejor
ser el ajuste y ms til la recta de regresin
como instrumento de prediccin.

25/05/17 37
Ejemplo

25/05/17 38
Invarianza de b y r
Si se hacen X=X h, Y=Y h en X o Y o en ambos,
b y r no cambian, esto es:

s XY s X 'Y ' s X 'Y s XY


b 2
2
2
2
sX sX sX sX
s XY s X 'Y ' s X 'Y s XY '
r .
s X sY s X ' sY ' s X ' sY s X sY '

25/05/17 39
Ejemplo
Al estudiar la relacin entre el costos(X) y las
utilidades (Y) en dlares de ciertos productos a partir
de una muestra se obtuvo la siguiente informacin:
SX=5, SY=4, x 100, y 50, Y260.76X.
a) Si cada valor del costo se aumenta en $3 y el
valor correspondiente a la utilidad se aumenta en
6 $, en cuanto se estima la utilidad para un costo
de $120?.
b) Qu porcentaje de la varianza de las utilidades es
explicada por la regresin de utilidades sobre
costos?.
Rp. a) Y'560.76(X'103), 68.92, b) r0.95, r20.9025
25/05/17 el 90.25% 40

Você também pode gostar