Você está na página 1de 8

EJERCICIOS TEMA 11 11.1.

- El volumen de ahorro y la renta del sector familias, en millones de euros, para el


periodo 2000-2009 fueron: Ao Ahorro Renta Se pide: 2000 19 205 2001 18 208 2002 20 212 2003 21 217 2004 19 221 2005 20 223 2006 22 222 2007 23 226 2008 27 231 2009 30 235

a) Calcule el coeficiente de correlacin lineal. b) Recta de regresin del ahorro en funcin de la renta. c) Si para el ao 2010 la renta fue de 241 millones de euros, cul fue el ahorro esperado para dicho ao?. Resolucin: En los clculos de rectas de regresin y coeficientes de correlacin lineal se necesitan las medias y varianzas de las variables as como la covarianza. Las varianzas pueden calcularse por la frmula equivalente consistente en calcular la media de los cuadrados menos el caudrado de la media, y la covarianza por la media de los productos menos el producto de las medias, por lo que para el clculo manual de lo que se pide podemos preparar la siguiente tabla de clculos, en la que x representa renta (variable explicativa) e y el ahorro (variable respuesta):
Ao 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 TOTAL Renta ( xi ) 205 208 212 217 221 223 222 226 231 235 2200 Ahorro ( yi ) 19 18 20 21 19 20 22 23 27 30 219 xi2 42025 43264 44944 47089 48841 49729 49284 51076 53361 55225 4.84838 sxy sx s y yi2 361 324 400 441 361 400 484 529 729 900 4929 xi yi 3895 3744 4240 4557 4199 4460 4884 5198 6237 7050 48464

a) El coeficiente de correlacin lineal es r =


n = 10 (nmero de pares de datos)

X=

1 220 xi = = 22 n 10

Y=

1 219 yi = = 219 n 10
-1-

4.84838 222 = 08380 S X = 08380 = 0915423 10 4929 2 SY =Y 2 Y 2 = 2192 = 01329 SY = 01329 = 0364555 10 48464 S XY = X Y X Y = 22 219 = 02840 10
2 2 S2 X =X X =

Por lo que el coeficiente de correlacin lineal es:

r=

S XY 02840 = 08510 S X SY 0915423 0364555

b) y = a + bx, donde las estimaciones de a y b son


S b = XY = 02840 / 08380 = 03389 S2 X
= Y b a X = 219 03389 22 = 52658 por lo que la recta de regresin del Ahorro en funcin de la Renta (en mi-

llones de euros) es: Ahorro = 52658 + 03389 Renta c) El ahorro esperado para 2010 es: Ahorro = 52658 + 03389 241 290 millones de euros

11.2.- Las calificaciones de 44 alumnos en Psicologa y en Estadstica han sido las de la


tabla adjunta: Psicologa Estadstica N Alumnos Se pide: 3 2 4 4 5 6 5 5 12 6 6 4 6 7 5 7 6 4 7 7 2 8 9 1 10 10 2 3 2 4

a) Calcule el coeficiente de correlacin lineal. b) Recta de regresin de la nota de Estadstica respecto de la nota de Psicologa. c) Si un alumno sac un 45 en Psicologa, qu nota se espera que tuvo en Estadstica?.

Resolucin: En los clculos de rectas de regresin y coeficientes de correlacin lineal se


necesitan las medias y varianzas de las variables as como la covarianza. Las varianzas pueden calcularse por la frmula equivalente consistente en calcular la media de los cuadrados menos el caudrado de la media, y la covarianza por la media de los productos menos el producto de las medias, por lo que para el clculo manual de lo que se pide podemos preparar la siguiente tabla de clculos, en la que x representa la nota de Psicologa (variable explicativa) e y la de Estadstica (variable respuesta). En este Ejercicio, adems, hay que tener en cuenta las frecuencias absolutas ni, que son los alumnos que han sacado el respectivo par de notas (xi, yi):

-2-

ni 4 6 12 4 5 4 2 1 2 4 TOTAL 44

xi 3 4 5 6 6 7 7 8 10 3 ---

yi 2 5 5 6 7 6 7 9 10 2 ---

nixi 12 24 60 24 30 28 14 8 20 12 232

niyi 8 30 60 24 35 24 14 9 20 8 232

nixi2 36 96 300 144 180 196 98 64 200 36 1.350

niyi2 16 150 300 144 245 144 98 81 200 16 1.394

nixi yi 24 120 300 144 210 168 98 72 200 24 1.360

a) El coeficiente de correlacin lineal es r =


n = 44 (nmero de pares de datos)

S XY S X SY

1 232 1 232 n i xi = = 5272727 Y = ni y i = = 5272727 n 44 n 44 2 2 1.350 2 S2 X = X X = 44 5272727 = 2880168 S X = 2880168 = 1697106 1.394 2 SY =Y 2 Y 2 = 52727272 = 3880168 SY = 3880168 = 1969814 44 1.360 S XY = X Y X Y = 5272727 5272727 = 3107441 44 X=
Por lo que el coeficiente de correlacin lineal es:

r=

S XY 3107441 = 09295 S X SY 1697106 1969814

b) y = a + bx, donde las estimaciones de a y b son


S b = XY = 3107441 / 2880168 = 10789 S2 X
= Y b a X = 52727 10789 52727 = 04160 por lo que la recta de regresin de la nota de Estadsticarespecto de la nota

de Psicologa es: Estadstica = 04160 + 10789 Psicologa

-3-

c) La nota esperada en Estadstica es: Estadstica = 04160 + 10789 45 = 444

11.3.- Se est estudiando la relacin entre el nmero de aos que una persona est afiliada
a un sindicato y el nivel de satisfaccin con la actuacin de dicho sindicato. Para ello se toman datos de 7 afiliados tomados al azar y se obtienen los siguientes resultados: Aos Satisfaccin 8 7 7 6 10 8 3 5 6 9 13 10 4 4

Calcule el coeficiente de correlacin de Spearman e interprtelo.

Resolucin: La correlacin de Spearman es rS = 1

n n 2 1 i=1

di2 , donde di son las

diferencias de rangos, por lo que para su clculo preparamos una tabla con los rangos, sus diferencias y sus cuadrados: Variables Aos 8 7 10 3 6 13 4 Satisfaccin 7 6 8 5 9 10 4
n

Rangos Aos (xi) 5 4 6 1 3 7 2 Satisfaccin (yi) 4 3 5 2 6 7 1 di = xi yi 1 1 1 1 3 0 1 TOTAL di2 1 1 1 1 9 0 1 14

por tanto: rS = 1

n n 2 1 i=1

di2 = 1

6 14 = 075 > 0, al aumentar los 7 48

aos en el sindicato tiende a aumenta su nivel de satisfaccin con la actuacin del mismo.

11.4.- Se realiza un estudio para determinar la asociacin entre la concentracin de nicotina en sangre (en n mol /l) y el contenido de nicotina de los cigarrillos (en mg), obtenindose los siguientes resultados: En Cigarrillo En Sangre 151 096 121 166 111 084 114 128 153 076

1857 1973 2042 1999 1991 1928 2074 1830 2341 1965

Calcule el coeficiente de correlacin de Spearman e interprtelo.

Resolucin: La correlacin de Spearman es rS = 1

n n 2 1 i=1

di2 , donde di son las

diferencias de rangos, por lo que para su clculo preparamos una tabla con los rangos, sus diferencias y sus cuadrados: -4-

Variables Cigarrillo 151 096 121 166 111 084 114 128 153 076 Sangre 1857 1973 2042 1999 1991 1928 2074 1830 2341 1965
n

Rangos Cigarrillo (xi) 8 3 6 10 4 2 5 7 9 1 Sangre (yi) 2 5 8 7 6 3 9 1 10 4 di = xi yi 6 2 2 3 2 1 4 6 1 3 TOTAL di2 36 4 4 9 4 1 16 36 1 9 120

por tanto: rS = 1

n n 2 1 i=1

di2 = 1

6 120 = 02727 > 0, al aumentar el 10 99

contenido de nicotina de los cigarrillos fumados tiende a aumentar (ligeramente) el contenido de nicotina en sangre.

11.5.- Los datos de una muestra de 600 personas se han clasificado en funcin del sexo y
procedencia, obtenindose la siguiente tabla: Espaoles Hombres Mujeres Calcule el coeficiente e interprtelo. 450 80 Extranjeros 50 20

Resolucin: Escribimos la tabla con los totales


Espaoles Hombres Mujeres TOTAL y de ella obtenemos 450 80 530 Extranjeros 50 20 70 TOTAL 500 100 600

450 20 50 80 500 100 530 70

= 01161 > 0, hay un ligero predo-

minio de la diagonal principal, una cierta asociacin entre hombre y nacionalidad espaola y el ser mujer y extranjera.

11.6.- Se ha preguntado a 100 mujeres y a 80 hombres si controlan su sobrepeso, obtenindose las respuestas que se resumen en la siguiente tabla:

-5-

Mujeres NO S Calcule el coeficiente e interprtelo. 25 75

Hombres 50 30

Resolucin: Escribimos la tabla con los totales


Mujeres NO S TOTAL y de ella obtenemos 25 75 100 Hombres 50 30 80 TOTAL 75 105 180

25 30 50 75 75 105 100 80

= 03780 < 0, predomina la diago-

nal secundaria, asociacin entre mujer y control del sobrepeso, y hombre con no control del mismo.

11.7.- Las notas de 6 alumnos de Primero son 5, 7, 75, 6, 52 y 53 y las notas de 8 alumnos de Segundo son 5, 7, 72, 65, 8, 6, 71 y 52. Calcule el coeficiente de correlacin biserial puntual.

Resolucin: La correlacin biserial puntual entre dos grupos de datos codificados con 0 y
con 1 viene dada por rbp =

X1 X 0 pq . Si codificamos con 0 a los de Primero y con 1 a SX los de Segundo, para conservar el orden, obtenemos:
Nota media de Primero: X 0 =

5 + 7 + 75 + 6 + 52 + 53 36 = =6 6 6
5 + 7 + 72 + 65 + 8 + 6 + 71 + 52 52 = = 65 8 8 5 + 7 + 75 + ... + 71 + 52 88 = = 62857 14 14

Frecuencia relativa para Primero: q = 6/14 = 04286 Nota media de Segundo: X 1 =

Frecuencia relativa para Segundo: p = 8/14 = 05714 Media global (o conjunta): X =

2 2 Varianza global (o conjunta): S 2 X = X X =

2 5 2 + 7 2 + 75 2 + ... + 712 + 52 2 88 = = 14 14 2 56692 88 = = 40494286 39510204 = 0984082 14 14

-6-

Desviacin tpica global (o conjunta): SX =

0984082 = 09920

Correlacin biserial puntual: rbp =


X1 X 0 SX pq =

65 6 09920

05714 04286 = 02494 > 0

existe una cierta correlacin o asociacin positiva (o directa) entre las notas y el curso, tendiendo a ser mayores las de Segundo.

11.8.- Se realiza un anlisis de regresin lineal con SPSS para buscar una relacin lineal
que explique el PESO (peso, en kg) de un individuo en funcin de su ESTATURA (estat, en cm), y se obtiene la siguiente salida:
Estadsticos descriptivos Media peso estat 66,1042 168,0417 Desviacin tp. 9,5922 7,5991 N 96 96

Variables introducidas/eliminadas(b) Modelo 1 Variables introducidas estat(a) Variables eliminadas . Mtodo Introducir

a Todas las variables solicitadas introducidas b Variable dependiente: peso Resumen del modelo Modelo 1 R ,8417(a) R cuadrado ,7085 ANOVA(b) Modelo 1 Regresin Residual Total Suma de cuadrados 6192,748 2548,210 gl 1 94 Media cuadrtica 6192,748 27,109 F 228,442 Sig. ,000(a) R cuadrado corregida ,7054 Error tp. de la estimacin 5,2066

a Variables predictoras: (Constante), estat

8740,958 95 a Variables predictoras: (Constante), estat b Variable dependiente: peso Coeficientes(a)


Coeficientes no estandarizados B Error tp. 11,8247 ,0703 Coeficientes estandarizados Beta -9,5087 15,1143 ,0000 ,0000 Intervalo de confianza para B al 95% Lmite inferior -135,9147 ,9229 Lmite superior -88,9585 1,2021

Modelo

Sig.

(Constante) estat

-112,4366 1,0625

,8417

a Variable dependiente: peso

Se pide:

a) Si existe regresin lineal y por qu. b) Escriba la ecuacin del modelo de regresin. c) Comente el coeficiente de determinacin.
-7-

d) Estimacin de la varianza y desviacin tpica de los errores.


estn calculando con un grado de confianza = 95%, por lo que el nivel de significacin para los contrastes de hiptesis ser el valor complementario, = 100% = 5% = 005.

Resolucin: Obsrvese, en la tabla de coeficientes, que los intervalos de confianza se

a) Las hiptesis nula y alternativa para decidir sobre el ajuste son:


H0: No hay regresin lineal (o no hay relacin lineal, o no hay ajuste lineal). H1: Hay regresin lineal (o relacin lineal, o ajuste).

En la Tabla ANOVA vemos que p (= Sig.) = 0000 < 005 = , luego s que hay regresin lineal (se rechaza H0 y se acepta H1). b) De la Tabla de Coeficientes obtenemos la ecuacin: y = 1124366 + 10625 x + donde y = PESO (en kg), x = ESTATURA (en cm) y es un error aleatorio de media 0 y desviacin tpica . c) En la Tabla Resumen del modelo vemos que el coeficiente de determinacin muestral es R2 = 07085 = 7085%, lo que significa que, en la muestra, las estaturas explican un 7085% de la variabilidad de los pesos; y en la realidad (poblacin) ese porcentaje se estima mejor con el coeficiente de determinacin corregido Rc2 = 07054 = 7054%, es decir, en la poblacin las estaturas explican un 7054% de la variabilidad de los pesos. d) Un estimador centrado de la varianza de los errores, 2, es la Media cua2 drtica del Residual (vea la Tabla ANOVA) = 27109 kg2, y la desviacin tpica se se estima con la raiz cuadrada de esa varianza, o con el Error tp. de la estima = 52066 kg. cin (vea la Tabla Resumen del modelo), su valor es

-8-

Você também pode gostar