Escolar Documentos
Profissional Documentos
Cultura Documentos
a) Calcule el coeficiente de correlacin lineal. b) Recta de regresin del ahorro en funcin de la renta. c) Si para el ao 2010 la renta fue de 241 millones de euros, cul fue el ahorro esperado para dicho ao?. Resolucin: En los clculos de rectas de regresin y coeficientes de correlacin lineal se necesitan las medias y varianzas de las variables as como la covarianza. Las varianzas pueden calcularse por la frmula equivalente consistente en calcular la media de los cuadrados menos el caudrado de la media, y la covarianza por la media de los productos menos el producto de las medias, por lo que para el clculo manual de lo que se pide podemos preparar la siguiente tabla de clculos, en la que x representa renta (variable explicativa) e y el ahorro (variable respuesta):
Ao 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 TOTAL Renta ( xi ) 205 208 212 217 221 223 222 226 231 235 2200 Ahorro ( yi ) 19 18 20 21 19 20 22 23 27 30 219 xi2 42025 43264 44944 47089 48841 49729 49284 51076 53361 55225 4.84838 sxy sx s y yi2 361 324 400 441 361 400 484 529 729 900 4929 xi yi 3895 3744 4240 4557 4199 4460 4884 5198 6237 7050 48464
X=
1 220 xi = = 22 n 10
Y=
1 219 yi = = 219 n 10
-1-
4.84838 222 = 08380 S X = 08380 = 0915423 10 4929 2 SY =Y 2 Y 2 = 2192 = 01329 SY = 01329 = 0364555 10 48464 S XY = X Y X Y = 22 219 = 02840 10
2 2 S2 X =X X =
r=
llones de euros) es: Ahorro = 52658 + 03389 Renta c) El ahorro esperado para 2010 es: Ahorro = 52658 + 03389 241 290 millones de euros
a) Calcule el coeficiente de correlacin lineal. b) Recta de regresin de la nota de Estadstica respecto de la nota de Psicologa. c) Si un alumno sac un 45 en Psicologa, qu nota se espera que tuvo en Estadstica?.
-2-
ni 4 6 12 4 5 4 2 1 2 4 TOTAL 44
xi 3 4 5 6 6 7 7 8 10 3 ---
yi 2 5 5 6 7 6 7 9 10 2 ---
nixi 12 24 60 24 30 28 14 8 20 12 232
niyi 8 30 60 24 35 24 14 9 20 8 232
S XY S X SY
1 232 1 232 n i xi = = 5272727 Y = ni y i = = 5272727 n 44 n 44 2 2 1.350 2 S2 X = X X = 44 5272727 = 2880168 S X = 2880168 = 1697106 1.394 2 SY =Y 2 Y 2 = 52727272 = 3880168 SY = 3880168 = 1969814 44 1.360 S XY = X Y X Y = 5272727 5272727 = 3107441 44 X=
Por lo que el coeficiente de correlacin lineal es:
r=
-3-
11.3.- Se est estudiando la relacin entre el nmero de aos que una persona est afiliada
a un sindicato y el nivel de satisfaccin con la actuacin de dicho sindicato. Para ello se toman datos de 7 afiliados tomados al azar y se obtienen los siguientes resultados: Aos Satisfaccin 8 7 7 6 10 8 3 5 6 9 13 10 4 4
n n 2 1 i=1
diferencias de rangos, por lo que para su clculo preparamos una tabla con los rangos, sus diferencias y sus cuadrados: Variables Aos 8 7 10 3 6 13 4 Satisfaccin 7 6 8 5 9 10 4
n
por tanto: rS = 1
n n 2 1 i=1
di2 = 1
aos en el sindicato tiende a aumenta su nivel de satisfaccin con la actuacin del mismo.
11.4.- Se realiza un estudio para determinar la asociacin entre la concentracin de nicotina en sangre (en n mol /l) y el contenido de nicotina de los cigarrillos (en mg), obtenindose los siguientes resultados: En Cigarrillo En Sangre 151 096 121 166 111 084 114 128 153 076
1857 1973 2042 1999 1991 1928 2074 1830 2341 1965
n n 2 1 i=1
diferencias de rangos, por lo que para su clculo preparamos una tabla con los rangos, sus diferencias y sus cuadrados: -4-
Variables Cigarrillo 151 096 121 166 111 084 114 128 153 076 Sangre 1857 1973 2042 1999 1991 1928 2074 1830 2341 1965
n
por tanto: rS = 1
n n 2 1 i=1
di2 = 1
contenido de nicotina de los cigarrillos fumados tiende a aumentar (ligeramente) el contenido de nicotina en sangre.
11.5.- Los datos de una muestra de 600 personas se han clasificado en funcin del sexo y
procedencia, obtenindose la siguiente tabla: Espaoles Hombres Mujeres Calcule el coeficiente e interprtelo. 450 80 Extranjeros 50 20
minio de la diagonal principal, una cierta asociacin entre hombre y nacionalidad espaola y el ser mujer y extranjera.
11.6.- Se ha preguntado a 100 mujeres y a 80 hombres si controlan su sobrepeso, obtenindose las respuestas que se resumen en la siguiente tabla:
-5-
Hombres 50 30
25 30 50 75 75 105 100 80
nal secundaria, asociacin entre mujer y control del sobrepeso, y hombre con no control del mismo.
11.7.- Las notas de 6 alumnos de Primero son 5, 7, 75, 6, 52 y 53 y las notas de 8 alumnos de Segundo son 5, 7, 72, 65, 8, 6, 71 y 52. Calcule el coeficiente de correlacin biserial puntual.
Resolucin: La correlacin biserial puntual entre dos grupos de datos codificados con 0 y
con 1 viene dada por rbp =
X1 X 0 pq . Si codificamos con 0 a los de Primero y con 1 a SX los de Segundo, para conservar el orden, obtenemos:
Nota media de Primero: X 0 =
5 + 7 + 75 + 6 + 52 + 53 36 = =6 6 6
5 + 7 + 72 + 65 + 8 + 6 + 71 + 52 52 = = 65 8 8 5 + 7 + 75 + ... + 71 + 52 88 = = 62857 14 14
-6-
0984082 = 09920
65 6 09920
existe una cierta correlacin o asociacin positiva (o directa) entre las notas y el curso, tendiendo a ser mayores las de Segundo.
11.8.- Se realiza un anlisis de regresin lineal con SPSS para buscar una relacin lineal
que explique el PESO (peso, en kg) de un individuo en funcin de su ESTATURA (estat, en cm), y se obtiene la siguiente salida:
Estadsticos descriptivos Media peso estat 66,1042 168,0417 Desviacin tp. 9,5922 7,5991 N 96 96
Variables introducidas/eliminadas(b) Modelo 1 Variables introducidas estat(a) Variables eliminadas . Mtodo Introducir
a Todas las variables solicitadas introducidas b Variable dependiente: peso Resumen del modelo Modelo 1 R ,8417(a) R cuadrado ,7085 ANOVA(b) Modelo 1 Regresin Residual Total Suma de cuadrados 6192,748 2548,210 gl 1 94 Media cuadrtica 6192,748 27,109 F 228,442 Sig. ,000(a) R cuadrado corregida ,7054 Error tp. de la estimacin 5,2066
Modelo
Sig.
(Constante) estat
-112,4366 1,0625
,8417
Se pide:
a) Si existe regresin lineal y por qu. b) Escriba la ecuacin del modelo de regresin. c) Comente el coeficiente de determinacin.
-7-
En la Tabla ANOVA vemos que p (= Sig.) = 0000 < 005 = , luego s que hay regresin lineal (se rechaza H0 y se acepta H1). b) De la Tabla de Coeficientes obtenemos la ecuacin: y = 1124366 + 10625 x + donde y = PESO (en kg), x = ESTATURA (en cm) y es un error aleatorio de media 0 y desviacin tpica . c) En la Tabla Resumen del modelo vemos que el coeficiente de determinacin muestral es R2 = 07085 = 7085%, lo que significa que, en la muestra, las estaturas explican un 7085% de la variabilidad de los pesos; y en la realidad (poblacin) ese porcentaje se estima mejor con el coeficiente de determinacin corregido Rc2 = 07054 = 7054%, es decir, en la poblacin las estaturas explican un 7054% de la variabilidad de los pesos. d) Un estimador centrado de la varianza de los errores, 2, es la Media cua2 drtica del Residual (vea la Tabla ANOVA) = 27109 kg2, y la desviacin tpica se se estima con la raiz cuadrada de esa varianza, o con el Error tp. de la estima = 52066 kg. cin (vea la Tabla Resumen del modelo), su valor es
-8-