Você está na página 1de 19

Casos y problemas

resueltos
Correlacin Fi Correlacin de Spearman Correlacin de Pearson

Estadstica Estadstica
Aplicada a las Ciencias Sociales Aplicada a las Ciencias Sociales
I: Estadstica Descriptiva

-3-

Patricio Alcano Martnez PatricioDerechos Reservados Alcano Martnez

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

Palabras iniciales

Estimados usuari@s: Este material que pongo a su disposicin est creado a partir de casos e investigaciones reales de distintos mbitos de las Ciencias Sociales. Los datos han sido cambiados para ajustarlos a situaciones didcticas ms claras para los estudiantes. Por ello, la informacin y conclusiones no son necesariamente vlidas en otros contextos. Este volumen est dirigido a tratar el tema del clculo e interpretacin de los coeficientes de correlacin ms frecuentes de encontrar en Ciencias Sociales. A saber: Coeficiente de correlacin , apropiado para anlisis de correlacin de variables dicotmicas, el coeficiente de correlacin de rangos de Spearman, para casos de variables ordinales y el coeficiente de correlacin lineal de Pearson para variables numricas. . El lector deber manejar los conceptos y procedimientos elementales de Estadstica y exhibir competencia en el uso de la calculadora cientfica de dos variables para calcular el coeficiente de correlacin. El uso de este material con fines comerciales no est permitido.

Atentamente;

Patricio Alcano Martnez

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

Caso 1: Embarazo adolescente


Debido a la alta prevalencia de madres adolescentes en una regin del norte de Argentina, las autoridades ordenan una investigacin, que estudi las siguientes variables en una muestra de nias de 13 a 20 aos, utilizando la escala que se especifica en cada una: W = Embarazo adolescente: 1 = S; 0 = No. X = Grupo de edad: 2 = Menos de 18 aos; 1 = Ms de 18 aos. Y = Educacin bsica completa: 1 = S; 0 = No. Z = Situacin socioeconmica: 2 = suficiente; 1 = pobreza; 0 = extrema pobreza. La investigacin lleg a establecer las siguientes correlaciones:

r(W, X ) O,756;

r(W, Y ) -O,673;

r(W, Z ) -O,597;

r( X, Y ) 0,107

Sobre la base de estos resultados: 1.1. Cul es el coeficiente de correlacin ms adecuado para calcular r(Y, Z)? 1.2. Qu relacin es posible afirmar entre el embarazo adolescente y el hecho de haber completado o la educacin bsica? 1.3. Qu conclusin puede construirse a partir de la correlacin entre X e Y? 1.4. Qu conclusin se puede construir a partir de la correlacin entre W y X? 1.5. Cul sera el perfil de las adolescentes en riesgo de embarazo adolescente?

Solucin: 1.1. Cul es el coeficiente de correlacin ms adecuado para calcular r(Y, Z)? La variable Y est medida a escala dicotmica, mientras que Z es ordinal. Por lo tanto el coeficiente ms adecuado es el de Spearman. 1.2. Qu relacin es posible afirmar entre el embarazo adolescente y el hecho de haber completado o la educacin bsica? Observando la correlacin entre W e Y, es posible afirmar la existencia de una asociacin de mediana a alta, de tipo negativa, entre el embarazo adolescente y la educacin, de modo que el embarazo est asociado en forma muy clara a las nias que no han completado la educacin bsica. 1.3. Qu conclusin puede construirse a partir de la correlacin entre X e Y? La correlacin entre X e Y es muy baja, tal que puede ser despreciable. De este modo, el hecho de completar o no la educacin bsica es independiente de la edad de la persona. 1.4. Qu conclusin se puede construir a partir de la correlacin entre W y X?

r(W, X ) O,756 es una correlacin alta, estrecha y positiva. De acuerdo a la escala utilizada, el embarazo adolescente est muy asociado a nias menores de 18 aos.
1.5. Cul sera el perfil de las adolescentes en riesgo de embarazo adolescente? Sobre la base de las correlaciones calculadas, las nias que podran ser protagonistas de embarazo adolescente, se caracterizan por tener menos de 18 aos, educacin bsica incompleta y situacin econmica de pobreza o extrema pobreza.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

Caso 2: IVE y nacionalidad en Espaa


La IVE (interrupcin voluntaria del embarazo) es la intervencin quirrgica ginecolgica ms practicada en Espaa desde 1991. Una investigacin con 48 mujeres espaolas y 30 de nacionalidad extranjera que se realizaron una IVE, consult a estas si se haban realizado una IVE anterior. De las espaolas, 18 lo haban hecho, mientras que de las extranjeras, 21. 2.1. Realice un anlisis de correlacin para determinar la asociacin entre nacionalidad e IVE anterior, construyendo las conclusiones del caso.

Solucin: Primero se ordenan los datos en una tabla de contingencia de 2x2, ya que ambas variables estn dadas a nivel dicotmico.
IVE anterior Nacionalidad Espaola S No Total 18 30 48 Extranjera 21 9 30 39 39 78 Total

En segundo lugar, se calcula el coeficiente de correlacin fi:

18 9 21 30 39394830

= -0,316

Se trata de una correlacin baja, del tipo negativo, que asocia la IVE anterior con las extranjeras. La asociacin es baja pero podra llegar a ser significativa, ya que est mostrando una tendencia. Conclusin: La realizacin de una IVE por parte de una mujer, habindose realizado una anterior, est asociada en forma baja, pero definida, a la nacionalidad extranjera.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

Caso 3: Empleo y salud mental


Se hizo un estudio respecto de su salud mental con personas que recientemente haban perdido su empleo, usando como variables de control el sexo y el estado civil. Las correlaciones encontradas son las siguientes: Sexo y estado de salud mental: = 0,671 Estado civil y estado de salud mental: = 0,742 Siendo: Estado civil: 1 = casado; 0 = soltero. Sexo: 1 = masculino; 0 = femenino. Estado de salud mental: 1 = bueno; 0 = malo. 3.1. Realice un anlisis de la situacin y construya conclusiones con cada una de las correlaciones dadas.

Solucin: Sexo y estado de salud mental: correlacin de mediana a alta, indicando una estrecha asociacin lineal entre sexo y estado de salud mental, de modo que los malos estados de salud mental aparecen asociados al sexo masculino. En conclusin, el perder el empleo afecta la salud mental preferentemente a los hombres. Estado civil y estado de salud mental: correlacin alta y negativa, indicando una estrecha asociacin lineal entre estado civil y estado de salud mental, de modo que los malos estados de salud mental aparecen asociados a los casados. En conclusin, el perder el empleo afecta la salud mental ms a los casados que a los solteros.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

Caso 4: peso corporal y estado general de salud


El grfico de la figura presenta, en N de casos, la evaluacin del estado general de salud de una muestra de sujetos estudiados, segn si presentan peso normal o sobrepeso.
N de casos

18 15 12 09 06 03 00 Bueno Malo

Peso normal Sobrepeso

ESTADO

Estado general de salud, segn peso

4.1. Indique el % en lo que se afirma acerca de la muestra: 4.1.1. De las personas con Sobrepeso, 5 de cada . . . . . presentan Mal estado general de salud. 4.1.2. De los que tienen un Buen estado general de salud, el . . . . . . % tiene un peso Normal. 4.1.3. De las personas de peso Normal, solo el . . . . . .% presenta Mal estado general de salud. 4.2. Analice la correlacin entre estado general de salud y peso. Construya una conclusin.

Solucin: 4.1. Indique el % en lo que se afirma acerca de la muestra: 4.1.1. Las personas con sobrepeso son: 12 + 15 = 27. De estas, 15 presentan Mal estado general de salud. De 27 personas con sobrepeso De x personas con sobrepeso Calculando x = 9. De las personas con Sobrepeso, 5 de cada 9 presentan Mal estado general de salud.
15 presentan Mal estado general de salud. 5 presentan Mal estado general de salud.

4.1.2. Tienen un Buen estado general de salud = 30 Tiene un Buen estado general de salud y peso Normal = 18 Llevando a %:

18 100 = 60,0%. 30

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

De los que tienen un Buen estado general de salud, el 60,0% tiene un peso Normal. 4.1.3. Tienen un peso Normal = 18 + 6 = 24 Presentan Mal estado general de salud = 6. Llevando a %:

6 100 = 25,0%. 24

De las personas de peso Normal, slo un 25% presenta Mal estado general de salud.

4.2. Analice la correlacin entre estado general de salud y peso. Construya una conclusin. Reorganizando los datos en una tabla de 2x2 segn anlisis solicitado:
Estado General de Salud Bueno Malo 18 6 12 15 30 21

PESO Normal Sobrepeso TOTAL

TOTAL 24 27 51

Clculo del estadgrafo :

18 15 12 6 24 27 30 21

= 0,310

Anlisis: La correlacin entre peso y estado general de salud es positiva, baja, pero perceptible. Conclusin: El mal estado general de salud est asociado en forma baja, pero definida, al sobrepeso.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

Caso 5: Tabaquismo y problemas vasculares


La siguiente tabla recoge datos mdicos relacionados con Tabaquismo y Problemas vasculares en una muestra aleatoria de personas que participarn en una investigacin de un medicamento.
Problemas vasculares Con problemas Fuman No fuman total Mujeres tabaquismo total Fuman No fuman 22 17 39 23 9 32 Sin problemas 103 151 254 81 127 208

Sexo Hombres tabaquismo

Total 125 168 293 104 136 240

5.1. Sobre la base de los datos dados, calcule, en esta muestra: 5.1.1. De los hombres, qu % fuma? 5.1.2. De los que presentan problemas vasculares, qu % NO fuma? 5.1.3. De las mujeres, qu % presenta problemas vasculares? 5.1.4. De los hombres que presentan problemas vasculares, qu % fuma? 5.1.5. De la muestra, qu % son hombres que fuman y presenta problemas vasculares? 5.2. Realice un anlisis de correlacin entre tabaquismo y sexo y construya las conclusiones correspondientes. 5.3. Realice un anlisis de correlacin entre tabaquismo y problemas vasculares y construya las conclusiones correspondientes. 5.4. Realice un anlisis de correlacin entre sexo y problemas vasculares y construya las conclusiones correspondientes.

Solucin: 5.1. Sobre la base de los datos dados, calcule, en esta muestra: 5.1.1. De los hombres, qu % fuma? Total de hombres = 293 Total hombres que fuman = 125 Llevando a %:

125 100 42,7% 293

El 42,7% de los hombres, fuma.

5.1.2. De los que presentan problemas vasculares, qu % NO fuma? Presentan problemas vasculares = 71 Presentan problemas vasculares y no fuman = 17 Llevando a %:

17 100 23,9% 71 De los que presentan problemas vasculares, el 23,9% no fuma. P

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

5.1.3. De las mujeres, qu % presenta problemas vasculares? Nmero de mujeres = 240 Mujeres con problemas vasculares = 32 Llevando a %:

32 100 13,3% 240

De las mujeres, el 13,3% presenta problemas vasculares.

5.1.4. De los hombres que presentan problemas vasculares, qu % fuma? Hombres con problemas vasculares = 39 Hombres con problemas vasculares y fuman = 22 Llevando a %:

22 100 56,4% 39 El 56,4% de los hombres que presentan problemas vasculares, fuma. P
5.1.5. De la muestra, qu % son hombres que fuman y presenta problemas vasculares? Total muestra = 533 Hombres que fuman y presentan problemas vasculares = 17 Llevando a %:

17 100 3,2% 533

El 3,2% la muestra son hombres que fuman y presentan problemas vasculares.

5.2. Realice un anlisis de correlacin entre tabaquismo y sexo y construya las conclusiones correspondientes. Reorganizando los datos en una tabla, se tiene:
SEXO Hombres 125 168 293 Mujeres 104 136 240

TABAQUISMO Fuman NO fuman TOTAL

TOTAL 229 304 533

Clculo del estadgrafo :

125 136 104 168 229 304 168 136

= -0,0067

Anlisis: Correlacin prcticamente nula entre sexo y tabaquismo. Conclusin: En la muestra estudiada, el tabaquismo no est asociado al sexo. Hombre y mujeres fuman por igual.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

10

5.3. Realice un anlisis de correlacin entre tabaquismo y problemas vasculares y construya las conclusiones correspondientes. Reorganizacin de datos en una tabla de 2x2 segn anlisis solicitado.
PROBLEMAS VASCULARES Con problemas Sin problemas 45 184 26 278 71 462

TABAQUISMO Fuman NO fuman TOTAL

TOTAL 229 304 533

Clculo del estadgrafo :

45 278 184 26 229 304 71 462

= 0,162

Anlisis: Correlacin positiva, pero baja, despreciable. No se puede afirma la existencia de asociacin entre la presencia de problemas vasculares y el hecho de fumar. Conclusin: No se puede afirma la existencia de asociacin entre la presencia de problemas vasculares y el hecho de fumar.

5.4. Realice un anlisis de correlacin entre sexo y problemas vasculares y construya las conclusiones correspondientes. Reordenamiento de datos en una tabla de 2x2 segn anlisis solicitado.
PROBLEMAS VASCULARES Con problemas Sin problemas 39 254 32 208 71 462

SEXO Hombres Mujeres TOTAL

TOTAL 293 240 533

Clculo del estadgrafo :

39 208 254 32 293 240 71 462

= -0,00033

Anlisis: La correlacin entre sexo y problemas vasculares es prcticamente nula. Conclusin: No existe asociacin entre problemas vasculares y sexo, de modo que hombres y mujeres se ven igualmente afectados.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

11

Caso 6: Diagnstico de salud


Se realiza una investigacin con una muestra aleatoria de pacientes con problemas cardiovasculares de un hospital pblico, para lo cual se han recogido datos de las siguientes variables en las escalas que se indica en parntesis:
X1 = Sexo (1 = femenino; 2 = masculino). X 2 = Edad (aos cumplidos). X 3 = Nivel de ejercicio semanal (0 = Ninguno; 1 = Moderado y 2 = Intenso). X 4 = Fuma cigarrillos (1 = S; 0 = No). X 5 = Consumo de grasas saturadas (en g/semana).

Indique qu coeficiente de correlacin recomendara para el anlisis de correlacin entre las variables que se indican. Fundamente cada propuesta. 6.1. X1 con X 3 6.4. X 3 con X 5 6.2. X1 con X 4 6.5. X1 con X 2 6.3. X 2 con X 5

Solucin: 6.1. X1 est medida a escala binomial y X 3 a escala ordinal. Es recomendable calcular el coeficiente de correlacin de rangos, ms conocido como coeficiente de Spearman. En este caso la variable dicotmica es tratada como ordinal. 6.2. Tanto X1 como X 4 estn medidas a escala binomial. Es recomendable el coeficiente , ideal para la correlacin de variables categricas dicotmicas. 6.3. Las variables X 2 y X 5 son numricas. Es posible calcular el coeficiente de correlacin de Pearson. 6.4. La variable X 3 es ordinal, mientras de X 5 es numrica. En este caso es recomendable el coeficiente de correlacin de Spearman. La variable numrica debera reducirse a ordinal, convirtiendo sus valores a rangos.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

12

Caso 7: Tiempo frente al TV y competencia lectora


Se mide en una muestra aleatoria de estudiantes de educacin bsica el tiempo semanal (horas) que pasan frente al televisor y los puntos obtenidos en una prueba de competencia lectora con escala de 0 a 20 puntos (0 = mnima competencia; 20 = mxima competencia). El propsito del estudio es determinar la posible asociacin entre las variables.
N 1 2 3 4 5 6 7 8 X = Tiempo de TV (hrs) 9 16 20 7 10 25 5 18 Y = Competencia lectora (pts) 15 11 8 18 14 7 12 10

7.1. Seleccione el coeficiente de correlacin ms apropiado para realizar un anlisis de correlacin en el marco del caso. Fundamente su propuesta. 7.2. Calcule el coeficiente de correlacin de acuerdo al punto anterior. 7.3. Sobre la base de los resultados numricos, analice y construya la conclusin.

Solucin: 7.1. Seleccione el coeficiente de correlacin ms apropiado para realizar un anlisis de correlacin en el marco del caso. Fundamente su propuesta. Considerando que la variable Tiempo es numrica y que el Puntaje en la prueba es ordinal (mientras no se trate de un test estandarizado), es conveniente utilizar el coeficiente de correlacin de Spearman. 7.2. Calcule el coeficiente de correlacin de acuerdo al punto anterior. Para los efectos de clculo, se convertirn ambas variables a rangos, asignado el rango 1 al valor ms bajo, y as en forma creciente.
X = Tiempo de TV (hrs) 9 16 20 7 10 25 5 18 Y = Competencia lectora (pts) 15 11 8 18 14 7 12 10 Rg(X) 3 5 7 2 4 8 1 6 Rg(Y) 7 4 2 8 6 1 5 3

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

13

Ya calculados los rangos de cada variable, se puede proceder de dos maneras: una es calcular directamente con la calculadora el coeficiente de correlacin de Pearson de estos rangos, y dos, completar la tabla con las diferencias de los rangos y sus cuadrados. En el primer caso el coeficiente da rS = -0,857142857

Para el segundo caso, se completa la tabla:


Rg(X) 3 5 7 2 4 8 1 6 Rg(Y) 7 4 2 8 6 1 5 3 d Rg(X) - Rg(Y) -4 1 5 -6 -2 7 -4 3 Suma = d2 16 1 25 36 4 49 16 9 156

Como no hay empates en los valores de la variable, para el clculo de rS se puede emplear la frmula simplificada:
rS 1 6 156 8 (8 1)
2

= 1

936 = -0,857142857 504

7.3. Sobre la base de los resultados numricos, analice y construya la conclusin.

rS = -0,857142857 se trata de una correlacin alta y negativa. En conclusin, la competencia lectora est alta e inversamente asociada al tiempo que los estudiantes pasan mirando televisin, de modo a que a mayor tiempo de TV, menor es su competencia lectora.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

14

Caso 8: aborto y edad


Se estudia la asociacin entre la edad al momento del embarazo y el mes de embarazo de aborto provocado, en una muestra de 12 mujeres.
Caso E (aos) M (meses) 1 15 2 2 14 3 3 16 2 4 16 3 5 18 1 6 20 2 7 21 2 8 22 3 9 23 3 10 25 4 11 28 4 12 29 3

E = edad de la mujer al momento del embarazo M = meses de embarazo al momento del aborto Se desea establecer la correlacin entre las variables y construir una conclusin. 8.1. Fundamente el tipo de coeficiente a utilizar. 8.2. Calcule el coeficiente indicado para los propsitos deseados. 8.3. Realice un anlisis de los resultados y concluya.

Solucin: 8.1. Fundamente el tipo de coeficiente a utilizar. Ambas variables son numricas, por lo tanto es utilizable el coeficiente de correlacin de Pearson. 8.2. Calcule el coeficiente indicado para los propsitos deseados. Ingresando los valores a la calculadora, el resultado directo es: r = 0,557945788 8.3. Realice un anlisis de los resultados y concluya. Esta es una correlacin positiva, mediana, que indica que a mayor edad de la mujer, ms meses de embarazo al momento del aborto provocado. Conclusin: las mujeres de mayor edad tienden a provocarse abortos con ms meses de embarazo, las ms jvenes, con menos tiempo de embarazo.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

15

Caso 9: anlisis de datos socioeconmicos


El Almanaque Mundial, en edicin 1994, entrega datos socioeconmicos de los pases del mundo. Los siguientes datos corresponden a una muestra aleatoria de pases de Amrica: X1 = Pas. X2 = Esperanza de vida, aos. X3 = Ingreso Per Cpita, en dlares. X4 = Analfabetismo, en %. X5 = Poblacin Urbana, en %.
X1 Canad Guatemala Cuba Honduras Brasil Chile Per Uruguay Bahamas Hait Trinidad y T. Panam Mxico X2 77,0 65,3 75,7 65,8 66,0 72,0 64,6 72,4 69,5 54,1 71,0 72,8 70,3 X3 20.470 900 2.000 590 2.680 1.940 1.160 2.560 11.420 370 3.610 1.830 2.490 X4 4,4 44,9 6,0 26,9 19,0 6,6 9,9 3,8 10,0 47,0 3,9 11,9 12,7 X5 77,0 39,0 73,0 86,0 75,0 86,0 72,0 86,0 59,0 28,0 69,0 53,0 73,0

Realice un anlisis de correlacin entre las variables que se identifican y construya las conclusiones del caso: 9.1. X2 con X4 9.2. Poblacin urbana y esperanza de vida. 9.3. Ingreso per cpita y Poblacin urbana.

Solucin: 9.1. Se calcula el coeficiente de correlacin de Pearson. Ingresando los valores a la calculadora, resulta: r(X2, X4)=-0,81460685. Correlacin alta y negativa. A mayor analfabetismo, menor esperanza de vida. Entonces: La poblacin de pases americanos con mayor analfabetismo tiene menor esperanza de vida. La poblacin de pases americanos con menor analfabetismo tiene mayor esperanza de vida.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

16

9.2. Se calcula el coeficiente de correlacin de Pearson. Ingresando los valores a la calculadora, resulta: r(X2, X5)= 0,60135272 Correlacin moderada y directa. A mayor poblacin urbana, mayor esperanza de vida. Entonces: En los pases americanos, a mayor % de poblacin urbana, mayor es la esperanza de vida de la poblacin. En los pases americanos, a menor % de poblacin urbana, menor es la esperanza de vida de la poblacin.

9.3. Se calcula el coeficiente de correlacin de Pearson. Ingresando los valores a la calculadora, resulta: r(X3, X5)= 0,15114664 Correlacin baja, casi nula, despreciable. Entonces: El ingreso per cpita no est asociado a la poblacin urbana. En los pases americanos, su ingreso per cpita es independiente del % poblacin urbana.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

17

Caso 10: Evaluacin del Transantiago


Se realiza un estudio de opinin en 12 sujetos acerca de la calidad del servicio de locomocin colectiva (Transantiago), utilizando para evaluar la siguiente escala: Muy bueno, Bueno, Ms que suficiente, Suficiente, Menos que suficiente, Malo, Muy malo. Segn edad del encuestado (aos), los datos obtenidos son los siguientes:
Obs 1 2 3 4 5 6 7 8 9 10 11 12 Evaluacin Muy bueno Bueno Bueno Ms que suficiente Ms que suficiente Suficiente Suficiente Suficiente Menos que suficiente Malo Malo Muy malo Edad (aos) 21 35 20 22 44 45 37 32 29 62 55 58

10.1. Realice un anlisis de correlacin y concluya, en el marco del caso.

Solucin: Por tratarse de una variable numrica y otra ordinal, se debe calcular el coeficiente de correlacin de rangos de Spearman. Se realiza una transformacin de los valores de las variables a rangos. Se comenzar asignado el valor 1 para el rango de menor categora, es decir, Muy malo = 1. Se recordar que para asignar los rangos, en casos de empates o repeticiones, se asigna a cada uno un rango igual al promedio entre los rangos. Por ejemplo, a los valores Malo, le corresponde rango 2 y 3, Por tratarse de una repeticin tomarn cada uno el rango promedio 2,5. As, se construye la siguiente tabla:
Obs 1 2 3 4 5 6 7 8 9 10 11 12 X = Evaluacin Muy bueno Bueno Bueno Ms que suficiente Ms que suficiente Suficiente Suficiente Suficiente Menos que suficiente Malo Malo Muy malo Y = Edad (aos) 21 35 20 22 44 45 37 32 29 62 55 58 Rg(X) 12 10,5 10,5 8,5 8,5 6 6 6 4 2,5 2,5 1 Rg(Y) 2 6 1 3 8 9 7 5 4 12 10 11

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

18

Con los rangos de X y de Y, es ms breve el clculo del coeficiente de correlacin de Pearson de los rangos. Usando calculadora esto da: rS -0,76466

Alta correlacin negativa. A mayor edad, peor es la evaluacin del servicio del Transantiago. Es decir, los jvenes dan una mejor evaluacin del servicio del Transantiago que los de mayor edad.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados

19

Caso 11: Pobreza y problemtica social


Un estudio con una muestra de pases incluye las siguientes variables: W = ndice de pobreza (1 = alto; 2 = medio; 3 = bajo) X = tasa de homicidios (5 = alta; 3 = media; 1 = baja) Y = ndice de robos (3 = alto; 2 = medio; 1 = bajo) Z = ndice de ataques sexuales (2 = alto; 1 = medio; 0 = bajo) Establecindose las siguientes correlaciones de Spearman: 11.1. rS (W, X) = 0,832; 11.2. rS (W, Y) = 0,586; 11.3. rS (W, Z) = 0,109; 11.4. rS (X, Y) = 0,683. Construya una conclusin por cada una de las correlaciones dadas, en el marco del caso.

Solucin: 11.1. rS (W, X) = 0,832. Valores altos de W, es decir 3 = bajo, est asociado a los valores bajos de X, es decir 1 = baja. Entonces: La alta tasa de homicidios est estrechamente asociada a altos ndices de pobreza. La baja tasa de homicidios est estrechamente asociada bajos ndices de pobreza. 11.2. rS (W, Y) = 0,586. Valores altos de W, es decir 3 = bajo, est asociado a los valores bajos de Y, es decir 1 = bajo. Entonces: El alto ndice de robos est asociado medianamente a altos ndices de pobreza. Los bajos ndices de robos estn asociados medianamente a bajos ndices de pobreza. 11.3. rS (W, Z) = 0,109. Correlacin muy baja, despreciable. Entonces: Los ataques sexuales no estn asociados a los ndices de pobreza. Los ndices de ataques sexuales son independientes de los ndices de pobreza. 11.4. rS (X, Y) = 0,683. Valores altos de X, es decir 5 = alto, estn asociado a los valores altos de Y, es decir 3 = alto. Entonces: Los altos ndices de homicidios aparecen asociados a altos ndices de robos. Los altos ndices de robos estn asociados a altos ndices de homicidios.