Você está na página 1de 11

Tema 8 An alisis de correspondencias

El An alisis de Correspondencias es una t ecnica de reducci on de dimensi on y elaboraci on de mapas percentuales. Los mapas percentuales se basan en la asociaci on entre objetos y un conjunto de caracter sticas descriptivas o atributos especicados por el investigador. Su aplicaci on es muy directa y su benecio es la capacidad para representar las y columnas en un mismo espacio. En este sentido la nalidad ser a determinar la posici on de una serie de objetos seg un una serie de caracter sticas a trav es de un espacio vectorial en dos, tres o m as dimensiones. En su forma b asica, el An alisis de Correspondencias examina las relaciones entre categor as de datos nominales mediante la medida de asociaci on de la chi-cuadrado. Este an alisis realiza una reducci on de la dimensi on del problema en donde la proximidad, en sentido matem atico, entre los individuos indicar a el nivel de asociaci on. El An alisis de Correspondencias tiene dos objetivos b asicos: Asociaci on entre categor as de columnas o las: se usa para medir la asociaci on de solo una la o columna, para ver, por ejemplo si las modalidades de una variable pueden ser combinadas Asociaci on entre categor as de las y columnas: se usa para estudiar si existe relaci on entre categor as de las las y columnas. El an alisis de correspondencias solo requiere que los datos representen las respuestas a una serie de preguntas y que est an organizadas en categor as. Dependiendo si existen dos o m as variables el an alisis ser a simple o m ultiple.

8.1.

An alisis de correspondencias

Uno de los objetivos del An alisis de Correspondencias es describir las relaciones existentes entre dos variables nominales, recogidas en una tabla de correspondencias, sobre un espacio de pocas dimensiones, mientras que al mismo tiempo se describen las relaciones entre las categor as de cada variable. Para cada variable, las distancias sobre un gr aco entre los puntos de categor as reejan las relaciones entre las categor as, con las categor as similares representadas

106

107 pr oximas unas a otras.

An alisis de correspondencias

El an alisis de las tablas de contingencia a menudo incluye examinar los perles de la y de columna, as como contrastar la independencia a trav es del estad stico de chi-cuadrado. Sin embargo, el n umero de perles puede ser bastante grande y la prueba de chi-cuadrado no revelar a la estructura de la dependencia. El procedimiento Tablas de contingencia ofrece varias medidas y pruebas de asociaci on pero no puede representar gr acamente ninguna relaci on entre las variables.

8.2.

Aplicaci on mediante SPSS


Analizar Reducci on de datos An alisis de Correspondencias

Para poder realizar un an alisis de correspondencias tendremos que seleccionar los men us:

En este ejemplo vamos a trabajar con el chero correspondencias en el cu al se mide a 1200 individuos dos variables, el Estado Civil, clasicado en tres grupos, Solteros, Casados y Otros y sus Preocupaciones m as importantes, en cuatro categor as, la Vida Afectiva, el Dinero, la Armon a Familiar y la Salud. Una vez seleccionado el an alisis obtendremos el siguiente men u, en donde hemos de seleccionar las variables con las trabajar y las categor as que tiene cada una. En este ejemplo la variable Fila ser a estado civil, la cu al tiene tres categor as (ordenadas de la 1 a la 3) por lo que el rango tomar a como valor m aximo el 3 y el m nimo el 1. La variable columna ser a preocupaciones, el rango ser a de 1 a 4. Figura 8.1: Selecci on del an alisis

A la hora de indicar las categor as de cada variable tenemos una serie de opciones sobre ellas que son: 1. Las categor as deben ser iguales. Utilizaremos esta opci on si existen dos categor as que son iguales o las queremos agrupar. ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

108

An alisis de correspondencias

2. La categor a es suplementaria si no inuye en el an alisis pero se representan. Bot on Modelo Con este bot on especicaremos el n umero de dimensiones, la medida de distancia, el m etodo de estandarizaci on y el m etodo de normalizaci on. Dimensiones en la soluci on : tendremos que tener en cuenta que el n umero de dimensiones optimo ser a el menor n umero de dimensiones que necesitaremos para explicar la mayor parte de la variaci on. Evidentemente intentaremos que este valor sea el m nimo posible, de tal manera que el n umero m aximo de dimensiones ser a el m nimo del n umero de las menos uno (en este caso 4-1=3) y el de columnas menos uno (3-1=2), es decir, en nuestro ejemplo usaremos dos dimensiones. Medida de distancia : por defecto usaremos la distancia chi-cuadrado. M etodo de normalizaci on : esta es una de las decisiones m as importantes, ya que dependiendo del m etodo, se producir an soluciones que, aunque equivalentes, pueden ser diferentes. Usaremos: 1. Sim etrico: en este caso la inercia se reparte igualmente entre las y columnas. Usaremos este m etodo para examinar las diferencias entre las categor as de las dos variables. 2. Principal: usaremos este m etodo si deseamos examinar las diferencias entre las categor as de una o de ambas variables en lugar de las diferencias entre las dos variables. 3. Principal por la: este m etodo se usa para examinar las diferencias entre las categor as de la variable de las. 4. Principal por columna: para examinar las diferencias entre las categor as de la variable de columnas. 5. Personalizado. Figura 8.2: Bot on Modelo

En nuestro ejemplo elegiremos la medida de la chi-cuadrado y como m etodo de normalizaci on el sim etrico. Como ya hemos visto el n umero de ejes o dimensiones apropiado ser a de dos. ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

109

An alisis de correspondencias

8.2.1.

Bot on Estad sticos

Con este bot on podremos obtener las siguientes salidas: Tabla de correspondencias : tabla de contingencia de las variables con los totales marginales de las y columnas. Inspecci on de los puntos de la : resumen de cada categor a de las, las puntuaciones, la masa, la inercia, la contribuci on a la inercia de la dimensi on y la contribuci on de la dimensi on a la inercia del punto. Inspecci on de los puntos de columna : igual que para las las pero para cada columna. Perles de la : marginales por las. Perles de columna : marginales por columnas. Permutaciones de la tabla de correspondencias. Estad sticos de conanza para puntos de la. Estad sticos de conanza para puntos de columna.

Figura 8.3: Bot on estad sticos

Aplicaci on en SPSS Vamos a seleccionar todas las opciones disponibles con este bot on. 1. Tabla de correspondencias : simplemente es la tabla de doble entrada de resumen de los datos; en ella podemos ver que por ejemplo existen 26 solteros cuya preocupaci on m as importante es la vida afectiva o 111 que es el dinero.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

110

An alisis de correspondencias

Figura 8.4: Tabla de contingencia

2. Perles por la y columna : son las distribuciones marginales. Los perles por la son el resultado de dividir cada valor por el total de su la mientras que los perles por columna es el valor de cada casilla entre el total su columna. 3. Tabla resumen : en esta tabla destacaremos varios aspectos: a ) Valor propio. b ) Inercia: ra z cuadrada del valor propio. Mide la importancia de un eje; 0.043 el primero y 0.05 el segundo. c ) Inercia total: explicaci on total de los ejes. Los ejes explican un total de 0.048. d ) Proporci on de inercia: aunque el valor de la inercia pod a parecer peque no, 0.0403 y 0.005, entre ambos ejes explican el 100 de la varianza y m as concretamente el primero el 90.4 % y el segundo el 9.06 %. e ) Chi-cuadrado: con este valor obtenemos el contraste de independencia entre ambas variables, como vimos en la secci on ?? el contraste de la chi-cuadrado en las Tablas de Contingencia contrasta la independencia como hip otesis nula frente a la 3 amos la hip otesis de dependencia. En este caso al ser el p-valor 0,3 10 aceptar dependencia entre variables. Destacamos que en el caso en que dos variables fuesen independientes, el an alisis de correspondencias podr a realizarse, pero no tendr a l ogica. Figura 8.5: Estad sticos

f ) Examen de los puntos la :

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

111

An alisis de correspondencias Las puntuaciones en la dimensi on son los valores que toma cada punto en la representaci on que hayamos calculado. Con inercia vemos lo que aporta cada categor a al total de inercia, por ejemplo, del total de inercia (0.048) los Solteros aportan 0.028. Con contribuci on de los puntos a la inercia de la dimensi on se mide la importancia de un punto a la hora de explicar un eje, por ejemplo Soltero es el valor m as importante para la orientaci on del primer eje y Otro para el segundo. Con contribuci on de la dimensi on a la inercia del punto vemos el porcentaje de cada modalidad explicado por cada eje, el primer eje explica el 98.30 % de la modalidad Soltero frente a solo el 1,7 % del segundo eje. g ) Examen de los puntos columna : Igual que el caso anterior, adem as de los valores para representar en los ejes, podemos ver que el primer eje viene muy determinado por el Dinero frente al segundo que lo hace por la Armon a Familiar. Tambi en podemos ver que el primer eje explica el 99.9 % de la varianza de la modalidad de Dinero y el 93 % de Salud. Figura 8.6: Puntos la y columna

8.2.2.

Bot on gr acos

Dentro del bot on de gr acos podremos especicar las siguientes opciones: Diagramas de dispersi on : produce los gr acos por parejas de las dimensiones. Entre ellos: 1. Diagrama de dispersi on biespacial: diagramas conjuntos de los puntos de las y de columnas. 2. Puntos de la. 3. Puntos de columna. ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

112

An alisis de correspondencias Gr aco de l neas. Para obtener los siguientes gr acos unidimensionales: 1. Categor as de la transformadas : produce un gr aco de los valores originales para las categor as de la frente a las puntuaciones de la. 2. Categor as de columna transformadas : produce un gr aco de los valores originales para las categor as de columna frente a las puntuaciones de columna. Dimensiones del gr aco. 1. Muestra todas las dimensiones de la soluci on. 2. Restringe el n umero de dimensiones

Figura 8.7: Bot on gr acos

Vamos a seleccionar todos los gr acos posibles. Aplicaci on en SPSS Si seleccionamos todos los gr acos posibles obtendremos:; Diagramas de dispersi on : Con esta opci on obtenemos los gr acos en dos dimensiones (si hubiera mas dimensiones obtendr amos las combinaciones de las dimensiones) para las y columnas a la vez y por separado. Si analizamos los perles la, observamos que los tres grupos, Solteros, Casados y Otros son bastante diferentes (lejanos). Si observamos los puntos columna, en estos parece que existe semejanza entre Dinero y Vida Afectiva y Salud y Armon a Familiar.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

113

An alisis de correspondencias

Figura 8.8: Gr acos de las y gr aco de columnas

Con el gr aco de las y columnas podemos sacar las conclusiones nales, que son que los Casados preeren la Armon a Familiar y la Salud frente a los Solteros que preeren el Dinero y la Vida Afectiva. Figura 8.9: Gr aco conjunto

Gr acos de l neas : muestras los valores de las componentes de las las y columnas unidimensionalmente.

8.3.

An alisis de correspondencias multiple

Para este caso vamos a usar el chero correspondencias2, que contiene los 50 primeros individuos del ejemplo anterior, pero a los que adem as se les ha estudiado el Sexo. Los procedimientos son los mismos solo que un poco m as amplios.

8.3.1.

Aplicaci on en SPSS

Para obtener un an alisis de correspondencias m ultiple, tendremos que elegir los men us: ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

114 Analizar Reducci on de Datos Escalamiento optimo y en la ventana del modelo seleccionar:

An alisis de correspondencias

Todas las variables son nominales m ultiples Un conjunto Denir Dentro de este an alisis podr amos obtener todos los resultados equivalentes al an alisis de correspondencias simple. Nosotros solo nos centraremos en las siguientes opciones: Opciones : cambiaremos m etodo de normalizaci on a sim etrico. Bot on resultados : seleccionaremos 1. Medidas discriminantes 2. Correlaciones de las variables originales Con estas dos opciones podemos ver la relaci on entre las variables. La correlaci on m as baja es entre la variable Sexo con las otras dos, lo que implicar a que no existe mucha relaci on entre ellas. Con respecto a la segunda dimensi on los valores aumentan pero sigue la variable Sexo sin estar muy relacionada. Tambi en podemos ver esta circunstancia en el gr aco de discriminaci on, en donde las variables Estado Civil y Preocupaciones est an muy relacionadas. La tabla de Medidas de discriminaci on son las coordenadas de las variables en las dos dimensiones. En la Tabla de resumen del modelo, vemos tambi en como con dimensiones explicamos el 91.7 % de la varianza total. Figura 8.10: Correspondencias multiples

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

115

An alisis de correspondencias

Figura 8.11: Correspondencias multiples2

3. Cuanticaciones y contribuciones de las categor as: Las cuanticaciones son los valores de los individuos son las representaciones optimas en el sentido que est en separadas unas de otras en las dimensiones estudiadas y dentro de cada categor a los individuos est en juntos entre si. Estas cuanticaciones son gracadas posteriormente y ser a esos valores los que estudiemos. Bot on Gr acos de variable : 1. Gr acos por categor as: introduciremos las tres variables. Con esta opci on nos mostrar a los gr acos bidimensionales de las variables marginalmente. 2. Gr acos de categor as conjuntas: tambi en introduciremos las tres variables. En este caso obtendremos un gr aco bidimensional con todas las variables juntas. Figura 8.12: Gr acos

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

116

An alisis de correspondencias En ellos podemos ver como los Hombres se posicionan cerca de preferencia por la Vida Afectiva, solteros por Armon a Familiar, Otro con Salud y Mujer con Casadas. 3. Gr acos de objeto: con este gr aco obtenemos la representaci on de todos los individuos pudiendo buscar aquellos que sean an omalos o extremos, que ser a aquellos que tengan un comportamiento distinto al resto. Figura 8.13: Puntos objeto

8.4.
8.4.1.

Ejercicios obligatorios
Ejercicio primero

El chero correspondencias3, contiene los datos para 1519 individuos, agrupados en categor as profesionales (numeradas del 1 al 5), y su consumo de tabaco (categor as 1 a 4). Se pide: 1. Cu al ser a el n umero de dimensiones m aximo posible? 2. Se podr a realizar una an alisis de dos dimensiones?, por qu e? 3. Realizar una an alisis de correspondencias con dos dimensiones. Ser a admisible agrupar alguna modalidad de la variable consumo de tabaco? Y de categor a profesional? Comentar el gr aco bidimensional.

8.4.2.

Ejercicio segundo

Se quiere analizar la inuencia de la raza en cada una de las regiones de America del Norte. Para ello se selecciona una muestra de tal manera que a esos individuos se analiza su regi on en donde viven y la raza a la que pertenecen. Los resultados aparecen en el chero correspondencias4. Se desea realizar un an alisis de correspondencias completo (incluido el an alisis de independencia y el estudio de las tablas de frecuencias marginales) en el que se analice esta hip otesis.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Você também pode gostar