Você está na página 1de 10
1. Introduccién 1.1. Introduccién En las tiltimas décadas se ha producido un gran crecimiento del uso de las técuicas estadisticas mullivariantes en todos los eampos de la investigacion cientifica, Podvfan darse muchas razones para este uso creciente, pero quiads as dos mas importantes sean las siguientes (Dillon y Goldstein, 1984): + En la mayorfa de las investigaciones eientificas, es necesario analizar rela- cianes simmulténeas entre tres 0 mas variables. La investigacién cientifica cs un proceso iterative. Primero ¢s necesaria la formulacién explicita de las hipétesis que despu yel anslisis de los datos, Estos andilisis probablemente sugieran una modili- cacién dle las hipotesis. En este proceso se aiiaden y climinan continua mente variables, La complejidad de los fenémenos analizados hace que sean muchas las variables implicadas y, por ello, las investigaciones sean necesariamente multivariantes, «s han de contrastarse mediante la recogida + El desarrollo de orcenaclores con capacidad de almacenamiento y potencia de procesamiento suficiente, acompaiiados de programas cada vex mas ficiles de usac, Pero ;,cémo definir cl analisis multivariante? La tarea no es sencilla. Muchos autores (Hair ef al, 2014a) optan por Ia alternativa de mostrarlo como una extension del audlisis bivariante, Bajo esta perspectiva, el anslisis umltivariante seria cl caso general y las técnicas univariantes © bivariantes serian los casos particulares de la anterior. De tna manera algo rss formal, Kachign (1991) define el anvilisis multiva- riante como la rama del andlisis estadistico que se centva. en la investigacion sinmltdnea de dos 0 mas caractertsticas (variables) medidas en un conjunto de objetos. En esta definicién, voluntariament relacién simultdnea entre las variables. En otras palabras, las téenieas multiva- riantes difieren de las univariantes y bivariantes en que dirigen su atencién no. al andlisis de la media y la varianza de una variable, o a Ja correlacion entre dos variables, sino al anilisis de las covarianvas o correlaciones que reflejan la relacién entre tres 0 mas variables, A lo largo de este libro, utilizaremos el término objetos para referienos a las personas, cosas o entidades de las que se toman las medidas. Las medidas, a aca, el elemento central es Ia 19 las que casi siempre nos xeferiremas como variables, sersn las caracteristicas © atributos de los objjetos que se consideran en la investigneién. 1.2. Niveles de medida de las variables Medir es el proceso mediante el cual se asocian ntimeros 0 sinabolos a deter- mninadas caracteristicas cle los objetos, de acuerdo con reglas preestablecidas (Sharma, 1996). Por ejemplo, a los individuos se les puede deseribir con re pecto @ caracteristicas como la edad, la educacién, los ingresos, el sexo 0 la preferencia por una marea u otra, y se deben buscar escalas adecuadas para modir esas caracteristicas. El tipo de escala utilizado para medit una variable es fundamental en Ta eleccién y aplicacion correcta del anélisis multivariante. A modo de ejemplo, si queremos establecer si existe una relacién de dependencia entre el nivel de ingresos de un individuo y, por ejemplo, su edad, edueaci 0, no seré lo mismo si los ingresos estén medidos directamente en euros, que si se recurre a una escala donde la medicién se hace par intervals: 1 = [0,600], 2 = (601, 1200] y 3 = (1201, oof. En el primer caso podremos reeurrir a una regresién lineal, en el segundo, probablemente debamos recurrir a una regresi6n logistica multino- mial. Stevens (1946) consideré que cualquier escala de medida pnede en alguno de los siguientes cuatro Lipos: nominales, ordinales, de intervalo o de raz6n. Esta clasificacién es la mas extendida y sera la que adoptaremos en este texto. Sin embargo, como sefiala Sharma (1996), no poclemos dejar de sefialar que ln aplicacién de esta clasificacion signe generando debates no resueltos en la literatura estadistica, Puede consultarse Velleman y Wilkinson (1993) para profundizar en esta cuestién, asificars 1.2.1. Escala nominal En este caso, los mimeros asiguados a cada caracteristica se comportan como etiquetas, con tanta validez como letras del alfabeto, que de hecho también padrian asignarse. Su misién es distinguir entre diferentes valores; por ejemplo: sexo (hombre, mujer). En el proceso de codificacién se puede asignar 1 al valor hombre y 2 al valor mujer. Esto no signifiea que la mujer sea mayor que el hombre (2 > 1) ni el doble (2 = 1 x 2), ni que existan personas de sexo intermedio (1,5). Por ello resulta totalmente inapropiado caleular estadisticos como la media o la varianza de una variable nominal, debiendo limitarnos a las recuentos de froeuencias, mada o tablas de contingencia cuando so cruce con otra variable nominal. ‘Una exigencia basica de las escalas uousinales es que los objetos han de poder clasificarse en categorias que scan mutuamente excluyentes y exhaustivas, es decir, cada individuo debe poder asignarse a una y solo una categoria y todos los individuos han de poder elasificarse en las categorias existentes 1.2.2. Escala ordinal No solo consigue distinguir entre valores, como la anterior, sino que ademis establece un orden entre ellos. Consideremos que aun individuo se le pide que ordene 4 modelos de coche (A, B, G y D) en funcién de que le gusten més © menos, Su respuesta es [A = 1, D = 2, 0 = 3 y B=), Bs obvio que el individue no solo no preficre igual al modelo A que al B, sino que, ademas preficre el morlela A mas que el B Sin embargo es muy importante seflalar que annque las diferencias numécicas entre las categorias sean numéricamente las mismas, esto no quiere decir que las diferencias de preferencia también Io scan. La diferencia de preferencia entre el antomévil A y el D no tiene por qué ser la mista que entze ol y el B, aunque (2-1 =4—3). Tampoco el antomévil A se prefiere el doble que el D. Por lo tanta, en las escalas ordinales, tiene sentido distinguir y ordenar, pero no las diferencias ni las razones. Los estadisticos que pueden ealeularse en este tipo de escalas los que se calculaban en Jas nominales, medianas y percentiles. son, ademas de 1.2.3. Escala de intervalo Una escala de intervalo pose las caracteristicas de una nominal (diferentes valores representan diferentes caracteristieas cle los objetos) y de la ordinal (mayor valor representa inayor presencia de Ia earacteristica, por ejemplo la preferencia). Sin embargo la. escala de intervalo aiade una nneva propicead: las diferencias también tienen sentido. Un ejemplo, que ademas es titi para distinguir estas escalas de las de vaz6n, es la medicién de la temperatura me- diante, por ejemplo, 1ma eseala Celsins. $i el termémetro marca 35°, marca wna temperatura distinta a si marca 30° (como a nominal), pero también marca mids temperatura (como la ordinal). Sin embargo, ademis, entre 35° y 30° hay la misma diferencia de temperatura que entre 30° y 25°: las diferencias iguales en os c6dligos se tracucen en diferencias iguales en cl atributo medido. enen sentido las razone: tan sencillo de ver. Aparente- Y es el doble de temperatura que 10°. Sin embargo veamos esta misrna medicién cn una escala Fahrenheit (figura 1.1). El atributo que se esta midien- do cs el mismo, la temperatura, pero decir que 20° es cl dable de 10° en Celsius ituplicaria Siempre que el atributo que se esté midiendo no tenga un cero absoluto, sino que este sea arbitrario, estarcmos ante escalas de intervalo. Es el caso, por ejemplo, de los calendarios, donde el cero se but coloeado arbitrariamente en el nacimiento de Cristo, pero hay calendarios con otros ceros y, de nuevo, las diferencias de arios tendr’n sentido pero las razones, cuando se comparen, no. ‘sto no to no es asi, que 68° es el doble de 50° eu Pubrenheit, y

Você também pode gostar