Você está na página 1de 18

Tcnicas estadsticas multivariadas y sus aplicaciones a indicadores e ndices econmico financieros de la actividad turstica

Autor: Rigoberto Fernndez MATEMTICAS FINANCIERAS Y EVALUACIN DE PROYECTOS

El anlisis econmico financiero de las empresas tursticas, muestra cada da mayor relevancia y significacin en la literatura nacional e internacional, las tcnicas tradicionales son empleadas con ms frecuencia y la evaluacin de sus resultados permiten tomar las decisiones adecuadas en el momento preciso. El presente artculo expone y sugiere el empleo de herramientas de la estadstica multivariada, las que pueden ser utilizadas entre otros, en el sector empresarial y muy en particular en el sector turstico. El trabajo muestra un ejemplo a partir de un Caso de Estudio que intenta estimular su empleo por parte de especialistas e investigadores en el rea turstica. 2. Comentarios acerca de las Tcnicas Multivariadas Las aplicaciones de la estadstica multivariada estn presentes en distintas reas o ramas de la ciencias, como por ejemplo en: Investigacin de mercados (para identificar caractersticas de los individuos con el propsito de determinar qu tipo de personas compran determinado producto); en el sistema de educacin de cualquier tipo de especialidad (para conocer los estudiantes que tendrn xito y concluirn satisfactoriamente sus estudios); en la agricultura (al estudiar la resistencia de determinado tipo de cosechas a daos por plagas y sequas); en el deporte (para conocer a partir de medidas antropomtricas las posibilidades de obtener buenos resultados en un deporte especfico); en la psicologa (al estudiar la relacin entre el comportamiento de adolescentes y actitudes de los padres); en la economa (para conocer el nivel de desarrollo de un territorio en relacin con otros y realizar inferencias a partir de variables econmicas fundamentales, entre otros). Los datos multivariados surgen cuando a un mismo individuo se le mide ms de una caracterstica de inters. Un individuo puede ser un objeto o concepto que se puede medir. Ms generalmente, los individuos son llamados unidades experimentales. Ejemplos de objetos: personas, animales, terrenos, compaas,

pases, etc. Ejemplos de conceptos: amor, amistad, noviazgo, etc. Una variable es una caracterstica o atributo que se le mide a un individuo. Objetivos de las tcnicas multivariadas: 1) Simplificacin: Los mtodos multivariados son un conjunto de tcnicas que permiten al investigador interpretar y visualizar conjuntos grandes de datos (tanto en individuos como en variables), a partir de su simplificacin o reduccin. 2) Relacin: Encontrar relaciones entre variables, entre individuos y entre ambos. 2.1) Relacin entre variables: Existe relacin entre variables cuando las mismas miden caractersticas comunes. Ejemplo: Suponga que se realizan exmenes de espaol, matemtica e historia a estudiantes de nivel 12, seleccionados en las entidades tursticas del pas, para el ingreso en la carrera de licenciatura en turismo. Si cada uno de los estudiantes obtiene calificaciones altas, regulares o bajas en los tres exmenes, entonces los exmenes estaran relacionados entre s. En este caso, la caracterstica comn que estos exmenes pueden estar midiendo podra ser la "inteligencia general" que les permita comenzar esa carrera universitaria. 2.2) Relacin entre individuos: Existe relacin entre individuos si alguno de ellos son semejantes entre s. Ejemplo: Suponga que se evalan diferentes tipos de cervezas respecto a su nivel de aceptacin y se miden, por ejemplo, los consumos de las mismas para diferentes grupos de edades, se podra esperar que las cervezas claras y oscuras tengan algn tipo de relacin, o que los tipos de cervezas sean totalmente diferentes.

En los mtodos multivariados, se supone que las variables estn correlacionadas, pero las observaciones sobre los individuos son independientes. Generalmente se supone tambin que el conjunto de variables que intervienen en el anlisis poseen una distribucin normal multivariada. Esta suposicin permite que el anlisis multivariado se desarrolle paralelamente al correspondiente anlisis univariado basado en una distribucin normal. Clasificacin de los mtodos multivariados: 1) Dirigidas o motivadas por las variables: se enfocan en las relaciones entre variables. Ejemplos: matrices de correlacin, anlisis de componentes principales, anlisis de factores y anlisis de regresin. 2) Dirigidas o motivadas por los individuos: se enfocan en las relaciones entre individuos. Ejemplos: anlisis discriminante, anlisis de conglomerados y anlisis multivariado de varianza. Anlisis exploratorio multivariado Las estadsticas descriptivas (multivariadas), como su nombre lo indica, sirven para describir el comportamiento de un conjunto de datos, entre ellas las ms importantes son: Media Muestral Varianza Muestral Correlacin Muestral Diagrama de Dispersin Componentes Principales Inferencia estadstica

El problema de inferencia estadstica consiste en aproximar el valor de ciertas caractersticas poblacionales (llamadas parmetros) por medio de resmenes (llamados estadsticas) generados a partir de la informacin contenida en una muestra obtenida de la poblacin. Estimacin Puntual: El problema de estimacin puntual consiste en proporcionar un valor puntual que aproxime al parmetro de inters. Los mtodos clsicos de estimacin puntual de parmetros son: mtodo de momentos y mtodo de mxima verosimilitud. Pruebas de Hiptesis: El problema de contraste de hiptesis en estadstica consiste en decidir cul de dos hiptesis es correcta. La decisin se toma de acuerdo con la informacin de la muestra. La prueba de hiptesis de mayor importancia en datos multivariados es probar si la correlacin entre dos variables es significativamente distinta de cero. Intervalos de Confianza: El calcular un intervalo de confianza es un problema de estimacin por intervalo, en donde lo que se proporciona es un conjunto de valores altamente posibles como aproximaciones al parmetro. Al igual que en el caso de pruebas de hiptesis, el intervalo de confianza de mayor inters es el de la correlacin entre dos variables. Uso de correlaciones para agrupar variables. Es posible que cuando se tiene un conjunto grande de variables, exista cierta relacin entre algunas de las variables. El coeficiente de correlacin entre parejas de variables permite agrupar variables de tal manera que variables en el mismo grupo tengan correlaciones altas y variables en grupos diferentes tengan correlaciones bajas.

Tcnicas Seleccionadas del Anlisis Multivariado Anlisis de Regresin Mltiple La regresin es una tcnica utilizada para la investigacin y modelacin de las relaciones existentes entre variables que inciden en un determinado fenmeno de la realidad. Un analista econmico, por ejemplo, pudiera estar interesado en establecer la relacin que existe entre la situacin que presentan los ndices financieros de una empresa y un probable escenario de desequilibrio o no. En un sentido amplio, la regresin es un proceso que tiene como finalidad ajustar un modelo a un conjunto de datos u observaciones. En realidad, la ecuacin de regresin es slo una

aproximacin de la relacin existente entre las variables. La regresin puede ser utilizada como herramienta descriptiva o como herramienta inferencial. En el primer caso, el investigador puede estar interesado en encontrar la mejor ecuacin lineal de prediccin. Tambin puede controlar un conjunto de factores presentes en el fenmeno para evaluar. En el segundo caso, o sea, inferencial, el investigador est interesado en realizar estimaciones de los parmetros poblacionales a travs del examen de una muestra de observaciones y verificar algunas pruebas de hiptesis tales como si existe realmente una relacin lineal entre las variables independientes, o sea, si una variable independiente especfica no tiene efecto lineal sobre la dependiente. Anlisis de Componentes Principales El anlisis de componentes principales (ACP), es una tcnica estadstica que fue propuesta a principios del siglo XIX por Karl Pearson como parte del anlisis de factores. Sin embargo la complejidad de los clculos retras su desarrollo hasta la aparicin de los computadores y su utilizacin en la segunda mitad del siglo XX. El objetivo principal que persigue el ACP es la representacin de las medidas numricas de varias variables en un espacio de pocas dimensiones donde nuestros sentidos puedan percibir relaciones que de otra manera permaneceran ocultas en dimensiones superiores. Dicha representacin debe ser tal que al desechar dimensiones superiores (generalmente de la tercera o cuarta en adelante) la prdida de inormacin sea mnima. Lo anterior, aunque sugiere que el ACP es una tcnica descriptiva, no niega la posibilidad de que tambin pueda ser utilizado con fines de inferencia. El ACP permite reducir la dimensionalidad de los datos, transformando el conjunto de p variables originales en otro conjunto de q variables incorrelacionadas, llamadas componentes principales. Las p variables son medidas sobre cada uno de los n individuos, obtenindose una matriz de datos de orden np (p < n). En el ACP existe la opcin de usar la matriz de correlaciones o bien, la matriz de covarianzas. En la primera opcin se le est dando la misma importancia a todas y a cada una de las variables; esto puede ser conveniente cuando el investigador considera que todas las variables son igualmente relevantes. La segunda opcin se puede utilizar cuando todas las variables tengan las mismas unidades de medida y adems, cuando el investigador juzga conveniente destacar cada una de las variables en funcin de su grado de variabilidad. Las q nuevas variables (componentes principales) son obtenidas como combinaciones lineales de las variables originales. Los componentes se ordenan en funcin del porcentaje de varianza explicada. En este sentido, el primer componente ser el ms importante por ser el que explica mayor porcentaje de la varianza de los datos. Queda a criterio del investigador

decidir cuntos componentes se elegirn en el estudio. El ACP tiene la ventaja de no exigir supuestos tales como la normalidad. Aplicaciones Entre los usos ms frecuentes del ACP estn: 1) Como tcnica de anlisis exploratorio que permite descubrir interrelaciones entre los datos y de acuerdo con los resultados, proponer los anlisis estadsticos ms apropiados. 2) Reducir la dimensionalidad de la matriz de datos con el fin de evitar redundancias y destacar relaciones. En la mayora de los casos, tomando slo los primeros componentes, se puede explicar la mayor parte de la variacin total contenida en los datos originales. 3) Construir variables no observables (componentes) a partir de variables observables. Por ejemplo, la inteligencia de una persona no es observable directamente, en cambio, se puede medir distintos aspectos de sta mediante pruebas psicomtricas. Las variables que miden los distintos aspectos de la inteligencia tienden a covariar; esto sugiere que expresan la mismas caractersticas pero de diferente forma y que slo hay un pequeo nmero de rasgos no directamente medibles, que se denominan Indicadores sintticos y que vienen estimados por los componentes. 4) Bajo ciertas circunstancias, es de gran utilidad usar estos componentes incorrelacionados, como datos de entrada para otros anlisis. Por ejemplo, en el caso de la regresin mltiple cuando las variables independientes presentan alta colinealidad es preferible hacer la regresin sobre los componentes principales en lugar de usar las variables originales. Anlisis Discriminantes Tcnica y herramienta estadstica que permite predecir el comportamiento nominal de una variable dependiente a travs de una combinacin lineal de las variables independientes, tambin llamadas variables predictivas, caractersticas o parmetros, que hagan que los puntajes promedios de las categoras de las variables dependientes en sta combinacin lineal se diferencien en forma mxima. Utilizada en investigaciones de mercado, por ejemplo, para predecir si las ventas potenciales en un territorio dado de mercado sern "buenas" o "malas" ,las variables dependientes, con base en ciertas evaluaciones sobre el ingreso personal disponible por territorio, densidad de poblacin y nmero de ventas al detalle, las variables predictivas. Otros ejemplos de aplicacin es en instituciones financieras, donde definidas cuentas "problemticas" o "serias", a cada una de ellas se les describe parmetros como tasas de crdito, nmeros de veces en

mora, razones de deuda a capital, existencia de demandas, posteriormente se obtienen aquellas variables predictivas que mejor puedan discriminar en que una determinada unidad de anlisis, individuos, objetos o en ste caso una cuenta pueda convertirse en "seria " o "problemtica". Dos son los objetivos centrales del anlisis discriminante: 1.-predecir la categora de una unidad de anlisis u objeto o individuo. 2.-determinar cuales son las variables predictoras con mayor poder discriminante para clasificar a las unidades de anlisis para que tengan uno o el otro atributo de la variable dependiente. La forma de conseguir los objetivos es va la obtencin de una funcin discriminante: FD = 1 X1 + 2 X2 + ...............+ m Xm donde xm es la m-sima variable independiente. La funcin discriminante obtenida por programas computacionales como el systat, BMD-07M o el statgrafics determinan los valores para cada variable independiente de los que reciben el nombre de coeficientes discriminantes, betas discriminantes o pesos discriminantes. Cada beta discriminante calculado tiene un monto o coeficiente determinado y su correspondiente signo positivo o negativo. El coeficiente de los betas determina el peso de cada una de las variables independientes en la discriminacin y el signo, positivo o negativo, representa su asignacin en uno u otro de los subgrupos definidos por las variables dependientes. La finalidad es remplazar una unidad de anlisis, objeto o individuo de la poblacin objetivo con sus variables independientes, parmetros o caracterstica en la funcin obtenida y calcular a priori su categora. Algebricamnte la funcin discriminante representa una combinatoria lineal de los datos originales que maximizan la razn de variabilidad entre grupos (por una parte la cuentas problemticas y por otra las seria) a variabilidad intra grupos. El criterio que se utiliza para decidir cuando son diferentes al mximo la variabilidad de grupos es la prueba anlisis de varianza F o tambin denominada F de Snedecor, conocida para hallar diferencias entre las varianzas. Por lo tanto, los coeficientes discriminantes se derivan de tal forma que: Variabilidad entre Grupos F = --------------------------------- sea mxima Variabilidad intra Grupos El punto de partida de cualquier anlisis discriminante es la determinacin de la matriz de datos de variables dependientes, de carcter nominal, la que puede ser calculada por componentes principales o dadas. 3. Un Caso de Estudio. Hoteles Miramar

La Cadena de Hoteles Miramar S.A., con 10 aos de operacin, ha consolidado su posicin en la zona del Caribe, con instalaciones en casi todos los pases del rea. La Junta de Accionista ha solicitado a la Junta de Direccin de sus hoteles, una clasificacin de los mismos, de acuerdo a los resultados de su actividad econmica con el propsito de tomar decisiones en aquellos que han quedado rezagados en sus metas. Para realizar este trabajo, la Junta de Direccin contrata a una consultora, dedicada a temas econmicos y de auditoria, y le solicita que se examinen en cada uno de los 30 hoteles que posee la Cadena las variables siguientes: Crecimiento de las Ventas, de la Rentabilidad Econmica y el Costo por Peso. La consultora decide que para lograr el objetivo propuesto deban apelar a las tcnicas multivariadas, especficamente al anlisis de componentes principales y el anlisis discriminante. En el procesamiento de la informacin se emple el Sistema Statgraphics, de uso muy extendido. Los resultados que se brindan a continuacin provienen de los resultados que brinda ese Sistema. ANALISIS DE COMPONENTES PRINCIPALES RESUMEN Variables Analizadas: Crecimiento de las Ventas Rentabilidad Econmica Costo por peso Nmero de casos: 30 Estandarizacin: si Nmero de componentes extradas: 1 Anlisis de Componentes Principales ----------------------------------------------------------------------------Por ciento Componente de Varianza Por ciento Nmero Valor Propio Explicada Acumulado 1 2,7729800 92,433 92,433 2 0,1507870 5,026 97,459 3 0,0762356 2,541 100,000 ----------------------------------------------------------------------------

Comentario --------------El propsito ha sido obtener una combinacin lineal de las 3 variables estudiadas, que explique la mayor parte de la variabilidad de los datos, en este caso, la primera componente explica el 92.433% de la variabilidad de los datos originales.

Table of Component Weights Componente 1 -----------Crecimiento de las Ventas 0,584118 Rentabilidad Econmica 0,577760 Costo por peso Comentario El cuadro anterior muestra los coeficientes de las variables de la primera componente principal, cuya ecuacin viene dada por: 0,584118*Crecimiento de las Ventas + 0,57776*Rentabilidad Econmica + 0,570088*Costo por peso Donde a los valores de las variables en la ecuacin han sido estandarizados, es decir, se les ha sustrado sus valores medios y divididos por la desviacin estndar. ANALISIS DISCRIMINANTE Resumen 0,570088

Variable de Clasificacin: Col_7 Variables Independientes: Crecimiento de las Ventas Rentabilidad Econmica Costo por peso Nmero de casos: 30 Nmero de Grupos: 2 Funcin Porcentaje Correlacin Discriminante Valor Propio Relativo Cannica ----------------------------------------------------------------------------1 3,14232 100,00 0,87097 Functions Derived Wilks Chi-Square DF P-Value Lambda

----------------------------------------------------------------------------1 0,241411 37,6633 3 0,0000 Comentario Este procedimiento est diseado para obtener un conjunto de funciones discriminantes que puedan ayudar a predecir la variable dependiente basado en los valores cuantitativos de las variables independientes. Unos 30 casos fueron empleados para obtener un modelo discriminante en dos grupos. Tres variables predictivas fueron introducidas. La primera funcin discriminante es estadsticamente significativa a un nivel de significacin del 95%.

Funcin Discriminante para la variable Dependiente Coeficientes Estandarizados --------------------------------Rentabilidad Econmica 0,736324 Crecimiento de las Ventas 0,171982 Costo por peso 0,196148 ----------------------------------------------------------------------Coeficientes no Estandarizados ------------------------------------Rentabilidad Econmica Crecimiento de las Ventas Costo por peso Constante -25,5891 0,1371040 0,0454077 0,0629418

Comentario --------------El cuadro anterior muestra los coeficientes de la funcin usada para discriminar entre los diferentes niveles de la variable dependiente. De particular inters son los coeficientes estandarizados. La primera funcin discriminante estandarizada es: 0,736324*Rentabilidad Econmica + 0,171982*Crecimiento de las Ventas + 0,196148*Costo por peso A partir de las magnitudes relativas de los coeficientes de la ecuacin anterior, se puede determinar como la variable dependiente puede emplearse para discriminar entre grupos.

Tabla de Clasificacin Tamao Grupos Grupos del Grupo 1 2 --------------------------------------------------------------1 15 15 0 (100,0%) (0,0%) 2 15 0 15 (0,0%) (100,0%) ---------------------------------------------------------------Por ciento de clasificacin correcta: 100,0% Resumen de las Estadsticas del Grupo -------------------------------------------------------------------------------------------Variable Dependiente 1 2 TOTAL CANTIDAD 15 15 30 -------------------------------------------------------------------------------------------MEDIAS Rentabilidad Econmica 97,38 115,227 106,303 Crecimiento de las Ventas 94,06 104,893 99,4767 Costo por peso 99,3667 107,093 103,23 --------------------------------------------------------------------------------------------DEVIACIN ESTANDAR Rentabilidad Econmica 4,29737 6,26241 10,4986 Crecimiento de las Ventas 4,47386 2,94533 6,6485 Costo por peso 2,37296 3,71377 4,98163 --------------------------------------------------------------------------------------------Coeficientes de la Funcin de Clasificacin para la variable dependiente -----------------------------------------------------------------------------1 2 Rentabilidad Econmica -0,738405 -0,268809 Crecimiento de las Ventas 2,29896 2,45449 Costo por peso 9,06632 9,28191 Constante -523,306 -610,951 Resultado

-523,306 - 0,738405*Rentabilidad Econmica + 2,29896*Crecimiento de las Ventas + 9,06632*Costo por peso

Esta funcin es utilizada como predictora de la variable dependiente para las nuevas observaciones. Estadsticas Matriz de Covarianzas Rentabilidad Econmica Crecimiento Ventas Rentabilidad Econmica 28,8426 Crecimiento de las Ventas 14,6768 Costo por peso 9,36831 7,93248 9,71152 Matriz de Correlacin Rentabilidad Econmica Crecimiento Ventas Costo por peso Rentabilidad Econmica 1,0 0,721541 0,559758 Crecimiento de las Ventas 0,721541 1,0 0,672066 Costo por peso Comentario Este cuadro muestra las correlaciones estimadas entre las variables independientes dentro de cada Grupo. La entidad consultora resume los resultados obtenidos de la forma siguiente: La mitad de los hoteles de la Cadena Miramar presentan problemas en sus operaciones. La metodologa empleada y las ecuaciones encontradas permiten discriminar si un Hotel se encuentra o no con problemas en sus operaciones. Este estudio deber debe realizarse tanto en perodo de baja como alta turstica. El indicador crecimiento de las ventas tiene el peso fundamental en el resultado de las operaciones de los Hoteles, le sigue a continuacin la rentabilidad de las ventas y finalmente el costo por peso. Se aconseja efectuar una revisin rigurosa de la situacin que presentan aquellos Hoteles que no logran estar en el grupo de resultados satisfactorios. 4. Bibliografa 0,559758 0,672066 1,0

Costo por peso 14,6768 9,36831 14,3452 7,93248

Linares Fintes, Gladys; Acosta Ramrez, Liliam; Sintache Vega, Vivian. Estadstica Multivariada ENDES, Stgo de Cuba. Cuba. 1986. htpp://www.emagister.com//Comunidad_Emagister_quiebra_2001 htpp://www.google.es//Anlisis de Componentes Principales. Componentes Principales con Statgraphics . 2005 htpp://www.google.es//Anlisis Multivariado. Anlisis Multivariado. 2005 htpp://www.google.es.//Anlisis Discriminante. Salud Financiera de una Empresa. Modelo Altman para Mercados Emergentes . 2006 htpp://www.google.es//Anlisis Discriminante. Anlisis Discriminante . 2006

1. UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMTICAS ( Universidad del Per, DECANA DE AMERICA) Mg. Mara Estela Ponce Aruneri ESCUELA ACADMICO PROFESIONAL DE ESTADSTICA DEPARTAMENTO ACADMICO DE ESTADSTICA SEMESTRE 2009-II

2. QU ES EL ANLISIS MULTIVARIANTE? Es el conjunto de mtodos estadsticos cuya finalidad es analizar simultneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo objeto estudiado. Su razn de ser radica en un mejor entendimiento del fenmeno objeto de estudio obteniendo informacin que los mtodos estadsticos univariantes y bivariantes no pueden proporcionar.

3. As, como Hair et al. (1999) dicen: Las mujeres y hombres de negocios de hoy no pueden seguir aproximaciones ya pasadas en las que los consumidores eran considerados homogneos y caracterizados por un nmero pequeo de variables demogrficas. En su lugar, deben desarrollar estrategias que atraigan a numerosos segmentos de clientes con caractersticas demogrficas y psicogrficas diversas en un mercado con mltiples restricciones (legales, econmicas, competitivas, tecnolgicas, etc). Slo a travs del anlisis multivariante las relaciones mltiples de este tipo podrn ser examinadas adecuadamente para obtener un entendimiento ms completo y real del entorno que permita tomar las decisines ms adecuadas .

4. Es una metodologa estadstica sofisticada, mucho ms potente, que utiliza los mtodos del lgebra lineal, matricial, clculo numrico, geometra lineal, entre otras. Los mtodos de anlisis multivariante se diferencian unos de otros, segn su rea de aplicacin se refiera a una o ms problemas y segn se requiera uno o ms grupo de variables .

5. Objetivos del Anlisis Multivariante Pueden sintetizarse en dos: 1) Proporcionar mtodos cuya finalidad es el estudio conjunto de datos multivariantes que el anlisis estadstico uni y bidimensional no pueden conseguir. 2) Ayudar al analista o investigador

a tomar decisiones ptimas en el contexto en el que se encuentre teniendo en cuenta la informacin disponible por el conjunto de datos analizado.

6. TIPOS DE TECNICAS MULTIVARIANTES Se pueden clasificar en tres grandes grupos: 1) Mtodos de dependencia Suponen que las variables analizadas estn divididas en dos grupos: las variables dependientes y las variables independientes. El objetivo de los mtodos de dependencia consiste en determinar si el conjunto de variables independientes afecta al conjunto de variables dependientes y de qu forma. 2) Mtodos de interdependencia Estos mtodos no distinguen entre variables Mtodos estructurales Suponen que las dependientes e independientes y su objetivo consiste en identificar qu variables estn relacionadas, cmo lo estn y por qu. 3) variables estn divididas en dos grupos: el de las variables dependientes y el de las independientes. El objetivo de estos mtodos es anlizar, no slo como las variables independientes afectan a las variables dependientes, sino tambin cmo estn relacionadas las variables de los dos grupos entre s.

7. CLASIFICACIN DE LAS TCNICAS MULTIVARIANTES El tipo de relacin que est siendo examinadas es de: Dependencia Interdependencia. La estructura de la relacin es entre: Variables. C.P. Anlisis Factorial Modelos loglineal. Casos. Anlisis Cluster Objetos. Escalamiento multidimensional. Anlisis de Corresponden -cias una Variable dependiente Varias Variables dependientes Mtrica. Regresin Mltiple. Anlisis de supervivencia. No mtrica. Anlisis Discriminante. Modelos de Regresin Logstica. Anlisis Conjunto. Mtricas. Manova. Correlacin Cannica.

8. FASES PRINCIPALES DE UNA INVESTIGACIN MULTIVARIANTE Definir el problema de Investigacin Objetivos; diseo e hiptesis Tcnica Multivariante a utilizar. Desarrollo del Proyecto de Anlisis Evaluacin de los supuestos de la Tcnica Multivariante Estimacin del modelo Multivariante. Valoracin del Ajuste del Modelo. Interpretacin de los valores Tericos Validacin del Modelo Multivariante

9. APLICACIONES DE LAS TCNICAS MULTIVARIANTES Medicina Evaluar la presencia o ausencia de determinados sntomas clnicos para diagnosticar la enfermedad de un paciente (anlisis discriminante). Para estimar la probabilidad de que la sintomatologa de una determinada enfermedad reaparezca antes de un perodo determinado, conocidos el tiempo de respuesta al tratamiento y los distintos hbitos del paciente, (Regresin logstica). Se tabula las frecuencias de ciertos estmulos y sus respuestas. Interesa obtener una representacin bidimensional de las correspondencias entre estmulos y respuestas (Anlisis Factorial de Correspondencia).

10. Biologa : Se miden diferentes variables biomtricas en los individuos de una misma especie. Se desea detectar componentes de tamao y forma (Anlisis de Componentes Principales). Las observaciones de p variables biomtricas representativas de los individuos de una especie, se obtienen para estudiar la variabilidad entre diferentes especies o razas geogrficas (Anlisis Cannicos).

11. Sociologa: Con referencia a determinadas caractersticas sociales, polticas y geogrficas se mide la similaridad de un grupo de naciones. (Escalamiento Multdimensional). Psicologa : Los resultados de un test de inteligencia de n tems basados en una muestra. Para detectar los factores de la inteligencia (Anlisis Factorial).

12. Investigacin de Mercados : 1.Se quiere determinar los beneficios subyacentes que buscan los consumidores en la compra de una pasta dental. (Anlisis Factorial). 2. Para el anlisis de percepciones y preferencias del consumidor (Escalamiento Multidimensional).

13. TAREA El estudiante realizar un resumen sobre las clases de variable y los tipos de escala de medida, con sus respectivos ejemplos.

14. MATRIZ DE DATOS Llamaremos X a la matriz de datos y x ij a su elemento genrico que representa el valor de la variable j sobre el individuo i. donde i = 1, ..., n y j = 1, ..., p. La matriz de datos X tendr dimensiones n p y puede representarse de dos formas distintas. Por filas como: donde cada variable X i es un vector fila p 1 que representa los valores de las p variables sobre el individuo i.

15. Alternativamente podemos representar la matriz X por columnas: donde ahora cada variable X j es un vector columna n 1 que representa la variable j, medida en los n elementos de la poblacin.

16. ESTADSTICOS MULTIVARIADOS Vector de Medias muestral Es la medida de centralizacin ms utilizada para describir datos multivariantes, tiene dimensin p y recoge las medias de cada una de las p variables. Se calcula fcilmente mediante:

17. Ejemplo: Se obtuvo la siguiente informacin de un grupo de PEC que atienden a nios y nias de cero a dos aos, mediante una ficha de observacin de desempeo en el aula en la regin de Apurimac.

18. 19. Matriz de varianzas-covarianzas muestral , es una medida de dispersin La variabilidad de los datos y la informacin relativa a las relaciones lineales entre las variables se resumen en la matriz de varianzas y covarianzas. Esta matriz es cuadrada y simtrica de orden p, donde los trminos diagonales son las varianzas y los no diagonales, las covarianzas entre las variables. Llamando S a esta matriz, tendremos que, por definicin:

20. Se calcula : EJEMPLO: Tarea: Qu es una matriz definida positiva? 21. MEDIDAS GLOBALES DE VARIABILIDAD 1)Varianza Total, es una medida global de dispersin para un conjunto de variables medidas en escala mtrica. 2)Varianza media, es una medida de dispersin promedio de un conjunto de variables medidas en escala mtrica. Inconveniente: no considera la estructura de dependencia de las variables y las unidades de medida de las variables.

22. Ejemplos 23. 3) Varianza Generalizada Una medida global escalar de la variabilidad conjunta de k variables es la varianza generalizada, que es el determinante de la matriz de varianzas y covarianzas. Su raz cuadrada se denomina desviacin tpica generalizada, y tiene las propiedades siguientes: Est bien definida, ya que el determinante de la matriz de varianzas y covarianzas es siempre mayor o igual que 0. (ii) Es una medida del rea (para

p = 2), volumen (para p = 3) o hipervolumen (para k > 3) ocupado por el conjunto de datos.

24. Interpretacin geomtrica : Cuando p =2 25. La varianza generalizada en p Observacin: No es til para comparar conjuntos de datos con diferentes nmeros de variables. Debido a que la VG se incrementa o decrece montonamente al incrementar el nmero de variables.

26. 4) Varianza Efectiva, Pea y Rodrguez (2003) propusieron la siguiente medida global de variabilidad: No presenta los inconvenientes de la varianza generalizada.

27. EJEMPLO 28. Variabilidad y Distancias Dados dos vectores x k , x l p , la funcin d es una distancia o mtrica con las siguientes propiedades: i) d: p x p + ; es decir d( x k , x l ) 0 ii) d( x k , x k )= 0 iii) d( x k , x l ) = d( x l , x k ) iv) d( x k , x l ) = d( x k , x m ) + d( x m , x l ) ( desigualdad triangular) y x y x d ) , (

29. Una familia de medidas de distancias muy conocidas en p son las distancias de Minkowski: Cuando r =2 se tiene la distancia eucldea, que es la ms utilizada, pero depende de las unidades de medida. Ejemplo : Para los datos de las PEC

30. Para eliminar el efecto de las unidades de medida de las variables se utiliza la familia de mtricas eucldeas ponderadas:

31. M es una matriz diagonal, aunque no es necesario, pero debe ser no singular y definida positiva. 1) Distancia de Mahalanobis, se define como: Esta libre de unidades de medidas y mide la distancia de cada individuo con respecto a su vector de medias. EJEMPLO: Consideremos las primeras cuatro variables de las PEC

32. 33. d 1 = 1,3128 d 2 =1,7670 d 3 = 1,9849 d 4 =1,9535 d 5 =1,8501 d 6 =1,9939 Los resultados de las Distancias de mahalanobis son:

34. Medidas de Dependencia lineal Permite evaluar la estructura de dependencia entre las variables bajo estudio. Matriz de Correlacin; el grado de asociacin lineal entre dos variables se estudia mediante el coeficiente de correlacin simple. R es una matriz simtrica, cuadrada y definida positiva.

35. Ejemplo: 36. 2) Correlacin Mltiple, permite evaluar el grado de asociacin de una variable j con el resto de variables. Para calcular, seguir los siguientes pasos: Tomar el j-simo elemento de la diagonal de la matriz de varianza-covarianzas, al que se denotara por s jj. Tomar el j-simo elemento de la diagonal de la inversa de la matriz de varianza-covarianzas, al que se denotara por s jj . R 1 = 0.9584 R 2 =0.9379 R 3 = 0.9263 R 4 =0.9139

37. 3) Correlaciones Parciales; mide el grado de asociacin entre dos variables controlando el efecto de las otras variables. Trabajamos con la matriz inversa de la matriz de varianzas-covarianzas. EJEMPLO :

38. 4)Coeficiente de Dependencia efectiva; es una medida global de la dependencia de los datos: Si las variables estn todas incorrelacionadas, se tiene que R = 1 y si las variables estn correlacionadas R = 0 Ejemplo: Para las 4 variables medidas a las PEC, se tiene : CDE = 0.8009 Globalmente la dependencia lineal explica el 80.09% de la variabilidad de los puntajes de las variables consideradas.

39. 5) Matriz de precisin , es la inversa de la matriz de varianzas-covarianzas, y contiene la siguiente informacin: Los elementos fuera de la diagonal ( s ij ) son los elementos de esta matriz.; y es el cociente del coeficiente de regresin de la variable j para explicar i y la varianza residual de la regresin. En la diagonal se encuentran las inversas de las varianzas residuales de la regresin de cada variable conel resto de ellas. Si se estandarizan los elementos de esta matriz , los elementos fuera de la diagonal son las correlaciones parciales.

40. Ejemplo: 41. Bibliografa [ 1] ANDERSON T.W.: An Introduction to Multivariate Analysis. 2 nd Edition. John Wil ey & Sons. [2] BERNARD FLURY. 1997. A First Course in Multivariate Statistics. Editorial Springer Verlag. New York Inc. [3] CASTRO POSADA. 2000. Estadstica Multivariante. Anlisis de Correlaciones Amaru Ediciones Melendez 21. Salamanca. Espaa. [4] CARLES M. CUADRAS, 2007. Nuevos Mtodos de Anlisis Multivariante . CMC EDITIONS. Espaa [5] DANIEL PEA, 2002. Anlisis de Datos Multivariados. McGRAW-HILL/ Interamericana de Espaa. [6] URIEL, EZEQUIEL, ALDAS JOAQUIN. 2005 Anlisis Multivariante Aplicado. Editorial Thompson Editores. Espaa. 7] JOHNSON, R.; WICHERN, D. 1982. Applied Multivariate Statistical Analysis. Editorial Prentice Hall Inc.Englewo od Cliffs. New Jersey. [8] MARDIA, KENT AND BIBBY. 1982. Multivariate Analysis. Academic Press. London. Textos de Consulta: [1] DALLAS E. JOHNSON. 2000. Mtodos Multivariados Aplicados al Anlisis de Datos. International Thom son Editores. [2] HAIR J., ANDERSON R., TATHAM R., BLACK W. 2001. Anl isis Multivariante. Prentice Hall.

Você também pode gostar