Você está na página 1de 814
ANALISIS MULTIVARIANTE Quinta edicion Joseph F. HAIR, Jr. Louisiana State University Rolph E. ANDERSON Drexel University Ronald L. TATHAM Burke Marketing Research William C. BLACK Louisiana State University Traducci6n: Esme Prentice Diego Cano Universidad Autonoma de Madrid Revisi6n técnica y compilacién de las lecturas complementarias: Ménica Gémez Suarez Profesora titular de Comercializacién e Investigacién de Mercados Universidad Auténoma de Madrid | PRENTICE HALL Madrid + Upper Saddle River + Buenos Aires * Londres * México * Nueva Delhi + Rio de Janeiro Santafé de Bogoté « Singapur * Sydney * Tokio + Toronto ANALISIS MULTIVARIANTE, 5" ed, PRENTICE HALL IBERIA, Mad 199% 1. lac J.-F Hair, Jr, RE. Anderson. R.L ANALISIS MULTIVARIANTE, Tatham, W. C. Black ved. [No esti permitida a reproduceién foal o parcial de esta obra fi su tratamiento o transmision por cualquier medio o método sin auoriaaci6n escrita de la Editorial DERECHOS RESERVADOS (© 1999 respecte ala primera edicidn en espaol por: poverier BATT IBERIA, SRL ISBN: 84-8322-035.0 Depssito Legal: M_31.513+1999 Tindueido de: MULTIVARIATE DATA ANALYSIS, Fith eition Prentice Hall International, Ine © MCMXCVIII ISBN; 0-13-930587-4 Ecdicin en espanol Exitor: Andis Otero Asistente editorial: Ana kabel Garcia Disefio de eubierts: Domingo Rafo ‘Composicion: COPIBOOK. S. L Imprese poe IMPRESO EN ESPANA - PRINTED IN SPAIN Fe ih sd npr com papel yin Contenido Prélogo XVI Prélogo a la edicién en castellano XxI Nota introductoria XXL Profesores que han participado con lecturas complementarias XxV Capitulo 1. Introduccién H {Qué es el analisis multivariante? 2 El impacto de la revolucién informética 3 Definicién del andlisis multivarianse 4 Algnnos eonveptos 1 andtisis maltivari 4 Et valor tebrico 4 Escalas de medida 3 Error de medida y medidas mulivariantes 6 Significacion estadistica frente a potencia estadistica 8 Tipos de téenicas multivariantes n ‘Componentes principales y andlisis factorial comin n Regresin miltiple u Analisis diseriminante miltiple " Anilisis multivariante de la Varianza y covarianza 12 Analisis conjunto 2 Correlacién canénica 2 Anilisis cluster B Analisis multidimensional B “Analisis de correspondencias B Modelos de probabitidad lincal 4 Modelos de ecuaciones estructurales M4 (tras téenicas multvariantes emergentes 4 Una clasificacién de la técnicas multivariantes, 15 rientaciones para el analisis multivariantey su interpretacién 19 Establecer la significacion prictica asi como la estadistica 19 El tamaiio muestral afeeta a todos los resultados 20 Conocer los datos 20 Procurar la parsimonia del modelo 20 Atender a los errores Validar los resultados 21 Una aproximacién organizada al diseito de modelos multivariantes 24 Primer paso: Definr el problema de investigacién, objetivos y téenica multivariante conveniente 2 Segundo paso: Desarrollo del proyecto de anslisis, 2 Tercer paso: Evaluacién de los supuestos bésicos de la téenica multivariante B Cuarto paso: Estimaci6n del modelo multivariante y valoracién del ajuste del modelo 2B coer Quinto paso: Interpretar el valor tebrico .... Sexto puso: Validacién del modelo multivariante ‘Un diagrama de flujos de decisiones Bases de datos La principal base de datos ‘Otras bases de datos Organizacién de los capitulos restantes RESUME eee eeeseeeesseeessesecseteeeeeeeeees Cuestiones de revisién Bibliogratia Seccién 1. Prepara Capitulo 2. Anélisis previo de los datos Introduecién Examen grifico de los datos La naturaleza de la variable: Analisis de la forma de la distribucién Anilisis de relacion entre variables Analisis de las diferencias entre grupos Perfiles multivariantes Resumen Datos ausentes Un ejemplo sencillo del andlisis de datos ausentes Conocimiento de las razones causantes de datos ausentes amen de los tipos de datos ausentes iagnostico de Ia aleatoriedad en el proceso de pérdida de observaciones ‘proximaciones al tratamiento de datos ausentes Utitizar s6lo aquellas observaciones con datos completos ceo Supresi6n de caso(s) y/o vatiable(S) .....-...ceee0ceeceeeeeteeeeee Metodos de imputacién Procedimientos basados en el modelo Un ejemplo de diagnéstico de datos ausentes \Un repaso de! anlisis de valores ausentes Resumen ‘sos atipicos Deteceidn de casos atipicos Deseripein de casos atipicos y especificacion Mantenimiento o eliminacién de tos casos atipicos Un ejemplo del analisis de casos atipicos Verificacién de los supuestos del a Valoracién de las variables individuales frente al modelo univariante Nonmalidad cee Homocedasticidad cite coe Linealidad viiteteeenees Ausencia de errores correlacionados Transfornaciones de los datos Un ejemplo de contastacion de lox supestos bios de nisi multivariate Homocedasticidad isis multivariante a incorporacién de datos no métricos con variable fitcias Resumen Cuestiones de revisién CONTENIDO Capitulo 3. Analisis factorial {Qué es el analisis factorial? Pe Un ejemplo hipotético del analisis factorial El proceso de decisin del andlisis factorial Primer paso: Objetivos del andlisis factorial ‘Segundo paso: El disefio de un analisis factorial Tercer paso: Supuestos en el anilisis factorial Cuarto paso: La estimacién de los factores y la valoracién del ajuste general ‘Quinto paso: Interpretacién de los factores Sexto paso: Validacién del anilisis factorial ‘Séptimo paso: Usos adicionales de los resultados det andlisis factorial Un ejemplo ilustrativo ae Primer paso: Objetivos del anilisis factorial ‘Segundo paso: Diseiio del analisis factorial Tercer paso: Supuestos del andlisis factorial ‘Analisis de factores componentes: Del paso cuarto al séptimo ‘Analisis factorial comtin: Pasos cuarto y quinto Una consideracién gerencial de los resultados Resumen Cuestiones de revision Bibliografia . — = Lectura complementaria: La imagen de la empresa detalisa y su percepcién por los consumidores: Una apli ‘cacién del andlisis factorial, por Rodolfo Vazquez. Casiclles Seccién 2, Técnicas de dependenci Capitulo 4. Andlisis de regresién multi {Qué es el analisis de regresién miltiple? Un ejemplo de la regresion simple y multiple Fijando una linea de base: prediccin sin variable independiente Prediccién mediante una tinica variable independiente. Regresién simple Prediccién utilizando varias variables independientes: Analisis de regresion miiltiple Resumen 5 a Un proceso de decisin para el analisis de regresion miltiple Primer paso: Objetivos de la regresién maltiple Problemas de investigacién adecuados para la regresién maltiple Especificacion de la relacién estadistica Seleccién de variables dependientes e independientes Segundo paso: Disefio en la investigacién del analisis de la regresién maltiple Tamaiio muestral . A Predictores de efectos fijos frente a predictos de efectos aleatorios Creacién de variables adicionales ‘i Tercer paso: Supuestos en el anilisis de regresién multiple Valoracién de las variables individuales frente al valor teérico Linealidad del fenomeno : Varianza constante del término de error Independencia de los términos de error Normalidad de la distribucién del término de error Resumen Cuarto paso: Estimacién del modelo de tegresién y valoracién ‘Aproximaciones generales a la seleecién de variables Contrastacién del cumplimiento de los supuestos de regresion Examen de la significacién estadistica de nuestro modelo vit 7» 80 83 83 86 8s 80 4 102 108 107 108 108 108 109 us 121 121 122 122 124 lat 143 144 las Mas 146 1st 153 133 VII CONTENIDO Identificacién de observaciones influyentes Quinto paso: Interpretacién del valor teorico de la regresion Utilizacién de los coeficientes de regresién Estandarizacién de los coeficientes de regresién: Los coeficientes beta Evaluacion de la multicolinealidad ‘Sexto paso: Validacion de los resultados Muestras adicionales o muestras divididas, Clculo del estadistico PRESS ‘Comparacién de los modelos de regresion votes Prediccién con el modelo Ejemplo de un anélisis de regresion Primer paso: Objetivos de la regresion multiple Segundo paso: Disetio de Ia investigacién mediante el andliss de regresion miltiple Tercer paso: Supuestos del andlisis de regresién miltiple ‘Cuarto paso: Estimacién del modelo de regresién y valoracién global del ajuste Quinto paso: Interpretacién del resultado teérico Sesto paso: Validacién de los resultados Evaluacién de modelos de regresion alternativos Una visién gerencial de los resultados Resumen Cuestiones de revision 5... Bibliogratia Apéndice 4A. Validacién avanzada en el anal Evaluacién de la multicolinealidad ‘Un proceso en dos partes... cites Ejemplo de evaluacién de la multicotineatidad dentficacién de observaciones infl rentes Primer paso: Examen de 10s residU0s 0. .6 600s cveees Segundo paso: Wentifcacién de punto de apalancamiento mediante los predictores Tercer paso: Diagnéstico de un tinico caso de observaciones influyentes Cuarto paso: Seleccidn y tratamiento de observaciones influyentes Ejemplo de la ase de datos HATCO. Visién panorimica ... ee... ceo bttetttrsteeeennes Resumen cov eetteeeeeseeee Cuestiones de revision... 2... e os Bibliografia Lecturas complementarias: Relacién entre concentracién y precios en el comercio minorista, por M: Jesiis ‘Yagtie Guillén y ET conportamiem de biisqueda de precios de los consumidores: Un andilisis en el merca- cdo minorista de alimentacién, por Carmen Berné Manero, Marta Pedraja Iglesias y Pilar Rivera Torres is discri Capitulo 5. Ani Qué son el analisis discriminante y la regresisn logistica? . coe ‘Analogia con la regresién y MANOVA we cites Un ejemplo hipotético del andlisis diseriminante ..........0.. : : Andlsis dieriminunie de dos grupo: Commpradoes frente a 0 compradores, so. ss.csssecssucesee Una representacin geométrica de la funcién discriminante de dos grupos Un ejemplo de analisis discriminante de tres grupos: Propésitos de cambio El proceso de decisién en el anilisis discriminante Primer paso: Objetivos del andlisis diseriminame <0... o.oo ect eceteteeseeeees Segundo paso: Diseio de la investigaciin mediante anélisis diseriminante Selecion de as varibles dependent cindependienes cee cot etteeeee Tamafio mucstral : . Divisibn de la muestra jnante multiple y regresién logistica 7 179 180. 180 18 186 186 207 208, 209 209 210 2 212 213, 213, 224 25 225 225 226 249 250 252 252 253 256 257 260 261 261 262 262 263 CONTENIDO Tercer paso: Supuestos del anilisis diseriminante Cuarto paso: Estimacion de! modelo discriminante y valoracién del ajuste global Método de céleulo Significacién estadistica Valoracién del ajuste global Diagnosis mediante casos Resumen Quinto paso: Interpretacién de los resultados Ponderaciones discriminantes Cargas discriminantes ‘Valores parciales de la F InterpretaciOn de dos o mas funciones { Cual es el método de interpretacion a emplear? Sexto paso: Validacién de los resultados Divisién de la muestra o procedimientos de validacion cruzada Perfilar las diferencias entre los grupos Regresién logistica: Regresién con una variable dependiente binaria Representacién de la variable dependiente binaria Estimacién del modelo de regresidn logistica Interpretacion de los coeficientes Un ejemplo ilustrativo de dos grupos Primer paso: Objetivos del andlisis discriminante ‘Segundo paso: Disefio de la investigacion mediante el andlisis diseriminante Tercer paso: Supuestos del anilisis discriminante Cuarto paso: Estimacién de la funcién discriminante y valoracion del ajuste global Quinto paso: Interpretacion de los resultados Sexto paso: Validacién de los resultados Una visidn gerencial de conjunto Un ejemplo ilustrativo de tres grupos Primer paso: Objetives del andlisis discriminante Segundlo paso: Disefio de la investigacién del anélisis diseriminante Tercer paso: Supuestos del andlisis diseriminante Cuarto paso: Estimacién de la funcién discriminante y valoracién del ajuste global Quinto paso: Interpretacién de los resultados del anslisis diseriminante de tres grupos Sevto paso: Validaciin de los resultados discriminantes Una vision gerencial de conjunto Un ejemplo ilustrativo de regresion logistics Pasos primero, segundo y tercero: Diseio de objetivos, diseito de la investigacién y supuestos estadisticos, Cuarto paso: Estimacién del modelo de regresion logistica y valoracién del ajuste global ‘Quinto paso: Interpretacién de los resultados Sexto paso: Validacién de los resultados Una vision gerencial de conjunto Resumen CCuestiones de revisién Bibliografia Lecturas complementarias: Factores determinantes del nivel de equipamiento doméstico. Un contraste empi: rico, por Carlos Flavidn Blanco, Eva Martinez Salinas y Yolanda Polo Redondo y Las estrategias de cap- tacién y retencién de clientes y la lealtad. Un andlisis de segmentacién, por Sandra Cavero Brojula y Javier Ceboliada Calvo Capitulo 6. Analisis multivariante de la varianza, {Qué es el andlisis multivariante de la varianza? Procedimientos univariantes para valorar las diferencias de grupo Analisis multivariante de la varianza (MANOVA) Ix 264 264 265 266 267 274 275 275 276 276 276 276 278 278 279 279 280 280 281 281 284 284 285, 286 286 294 297 298, 298 298 299 299 299 31 315 315 316 316 316 322 322 322 322 323, 323, 325 345 346 346 349 X CONTENIDO Las diferencias entre MANOVA y el andlisisdiseriminante Una ilustracian hipotética del MANOVA Cuando se debe utilizar MANOVA? Control del porcentaje de errores experimentales : Diferencias entre una combinacién de variables dependientes| Un proceso de decision para el MANOVA Primer paso: Objetivos del MANOVA ‘Tipos de preguntas adecuadas en el andlisis moultivariante del MANOVA Segundo paso: Cuestiones bisicas del disefio de Ia investigacién mediante MANOVA Requisitos de tamaito muestral — en conjunto y por grupos ...... Diseios factoriales — dos o mas tratamientos Uso de covariaciones— ANCOVA y MANCOVA Tercer paso: Supuestos bisicos del ANOVA y del MANOVA Independencia {qualdad de las matrices de varianzas-covarianzas Normalidad Linealidad y multicolinealidad entre las variables dependientes Sensibilidad a los datos atipicos Cuarto paso: Estimacién del modelo MANOVA y valoracién del ajuste global Criterios para la contrastacién de la significacion Potencia estadistica de los contrastes multivariantes Quinto paso: Interpretacién de los resultados det MANOVA, Evaluacién de las covarianzas cevvseetseeens Evaluacién del valor tedrieo dependiente Identificacién de las diferencias entre los distintos grupos . Sexto paso: Validacién de los resultados Resumen Ejemplo 1: Diferencia entre dos grupos independientes Un enfoque univariante: El contraste Un enfoque multivariante: La T? de Hotelling Ejemplo 2: Diferencia entre k grupos independientes Un enfoque univariante: ANOVA con k grupos Un enfoque multivariante: MANOVA con k grupos : Ejemplo 3: Disefio factorial del MANOVA con dos variables independientes Primer paso: Objetivos del MANOVA Segundo paso: Diseno de investigacién del MANOVA Tercer paso: Supuestos basicos del MANOVA Cuarto paso: Estimacién del modelo MANOVA y valoracién del ajuste global . Quinto paso: Interpretacién de los resultados . Una consideracién general de los resultados ... Resumen Cuestiones de revision Bibliografia Lectura complementaria: Imagen y atraccidn de centros comerciales suburbanos, por Francisco José Mas Ruiz coe Capitulo 7, Andlisis conjunto {.Qué es el anlisis conjunto? Un ejemplo hipotetico de andlisis eonjumto.... Un ejemplo empirico : La utilizacion del andlisis conjunto en la préctica total ‘Comparacién del andlisis conjunto con otros métodos multivariantes 351 352 353 354 354 354 355 356 387 387 397 359 362 362 363 363 364 399 407 408 409 410 44 4s CONTENIDD XI Técnicas de composicién frente a las téenicas de descomposicién Especificacién del valor tebrico en el andlisis conjunto Modelos separados para cada individuo Tipos de relaciones Disefio de un experimento de andlisis conjunto Primer paso: Objetivos del anilisis conjunto Definicién del valor total del objeto Especificacion de los factores determinantes, Segundo paso: Diseio del anélisis conjunto Seleccién de una metodologia para el anélisis conjunto, Disefio de tos estimulos Especificacién de la forma bésica del modelo Recogida de datos Tercer paso: Supuestos bisicos del anilisis conjunto Cuarto paso: Estimacién del modelo conjunto y valoracién del ajuste global Seleccién de una técnica de etimacién . Evaluacién de ta bondad del ajuste det modelo. Quinto paso: Interpretacién de los resultados Analisis agregado frente a anilisis desagradado Evaluacién de la importancia relativa de los relativos Sexto paso: Validacidn de los resultados del andtisis conjunto Aplicacién de los resultados del anilisis conjunto Segmentacion . ‘Analisis de rentabilidad ‘Simuladores conjuntos Metodologias alternativas en cl andlisis conjunto . Analisis conjunto adaptativo: Anilisis adaptativo con un gran nimero de factores . Resumen de las tres medologias completas.. Una ilustracién del analisis conjunto Primer paso: Objetivos del anilisis conjunto Segundo paso: Disefio del anilisis conjunto Tercer paso: Supuestos basicos del anilisis conjunto Cuarto paso: Estimacién del modelo conjunto y valoracién del ajuste conjunto Quinto paso: Interpretacion de los resultados Sexto paso: Validacién de los resultados ‘Una aplicacién practica: Utilizacién de un simulador de eleccion Resumen : Cuestiones de revision... 2.00.2 sccceeveee Bibliogratfia Lectura complementaria: Las preferencias del consumidor: estudio de su composicisn a través del anélisis com. ‘conjunto, por Salvador Ruiz de Maya y José Luis Munuera Alemin 455, Capitulo 8. Andlisis de correlacién canénica 469 {Qué es la correlacién canénica? 470 Ejemplo hipotético de correlacién canénica . : 476 Elanilisis de las relaciones mediante correlacion candnica 471 Primer paso: Objetivos del anlisis de correlacién canénica : 4n ‘Segundo paso: Diseiio de un anélisis de correlacién canénica . 478 Tercer paso: Supuestos bisicos de la correlacién canénica Cuarto paso: Obtencién de las funciones candnicas y valoracién del ajuste global a a7 La derivacin de funciones canénicas .......... ans {Qué funciones canénicas se deben interpreta? an Days Quinto paso: Interpretacién del valor tebrico canénico 47% XII CONTENIDO Ponderaciones canénicas Cargas eanénicas Cargas eruzadas eanénicas oe El enfoque de interpretacion a emplear Sexto paso: Validacién y diagnosis Un ejemplo ilustativo a Primer paso: Objetivos del anilisis de cortelacién eanénica = Segundo y tercer pasos: Disefo de un anilisis de correlacién candnica y contrastacidn de los supuestos Cuarto paso: Obtencién de las funciones canénicas y valoracién del ajuste global Quinto paso” Intepretacién de los valores tebricos cannicos bod Sexto paso: Validacién y diagnosis. Una consideracion general para los resultados Resumen we Cuestiones de revision... Bibliografia . Seccién 3. Técnicas de interdependencia Capitulo 9. Analisis cluster . Qué es analisis cluster? {Cémo funciona el andlisis cluster? Medicién de ta simititud Formacién de conglomerados . Determinacién del ndmero de conglomerados en la solueién final Proceso de decisién con el andlisis cluster Primer paso: Objetivos del andlisis cluster Scleccién de variables del andlisis cluster oe Segundo paso: Discio de investigacién mediante analisis cluster Deteceidn de atipicos Medias de simiitud . Tipificacién de los datos Tercer paso: Supuestos del anilisis luster... Representatividad de Ia muestra, Impacto de la multicolinealidad . Cuarto paso: Obtencién de conglomerados y valoracién del ajuste conjunto Algoritmo para la obtencién de conglomerados {Cuintos grupos deben formarse? . {Debe volverse a especificar el andlisis cluster? ‘Quinto paso: Interpretacién de los conglomerados Sexto paso: Validacion y perfil de tos grupos Validacién de ta solueién cluster Pertiles de la solucién cluster Resumen del proceso de decisi6n Un ejemplo ilustrativo Primer paso: Objetivos del andlisis cluster. Segundo paso: Diseito de investigacién del analisis cluster Tercer paso: Supuestos del anilisis cluster coon Cuarto paso: Obtencién de grupos y valoracién del ajuste conjunto Quinto paso: Interpretacién de los conglomerados Sexto paso: Validacién y perfil de los grupos... Una vision practi : Resumen oe ce Cuestiones de revision coe foe 478 478 479 479 479 480 480 481 481 483 486 486, 487 487 487 489) 491 492 493 494 495 497 498 498 500 500 S01 502 506 507 508 508 508, 509 sis 516 516 SIT SIT 518, 518. 518, 318 519 519 519 525 528 531 331 532 Cai CONTENIDO Bibliografia - Lecturas complementarias: Aplicacién del andlisis cluster, por Azucena Penelas y El andlisis cluster en inves- tigacién de marketing: Merodologia y critica, pot Ménica Gomez Suarez Capitulo 10. Ani {Qué ¢s el anslisis multidimensional? Una vision simplificada del andlisis multidimensional Comparacién del anilisis multdimensional con otras técnicas de interdependencia EJ individuo como unidad de analisis, Ausencia de valor teérico Un marco de decisién para la Primer paso: Objetivos del analisis multidimer is multidimensional laboracién de mapas perceptuales onal Decisiones clave en la fijacién de objetivos Segundo paso: Diseio de investigacién mediante el anélisis multidimensional ‘Scleccién de un enfoque de descomposicidn (libre de atributos) o de composicién (basada en atributos) Objetos: Su mimero y seleccién Métodos métricos frente a métodos no métricos Recogida de datos sobre similitudes o preferencias Tercer paso: Supuestos del andlisis multidimensional Cuarto paso: Obtencién de soluciones de andlisis multidimensional y valoracién del ajuste conjunto Determinacién de la posicién de un objeto en un mapa perceptual Seleccionando la dimensionalidad del mapa perceptual Incorporacién de las preferencias en el andlisis multidimensional Quinto paso: Interpretacién de los resultados del analisis multidimensional Identificacién de las dimensiones Sexto paso: Validacién de los resultados del andlisis multidimensional ‘Analisis de correspondencias Un ejemplo sencillo de CA Primer paso: Objetivos de! anilisis de correspondencias ‘Segundo paso: Disefio de la investigacion mediante analisis de correspondencias Tercer paso: Supuestos del anilisis de correspondencia Cuarto paso: Obtencidn de resultados con analisis de correspondencias y valoracién del ajuste conjunto ‘Quinto paso: Interpretacién de los resultados Sexto paso: Validacién de los resultados Visién de conjunto del analisis de correspondencias Iustracién del andlisis multidimensional y det anailisis de correspondencias Primer paso: Objetivos del mapa perceptual Segundo paso: Diseno de la investigacién mediante el estudio del mapa perceptual Tercer paso: Supuestos bisicos en la elaboracién de un mapa perceptual Analisis multidimensional: Pasos cuarto y quinto Revisién de los resultados de descomposicion Analisis de eorrespondencias: Pasos cuarlo y quinto Sexto paso: Validacion de los resultados Un resumen para la direccién de los resultados del analisis multidimensional Resumen Cuestiones de revisién Bibliogratia Lectura complementaria: Aplicaciin del andlisis multidimensional y del andilisis factorial de corresponden cias, por Enrique Bigné Aleafiz y Natalia Vila Lopez Seccién 4. Técnicas avanzadas emergentes Capitulo 11. Modelos de ecuaciones estructurales {Qué es el modelo de ecuaciones estructurales? 533 347 sas. 549 551 351 552 552 352 352 555 555 357 558. 558, 561 561 361 563, 565 569 569 370 sn S71 575 516 576 576 377 377 377 S78. S78 578 578. 580 587 588, sol 592 593 593, 594 595 609 ou 612 XIV CONTENIDO Tratamiento de relaciones miltiples de dependencia cruzada Incorporacién de variables que no se miden directamente Un cjemplo sencillo de SEM La cuestion de investigacion Identificacién del modelo de ecuacién estructural para el analisis de secuencias Una aplicacién del andlisis de secuencias Resumen La funcién de la teoria en los modelos de ecuaciones estructurales. Desarrollo de una estrategia de modelizacion Estrategia de modelizacién confirmatoria Estrategia de modelos rivales ....... Estrategia de desarrollo del modelo... 0... ..e0cseee Pasos en la modelizacion de ecuaciones estructurales Primer paso: Desarrollo de un modelo basado en la teoria ‘Segundo paso: Construecién de un diagrama de secuencias de relaciones causales Tercer paso: Conversién de un diagrama de secuencias en un conjunto de ecuaciones gstructurales y espe- cifieacién del modelo de medida “a Cuarto paso: Seleccidn del tipo de matriz de entrada y estimacién del modelo propuesto ‘Quinto paso: Valoracién de ta identificacién del modelo estructural Sexto paso: Evaluacién de los eriterios de calidad de ajuste Séptimo paso: Interpretacion y modificacién del modelo Una recapitulacién del proceso de siete pasos os ilustraciones de modelizacién de ecuaciones estructurales Anilisis factorial confirmatorio Primer paso: Desarrollo de un modelo basado en la teoria . Segundo paso: Construccién de un diagrama de relaciones causales . 7 Tercer paso: Conversion de un diagrama de relaciones en un conjunto de modelos de ecuaciones estructu- rales yde medida ........... Cuarto paso: Eleccién del tipo de matriz de entrada y estimacién del modelo propuesto Quinto paso: Valoracion de la identificacién del modelo estructural Sexto paso: Evaluacin de criterios de calidad del ajuste ‘Séptimo paso: Interpretacion y modificacién del modelo Modelos de andlisis factorial de orden superior ........ 00+ Resumen . Estimacion de un modelo de relaciones con SEM Primer paso: Desarrollo de un modelo basado en la teoria ‘Segundo paso: Construecién de un diagrama de relaciones causales Tercer paso: Conversién del diagrama de relaciones en un conjunto de ecuaciones estructurales y especi- ficacién del modelo de medida ‘Cuarto paso: Eleccién del tipo de matriz de entrada y estimacién del modelo propuesto ‘Quinto paso: Evaluacién de la identificacién del modelo estructural Sexto paso: Evaluacion de los criterios de calidad del ajuste ‘Séptimo paso: Interpretacién y modificacién del modelo Repaso del proceso de siete pasos Resumen... Cuestiones de revisién Apéndice 11A. Una representacién matemtica en notacién LISREL Notacién LISREL, Desde un diagrama de relaciones a la notacién LISRE! Construccién de las ecuaciones estructurales desde el diagrama de relaciones Resumen 613. 613 64 ols 615 616 617 67 618, ols. 619 619 620 620 622 624 628 634 637 640 642 642 643 643. 643 644 645 645 646 651 652 653 653 654 655 655 656 657 657 666 669 669 669 on CONTENIDO Apéndice 11B. Medidas conjuntas de calidad del ajuste para modelos de ecuaciones estructurales oe tee 5 Medidas del ajuste absoluto . 5 Estadistico-ratio de verosimilitud chi-cuadrado Parimetros de no centralidad y no centralidad a escala indice de calidad del ajuste Residuo cuadritico medio Error de aproximacién cuadratico medio Indice de validacién cruzada esperada Indice de validacién eruzada Medidas del ajuste incremental indice de calidad del ajuste ajustada indice Tucker-Lewis indice del ajuste normal ....... Otras medidas de ajuste incremental ... Medidas de ajuste de parsimonia indice de ajuste normado de parsimonia indices de calidad de ajuste de parsimonia Chi-cuadrado normada Criterio de informacion de Akaike 7 Una revisidn de las medidas de calidad del ajuste estructural Resumen Bibliografia , god zi fees Lectura complementaria: La confianza del consumidor en el minorista: Desarrollo y contraste de un modelo ‘conceptual, pot Manuel Sanchez Pérez, M.* Angeles Iniesta y Elvira Séez Gonzalez Capitulo 12, Nuevas técnicas del andlisis multivariante introduccion Laavalancha de informacién Anilisis sin inferencia estadistica ‘Temas abarcados en este capitulo Almacenamiento y extraccién de datos 5 {fn qué consisten la extraecién y el almacenamiento de datos? ‘Conceptos fundamentales del almacenamiento de datos Supuestos fundamentales en la extraccién de datos Redes neuronales es neuronales Estimacion de un modelo de red neuronal Utilizacién de una red neuronal para la elasificacién Resumen Remuestreo Un breve repaso de la inferencia paramétrica Conceptos basicos de la reespecificacién Un ejemplo de reespecificacién y regresion multiple Resumen Resumen Cuestiones de revision Bibliografia Apéndice A. Aplicaciones del anélisis multivariante Glosario xv 679 680 680 681 681 681 682 682 682 682 683, 683 683 683, 683 684 684 684 685 685 685 687 691 707 708 708 709 709 710 m n2 na rR m2 4 m1 TB Ts no no 730 732 73 73 Ta 75 167 Prologo {Quién hubiera pensado que cuando se publicé la primera edicién del Analisis Multivariante hace asi 20 afios que el uso de las estadisticas multivariantes estaria tan omnipresente como ocurre hoy en dia? Durante este tiempo hemos observado un cambio drastico en el entorno de investigacion al que se enfrentan tanto los investigadores académicos como los empresariales. En primer lugar, a revolucién del computador personal ha proporcionado un poder y que era inimaginable hace tan solo unos pocos afios. En este tiempo hemos progresado desde las tarjetas perforadas al reconoci- miento de la voz. También hemos observado avances importantes, tanto en la disponibilidad de pro- gramas estadisticos como en su facilidad de uso, que abarca desde los paquetes informiticos completamente integrados tales como el SPSS y el SAS hasta los programas especializados para téenicas tales como redes neuronales y andlisis conjunto. Hoy en dia, el investigador puede encontrar casi cualquier técnica concebible en un formato de computador personal y a un precio razonable. Desde la perspectiva estadistica, hemos observado un desarrollo continuo de las nuevas técni~ cas, tales como el anilisis conjunto, los modelos de ecuaciones estructurales y las redes neurona~ les. Todos estos avances tecnoldgicos, sin embargo, se han visto igualados por una necesidad reciente de una capacidad més analitica, La explosién de datos de los tltimos afios no s6lo ha hi potecado nuestros recursos para manejar fisicamente y analizar toda la informacién disponible, sino que también ha obligado a una nueva valoracién de nuestra aproximacién al anélisis de datos. Fi- rnalmente, la compleja naturaleza de los temas abordados y el creciente papel de la teoria en el di- sefio de la investigacién se han unido para exigir técnicas mas rigurosas y sofisticadas que permitan evar a cabo los anilisis confirmatorios necesarios. Todos estos acontecimientos han contribuido a la aceptacion de las iltimas cuatro ediciones de este libro y han creado una demanda para esta quinta edicién. Con esta revisién hemos intentado abordar las exigencias de académicos ¢ investigadores aplicados, con una presentacién que se basa fundamentalmente en las técnicas estadisticas. Sin embargo, también se centra en el disefio, la es- timacién y la interpretacion. Nos esforzamos continuamente por reducir nuestra dependencia so- bre la notacién estadistica y la terminologia y en su lugar identificamos los conceptos fundamentales que tienen efecto sobre nuestro uso de estas técnicas y los expresamos en términos sencillos: una introduccién de orientacién basicamente prictica del andlisis multivariante para personas que no son expertas en estadistica, Continuamos con nuestro cometido de proporcionar una comprensién completa de los principios estadisticos y de gestién que subyacen en cl andlisis multivariante para desarrollar con comodidad no s6lo las cuestiones estadisticas sino también las pricticas, XVII PROLOGO: Lo que es nuevo El cambio mas obvio en ta quinta edicién es su reorganizacién en cuatro secciones. Esta organi- zacién sigue un esquema en paralelo mas estrecho con el proceso de investigacién, particularmente en el enfoque sobre la preparacién de datos y el desarrollo de escalas antes de emplear las técni- cas de dependencia o interdependencia. La Seccién 1, «Preparacién para un aniilisis multivarian- te» tiene como nucleo central la preparacién de datos, tales como el andilisis de datos ausentes y la valoraci6n de supuestos estadisticos junto a la reduccién de datos, con especial atencién al de- sarrollo de las escalas aditivas. La Seccién 2, «Técnicas de dependencian, se dedica a cinco tée- nicas de dependencia multivariante: la regresion maltiple, el andlisis discriminante, la regresion logistica, el andlisis multivariante de la varianza, el andlisis conjunto y la correlacién eanonica, La Seccién 3, «Técnicas de interdependencia», proporciona una cobertura del anilisis cluster y las es- calas multidimensicnales y sus aplicaciones en el uso de estructuras entre observaciones. La ailti- ma seccién, la Seccién 4, «Técnicas avanzadas y emergentes» introduce los modelos de ecuaciones estructurales junto con algunas éreas nuevas del andlisis multivariante, que incluyen la busqueda y almacenaje de datos, las redes neuronales y la re-utilizacion de muestras. Se han realizado dos incorporaciones a la explicacién de cada técnica multivariante. En primer ugar, se proporciona un ejemplo sencillo al comienzo de cada capitulo para ilustrar fos principios bbasicos y los objetives y cémo funcionaria un método en particular en una situacién real. En se~ gundo lugar, a continuacién de cada uno de los ejemplos que utilizan los datos HATCO, se offe- ‘ce una valoracién general que proporciona una perspectiva sobre la interpretacién de los resultados y c6mo podrian emplearse para abordar la cuestién objeto de la investigacién, Ambas incorpora- ‘ciones proporcionan un contexto mis ilustrativo para cada técnica. Lo que ha sido desarrollado y actualizado Cada capitulo ha sido revisado para incorporar los avances en la tecnologia y varios capitulos han experimentado un cambio mas extenso. Con la inclusion del Capitulo 3, «Analisis factorial» en la Seccién 1, se ha hecho especial hincapié en el desarrollo de escalas aditivas y la utilizacion de las escalas o las puntuaciones factoriales en otras aplicaciones. El Capitulo 5, «Analisis discriminan- te miltiple y regresién logistica» proporciona ahora una cobertura completa del anilisis de varia bles dependientes categoricas con la inclusién tanto del analisis discriminante como de la regresién logistica, y contiene un tratamiento desarrollado de otros modelos categoricos. El Capitulo 7, en la parte «Analisis conjunto» contiene una revisién de las cuestiones de diseio de investigacion, que se centra en el desarrollo de los estimulos de una manera concisa y clara. Finalmente, el Capitulo 11, «Modelos de ecuaciones estructurales», ha sido actualizado para reflejar los miiltiples cambios que ha suftido este area durante los tiltimos afios. Tres temas abordados son modelos factoriales de segundo orden; técnicas de estimaciones alternativas, tales como la simulacién y «bootstrap- ping»; y algunos de los problemas operativos ms comunes, tales como los datos ausentes 0 la ob- ‘encién de una matriz definitiva no positiva durante una estimacién de modelo. Cada uno de estos ‘cambios, junto con otros que no han sido mencionados, ayudan a la adquisicién de un conocimiento profundo de las cuestiones estadisticas y aplicadas que subyacen estas técnicas, Con vistas al futuro Hemos realizado otras dos incorporaciones que consideramos innovadoras y que aumentarén sus- tancialmente la comprensién del lector acerca del analisis multivariante. La primera es un capitu- lo nuevo —«Téenicas emergentes en el anilisis multivariante». Conforme evoluciona el entorno . investigador, los investigadores tienen que adaptarse a los cambios. El investigador de hoy dia se PROLOGO XIX ‘enfrenta a cantidades de informacién crecientes y 1a necesidad de un método de descubrimiento objetivo ademas de explicativo. Introducimos las temas del almacenaje y basqueda de datos para exponer al investigador sus objetivos bisicos y los principios implicados. Con la utilizacién de las perspectivas obtenidas en el debate de otras téenicas contrastamos la naturaleza exploratoria de la busqueda de datos, También abordamos el concepto de redes neuronales, una de las técnicas es- trechamente asociada con la busqueda de datos y utilizada en muchas aplicaciones hoy en dia, Otro toma es la reutilizacién de muestras, también conocido como «bootstrapping» y el efecto wiackk- nifey. Esta aproximacién ha estado disponible muchos afios; pero no ha sido utilizada de forma ge- neral, y estd obteniendo una aceptacién muy amplia como alternativa a la estimacién paramétrica. Los debates oftecidos proporcionan una breve panormica de los temas, asi como ejemplos em- piricos simples. Asi demostramos la capacidad de las redes neuronales para llevar a cabo el ané- lisis discriminante y los resultados de la utilizacién sobre muestras cuando se aplican a la regresion miltiple. El iltimo avance es la creacién de una pagina Web http://www.prenhall.com/hair, dedicada al andlisis multivariante y que la hemos llamado «Great Ideas in Teaching Multivariate Statistics» Esta pagina Web acta como un eentro de recursos para todos los que se interesen por ef anlisis ‘multivariante, proporcionando conexiones para cada técnica y un foro para la identificacién de nue ‘vos temas o métodos estadisticos. De esta forma podemos offecer tna contestacién mas persona lizada a los investigadores en tiempo real, en vez de mediante una nueva edicion del libro. También ‘esperamos que esta Web sea un centro de entrada y salida de materiales sobre la ensefianza de es- tadistica multivariante, proporcionando ejercicios, series de datos e ideas sobre proyectos. ‘Numerosas personas nos han ayudado en la realizacion de la quinta edicin de este texto. Barba- a Ross, doctora por la Universidad de Louisiana (Louisiana State University), nos ha provisto de imponderable ayuda en todas las fases de la revision. Stern Neill, también doctor por la Universi- dad de Louisiana, proporcioné asistencia en el analisis de los datos y la adicién de las nuevas tée~ nicas estadisticas. Estamos en deuda con los siguientes supervisores por su inestimable ayuda en las adiciones a la quinta edicién: David Booth, Kent State Univers! Robert Bush, Memphis State University Rabikar Chatterjee, Univerisity of Michigan Kerri Curtis, Golden Gate University Muczaffar Shaikh, Florida Institute of Technology ‘También queremos expresar nuestro agradecimiento a personas que colaboraron en anteriores ediciones. Fundamentalmente, Bruce Alford, University of Evansville; David Andrus, Kansas State University; Alvin C. Burns, Louisiana State University; Alan J. Bush, University of Mem- phis: Robert Bush, University of Memphis; Chaim Ehrman, University of ilinois at Chicago; Joel Evans, Hofstra University: Thomas L. Gillpatrick, Portland State University; Dipak Jain, North- western University; John Lastovicka, University of Kansas; Margaret Liebman, La Salle Univer- sity; Richard Netemeyer, Louisiana State University; Scott Roack, Northeeast Louisiana University Walter A. Smith, Tulsa University; Ronald D. Taylor, Mississippi State University; y Jerry L. Wail, Northeast Louisiana University. 2pPe aetna Bare Prologo a la edicion en castellano La primera edicién de este libro realizado por los autores Hair, Anderson y Tatham apareci6 en 1984. Deede entonces, hasta la 52 edicion cuyo texto prologamos, se han producido profundas transfor~ maviones en Ia teoria y practica de la investigacién de mercados que han sido recogidas fielmer te por los autores. ‘La investigacién de mercados inicia su expansién en Ia década de los afios setenta con Ia in~ corporacion de un conjunto de téenicas de anzlisis de datos procedente de la estadistica, Hasta en- tonces, en Espaita las fuentes doctrinales se basaban en la obra pionera de Tagliacame (Ariel, 1962), ceatructurada en tomo a la realizacion de encuestas y el muestreo. Posteriormente, en la década de Tos setenta se introduce en el mundo académico y empresarial un conjunto de técnicas estadisticas de anilisis de datos en tomo a los Cursos de Investigacion Comercial de AEDEMO y de los Cua demos Universitarios de Planificacion Empresarial y Marketing (CUPEMA) que dirigié el Prof Antonio Pulido. Las décadas de los ochenta y noventa, con la difusién de los computadores personales y de pro- gramas informéticos més amigables para los usuarios, muestran la ecosin de la aplicacién de las (eenieas multivariantes a la investigacién de mercados en las universidades y en las empresas, de las que los trabajos espaftoles que acompaiian al texto original son un buen exponente Esta difusion y una mayor facilidad de utilizacion, que ofrece grandes ventajas, no estin exer tas de inconvenientes, Asi, se puede mencionar la utilizacién excesiva de un conjunto de técnicas inadecuadas para el problema comercial objeto de estudio. La aplicacién indiscriminada de las téc- hieas estadisticas a cualquier base de datos y la explicacién posterior de los resultados obtenidos ‘onstruyendo supuestas “teorkas” explicativas ad-hoc, son uno de los prineipales errores, Todo in- Vestigador, empresarial o universitaio, debe partir de una adecuada formulacién del problema ob- jeto de estudio, debe formular una teoria explicativa o, al menos, un conjunto de hipotesis y. Finalmente, debe contrastar estas hipétesis con Ia evidencia empirica. La espectacularidad de las técnicas empleadas no puede nunca obviar la logica de la investigacién cientifica En Ia actividad universitaria constituye un punto de especial interés la delimitacién de los cam- pos de estudio de las diferentes disciplinas. En este sentido, es importante delimitar en Ia Invest fzacign de Mercados el papel a desompeitar por la estadistica como proveedora de las téenicas de nilisis de la informacion comercial. En esta debatida cuestién, corresponde a la Investigacién de Mercados la definicion del problema objeto de estudio, la formulaciin de la hipotesis explicativas, la obtencién de la evidencia empirica y la interpretacién de los resultados, mientras que la Es XXII PROLOGO A LA EDICION EN CASTELLANO. distica debera suministrar el acerbo de conocimientos tedricos, procedimientos y algoritmos, que hagan posible las investigaciones planteadas. El libro que hoy prologamos responde al enfoque antes expuesto. Fl tratamiento de las técni- ccas se hace desde una perspectiva del usuario, es decir, se explica cada método de acuerdo con los objetivos que podrian tenerse en cuenta al desarrollar una investigacién, intentando no abrumar al lector con complejas notaciones estadisticas. Con este enfoque, los autores hacen énfasis en el di sarrollo conceptual de la técnica y en la interpretacién de los resultados, mas que en el aparato ¢: tadistico que justifica cada método. No obstante, esto no quiere decir que las explicaciones y aplicaciones no sean rigurosas desde el punto de vista tedrico, ya que siempre se trata de poner de manifiesto la importancia de determinados aspectos relevantes como el andlisis previo de los da- tos, el tamaiio muestral minimo requerido para la aplicacién de una técnica concreta, el cumpli- miento de unos supuestos estadisticos basicos, la necesidad de que no sélo se analice el nivel de significacién sino también la potencia estadistica, el andlisis de fiabilidad y validez de los resul- tados, ete. La estructura del libro responde a un orden légico que se basa en el disefio de modelos multi- variantes para desarrollar las diferentes etapas a seguir en la aplicacién de cada técnica. Asi pues, cada capitulo dedicado a una técnica determinada sigue dichas etapas, de tal forma que el lector aprende el uso de los distintos métodos partiendo siempre de los objetivos de la investigacién y fi- nalizando con la significacién practica de los resultados. De esta forma se pone de manifiesto la importancia que tiene el disefio de la investigacién como punto inicial de cualquier anilisis esta distico, Por ello resulta una guia muy adecuada para los investigadores noveles que siempre ti nen la tentacién de justificar el uso de cualquier técnica, sin detenerse previamente a pensar si estén utilizando las variables adecuadas o si se incumplen determinados supuestos que podrian com- prometer gravemente los resultados de la investigacién. La labor de revision de la traduccién es una tarea que ha sido cuidadosamente realizada por Mé- nica Gémez Susrez, Profesora Titular de Comercializacién e Investigacién de Mercados en la Un versidad Auténoma de Madrid, con una amplia experiencia en la docencia y la investigacién. La edicién anterior de este libro venia acompaiiada de un conjunto de lecturas referentes al mercado norteamerieano, que han sido eliminadas en esta quinta edicién en inglés. Como quiera que estas Jecturas eran un buen complemento a los fundamentos tedricos del libro, se ha decidido, con gran to por parte de la editorial, la inclusién de ejemplos de publicaciones realizadas en Espatia. La profesora Gémez Suarez ha seleccionado un conjunto de articulos representatives de cada una de las técnicas de investigaciin de mercados, que son buenos ejemplos de las investigaciones alizadas por los profesores de las universidades espafiolas y que muestran el alto nivel alcanzado por los investigadores espafoles. Este esfuerzo constituye un importante valor aitadido a la obra original. Por todo ello pensamos que este libro va.a constituir una referencia obligada entre los cada vez mas numerosos y competentes estudiosos de la investigacién de mercados En Madrid, a 30 de junio de 1999 Ignacio Cruz Roche Catedritico de Comercializacién e Investigacién de Mercados Universidad Auténoma de Madrid Nota introductoria Durante la década de los ochenta se fueron desarrollando los programas estadisticos que fa ron el anilisis de gran cantidad de datos cuyo origen estaba en encuestas 0 en bases de datos que provenian de fuentes secundarias de informacin. Los fundamentos tedricos 0 estadisticos de las Kéenicas multivariantes que permitian el andlisis de estos datos habian sido desarrollados con an- terioridad, pero sblo cuando los ordenadores tuvieron la capacidad de célculo y memoria necesa- rios para Hevar a cabo el anilisis multivariante, se empez6 a generalizar el uso de estas téenicas. La primera edicién de este libro data de 1984, un afio que nos parece ya bastante lejano si tene- ‘mos en cuenta la revolucion que se ha experimentado en las técnicas de andlisis de la informaci6n. en las ediciones posteriores, los autores han ido cambiando la estructura del libro, incluyendo nug- vvas técnicas y adaptando sus explicaciones a la practica investigadora y empresarial. Preparar y adaptar la quinta edicin de “Analisis Multivariante” al mercado espaiiol ha supuesto tuna labor importante, puesto que no s6lo se ha realizado la revisién técnica de la obra, sino tam- bién la seleccién de lecturas que complementan la comprension de las técnicas mediante su apli- cacién a investigaciones realizadas en nuestro pats. Hemos incluido articulos relacionados con el marketing publicados en revistas espafiolas y aplicaciones realizadas especificamente para este li bro, de forma que participaran autores de diferentes universidades y que se tuviera en cuenta dis- tintos ambitos de aplicacién de cada una de las técnicas. Por ello, en esta nota introductoria debemos destacar nuestro mas sincero agradecimiento a estos autores que, no solo han colabora~ ido con sus investigaciones, sino que también han ayudado en la revision de los capitulos corres pondientes, En el tercer capitulo, Andlisis Factorial, hemos insertado la Jectura de un articulo elaborado por el profesor Rodolfo Vazquez Casielles de la Universidad de Oviedo, que ilustra como se utiliza esta técnica cuando el objetivo es anafizar la imagen proyectada por una serie de establecimientos mi- noristas y la percepcién del servicio ofertado que tienen los consumidores. El cuarto capitulo, Regresion Maltiple, se complementa con dos lecturas. La primera ha sido desartollada por la Profesora M," Jesiis Yagite de la Universidad Autonoma de Madrid. En este caso, se utilizan datos que provienen de fuentes secundarias para mostrar la relacién existente entre con- centracién y precios en el comereio minorista. Asimismo, para ilustrar las téenicas avanzadas de regresién hemos incluido el articulo de tres profesoras de la Universidad de Zaragoza, Carmen Ber- né, Marta Pedraja y Pilar Rivera. A diferencia del articulo anterior, se trata de ver el andlisis de pre- ios en el mercado minorista de alimentacién desde la perspectiva del consumidor mediante regresién por los métodos de estimacién ULS y GLS. En el capitulo cinco, dedicado al Analisis Discriminante Maltiple y la Regresién Logistica, he- ‘mos seleccionado dos articulos. El primero ha sido elaborado por los profesores Carlos Flavidn, Eva Martinez y Yolanda Polo, de la Universidad de Zaragoza, que aplican un anilisis discriminante Vv NOTA INTRODUCTORIA y un andlisis logit para determinar qué factores son los més influyentes en el nivel de equipamiento doméstico a partir de una encuesta realizada a familias residentes en el ambito metropélitano de Zaragoza. Con el objetivo de mostrar mas especificamente cémo se utiliza el andlisis logit multi- nomial, se incluye también el articulo de Sandra Cavero y Javier Cebollada, de la Universidad Pi- blica de Navarra, cuya investigacién tiene como objetivo analizar las estrategias de captacién y retencién de clientes por parte de las empresas. Los datos que sirven para realizar este anilisis pro- vvienen de un panel de hogares. Fl articulo que ilustra el capitulo seis, Andlisis Multivariante de la Varianza, ha sido elabora- do por Francisco Mas, de la Universidad de Alicante. El objetivo fundamental de su trabajo con- siste en examinar las percepciones de los consumidores sobre los centros comerciales, asi como la relacién existente entre dichas percepciones y la atracciin de los mismos. La informacién se ob- tiene mediante una encuesta y el anilisis multivariante de la varianza se utiliza para probar si los niveles promedios de cada una de las dimensiones de imagen difieren entre los centros comercia- les, La lectura seleccionada para el capitulo siete, Andlisis Conjunto, se basa en la investigacién realizada por Salvador Ruiz de Maya y José Luis Munuera sobre las preferencias de consumidor. En el articulo se establecen previamente las etapas que se deben seguir al aplicar esta técnica y lue- go se muestra su utilizacién en un producto conereto, las marcas de colonia, "ara los capitulos neve y diez hemos contado con la colaboracién de tres profesores que han elaborado las aplicaciones de las técnicas especificamente para ser expuestas en este libro. Por ello, queremos agradecer el esfuerzo adicional que han tenido que desarrollar adaptando sus investiga- ciones a la exposicién de dichas aplicaciones. Fn el capitulo dedicado a Analisis Cluster, Azuce- na Penelas, de la Universidad de Alcala, ilustra la utilizacién de esta técnica para definir como las, entidades bancarias espafiolas desarrollan sus estrategias de seamentacién de mercados. En el ca- pitulo diez, dedicado a Analisis Multidimensional y Factorial de Correspondencias, Enrique Big- né (Universidad Jaume I, Castell6n) y Natalia Vila (Universidad de Valencia) muestran con fines exclusivamente pedagégicos para qué sirven del andlisis multidimensional, el andlisis factorial de correspondencias, el andlisis de preferencias y el andlisis de propiedades, para medir el posicio- namiento a través de mapas perceptuales de cada uno de los cinco puntos de venta que compiten en dos localidades. En ambos capitulos, los datos se obtienen a partir de encuestas (Ia primera apli- cacién a directivos bancarios y la segunda, a amas de casa). También se incluye en el capitulo nu ve, dedicado a andlisis cluster, una revision critica y metodoligica de la aplicacién del analisis cluster en los afios 90 en la disciplina de Marketing, mostrindose cémo se ha utilizado esta técni- ca y sus principales aplicaciones, Por iltimo, en el capitulo once, dedicado a modelos de ecuaciones estructurales, se complementa con el articulo de los profesores Manuel Sanchez, M.* Angeles Iniesta y Elvira Saez, de la Uni- versidad de Almeria, que plantean un modelo conceptual de la confianza en el contexto de las re- laciones minorista-consumidor, a partir de un andlisis factorial confirmatorio de orden superior. En los capitulos ocho (Correlacién Canéniea) y doce (Técnicas emergentes) no hemos inclui- do ninguna lectura complementaria, puesto que la primera de las técnicas se ha utilizado muy poco en marketing tanto internacionalmente como en Espaia y las tiltimas no cuentan todavia con de- sarrollos académicos que permitan ilustrar su aplicacién. Respecto a este Ultimo capitulo, debemos destacar la colaboracion de Jean Pierre Levy, de la Universidad de Quebec, que nos ha ayudado a hacer la revisién de este capitulo y nos ha proporcionado certeros consejos en cuanto a ia traduc- cidn de algunos términos, Antes de terminar, quiero agradecer el apoyo recibido de todos los profesores del Departamento de Financiacidn e Investigacién Comercial de la Universidad Autnoma de Madrid y expresar mi satisfaccién por haber podido contribuir a la difusién en lengua espafiola de este libro. En Madrid, a 30 de junio de 1999 Monica Gomez Suarez Profesora titular de Comercializacidn e Investigacion de Mercatlos Universidad Autonoma de Madrid Profesores que han participado con lecturas complementarias Rodolfo Vazquez Casiclles M_*Jestis Yagite Guillén Carmen Berné Manero Marta Pedraja Iglesias Pilar Rivei Carlos Flavidn Blanco Eva Martinez Salinas Yolanda Polo Redondo Sandra Cavero Brijula Javier Cebollada Calvo Francisco José Mas Ruiz Salvador Ruiz. de Maya José Luis Munuera Aleman Azucena Penelas Monica Gomez. Suérez Enrique Bigné Alcaz Natalia Vila Lépez Manuel Sanchez. Pérez M." Angeles Iniesta Elvira Saez Gonzélez Universidad de Oviedo Universidad Autonoma de Madrid Universidad de Zaragoza Universidad de Zaragoza Universidad de Zaragoza Universidad de Zaragoza Universidad de Zaragoza Universidad de Zaragoza Universidad Publica de Navarra Universidad Publica de Navarra Universidad de Alicante Universidad de Murcia Universidad de Murcia Universidad de Alcald de Henares Universidad Autonoma de Madrid Universitat Jaume I de Castellén Universitat de Valencia Universidad de Almeria Universidad de Almeria Universidad de Almeria APITULO Introduccion OBJETIVOS DE APRENDIZAJE = Explicar qué es el andlisis multivariante y cuando es apropiada su aplicacion. Definir y comentar las técnicas concretas incluidas en el andlisis muttivariante. Determinar qué técnica multivariante es la indicada para un problema de investigacién especifico. Explicar la naturaleza de las escalas de medida y su relacion con las técnicas multivariantes. Describir los aspectos conceptuales y estadisticos propios del analisis multivariante. E capituto 1 constituye una revision simplificada de las teenicas del andlisis multivariante. ‘esata la influencia creciente de los métodos del andlisis multivariante, no s6lo en los aspectos analiticos de la investigacién, sino también en el disefio y forma en que se recogen datos para la adopcién de decisiones y la resolucién de problemas. Aunque las téenicas multivariantes eomparten bastantes caracteristicas con sus andlogas uni y bivariantes, son evidentes las diferencias que exis ten al pasar al Ambito del andlisis multivariante. Para ilustrar éstas, este capitulo presenta una cla sificacion de las técnicas multivariantes. Después, proporciona unas indicaciones generales para la aplicacion de estas técnicas junto con una aproximacién estructurada a su formulacién, esti- ‘macién y a la interpretacién de resultados multivariantes. El capitulo concluye con un comenta- tio sobre la base de datos utilizada en la mayor parte de! libro para ilustrar las aplicaciones de las técnicas. 2 ANALISIS MULTIVARIANTE es el andlisis multivariante? La tecnologia informatica disponible hoy en dia, casi inimaginable hace sélo dos décadas, ha hecho posible avances extraordinarios en el anilisis de datos psicologicos, sociolégicos y de otro tipo de datos referidos al comportamiento humano. Este impacto es més evidente en la relativa facilidad con la que los ordenadores pueden analizar enormes cantidades de datos complejos. Casi cualquier problema se puede analizar facilmente hoy en dia por un nimero ilimitado de programas estadisticos, incluso en ordenadores personales. Ademds, los efectos del progreso tecnolégico han extendido ain mis !s scpacidad de manipular datos, liberando a los investigadores de las restricciones del pasado y permitiéndoles asi abordar investigaciones mas sustantivas y ensayar sus modelos tedricos. Las limitaciones metodologicas no son ya un asunto critico para el tedrico empeftado en la biisqueda de evidencia empirica. Gran parte de esta creciente comprensién y pericia en el analisis de datos ha venido a través del estudio de la estadistica y de la inferencia estadistica. Igualmente importante, sin embargo, ha sido el ditatado conocimiento y aplicacién de un grupo de técnicas estadisticas conocidas como andilisis multivariante. Las téenicas del andlisis multivariante estin siendo ampliamente aplicadas a la industria, administracién y centros de investigacién de Ambito universitario. Por otra parte, pocos campos de investigacién o estudio han fracasado en integrar las técnicas multivariantes en su «caja de herra ‘mientas» analitica. Para atender este creciente interés, se han publicado numerosos libros y arti culos sobre los aspectos teéricos y matematicos de estas herramientas, y han aparecido textos introductorios en casi todos los campos. Sin embargo, se han escrito pocos libros para el investi gador que no es un especialista en matematicas o estadistica. Y menos aim que traten las aplica- ciones de la estadistica multivariante asi como que suministren un tratamiento conceptual de los ‘métodos estadisticos. Este libro se ha escrito para cubrir este vacio. Los libros orientados a las aplicaciones son de un interés crucial para los estudiosos del comportamiento, los directivos de empresa o los funcionarios de la administracién publica, sea cual sea su entorno, que tienen que desarrollar sus conocimientos del andlisis multivariante para conseguir una mejor comprension de los complejos fenémenos de sus Ambitos de trabajo. Cualquier investigador que examina sélo relaciones de dos variables y que evita el andlisis multivariate esta ignorando poderosas herramientas que podrian suministrar informacion potencialmente itil. Como afirma un investigador, «para los propésitos de... cualquier... discipli- na aplicada, la mayor parte de nuestras herramientas son, 0 deberian ser, multivariantes. Uno Hega a una conclusién que a menos.... que el problema sea tratado como un problema multivarian- te, estd tratado superficialmenten. Segtin los estadisticos Hardyck y Petrinovich: El analisis de tos métodos multivariantes predominara en el futuro y dara por resultado cambios. drasticos en el modo en que los investigadores piensan sobre los problemas y en cémo disefian sus investigaciones. Fsos métodos hacen posible plantear preguntas especificas y precisas de considerable complejidad en marcos idéneos, lo que posibilita llevar a cabo investigaciones tedricamente significativas y evaluar los efectos de las variaciones paramétricas ocurridas de forma natural en el contexto en que normalmente ocurten. De esta forma, se pueden preservar las correlaciones naturales entre las maltiples influencias sobre el comportamiento ¥ se pueden estudiar estadisticamente los efectos aislados de esas influencias sin provocar el tipico aislamiento de esos individuos o variables. Por ejemplo, en la mayor parte de los mereados actuales, los directivos no pueden fiarse de las antiguas aproximaciones donde se consideraban consumidores homogéneos y caracterizados por un reducido mimero de variables demograficas. En su lugar, deben desarrollar estrategias para atraer ‘a mumerosos segmentos de clientes con diversas caracteristicas demograficas y psicograficas en un ‘mercado con miiltiptes restrieciones (legales, econdmicas, competitivas, tecnolégicas, etc.). Solo a través de las técnicas de andlisis multivariante se pueden examinar adecuadamente las relaciones miiltiples de este tipo para llegar a una comprensién de la toma de decisiones mas completa y realista INTRODUCCION 3 En todo el texto usamos el término «investigador» cuando nos referimos a un analista, tanto ‘en Ia comunidad empresarial como académica. No consideramos oportuno hacer una distinei6n entre estas dos reas, puesto que la investigacién en cualquiera de las dos tiene que depender de bases todricas y cuantitativas. Aunque los objetivos de la investigacion y el énfasis en la interpretacion pueden Variar, un investigador tiene que abordar todos los asuntos, tanto conceptuales como ‘empiricos, que surgen en los debates de los métodos estadisticos. Pec eco eal AMA fea tcnsacaan Es poco menos que imposible discutir la aplicacién de las téenicas multivariantes sin una mencion al impacto de la informatica, Como se ha expuesto antes, el amplio desarrollo de la aplicacién de os computadores (primero el computador y mis recientemente los computadores personales 0 10s microcomputadores) para procesar grandes y complejas bases de datos, ha estimulado de manera impresionante el uso de los métodos de estadistica multivariante. Toda la estadistica tebrica de las técnicas multivariantes actuales fue desarrotlada mucho antes de la aparicién de los computadores, pero sélo cuando estuvo disponible el poder de la informatica para realizar célculos cada vez mis complejos legs a conocerse Ia existencia de esas técnicas fuera del circulo de los estadisticos tedricos, Los continuos avances tecnolégicos en informatica, particularmente en los computadores personales, han puesto a disposicion de cualquier investigador interesado cl acceso a todos los Tecursos necesarios para resolver un problema multivariante de casi cualquier dimensién. De hhecho, muchos investigadores se llaman a si mismos analistas de datos en lugar de estadisticos 0 (en lenguaje llano) «aficionados a lo cuantitativo». Estos analistas de datos han contribuido sustancialmente al aumento del uso y aceptacidn de la estadistica multivariante en los negocios y cen la administracién. En la comunidad académica, disciplinas de todos los campos del saber han ‘adoptado las técnicas multivariantes, y los académicos deben estar cada vez mis versados en las técnicas multivariantes apropiadas para sus investigaciones empiricas. Incluso para personas con sélida preparacién cuantitativa, la disponibilidad de programas preparados para el andlisis ‘uitivariante ha facilitado la compleja manipulacién de matrices de datos que durante mucho tiempo ha retrasado el crecimiento de técnicas multivariantes. Muchas de las principales universidades americanas estan pidiendo ya a los estudiantes como requisito de entrada comprar sus propios computadores incluso antes de su matriculacién. Los es~ tudiantes y profesores analizan rutinariamente datos multivariantes para responder a cuestiones sur~ idas en disciplinas de la antropologia y la zoologia. Todos los programas completos de estadistica disefiados para computadores (por ejemplo, SPSS, SAS y BMDP) ahora se encuentran también para computadores personales. Los programas especializados para todo tipo de anilisis multivariante, incluyendo los de escala multidimensional, modelos de ecuaciones simulténeas/estructurales y ané- lisis conjunto, en su dia se ofrecieron solo para computadores siendo hoy en dia compatibles con Jos computadores personales. Se estin desarrollando sistemas expertos dirigidos incluso a temas tales como la seleccién de una técnica estadistica [4] o diseftar un plan de muestreo que asegure los objetivos practicos y estadisticos deseados (3}. ‘Los programas estadisticos ya no se desarrollan primero en sistemas de computadores centrales para después trasladarios a computadores personales 0 microcomputadores, sino que se desarroltan directamente para computadores personales. Quizé la categoria de programas de estadistica de mayor desarrollo sean los paquetes estadisticos disefados especificamente para aprovecharse de la flexibilidad del computador personal. Las técnicas multivariantes estan tan extendidas que todas las técnicas ilustradas en este texto pueden ser estimadas con paquetes estadisticos fécilmente accesibles tanto para un computador, un microcomputador 0 un computador personal. La lista completa de los programas principales disponibles de software para el andlisis multivariante se puede encontrar en el Apéndice A. Es necesario prestar una atencidn especial alos programas para ‘el computador personal. 4 ANALISIS MULTIVARIANTE vile aMe eC MeL Elandlisis multivariante no es facil de definir. En un sentido amplio, se refiere a todos los métodos, estadisticos que analizan simulténeamente medidas miiltiples de cada individuo u objeto sometido a investigacion. Cualquier andlisis simultineo de més de dos variables puede ser considerado apro- ximadamente como un andlisis multivariante. En sentido estricto, muchas técnicas multivariantes son extensiones del andlisis univariante (andlisis de distribuciones de una sola variable) y del ana~ lisis bivariante (clasificaciones cruzadas, correlacién, andlisis de la varianza y regresiones simples, utilizadas para analizar dos variables). Por ejemplo, una regresién simple (con una variable predictor) se extiende al caso multivariante para incluir varias variables predictor, De la misma forma, la va- riable dependiente que se encuentra en el anzlisis de la varianza se extiende para incluir miltiples variables dependientes en el andlisis multivariante de la varianza. Como veremos mas adelante, en ‘muchas ocasiones las técnicas multivariantes son un medio de representar en un andlisis simple aque Ho que tequirié varios andlisis utilizando téenicas univariantes. Otras técnicas multivariantes, sin ‘embargo, estan disefiadas exclusivamente para tratar con problemas multivariantes, tales como el “nilisis factorial que sirve para identificar la estructura subyacente de un conjunto de variables 0 el anilisis discriminante que sirve para diferenciar entre grupos basados en un conjunto de variables. Una de las razones de Ia dificultad de definir el analisis multivariante es que el término mul- tivariante no se usa de la misma forma en la literatura. Para algunos investigadores, multivarian~ te significa simplemente examinar relaciones entre mas de dos variables. Otros usan el término sélo para problemas en los que se supone que todas las variables miiltiples tienen una distribucién nor- ‘mal multivariante. Sin embargo, para ser considerado verdaderamente multivariante, todas las va- riables deben ser aleatorias y estar interrelacionadas de tal forma que sus diferentes efectos no puedan ser interpretados separadamente con algiin sentido. Algunos autores afirman que el pro- pésito del andlisis multivariante es medir, explicar y predecir el grado de relacién de los valores teéricos (combinaciones ponderadas de variables). Por tanto, el cardcter multivariante reside en los miltiples valores tedricos (combinaciones miltiples de variables) y no sélo en el niimero de v riables u observaciones. A efectos de este libro, no insistiremos en una definicién rigida del an: lisis multivariante. En lugar de esto, el andlisis multivariante incluira tanto técnicas multivariables como técnicas multivariantes, debido a que los autores ereen que el conocimiento de las técnicas multivariables es un primer paso esencial en la comprensién del analisis multivariante, TNT eels eerie cee ts re OC id Aunque el andlisis multivariante tiene sus rafees en la estadistica univariante y bivariante, la ex- tension al dominio multivariante introduce conceptos y cuestiones adicionales. Estos conceptos van desde la necesidad de un entendimiento conceptual del elemento bisico del andlisis multivarian- te —el valor tedrico— a las cuesticnes especificas acerca de los tipos de escalas de medida utili- zadas y los resultados estadisticos de los test de significacion y los intervalos de confianza. Cada ‘concepto juega un papel importante en la correcta aplicacién de cualquier técnica multivariante, El valor teérico ‘Como ya se ha mencionado, el elemento esencial del andlisis multivariante es el valor te6rieo, una combinacién lineal de variables con ponderaciones determinadas empiricamente. El investigador specifica las variables, mientras que las ponderaciones son objeto especifico de determinacién por parte de la técnica multivariante. Un valor teérico de n variables ponderadas (X, a X,) puede expresarse matemiticamente asi Valor teérico = w,X, +w,X, + w.X, +. tW,X, INTRODUCCION 5 donde X, es la variable observada y w, es la ponderacién determinada por la técnica multiva- riante. El resultado es un valor tnico que representa una combinacién de fodo el conjunto de variables que mejor se adaptan al objeto del anélisis multivariante especifico. En regresiones maltiples, el valor tebrico se determina de tal forma que guarde la mejor correlacién con la variable que se est prediciendo. En el andlisis discriminante, el valor teérico se forma de tal manera que produzca resultados para cada observacion que diferencien de forma maxima entre grupos de observaciones. Y en el anilisis factorial, los valores tedricos se forman para representar mejor las estructuras subyacentes o la dimensionalidad de las variables tal y como se representan en sus intercorre: laciones. En cada caso, el valor tedrico capta el cardcter multivariante del andlisis. Por tanto, en nues- tras discusiones de cada técnica, el valor te6rico es el punto central del andlisis por varias razones. Debemos entender no solo su impacto conjunto para lograr cumplir el objetivo de cada técnica, sino también la contribucién de cada variable separada al efecto del valor teGrico en su conjunto. Escalas de medida El andlisis de los datos implica la separacién, identificacién y medida de la variacién en un conjunto de variables, tanto entre ellas mismas como entre una variable dependiente y una o més variables independientes. El término clave aqui es medida, dado que el investigador no puede separar o identificar una variacién a menos que pueda ser mesurable. La medida es importante para representar con precisién el concepto de nuestro interés y es crucial en la seleccién del método de anilisis multivariante apropiado. En los siguientes parrafos vamos a discutir el concepto de medida cen lo que se refiere al andlisis de datos y particularmente a las diversas téenicas multi variantes. Existen dos tipos bisicos de datos: no métricos (cualitativos) y métricos (cuantitativos). Los datos no métricos son atributos, caracteristicas o propiedades categoricas que identifican o deseriben ‘un sujeto, Describen diferencias en tipo o clase indicando la presencia o ausencia de una carac- teristica o propiedad. Muchas propiedades son discretas porque tienen una caracteristica peculiar que excluye todas las demas caracteristicas. Por ejemplo, si uno es hombre, no puede ser mujer. No hay cantidad de «género», s6lo Ta condicién de ser hombre o mujer. Por el contrario, las me- didas de datos métricos estin constituidas de tal forma que los sujetos pueden ser identificados por ‘ferencias entre grado o cantidad. Las variables medidas métricamente reflejan cantidades rela tivas 0 grado, Las medidas métricas son las mas apropiadas para casos que involucran cantidad 0 magnitud, tales como el nivel de satisfaccién o la demanda de trabajo. Escalas de medida no métricas Las medidas no métrieas pueden tener escalas nominales u ordinales. La medida con una escala nominal asigna nimeros que se usan para ctiquetar 0 identificar sujetos u objetos. Las escalas no- minales, también conocidas como escalas de categoria, proporcionan el nimero de ocurrencias en cada clase 0 categoria de la variable que se est estudiando. Por tanto, los niimeros o simbolos asig- nados a los objetos no tienen mas significado cuantitativo que indicar la presencia o ausencia del atributo o caracteristica bajo investigacién. Los ejemplos de datos con escala nominal incluyen el exo, la religiOn o el partido politico de una persona. Para trabajar con estos datos, el analista pue- de asignar nlimeros a cada categoria, por ejemplo, 2 para mujeres y 1 para hombres. Estos nime- 10s s6lo representan categorias o clases y no implican cantidades de un atributo 0 caracteristica. Las escalas ordinales representan un nivel superior de precision de la medida. Las variables pue- den ser ordenadas 0 clasificadas con escalas ordinales en relacion a la cantidad del atributo pose- ido, Cada subclase puede set comparada con otra en términos de una relacién de «mayor que» 0 ‘

Você também pode gostar