Você está na página 1de 18

Anlisis Discriminante Y Cannico

Trabajo Prctico




Curso : Investigacin de Mercados.
Docente : Milagritos del Rosar Velarde Echevarria
I ntegrantes : Alvites Azogue, Yesho
DAngelo Reyes, Giuliana
Valera Daz, Chanel

Ciclo : VII
TRUJILLO PERU
2013
ANLISIS DISCRIMINANTE Y CANNICO.
FIJACIN DE ESCALAS MULTIDIMENSIONALES

I. Anlisis Discriminante
I.1. Introduccin
Supongamos que un conjunto de objetos est ya clasicado en una serie de
grupos, es decir, se sabe previamente a qu grupos pertenecen. El Anlisis
Discriminante se puede considerar como un anlisis de regresin donde la
variable dependiente es categrica y tiene como categoras la etiqueta de cada
uno de los grupos, y las variables independientes son continuas y determinan a
qu grupos pertenecen los objetos. Se pretende encontrar relaciones lineales
entre las variables continuas que mejor discriminen en los grupos dados a los
objetos.
Un segundo objetivo es construir una regla de decisin que asigne un objeto
nuevo, que no sabemos clasicar previamente, a uno de los grupos prejados
con un cierto grado de riesgo.
Es necesario considerar una serie de restricciones o supuestos:
Se tiene una variable categrica y el resto de variables son de
intervalo o de razn y son independientes respecto de ella.
Es necesario que existan al menos dos grupos, y para cada grupo
se necesitan dos o ms casos.
El nmero de variables discriminantes debe ser menor que el
nmero de objetos menos 2: x1, ..., xp, donde p < (n2) y n es el
nmero de objetos.
Ninguna variable discriminante puede ser combinacin lineal de
otras variables discriminantes.
El nmero mximo de funciones discriminantes es igual al mnimo
entre el nmero de
variables y el nmero de grupos menos 1 (con q grupos, (q 1)
funciones discriminantes).

I.2. Definicin
Es una tcnica de clasicacin donde el objetivo es obtener una funcin capaz
de clasicar a un nuevo individuo a partir del conocimiento de los valores de
ciertas variables discriminadoras.
A diferencia del A. Cluster, se deben conocer los grupos previamente y a qu
grupo pertenecen ciertos individuos, de los que tambin se conoce sus valores
en las variables discriminantes.

I.3. Objetivos
Tiene cuatro objetivos principales:
determinar combinaciones lineales de variables predictoras para separar
a los grupos maximizando la variacin relativa entre grupos con
relacin a la variacin dentro de los grupos (los objetos en diferentes
grupos tiene un separacin mxima).
Desarrollar procedimientos para asignar nuevos objetivos, empresas o
individuos, cuyos perfiles son conocidos, pero no su identidad de
grupo, a uno de los dos grupos.
Probar si existen diferencias significativas entre los dos grupos.
Determinar cules variables cuentan ms para explicar las diferencias
entre grupos.

I.4. Finalidad
El Anlisis Discriminante es una tcnica estadstica multivariante que busca una
doble finalidad:
En primer lugar, el anlisis discriminante es una tcnica,
sustancialmente, clasificatoria. A partir de una variable dependiente
cualitativa y un conjunto de una o ms variables independientes
cuantitativas (en caso contrario habr que recodificar los valores de las
variables no cuantitativas), el anlisis discriminante permite clasificar a
los individuos o casos en alguno de los grupos establecidos por la
variable dependiente. Desde esta perspectiva, guarda cierta similitud con
el anlisis de conglomerados o cluster: mientras que ste tiene un carcter
estrictamente exploratorio (no se conocen a priori los grupos a formar),
en el anlisis discriminante s se conoce el grupo de pertenencia; en el
anlisis de conglomerados el objetivo es obtener grupos homogneos
entre s y heterogneos respecto a los dems; por su parte, en el anlisis
discriminante los grupos ya estn constituidos debiendo identificar lo
especfico de cada uno de ellos para poder as asignar a los individuos o
casos a cada uno de ellos. En esta finalidad clasificatoria va implcita,
pues, una finalidad descriptiva (identificar las variables que ms y mejor
discriminan y caracterizan a los grupos).
En segundo lugar, y siempre que se apreciara la efectiva diferencia entre
grupos, el anlisis discriminante cumple una finalidad predictiva al
proporcionar procedimientos de clasificacin sistemtica de nuevas
observaciones de origen desconocido en uno de los grupos analizados.
Desde esta segunda ptica, a su vez, guarda cierta similitud con el
modelo de regresin mltiple: mientras que la ecuacin de regresin lineal
nos permita estimar directamente el valor de la variable dependiente; en
el anlisis discriminante ser a partir de las puntuaciones discriminantes
desde las que estimaremos la probabilidad de pertenencia a un grupo, y
a partir de dicha probabilidad estimaremos a cul de ellos pertenece
cada unidad o caso.

Nosotros vamos a centrar nuestra exposicin, exclusivamente, en la primera de
las posibilidades implcitas en esta tcnica de anlisis. Desde esta ptica, el
anlisis discriminante clasifica a los individuos entre los grupos considerando
las variables que ms y mejor caracterizan y, en consecuencia, diferencian a los
grupos. A estas variables, en el anlisis discriminante, se les denominan variables
cannicas o discriminantes, se presentan como combinaciones lineales de las
variables originales y se expresan por una funcin discriminante. Estadsticamente
el anlisis discriminante busca la obtencin de dichas funciones de la siguiente
manera:

I.5. Tcnicas
Funcin lineal discriminante de Fisher
Se trata de encontrar una buena funcin discriminante que sea una combinacin
lineal de las variables originales. Cuando aplicamos la funcin a un dato nuevo nos
dice a qu grupo pertenece.


Formas de evaluar la clasificacin
La clasificacin ser buena si las variables son buenas, separan claramente a los
individuos de los distintos grupos.
Tasa de error aparente: Se aplica la regla para clasificar todos los datos de la
muestra de entrenamiento y se cuentan los casos en los que la clasificacin es
errnea.


Diagnstico de hiptesis con el test M de Box



Clasificacin incorporando informacin previa
Cuando tenemos informacin previa sobre a qu grupo es ms probable que
pertenezca un nuevo individuo que queremos clasificar, la podemos incorporar en
la regla de decisin.

Otros mtodos de clasificacin
Clasificacin cuadrtica utilizando la distancia de Mahalanobis
Clasificacin por vecinos ms cercanos
Discriminacin con regresin logstica
Arboles de clasificacin y regresin (CART)
Mtodos bayesianos
Redes neuronales, Projection pursuit, Support
Vector Machines, etc.

Aplicaciones
Las tcnicas de anlisis discriminante tienen numerosas aplicaciones y se ha utilizan
mucho para abordar problemas interesantes y complejos tanto en la biologa como
en otras disciplinas
o Medicina: Deteccin precoz del cncer
o Ingeniera: Reconocimiento de voz
o Informtica: Clasificacin de correo spam
o Economa: Adjudicacin de crditos bancarios
o Literatura: Autora de manuscritos de autores desconocidos

I.6. Etapas del Anlisis Discriminante
1. Planteamiento del problema
n casos divididos en q grupos que constituyen una particin de la poblacin de
la que dichos casos proceden (o dos poblaciones)
Y=(Y1,...,Yp) es el conjunto de variables numricas observadas sobre dichos
casos
Los objetivos del anlisis discriminante en esta etapa pueden ser:
Analizar si existen diferencias entre los grupos respecto a las variables
consideradas y averiguar en qu sentido
Elaborar procedimientos de clasificacin sistemtica de individuos de
origen desconocido.

Ejemplo.
Planteamiento del problema
La Universidad desea establecer las diferencias entre dos razas bovinas
(toros).
Para ello, estudia 8 variables morfolgicas en 1000 animales de 30
explotaciones.
El objetivo es determinar si existen diferencias en ambas razas, y en
caso de que existan determinar en qu sentido se dan dichas
diferencias.
En este caso:
Variables independientes: 8 medidas biomtricas
Variable dependiente: raza (braford vs aberdeen)
n = n1 + n2; 1000 = 600 braford + 400 aberdeen
El fin ltimo es encontrar una regla que permita clasificar
adecuadamente nuevos animales

2. Seleccin de variables dependientes e independientes
La variable dependiente debe ser no mtrica:
Los grupos deben ser mutuamente excluyentes
Puede ser mtrica en origen
P.e. Superficie: pequea, mediana, grande
La decisin sobre el nmero de categoras:
Debe ajustarse al poder discriminante de los predictores
Puede observarse en etapas sucesivas y optar slo por el enfoque de
extremos polares
P..e.. Superficie: pequea o grande

3. Seleccin del tamao muestral
Alta sensibilidad al tamao muestral
Por lo menos 5 casos por variable independiente.
Ideal, 20 casos por variable.
Alta sensibilidad al tamao de los grupos.
No es necesario que los grupos tengan el mismo nmero de casos,
aunque es recomendable.
El ms pequeo de los grupos debe tener ms casos que variables
independientes.

4. Comprobacin de las hiptesis de partida
Normalidad multivariante. Si no se cumple hay que usar un modelo de
regresin logstica.
Homocedasticidad multivariante (matrices de varianzascovarianzas
similares). Si no se cumple hay que usar tcnicas de clasificacin
cuadrticas.
Multicolinealidad. Causar problemas en la interpretacin.

5. Estimacin del modelo
La discriminacin entre los q grupos se realiza mediante el clculo de unas
funciones matemticas denominadas funciones discriminantes.
Existen varios procedimientos para calcularlas siendo el procedimiento de
Fisher el ms utilizado.

6. Validacin de las funciones discriminantes
T2 de Hooteling
Autovalores (races caractersticas)
La suma de cuadrados entre grupos de cada funcin discriminante.
Ratio autovalor / suma de autovalores
Indica la capacidad discriminante relativa
Test de Bartlett
Correlacin cannica
Mide en trminos relativos el poder discriminante
Lambda de Wilks
Es un estadstico que mide el poder discriminante de las variables.

7. Contribucin de las variables a la capacidad discriminante
Este es el aspecto clave del anlisis discriminante.
Hay que encontrar una regla ptima de clasificacin con el menor nmero de
variables (principio de parsimonia)
La regla ptima de clasificacin es la que menos errores comete con el mnimo
nmero de variables (valoracin de la capacidad predictiva)

8. Valoracin de la capacidad predictiva
Estimacin por resustiucin: Mtodo de resustiucin
Estimacin por valoracin cruzada. (Lachenbruch)

9. Seleccin de variables

I.6. Ejemplo
Se dispone de una muestra de pacientes a los que se les mide previamente un
conjunto de variables. El investigador puede dividir la muestra en dos(o ms)
grupos de diagnstico. Ms tarde se mide a un nuevo enfermo el mismo grupo de
variables y, por los valores obtenidos, el Anlisis Discriminante permite asignar
dicho paciente al grupo de mxima probabilidad, cuanticando a la vez el valor de
ella.

Inters
Extensin a los campos de las Ciencias de la Vida en la que la clasicacin de
individuos a travs de un perl observado constituye un frecuente problema de
investigacin.

Definicin
Tcnica de Anlisis Multivariante que permite asignar o clasicar nuevos individuos
dentro de grupos previamente reconocidos o denidos.

II. Anlisis Cannico

II.1. Introduccin
El Anlisis Cannico de Poblaciones (ACPO), forma parte de una serie de
tcnicas destinadas a clasificar o a explicar clasificaciones de individuos,
caracterizados por cierto nmero de variables numricas o nominales. Puede
considerarse como un mtodo que es a la vez descriptivo y predictivo.

El origen del mtodo se remonta a FISHER (1936), o en forma ms directa a
MAHALANOBIS (1936). Es uno de los mtodos ms usados, y ha recibido
por los autores diferentes nombres, tales como: Anlisis de Variables Cannicas
(GITTINS, 1985; KRZANOWSKI, 1988; GOWER, 1989) o Anlisis Factorial
Discriminante (LEBART et al, 1995) y Anlisis Cannico de Poblaciones
(CUADRAS, 1996) entre otros muchos.

II.2. Definicin
Es una tcnica para evaluar relaciones entre variables dependientes mltiples y
variables independientes mltiples. Permite estudiar la estructura de varios
grupos de individuos con respecto a un conjunto de variables observadas,
proyectando el espacio Eucldeo generalizado en un espacio Eucldeo. La
condicin que se impone es que la separacin entre los distintos grupos sea
mxima, con respecto a la variabilidad dentro de los grupos.

II.3. Finalidad
Basado en lo anterior puede decirse que este anlisis pretende:
Hallar una ordenacin de los grupos de individuos cada uno
representado por el vector de las medias en todas las variables.
Hallar combinaciones lineales de las variables de partida con mximo
poder discriminante entre los grupos
Estudiar de la dimensionalidad de la hiptesis alternativa en el
MANOVA.

II.4. Tcnicas
El Anlisis Cannico de Poblaciones est relacionado con diferentes tcnicas
multivariantes, entre las que se pueden enumerar las siguientes:
El Anlisis Multivariante de la Varianza (MANOVA), el cual contrasta
la hiptesis de igualdad entre los vectores de medias de los distintos
grupos de individuos.
El Anlisis Discriminante Lineal, el cual busca construir una funcin,
generalmente combinacin lineal de las variables de partida. A travs
de dicha funcin se debe poder asignar un nuevo individuo a uno de
los grupos definidos a priori.
El Anlisis de Componentes Principales. El Anlisis Cannico de
Poblaciones puede considerarse como un Anlisis de Componentes
Principales de una matriz cuyas filas corresponden a los centros de
gravedad de los grupos en el espacio de las variables. La matriz de
mtricas para los individuos, es la inversa de la matriz de varianzas
covarianzas dentro de los grupos y la de las variables es la matriz
diagonal, cuyos trminos de la diagonal son los tamaos maestrales de
cada uno de los grupos(LEBART et al, 1995).

III. Fijacin de Escalas Multidimensionales

III.1. Introduccin.
La fijacin de escalas multidimensionales se ocupa del problema central de
posicionar objetos en un espacio perceptual. Gran parte de la administracin
de mercadotecnia se ocupa de la cuestin del posicionamiento. Con quin
competimos? Cmo somos en comparacin con nuestros competidores?
Qu estrategias de posicionamiento deben seguirse? Las escalas
multidimensionales tratan de responder a estas y otras preguntas.

La construccin de escalas multidimensionales comprende bsicamente dos
problemas. En primer lugar, deben identificarse las dimensiones en las cuales
los clientes perciben o evalan objetos (organizaciones, productos, marcas).
Por ejemplo, los estudiantes deben evaluar las escuelas superiores en las que
podran inscribirse en trminos su calidad, costo, distancia desde el hogar y
tamao. Sera conveniente trabajar solo con dos dimensiones, ya que as los
objetos se podran ilustrar grficamente. Sin embargo, esto no siempre es
posible, debido a que en ocasiones se necesitan dimensiones adicionales para
representar las percepciones y evaluaciones de los clientes. En segundo lugar,
lo objetos necesitan posicionarse con respecto a estas dimensiones. Las escalas
multidimensionales dan como resultado la ubicacin de los objetos en las
dimensiones, lo cual se denomina mapa perceptual o de posicionamiento.

III.2. Definicin
Las escalas multidimensionales se emplea para identificar dimensiones
mediante las cuales se perciben o evalan objetos para posicionar a los objetos
con respecto a dichas dimensiones, y para tomar decisiones de
posicionamiento para nuevos y viejos productos.

III.3. Fundamentos claves
El supuesto fundamental es que los datos bsicos representan mediciones
vlidas. Por lo tanto, suponemos que los encuestados deben comprara objetos
con respecto a la similitud o preferencia de los atributos. Otro de los supuestos
consiste en que los encuestados empleen el contexto apropiado. Algunos de
ellos podran fomentar s preferencia de orden de clasificacin de cerveza en el
supuesto de que se les servir a invitados. Mientras que otros podran suponer
que ellos mismos lo consumirn.
En el caso en que los datos basados en atributos, se asume que lista de
atributos es pertinente y completa. Si se agrupan individuos, se asume que sus
percepciones sern similares.
El objeto ideal introduce problemas conceptuales adicionales. Otro supuesto
bsico consiste en que las distancias entre puntos generadas por un mapa
perceptual tiene un significado conceptual relevante para las decisiones de
eleccin.

III.4. Enfoques basados en atributos
Un supuesto importante de los enfoques basados en atributos es que pueden
identificar las caractersticas sobre las cuales se basan las percepciones que los
individuos tiene de los objetos.

Anlisis de factores
La meta del anlisis de factores consiste en generar dimensiones que
aumenten al mximo la capacidad de interpretacin y expliquen la
varianza.

Anlisis discriminante
La meta del anlisis discriminante es generar dimensiones
(denominadas factores de funcin discriminante) que permitan
discriminar o separar los objetos tanto como sea posible. Al igual que el
anlisis de los factores, cada dimensione se basa en una combinacin
de los atributos bsicos. Sin embargo, el anlisis discriminante, el grado
en que un atributo tienda a contribuir de manera importante a una
dimensin depende del grado en que exista una diferencia percibida
entre los objetos que tienen dicho atributo.

Anlisis de correspondencia
En anlisis de correspondencia genera, a manera de salida, un mapa
perceptual en el que se posicionan tanto elementos de los atributos
como las marcas

III.5. Limitaciones
Una limitacin de los mtodos basados en atributos consiste en que estos
tienen que generarse. El analista tiene la responsabilidad de asegurarse que los
atributos representes las percepciones y evaluaciones de los encuestados. Con
datos de similitud o preferencia, esta tarea se elimina. Sin embargo, el analista
debe entonces interpretar las dimensiones sin la ayuda de tales atributos,
aunque se podran generar datos de atributos de manera independiente y aun
as obtenerse correlaciones de dimensiones-atributos.


Referencias bibliogrficas
Aaker, D.A.; Day, G. S.; Kumar, V. (2001). Investigacin De Mercados.) Mxico, D.F: Limunsa.
R. Gutirrez, A. Gonzlez, F. Torres, J.A. Gallardo (1994). Tcnicas de Anlisis de datos
Multivariable. Tratamiento computacional. Universidad de Granada.
Garnica, O.; Gonzlez, M.; Daz, A. y Torres, L. (1991). Anlisis discriminante. Estudio del
rendimiento estudiantil. Universidad de Los Andes, Instituto de Investigaciones
Econmicas y Sociales. Recuperado de:
http://iies.faces.ula.ve/Revista/Articulos/Revista_06/Pdf/Rev6GarnicaO.pdf
Universidad de Crdova Anlisis Discriminante. Recuperado de:
http://www.uco.es/zootecniaygestion/img/pictorex/09_13_30_sesion_10.pdf
Anlisis Cannico De Poblaciones Y Mtodos Relacionados. Recuperado de:
http://biplot.usal.es/DOCTORADO/3CICLO/BIENIO-04-
06/Canonico/ACPO.pdf
Tema 6: Anlisis Discriminante. Recuperado de:
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/AMult/tema6a
m.pdf
Tema 3: Tcnicas De Anlisis Discriminante. Recuperado de:
http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/AD10_11_D
iscriminante.pdf

Você também pode gostar