Escolar Documentos
Profissional Documentos
Cultura Documentos
doc
12/01/2015
vgg
Cmo depende
Y
de las variables X1, X2, ... Xp ?
cualitativa
cuantitativas
INTRODUCCIN
discrim_predictivo.doc
12/01/2015
vgg
discrim_predictivo.doc
12/01/2015
vgg
Observadas p variables conjuntamente para individuos dentro de cada grupo, podemos analizar
mediante un MANOVA si las media p-dimensional (de las variables X1, X2, ... Xp) es cambiante
atravs de los k grupos, o por el contrario, no se aprecia efecto grupo.
MANOVA de 1 factor Y (grupo), con variables explicativas X1, X2, ... Xp (cuantitativas)
Cada nivel del factor Y define un grupo.
H0: NO EFECTO. La media p-dim se mantienen a travs de los k grupos: 1= 2= = k
Nota recordatoria: El Manova requiere normalidad y homocedasticidad.
Obviamente, tiene sentido realizar un Anlisis Discriminante que estudie las diferencias entre
grupos slo cuando se rechaza H0
Cuando el MANOVA rechaza la igualdad de medias a travs de los grupos, el
ADD caracteriza las diferencias entre grupos
(Planteamiento Descriptivo)
ADP
predice el grupo de individuos sin catalogar
(Planteamiento Predictivo)
i desconocidas; conocida
i y desconocidas
enfoque poblacional
asumimos
enfoque muestral
enfoque muestral
i i desconocidas
SIN asumir
enfoque poblacional
enfoque muestral
's iguales
p=2
discrim_predictivo.doc
12/01/2015
vgg
i y conocidas (caso
Poblacin 1: 1 x ~ Np (1, )
- enfoque poblacional -
Poblacin 2: 2 x ~ Np (2, )
= 1-2
x0 ~ Np (0, )
0 1 0 2 ?
Idea:
Optimo:
L(x) at x
x / at x > k
x / at x < k
at x0 ~ N1(at 0, at a)
Busco la direccin a que mejor discrimina entre los dos grupos, es decir, que
maximiza la separacin (homogeneizada) entre las medias transformadas: at 1 , at 2
a2
= -1= 2
t
t
t
a a
a a
a a
a a
(1)
a = -1 -1(1-2)
( a , puesto que a2 = 2a 0 )
Para esta a,
at x = (1-2)t-1 x L(x)
discrim_predictivo.doc
12/01/2015
vgg
Regla de clasificacin
A partir de L(x0) (valor que toma la funcin lineal discriminante L para la nueva
observacin x0), decido a qu poblacin se asigna la nueva observacin x0:
x 0 1 si a t x 0 > k
para ello utilizo una Regla de clasificacin :
t
x 0 2 si a x 0 < k
[1]
Error tipo 2: 2 1
- k + t -1 2
e2= (
)
1
e1= e2 = ( )
2
punto medio
x01 si (1-2)t-1 x0 -
1
(1 t-1 1 - 2 t-1 2) > 0
2
Otros criterios
2) Mnima Distancia:
Regla MD:
[2]
discrim_predictivo.doc
12/01/2015
vgg
n1 individuos en la poblacin 1;
media muestral x1
media muestral x 2
n2 individuos en la poblacin 2;
Sustituyo en [2] las i, ahora desconocidas por sus estimaciones por x i y tengo una
nueva versin de la regla de discriminacin lineal de Fisher:
Observo
x01 si ( x1 - x 2 )t-1 x0 -
1
( x1 t-1 x1 - x 2 t-1 x 2 ) > 0
2
[3]
Nota: Sigue coincidiendo con la regla DM, pero con la RV slo si n1= n2.
discrim_predictivo.doc
12/01/2015
vgg
i y desconocidas (caso
-enfoque Muestral-
x01 si ( x1 - x 2 )t Sp-1 x0 -
1
( x1 t Sp-1 x1 - x 2 t Sp-1 x 2 ) > 0
2
[4]
discrim_predictivo.doc
12/01/2015
vgg
's diferentes
i y i conocidas ( )
- enfoque poblacional -
x01
si
- enfoque muestral
discrim_predictivo.doc
12/01/2015
vgg
(desconocida)
- enfoque muestral
xi :
Sp
k
i=1
ni - k
g.de l.
x0 ~ Np (0, )
Nuevo elemento:
dS2-1 (x 0 , x i ) d S2-1 (x 0 , x j )
p
x it S-1p x 0 -
1 t -1
1
x i Sp x i sup x tj S-1p x 0 - x tj S-1p x j
2
2
j 1...k
[5]
- enfoque muestral
x it Si-1x 0 -
1 t -1
1
x i Si x i sup x tj S-1j x 0 - x tj S-1j x j
2
2
j 1...k
[6]
Densidades conocidas
muestras
discrim_predictivo.doc
12/01/2015
vgg
10
1
2 k
p(1) p(2) p(k)
f(x/1) f(x/2) f(x/k)
probs a posteriori
(conocidas o estimadas)
p(i) f(x/i)
con
p(i/x)= k
p(j) f(x/j)
j=1