Escolar Documentos
Profissional Documentos
Cultura Documentos
ANÁLISIS MULTIVARIADO
PARA RIESGOS
EMAIL: lnieto@itam.mx
URL: http://allman.rhon.itam.mx/~lnieto
¾ TEMARIO (EXTENDIDO):
1. Introducción.
1.1 Aplicaciones de los métodos multivariados
1.2 Organización de los datos
1.3 Variables, vectores y matrices aleatorias
1.4 Repaso de álgebra matricial
2. Análisis exploratorio multivariado
2.1 Estadística multivariadas descriptivas
2.2 Análisis gráfico
3. La distribución normal multivariada
3.1 Propiedades
3.2 Estimación máximo verosímil
3.3 Validación del supuesto de normalidad
3.4 Transformaciones para conseguir normalidad
4. Análisis de componentes principales
4.1 Componentes principales poblacionales
4.2 Reducción de la variabilidad muestral con CP
4.3 Gráficas de los componentes principales
4.4 Inferencias asintóticas para λi y ei.
5. Análisis de clasificación (discriminante)
5.1 Clasificación de dos poblaciones
2
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
¾ REFERENCIA BÁSICA:
9 Johnson, R. A. & Wichern, D. W. (2002). Applied Multivariate Statistical
Analysis. Prentice Hall: London.
¾ REFERENCIAS ADICIONALES:
Anderson, T.W. (2003). An Introduction to Multivariate Statistical
Analysis. Wiley: New York.
Bluhm, C., Overbeck, L. & Wagner, C. (2003). An Introduction to Credit
Risk Modelling. Chapman & Hall: London.
Elizondo, A. (2003). Medición integral del riesgo de crédito. Limusa:
México.
Hand, D. J. & Jacka, S. D. (1998). Statistics in Finance. Wiley: New York.
3
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
4
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
1. Introducción
5
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
¾ Los objetivos para los cuales se han usado los métodos multivariados más
comúnmente son:
1) Reducción de datos o simplificación estructural
2) Clasificación y agrupación: tanto individuos como variables
3) Investigar la dependencia entre variables
4) Predicción
5) Pruebas de hipótesis
6
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
¾ Los valores de estas variables están medidas para cada individuo, elemento
o unidad experimental.
¾ NOTACIÓN:
p = número de variables
n = número de individuos
Xij = j-ésima variable del i-ésimo individuo
xij = valor observado de la j-ésima variable del i-ésimo individuo
⇒ Si tenemos n mediciones de p variables, es decir, i=1,...,n y j=1,....,p
x11 x12 L x1p
x 21 x 22 L x 2p
X=
M M O M
x x n2 L x np
n1
X=matriz de datos
7
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
¾ Recordemos:
o X es una variable aleatoria si X es una función medible con dominio en el
espacio muestral (Ω) y contradominio en los números reales (ℜ ), i.e.,
8
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
medible.
9
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
conjunta
X1 '
X2 '
o Sea X = una matriz aleatoria tal que X i ' = (X i1 , X i 2 ,K, X ip ) son
M
X
n '
i =1 i =1
10
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
∞
∫ (x − µ ) f (x )dx, si X es continua
2
σ 2X = Var(X ) = −∞
∑ (x − µ )2 f (x ), si X es discreta
x
{
Nota: Var(X ) = E (X − µ ) = E X 2 − µ 2
2
} ( )
o Sea X' = (X1 , X 2 ) un vector aleatorio de dimensión 2×1, entonces
Covarianza:
σ12 = Cov(X1 , X 2 ) = E{(X1 − µ1 )(X 2 − µ 2 )} = E(X1X 2 ) − µ1µ 2 ,
donde, µ j = E (X j ) , j=1,2
∞
∫ (x1 − µ1 )(x 2 − µ 2 )f X1 ,X 2 (x1 , x 2 )dx1dx 2 , si X1 y X 2 son continuas
σ12 = −∞
∑ (x1 − µ1 )(x 2 − µ 2 )f X ,X (x1 , x 2 ), si X1 y X 2 son discretas
x 1 2
11
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
Vector de medias:
E (X1 ) µ1
E (X 2 ) µ 2
µ = E (X) = =
M M
E (X ) µ
p p
12
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
σ ii = Var (X i ) y σ ij = Cov(X i , X j )
σ ij
⇒ ρ ij = Corr (X i , X j ) = , i,j=1,...,p.
σ ii σ jj
13
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
( )
debido a que A −1A = ΡΛ−1Ρ' (ΡΛΡ ') = Ρ(I )Ρ' = ΡΡ' = I
Nota: Otra forma de calcular A−1 es:
1
A −1 = Adj(A) , donde Adj(A) = Cofac(A)'
det(A)
14
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
o Raíz cuadrada de una matriz: A(p×p), λi > 0, para i=1,...,p (i.e., A definida
positiva)
p
A 1/ 2
= ΡΛ Ρ' = ∑ λ i e i e i '
1/ 2
i =1
( )(
tal que A1/ 2 A1/ 2 = ΡΛ1/ 2 Ρ' ΡΛ1/ 2 Ρ' = Ρ(Λ )Ρ' = A )
15
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
x x
o Nota: Para un x≠0, si x 0 = = , i.e. x0 es el vector normalizado de x
x x' x
x ' Bx
(x0 se encuentra en el círculo unitario) ⇒ = x 0 ' Bx 0
x' x
16
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
17
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
X1 X11 X n1
X 2 1 X12 X n 2
X = = +L+ .
M n M M
Xp X X
1p np
Esto implica que, para j=1,...,p
1 n
Xj = ∑ X ij .
n i=1
Propiedades:
E(X ) = µ ,
donde µ es el vector de medias poblacional de dimensión p×1
1 1
Var (X ) = Var(X i ) = Σ ,
n n
donde Σ es la matriz de varianzas y covarianzas de Xi.
DEM...
18
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
1
S= (X − 1X')' (X − 1X'),
n −1
donde 1'n×1 = (1,K,1) . Alternativamente,
donde, S jj =
1 n
∑ (X ij − X j )2 , para j=1,2,...,p, y
n − 1 i=1
Propiedades:
E(S) = Σ ,
donde Σ es la matriz de varianzas y covarianzas poblacional
DEM...
R: var
19
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
Propiedades:
1) -1 ≤ rkj ≤ 1
2) E(R ) ≠ Ρ .
R: cor
R: summary
20
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
21
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
R: stars
x i1
f i (t ) = + x i 2 sen ( t ) + x i 3 cos( t ) + x i 4sen (2 t ) + x i 5 cos(2 t ) + L
2
para − π < t < π .
El diagrama de Andrews se construye graficando las n funciones fi(t),
i=1,...,n sobre una misma gráfica en dos dimensiones. Es recomendable
estandarizar las variables. Distintos ordenamientos de las variables dan
representaciones diferentes.
22
Maestría: Administración de riesgos Análisis multivariado para riesgos
PROFESOR: LUIS E. NIETO BARAJAS
¾ NOTAS FINALES:
Los diagramas de estrellas, las caras de Chernoff y el diagrama de
Andrews nos sirven para resolver los siguientes objetivos:
o Encontrar una agrupación inicial de individuos
o Detectar observaciones multivariadas extremas
o Verificar o validar una agrupación obtenida por algún método de obtención
de cúmulos (cluster analysis).
23
Maestría: Administración de riesgos Análisis multivariado para riesgos