Você está na página 1de 58

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

AnlisisdeCorrespondencias

ANLISISDECORRESPONDENCIAS(AC)
Esunatcnicadescriptivaoexploratoriacuyoobjetivoesresumirunagrancantidaddedatosenun
nmeroreducidodedimensiones,conlamenorprdidadeinformacinposible.
Enestalnea,suobjetivoessimilaraldelosmtodosfactoriales,salvoqueenelcasodelanlisisde
correspondenciaselmtodoseaplicasobrevariablescategricasuordinales.
Elanlisisdecorrespondenciassimplesseutilizaamenudoenlarepresentacindedatosquese
puedenpresentarenformadetablasdecontingenciadedosvariablesnominalesuordinales.Otras
utilizacionesimplicaneltratamientodetablasdeproximidadodistanciaentreelementos,ytablas
depreferencias.
Sisetratadeunatabladecontingenciadedosvariablescualitativas,unavariablecuyascategoras
aparecenenfilasylaotravariablecuyascategorassonrepresentadasencolumnas,elanlisisde
correspondenciasconsisteenresumirlainformacinpresenteenlasfilasycolumnasdemaneraque
puedaproyectarsesobreunsubespacioreducido,yrepresentarsesimultneamentelospuntosfilay
lospuntoscolumna,pudindoseobtenerconclusionessobrerelacionesentrelasdosvariables
nominalesuordinalesdeorigen.
Laextensindelanlisisdecorrespondenciassimplesalcasodevariasvariablesnominales(tablasde
contingenciamultidimensionales)sedenominaAnlisisdeCorrespondenciasMltiples,yutilizalos
mismosprincipiosgeneralesquelatcnicaanterior.Engeneralseorientaacasosenloscualesuna
variablerepresentatemsoindividuosyelrestosonvariablescualitativasuordinalesque
representancualidades.
EntrelautilizacindelAnlisisdeCorrespondenciasSimpleyMltiple,estudios:
PreferenciasdeconsumoenInvestigacindeMercados.
Posicionamientodeempresasapartirdelaspreferenciasdeconsumidores.
Bsquedadetipologasdeindividuosrespectoavariablescualitativas(patronesde
enfermedadesenmedicina,perfilespsicolgicos,comportamientodeespeciesenbiologa,etc.).
ElAnlisisdeCorrespondenciastienedosobjetivosbsicos:
Asociacinentrecategorasdecolumnasofilas:Medirlaasociacindesolounafilaocolumna,para
ver,porejemplo,silasmodalidadesdeunavariablepuedensercombinadas.
Asociacinentrecategorasdefilasycolumnas:Estudiarsiexisterelacinentrecategorasdelasfilas
ycolumnas.
Elanlisisdecorrespondenciassolorequierequelosdatosrepresentenlasrespuestasaunaseriede
preguntasyqueestnorganizadasencategoras.Dependiendosiexistendosomsvariablesel
anlisissersimpleomltiple.
UnanlisisdecorrespondenciasenSPSS:Analizar/Reduccindedatos/Anlisisdecorrespondencias.

SantiagodelaFuenteFernndez

AnlisisdeCorrespondencias

PLANTEAMIENTODELPROBLEMA
ElAnlisisdeCorrespondenciasesunatcnicaestadsticaqueseutilizaparaanalizar,desdeun
puntodevistagrfico,lasrelacionesdedependenciaeindependenciadeunconjuntodevariables
categricasapartirdelosdatosdeunatabladecontingencia.
Paraelloasociaacadaunadelasmodalidadesdelatabla,unpuntoenelespacioRn(generalmente
n=2)deformaquelasrelacionesdecercana/lejanaentrelospuntoscalculadosreflejenlas
relacionesdedependenciaysemejanzaexistentesentreellas.
SecomienzaanalizandoelproblemabidimensionalqueeselqueanalizaelAnlisisde
Correspondenciaspropiamentedicho.Posteriormentesetrata,brevemente,delproblema
ndimensional(n3)queeselproblemaqueanalizaelAnlisisdeCorrespondenciasMltiples.
SeaXeYdosvariablescategricas,respectivamente,convalores{x1,...,xk}e{y1,...,ym}.Seobservan
dichasvariablesenNelementosdeunapoblacin.Lainterseccinentreunafilayunacolumnada
lugaraunaceldaocasilla,cuyafrecuenciaobservadaes nij
Y
X

x1
x2
M
M

xi
M
M

xk

y1

y2

n11

n12

(e 11 )

(e 12 )

n21

n22

(e 21 )

(e 22 )

M
M
ni1

M
M
ni2

(e i1 )

(e i2 )

M
M
nk1

M
M
nk2

(e k1 )

(e k2 )

N1

N 2

yj

.......

n1 j
.......

(e 1 j )

n2 j
.......
M
M

(e 2 j )

ym

.......

n1m

.......

nij
(eij )

.......

M
M
nim

nkj

.......

(e kj )

M
M

M
M
nkm

.......

M
M

Nk

(e km )

N j

N j = nij
i =1

N = Ni = N j

Ni

(e im )

.......

j =1

N2

(e 2m )

.......

Ni = nij

n2m

.......
.......

.......

N1

(e 1m )

Nm

e ij =

Ni . N j
N

LosPERFILESMARGINALESdescribenladistribucinmarginaldelasvariablesXeY,respectivamente,
sereflejanenlassiguientestablas:
X = xi
Frecuencias
relativasmarginales
Y = yj
Frecuencias
relativasmarginales

SantiagodelaFuenteFernndez

x1

x2

N1

N2

y1

y2

N1

N2

......
......
......
......

xi
Ni
N

yj
N j
N

......
......
......
......

xk
Nk
N

ym
Nm
N

Total
1

Total
1

AnlisisdeCorrespondencias

LosPERFILESCONDICIONALESdescribenlasdistribucionescondicionadasasociadasalaTablade
Correspondencias.

LosperfilesfiladescribenlasdistribucionescondicionadasdelavariableYporlasdistintas
modalidadesdelavariableX.SeobtienenapartirdelaTabladeCorrespondenciasyelperfil
marginaldeXmediantelassiguientesexpresiones:
f(Y / X = xi )

y1

.......

x1

n11
N1

.......

x2

n21
N2

.......

xi
M

xj
M

xk

M
ni1
Ni
M
nj 1
Nj

M
nk1
Nk

.......
.......
.......
.......
.......

yj
n1 j
N1
n2 j
N2

M
nij
Ni

M
nj j
Nj

M
nkj
Nk

.......

ym

Total

.......

n1m
N1

.......

n2m
N2

.......
.......

M
nim
Ni

.......
.......

nj m

dij = 1 ni1 n j1

Nj

M
nkm
Nk

N1 Ni

N j

1
Distanciachicuadradoenlatablaentreperfilesfila: dij =
h=1 Nh

Distancia
chicuadradoentre
perfilesfilas(i,j):

.......
.......

nih njh

Ni Nj

LosperfilescolumnadescribenlasdistribucionescondicionadasdelavariableXporlasdistintas
modalidadesdelavariableY.Seobtienenapartirdelatabladecorrespondenciasyelperfil
marginaldeXmediantelassiguientesexpresiones:
f(X / Y = y j )

y1

.......

yi

.......

x1

n11
N1

.......

n1i
N i

.......

x2

n21
N1

.......

n2i
N i

.......

xi
M

xk
Total

M
ni1
N1
M
nk1
N1

.......
.......
.......

M
nii
N i
M
nki
N i

.......
.......
.......

yj
n1 j
N j
n2 j
N j
M
nij
M
nkj

N j

Distanciachicuadradoentreperfilescolumnas(i,j): dijc
SantiagodelaFuenteFernndez

ym

.......

n1m
Nm

.......

n2m
Nm
M
nim
Nm

.......

N j

.......

.......
.......

.......

nkm
Nm

1 n1i n1 j
=

N1 Ni N j

AnlisisdeCorrespondencias

Distanciachicuadradoenlatablaentreperfilescolumnas: dijc

1 nhi nhj
=

N
N
h=1 Nh

i
j

Trabajarconperfilesfacilitalainterpretacin,perotambinpuedeproducirunavisinequivocada
delarelacinentrevariablesenlamedidaquetodoslospuntostienenlamismaimportancia:los
marginalesdelosperfilesycolumnasonigualesa1.Paraevitaresteproblemaelanlisisde
correspondenciasdeberutilizarunadistanciaquenoolvidelasdiferenciasentrelosefectivosde
cadalnea(ocolumna).Ladistanciachicuadradocumplelacondicindeponderarcadaperfilporun
peso.Ascadafila(ocolumna)estafectadadeunpesoproporcionalasuimportanciaenel
conjunto,pesoconocidocomomasa.Alconsiderarcadapuntoconunamasaproporcionalasu
frecuenciaseevitaprivilegiarlascategorasconpocosefectivos.Setrata,dehecho,deunadistancia
eucldeaponderadaporelinversodelamasadelascolumnascuandosemideladistanciaentrefilas,
oporlamasadelasfilasparaladistanciaentrelascolumnas.
Ladistanciachicuadradocumpleelprincipiodelaequivalenciadistribucional,quepostulaquesidos
categorastienenperfilesidnticospuedensersustituidasporunasolacategoraquesealasumade
suspesos,sinqueconellosemodifiqueladistanciaentrelasfilasocolumnas.Laimportanciade
estapropiedadestribaenquegarantizalaestabilidadenlosresultadosconindependenciadela
codificacinenlasvariables;demodoqueesposibleagruparcategorasquetienenperfiles
coincidentes,tantoporfilascomoporcolumnas.Sielresultadosemantieneestabletrasunir
categoras,deigualmodoestosresultadosnomejoranalrealizarmssubdivisionesdecategoras
homogneas.

DEPENDENCIAEINDEPENDENCIAENTABLASDECORRESPONDENCIAS

LaexistenciaonodealgntipoderelacinentrelasvariablesXeYseanalizamediantecontrastes
dehiptesissobrelaindependenciadedichasvariables.Eltestdehiptesishabitualmenteutilizado
eseldelaChicuadradodePearson.
Secontrastalahiptesisnulaquepresuponelaindependenciaentreambasvariables,medianteel
estadstico 2 dePearson.

H0 : Ambas var iables son independie ntes



H1: Existe una relacin de dependencia
Eltestsebasaencompararlosperfilesfilaycolumnaconlosperfilesmarginalescorrespondientes,
considerandoquesiH0esciertatodoslosperfilesfila(respectocolumna)sonigualesentrese
igualesalperfilmarginaldeX(respectodeY).
k m

(nij eij )2

i =1 j =1

eij

Sedefineelestadsticoobservado:

Siendo e ij = E nij / H0 es cierta =

SantiagodelaFuenteFernndez

Ni . N j
N

= (2k 1). (m1)

,elestadsticoobservadosepuedeexpresartambin:

AnlisisdeCorrespondencias
2

nij N j
n
N
N

N j ij i

i
2
k m (n e )
k m
k m
N i N
N j N
ij
ij

=
=
N j
N i
eij
i=1 j=1
i=1 j=1
i=1 j=1
N
N

Laregincrticaparaelcontrastedeindependenciasedetermina: P (2k 1). (m1) k / H0 =

As,pues,paraunniveldesignificacin :
(2k 1).(m1) < 2;(k 1).(m1) X e Y son independie ntes al nivel
2
2
(k 1).(m1) ;(k 1).(m1) X e Y no son independie ntes al nivel

Sig.a sinttica(p _ value) 0,05 Se rechaza H0


SPSS
Sig.a sinttica(p _ value) > 0,05 Se acepta H0

Silahiptesisnulaserechaza,lasvariablesXeYsondependientes.Enestecasoconvieneanalizar
losperfilescondicionalesfilaycolumnaascomolosresiduosdelmodeloparaestudiarqutipode
dependenciaexisteentreellas.Losresiduosmsutilizadossonlosllamadosresiduostipificados
corregidosquevienendadosporlaexpresin:

ANLISISDELOSRESIDUOS:Losresiduossonlasdiferenciasentrelafrecuenciaobservadayla
frecuenciaesperadaencadacasilla: rij = nij eij .Enelcasodequeelcontrastede 2 hayaresultado

significativo,estosresiduosindicarnqucasillascontribuyenenmayorgradoalvalordel
estadstico.
Cuantomayorseaelvalordelosresiduosmayoreslaprobabilidaddequeunadeterminada
combinacindevaloresdelasvariables,estoes,unacasilla,seasignificativa.
Paraqueelanlisisdelosresiduosresulteadecuadoesnecesarioquepreviamentestoshayansido
ajustadosyestandarizados,paralocualsesueleaplicarlafrmulapropuestaporHaberman(1978),
queconsisteendividirelvalordelresiduoencadacasillaporsuerrortpico.
Residuostipificados rij =

nij eij
eij

Residuostipificadoscorregidos rijc =

rij
V(rij )

(nij eij ) / eij


Ni N j
1
1

N
N

N(0,1)

ANLISISDECORRESPONDENCIASCLASICO

Conlosperfilesdefilasycolumnasdescritosseelaboralamatrizdecoordenadas(distancias)
utilizandoladistanciachicuadrado,quepermitircalibrarlamagnituddelasdiferenciasentrela
tabladedatosanalizadayunatabladedatossinrelacinentrelasvariables.

SantiagodelaFuenteFernndez

AnlisisdeCorrespondencias

Elmtodoconsisteenencontrarladescomposicinenvaloressingularesdelamatriz:
C = (rij ) siendo rij =

nij eij
eij

paraconstruirunsistemadecoordenadas(generalmente,bidimensional)asociadoalasfilasy
columnasdelatabladecontingencia,quereflejelasrelacionesexistentesentredichasfilasy
columnas.
Enlarepresentacintienenunpapelimportantelasllamadasdistancias2entreperfiles,quesonlas
queelanlisisdecorrespondenciasintentareproducirensusrepresentacionesgrficas.Dichas
distanciassondistanciaspitagricasponderadasentreperfilesquevienendadasporlassiguientes
expresiones:
m

1
Distanciaentreperfilesfila: dij =
h=1 Nh
Distanciaentreperfilescolumnas: dijc

nih njh

Ni Nj

1 nhi nhj
=

h=1 Nh
Ni N j
k

Lasdistanciasnosemidenentredosfilasodoscolumnassinoconrelacinalperfilmediodefilao
columna,esdecir,conrelacinalpromediodelascoordenadasdeesafila(ocolumna)ponderada
porsumasa(pesoproporcionalasuimportanciaenelconjunto).
Esteperfilmedioaparecersituadoenelorigendecoordenadasyesconocidocomocentrode
gravedad.Lamediadelasdistanciasalcuadradodecadapuntodefilaalcentrodegravedadse
conocecomoinerciadefilas,oinerciadecolumnascuandosetratadelascolumnas,einerciatotal
delanubedepuntoscuandoseconsiderantodosloselementosdelatabla.Unainerciabaja
significaquetodoslosproductosestnsituadosmuycercadelcentrodegravedadyqueen
consecuenciasonmuysimilares,mientrasquealtosvaloresdeinerciaendeterminadascategoras
implicangrandesdiferenciasdelperfilmediodelasfilasolascolumnas.
PosteriormenteseprocedeadiagonalizarlamatrizCdevarianzacovarianzaconelfindeobtener
losvectoresyvalorespropiosquedefinirnlosnuevosejessobrelosqueserproyectadalanubede
puntos.Cuandolacantidaddeinerciaexplicadaconlosprimerosfactoresseaaltabastarcon
seleccionarunpequeonmerodestos(dosotres)yrepresentarlanubedepuntossobregrficos
dedosotresdimensiones,obteniendoasunavisinsimplificadadelasrelaciones.
Elanlisisdecorrespondenciasbuscaencontrardosmatrices(A,B)decoordenadascartesianas:
a1

a2 querepresentealospuntos
A =
filacon ai = (ai1 ,L , aih )
M

a
k

b1

b2
B=
M

b
m

querepresentealospuntos
columnacon b j = (b j1 ,L,b jh )

(generalmenteh=2)
HaydiversasformasdecalcularlasmatricesAyB,conocidascomonormalizaciones.Unaformamuy
utilizadaeslaconocidacomonormalizacinsimtricaocannica(ACC),quebuscasatisfacerqueel
productoescalar (ai .b j ) seaproporcionalalosresiduostipificados rij .
SantiagodelaFuenteFernndez

AnlisisdeCorrespondencias

Lanormalizacinsimtricaocannicadescomponelamatriz C = (rij ) envaloressingularescalculando


matricesUkxh,DyVmxh,conH=mnimo{k1,m1},talesqueC=UDV',siendoU'U=V'V=I,
D=diagonal{1,2,...,H}dondeivaloressingulares(i=1,...,H)
1/2

LasmatricesAyBsecalculanapartirdelasexpresiones A = Dk
Dk=diagonal{n1,n2,...,nk},Dm=diagonal{n1,n2,...,nm},

1/2

UD y B = Dm

VD con

INTERPRETACINBARICNTRICA:

k Nh
N ahj = 0 ( j = 1,L ,h)
h=1

m Nh
bhj = 0 ( j = 1,L,h)

h=1 N

( )j=1,L,m tendrnunamedia

Lospuntos (ai )i=1,L,k y bj


baricntricaigualalorigen.

m n

ih
j . aij = N bhj (i = 1,L,k) ( j = 1,L,H)
h=1 i

k n

hi
ahj (i = 1,L,m) ( j = 1,L,H)
j .bij =
h=1 Ni

Lascoordenadasdelospuntosfila(columna)son
mediasponderadasdelascoordenadasdelos
puntoscolumna(fila)salvounfactordadopor
losvaloressingulares,esdecir,lospuntosfila
(columna)son,salvounfactordedilatacin
(1/j),elbaricentrodelospuntoscolumna(fila).

INTERPRETACINRESULTADOS:

LaInerciaTotal(medidaanlogaalavariacintotalenelcasodelascomponentesprincipales)
cuantificaelgradodedependenciaentrelasvariables(X,Y):
IT =

2
H
H k
H m
1 k m (ni j ei j )
= h2 = Ni a2ih = N j b2jh

N i=1 j=1 e ij
h=1
h=1 i=1
h=1 j=1

ApartirdelaInerciaTotal(IT)secalculanlasproporcionesdeinerciaexplicadaparacadaunadelas
2i
queayudanaponderarlaimportanciadecadaunadelasdimensiones
dimensiones
IT i=1,L,H
cuandosetratedeexplicarlasdependenciasobservadas.
Lasproporcionesdeinerciaacumuladaexplicadaporlasisimasprimerasdimensiones
2
i i
permitendecidirelnmeromnimodedimensionesnecesarioparaexplicardichas

h=1 IT i=1,L,H
dependencias.
CONTRIBUCIONESTOTALES:Cuantificanlaimportanciadecadaunadelasmodalidadesdelas
variablesanalizadasenlaconstruccindelosejesfactorialesconstruidosporelanlisisde
correspondencias(ACC):

SantiagodelaFuenteFernndez

AnlisisdeCorrespondencias

Ni a2ih
Ni a2ih

=
=
contribuci
n
i
sima
fila
:
C
(
i
)

t
r
h2

Nj a2jh

j=1
k
m

C t (i) = C t ( j) = 1
i=1
j=1

N b2
N b2
contribucin i sima columna : C t ( j) = j jh = j jh
m
h2

Ni b2ih

i=1
Seutilizanparainterpretarelsignificadodelosejesutilizando,paracadaunodeellos,las
modalidadesconcontribucionesmsfuertes.
CONTRIBUCIONESRELATIVAS:Midenlaimportanciadecadafactorparaexplicarlaposicin(enel
diagramacartesiano)decadaunadelasmodalidadesdelasvariablesanalizadas,representandola
partedeladistanciaalorigendecoordenadas,explicadapordichofactor.Vienendadaspor:

a2
Cr (i) = H ih
contribucin relativa i sima fila :

a2il

l=1
k
m

=
=
C
(
i
)
C
(
j
)
1
r
r

i=1
j=1

b2jh
contribucin relativa i sima columna : Cr ( j) =
H

b2jl

l=1
Seutilizanparaanalizarlasproximidadesentrelospuntoshaciendohincapienaquellosfactores
cuyascontribucionesseanmselevadascuandosedeseaexplicardichasproximidades.
ELEMENTOSSUPLEMENTARIOS:Sonfilasocolumnasdelatabladecontingencianoutilizadasenel
clculodelosejesfactorialesperoque,unavezcalculadosstos,sesitaneneldiagramacartesiano
conelfindeayudarenlainterpretacindelosresultadosobtenidos.Suscoordenadassecalculan
utilizandolasrelacionesbaricntricasexistentesentrelospuntosfilaycolumna.

SantiagodelaFuenteFernndez

AnlisisdeCorrespondencias

ANLISISDECORRESPONDENCIASMLTIPLES

Seaplicaatablasdecontingenciasendondeporfilashay(n)individuosyporcolumnas(s)variables
categricascon (pi = 1, 2,L , s) mutuamenteexcluyentesyexhaustivas.
Latabladedatostienelaforma: Z = [Z1 , Z2 ,L , Zs ] ,
1 si el individuo i simo elige la mod alidad j
siendo Zi unamatriz (n.pi ) ,deformaque: zij =
0 si el individuo i simo no elige la mod alidad j
Elanlisisdecorrespondenciasmltiplessebasaenrealizarunanlisisdecorrespondenciassobrela
llamadamatrizdeBurt: B = Z' Z
LamatrizdeBurtseconstruyeporsuperposicindecajas.Enlosbloquesdiagonalesaparecen
matricesdiagonalesconteniendolasfrecuenciasmarginalesdecadaunadelasvariablesanalizadas.
Fueradeladiagonalaparecenlastablasdefrecuenciascruzadascorrespondientesatodaslas
combinaciones2a2delasvariablesanalizadas.

Setomancomodimensionesaquellascuyadistribucinalainerciasupera(1/p).

ACM:ANLISISFACTORIAL(AFC)DEUNATABLADISYUNTIVA

nindividuos
qvariablescualitativas
pkmodalidadesdelavariablek
q

p = pk total de columnas
k =1

Z = (z ij )

zi q pues hay q unos en la fila i sima

Mrgenes
z individuos que tienen mod alidad j sima
j
Matrizadiagonalizar: S =

SantiagodelaFuenteFernndez

1
z ij =
0

zij = nq
j

1
1
Z' Z D 1 = BD 1 con D = diagonal (z j )
q
q

AnlisisdeCorrespondencias

ACM:NUBEDEPUNTOS,PERFILES

Puntos(coordenadas):

zij
zi

zij

Tabla :

1
Z
q

z i q 1
=
=
nq nq n
Perfilesfila(individuos)
nq

Mtrica: diagonal
z
j
n p
2
2
2
Distancia : d (i, i' ) = (z ij z i' j )
q j =1
Peso:

Puntos(coordenadas):
Peso:
Perfilescolumna(modalidades)

zij
z j

z j
nq
nq
nq
= diagonal = diagonal (n)
q
z i

Mtrica: diagonal

Distancia2: d ( j, j') = n
2

j =1

Perfilesdefila: d (i, i' ) =


2

n p
n
(zij zi' j )2 =

q j=1
q

z ij z ij'

z j z j'

jMii' j

con Mii' : modalidadesquetienesolounindividuoioi'.


Msparecidossitienenmsmodalidadesencomn.

Perfilesdecolumna:
p

d2 ( j, j' ) = n
j=1

zij zij'
card [ individuos ( j, no j' )] + card [ individuos ( j' , no j)]
=n
z j . z j'
z j z j'
2

Entremsobjetostenganslounadejoj'mayoresladistancia.

INTERPRETACIN

Dosmodalidadesescogidasporlosmismosindividuoscoinciden
Dosindividuossoncercanossiescogenlasmismasmodalidades
Modalidadesconpocoefectivoestnalejadasdelcentrodegravedad

SantiagodelaFuenteFernndez

10

AnlisisdeCorrespondencias

ANLISISDECORRESPONDENCIASMLTIPLES(ACM):INERCIA

1
n

1
n

Centrodegravedaddenubedemodalidades: G = ,L,
p

d ( j, G) = n
2

j =1

p
zij 1
= n
j =1
z j n

zij 2 zij 1 n
+ 2 = 1
2
z
n
z
n z j

j
j

Ladistanciaesmayorsielefectivoespequeo.

Inerciadelamodalidadj: I( j) =

z j
nq

d2 ( j, G) =

zj n
z
1 = 1 1 j
q
nq z j
n

Haymayorinerciasielefectivoespequeo.

Inerciadelavariablek: I(k) =

pk
1 z 1
=
I
(
j
)
q 1 n j = q (pk 1)

j =1
j =1
pk

Lainerciacrececonelnmerodemodalidades.Si pk = 2 a mnimo

Inerciatotal: I =

1
q

I(k) = q (pk 1) = q (p q) = q 1
k

Notienesignificadoestadstico.

SOLUCINDEANLISISDECORRESPONDENCIASMLTIPLES

1
Z' Z D 1 u = u
q
1 1
1
factor

=
D
u

D Z ' Z =

Diagonalizacin:
q
En :
p

En n :

SantiagodelaFuenteFernndez

1 1
Z D Z' =
q

11

AnlisisdeCorrespondencias

=
D
Z'

Relacionesdetransicin:

1
= q Z

Relacionesbaricntricas:
P(i)modalidadesquetienei
I(j)modalidadesquetienej

j =

z ij

j =1 i

j =

1
q

jP(i)

n z
1
1
ij
i =
i = 1

zj
j =1 z j

jI( j)

INTERPRETACINANLISISCORRESPONDENCIASMLTIPLES

Proximidadentreindividuosentrminosdeparecido:Dosindividuosseparecensitienencasi
lasmismasmodalidades.Esdecir,dosindividuosestnprximossehanelegidoglobalmentelas
mismasmodalidades.

Proximidadentremodalidadesdevariablesdiferentesentrminosdeasociacin:Son
cercanospuestoqueglobalmenteestnpresentesenlosmismosindividuos.Esdecir,dos
modalidadesestnprximassihansidoelegidasglobalmenteporelmismoconjuntode
individuos.

Proximidadentremodalidadesdeunamismavariableentrminosdeparecido:(a)Son
excluyenteporconstruccin.(b)Sisoncercanasesporquelosindividuosquelasposeen
presentancasielmismocomportamientoenlasotrasvariables.

SantiagodelaFuenteFernndez

12

AnlisisdeCorrespondencias

Ejemplo:Sealatablaformadapor10individuosdeunaempresa,quesedistribuyensegnel
gnero,losaosenlaempresaylosingresosobtenidos:

Individuos
1
2
3
4
5
6
7
8
9
10

Gnero
Mujer
Mujer
Hombre
Mujer
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer

Aos
5
3
4
1
2
5
2
3
1
4

Ingreso
Medio
Alto
Bajo
Bajo
Medio
Alto
Medio
Bajo
Alto
Medio

Apartirdelatablaoriginalseconstruyelatabladisyuntiva(matrizZ)contantascolumnascomo
categoras:
Gnero
Mujer
Hombre
1
0
1
0
0
1
1
0
1
0
0
1
1
0
0
1
0
1
1
0

1
0
0
0
1
0
0
0
0
1
0

2
0
0
0
0
1
0
1
0
0
0

Aos
3
0
1
0
0
0
0
0
1
0
0

4
0
0
1
0
0
0
0
0
0
1

5
1
0
0
0
0
1
0
0
0
0

Ingresos
Bajo Medio
0
1
0
0
1
0
1
0
0
1
0
0
0
1
1
0
0
0
0
1

Alto
0
1
0
0
0
1
0
0
1
0

Enlatabladisyuntivacompleta(matrizZ),sihayalgunavariablecontinua,debetransformarseen
nominal,ordenndoseenintervalosalosquesedaunrangodevalores.

Lasfrecuenciasmarginalesdelaslneasdelatabladisyuntivacompletasonigualesalnmero
depreguntas(s),ylasfrecuenciasmarginalesdelascolumnascorrespondenalnmerode
sujetosquehanelegidolamodalidad(j)delapregunta(q),porloqueparacadasubtabla,el
nmerototaldeindividuosesn.

Enconsecuencia,siparanindividuossedisponederespuestasrespectoa,porejemplo,dos
variablesnominalesquetienenrespectivamentep1yp2modalidades,entoncesesequivalente
someteraunAnlisisdeCorrespondenciasSimpleslatabladecontingencia(p1,p2)yanalizarla
tablabinariadenlneasy(p1+p2)columnasquedescribelasrespuestas.

setiene,

SantiagodelaFuenteFernndez

13

AnlisisdeCorrespondencias

M
Gnero
H

1
2
3
Z = Aos
4
5
a
B
M
Ingresos
A
a

M
Gnero
H

1
2
3
Z' = Aos
4
5
a
B
M
Ingresos
A
a

Gnero
M H

Aos
1 2 3 4 5

Ingresos
B M A

1
1
0

0
0
1

1
1
0
1
0
0
1

0
0
1
0
1
1
0

0 0 0 0 1
0 0 1 0 0
0 0 0 1 0
1 0 0 0 0
0 1 0 0 0
0 0 0 0 1
0 1 0 0 0
0 0 1 0 0
1 0 0 0 0
0 0 0 1 0

0 1 0
0 0 1

1 0 0

1 0 0
0 1 0

0 0 1
0 1 0

1 0 0
0 0 1

0 1 0

Gnero
M H

Aos
1 2 3 4 5

Ingresos
B M A

1
0

0
0

0
1

0
1

1
0
0
0
1
0
0
0

0
1
0
0
0
1
0
1

0
1

0 0 1 0 1
0 0 0 1 0

1
0
1
0
0
0
0
1

1
0
0
1
0
0
0
0

0
1
0
0
0
0
1
0

1
0
0
1
0
0
0
0

0 0 1

0 1 0

0
1
0
0
1
0
0
1

0
1
1
0
0
0
0
0

1
0
0
0
0
1
0
0

RelacionandocadavariablecontodaslasdemslatabladisyuntivaseconvierteaunatabladeBurt
quecontienetodaslastablasdecontingenciasimplesentrelasvariables(cruzadasdosados).
ApartirdelatabladisyuntivacompletasepuedeconstruirlatabladecontingenciadeBurt(B),que
esunatablasimtricadeorden(p,p): B = Z'. Z
Besunayuxtaposicindetablasdecontingenciayestformadades2bloquesdelaforma:

Cadabloqueesunasubmatrizformadaportablas
decontingenciadelasvariablesdosados,salvo
losbloquesqueseestnenladiagonalquesonlas
tablasdecontingenciadecadavariableconsigo
misma.

SantiagodelaFuenteFernndez

14

AnlisisdeCorrespondencias

conlocual,

LatabladisyuntivacompletaesequivalentealatabladeBurtyambosproducenlosmismos
factores.
ConlatabladeBurtsepodrnobtenerlaspuntuaciones(distanciasalcentrodegravedad),
contribucionesabsolutasdecadamodalidadyvariablealosejesofactoresobtenidos(contribucin
decadamodalidadovariablealainerciadelosnuevosejes)ycontribucionesrelativaso
correlacionesdecadamodalidadconlosnuevosejes.
ComoenlatabladeBurtlasfilasylascolumnasrepresentanlasmismasmodalidades,elestudiode
ambasofreceigualesresultados,porloquesloserepresentanlosdelasfilas.
ParalaresolucinenelSPSS(Analizar/Reduccindedatos/Escalonamientoptimo),enprimer
lugarhayqueintroducirlosdatosdelamismaformaqueenelanlisisdecorrespondenciassimples,
creandoportantotresvariables.Lasdosprimerascorrespondenalosrangosdetodaslas
modalidadesy,enlatercera,seincluirnlasfrecuenciasconjuntasdelosparesdemodalidades,las
cualesfuncionarncomoponderaciones.
EXAMENDELOSPUNTOS:

Lasdistanciasdelasmodalidades,mientrasmsalejadasseencuentrendelorigen,mejor
representadosestarn.Cuantomsalejadasestnlasmodalidadesentresenelgrficomenor
asociacinexistirentreellasycuantomscercanas,msasociacinexistirentreellas.

Lacontribucindelospuntosalainerciadecadadimensinocontribucindecadaunadelas
filasalainerciaovarianzaexplicadaencadaunodelosejesconsiderados

Lacontribucindelasdimensionesalainerciadecadapunto.Serefierealacorrelacin
existenteentrecadaunodeloscaracteresylosnuevosejes.

SantiagodelaFuenteFernndez

15

AnlisisdeCorrespondencias

LGICADELANLISISDECORRESPONDENCIAS(AC)
Antesdecomenzarconunaexposicindetalladaconvieneprecisarqueelobjetivoenestudioesla
utilidadprcticaeinterpretativaquesederivadesuaplicacin.Partiendodeestaconcepcinse
tratademostrarlalgicadelanlisisdecorrespondenciasutilizandounejemplodeunasupuesta
investigacincomercial.
Unfabricantedeproductodelimpiezadeseaconocerlascaractersticasmsimportantesdecada
unodesusproductos,paraellorealizaunaencuestaentresusclientes.Latablaadjuntamuestralas
frecuenciasdeasociacindecadaproductoconlascaractersticasanalizadas.

Conelobjetivodeconocerlarelacinentrelosproductosylascaractersticaselanlisisde
correspondenciasconviertelatabladecontingenciaendosnubesdepuntosdepuntosfilay
columna,paraposteriormenterealizarunarepresentacindecadanubequepermitadetectarlas
relacionesentrelasfilas(productos),lascolumnas(caractersticas)yfilasycolumnas
conjuntamente.
Pararealizarestoelanlisisdecorrespondenciasnotrabajadirectamenteconlosdatosdelatabla,
puestoquesuobjetivonoesdetectarlasdiferenciasabsolutasexistentesentrelasvaloracionesde
cadaproducto,sinoquerealizaunastransformacionesdelosdatosylosconvierteenperfilesdefilas
ycolumnas.
Losperfilesdefilasecalculandividiendoelnmerodepersonasqueeligenunadeterminada
caractersticadeunproductoentretodoslosqueutilizaneseproducto,obteniendoladistribucin
condicionaldelascaractersticas(columnas)dentrodecadafila(producto):<<delas275personas
queutilizaronelproductoA,68consideranquedejalasuperficiebrillante,elratio(68/275=0,274)
proporcionaunperfilde0,274.Elratio(205/883=0,232)proporcionaelperfilmediodebrillode
0,232.

Anlogamente,losperfilesdecolumna.Enestecaso,delas205eleccionesrecibidas,68
correspondenalproductoA:elratio(68/205=0,332)proporcionaunperfilcolumnade0,332

SantiagodelaFuenteFernndez

16

AnlisisdeCorrespondencias

Cuandodosproductostienenvariascaractersticasenlamismaproporcin,poseenelmismoperfil,
seconsideransimilares(productosAyC).Lomismosucedeconlascaractersticas(columnas).
Frentealasencillezdelalecturabasadaenlosperfiles,losvaloresabsolutospresentanmayor
complicacin.
Laproblemticadelosnmerosabsolutosconsisteenquelosproductosmuyutilizadosconsiguen
numerosaseleccionesentodaslasceldillas(productoC),mientrasquelosproductospocosutilizados
tienenceldasconvaloresreducidos(productoB).
Alcalcularlasdiferenciasentrelosproductosutilizandolosvaloresabsolutoselresultadoobtenido
plasmaladiferenciaenteladistribucindelascaractersticas,unidaaladiferenciaentreelnmero
deeleccionesdecadaproducto.Estoes,elmayornmerodeeleccionesdelproductoCdificulta
realizarunacorrectacomparacinconelproductoA.
Enestesentido,elobjetivodelanlisisdecorrespondenciasnoesdetectarlasdiferenciasabsolutas
entrelasvaloracionesdelosproductos.
Habiendodetectadocmotrabajarconperfilesfacilitalainterpretacin,hayqueprevenirno
producirunavisinequivocadadelarelacinentrevariablesenlamedidaquetodoslospuntos
tienenlamismaimportancia:losmarginalesdelosperfilesdefilaycolumnasonigualesa1.
Paraevitaresteproblemaelanlisisdecorrespondenciasdebeutilizarunadistanciaquenoolvide
lasdiferenciasentrelosefectivosdecadalnea(ocolumna).
Ladistanciachicuadradocumpleestacondicin,alponderarcadaperfilporunpeso.Ascadafila(o
columna)estponderadaporunpesoproporcionalasuimportanciarealenelconjunto,peso
conocidocomomasa.Alconsiderarcadapuntoconunamasaproporcionalasufrecuenciaseevita
privilegiarlascategorasconpocosefectivos.
Dehecho,setratadeunadistanciaeucldeaponderadaporelinversodelamasadelascolumnas
cuandosemideladistanciaentrefilas,oporlamasadelasfilasparaladistanciaentrelascolumnas.
Ladistanciachicuadradocumpletambinelprincipiodeequivalenciadistribucional,quepostula
quesidoscategorastienenperfilesidnticospuedensersustituidasporunasolacategoraquesea
lasumadesuspesos,sinqueconellosemodifiqueladistanciaentrelasfilasocolumnas.
Estapropiedadgarantizalaestabilidaddelosresultadosconindependenciadelacodificacindelas
variables,demodoqueesposibleagruparcategorasquetienenperfilescoincidentestantoporfilas
comoporcolumnas.Sielresultadosemantieneestabletrasunircategoras,deigualformaestos
resultadosnomejoranalrealizarmssubdivisionesdecategorashomogneas.
Conlosperfilesdefilaycolumnaseelaboralamatrizdecoordenadas(distancias)utilizandola
distanciachicuadrado,quepermitircalibrarlamagnituddeladiferenciaentrelatabladedatos
analizadayunatabladedatossinrelacinentrelasvariables.
Lasdistanciasnosemidenentredosfilasodoscolumnassinoconrelacinalperfilmediodefilaso
columnaso,dichodeotramanera,conrelacinalpromediodelascoordenadasdeesafila(o
columna)ponderadaporsumasa.Esteperfilmedioaparecesituadoenelorigendecoordenadasyse
leconocecomocentrodegravedad.
SantiagodelaFuenteFernndez

17

AnlisisdeCorrespondencias

Lamediadelasdistanciasalcuadradodecadapuntodefilaalcentrodegravedadseconocecomo
inerciadefilas,oinerciadecolumnascuandosetratadelascolumnas,einerciatotaldelanubede
puntoscuandoseconsiderantodosloselementosdelatabla.
Unainerciabajasignificaquetodoslospuntosestnsituadosmuycercadelcentrodegravedady
queportantosonmuysimilares;mientrasquealtosvaloresdelainerciaendeterminadascategoras
implicangrandesdiferenciasdelperfilmediodelasfilasolascolumnas.
Posteriormenteseprocedeadiagonalizarlamatrizdevarianzacovarianzaconelfindeextraerlos
vectoresyvalorespropiosquedefinirnlosnuevosejessobrelosqueserproyectadalanubede
puntos.Cuandolacantidaddeinerciaexplicadaconlosprimerosfactoresseaaltabastar
seleccionarunpequeonmerodeestos(tanslodosotres)yrepresentarlanubedepuntossobre
grficosdedosotresdimensiones,obteniendoasunavisinsimplificadadelasrelaciones.
Trabajarconperfilesdefila(paracompararlasdistribucionesdelascaractersticasencadaproducto)
yconperfilesdecolumna(paracompararcmosedistribuyecadacaractersticaenlosproductos)
precisadedosanlisisdiferentes:unosobrelosperfilesdefilasyotrossobrelosperfilesde
columnas,puestoqueseconsideransimtricoslospapelesdelasfilasydelascolumnas.
Alrealizarestosanlisisesposibleutilizarunasfrmulasquerelacionanaambasdimensiones,
conocidascomofrmulasdetransicin,quepermitenobtenerlascoordenadasfactorialesdelotro
conjuntosinnecesidaddeunanuevadiagonalizacin.
Ademsdelahorrodetiempoqueestosuponealreducirlosclculosaunasolafactorizacin,estas
relacionespermitenrepresentarsobreunmismoplanolospuntosdefilaycolumna,permitiendoas
interpretarladistanciadeunpuntoaotro.Dehecho,unadelasgrandesventajasdelanlisisde
correspondenciaseslafacilidadparasacarconclusionesbasndoseenlainterpretacingrfica.
Debeconsiderarsequelosfactoresodimensionesextradasnoexplicanlatotalidaddelainercia,ni
tampococadaunadeellasaportanlomismo;deformaquesernecesarioextraerunnmerode
factoresqueexpliquenunporcentajeelevadodelavariabilidadtotal,altiempoquedeber
interpretarsecadaunoenrelacinconlacantidaddeinerciaexplicada.Elanlisisdelas
contribucionesabsolutasyrelativasindicarlasmodalidadesmsrelacionadasconcadafactor,
mientrasqueelsignodelascoordenadassituarncadacategoraenunapartedelfactor.
Lacontribucinabsolutaexpresalaaportacindeunelementoalainerciaexplicadaporelfactor,
mientrasquelacontribucinrelativarecogelacontribucindeunfactoralaexplicacindeunafilao
columna.
PROCESOINTERPRETACINDELGRFICO:
1. Localizacindelasmodalidadesconmayorescontribucionesabsolutas,diferenciandomediante
elsignodelascoordenadaslasquesesitanenelladopositivoyenelladonegativodelfactor.
2. Anlisisdelacalidadderepresentacin(contribucinrelativa)delrestodemodalidades.Cuando
unamodalidadtieneunabajacontribucinrelativaesprobablequeestmuyrelacionadacon
otrofactor,demodoqueparasuestudioserconvenienteconsiderar,sinolatotalidaddelos
ejes,almenosunnmeroelevadodestos.
3. Bsquedadeaquellasmodalidadesque,aunquenocontribuyenalaformacindelfactor,se
encuentranbienrepresentadas.Estasmodalidadessonilustrativasdelasignificacindela
dimensin.
4. Considerandotodosestoselementosseprocedeconladenominacindecadafactor,analizando
porseparadolavariablefilaycolumna.
SantiagodelaFuenteFernndez

18

AnlisisdeCorrespondencias

5. Seprocedealanlisisgrficoconelfindedetectarsimilitudesentrelasmodalidadesdefila(o
columna).Respectoalasituacindelasmodalidadesenelgrficohayqueprecisarqueenel
origendecoordenadasseencuentranlascategorassimilaresalamediadelasfilas(ocolumnas),
quesonlasquetienenmenortasadeinercia,yportantolasquemenosaportanenladefinicin
decadadimensin.Porotraparte,lasmodalidadesmsalejadasdelorigensecaracterizanpor
sugrancontribucinenladefinicindecadafactor.Enelejemplodelosproductosdelimpieza,
sidosfilas(productos)tienencaractersticassemejantessesituarnprximasunadelaotraenel
planodecoordenadas.Lamismaconsideracinseutilizaparainterpretarlascaractersticas
(columnas)prximas.Resumiendo,mayoromenorproximidadentrelasmodalidadesenelplano
equivaleamayoromenorgradoderelacinointerdependenciaentrelasmismas.
6. Interpretacinconjuntadeambasvariables.Generalmente,pudedecirsequedosmodalidades
defilaycolumnaconunasituacincercanaenelgrficoestnindicandoasociacinentreellas,
muchomscuandoseencuentranlejosdelcentrodegravedad.
7. Proyeccindemodalidadesilustrativasosuplementarias.Lainterpretacindelanlisispuede
enriquecerseconlarepresentacingrficadelasmodalidadessuplementarias,elementosqueno
participanenladefinicindelosejesperoqueseproyectansobreelgrficoobtenido.
Hastaestemomentoelanlisissehacentradoenunatablabidimensional,aunqueelefectoprctico
yeficaciadelanlisisdecorrespondenciasaumentacuandosetrabajacongrandestablasdedatos.
Sealarqueelanlisisdecorrespondencias,ensuformatomssimple,trataderepresentardos
variablescualitativasqueformanpartedeunatabladecontingencia,aunqueexisteuna
generalizacindelanlisisdecorrespondenciasparamsdedosvariablescategricasquerecibeel
nombredeanlisisdecorrespondenciasmltiples.
Lalgicadelanlisisyelprocesodeclculoessimilarenambos,demodoqueseanotanaqulos
aspectosdiferenciadosdelanlisisdecorrespondenciasmltiples:

Enelanlisisdecorrespondenciasmltipleslosvalorespropiosgeneranunaideapesimistadela
variabilidadexplicada,siendoconvenientemedirlatasadeinerciarealizandounamodificacin
destosutilizandolacorreccindeBenzcri(1979):
1.
2.
3.
4.

CalcularB=1/Q,siendoQelnmerodevariables.
Seleccionarlosvalorespropios(VP)igualesosuperioresaB.
Calcularlosvalorespropiostransformados(VPT): VPT = (VP B)2 .
Calcularelporcentajedevarianzaexplicada(VPE)conlosvalorespropiostransformados.
Cadavalorpropiotieneunatasadeinerciasobreeltotaldevarianzaexplicadaportodoslos
ValoresPropiostransformados.
5. Calcularelporcentajeacumuladodevarianzaexplicada.

Lapartedeinerciadebidaaunamodalidadderespuestaaumentacuantomenorseaelnmero
depersonasdeestamodalidad,cuantomenorseasumasa.Porelloesconvenientenointroducir
enelanlisislasmodalidadesconescasonmeroderespuestas,ydehechoalgunosprogramas
estadsticoseliminanlasmodalidadesconunnmeroderespuestasinferioral2%delamuestra.

Lapartedeinerciaproducidaporunavariableaumentacuantomayorseaelnmerodeopciones
derespuesta,demodoquedebeprocurarsequelasvariablestenganunnmerohomogneode
categoras.

SantiagodelaFuenteFernndez

19

AnlisisdeCorrespondencias

Elpuntodepartidaesunatabladisyuntivacompletadondelascategorasderespuestadeuna
preguntaseexcluyenmutuamente,yunanicamodalidadesescogidaobligatoriamenteporel
encuestado(ounidadconlaquesetrabaje).
Enestatabla,lasfilasestnformadasporlosindividuosencuestados,ylascolumnasporcada
unadelascategorasdelasvariablessometidasalanlisis,demodoquecadaceldaestformada
porun1cuandoelindividuoposeeunacaracterstica,yun0cuandonoesas.
TABLAORIGINAL
P1
1
2
3
2
1
3

n1
n2
n3
n4
n5
n6

P2
1
2
1
3
2
2

P3
1
1
2
1
2
2

Enlatablaoriginalpresentadasehadejadounanicacolumnaparalascategorasdecada
pregunta,mientrasquelatabladisyuntivatantascolumnascomocategoras.
Aslasrespuestasdelsegundosujeto(2,2,1)soncodificadasenlatabladisyuntivacomo(0,1,0)
enP1,(0,1,0)enP2,y(1,0)enP3.
TABLADISYUNTIVACOMPLETA
Categoras
n1
n2
n3
n4
n5
n6
Total

1
1
0
0
0
1
0
2

P1
2
0
1
0
1
0
0
2

3
0
0
1
0
0
1
2

1
1
0
1
0
0
0
2

P2
2
0
1
0
0
1
1
2

P3
3
0
0
0
1
0
0
2

1
1
1
0
1
0
0
2

2
0
0
1
0
1
1
2

Total
3
3
3
3
3
3

Relacionandocadavariablecontodaslasdemslatabladisyuntivaseconvierteaunatablade
Burtquecontienetodaslastablasdecontingenciasimplesentrelasvariables(cruzadasdosa
dos).
TABLADEBURT
categoras
n1
n2
n3

1
2
0
0

P1
2
0
2
0

P2

n1
n2
n3

1
1
0

0
1
1

1
1
0

2
0
0

0
3
0

0
0
1

1
1
1

1
2
0

P3

n1
n2

1
1

2
0

0
2

1
1

1
2

1
0

3
0

0
3

P1

SantiagodelaFuenteFernndez

3
0
0
2

1
1
0
1

P2
2
1
1
1

P3
3
0
1
0

1
1
2
0

2
1
0
2

20

AnlisisdeCorrespondencias

Elvalor2delaesquinasuperiorizquierdasonlaspersonasquehanelegidoelvalor1enP1
(pregunta1).Enlasdosprimerastablasestaspersonashansidoidentificadasconn1yn5.

Enlapregunta2(P2),el1delaizquierdarepresentaalapersonaquehaelegido1enP1yel1
enP2,setratadelapersonan1.

Enlapregunta2,el1delcentroesel1queeligiel1enP1yel2enP",personan5.

Enlapregunta2,el1delasegundalnearepresentaalapersonaquehaelegido2enP1y3en
P2,identificadaconn4.

otambin:
TABLADISYUNTIVACOMPLETA
Categoras
n1
n2
n3
n4
n5
n6
Total
P1
1 2 3
1
0

0
Z=
0
1

0
1
0
1
0
0

1
0

Z' . Z = 1
0

0
0
1
0
0
1

0 0
1 0
0 1
0 1
1 0
0 0
1 0
0 1

P1
2
0
1
0
1
0
0
2

1
1
0
0
0
1
0
2

3
0
0
1
0
0
1
2

P2
1 2 3

P3
1 2

1
0
1
0
0
0

1
1
0
1
0
0

0
1
0
0
1
1

0
0
0
1
0
0

0 1 0
1 0 0

0 0 1

0 0 0
0 1 1

1 0 0

1 0 0

0 1 1

SantiagodelaFuenteFernndez

1
0

0
1

0
0

0
1

1
1
0
1
0
0
0
2
1
0

Z' = 1
0

P2
2
0
1
0
0
1
1
2
0 0
1 0
0 1
0 1
1 0
0 0
1 0
0 1

0 0

1 0 0

1 0

0 1 0

0 1

1 0 0

1 0

0 0 1

0 0

0 1 0

0 1

0 1 0

P3
3
0
0
0
1
0
0
2

1
1
1
0
1
0
0
2

2
0
0
1
0
1
1
2

Total
3
3
3
3
3
3

0 1 0
1 0 0

0 0 1

0 0 0
0 1 1

1 0 0

1 0 0

0 1 1

1 0
1 0

0 1
=
1 0
0 1

0 1

21

AnlisisdeCorrespondencias

LatabladisyuntivacompletaesequivalentealatabladeBurtyambosproducenlosmismos
factores.

SantiagodelaFuenteFernndez

22

AnlisisdeCorrespondencias

Ejemplo1.Lossiguientesdatoscorrespondenaladistribucindelnmerodeparadosdetres
provinciasdeCastillaLenenelao2005clasificadosporSexo,ProvinciayNiveldeEstudios.

PRIMERANLISISDELAINFORMACIN:Secomienzaconunanlisisunivariadodelasvariables
consideradas,conlafinalidaddeidentificardeterminadospatronesdecomportamiento.
Sesolicitanlosporcentajesdefilaycolumna:

Alcompararlosporcentajesdefilaseobservaqueun9,8%delosHombresdeAvilaparados
tienenunniveldeestudiosprimario(cifraquecontrastaalacorrespondientedistribucin
marginalenlaquenicamenteun2%delosparadosposeendichoniveldeestudios),mientras
queenMujeresdeSoriaparadasun0,8%tienenestudiosprimarios.

Alcompararlosporcentajescolumna,porejemplo,seobservaqueun16,9%delosparadoscon
unniveldeestudiosprimariosonHombresdevila(ciframuchomselevadaquela
correspondientealadistribucinmarginalenlaquetansloun3,4%sonHombresdevila).

Parainterpretarelinteriordelatabla,desdeunpuntodevistaprctico,esmssencilloutilizarlos
residuosestandarizadoscorregidos.

SantiagodelaFuenteFernndez

23

AnlisisdeCorrespondencias

Enlosresiduosestandarizadoscorregidoslamayorpartesonmayoresque2envalorabsoluto(aun
niveldel95%deconfianza,residuosconunvalorabsolutomayorque2seconsiderancomovalores
anormalmentealtos).
Observando,adems,elpatrndelossignos:

Losresiduospositivosparaloshombrestiendenasituarseenlosnivelesdeestudiosmsbajos
(estudiosprimariosycertificadoescolar)yparalasmujeresenlosnivelesdeestudiossuperiores
(graduadoescolar,bachilleratoydiplomadosentodaslasprovincias;formacinprofesionalen
BurgosySoria,yuniversitarioenSoria).

El p _ value = 0,000 < 0,05 conloqueserechaza


lahiptesisnula,concluyendoquelospatrones
deparosondistintossegnelsexoprovinciade
residencia.

REDUCIRDATOS/ANLISISDECORRESPONDENCIAS:

SantiagodelaFuenteFernndez

24

AnlisisdeCorrespondencias

EnlaparteinferiordelcuadrodedilogoaparecenunaseriedeRestriccionesparalascategorasque
permitenunirlascategorasodefinirunacategoracomosuplementaria.Lareduccindelnmero
decategorasactivasqueseoriginaalunircategorasodefinirdeterminadascategorascomo
suplementariasestsujetaaciertasrestricciones:(a)elnmeromximodecategorasquepueden
unirseequivalealtotaldecategorasmenos1.(b)elnmeromximodecategorassuplementarias
eseltotaldecategorasmenos2.

ElsubmenModeloseencuentradivididoencuatro
partes(nmerodedimensiones,medidade
distancia,mtododeestandarizaciny
normalizacin)

Dimensionesenlasolucin:Nmerodedimensionesnecesariasparaexplicarlamayorpartedela
variacin.Elnmeromximodefactoresesigualalnmerodefilasmenos1(oaldecolumnas
menos1),elqueseamenor.Enesteejemplo,condosvariables,respectivamente,con6y7
categorascadavariable,elnmeromximoser(61=5).Sinembargo,elinvestigadordeber
especificarelmenornmerodefactoresparaexplicarelmximodeinercia,buscandosiempreel
equilibrioentreparsimoniaeinterpretabilidad.

Aunquepordefectoelprogramaselecciona2dimensiones,cuandoserealizaelprimeranlisisdeun
conjuntodedatosesconvenientesolicitarunnmeroelevadodedimensiones,conelfindeexplicar
unaltoporcentajedeinercia,ydisponerasdelamximainformacinparadecidirla
dimensionalidadadecuada.
Medidasdedistancia:Entrelasfilasylascolumnas,sepuedenmedirentredosmedidas:

Distanciachicuadrado:Lasmodalidadesseponderanenfuncindelamasadelasfilaso
columnas.Utilizadaparaelanlisisdecorrespondenciasestndar.

SantiagodelaFuenteFernndez

25

AnlisisdeCorrespondencias

Distanciaeucldea:Razcuadradadelasumacuadrticadelasdiferenciasentreparesdefilasy
entreparesdecolumnas.JoaristiyLizasoaindesaconsejanlautilizacindeestadiferencia
porqueconsideraatodosloselementosconelmismopeso,llegandoadesvirtuarelanlisisde
correspondencias.

Mtododeestandarizacin:Cuandoserealizaladistanciachicuadradoelprogramacentralas
filasylascolumnasalpresentarnicamentelaopcinSeeliminanlasmediasdefilasy
columnas.Conladistanciaeucldeaseactivantodaslasopcionesdisponibles.

Mtododenormalizacin:Lanormalizacinseutilizaparadistribuirlainerciadelatablapor
filasy/ocolumnas,demodoqueelmtodoelegidonicamenteafectaralaspuntuacionesya
lasvarianzasdelasfilasycolumnas.Elrestoderesultadosnocambian(autovalores,inercia
explicadaporcadafactoryelporcentajedeinerciaexplicada).ElSPSScontemplacincomtodos
dedistribucindeinercia:
) Simtrico(cannico):Encadadimensinlaspuntuacionesdefilasonelpromedioponderado
delaspuntuacionesdecolumnadivididasporelautovalorcorrespondiente,mientrasquelas
puntuacionesdecolumnasonelpromedioponderadodelaspuntuacionesdefiladivididas
porelautovalor.Seaconsejautilizarestemtodocuandosedeseanexaminarlasdiferencias
(osimilitudes)entrelasdosvariables.Eselmtodoelegidoparanuestroejemplo.
) Principalporfila:Laspuntuacionesdelafilasonlamediaponderadadelapuntuacindelas
columnas,maximizandoaslasdistanciasentrelascategorasdelavariablefila.Mtodo
aconsejablecuandoelobjetivoesanalizarlasdiferenciasentrelascategorasdelavariable
situadaenlasfilas.
) Principalporcolumna:Cuandoelobjetivoesanalizarlasdiferenciasosimilitudesentrelas
categorasdelavariablecolumnaseutilizaestemtodo,queconsideralaspuntuacionesde
lascolumnascomolamediaponderadadelapuntuacindelasfilas,llegandoasamaximizar
lasdistanciasentrelascolumnas.
) Principal:Lasdistanciasobtenidasconestemtodorepresentanladistanciaexistenteentre
cadafila(ocolumna)aladistanciapromediodelperfilfila(ocolumnas).Estemtodose
utilizacuandosedeseanexaminarlasdiferenciasentrelascategorasdelavariablefilaylas
diferenciasentrelascategorasdelavariablecolumna,peronolasdiferenciasentre
variables.ConestemtodonoesposiblerepresentarelDiagramadedispersinbiespacial
(submenEstadsticos).
) Personalizado:Introduciendounvalorentre1y1enlaventanasituadaaladerechadeesta
opcin.Elvalor1realizaunanlisisprincipalporcolumna,el1unanlisisprincipalporfila,y
el0unanlisissimtrico.Dentrodeestoslimites,elvalorelegidodispersarlainerciasobre
laspuntuacionesdefilaocolumnaengradosdiversos.Unadelasventajasdeestemtodoes
quepermitecreardiagramasdedispersinbiespacialesamedida.

ElsubmenEstadsticosseencuentranvarias
opciones.

SantiagodelaFuenteFernndez

26

AnlisisdeCorrespondencias

Tabladecorrespondencias:Muestraunatabladecontingenciadelasvariablesdeentrada
(ficherodedatos),incluyendoelnmerodecasosencadaceldaylostotalesmarginalesdefilay
columna.

Inspeccindelospuntosdelafila:Paracadacategoradelavariablefilasemuestranlasmasas,
puntuaciones,inercia,contribucinabsoluta(contribucindeladimensinalainercia)y
relativa(contribucindeladimensinalainerciadelpunto).

Inspeccindelospuntosdecolumna:Masas,puntuaciones,inercia,contribucindela
dimensinalainercia(contribucinabsoluta)ycontribucindeladimensinalainerciadel
punto(contribucinrelativa)paracadacategoradelavariablesituadaenlacolumna.

Permutacionesdelatabladecorrespondencias:Realizaunaordenacindelatablade
correspondenciassituandolasfilasylascolumnasenordenascendenteenfuncindelas
puntuacionesdelaprimeradimensin.Esposiblerepresentarelrestodedimensiones
colocandounnmeroenlaventanaDimensinmximaparalaspermutaciones,alrealizarlose
generaunatablapermutadaparacadadimensin,desdelaprimerahastaelnmero
especificado.

Perfilesdefila:Proporcindecadacategoraconrelacinalmarginaldefila.

Perfilesdecolumna:Proporcindecadacategoraconrelacinalmarginaldecolumna.

Estadsticosdeconfianzaparapuntosdefila:Desviacintpicaycorrelacionesparalospuntos
defilaactivos.

Estadsticosdeconfianzaparapuntosdecolumna:Desviacintpicaycorrelacionesparalos
puntosdecolumnaactivos.

ElsubmenGrficos:

SantiagodelaFuenteFernndez

Diagramadedispersinbiespacial:Grficode
dispersinconlaspuntuacionesdefilay
columna.Sealarquenoesposiblerepresentar
estegrficocuandoseutilizaelmtodode
normalizacinprincipal.

Puntosdefila:Grficodedispersinconlas
puntuacionesdelafila.

Puntosdecolumna:Grficodedispersincon
laspuntuacionesdelacolumna.

27

AnlisisdeCorrespondencias

Grficosdelnea:Generanungrficoparacadadimensindelavariableseleccionada.
) Categoradefilatransformadas:Representacingrficadelascoordenadasdelavariable
fila.
) Categoradecolumnatransformadas:Representalosvaloresdelavariablecolocadaenla
columna.

Todaslassolucionesgrficaspermitendelimitarelnmerodecaracteresdelasetiquetasdevalor
quesernutilizadasenlarepresentacingrfica(AnchodeetiquetadeIDparadiagramasde
dispersinoparagrficosdelneas).Aunqueelprogramapermiteutilizarhasta20caracteres,se
aconsejautilizarcuatroocincoparafacilitarlaclaridadeinterpretacindelgrfico.

EnlatablasemuestranlascontribucionesdecadaunadelasH=mnimo{61,71}dimensiones
calculadasalainerciatotal.
Laprimeradimensincontribuyecon0,825(82,5%)adichainercia,ylasdosprimerasdimensiones
contribuyenconun96,9%,mientrasquelastresprimerasdimensionescontribuyenaun98,9%,por
loqueseconcluyequelasdependenciasobservadasenlatablavienenadecuadamentecapturadas
porlas2primerasdimensiones.

Elanlisisdelascontribucionesrelativadelexamendelospuntosdefila,reflejaunaelevada
representatividad,convalorescercanosalaunidadenlaltimacolumna,delascategorasenlos
factores.
Enlatabladeexamendelospuntosfila(primerfactor):HombresdeBurgostieneunapuntuacinde
(0,781)yHombresdeAvila(1,235),respectivamente,contribuyenasuinerciaconunapuntuacin
SantiagodelaFuenteFernndez

28

AnlisisdeCorrespondencias

de(0,143)y(0,236).Enlapartepositivadelprimerfactorseencuentranlasmujeres,esdecir,el
primerfactordiscriminaporsexos.

Enelexamendelospuntosfila(segundofactor):discriminaseparando,esencialmenteaHombresde
Avilaconunapuntuacinde(1,082)yaHombresdeSoria(0,290).Lospuntosquemscontribuyen
asuinerciason,consecuentemente,lospuntosfiladeHombresAvila(0,433)yHombresSoria
(0,295).
Porotraparte,elsegundofactortieneunacontribucinrelativaalainercianadadespreciabledelos
puntosfiladeAvila(hombresymujeres),MujeresdeBurgosyHombresdeSoria.

SantiagodelaFuenteFernndez

29

AnlisisdeCorrespondencias

Enlafiguraadjuntaseobservaquelaprimeradimensindiscriminaporsexos.Lasegundadimensin
discriminaporprovinciasseparando,especialmenteaviladeSoria.

Enlatablasemuestralamasa(pesoproporcionalasuimportanciaenelconjunto)decadacolumna,
lascoordenadasdelascolumnasenlosfactores,lacontribucindecadacolumnaalainerciatotal,
lascontribucionesabsolutasyrelativas.

SantiagodelaFuenteFernndez

30

AnlisisdeCorrespondencias

Elprimerfactordiscriminalosnivelesdeestudiomsbajosprimaria(0,253)ycertificadoescolar
(0,398)frentealresto,siendostasmodalidadesjuntoaladediplomados(0,178)lasquems
contribuyenasuinercia.Deotraparte,elprimerfactoreselquemscontribuyealainerciade
todoslosperfilesdecolumna.

Elsegundofactorseparaelperfilcorrespondientealniveldeestudiosdeprimaria(0,600)delresto
delosniveles.Destacarqueelsegundofactortieneunacontribucinrelativanadadespreciableala
inerciadelosquetienenestudiosdeprimaria(0,291)yestudiosdeformacinprofesional(0,235).

SantiagodelaFuenteFernndez

31

AnlisisdeCorrespondencias

Porltimosepresentaungrficoconjuntodelospuntoscorrespondientesalosperfiles
condicionalesdefilaycolumna:

Seobservaquelaprimeradimensindiscriminaentresexosdebidoalatendenciaahaberms
paradosvaronesenlosnivelesdeestudiosmsbajos(estudiosprimariosycertificadoescolaridad)y
msparadosmujeresenelrestodelosniveles.Estehechodemanifiestoanalizandolasrelaciones
deproximidadyalejamientodelospuntosfilaycolumna.

SantiagodelaFuenteFernndez

32

AnlisisdeCorrespondencias

As,porejemplo,lacercanaentrelospuntosfilaHombresdevilaycolumnaEstudiosPrimarioses
debidaalatendenciaenambosperfilesatenermayornmerodeparadosdelamodalidad
representadaporelotroperfil.
Tambinseobservaquelasegundadimensinponedemanifiestolaasociacinpositivaexistente
entrelascategoras(MujerdeBurgosyMujerdevilayDiplomado)ylasde(MujerdeSoriay
Universitario)mostrandounaespecializacineneltipodeparoexistenteenlasmujeresde
CastillaLen.
EnMujeresdeBurgosyvilatiendeahabermayoresnivelesdeparorelativoenDiplomado,
mientrasqueenMujeresdeSoriahaymayorniveldeparorelativoenUniversitario.

SantiagodelaFuenteFernndez

33

AnlisisdeCorrespondencias

Ejemplo2.EnlatablaadjuntasepresentalaEncuestadePresupuestosFamiliaresduranteel
perodo19901991,realizadoenladistintasComunidadesAutnomasespaolas.Enlasfilasse
recogencadaComunidadAutnoma,mientrasquelascolumnasrecogenlascantidadesgastadasen
cadaconceptosegnlosnuevegrandesgruposdegastoformuladosporelINE:
Grupo1:alimentos,bebidasytabaco
Grupo2:vestidoycalzado
Grupo3:vivienda,calefaccinyalumbrado
Grupo4:muebles,enseresyserviciosdelhogar
Grupo5:serviciosmdicosygastossanitarios

Grupo6:transportesycomunicaciones
Grupo7:esparcimiento,enseanzaycultura
Grupo8:otrosbienesyservicios
Grupo9:otrosgastosnomencionados

Deestemodo,elcrucedeunafilayunacolumnarepresentanlaspesetasqueloshabitantesdeuna
Comunidaddedicanaundeterminadoconcepto.

PLANTEAMIENTODELPROBLEMA:ElobjetivoprincipaldelasEncuestasdePresupuestosFamiliares
esactualizarlasponderacionesdelosdistintosbienesyserviciosqueintegranlacestadelacompra
paralaelaboracindelIPC(ndicedePreciosalConsumo).Aunqueensuorigenestasencuestas
analizabannicamenteelgastodelasunidadesfamiliares,enlaactualidadrecogengrancantidadde
informacinsobrelasfamiliasentrevistadas(nmerodemiembros,origendelosingresos,etc.),
informacinqueproporcionaunavisindetalladadelosmodosdevidaalpermitirestablecer
conexionesentrelospatronosdegastos,losingresosdelaunidadfamiliar,elequipamientodel
hogar,lascondicionesdelavivienda,etc.
Enesteejercicioseutilizacomocriterioclasificadorladistribucindelosgastosfamiliares.Eneste
sentido,lapreguntaesencialdelainvestigacincuestionalaexistenciaderelacinodependencia
entreComunidadAutnomaytipodegasto,esdecir,sihayComunidadesquepuedencaracterizarse
porunaseriedegastosdiferenciados,osimsbienComunidadytipodegastosonindependientes.
SealarquecuandosepostulaquelasComunidadesAutnomastienenpatronosdiferencialesde
gastoseasumelaexistenciadeunaestructuradeindependenciaentretiposdegastosy
ComunidadesAutnomas.Enestalnea,surgenvariaspreguntas:Culessonlascaractersticasde
esarelacin?,QuComunidadesAutnomastienenpautassimilares(diferenciadas)degasto?,
QugruposdegastotienenunadistribucinsemejanteenlasComunidades?,.

SantiagodelaFuenteFernndez

34

AnlisisdeCorrespondencias

Elanlisisdecorrespondenciaspermiteplanteartambincmolascategorasdeunavariable
explicanlasdiferencias(similitudes)observadasenlaotra,esdecir,Qugastosexplicanlas
diferencias(osimilitudes)entrelasComunidades?,QuComunidadesexplicanlasimilitud(o
diferencia)enlospatronesdegasto?.
Lagranheterogeneidaddelasregionesespaolasesadoptadacomopuntodepartidaparaanalizar
ladistribucindelosgastosenbienesyserviciosporpartedelasfamiliasdecadaComunidad
Autnoma,partiendodelahiptesisqueenfuncindeldesarrollodecadaComunidadsus
habitantesmanifestarndiferentescomportamientosenrelacinaladistribucindesusgastos.
PRIMERANLISISDELAINFORMACIN:Secomienzaconunanlisisunivariadodelasvariables
consideradas,conlafinalidaddeidentificardeterminadospatronesdecomportamiento.

SantiagodelaFuenteFernndez

35

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

36

AnlisisdeCorrespondencias

Elpvalue=0<0,05,serechazalahiptesisnula,
yseconcluyequelospatronesdegastoson
distintossegnlaComunidadAutnomade
residencia.

Sehasolicitadolosporcentajesdefilaycolumna.Compararlosporcentajesdefilaconla
distribucindegastosparatodoelpaspermitedetectarlasComunidadesqueempleanms
proporcindelgastoendeterminadosconceptos:enAndalucaempleanenalimentacinel31,6%
delosgastos,mientrasqueenNavarraempleanel24%delosgastos.
Parainterpretarelinteriordelatabla,desdeunpuntodevistaprctico,esmssencilloutilizarlos
residuosestandarizadoscorregidos,quesemuestranenlasiguientetabla:

Encadacasillaserecogenlosvaloresabsolutosylosresiduosestandarizados.Unanlisisdestas
permitirdetectarlosgruposdegastoquepredominanencadaComunidadAutnoma:
GRUPO1(alimentos,bebidaytabaco):LasComunidadesconunmayorresiduopositivosonCeutay
MelillaconAndaluca,esteelevadovalordetectalaexistenciadeunarelacinelevadaentreestos
elementos,enotraspalabras,estasComunidadesdestacanpordedicarunmayorporcentajede
ingresosalosgastosenalimentacin,bebidaytabaco.Porotraparte,loselevadoscoeficientes
negativosdeNavarra,BalearesyMadridreflejanqueelporcentajedeingresosdedicadosaeste
gastoesdeficienteconrelacinalrestodegrupos.
SantiagodelaFuenteFernndez

37

AnlisisdeCorrespondencias

GRUPO2(vestidoycalzado):EnestosconceptosdestacanCantabria,AragnyExtremadura;porel
contrario,CanariasyMadridpresentanunelevadocoeficientenegativo.
GRUPO3(vivienda,calefaccinyalumbrado):HaygastoselevadosenCantabria,CastillayLeny
Catalua.GastosreducidosenCeutayMelilla,ExtramadurayCanarias.
GRUPO4(muebles,enseresyserviciosdelhogar):NavarraylaComunidadValenciapresentaun
altocoeficiente,reflejandoquededicanunaltoporcentajedeingresosaestosconceptos.Porel
contrario,elporcentajedeingresosdedicadosaesteconceptoesdeficienteenCeutayMelilla,
CantabriayMadrid.
GRUPO5(serviciosmdicosygastossanitarios):GastoselevadosenBaleares,CanariasyCatalua.
GastosreducidosenCeutayMelilla,CastillaLaManchayMurcia.
GRUPO6(transportesycomunicaciones):GastoselevadosenBaleares,CanariasyMurcia.Gastos
reducidosenCeutayMelilla,ylaRioja.
GRUPO7(esparcimiento,enseanzaycultura):GastoselevadosenCatalua,MadridyCanarias.
GastosreducidosenMurcia,CastillayLen,Cantabria,CeutayMelilla.
GRUPO8(otrosbienesyservicios):GastoselevadosenMadridyPasVasco.Gastosreducidosen
GaliciayCantabria.
Elanlisisclsicodelastablasdecontingenciapermiteresolverelobjetivopropuesto,aunque
presentadificultadpararevelarlasestructurasdedependenciaentrelascategorasdelasvariables.
Porotraparte,amedidaquelatablaaumentadetamaosevaincrementandolacomplejidadpara
unaadecuadainterpretacin.Subrayarquelautilizacindetablasdecontingencianopermite
representargrficamentelasrelacionesentrevariables.
Seutilizaelanlisisfactorialdecorrespondenciasenlamedidaquesuobjetivoesprofundizarenel
conocimientodelasrelacionesqueseestablecenentredosvariablescualitativasobservadasenuna
mismapoblacin.

SantiagodelaFuenteFernndez

38

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

39

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

40

AnlisisdeCorrespondencias

Enlatabladecorrespondenciasserecogenlascantidadesmediasgastadasporhogarencada
ComunidadAutnoma,queoscilanentre2.677.012pesetasdeNavarray1.644.985pesetasde
CeutayMelilla.Enlascolumnasaparecenlascantidadesgastadasencadaconceptosegnlosnueve
gruposdegasto,seobservaqueen1991loshogaresespaolesgastaronenelGrupo1(alimentos,
bebidasytabaco)10.693.554pesetas,yconsiderandoqueelgastototaldelasComunidadesfue
37.339.465pesetas,elgastoenelGrupo1representa0,286(10.693.554/37.339.465)delosgastos
efectuados.
Estedatode0,286correspondealamasa(pesoproporcionalasuimportanciaenelconjunto)del
perfildelaprimerafila.Lamasaindicaelpromediototaldegasto,estoes,unaComunidad
Autnomaidealcuyopatrndegastocoincideconelconjuntonacional.
Enlatablaperfilesdecolumnaparalosdistintosgrupos,queseinterpretancomolaparticipacinde
cadaComunidadAutnomaenlosgruposdegasto:Andalucacontribuyeconun5,7%delgastototal
dealimentacin.
Enlneaconloexpuesto,losperfilessonlasproporcionesdecadaceldillaenfuncindela
distribucinmarginaldelafilaylacolumnacorrespondiente.Laimportanciadeestainformacin
radicaenqueelanlisisdecorrespondenciasdeterminaladistanciaentrelasmodalidades
considerandolasdistribucionesmarginalesylamasadecadacelda.
Estehechoobligaaconsiderarlasdiferenciasentreloselementosentrminosdedistancias,de
maneraquecuantomayorsealadiferenciaentreperfilesconmasasimilar,mayorserladistancia
entrelasComunidades.
ANLISISPERFILESDEFILA:

UnanlisisdetalladomuestragrandessimilitudesenladistribucindegastosdeCanariasyMadrid,
concluyendoqueambasComunidadestienenunospatronesdegastossimilares.
Siseconsideranlasdiferenciasentreloselementosenfuncindelasdistancias,estasComunidades
tendrnescasasdistancias.Deformaanloga,cuantomayorsealadiferenciaentrelosperfiles
mayorserladistanciaentrelasComunidades.
Resaltarquealestablecerlasdiferenciasentrelasmodalidadesnohayquefijarsenicamenteenlas
distanciasentrelosperfiles,tambinhayqueprestaratencinalasdistanciasponderadasen
funcindesumasa.
Lamasa(pesoproporcionalasuimportanciaenelconjunto)indicalainfluenciadeunobjetoen
baseasufrecuenciamarginal.Lamasaafectaalcentroide(baricentro),queeselperfilmediodela
columnaofila.Lasfilas(ocolumnas)conunamasaelevadaNavarra(0,072),Madrid(0,069)y
Catalua(0,068),porejemploinfluyenenlainerciaaunqueestncercadelcentroide;mientras
quelasfilas(ocolumnas)conunamasapequeaExtremadura(0,042),CeutayMelilla(0,044)
influyensobrelainercianicamentecuandoestnlejosdelcentroide.
Traslosperfilesdefilasycolumnas,SPSSofreceunatablaresumendondeaparecenelnmerode
dimensionescalculadas,losvalorespropiosoautovaloresdecadadimensin,lainercia,elvalorde
chicuadradoconsusignificacin,laproporcindeinerciaexplicadaparacadadimensin,yla
proporcinexplicadaacumulada.
SantiagodelaFuenteFernndez

41

AnlisisdeCorrespondencias

Elnmeromximodedimensionesesunnmeroinferioralnmerodecategorasdelavariable
conmenoscategoras(91=8).Aligualqueelanlisisdecomponentesprincipales,laprimera
dimensinexplicalamayorcantidaddeinercia,lasegundaunacantidadmenor,yashastala
ltima.

Aunqueelobjetivodelanlisisdecorrespondenciasesrepresentarlarelacinentrefilasycolumnas
conelmenornmerodedimensiones,convienecomenzarelanlisissolicitandounnmeroelevado
dedimensionesparaobservarlacontribucinrelativadecadauna.
Enestecasosehansolicitadocincodimensiones,aunqueSPSSproporcionainformacinsobreel
valorpropioyelporcentajedevarianzaexplicadadetodaslasdimensiones.Noocurrelomismocon
ladesviacintpicaylacorrelacinentredimensiones,quenicamentepresentalosvaloresdelas
dimensionesespecificadas.

Enlasegundacolumnaaparecenlosvalorespropiosoautovalores,esdecir,lacorrelacinentre
laspuntuacionesdefilasydecolumnas.Lainerciadecadadimensineselcuadradodecada
autovalor,queesunamedidarelativadelaimportanciadecadadimensin.

Enlaterceracolumnaelestadsticochicuadrado,sumaponderadadetodaslasdistanciasal
cuadradoentrelosperfilesdefilayelperfilmediodelafila,yentrelosperfilesdecolumnayel
perfilmediodecolumna.Susignificacin0,000<0,05hacequeserechacelahiptesisnula,
indicandounarelacinsignificativaentrelasvariablesutilizadas.Cuantomayorseaestadistancia
menorsersusignificacin,loqueconduciraunaelevadainterrelacinentrelasvariables,y
unamayordiferenciadelosperfilesrespectoalperfilmedio.

Lainerciatotaleslasumaponderadadetodaslasdistanciasalcentroide(baricentro)que
coincideconladistanciachicuadradodivididaentreeltotaldecasos:(chicuadrado/N=
489287,344/37339465=0,013).
Unavezqueseconocelainerciaexplicadaportodaslasdimensionesessencillovalorarla
aportacinindividualdecadauna:elcocientedelainerciadecadadimensinentreeltotal
(0,007/0,013=0,547)informaquelaprimeradimensinexplicael54,7%delainercia,
mientrasquelasegundadimensinsloexplicael18,9%.
Enlasiguientecolumnasemuestralaproporcindeinerciaacumulada,queindicalaexplicacin
conseguidacuandoseconsideraunmodelocondos,tresomsdimensiones.Enestesentido,el
modelocondosdimensionesexplicael73,7%,llegandoaunaexplicacindel84,3%alseleccionar
lastresprimerasdimensiones.

Lassiguientescasillasproporcionaninformacinpararealizarelintervalodeconfianzadela
poblacindequelasehanextradolosdatos,presentandoladesviacintpicaparacadadimensin
ylacorrelacinentrelasdimensionessolicitadas.Cuandolasdesviacionestpicassonpequeases
probablequelasolucinpresentadaestcercadelvalorpoblacional.
SantiagodelaFuenteFernndez

42

AnlisisdeCorrespondencias

Enlatablaaparecendesviacionestpicasmuypequeas,indicandoquelosresultadosseranmuy
similaresauncuandoserealizaseesteanlisisenotrasmuestrasdeigualtamao,extradasdela
mismapoblacinyconunprocedimientoidntico.
Acontinuacin,aparecenlastablasExamendelospuntosfilayExamendelospuntoscolumna:

SantiagodelaFuenteFernndez

43

AnlisisdeCorrespondencias

Latablamuestralamasa(pesoproporcionalasuimportanciaenelconjunto)decadacolumna,las
coordenadasdelascolumnasenlosfactores,lacontribucindecadacolumnaalainerciatotal,las
contribucionesabsolutasyrelativas.
Lainerciadeunadimensineslasumaponderadadelasdistanciasalcuadradoentrecadapuntoy
elcentrodecoordenadas.LascontribucionesabsolutasaparecenbajoelttuloContribucindelos
puntosalainerciadeladimensin,yaparecelacontribucindecadapuntoaladefinicindela
dimensino,expresadodeotraforma,laproporcindelainerciaexplicadaporunfactordebidaa
cadacategora.Lasumadelascontribucionesabsolutasdetodaslasmodalidadesenunfactorser
igualalaunidad.
Lacontribucindecadapuntodependedeladistanciadecadacategoraalcentrodegravedadyde
sumasa,siendoelproductodelacoordenadaalcuadradoporlamasadelacategora,divididopor
elvalorpropiodelfactor:Lacontribucin0,529delosgastosdealimentacinseobtienedela
expresin[(0,395)2.0,286]/0,085=0,529.
Conesteenfoque,sepuedeafirmarquelascontribucionesabsolutasponderanladistanciadecada
modalidadenfuncindesumasa,demodoquenobastaconobservarlascoordenadas(comoenel
anlisisdecomponentesprincipales)sinoqueesnecesarioconsiderarelnmerodeelementos
incluidosencadamodalidad,sumasa.Estoexplicaquepuntoslejanosdelcentroide(baricentro)
tengancontribucionesabsolutaspequeas,yviceversa,queComunidadesconcoordenadasbajas
consiganelevadascontribucionesenlaexplicacindelfactor.

Lasmodalidadesdegastosdominantesdelprimerfactorsonlosgastosenalimentacin(conuna
contribucinde0,529alainerciadeleje),seguidosdelosgastosentransportesy
comunicaciones(conunacontribucinde0,169alainerciadeleje),yenesparcimiento(conuna
contribucinde0,121).Conestastresmodalidades(alimentacin,transportesycomunicaciones,

SantiagodelaFuenteFernndez

44

AnlisisdeCorrespondencias

yesparcimiento)seexplicael82%delainerciadeesteprimerfactor.Elprimerfactorexplicael
54,7%delainerciatotal(tablaresumen).

Enelsegundofactorlosgastosenvestidocalzado(conunacontribucinde0,362alainerciadel
eje)yesparcimiento(conunacontribucinde0,262)lleganaexplicarel62,4%delainerciadel
segundofactor.Elsegundofactorexplicael18,9%delainerciatotal(tablaresumen).

Eltercerfactorestexplicadofundamentalmenteporlosgastosenvivienda(conuna
contribucinde0,274alainerciadeleje),otrosbienesyservicios(contribucinde0,103)yotros
gastosnomencionados(contribucinde0,223),llegandoaexplicarel60%delainerciadeltercer
factor.Eltercerfactorsloexplicael10,6%delainerciatotal(tablaresumen).

Enelcuartofactordestacalacontribucinenvestidocalzado(0,217)ytransportes(0,151),en
definitivapuededecirsequenotieneningunacontribucinabsolutaelevada.Elcuartofactor
sloexplicael5,2%delainerciatotal(tablaresumen).

Enelquintofactordestacanlasaportacionesdelosgastosenmuebles(0,252),gastossanitarios
(0,119)yotrosbienesyservicios(0,350),llegandoaexplicarel72,1%delainerciadelquinto
factor.Elquintofactorsloexplicael4,7%delainerciatotal(tablaresumen).

Lascontribucionesrelativasexpresanlacontribucindecadafactoralainerciadecadacategora,es
decir,lacalidaddelarepresentacindeunpuntosobreunadimensin.
Lacontribucinrelativasecalculadividiendolacoordenadaalcuadradoentreladistanciadela
categoraalcentrodegravedad,ylasumadelascontribucionesrelativasdeunamodalidadentodos
losfactoresesigualalaunidad.
Laltimacolumnadelascontribucionesrelativas,convalorescercanosalaunidad,reflejalaelevada
calidaddetodoslospuntossobrelascincodimensiones;sibienlastresprimerasdimensiones
explicanlamayorpartedelosgruposdegasto,aexcepcindelgastoenmueblesyenotrosgastos
nomencionados.
INFORMEPUNTUALDELAINVESTIGACIN:Elobjetivodelanlisisdecorrespondenciasesreducir
unaseriedevariablesobservadasaunconjuntomenordevariableslatentesllamadasfactores,con
lamenorprdidadeinformacin.
Enunprincipiosehaciareferenciaalaconvenienciadeextraerunnmeroelevadodedimensiones
paraanalizarlacontribucindecadauna,alavezquesehamencionadoenlaconvenienciade
buscarelequilibrioentreparsimoniaeinterpretabilidad.Concincofactoresseexplicael94%dela
inercia,mientrasquecontresfactoresseexplicael84,3%delainerciatotal.Enestalnea,es
aconsejablerealizarelanlisisconlostresprimerosfactores,decisinquequedaavaladaporla
ausenciadeelevadascontribucionesabsolutasapartirdelacuartadimensin.

Paraconstruirelnuevomodelosemodificalalnea
/DIMENSION=5coneleditordesintaxis,osecambia
elnmerodedimensionesenelcuadrodedilogode
lafiguraadjunta

SantiagodelaFuenteFernndez

45

AnlisisdeCorrespondencias

Losresultadosanalizadoshastaelmomentonocambian,aexcepcindelascontribucionesrelativas:

Elanlisisdelascontribucionesrelativasdelasdostablas(examendelospuntosfilaycolumnacon
tresdimensiones),convalorescercanosalaunidadenlaltimacolumna,siguereflejandouna
elevadacalidaddelarepresentacindelascategorasenlosfactores,aunquedeterminadosgrupos
degastoGrupo4(muebles,enseresyserviciosdelHogar)yGrupo8(otrosbienesyservicios)y
algunasComunidadesAutnomasValencia,Galicia,PasVasco,etc.disminuyanligeramentesu
representatividad.
SantiagodelaFuenteFernndez

46

AnlisisdeCorrespondencias

ANLISISCOMPONENTESGRFICOS:Enlastablasde
examendelospuntosfilaycolumnacontresdimensionesse
recogenlaspuntuacionesdecolumnasyfilasquesern
utilizadascomocoordenadasenlasrepresentaciones
grficas.
SecomienzananalizandolosGrficosdeLneasenlamedida
queimplicanelacercamientomssencilloalarealidad
estudiada.

Estosgrficosnosonmsqueunarepresentacindelaspuntuacionesdelascategorasdecada
dimensin,siendomuyilustrativosparaconocerladistanciadecadacategoraalpuntode
coordenadas.
Alestarrepresentadaslascoordenadasdecadacategoraestosgrficospermitenunarpida
comparacinentrelasdistanciasdelascategorasrespectoalorigendecoordenadas,conociendoas
loselementosquedefinencadafactor.

EnlatabladeExamendelospuntosdeFila(primerfactor):Andalucatieneunapuntuacinde
(0,240)enlaprimeradimensin,raznporlaqueestaComunidadAutnomaaparecesituadaalgo
msabajodelvalor(0,20).Enlapartederecha,CeutayMelilla,conunapuntuacinde(0,737),es
elvalormsbajodetodoslosvaloresconsiderados.

EnelgrficodeExamendeLneasdeFila(primerfactor)aparecenenlapartenegativalas
ComunidadesdeCeutayMelilla,Andaluca,ExtremadurayGalicia.

SantiagodelaFuenteFernndez

47

AnlisisdeCorrespondencias

Enlapartenegativadelprimerfactor(elevadosgastosenalimentacin):CeutayMelilla,Andaluca,
ExtremadurayGalicia.Sealarque,comoejemplo,encasoscomoExtremadurayGalicia,sepoda
pensarquecomoestasdosmodalidadesaparecenjuntastienenperfilessemejantes;perocuandola
calidadderepresentacinesbajasedebematizarestasemejanza:Estostresfactoresexplicanel
50,3%deGalicia,esdecir,lasemejanzaseproduceconsiderandonicamentelamitaddeesta
modalidad,pudiendosucederqueestasComunidadesseanmuydiferentesencualquierotro
aspectonorecogidoporestostresfactores;esdecir,encualquierotroaspectoincluidoenel50%
restantequequedasinespecificar.
ParaanalizarelorigendeesteproblemaseconsideraqueGaliciasediferenciadelperfilmedio,yde
otrasComunidades,engruposdegastosdistintosalosdestacadosporestostresfactores.Dehecho,
alobservarlatablaExamendelospuntosdeFila(cincodimensiones)seapreciaqueloscinco
primerosfactoresexplicanel78,3%deestaComunidad,destacandolaelevadacontribucinde
Galiciaenelquintofactor.
GRFICO DE LNEA DE LAS COLUMNAS

EnelgrficodeExamendeLneasdeColumna(primerfactor)sedesvelaquelosgastosdesanidad,
esparcimientoyalimentacinestnmuylejosdelorigendecoordenadas,respectivamente,losdos
primerossituadosenlapartepositivayelterceroenlapartenegativa.
Elgrupo'Otrosbienesyservicios'ylosgastosenviviendaseencuentransituadosmuycercadel
origendecoordenadas,deformaquetienenunescasopoderdiscriminanteenlaprimera
dimensin.

Altapresenciadegastosentransportes,sanidadyesparcimiento(extremopositivodelprimer
factor):Baleares,Navarra,MadridyCatalua.

SantiagodelaFuenteFernndez

48

AnlisisdeCorrespondencias

Enlasegundadimensinseaprecianlaspuntuacionesextremasdelosgastosenvestidoyen
esparcimiento,elprimeroconsignonegativoyelsegundopositivo,quesernelementosdefinitorios
delasegundadimensin.
GRFICO DE LNEA DE LAS FILAS

Predominiodegastosenvestidoycalzado(partenegativadelsegundofactor):Cantabriay
Aragn.
Presenciaelevadadegastosenesparcimiento(extremopositivodelsegundofactor):Ceutay
Melilla,MadridyCanarias.
GRFICO DE LNEA DE LAS COLUMNAS

SantiagodelaFuenteFernndez

49

AnlisisdeCorrespondencias

Enlaterceradimensin,serecogenpuntuacionesextremasenesparcimientoyvivienda(signo
positivo)yenotrosgastosnoincluidosanteriormente(partenegativa).
GRFICO DE LNEA DE LAS FILAS

Elevadosgastosenotrosgastos(extremonegativodeltercerfactor):MurciayNavarra.
Predominodegastosenesparcimientoyvivienda(partepositivadeltercerfactor):Cataluay
Cantabria.
GRFICO DE LNEA DE LAS COLUMNAS

SantiagodelaFuenteFernndez

50

AnlisisdeCorrespondencias

Lasrepresentacionesgrficasanteriores,conunagranfacilidaddeinterpretacin,dejanaspectossin
explicar,raznporlaqueesnecesarioanalizarlosgrficosdedispersinquepresentanlas
puntuacionesdefila(ocolumna)enlosdiversosfactores.
Mientrasquelosgrficosdelneanicamenteconsiderabanlapuntuacindecadacategoraenun
factor,losgrficosdedispersinrealizanunarepresentacinenvariasdimensionesreflejandouna
mejorcaracterizacindelarealidad.
LaspuntuacionesdecadaComunidad(filas)enlastresdimensionesseleccionadassecombinanpara
realizarunarepresentacindelosdosprimerosfactores,odelprimeroconeltercerfactor.

SantiagodelaFuenteFernndez

51

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

52

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

53

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

54

AnlisisdeCorrespondencias

INTERPRETACINDELOSRESULTADOS:Elobjetivoerarealizarunatipologizacindelas
ComunidadesAutnomasconsiderandocomocriterioclasificadorladistribucindelosgastos
familiares.
AplicandoelanlisisdecorrespondenciassimplesalosdatosobtenidosporlaEncuestade
PresupuestosFamiliares(19901991)seobtienendosfactoresqueconjuntamenteexplicanel73,7%
delainerciatotal(tablaresumen:proporcininerciaacumulada).
Unaprimeraobservacindelascontribucionesabsolutasdelprimerfactorreflejalagranaportacin
dedosgruposdegasto:GrupoI(alimentacin,bebidasytabaco)conunacontribucinabsolutade
0,529,GrupoVI(transportesycomunicaciones)conunacontribucinabsolutade0,169(tabla
examendelospuntoscolumna).Estasdosmodalidadesexplicanel69,8%delainerciadelfactor.
Lascontribucionesrelativas(tablaexamendelospuntoscolumna)mejoranlainterpretacinal
desvelarqueelGrupo5(mdicosyserviciossanitarios),conunacontribucinrelativade0,614se
encuentranfuertementeexplicadosporesteprimerfactor.
ElanlisisdecoordenadasindicaquelosgastosenelGrupoI(alimentacin,bebidasytabaco)se
encuentransituadosenlaparteizquierdadelfactor(0,395)(Tablaexamendelospuntoscolumna
contresdimensiones,GrficodeLneadelasColumnas)conunacontribucinabsolutade0,529,
mientrasquealaderechadelorigendecoordenadasseencuentranlosgastosdelGrupoVI
(transportesycomunicaciones)conunarepresentacinde0,318,contribucinabsolutade0,169y
Grupo5(mdicosyserviciossanitarios)conunarepresentacinde0,507,contribucinabsoluta
0,088.
AunqueenlapartederechadeesteprimerfactoraparecetambinelGrupoIV(muebles,enseresy
serviciosdelhogar),elanlisisdecontribucinabsoluta(0,026)desvelaqueestegrupodegasto
tieneescasainfluenciaenladefinicindelfactor.Labajacontribucinrelativade(0,263)est
indicandoqueestosgastosestnmuypocodefinidosporelmodelodelosdosfactores.
Concluyendo,elprimerfactorqueexplicael54,7%delainerciatotal(tablaresumen:proporcin
inerciaexplicada),estsealandounaoposicinentrelosgastosdelGrupo5(mdicosyservicios
sanitarios)yGrupoVI(transportesycomunicaciones),frentealgastoenelGrupoI(alimentos,
bebidasytabaco).Lostiposdegastosdefinitoriosdelprimerfactor,juntoconlasComunidades
Autnomasenlosquepredominan,aparecenrepresentadosenlosextremosderechoeizquierdadel
grficopuntosdecolumnaparagastos.
Unapanormicanacional:CeutayMelilla,Andaluca,ExtremadurayGaliciatienenungastosuperior
enelGrupoI(alimentos,bebidasytabaco),respectivamente,(683373/1644985=41,5%),
(604906/1915446=31,6%),30,3%y30,4%(tabladecorrespondenciaspermutadasdeacuerdoconla
dimensin1).
LalejanaposicindeCeutayMelillarespectoalorigendecoordenadas,unidaasuelevada
contribucinabsolutahacensospecharquepuedatratarsedeuncasoatpicoquepodraafectar
gravementealaestabilidadinternadelapresentacin.Estetipodepuntosdificultanla
interpretacindelgrficoalconcentrarelrestodelospuntosenunreapequea,aunqueel
principalproblemaquesepresentaesquesueliminacincambiatotalmentelaorientacindelos
ejes,amenazandolaestabilidadinternadelmodelo.Pararesolverladudaserealizaranvarios
anlisissinestacategora,sielplanoylosejespermanecenestables,serechazaquesetratedeun
casoatpico.

SantiagodelaFuenteFernndez

55

AnlisisdeCorrespondencias

SantiagodelaFuenteFernndez

56

Você também pode gostar