Escolar Documentos
Profissional Documentos
Cultura Documentos
8
ANLISISESTADSTICO:
SEGUNDAPARTE
INTRODUCCIN
Conestecaptulosecomplementael10deMetodologadelainvestigacin,5edicin,
adems de que se actualiz su contenido. Se presentan primero las hiptesis
estadsticas, las puntuaciones z, clculos inferenciales o estimaciones de parmetros y
luego el clculo del coeficiente alfaCronbach y el sustento del anlisis de varianza
unidireccional.Finalmentelosanlisismultivariadosyalgunasfrmulas,ascomouna
secuencia de anlisis en Minitab y otra en SPSS. Los autores asumimos que se revis
previamenteelcaptuloencuestin.
HIPTESISESTADSTICAS
Enelcaptulo10sesealquecadapruebaestadsticaobedeceauntipodehiptesis
de investigacin e hiptesis estadstica distinta. Las hiptesis estadsticas son la
Hiptesisestadsticasdeestimacin
Corresponden a las que, al hablar de hiptesis de investigacin, se les denomina
hiptesisdescriptivasdeundatoquesepronostica.Sirvenparaevaluarlasuposicinde
un investigador respecto del valor de alguna caracterstica en una muestra de
individuos,otrosseresvivos,sucesosuobjetos,yenunapoblacin.Sefundamentanen
informacin previa. Supongamos que, basndose en ciertos datos, un investigador
plantea la siguiente hiptesis: el promedio mensual de casos de trastorno
psiconeurtico caracterizados por reaccin astnica, que sern atendidos en los
hospitales de la ciudad de Linderbuck, resultar mayor a 20. Adems, desea
transformarestahiptesisdeinvestigacinenunahiptesisestadstica.Loprimeroque
debe hacer es analizar cul es la estadstica a que su hiptesis hace referencia (en el
ejemplosetratadeunpromedioomediamensualdecasosatendidos).Elsegundopaso
consiste en encontrar cmo se simboliza esa estadstica (promedio se simboliza como
). El tercer paso consiste en traducir la hiptesis de investigacin a una forma
estadstica:
Hi:
>20(elpromediomensualdecasosatendidossermayora20.)
Lahiptesisestadsticanulaseralanegacindelahiptesisanterior:
Ho:
<20(elpromediomensualdecasosatendidossermenora20.)
ylahiptesisalternativapodraser:
Ha:
=20(elpromediomensualdecasosesiguala20.)
Hiptesisestadsticasdecorrelacin
Estas hiptesis tienen por objetivo traducir en trminos estadsticos una correlacin
entre dos o ms variables. El smbolo de una correlacin entre dos variables es r
(minscula), y entre ms de dos variables R (mayscula). La siguiente hiptesis: a
mayor cohesin en un grupo, mayor eficacia en el logro de sus metas primarias, se
traduciratalcomosemuestraenelesquema.
0(noesigualaceroo,loqueeslomismo,ambas
variablesestncorrelacionadas)
Lacorrelacin
entredosvariables(cohesinyeficacia)
Hi:rxy
Lahiptesisnulasetraducira:
Ho:rxy=0(Lasdosvariablesnoestncorrelacionadas;sucorrelacinescero.)
Otroejemplo:
Hi:Rxyz0(Lacorrelacinentrelasvariablesautonoma,variedadymotivacin
intrnseca no es igual a cero. Es decir, las tres variables x, y, z estn
asociadas).
Ho:Rxyz=0
(Nohaycorrelacin)
Hiptesisestadsticasdeladiferenciademediasuotrosvalores
Enestashiptesissecomparaunaestadsticaentredosomsgrupos.Supongamosque
uninvestigadorplantealasiguientepreguntadeestudio:difierenlosperidicosTlexy
Noticias en cuanto al promedio de editoriales mensuales que dedicaron, durante el
ltimoao,altemadelterrorismointernacional?1Suhiptesisdeinvestigacinpodra
ser: existe una diferencia entre el promedio de editoriales mensuales que dedic,
durante el ltimo ao, al tema del terrorismo internacional el diario Tlex, y el que
dediceldiarioNoticias.Laestadsticaquesecomparaentrelosgrupos(editorialesde
Tlex,ungrupo,yeditorialesdeNoticias,otrogrupo)eselpromediomensual(
).La
hiptesisestadsticaseformularaas:
esdiferente
Hi:
2(promediodelgrupo2:editorialesdeNoticias)
Tlex)
Lahiptesisnula:
Ho:
1 =
editoriales.)
Conotraestadstica(porcentaje)ytresgrupos,seobtendranhiptesisestadsticas
comolassiguientes:
Hi:%1%2%3(Losporcentajesdelostresgrupossondistintos.)
Ho:%1=%2=%3(Nohaydiferencias.)
PUNTUACIONESz
Las puntuaciones z son transformaciones que se pueden
hacer a los valores o las puntuaciones obtenidas, con el
propsito de analizar su distancia respecto a la media, en
unidadesdedesviacinestndar.Unapuntuacinznosindica
la direccin y el grado en que un valor individual obtenido se
PuntuacinzMedida
queindicaladirecciny
elgradoenqueunvalor
individualsealejadela
media,enunaescalade
unidadesdedesviacin
estndar.
1Nombrescompletamenteficticios
alejadelamedia,enunaescaladeunidadesdedesviacinestndar.Comomencionan
Nie et al. (1975), las puntuaciones z son el mtodo ms comnmente utilizado para
estandarizarlaescaladeunavariablemedidaenunnivelporintervalos.
Sufrmulaes:
dondeXeslapuntuacinoelvaloratransformar,
eslamediadeladistribucinysla
X = 50
= 60
s = 10
Lapuntuacinzcorrespondienteaunvalorde50es:
Podemosdecirqueelvalor50selocalizaaunadesviacinestndarpordebajode
lamediadeladistribucin(elvalor30estatresdesviacionesestndarpordebajode
lamedia).
Estandarizar los valores permite comparar puntuaciones de dos distribuciones
diferentes (la forma de medicin es la misma, aunque se trata de distribuciones
distintas). Por ejemplo, podemos contrastar una distribucin obtenida en una
z=
130 122.5
= 0.75
10.0
Yelvalorde135correspondeaunapuntuacinzde:
z=
135 140
= 0.51
9.8
Como observamos, en trminos absolutos 135 es una mejor puntuacin que 130,
peronoentrminosrelativos(enrelacinconsusrespectivasdistribuciones).
La distribucin de puntuaciones z no cambia la forma de la distribucin original,
pero s modifica las unidades originales a unidades de desviacin estndar (Wright,
1979).Ladistribucindepuntuacionesztieneunamediade0(cero)yunadesviacin
estndarde1(uno).Lafigura8.1muestraladistribucindepuntuacionesz.
Figura8.1Distribucindepuntuacionesz
Laspuntuacionesztambinsirvenparacompararmedicionesdedistintaspruebas
oescalasaplicadasalosmismosparticipantes(losvaloresobtenidosencadaescalase
transforman en puntuaciones z y se comparan) (Delbaere et al., 2007). No debe
olvidarsequeloselementosdelafrmulaespecficamentesonlamediayladesviacin
estndarquecorrespondenalvaloratransformar(desumismadistribucin).Tambin,
las puntuaciones z sirven para analizar distancias entre puntuaciones de una misma
distribucin y reas de la curva que abarcan tales distancias, o para sopesar el
desempeodeungrupodeparticipantesenvariaspruebas.Laspuntuacioneszsonun
elementodescriptivoadicionalqueseagregaparaanalizarnuestrosdatos.
ESTIMACINDEPARMETROS:
UNEJEMPLOCONLAMEDIAPOBLACIONAL
2Enesteejemploseutilizalamedia,talvezelcasomsconocido,peropuedesercualquierotroparmetro
poblacional.
Donde
representaladesviacinestndardelamuestrayneseltamaodelamuestra.
Enelejemplo:
dondeXeslamediadelamuestra(recordemosqueladistribucinmuestralesde
mediasynodepuntuaciones), eslamediahipotticadeladistribucinmuestral
(parmetro poblacional),
muestraldemedias.As,tenemos:
z=
2.9 3.0
= 1.47
0.0679
6. Enlatabladereasbajolacurvanormal(verapndice,4tabla1deesteCD),buscar
aquellapuntuacinzquedejea25%porencimadeella,quees1.96.Enlatabladel
apndice 4 se presenta la distribucin de puntuaciones z, slo la mitad, pues
debemos recordar que es una distribucin simtrica y se aplica igual para ambos
ladosdelamedia.Asseincluyeenlostextosdeestadstica.Sebusca2.5%,porque
latablasloabarcalamitaddeladistribucinyelriesgoqueestamosafrontandoes
de 5% (2.5% del extremo de cada lado). La tabla mencionada contiene cuatro
columnas: la primera indica puntuaciones z, la segunda expresa la distancia de la
puntuacinzalamedia.Latercera,elreaqueestpordebajodeesapuntuacin
desdeelcomienzodeladistribucin,comosemuestraenlagrfica:
Ylacuarta,delreaqueestporencimadeesapuntuacin:
7. Compararlamediadelamuestratransformadaapuntuacinzconelvalor1.96;si
esmenor,aceptarlahiptesis;siesmayor,rechazarla.Veamoselejemplo:
Mediadelamuestratransformadaaz
1.47
Niveldesignificanciadel0.05
1.96
Decisin:Aceptarlahiptesisaunniveldesignificanciade0.05(95%afavory5%de
riesgodecometerunerror).
Silamediaobtenida
altransformarseenz,
Hubierasido3.25,
7.46 ounvalormayorRechazarlahiptesis
Porejemplo:
Mediadelamuestra=2.0
Desviacinestndardelamuestra=0.65
n=700
S =0.0246
z=40.65
Lamediaestsituadaamsde40desviacionesestndardealmedia;selocalizaenla
zonacrtica(msallde1.96desviacionesestndar).Rechazarlahiptesis.
PORQUESIMPORTANTEOTROCONCEPTOPARALA
ESTIMACINDEPARMETROS:ELINTERVALODECONFIANZA?
Sehahabladodeladistribucinmuestralporloquerespectaalapruebadehiptesis,
perootroprocedimientodelaestadsticainferencialesconstruirunintervalodondese
localiza un parmetro (Wiersma y Jurs, 2008). Por ejemplo, en lugar de pretender
probarunahiptesisacercadelamediapoblacional,puedebuscarseunintervalodonde
se ubique dicha media. Lo anterior requiere un nivel de confianza, al igual que en la
prueba de hiptesis inferenciales. El nivel de confianza es al intervalo de confianza lo
que el nivel de significancia es a la prueba de hiptesis. Es decir, se trata de una
probabilidaddefinidadequeunparmetrosevaaubicarenundeterminadointervalo.
Recordemosquelosnivelesdeconfianzaexpresadosenporcentajesmscomunesen
lainvestigacinson0.95y0.99(.05y.01).Susentidoessimilaralyacomentado,sies
de 0.95; quiere decir que tenemos 95% en favor de que el parmetro se localice en el
intervaloestimado,contra5%deelegirunintervaloequivocado.Elnivelde0.99seala
99%deprobabilidaddeseleccionarelintervaloadecuado.Talesnivelesdeconfianzase
expresan en unidades de desviacin estndar. Una vez ms se acude a la distribucin
muestral,concretamentealatabladereasbajolacurvanormal(apndice4,tabla1de
este CD anexo o en STATS reas bajo la curva normal)3, y se elige la puntuacin z
correspondiente al nivel de confianza seleccionado. Una vez hecho esto, se aplica la
siguientefrmula:
3TambinSTATScontieneestatabla.
Intervalodeconfianza=estadgrafo+
Puntuacinzque
expresaelnivelde
confianzaelegido
Desviacinestndarde
ladistribucinmuestral
correspondiente
Enlafrmula,elestadgrafoeslaestadsticacalculadaenlamuestra,lapuntuacin
z es 1.96 con un nivel de 0.95 y de 2.58 con un nivel de 0.99, en tanto que el error
estndardependedelestadgrafoencuestin.Vemosloconelejemplodelamediaen
elcasodelaexposicindiariaalatelevisin(enfindesemana)porpartedelosnios
deValladolid:
Media=2.9horas
s=1.2horas
(desviacinestndardeladistribucinmuestraldelamedia).
Niveldeconfianza
=0.95(z=1.96)
Intervalodeconfianza
=2.9(1.96)(0.0679)
=2.9(0.133)
Intervalo de confianza: la media poblacional est entre 2.767 y 3.033 horas, con
95%deprobabilidadesdenocometererror.
CLCULODELCOEFICIENTEDECONFIABILIDAD
(FIABILIDAD)ALFACRONBACH
Enloscaptulos9y10sedefinielcoeficientealfadeCronbach(),ascomosususose
interpretacin.LosprogramasdeanlisisestadsticocomoSPSS,Minitab,SASyotros,lo
incluyen y calculan instantneamente. Pero para quienes no tienen acceso a estos
programas, presentamos la forma de obtenerlos. De acuerdo con Carmines y Zeller
(1988, pp. 44 y 45), as como Corbetta (2003), existen tres procedimientos para
determinarelcoeficienteoalfa:
( )
1 s 2 Yi
N 1
s2 x
s (Yi ) es igual a la
2
sumatoriadelasvarianzasdelostemsys2xequivalealavarianzadetodalaescala.
2. Sobrelabasedelamatrizdecorrelacindelostems,elprocedimientosera:
a) Seaplicalaescala.
b) Seobtienenlosresultados.
c) Se calculan los coeficientes de correlacin r de Pearson entre todos los tems
(todoscontratodosdeparenpar).
d) Seelaboralamatrizdecorrelacinconloscoeficientesobtenidos.Porejemplo:
tems
0.451
0.399
0.585
yafuecalculado
0.489
0.501
yafuecalculado
yafuecalculado
0.541
yafuecalculado
yafuecalculado
yafuecalculado
e) Secalcula (promediodelascorrelaciones).
decorrelacionesnorepetidasonoexcluidas).
f)
Seaplicalafrmulasiguiente:
Np
1 + p (N 1)
DondeNeselnmerodetemsy elpromediodelascorrelacionesentretems.
Enelejemplo:
= 0.798
= 0.80(cerrando)
Es un coeficiente aceptable y recordemos que todos los tems de la escala deben
estarmedidosenintervalosorazn.
3. Medianteotrafrmulaquesebasaenlacorrelacinpromedio(Corbetta,2003,
p.238).
Seusalasiguientefrmula:
nr
1 + r(n 1)
SUSTENTODELANLISISDEVARIANZAUNIDIRECCIONAL
En el captulo 10 del texto impreso, se dijo que el ANOVA unidireccional produce un
valorF,elcualsebasaenunadistribucinmuestral,conocidacomodistribucinF,ytal
valor compara las variaciones en las puntuaciones debidas a dos diferentes fuentes:
variacionesentrelosgruposquesecontrastanyvariacionesdentrodelosgrupos.
Silosgruposdifierenrealmenteentres,suspuntuacionesvariarnmsdeloque
puedanvariarlaspuntuacionesentrelosintegrantesdeunmismogrupo.Vemoslocon
unejemplocotidiano.SitenemostresfamiliasA,ByC.LafamiliaAestintegradapor
Felipe,Anglica,ElenayJosLuis.LafamiliaBestcompuestaporChester,Pilar,igo,
Alonso y Carlos. Y la familia C est integrada por Rodrigo, Laura y Roberto. Qu
esperamos?Puesquelosintegrantesdeunafamiliaseparezcanmsentresquealos
miembrosdeotrafamilia.Estosegraficaracomoenlafigura8.2.
Figura8.2Ejemplodelasvariacionesdelosgruposcomparados
elevadasalcuadrado X X
es
( X X )
expresaas:
) .LavarianzaporesosesimbolizacomoS ysufrmula
2
En donde la media cuadrtica implica un promedio de varianzas elevadas al
cuadrado. La media cuadrtica entre los grupos se obtiene al calcular la media de las
puntuacionesdetodoslosgrupos(mediatotal),despusseobtieneladesviacindela
mediadecadagruporespectoalamediatotalyseelevaalcuadradocadaunadeestas
desviaciones,yluegosesuman.Finalmentesesopesaelnmerodeindividuosencada
grupoylamediacuadrticaseobtieneconbaseenlosgradosdelibertadintergrupales
(nosecalculaconbaseenelnmerodepuntuaciones).Lamediacuadrticadentrode
losgrupossecalculaobteniendoprimeroladesviacindecadapuntuacinrespectoala
media de su grupo; posteriormente esta fuente de variacin se suma y combina para
obtenerunamediadelavarianzaintragrupalparatodaslasobservaciones,tomandoen
cuentalosgradosdelibertadtotales(Wright,1979;DoncasteryDavey,2007).
Lasfrmulasdelamediacuadrticason:
Losgradosdelibertadentregrupos=
(dondeKeselnmerodegrupos).
Losgradosdelibertadintragrupos= n K (neseltamaodelamuestra,lasuma
delosindividuosdetodoslosgrupos,yKrecordemosqueeselnmerodegrupos).
Pues bien, cuando F resulta significativa, quiere decir que los grupos difieren
significativamente entre s. Es decir, se acepta la hiptesis de investigacin y se
rechazalahiptesisnula.
Cuandoseefectaelanlisisdevarianzapormediodeunprogramacomputacional
estadstico,segeneraunatabladeresultadosconloselementosdelatabla8.1.
Tabla8.1Elementosparainterpretarunanlisisdevarianza
unidireccionalrealizadoenSPSS
Fuentede
variacin
(Source)
Entre
grupos
(between
groups)
Intragrupos
(within
groups)
Total
Sumasde
Gradosde
Medias
cuadrados
libertad
cuadrticas
(Sumsof
(Degreesof
(Mean
RaznF
squares)
freedom)
squares)
(Fratio)
SSentre+
glentre
SSentre/gl
entre
SSintra
glintra
SSintra/gl
intra
SSentre
glentre+
SSintra
glintra
EnMinitabsedanlossiguienteselementos:
FuenteGL(gradosSC(sumadeMC(mediaF(valor)P(sig.)
delibertad)cuadrados)cuadrtica)
Significancia
deF
(Fprob.)
Elvaloralfaoprobabilidadaelegirunavezmses0.05o0.01.Siesmenorque0.05
es significativo en este nivel, y si es menor que 0.01 tambin es significativo en este
nivel.Cuandoelprogramaopaqueteestadsticonoincluyelasignificanciaseacudeala
tabla3delapndice4(tabladeladistribucinFoenSTATSaValoresdeFalnivel
de confianza de .05 y .01). Esta tabla contiene una lista de razones significativas
(razones F) que debemos obtener para aceptar la hiptesis de investigacin en los
nivelesdeconfianzade0.05y0.01.Aligualqueencasodelaraznt,elvalorexactode
F que debemos obtener depende de sus grados de libertad asociados. Por lo tanto, la
utilizacindelatablaseiniciaalbuscarlosdosvaloresgl,losgradosdelibertadentrelos
grupos y los grados de libertad intragrupos. Los grados de libertad entre grupos se
indican en la parte superior de la pgina, mientras que los grados de libertad
intragrupos se han colocado al lado izquierdo de la tabla. El cuerpo de la tabla de la
distribucin F presenta razones F significativas en los niveles de confianza de 0.05 y
0.01.
SiF = 1.12
glentre = 2
glintra = 60
EstevalorFsecomparaconelvalorqueapareceenlatabladeladistribucinFque
es 3.15 y como el valor F calculado es menor al de dicha tabla, rechazaramos la
hiptesisdeinvestigacinyaceptaramoslahiptesisnula.ParaqueelvalorFcalculado
seasignificativodebeserigualomayoraldelatabla.
ANLISISMULTIVARIADO
En el captulo 10 del libro, cuando se analizaron los principales mtodos estadsticos
paramtricos, concretamente, despus de revisar el ANOVA unidireccional, nos
preguntbamos: pero qu ocurre cuando tenemos diversas variables independientes y
una dependiente, varias independientes y dependientes? Tal como observbamos en
diagramascomoelquesemuestraenlafigura8.3.
Autoestimade
lapersona
Edad
Sentido
devida
dela
persona
Gnero
Religin
Figura8.3Ejemploconcuatrovariablesindependientesyunadependiente.
Larespuestaera:entonces,requerimosdeotrosmtodosestadsticos.stossonlos
que revisaremos a continuacin y una vez ms, sobre la base de que existen
computadoras y programas como el SPSS, del mismo modo centrndonos en los
elementosfundamentalesdeinterpretacin.
Qusonlosmtodosdeanlisismultivariado?
Los mtodos de anlisis multivariado son aquellos en que se analiza la relacin entre
diversas variables independientes y al menos una dependiente. Son mtodos ms
complejosquerequierendelusodecomputadorasparaefectuarlosclculosnecesarios
(normalmenteseenseananivelposgrado).
Queselanlisisfactorialdevarianza?
ANOVA(anlisisdevarianzadekdireccionesovariosfactores)
Definicin: Es una prueba estadstica para evaluar el efecto de dos o ms variables
independientessobreunavariabledependiente.
Respondeaesquemascomoelquesemuestraenlafigura8.4.
X1
X2
Xk
Figura8.4Esquemadeunanlisisfactorialdevarianza
Constituyeunaextensindelanlisisdevarianzaunidireccional,solamentequeincluye
ms de una variable independiente. Evala los efectos por separado de cada variable
independienteylosefectosconjuntosdedosomsvariablesindependientes.
Variables:dosomsvariablesindependientesyunadependiente.
Niveldemedicindelasvariables:lavariabledependiente(criterio)debeestarmedida
enunnivelporintervalosorazn,ylasvariablesindependientes(factores)pueden
estarencualquierniveldemedicin,peroexpresadasdemaneracategrica.
Interpretacinyejemplo
Hi: la similitud en valores, la atraccin fsica y el grado de realimentacin positiva son
variablesqueincidenenlasatisfaccinsobrelarelacinenparejasdenovios.
Tabla8.2EjemploderesultadosenelANOVA
Fuentedevariacin
(SOURCEOFVARIATION)
Efectosprincipales
(maineffects)
VARIABLEDEPENDIENTE:SATISFACCINENLARELACIN
Sumade
Gradosde
Medias
Razn
Significancia
cuadrados
libertad
cuadrticas
deFOP
(SUMSOF
(DEGREESOF (MEAN
SQUARES)
FREEDOM)
SQUARES)
22.51
0.001**
Similitud
31.18
0.001**
Atraccin
21.02
0.001**
Realimentacin
11.84
0.004**
Interaccindedos
direcciones(2way
interactions)
7.65
0.010*
Similitud
4.32
0.040*
Atraccin
Similitud
2.18
0.110
Realimentacin
Atraccin
1.56
0.190
Interaccindetres
8.01
0.020*
direcciones(3way
interaction)
Similitud
Atraccin
Realimentacin
Residual
Total
Nota: AlosestudiantesqueseinicianenelANOVAnormalmentelesinteresasabersilasrazonesF
resultarononosignificativas;portanto,sloseincluyenestosvalores.Porloqueesaellosaquieneslos
autoresrecomiendanconcentrarseendichosvaloresyevitarconfusiones.Desdeluego,elinvestigador
experimentadoacostumbraestudiartodoslosvalores.
**RaznFsignificativaalniveldel0.01(p<0.01)
*RaznFsignificativaalniveldel0.05(p<0.05)
Queselanlisisdecovarianza?
Definicin: es un mtodo estadstico que analiza la relacin entre una variable
dependienteydosomsindependientes,conelqueseeliminaocontrolaelefectodeal
menosunadeestasindependientes.SimilaralANOVA,exceptoquepermitecontrolarla
influencia de una variable independiente, la cual con frecuencia es una caracterstica
antecedentequepuedevariarentrelosgrupos(Mertens,2005;Babbie,2009)oinfluir
losresultadosyafectarlaclaridaddelasinterpretaciones.
Perspectivasousos:WildtyAhtola(1978,pp.89)destacantresperspectivasparael
anlisisdecovarianza:
Variables
independientes
categricas
X1
X2
Xk
Variables
independientes
cuantitativas
continuas
Z 1
Z 2
Zk
Figura8.5Ejemplodevariablesindependientesqueafectanaunadependiente
Variable
dependiente
X1
X2
Xk
Y
Z1
Removero
controlar
Z2
Zk
Figura8.6Ejemplodecontroldevariablesindependientesnocategricas.
Variablecategricaunascuantascategorasounrangomedio.
Variablecontinuamuchascategoras(avecesunainfinidad).
A dichas variables independientes cuantitativas continuas, cuya influencia se
controla,selesdenominacovariables.Unacovariableseincluyeenelanlisispara
removersuefectosobrelavariabledependiente,eincrementarelconocimientode
la relacin entre las variables independientes categricas de inters y la
dependiente,locualaumentalaprecisindelanlisis(DoncasteryDavey,2007).
Enestaperspectiva,elanlisisdecovarianzapuedeserconcebidoprimerocomo
un ajuste en la variable dependiente respecto a diferencias en la covariable o las
covariables y, posteriormente, como una evaluacin de la relacin entre las
variables independientes categricas y los valores ajustados de la variable
dependiente (Wildt y Ahtola, 1978). En trminos de Creswell (2005): el
procedimiento ajusta las puntuaciones en la dependiente para dar cuenta de la
covarianza (por decirlo en trminos sencillos: hace equivalentes a los grupos en
la(s) covariable(s) y controla influencias potenciales que pueden afectar a la
variabledependiente).
B. Perspectivadeintersporlacovariable.Estaperspectivaseejemplificaconaquellas
instanciasenlascualeselintersprincipalsecentraenanalizarlarelacinentrela
variable dependiente y la covariable (variable cuantitativa continua) o las
covariables. Aqu el enfoque es distinto; la influencia que se remueve es la de las
variables independientes categricas. Primero se controla el efecto (en este caso
contaminante)deestasvariablesydespusseanalizaelefectopurificadodelas
covariables.
C. Perspectiva de regresin. En esta tercera perspectiva, tanto las variables
independientes categricas como las covariables resultan de inters para el
investigador, quien puede desear examinar el efecto de cada variable
independiente(covariablesynocovariables,todas)ydespusajustarocorregirlos
efectosdelasdemsvariablesindependientes.
Encualquiercaso,elanlisisdecovarianzaeliminainfluenciasnodeseadassobrela
variable dependiente. Se puede utilizar en contextos experimentales y no
EJEMPLO
Estudio:Alinvestigadorleinteresaanalizarelefectoenelaprendizajedelacomputacin,pormedio
deunnuevomtodoparasuenseanzaanios.Lahiptesises:elnuevomtododeenseanzade
lacomputacin(MARH)provocarunmayoraprendizajeenlosniosqueunmtodotradicional.
mtodo de enseanza de computacin (MARH); el otro grupo aprende con el mtodo tradicional;
finalmente,untercergrupo,decontrol,norecibeningntipodeenseanzaencomputacin.
La variable independiente es el tipo de mtodo con tres categoras o niveles (mtodo nuevo,
mtodotradicionalyausenciademtodo),ladependienteeselaprendizajeencomputacin(medida
porunapruebaestandarizadaaniveldeintervalos).Setieneunesquemacomoeldelafigura8.7.
Tipodemtodo(X)
Aprendizaje(Y)
Elinvestigadorsabequeelaprendizajesepuededeberamuchasrazones,ademsdelmtodo.Esdecir,el
aprendizajevarapordiversosmotivos,locualserepresentaenformadeconjuntosdelasiguientemanera:
Variable
independiente:
mtodo(X)
Variable
dependiente:
aprendizaje(Y)
Varianzaencomnentre
mtodoyaprendizaje
Varianzadelaprendizajeno
explicada(quenosedebeal
mtodosinoaotrosfactores)
Conelexperimentoelinvestigadordeseaconocerlavarianzaencomnentremtodoyaprendizaje
(cuantificarla),larelacinXY(pura).Silosniossonasignadosalazaralosgruposdelexperimento
ytienegruposdetamaoaceptable,poreldiseomismo,remuevelainfluenciadelascovariables
quepudieranafectar.Perosinoesfactiblehacerloytieneundiseocuasiexperimental(grupos
intactos),deberemovertalinfluenciaconelanlisisdecovarianza(eliminaralmnimoposiblela
varianzadelaprendizajenoexplicada),paraevitarquelascovariablesimpidanverconclaridadla
relacinXY.Porejemplo,elniveleducativotecnolgicodelospadrespuedeinfluir(hacevariaral
aprendizaje)yesteefectodebesercontrolado,alintroducirlocomocovariable.
Variable
independiente:
mtodo(X)
Variable
dependiente:
aprendizaje(Y)
Elniveleducativo
tecnolgicodelos
padres(COVARIABLE)
Varianzaencomn:entre
mtodoyaprendizaje
Varianzacompartidaentreelnivel
educativodelospadresyelaprendizaje(la
cualsecontrolaconelANCOVA)
Entremscovariablessecontrole,msseexplicarsobrelavarianzacomnentreelmtodoyel
aprendizaje.
Figura8.7Ejemplodelcontroldelascovariables(conunacovariable).
Loqueelinvestigadordeseatambinsepuedeexpresar
grficamenteas:
Tipodemtodo
Aprendizaje
ANCOVA
Niveleducativo
tecnolgicodelos
padres(covariable)
Controlarinfluenciadelacovariable
WildtyAhtola(1978,p.13)definenalgunosusosdelanlisisdecovarianza:
1. Incrementarlaprecisinenexperimentosconasignacinalazar.
2. Eliminar influencias extraas o contaminantes que pueden resultar cuando las
pruebas o los individuos no son asignados al azar a las diferentes condiciones
experimentales(gruposdeunexperimento).
3. Eliminar efectos de variables que confundan o distorsionen la interpretacin de
resultadosenestudiosnoexperimentales.
Nivel de medicin de las variables: la variable dependiente siempre est medida por
intervalosoraznylasvariablesindependientespuedenestarmedidasencualquiernivel.
Interpretacin: depende de cada caso especfico, ya que el anlisis de covarianza
efectuado mediante un programa estadstico computacional, produce un cuadro de
resultados muy parecido al del anlisis de varianza. Los elementos ms comunes
puedenobservarseenlatabla8.3.
Tabla8.3Ejemplodeelementoscomunesdeunanlisisdecovarianza
Fuente
de Sumasde
variacin
(Source
variation)
Sumasde
Gradosde Medias
Razn Significancia de
cuadrados
libertad
F(F)
ajustadas
(Degrees
productos
(Adjusted
of
cruzados
sumof
freedom)
(Sumof
squares)
cuadrados
of y
cuadrticas
F(Sig.)
squares
andcross
products)
razonamientoestadsticoeselmismoyFseinterpretaigual,inclusoseutilizaelmismo
cuadrodeladistribucinF(tabla3,apndice4oenSTATSaValoresdeFalnivelde
confianza de .05 y .01). Solamente que las inferencias y conclusiones se hacen al
considerarquelasmediasdelavariabledependiente,atravsdelascategorasdelas
variables independientes, se han ajustado, de este modo eliminan el efecto de la
covariableocovariables.
EJEMPLO
Diseodeinvestigacinqueutilizaelanlisisdecovarianza
Hi:lostrabajadoresquerecibanretroalimentacinverbalsobreeldesempeodeparte
desusupervisormantendrnunnivelmayordeproductividadquelostrabajadoresque
reciban retroalimentacin sobre el desempeo por escrito, y ms an que los
trabajadoresquenorecibanningntipoderetroalimentacin.
Hi: 1
>
(verbal)
(porescrito)
>
3
(ausencia)
Elinvestigadorplanteaundiseoexperimentalparaintentarprobarsuhiptesis.
Sinembargo,nopuedeasignaraleatoriamentealostrabajadoresalostresgruposdel
experimento. El diseo sera con grupos intactos (cuasiexperimental) y se
esquematizaraas:
G1
X1
G2
X2
G3
Asimismo, el investigador presupone que hay un factor que puede contaminar los
resultados (actuar como fuente de invalidacin interna): la motivacin. Diferencias
iniciales en motivacin pueden invalidar el estudio. Como la asignacin al azar est
ausente, no se sabe si los resultados se ven influidos por dicho factor. Entonces, el
3
Retroalimentacin(variable
independientecategrica)
Productividad(variable
dependiente)
ANCOVA
Motivacin
(covariable)
Figura8.8Ejemplodondelamotivacinescovariable
Cabe destacar que, para introducir una covariable en el anlisis, de preferencia debe
medirseantesdeliniciodelexperimento.
Elanlisisdecovarianzaquitaalavariabilidaddeladependienteloquesedebeala
covariable. Ajusta la varianza de la variable dependiente en las categoras de la
independiente, al basarse en la covariable. En el ejemplo, ajusta la varianza de la
productividad debida a la motivacin, en las categoras experimentales (tratamientos o
grupos). El ajuste se realiza sobre la base de la correlacin entre la covariable y la
dependiente.Estosemuestraesquemticamenteenlatabla8.4.
Tabla8.4Ejemplodeundiseodeinvestigacinqueutilizaelanlisisdecovarianzacomo
herramientaparaajustardiferenciasenmotivacinentrelosgrupos
Covariable
Calificacinen
motivacin
Variable
independiente
Tipode
realimentacin
Variable
dependiente
Puntuacionesen
productividadajustadas,
tomandoencuentala
covariable
G1
X1
G2
X2
G3
G2=36
La correlacin entre la calificacin en motivacin y las puntuaciones en
productividadeslabaseparaelajuste.
G3=38
Glentre=K1=31=2
Glintra=NK=107
F=1.70
Comparamosconelvalordelatablarespectiva:enelnivelde0.05esiguala3.07,y
nuestra razn F a 1.70 es menor a este valor. Por tanto, rechazamos la hiptesis de
investigacin y aceptamos la hiptesis nula. Esto se contrasta y profundiza con las
mediasajustadasdelosgruposqueproporcioneelanlisisdecovarianza(nolasmedias
obtenidas en el experimento por cada grupo, sino las ajustadas con base en la
covariable).
RecordemosqueSPSSyMinitabnosproporcionanautomticamentelasignificancia
deF.
Queslaregresinmltiple?
Esunmtodoparaanalizarelefectodedosomsvariablesindependientessobreuna
dependiente. Asimismo, constituye una extensin de la regresin lineal slo que con
mayornmerodevariablesindependientes.Esdecir,sirveparapredecirelvalordeuna
variable dependiente, cuando se conoce el valor y la influencia de las variables
independientes incluidas en el anlisis. Si queremos conocer el efecto que ejercen las
variables:a)satisfaccinsobrelosingresospercibidos,b)antigedadenlaempresa,c)
motivacin intrnseca en el trabajo y d) percepcin del crecimiento y desarrollo
personal en el trabajo; sobre la variable permanencia en la empresa (duracin o
estancia), el modelo de regresin mltiple es el adecuado para aplicarlo a los datos
obtenidos.Otroejemploseraelsiguiente:
VARIABLESINDEPENDIENTES
Diseodeestrategiasde
cooperacinentremaestrosparala
enseanzaenlasclases.
VARIABLE
DEPENDIENTE
Gradodeutilizacindela
tecnologacomputacionalenel
aula.
Desempeoescolar
delosalumnos
Gradodeinvolucramientodelos
padresenlasestrategiasde
enseanza.
Gradodecooperacinytrabajoen
equipoporpartedelosalumnos
pararealizarlastareas.
Figura8.9Esquemadeunmodeloconunavariabledependienteyvariasindependientes,
dondeseconoceelefectodecadaunadestas
Esdecir,elmodeloderegresinmltiplenosindica:
Larelacinentrecadavariableindependienteylanicadependiente(cmocambios
enlaindependientesevinculanconcambiosenladependiente).
Larelacinentretodaslasvariablesindependientes(enconjunto)yladependiente
(cmocambiosenlasindependientessevinculanconcambiosenladependiente).
Laprediccindeladependienteapartirdelasindependientes.
Lacorrelacinentrelasvariablesindependientes(colinealidad).
Las variables independientes se denominan predictoras4 y anteceden
temporalmentealavariabledependienteocriterio.
La informacin bsica que proporciona la regresin mltiple es el coeficiente de
correlacinmltiple(R)ylaecuacinderegresin.
4Trminoanglosajn.
Variableindependiente
1
Variable
independiente2
Variable
dependiente
Figura8.10
Esquemadeuncoeficientededeterminacinocorrelacinparcial
R2(expresaen
porcentajelavarianza
compartidaporlastres
variables)
Este coeficiente (R2) resulta til tambin para determinar la cantidad de varianza
que una variable interviniente explica tanto de la variable independiente como de la
dependiente,deestemodo,sepuederemoverlavarianzacompartidadelainterviniente
conlavariableindependienteoladependiente(Creswell,2005;Sengupta,2009),quees
algosimilaraloqueseefectaconelanlisisdecovarianza.
Talseraelcasodeunarelacindelsiguientetipo:
Autoestimadelestudiante
relacinnegativa
(independiente)
Consumodeestupefacientes
(dependiente)
Reforzamientodelos
valoresdelestudiante
porpartedesustutores
(interviniente)
relacinnegativa
Figura8.11Ejemplodelcoeficientededeterminacin(correlacinparcial)
Siresumimoslovistoenelcaptulo10dellibrosobrecorrelacinyregresinlineal
yloexpuestohastaaqu,tenemosloscoeficientesqueseresumenenlatabla8.5.
Tabla8.5Resumendecoeficientesdecorrelacinbivariadaymltiple
Coeficiente
Pearson
Smbolo
r
Informacinproducida
Grado de asociacin entre dos variables
(oscilaentre0y1).
Coeficientede
determinacin
r2
Varianzadefactorescomunes(porcentaje
delavariacindeunavariabledebidoala
variacin de la otra variable y viceversa).
Oscilaentre0y100%.
Mltiple
Correlacinentrelavariabledependiente
R2
Otra informacin relevante producida por el anlisis de regresin mltiple son los
valores beta ( o b) que indican el peso o la influencia que tiene cada variable
independiente sobre la dependiente, al controlar la varianza de todas las dems
independientes. Cada peso beta es un coeficiente que seala la magnitud de la
prediccin de una variable independiente para una variable dependiente (criterio),
despus de remover los efectos de todas las dems independientes. Los valores beta
estnestandarizados,esdecir,noimportaquecadavariablepredictoraestmedidaen
una escala diferente (como ocurra con las puntuaciones z) y se interpretan como el
coeficientedePearson,de1.00a+1.00(Creswell,2005).
Tambin el anlisis proporciona coeficientes de correlacin bivariados entre la
dependienteycadaindependiente(Shaw,2009).
Parapredecirvaloresdelavariabledependienteseaplicalaecuacinderegresin
mltiple:
y=a+b1X1+b2X2+b3X3+bkXk
Dondeaesunaconstantederegresinparaelconjuntodepuntuacionesobtenidas,
b1,b2,b3,bksonlospesosbetadelasvariablesindependientes.MientrasqueX1,X2,
X3yXksonvaloresdelasvariablesindependientesquefijaelinvestigadorparahacer
laprediccin.
La variable dependiente debe estar medida en un nivel por intervalos o de razn.
Lasindependientes,encualquierniveldemedicin(elmodeloestandarizamediciones).
Cuando se utilizan variables categricas (nominales u ordinales, como gnero, grupo
tnico, nivel jerrquico, etc.) se transforman en variables dummy y se introducen al
modelo como predictores. Los cdigos dummy son series de nmeros asignados para
Seguirelordenenquesehanintroducidoenestudiosprevios.
Procederdeacuerdoconlateora.
Normalizacin(formalizacindepolticasendocumentos).
Innovacindepartamental.
Desempeo(ndicedeproductividaddelempleado).
Motivacingeneral.
Antigedadenlaempresa(enmeses).
Satisfaccingeneraleneltrabajo.
Liderazgo(percepcindelsuperiorinmediatocomolder).
Cultura(arraigodelaculturaorganizacionaldefinidaporladireccindela
empresa).
Pago(salario).
Primero.Sepresentanlasvariablesintroducidasenelmodeloderegresin:
Tabla8.6Variablesintroducidasenelejemploderegresinmltiple
Variablesintroducidas/eliminadas
Modelo
Variables
Variables
introducidas(a)
eliminadas
Pago
Innovacin
Antigedad
Motivacin
Normalizacin
Procesodecalidad
Cultura
Identificacin
Desempeo
Liderazgo
Satisfaccin
Comunicacin
a. Todaslasvariablessolicitadasintroducidas
b. Variabledependiente:clima
Mtodo(b)
Introducir
Hora
Nombredelparticipante
Codificador
Fecha
Condicinexperimental
Categora
Subcategora
10 20 30 40
50 1
10 20 30 40 50 2
10 20 30 40 50 3
Distancia
Alejamiento(0)
fsica
Acercamiento(2)
Esttico(1)
Movimientos Tensin(0)
corporales
Relajacin(2)
Ninguno(1)
Alsujeto(1)
Aotraparte(0)
Conducta
F.completas(1)
verbal
F.dictomas(0)
Silencios(0)
Conducta
visual
Nota:Seagregaronlassubcategorasestticoenlacategoradistanciafsicayningunoenlacategoramovimientoscorporales.
Figura7.11Primerejemplodeunformatoderegistroocodificacin
66
Figura7.12Segundoejemplodeunformatoderegistroocodificacin
Elejemplodelafigura
7.12 es un formato para registrar conductas inapropiadas en la clase y analizar
cules son las que se presentan con mayor frecuencia y el nmero de estudiantes
involucrados(Creswell,2005).
Los nmeros (columnas) representan episodios de conducta inapropiada en la
clase (cada vez que ocurre). Se coloca en la fila CI (conducta inapropiada) la letra
inicialdelaconducta(ejemplo:O,ofensaverbal;H,hablarenclase),y1sisonotras.
Asimismo,enlafilaNseindicaelnmerodeestudiantesinvolucradosenelepisodio.
67
68
Participantecompleto:
totalinteraccin,su
rolprimarioes
participarygenerarla
interaccin.
Participante
observador:surol
primarioesparticipar,
perocasialapar
observa.
Observador
participante:surol
primarioesobservar,
aunquetieneciertas
participaciones.
Observador
completo:nula
participacin,se
limitaaobservar
Patton(2001)sugierequeelobservadordebeubicarseenvarioscontinuospara
establecersupapel(queesunaubicacinaproximadaynoexacta):
69
intermedia,decortaestanciayenfocada.Mientrasquelaobservacincualitativa
esparticipante,abierta,prolongadaygeneral.
8. Seleccionar a los observadorescodificadores. Puesto que son las personas que
habrn de codificar la conducta, deben conocer las variables, categoras y
subcategoras.Lashabilidadesmsimportantesdeunbuenobservadorson:
Selectividadpararegistrarloqueobserva,deacuerdoconreglas.
Uso de todos los sentidos, particularmente ante lo que no se esperaba
encontrar.
Capacidad para seguir el sistema de registro que involucra el
procesamientodeinformacin.
9.
10.
70
71
2. Llevaracabolacodificacinporobservacin.
3. Vaciarlosdatosdelashojasoformatosdecodificacinyobtenertotalesparacada
categora.
4. Realizarlosanlisisapropiados.
CODIFICACINENELANLISISDECONTENIDOYLAOBSERVACIN
Unavezrecolectadoslosdatosdelanlisisdecontenidoy/olaobservacin,tambin
stosdebencodificarse,esdecir,asignarcdigos(generalmentenumricos)alas
categorasy/osubcategoras.Porejemplo,enelcasodelestudiodeNavesyPoplawsky
(1984),lacodificacineslaquesemuestraenlatabla7.10(quecorrespondealprimer
ejemplodeunformatoderegistroocodificacin,figura7.11).
Tabla7.10EjemplodecodificacinenelcasodelestudiodeNavesyPoplawsky
Cdigos
Columnas
1
2
Alejamiento
Acercamiento
Esttico
Tensin
Relajacin
Ninguno
Alsujeto
Aotraparte
Frasescompletas
Frasesdictomaso
silencios
0
2
1
0
2
1
1
0
1
0
Variable
Categoras
Subcategoras
Tratamiento
experimental
Conducta
Codificador
Grupocultural
Gruposociopsicolgico
Distanciafsica
Movimientoscorporales
Conductavisual
Conductaverbal
72
LRE
1
6
MRM
APY
3
Desdeluego,NavesyPoplawsky(1984)paralascategorasdeconductadeevitacinobtenanesta
codificacincada10segundos(cadaunidaddeanlisis),ysumabanelnmerode2(dos)y1(uno)y
lotransformabanenporcentaje.Aqusuponemosquetodalainteraccinconelsupuestodeficiente
mentalpuedecategorizarseysubcategorizarse.Recordemosqueeran30participantes.
YlamatrizdeSPSSoequivalenteseraladelafigura7.13(desdeluego,solamente
seincluyen10casosamaneradeejemplo).
Figura7.13Matrizovistadelosdatosparalacodificacindelatabla7.10(Navesy
Poplawsky)
RECOPILACINYANLISISDEDATOSSECUNDARIOS
73
1. Personaseconmicamenteactivasenelsistemafamiliar.
2. Distribucindeltiempolibredelestudiante.
3. Convivenciadelalumnoenelhogar(padresyotrosparientes).
4. Estructuradelsistemamatrimonialdelostutoresdelestudiante(padres
casados,divorciados,separados,etctera).
5. Ocupacindelaspersonaseconmicamenteactivasenelhogar.
6. Persona(s) con quien(es) los estudiantes se comunican ms dentro del
hogar.
1Porejemplo,enMxicolapublicaperidicamenteelConsejoNacionalContralasAdicciones(CONADIC).
74
75
Peroelinvestigador,aunquenogenerestosdatos,tieneaccesodirectoaellos(a
la informacin individual y original; a los cuestionarios, registros, etc.) y, por lo tanto,
los puede volver a analizar (incluso a veces puede identificar a los encuestados o sus
perfiles).
1. Oficinasyagenciasgubernamentalesyoficiales(MinisteriodeEducacin,
Ciencia y Tecnologa de Argentina; Ministerio de Educacin y Ciencia de
Espaa; Direccin de Impuestos y Aduanas Nacionales de Colombia;
Instituto Nacional de Estadstica de Bolivia; Ministerio de Industria,
Turismo, Integracin y Negociaciones de Per; Banco Central de
Venezuela;etctera).
2. Organizaciones privadas (Cmara de Comercio de Santiago de Chile,
Consejo de Fundaciones Privadas de Guatemala, Fundacin Cultural
EspaolaparaelFomentodelaArtesana,CentrodeEstudiosEconmicos
delSectorPrivadoenMxico,FundacinFord,entreotras).
Algunas bases de datos privadas contienen archivos periodsticos, como
por ejemplo: U.S. News Archives on the Web (peridicos en Estados
76
Unidos),ReutersyEuroprensa(UniversidadComplutensedeMadrid),etc.
Los peridicos ms importantes del mundo generalmente poseen su
propiabasededatos.
3. Organizaciones no gubernamentales (Agencia de Cooperacin en
Ingeniera Ambiental o ACIA, Pro Amazonia "Selva Para la Vida", Alianza
Cvica en Mxico, Red 2002 de Barcelona para el apoyo de enfermos de
SIDA,yotras).
4. Organizacionesinternacionales(ComisinEconmicaparaAmricaLatina
y el Caribe; Organizacin de las Naciones Unidas para la Educacin, la
Ciencia y la Cultura, UNESCO; Organizacin Mundial de la Salud, OMS;
FondodelasNacionesUnidasparalaInfancia,UNICEF;FondoMonetario
Internacional,FMI;etctera).
Las primeras tres fuentes genricas varan en cada pas, por lo que
resultara imprctico intentar mencionarlas. Por ello, cada estudiante o
profesor debe tener en mente cules son y qu tipo de informacin pueden
proporcionar.2
Delosdatosresultafundamentalconocer:3
Elnombreylafiliacininstitucionaldequienrecolectlosdatos.
Elperiododerecopilacindelosdatos.
Lamuestra(mtododeseleccin,tamao,caractersticas).
Elmtododerecoleccindelosdatos,incluyendoel
instrumento,procedimiento,confiabilidadyvalidez,etctera.
Localizacin(disponibilidad).
Ydeserposible:
Procedimientosdecodificacin.
Anlisispracticados.
Sugerenciasparaelanlisis.
Para el caso de Espaa recomendamos a Berganza y Garca (2005) y a Corbetta (2003) y la siguiente
pgina
web:
http://www.typicallyspanish.com/html/castellano/sociedad/gobierno/organizaciones_no_gubernament
a
les/. Para las organizaciones no gubernamentales latinoamericanas, por ejemplo, en el caso del medio
ambiente, la siguiente direccin en internet incluye una gran cantidad de ellas:
http://www.ecoportal.net/content/view/
full/158
3
Aplicatambinalosdatosmicro.
2
77
c) Datos cualitativos micro: producidos por una persona y recabados por otra. Al
investigador le llega el dato (cartas recopiladas por otros, transcripciones de
entrevistas hechas por psiclogos, grabaciones de las llamadas de pasajeros que
iban en los aviones secuestrados por terroristas en los atentados a las torres
gemelasdelWorldTradeCenterenNuevaYork,etc.).Talesdatospuedenvolvera
seranalizadosporelinvestigador.
Lasventajasdelosdatossecundariosresidenenquesucostoesgeneralmente
elmsbaratodetodoslosmtodosderecoleccinyavecessonlanicaopcin
para el investigador (Smith, 2008; Sieppert, McMurtry y McClelland, 2005),
adems pueden replicarse estudios con base en ellos. Gran cantidad de datos
secundarios se localiza mediante internet. Sus desventajas potenciales consisten
en que a veces no son accesibles, no estn estandarizados, pueden haberse
omitidovariablesimportantesparanuestroestudioyesfactiblequedenunafalsa
impresindeciertossubgrupos(lospromediosdeingresonacionalpercpita,por
ejemplo,suelenresultarengaosos).
Elprocesoparautilizardatossecundariosenunainvestigacinseresumeenla
figura7.14,adaptadodeSieppertetal.(2005)yKrysik(2005).
78
Analizarlarelacinentreel
planteamientodelproblemay
losdatossecundarios:
Sonpertinentesparael
estudio?
Representan
adecuadamenteuna
operacionalizacindenuestras
variables?
Prepararlosdatosparasu
anlisis.
Evaluarlacalidaddelosdatos:
Muestra
Confiabilidad
Validez
Mtododerecoleccin
Fuentedeorigen
Enelcasodedatos
estadsticos,verificarlos
preferentementeenalmenos
dosfuentesconfiables
(validacincruzada).
Figura7.14Procesoesencialparautilizardatossecundarios
ParaelmanejodearchivosserecomiendaconsultaraWebb,CampbellySchwartz
(2000).
Elmetaanlisis
Esta clase de procedimiento de recoleccin y anlisis de los datos implica sintetizar
resultados de investigacin por medio de un nmero de estudios que consideran el
mismoplanteamientoyvariables(WiersmayJurs,2008).
Los pasos de un metaanlisis son muy similares a los de otros estudios, con la
salvedad de que ahora la unidad de anlisis ya no es el participante o caso, sino la
investigacinrealizadaporotro(s)investigador(es).Elretoesresumirlosdatosapartir
delosdiferentesestudiosdemaneramuybienestructurada,queeviteerroresyfacilite
suulterioranlisis.
Cabesealarqueelmetaanlisissermsprecisoentremshomogneosseanlos
estudiosqueseconsideran,encuantoalapreguntadeinvestigacin,variables,mtodo,
instrumentosdemedicinyanlisisestadstico.Porlotanto,elprimerpasoconsisteen
ponderarsiesposiblecombinarlos(nosreferimosnicamenteaestudioscuantitativos).
79
Tal consideracin nos puede llevar a un sinfn de opciones, desde descubrir que hay
varios estudios que son totalmente compatibles y pueden mezclarse, hasta contrastar,
aquellosqueslotienenuntemensuscuestionariosquenosseadeutilidad.
Existen diferentes propuestas para conjuntar estadsticamente los resultados de
distintos estudios, destacan tres fundamentalmente, que se conocen con el nombre de
modelodeefectosfijos,modelodeefectosaleatoriosy,porltimo,elmodelobayesiano
(Molinero,2003).
En el modelo de efectos fijos, los estudios se combinan y se asume que no existe
heterogeneidad entre ellos, que por lo tanto todos constituyen estimaciones de un
efecto real, cuya magnitud se desea conocer. As pues, la inferencia realizada se
condicionaalosestudiosefectuados.
Lautilizacindemodelosbayesianosrequieredemodelosestadsticoscomplejos
devarianza.
El metaanlisis constituye un intento de resolver contradicciones entre los
resultados de diferentes investigaciones y evaluar patrones comunes en distintos
estudios.Esunmtodosumamenteimportanteparagenerarteora.
Como todo mtodo inferencial, tiene sus problemas y limitaciones. Uno de los
principales problemas es que al ser un estudio que generalmente se ejecuta de forma
retrospectiva, tiene una posibilidad mayor de introducir sesgos (error sistemtico).
Otros retos son los que se derivan del procedimiento de combinar datos de mltiples
estudios, entre los cuales pudiera haber diferencias en cuanto a mtodo y muestreo
(Smith,2008).
El procedimiento general de un metaanlisis es similar al de los datos
secundarios,peroseagreganalgunoselementoscomoelanlisismismo(figura7.15).
80
Evaluarsiel
metaanlisispuede
responderal
planteamientodel
problema
Definirloscriteriosde
seleccindelosestudios
quedebenserincluidos
enelanlisis(criteriosde
inclusinyexclusin)
Analizarlarelacinentreel
planteamientodelproblemaylos
estudios:
Sonpertinenteslosestudiospara
lainvestigacinplanteada?
Qutanhomogneoso
heterogneosresultanyenqus
puedenconjuntarseyenquno?
Prepararlos
datosparasu
anlisis
Seleccionarlosestudios
quehabrndeincluirse
Analizarlos
datos
a)Elegirlosaspectos,dimensiones
y/ovariablesenlascualesvana
conjuntarseocompararse.
b)Evaluarlacalidaddelosestudios:
Muestra
Confiabilidad
Validez
Mtododerecoleccin
Fuentedeorigen
Otrosparmetros:veaelltimo
captulodelCD
Figura7.15Procesoesencialdelmetaanlisis
AlgunasrecomendacionesparaelmetaanlisislasproporcionanCspedes(1995)
yHarpe(2009):
1. Seleccionarinvestigadoresindependientesquelean,clasifiquen,codifiquen,
cuantifiquen y finalmente evalen y elijan el grupo de estudios que sern
incluidosenelmetaanlisis(MA).
2. Elaborar una gua de los datos que deben ser recolectados de los estudios
escogidosparaserprocesadosenelMA.
3. Combinar los resultados obtenidos y asegurar la calidad de los datos y su
procesamientoestadsticoadecuado.
4. Preferentementeutilizardatosprovenientesdemuestrasaleatorias.
81
El anlisis estadstico general para el modelo de efectos fijos (no existe hetero
geneidad, hay homogeneidad o las investigaciones que se estiman muestran un efecto
uniforme, debido al uso de un mismo tratamiento), se utiliza el mtodo de Mantel
HaentzelPeto.
Si los estudios son heterogneos al mostrar el efecto ante un tratamiento
(modelo de efectos aleatorios), se utiliza el mtodo de CochranDersimonianLaird
(Cspedes,1995).
En general, se obtiene para las estadsticas calculadas, el tamao del efecto
(Nugent,2009,WiersmayJurs,2008,yGlass,1976),elcualserevisenelcaptulo10
dellibro.Recordamosqueesunamedidadelafuerzadeladiferenciadelasmediasu
otros valores considerados (Creswell, 2005). Resulta ser una medida en unidades de
desviacinestndar.Suclculofueejemplificadoconlapruebat.
Existendiversosprogramascomputacionalesparaelmetaanlisis,entreloscuales
seencuentranlossiguientes:
EasyMA[M.Cucherat].Lyon,France:
UniversityofLyon.http://www.spc.univlyon1.fr/~mcu/easyma
BUGSyWinBUGS:http://www.mrcbsu.cam.ac.uk/bugs
STATA.http://www.stata.com
MetaWin:http://www.metawinsoft.com
82
EJEMPLOSDEESTUDIOS
BASADOSENDATOSSECUNDARIOS
Shuli et al. (2008) efectuaron una investigacin para desarrollar un modelo que
predijeralapermanenciadepersonasancianasensuhogar(enlugardeacudiraasilos,
por ejemplo), utilizando datos secundarios de 9879 individuos de la base de datos
pblicadeEstadosUnidos:TheNationalHomeandHospiceCareSurvey2000(NHHCS
2000). Descubrieron que el principal predictor de la permanencia es que la persona
viva con familiares. Asimismo, Smith (2009) se fundament en anlisis de datos
secundariosparaestudiarlasinequidadesenlaeducacinbritnica,especficamentela
exclusindeescuelas.
Hernndez Sampieri et al. (2008) realizaron un estudio de mercado utilizando
datossecundariosconlafinalidaddeindagarsobrelaconvenienciadeabrirclnicasde
cirugaestticayplsticaenMxico.Buscandoendiversasfuentesdeinternet,medios
impresos(revistasydiariosdecirculacinnacional)ybasesdedatos,lograronubicara
lasprincipalesclnicasqueoperabananivelnacionalyenlasregionesyciudadesms
pobladas del pas (Ciudad de Mxico, Monterrey, Guadalajara, Tijuana, Puebla),
establecer los precios de sus servicios, determinar el mercado potencial y sus
caractersticas (por ejemplo, nmero de cirugas que se practicaron durante el ltimo
ao, inters por practicarse una ciruga plstica, preocupacin por la esttica
personal),evaluarlasapelacionesdesupublicidadyotrascuestiones.Haberrealizado
unaencuestahubierasidomspreciso,perotambinmscostoso,detalmodoquese
hizounainvestigacindeacuerdoconelpresupuestodelinversionistaespaol.Incluso
le proveyeron de un anlisis del marco jurdico mexicano para abrir y operar tales
clnicas.
Estudioparaeldiagnsticomunicipal
En las anteriores ediciones de esta obra, se integraba un ejemplo para diagnosticar y
caracterizar a un municipio, con el fin ltimo de elaborar su plan de desarrollo.
Regularmente estos diagnsticos son estudios mixtos, pero una parte muy importante
de sus insumos lo constituyen los datos secundarios, que se generan con base en
indicadores,loscualessehandesarrolladopordiferentesorganizacionesdedicadasala
83
84
Erroresenlasmediciones
Esta parte se escribe porque es una pregunta que se nos ha hecho constantemente
sobrelostiposdeerroresenlamedicin.
Encualquierinstrumentodemedicinsetieneungradodeerror(recordemoslo
sealadoenelcaptulo9dellibroyaliniciodeestecaptulo).
Imaginemos que realizamos la evaluacin de la autoestima en un grupo de
estudiantes.Silamidoundaylavuelvoamediraldasiguiente,yposteriormenteala
semana;podemosesperarquelaspuntuacionesseanlasmismasenlastresmediciones.
Laautoestima comootrosatributosno varan a travs del tiempo,a menos que algo
los haga variar (un estmulo, la maduracin de la persona, un suceso de vida, entre
otros).Esdecir,silosestudiantesobtuvieronpuntuacionesdiferentesenlaspruebas,su
desempeosedebialainfluenciadeotromotivodistintoasupropiaautoestima.Estas
otras razones provocan error. El grado en que un instrumento se encuentra libre de
error indica su confiabilidad. Entre ms fiable resulta un instrumento, el investigador
puedeacercarseaunaverdaderaestimacindelatributoconsiderado.Talexactitudse
obtienealminimizarlasfuentesdeerrorenlamedidadeloposibleyconlaestimacin
del grado de error que permanece. Pues bien, hay dos tipos de errores que pueden
ocurrir: sistemticos y no sistemticos. Los primeros maximizan o minimizan el
desempeodeuninstrumentoyafectanalavalidez(Mertens,2005).Enelejemplode
laautoestima,unmtodoparadesarrollarlaofortalecerla(porejemplo,motivacionalo
teraputico)puedeservistocomounainfluenciasistemticaenlavariableoatributo.El
efectodelerrorsistemticoenlasrespuestasesconstanteypuedepredecirse.Perolos
errores no sistemticos (que conciernen a los investigadores) varan de situacin en
situacin (aplicaciones distintas) y en consecuencia no pueden predecirse (o es
sumamentecomplejo),perosprevenirse.
Estos errores pueden caer en tres categoras: a) personales (dependen de cada
individuo, como el estrs, el cansancio o la motivacin), b) condiciones de
administracin del instrumento (instrucciones distintas a los respondientes,
temperaturaambiental,lenguaje,etc.)yc)modificacionesenlosinstrumentosotareas
(por ejemplo, cambios en tems o las conductas a observar). Normalmente, la
confiabilidad es calculada mediante una estadstica que compara el desempeo de los
mismosindividuosentiemposdiferentesopartesdistintasdelinstrumentoyqueoscila
85
entreceroyuno,sufinesprecisamenteayudaralinvestigadoraidentificarelgradode
errorquesepresentaenlamedicin,ensuconsistenciainterna;mediantelafiabilidady
unanlisisdelinvestigadorsedebenhacertransparenteslasfuentesdeerror.
BIBLIOGRAFA
86