Você está na página 1de 16

FacultaddeCienciasSociales

DepartamentodeSociologa
SoftwareyanlisisdedatosparalasCienciasSociales

GuaPrctica:TestdeHiptesisenStata
PorCatalinaCanals
Contenidos

ValoresPerdidos
TestdeNormalidad
TestdeIgualdaddeVarianza
TestdeMediasyTestdehomocedasticidaddeloserrores
Testdeproporciones
TestdeSimetra

Para poder realizar estos distintos test utilizaremos tres bases de datos: (1) CASEN 2011, la cual tiene
muchos casos (n grande) y muestras independientes, (2) Base de Datos investigadores 20062007 la cual
tiene46casosymuestrasindependientes;(3)Pases18002009lacualtienengrandeynpequeo(segn
la variable) y muestras relacionadas. La segunda corresponde a una seleccin de una investigacin
desarrolladaporC.Galleguillos,C.CanalsyA.VsquezsobrelosganadoresdeproyectosFONDECYTregular
en Ciencias Sociales. La tercera corresponde a selecciones de bases de datos que tienen como fuente
www.gapminder.org,yquefueronconstruidasparaunainvestigacinsobreProgresosocialdesarrolladapor
P.RazetoyC.Canals(IFICC).Cadapartedelaguautilizarunadelasbasesdedatos.

IPARTE.MuestrasGrandeseindependientes:CASEN2011

Valoresperdidos
Antes de hacer cualquier test es relevante asegurarse de que el programa (Stata en este caso) considere
comoperdidoslosvaloresquenosonrelevantesparalostest.Especficamentenosreferimosalosvalores
fuera delrangoposible. Realizaremosel procedimiento para queStatareconozca los valores perdidosen
todaslasvariablesautilizar,estasson:

ytrabaj(IngresoLaboral)
sexo
educ(Niveleducacional)

Enprimerlugarpediremosestadsticosdescriptivosbsicosdelavariable,parareconocerfcilmentelos
valoresperdidos:
summarizeytrabajsexoeduc

Variable|ObsMeanStd.Dev.MinMax
+
ytrabaj|11993564065.2924104.402.20e+07
sexo|270651.528912.499172612
educ|270653.7226682.68159808

Latablapermiteobservarqueparalavariablesexo,elrangofluctaeneldebido(1y2),porloquenohay
problema con esta variable. Lo mismo sucede con la variable educ que va entre 1 y 8 que es lo pre
establecido.

Respectoalavariableingresolaboral,notamosquehaypersonasquetienencomoingresoelvalor=0,sin
embargo, los casosen que tieneningreso laboral =0 son aquellos que notrabajany queporendenoson
relevantesparaelanlisis,porelloconsideraremosestoscomoperdidos.Paraellogeneraremosunanueva
variable"ytrabajR"conelsiguientecomando:
generateytrabajR=ytrabajifytrabaj>0

Estecomandoindicaquegenereunanuevavariableidnticaalaoriginalsiesqueenlavariableoriginalel
valoresmayorque0;sinosecumplelacondicinelcasoquedarconvalorperdido.

TestdeNormalidad
EnprimerlugaranalizaremossilavariableIngresoLaboralsedistribuyenormalmente.Dadoquelamuestra
esgrandeutilizaremoseltestdeKolmogorovSmirnnov,paraesoutilizamoselsiguientecomando:
ksmirnovytrabajR=normprob(ytrabajR)

OnesampleKolmogorovSmirnovtestagainsttheoreticaldistribution
normprob(ytrabajR)

SmallergroupDPvalueCorrected

ytrabajR:0.00001.000
Cumulative:1.00000.000
CombinedKS:1.00000.0000.000

Note:tiesexistindataset;
thereare2869uniquevaluesoutof11990observations.

LorelevanteenlosresultadosobtenidosesobservarelvalorPcorregido.EnelTestdeKolmogorovSmirnov
laHiptesisNulaesquelavariableesnormal,porendeenestecasodadoelValorP=0.000Rechazamosla
normalidaddelavariable.

Testdedemedias/medianaspara1muestra
ParapoderponerapruebalaHiptesisnula"Elingresopromediodeloschilenoses=200.000"realizaremos
untestdemediaparaunamuestra,dadoquelamuestraesgrandepodemosutilizarTestToTestZ.Dado
que,parangrandeladistribucinTconvergealanormal,bastarconutilizareltestT.
ttestytrabajR==200000,level(99)

Al utilizar el comando anterior para obtener el Test T obtenemos el valor P para las distintas hiptesis
alternativas.SiH1es"elingresopromediodeloschilenoses<200.000",dadoelValorP=1norechazoH0.
Pero si la hiptesis alternativa es H1: "el ingreso promedio de los chilenos es 200.000", o "el ingreso
promedio de los chilenos es >200.000", el valor P=0,000 por lo cual rechazamos la hiptesis nula. En
definitiva, lo ms preciso que podemos concluir a partir de esta salida es que con 99% de confianza el
promediodeingresodeloschilenosessuperiora200.000pesos.

Onesamplettest

Variable|ObsMeanStd.Err.Std.Dev.[99%Conf.Interval]
+
ytrabajR|11990564206.38440.06924176.9542462.7585949.9

mean=mean(ytrabajR)t=43.1521
Ho:mean=200000degreesoffreedom=11989

Ha:mean<200000Ha:mean!=200000Ha:mean>200000
Pr(T<t)=1.0000Pr(|T|>|t|)=0.0000Pr(T>t)=0.0000

TestdeigualdaddeVarianzas
Ahora queremos poner a prueba la hiptesis nula "el ingreso laboral de los hombres es igual al de las
mujeres", para ello, dado que la muestra de hombres y mujeres son independientes, y dado que las
muestrassongrandespodemosutilizarTestTparamuestrasindependientes.Sinembargo,lapruebaTtiene
variacionesparacuandolosgrupostienenigualydistintasvarianzas.Porendeantesdepoderrealizareltest
necesitamoscorroborarlaHiptesisNula"lavarianzadelingresolaboralenloshombresesigualqueenlas
mujeres".

Dado quesabemosqueelingreso nodistribuyenormalnopodemosusarelTest FdeSnedecorparaesta


hiptesis,yporendeutilizamoseltestdeLevene,queesrobustoalanonormalidad.Paraelloutilizamosel
siguientecomando:
robvarytrabajR,by(sexo)

|SummaryofytrabajR
Sexo|MeanStd.Dev.Freq.
+
Hombre|657187.6711013516680
Mujer|447235.37614997.915310
+
Total|564206.29924176.9211990

W0=210.872803df(1,11988)Pr>F=0.00000000

W50=92.685405df(1,11988)Pr>F=0.00000000

W10=105.626785df(1,11988)Pr>F=0.00000000

LoquehayqueobservareselvalorPparaW0,dadoqueW50yW10sonvariacionesdeltestdeLevene.
DadoqueelValorP=0,000seRechazalahiptesisnuladequelasvarianzassoniguales.Dehecho,enlataba
podemosobservarquelavarianzaenloshombresesmayor.Sabiendoesto,podemosutilizaruntestdeT
paracompararmediassinigualdaddeVarianzas.

Testdemedias/medianaspara2muestrasindependientes
Paratestearlahiptesisnuladequelasmediassoniguales,utilizaremosentonceselsiguientecomando:
ttestytrabajR,by(sexo)unequallevel(99)

Twosamplettestwithunequalvariances

Group|ObsMeanStd.Err.Std.Dev.[99%Conf.Interval]
+
Hombre|6680657187.713475.271101351622467.8691907.6
Mujer|5310447235.48439.688614997.9425488.4468982.4
+
combined|11990564206.38440.06924176.9542462.7585949.9
+
diff|209952.315900.04168989.3250915.3

diff=mean(Hombre)mean(Mujer)t=13.2045
Ho:diff=0Satterthwaite'sdegreesoffreedom=10846.9


Ha:diff<0Ha:diff!=0Ha:diff>0
Pr(T<t)=1.0000Pr(|T|>|t|)=0.0000Pr(T>t)=0.0000

En primer lugar notemos que este test se basa en la diferencia entre ambos promedios, donde diff=
promediodehombrepromediomujer.EntoncessilaH1es"diff<0",loqueesequivalentea"elpromedio
deingresosdelhombrees menorqueeldelamujer",dadoelValorP=1, laH0noserechaza.SilaH1es
diff=0odiff>0,oloqueesequivalentea"elpromediodeingresoslaboralesdeloshombresesdistintoalde
las mujeres" y a "el ingreso laboral de los hombres es mayor que el de las mujeres" respectivamente, el
valorP=0,000,porenderechazamosH0.Ensuma,latablanospermiteconcluirqueelpromediodeingreso
delasmujeresesmenorqueeldeloshombres.

Silasvarianzasfuesenigualesenambosgrupos,elcomandoquehubisemosutilizadosera:
ttestytrabajR,by(sexo)level(99)

Testdemedias/medianaspara3omsmuestras
Ahora queremos evaluar la hiptesis nula de que el ingreso promedio es igual en todos los niveles
educativos,paraellorequeriramoshacerunANOVA,sisecumpleelsupuestodehomocedasticidaddelos
errores, o de lo contrario un Test Kruskal Wallis. Vale sealar que en principio ANOVA tambin tiene el
supuestodenormalidaddelavariable,peroestudioshandemostradoqueesrobustaalaviolacindeeste
supuesto.

Pediremosunatabladefrecuenciadelavariableeduc,paraconocerlascategoras.
tableeduc

Niveleducacional|Freq.
+
SinEduc.Formal|2,929
BsicaIncom.|5,511
BsicaCompl.|2,100
M.Hum.Incompleta|3,859
M.Tc.Prof.Incompleta|612
M.Hum.Completa|4,648
M.TcCompleta|1,561
TcnicoNivelSuperioroProfesionalIn|2,348
TcnicoNivelSuperioroProfesionalCo|3,497

Dado que la variable ingreso laboral no es normal haremos el test BreuschPagan/CookWeisberg para
evaluarhomocedasticidad.ParapoderealizarloenStata,hayquerealizarAnovaantes,paraesoponemos
lossiguientescomandos:

anovaytrabajReduc
hettest

Numberofobs=11990Rsquared=0.1750
RootMSE=839710AdjRsquared=0.1744

Source|PartialSSdfMSFProb>F
+
Model|1.7919e+1582.2399e+14317.660.0000
|

educ|1.7919e+1582.2399e+14317.660.0000
|
Residual|8.4480e+15119817.0511e+11
+
Total|1.0240e+16119898.5410e+11

BreuschPagan/CookWeisbergtestforheteroskedasticity
Ho:Constantvariance
Variables:fittedvaluesofytrabajR

chi2(1)=11102.47
Prob>chi2=0.0000

Notemosquehaydoscomandosparahaceranova:"anova"y"oneway",cuandoqueremosrealizareltest
deBreuschPagan/CookWeisberg,pedimosanova,ycuandoqueremoseltestdeBarlettpedimosoneway.
Ambassalidasdanlosmismoresultadosparaanova,perodistintostestcomplementarios.

ElValorPasociadoalTestdeheterocedasticidades=0,000porendeserechazaH0deigualdaddevarianzas,
lo cual no permite utilizar ANOVA. Pode ende realizaremos el test de Kruskal Wallis. Para realizarlo
utilizamoselsiguientecomando:
kwallisytrabajR,by(educ)
KruskalWallisequalityofpopulationsranktest
++
|educ|Obs|RankSum|
|++|
|SinEduc.|114|384997.50|
|BsicaInc|1069|4.26e+06|
|BsicaCom|1110|4.87e+06|
|M.Hum.In|1440|6.56e+06|
|M.Tc.Pr|218|1.14e+06|
|++|
|M.Hum.Co|3101|1.68e+07|
|M.TcCom|1133|6.01e+06|
|TcnicoNi|1001|6.12e+06|
|TcnicoNi|2804|2.58e+07|
++
chisquared=3439.183with8d.f.
probability=0.0001
chisquaredwithties=3439.807with8d.f.
probability=0.0001

El Test de hiptesis pone a prueba la hiptesis nula de que las medianas de las muestras son iguales. Lo
importanteeselvalorPqueenestecasoes=0,001,esdecircon95%deconfianzarechazamoslahiptesis
nuladelaigualdaddelasmedianas.Estoindicaraquelosingresostiendenaserdiferentesparalosdistintos
niveleseducativos.

Testdeproporcionesparaunamuestra
Igualqueenlaclaseanterior,queremosanalizarlaproporcindepersonasconttulouniversitario.Paraeso
nuevamente generamos la variable TituloU, la cual tendr valor 1 si la gente tiene como mximo nivel
formalalcanzadoeducacinuniversitariaoposgrado,y0sino.
recodee6a(13=1)(12=1)(nonmissing=0),gen(TituloU)

DadoqueeltamaomuestralesgrandepodemosusarunapruebaZparaproporciones.Consideraremosla
Hiptesis nula de que la proporcin de personas con ttulo universitario es =0,5. Para eso utilizamos el
siguientecomando:
prtestTituloU==0.5,level(99)
OnesampletestofproportionTituloU:Numberofobs=27065

Variable|MeanStd.Err.[99%Conf.Interval]
+
TituloU|.1598744.0022277.1541362.1656126

p=proportion(TituloU)z=1.1e+02
Ho:p=0.5
Ha:p<0.5Ha:p!=0.5Ha:p>0.5
Pr(Z<z)=0.0000Pr(|Z|>|z|)=0.0000Pr(Z>z)=1.0000

Losresultadosnosindicaranque,paralasHiptesisalternativasdequelaproporcindepersonasconttulo
universitario es menor que 0,5 y distinto que 0,5, el valor P=0,00 por ende rechazamos hiptesis nula.
MientrasquesilaHiptesisalternativaesquelaproporcinesmayorque0,5,norechazamosH0(P=1).

Testparaproporcionespara2muestras
Ahoraqueremoscompararcmoeslaproporcindepersonasconttulouniversitarioenlasmujeresylos
hombres.Dadoquelamuestraesgrande,utilizamosunTestZ.
prtestTituloU,by(sexo)level(99)
TwosampletestofproportionHombre:Numberofobs=12750
Mujer:Numberofobs=14315

Variable|MeanStd.Err.zP>|z|[99%Conf.Interval]
+
Hombre|.1701961.0033282.1616232.1787689
Mujer|.1506811.00299.1429794.1583828
+
diff|.019515.004474.0079907.0310393
|underHo:.00446294.370.000

diff=prop(Hombre)prop(Mujer)z=4.3727
Ho:diff=0

Ha:diff<0Ha:diff!=0Ha:diff>0
Pr(Z<z)=1.0000Pr(|Z|<|z|)=0.0000Pr(Z>z)=0.0000

Nuevamente este test, al igual que el test t para 2 muestras, utiliza la diferencia, que corresponde a la
proporcinenloshombreslaproporcinenlasmujeres.Enestecaso,considerandolahiptesisnulade
quelasproporcionessonigualesylahiptesisalternativadequesondiferentes,elValorP=0,00porende
rechazamoslahiptesisnulayafirmamosquesondiferentes.ConsiderandolaHiptesisalternativadeque
diff<0,esdecirdequelaproporcindehombresconttulouniversitarioesmenorqueladelasmujeres,el
valorP=1,esdecirnoserechazaH0.ConsiderandolaHiptesisalternativadequediff>0,esdecirdequela
proporcindehombresconttulouniversitarioesmayorqueladelasmujeres,elvalorP=0,00,esdecirse
rechazaH0.

IIPARTE.Muestraschicaseindependientes:Investigadores20062007

TestdeNormalidad
Analizaremos la normalidad de las siguientes variables, para lo cual, dado que el tamao muestral es
pequeo,realizaremoselTestdeShapiroWilks.
Numerodeposgradosdelinvestigador(NPosgrad)
AodeEgresodelpregrado(AoPregr)

Paraestoutilizamoselsiguientecomandoelcualnosentregaeltestparacadavariable:
swilkAoPregrNPosgrad

ShapiroWilkWtestfornormaldata

Variable|ObsWVzProb>z
+
AoPregr|460.943052.5091.9520.02547
NPosgrad|460.998040.0865.1941.00000

LosvaloresPentregadosnospermite,paraelcasodelAodeegresodepregrado,con95%deconfianza,
rechazar la hiptesis nula de normalidad de la variable, y para el caso de la cantidad de Posgrado, no
rechazarlahiptesisnuladenormalidaddelavariable.

Testdedemedias/medianaspara1muestra
En primer lugar, queremos poner a prueba la hiptesis nula de que la cantidad de posgrados de los
investigadoreses=2;paraello,dadoqueneschico,perolavariabledistribuyenormal,podemosrealizarun
testt.
ttestNPosgrad==2,level(99)

Onesamplettest

Variable|ObsMeanStd.Err.Std.Dev.[99%Conf.Interval]
+
NPosgrad|461.586957.1226758.8320281.2570091.916904

mean=mean(NPosgrad)t=3.3670
Ho:mean=2degreesoffreedom=45

Ha:mean<2Ha:mean!=2Ha:mean>2
Pr(T<t)=0.0008Pr(|T|>|t|)=0.0016Pr(T>t)=0.9992

Considerandolahiptesisalternativadequelamediaes<2,dadoelValorP<0,05rechazamoslahiptesis
nula. Considerando la hiptesis alternativa de que la media es 2, dado el Valor P<0,05 rechazamos la
hiptesis nula. Considerando la hiptesis alternativa de que la media es >2, dado el Valor P>0,05 NO
rechazamoslahiptesisnula.Esdecir,losresultadosdeestetestindicaraqueelpromediodeposgradode
losinvestigadoresesmenorque2.

Tambinqueremosanalizarcmosonlasmedia/medianasdelavariableAodeegresodePregrado,pero
estanoesnormal,porenderequerimosutilizareltestdesignosoeltestderangosdeWilcoxon.Parasaber
sipodemosutilizaresteltimo,analizaremoslasimetradelavariable.
sktestAoPregr

Skewness/KurtosistestsforNormality
joint
Variable|ObsPr(Skewness)Pr(Kurtosis)adjchi2(2)Prob>chi2
+
AoPregr|460.04620.76834.200.1222

ElvalorPparaeltestdesimetra(Skewness)es=0,04<0,05porendenoserechazalahiptesisnuladeque
lavariableessimtrica.Estonospermiterealizarambostest.

PararealizareltestdeWilcoxon,realizamoselsiguientecomando:
signrankAoPregr=1995

Wilcoxonsignedranktest

sign|obssumranksexpected
+
positive|9490.51575
negative|362659.51575
zero|4711281128
+
all|9242784278

unadjustedvariance65952.50
adjustmentforties11.75
adjustmentforzeros8930.00

adjustedvariance57010.75

Ho:AoPregr=1995
z=4.542
Prob>|z|=0.0000

ElValorP=0,00nospermiterechazarlahiptesisnuladequelamedianaes=1995.Ahorarealizaremosel
testdesignos.

signtestAoPregr=1995

Signtest

sign|observedexpected
+
positive|922.5
negative|3622.5
zero|4747
+
all|9292

Onesidedtests:
Ho:medianofAoPregr1995=0vs.
Ha:medianofAoPregr1995>0
Pr(#positive>=9)=
Binomial(n=45,x>=9,p=0.5)=1.0000

Ho:medianofAoPregr1995=0vs.
Ha:medianofAoPregr1995<0
Pr(#negative>=36)=
Binomial(n=45,x>=36,p=0.5)=0.0000

Twosidedtest:
Ho:medianofAoPregr1995=0vs.
Ha:medianofAoPregr1995!=0
Pr(#positive>=36or#negative>=36)=
min(1,2*Binomial(n=45,x>=36,p=0.5))=0.0001

Los resultados muestran que si consideramos la hiptesis nula de que la mediana es =1995, y la hiptesis
alternativadequelamedianaesmayor1995,elValorP=1,esdecirNorechazamoslahiptesisnula.Mientras
queconsiderandocualquieradelasotrashiptesisalternativas,rechazamosH0.Estoindicaraquelamediana
esmenorque1995.

TestdeVarianzas
Ahoraestamosinteresadosenpodercompararcmoeslacantidaddeposgrados,ydeaosdepregradopara
lasinvestigadoresresponsablesycoautores.Comosabemosquelacantidaddeposgradoesnormal,sabemos
quepodemosutilizaruntestdetparamuestrasindependientes.Paraello,debemosevaluarsirequerimosel
test T para igualdad de varianza o no. Para evaluar esto podemos utilizar el Test F de Snedecor, ya que se
cumpleelsupuestodenormalidad.Paraelloutilizamoselsiguientecomando:
sdtestNPosgrad,by(Investig)
Varianceratiotest

Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]
+
coautor|351.6.1309307.77459671.3339171.866083
Investig|111.545455.3122831.035725.84964472.241264
+
combined|461.586957.1226758.8320281.3398751.834038

ratio=sd(coautor)/sd(Investig)f=0.5593
Ho:ratio=1degreesoffreedom=34,10

Ha:ratio<1Ha:ratio!=1Ha:ratio>1
Pr(F<f)=0.10102*Pr(F<f)=0.2020Pr(F>f)=0.8990

Loque interesa esprobarla Hiptesis Nula de queelratiode las desviacionesestndares iguala 1 (esto
implica que ambas desviaciones estndar son iguales). Notamos que, independiente de la hiptesis
alternativa,lahiptesisnula,con95%deconfianza,noserechaza.

Testdemedias/medianasparadosmuestras

Los resultados anteriores nos permiten hacer un test t para 2 muestras independientes sin igualdad de
varianzas,atravsdelsiguientecomando:
ttestNPosgrad,by(Investig)level(99)

ttestNPosgrad,by(Investig)level(99)

Twosamplettestwithequalvariances

Group|ObsMeanStd.Err.Std.Dev.[99%Conf.Interval]
+
coautor|351.6.1309307.77459671.2427691.957231
Investig|111.545455.3122831.035725.55574462.535164
+
combined|461.586957.1226758.8320281.2570091.916904
+
diff|.0545455.2907319.7281858.8372767

diff=mean(coautor)mean(Investig)t=0.1876
Ho:diff=0degreesoffreedom=44

Ha:diff<0Ha:diff!=0Ha:diff>0
Pr(T<t)=0.5740Pr(|T|>|t|)=0.8520Pr(T>t)=0.4260

Latabladeresultadosmuestraque,independientedelahiptesisalternativa,lahiptesisnuladeigualdad
decantidaddeposgradosentreinvestigadoresresponsablesycoautoresnoserechaza.

Por su parte, para comparar las medias/medianas de la variable Ao de egreso de pregrado entre ambos
tiposdeinvestigadoresnopodemosutilizardichotestporquelavariablenoesnormal.portanto,dadoque
sonmuestrasindependientes,podemosutilizarlaUdeMannWhitney.
ranksumAoPregr,by(Investig)

TwosampleWilcoxonranksum(MannWhitney)test

Investig|obsranksumexpected
+
coautor|35807.5822.5
Investig|11273.5258.5
+
combined|4610811081

unadjustedvariance1507.92
adjustmentforties4.65

adjustedvariance1503.27

Ho:AoPregr(Investig==coautor)=AoPregr(Investig==Investig)
z=0.387
Prob>|z|=0.6988

ElValorPparaesteTestessuperiora0,05porendenoserechazalahiptesisnuladeigualdaddemedianas
entreinvestigadoresresponsablesycoautoresenlavariableAodeegresodepregrado.

Testde1muestraparaproporciones
ParaprobarlahiptesisnuladequelosinvestigadoresganadoresdefondecytenCienciasSocialestienenla
mayoraposgrados,secontrastarlahiptesisnula:laproporcindeinvestigadoresconposgradoes=0,5.
Dadoquelamuestraespequea,seutilizareltestbinomial.
bitestTenerPos==0.5

Variable|NObservedkExpectedkAssumedpObservedp
+
TenerPos|4642230.500000.91304


Pr(k>=42)=0.000000(onesidedtest)
Pr(k<=42)=1.000000(onesidedtest)
Pr(k<=4ork>=42)=0.000000(twosidedtest)

Losresultadosmuestranque,considerandolahiptesisalternativadequelaproporcinesdistintade0,5al
serelvalorP<0,05serechazaH0.Ademssiconsideramoslahiptesisalternativadequelaproporcines
mayorque0,5,serechazaH0(PValor=0,000),ysiseconsideralahiptesisalternativadequelaproporcin
esmenorque0,5,NoserechazaH0(PValor=1).Porendeconcluimosqueefectivamentemsdelamitadde
losinvestigadoresganadoresdefondecyttieneposgrado.

Testdemedias/medianaspara3omsmuestras
Queremos comparar ahora cmo vara la cantidad de posgrados de los investigadores, segn si estos
publicanpoco,msomenos,omucho(1,2y3respectivamenteenlavariableGpublic).Parasaberquetest
usar, dado que el n es chico, pero normal, requerimos saber si hay homocedasticidad. Para saber si hay
homocedastidicad,dadoquesabemosquelacantidaddeposgradosesnormalusaremoseltestdeBarlett.
ParahacereltestdeBarlettrequerimoscomputarANOVAconelsiguientecomando:
onewayNPosgradGpublic

AnalysisofVariance
SourceSSdfMSFProb>F

Betweengroups.5485559092.2742779540.460.6350
Withingroups20.262254934.595948674

Total20.810810836.578078078

Bartlett'stestforequalvariances:chi2(2)=0.5518Prob>chi2=0.759

Los resultados nos muestra que no se rechaza la hiptesis nula de homocedasticidad (P Valor>0,05), por
endepodemosrealizarANOVA.LosresultadosdeANOVAindicanqueelvalorP=0,6porendenoserechaza
la hiptesis nula de igualdad de promedio de posgrado en los distintos grupos segn su nmero de
publicaciones.

IIIPARTE.Muestrasindependientes:Pases19802009
La Base de datos Pases 18002009 contiene datos del PIB, Esperanza de Vida, Poblacin e ndice de
Democracia (donde 10 es mxima democracia y 10 mnima) para los aos 1800, 1900, 1980 y 2009. Nos
gustara comparar los aos 18001900 y 1980200, pero para eso queremos saber para qu variables
podemosconsiderarngrandeparaellopedimosunresumendetodaslasvariables.

summarizePOBLACIOPoblacioPoblaci0Poblaci1LEAB1800LEAB1900LEAB1980LEAB2009PIB1800
PIB1980PIB1900PIB2009DEMO2009DEMO1980DEMO1900DEMO1800

Variable|ObsMeanStd.Dev.MinMax
+
POBLACIO|22741847462.43e+07343.22e+08
Poblacio|22771150343.22e+07794.00e+08
Poblaci0|2271.96e+078.32e+07639.83e+08
Poblaci1|2273.00e+071.24e+0801.33e+09
LEAB1800|15531.438713.4866792540
+
LEAB1900|2740.222227.0565482753

LEAB1980|19361.3678810.510133476
LEAB2009|19368.787569.9823524683
PIB1800|227725.8624383.35602716.87
PIB1980|2278878.50211230.14079534.57
+
PIB1900|2271422.7771166.02806624.3
PIB2009|22710243.8213825.4074138.28
DEMO2009|1613.6894416.3148991010
DEMO1980|1341.7462697.5110811010
DEMO1900|53.73584916.0958721010
+
DEMO1800|206.74.402153104

EnlatablaobservamosquelapoblacinyPIBtienenngrandetodoslosaos,porloqueadmiteTestT.La
esperanzadevidatienengrandeen1980y2009,yDemocraciatienenchicoparatodoslosaos.

Testdemediasparamuestrasgrandesrelacionadas
Nos gustara poder comparar cmo vara el PIB entre 1980 y 2009, para ello, dado que el n es grande,
realizaremosuntestTparamuestrasrelacionadas.
ttestPIB1980==PIB2009,level(99)

Pairedttest

Variable|ObsMeanStd.Err.Std.Dev.[99%Conf.Interval]
+
PIB1980|2278878.502745.370311230.146942.21110814.79
PIB2009|22710243.82917.623713825.47860.05912627.59
+
diff|2271365.322689.274110384.963155.889425.2457

mean(diff)=mean(PIB1980PIB2009)t=1.9808
Ho:mean(diff)=0degreesoffreedom=226

Ha:mean(diff)<0Ha:mean(diff)!=0Ha:mean(diff)>0
Pr(T<t)=0.0244Pr(|T|>|t|)=0.0488Pr(T>t)=0.9756

LatabladeresultadosnosentregalosvaloresPparalasdistintashiptesisalternativas.H0correspondea
queelPIBdelospasesen1980y2009eraigual.SiH1esqueelPIben1980eramenorqueenel2009,con
95% deconfianzarechazamosla hiptesisnula. SiH1esqueelPIben1980eraigualqueenel2009,con
95%deconfianzarechazamoslahiptesisnula.SiH1esqueelPIben1980eramayorqueenel2009,con
95%deconfianzanorechazamoslahiptesisnula.Entonces,podemosconcluirqueen1980,enpromedioel
PIBdelospaseseramenorqueenel2009.

Testdemediasparamuestraschicasrelacionadas
Ademsqueremoscompararcmovaralademocraciaentre1800y1900,paraellodadoquesonmuestras
relacionadasparanpequeo,realizaremosuntestderangosdeWilcoxon.ElTestdeWilcoxonesthecho
parautilizarunavariabledeagrupacin,entoncescopiaremosloscasosdelao1800comonuevoscasos,y
crearemosunavariablegrupo.

ParaelloprimeroordenamoslavariableDEMO1800,
sortDEMO1800

Vamosahoraeleditordedatos,copiamoslosdatosvlidosdeDEMO1800ylospegamosbajolavariable
DEMO1900comosifuerannuevoscasos.Luego,enlaltimacolumnarellenamoscon1paraaquelloscasos
donde pegamosnuevosvalores,y con 0 para aquellos de la base original.Luego hacemosdoble clic en la
primerafila,sobrelanuevavariable,paraponerleelnombre"Grupo".

EntoncespedimoselTestdeWilcoxon:
ranksumDEMO1900,by(Grupo)

TwosampleWilcoxonranksum(MannWhitney)test

Grupo|obsranksumexpected
+
0|532279.51961
1|20421.5740
+
combined|7327012701

unadjustedvariance6536.67
adjustmentforties83.49

adjustedvariance6453.17

Ho:DEMO1900(Grupo==0)=DEMO1900(Grupo==1)
z=3.965
Prob>|z|=0.0001

Dado el valor P obtenido=0,0001, rechazamos la hiptesis nula de la igualdad de las medianas para la
democraciadelospasesen1800y1900.

Testdemedias/medianaspara3omsmuestras
Queremos comparar cmo en la actualidad vara el PIB promedio segn el tamao poblacional, para eso
consideraremos los 3 grupos que ordenan a los pases de ms pequeo a ms grande (1 a 3), segn su
poblacin en el ao 2009. Para saber que test usar, dado que el n es grande, requerimos saber si hay
homocedasticidad. A su vez, para saber si hay homocedastidicad, para saber qu test usar, debemos
verificarsilavariableesnormal.Utilizamosentonceseltestdekolmogorovsmirnov:
ksmirnovPIB2009=normprob(PIB2009)

OnesampleKolmogorovSmirnovtestagainsttheoreticaldistribution
normprob(PIB2009)

SmallergroupDPvalueCorrected

PIB2009:0.00001.000
Cumulative:0.83260.000
CombinedKS:0.83260.0000.000

Note:tiesexistindataset;
thereare190uniquevaluesoutof227observations.

Dado el Valor P=0,00 se rechaza la hiptesis nula de normalidad, por ende utilizamos el test Breusch
Pagan/CookWeisberg para testear homocedasticidad. Para esto hay que aplicar antes ANOVA, por ende
ingresamoslossiguientescomandos:

anovaPIB2009Gpob
estathettest

Numberofobs=227Rsquared=0.0256
RootMSE=13707.8AdjRsquared=0.0169

Source|PartialSSdfMSFProb>F
+
Model|1.1077e+0925538305142.950.0545
|
Gpob|1.1077e+0925538305142.950.0545
|
Residual|4.2090e+10224187903257
+
Total|4.3198e+10226191141552

BreuschPagan/CookWeisbergtestforheteroskedasticity
Ho:Constantvariance
Variables:fittedvaluesofPIB2009

chi2(1)=0.20
Prob>chi2=0.6577

DadoelValorP>0,05elTestdehomocedasticidad,noserechazalahiptesisnuladeigualdaddevarianza,
por ende es aplicable ANOVA. Observando ANOVA vemos que el valor P=0,054>0,05 por ende no
rechazamoslahiptesisnuladeigualdaddevarianzaenlos3grupos.Sinembargo,notemosquehay5,4%
deprobabilidadesdetenerlasmediasquetenemosconsiderandoqueestassonrealmenteiguales,locual
es bastante bajo, por lo que nos gustara revisar cmo es la igualdad de medias para cada par de grupo.
ANOVAincluyetestparaestoquesellamantestdepostestimacin.Particularmente,eltestdeBonferroni,
nospermiteponerapruebalahiptesisnuladelaigualdaddemediasdecadapardegrupos:
onewayPIB2009Gpob,bonferronituckey

Este cdigo nos vuelve a entregar los resultados de anova (en otro formato), y adems los resultados de
bonferroni.

ComparisonofPIBinterpoladolinealmentebyGpob
(Bonferroni)
RowMean|
ColMean|12
+
2|5418.05
|0.049
|
3|2342.373075.68
|0.8800.504
Estosltimosmuestranquecon95%deconfianzaserechazalahiptesisnuladeigualdaddemediasparael
grupo1y2,peronoserechazaparalosgrupos1y3y2y3.

ANEXO1:TestdeHiptesisdeMedia/Mediana:QuTestHacer?*

ANEXO2:TestdeHiptesisdeProporciones:QuTestHacer?*

ANEX
XO3:TestdeeHiptesisdeeVarianzas:QuTestH
Hacer?*

XO4:TestdeeHiptesisdeeNormalidaad:QuTesttHacer?*
ANEX

mtricos.
*EnrrojoestnescritoslostesstNoparamtricosyenaazullosparam

Você também pode gostar