Você está na página 1de 24

Anlisis de Investigacin

Distribucin normal
swilk
Ho

distribucin continua
Ha no distribucin continua
swilk hc
bysort sexo : swilk hc

. swilk costo
Shapiro-Wilk W test for normal data
Variable

Obs

costo

289

0.62221

V
77.868

z
10.204

Prob>z
0.00000

Distribucin normal
ANALISIS PARAMETRICO
variable
continua
2
2 variables
continuas
Correlacin
pearson

t
student

anova

+
2

cuantitativ
a
categrica

Distribucin no normal
ANALISIS NO PARAMETRICO
variable
continua
2
2 v.
continuas o
una ordinal
Correlacin
spearman

U de
MannWhitney +
2
Kruskalwallis

cuantitativ
a
categrica
2 variables
categricas
chi
cuadrado

ANALISIS PARAMETRICO
Distribucin normal
T

students
Una variable
continua y una
variable
categrica
(dicotmica)

ttest costo, by(sexo)

Varianzas iguales o no iguales

ttest costo, by(sexo), unequal

ANOVA
Una

variable
continua y una
variable
categrica mas
de 2 )

oneway costo alta

Varianza iguales o no iguales

Comando mas usado en la


elaboracin de tablas
tabstat

xxxxx, s(n, mean, sd, median, p25, p75)


tabstat xxxxx, s(n, mean, sd, median, p25, p75,
skewnes, kurtosis)
tabstat xxxxx, s(n, mean, sd, median, p25, p75,
ske, kur)

Edison Bedoya Y Diego Echavarria

Prueba Chi Cuadrado

Existe concordancia entre la concordancia de los valores esperados


y los valores observados
. tab viremia_alta desnutrido, row nokey exp chi2
viremia_al
ta

desnutrido
0

Total

12
8.1
37.50

20
23.9
62.50

32
32.0
100.00

9
12.9
17.65

42
38.1
82.35

51
51.0
100.00

Total

21
21.0
25.30

62
62.0
74.70

83
83.0
100.00

Pearson chi2(1) =

4.1005

Pr = 0.043

ANOVA
Dos

Variables:
Categrica (los grupos)
Cuantitativa (lo medido)
Los promedios de la variable cuantitativa
varan entre los grupos (categoras)?

Nota: si se trata solamente de dos grupos se hace test t .

Anova, para ms de dos grupos.

T de student
La

prueba T de Student de grupos


independientes difiere si las varianzas
difieren entre los grupos, debiendo
agregarse la opcin unequal

Para

evaluar si las varianzas son


comparables o no se utiliza el
comando sdtest

ttest
sdtest

x, by (sexo)

unequal
ttest x, by (sexo) unequal

ANOVA
1.

Muestras provienen de poblacin con


distribucin normal y con similares DS
(para hablar de similitud de DS siga la regla 2:1).

La varianza de cada grupo es un


estimativo de la varianza de la poblacin.
3. La varianza mezclada (pooled) de los
grupos puede utilizarse para calcular IC
de la diferencia de pares de promedios.
2.

Tests para comparar medias


Scheff

Si tamao de los grupos es diferente


Interesa adems contrastes (Ej: grupo 1 y 2 vs 3)
Tukey

Si tamao de los grupos es igual


Inters prinicipal es comparar solo promedios de
grupos
Bonferroni

No se haba previsto comparar grupos


Utilizar solamente si resultado en ANOVA es p<0,05

oneway
oneway

-- One-way analysis of

variance

13

. oneway

costo alta

Source
Between groups
Within groups
Total

Analysis of Variance
SS
df
MS
2.6241e+09
2.3374e+10

2
286

1.3120e+09
81725740.2

2.5998e+10

288

90269491.3

Bartlett's test for equal variances:

Prob > F

16.05

chi2(2) = 136.5137

0.0000

Prob>chi2 = 0.000

Prueba F significancia menos de 0.005

Prob (significancia p).explica si tienen varianzas


iguales

14

Prueba de Mann-Whitney
Equivalente

no paramtrico a una
prueba de hiptesis de promedios
para dos muestras

Determina

si una variable tiene


valores mas altos en una poblacin
que en otra. NO COMPARA LOS
PROMEDIOS!!!

Util

si el tamao de muestra es
pequeo o la distribucin es
demasiado sesgada Edison Bedoya Y Diego Echavarria

15

Edison Bedoya Y Diego Echavarria

16

Prueba de Kruskal-Wallis
Extension

de la prueba de MannWhitney a mas de dos poblaciones

Equivalente

no paramtrico del
anlisis de varianza

TAMPOCO

COMPARA PROMEDIOS:
determina si una poblacin tiene
valores diferentes (mas altos o mas
bajos) que las otras poblaciones
17

Edison Bedoya Y Diego Echavarria

18

oneway costo alta, t


alta

Summary of costo
Mean
Std. Dev.

Freq.

0
1
2

12374.286
8754.3
16333.333

7625.5899
3782.5416
13844.901

105
100
84

Total

12272.422

9501.0258

289

Source
Between groups
Within groups
Total

Analysis of Variance
SS
df
MS
2.6241e+09
2.3374e+10

2
286

1.3120e+09
81725740.2

2.5998e+10

288

90269491.3

Bartlett's test for equal variances:

Prob > F

16.05

chi2(2) = 136.5137

0.0000

Prob>chi2 = 0.000

19

oneway costo alta, t bon sid


sch
. oneway costo alta, t bon sid sch

Summary of costo
Mean
Std. Dev.

alta

Freq.

0
1
2

12374.286
8754.3
16333.333

7625.5899
3782.5416
13844.901

105
100
84

Total

12272.422

9501.0258

289

Analysis of Variance
SS
df
MS

Source
Between groups
Within groups
Total

2.6241e+09
2.3374e+10

2
286

1.3120e+09
81725740.2

2.5998e+10

288

90269491.3

Bartlett's test for equal variances:

Row MeanCol Mean

0
-3619.99
0.013

3959.05
0.009

16.05

chi2(2) = 136.5137

0.0000

Prob>chi2 = 0.000

7579.03
0.000
Comparison of costo by alta
(Scheffe)

-3619.99
0.017

3959.05
0.012

Row MeanCol Mean

Prob > F

Comparison of costo by alta


(Bonferroni)

Row MeanCol Mean

7579.03
0.000
Comparison of costo by alta
(Sidak)

-3619.99
0.013

3959.05
0.009

7579.03
0.000

20

Anlisis entre dos variables


continuas

40

o pearson, variables continuas con distribucin


normal
pwcorr xx yy, sig
spearman, variables ordinal o v. c. sin
distribucin normal
spearman x y
scatter pcr te
twoway (scatter xx yy)
pcr
1.0000

te

0.0748
0.3322

te
pcr
20

pcr

30

pcr te, sig

10

1.0000

. pwcorr

te

10

15

Pruebas para contrastar la correlacin en


un grupo
-la hiptesis nula es que el ndice de correlacin de
Pearson sea 0
-la hiptesis alternativa es que no lo sea.
El estadstico de contraste es el siguiente:

rxy n2
t
1 r2
xy

Si la hiptesis nula es cierta, dicho estadstico sigue una


distribucin t de Student con n-2 grados de libertad.

Presentacin de tablas

Edison Bedoya Y Diego Echavarria

23

Gracias

24