Escolar Documentos
Profissional Documentos
Cultura Documentos
INTRODUCCION AL PROGRAMA
ESTADSTICO
TEST ESTADSTICOS
1
Sesin II
Objetivo General:
Conocer y utilizar los comandos mas
comunes usados en R para pruebas o test
estadsticos.
2
1. Test de Chi-cuadrado X2 (Frecuencias)
Anlisis de una Variable categrica con n niveles.
El Test Chi-cuadrado puede usarse como un Prueba de bondad de ajuste.
H0: p = p p=1
H1: p p p1
Problema 1
Supngase que la proporcin observada de hembras vs machos de pepinos de mar en un
rea determinada del intermareal es de 29/29 respectivamente.
salida
Chi-squared test for given probabilities
data: pepino
X-squared = 0, df = 1, p-value = 1
3
Problema 2
Supngase que la proporcin de hembras vs machos de pulpos en un rea determinada del
intermareal rocoso es de 49/9 respectivamente. Genere el vector pulpos y aplique el test de
Chi-cuadrado.
> pulpos<-c(49,9)
> chisq.test(pulpos)
salida
Chi-squared test for given probabilities
data: c
X-squared = 27.5862, df = 1, p-value = 1.502e-07
4
Problema 3. Asignando una probabilidad.
Supngase que la proporcin de hembras vs machos que se espera para una especie de
pez intermareal es desconocida y se quiere probar que ser de un 10%:
H0: p = 0.1
H1: p 0.1
Suponiendo que una muestra aleatoria de 100 erizos de mar encontramos 16 machos.
salida
Chi-squared test for given probabilities
data: pez
X-squared = 4, df = 1, p-value = 0.0455
Caso especial:
6
Problema 4
Supngase que interesa saber si existe asociacin entre el sexo del paciente y su estado de
parasitismo por Taenia solium:
salida
Pearson's Chi-squared test with Yates' continuity correction
data: x 7
X-squared = 5.2714, df = 1, p-value = 0.02168
Problema 5
Interesa determinar si hay diferencias significativas en el porcentaje de personas con
depresin entre dos poblaciones A y B. Para esto, se tom una muestra de 150 personas
de la poblacin A y 200 de la poblacin B, encontrndose 48 y 50 personas con depresin
en cada una de las ciudades respectivamente.
> depresion1<-matrix(c(48,50,102,150),nc=2)
> chisq.test(depresion1,correct=F)
> depresion1<-matrix(c(48,50,102,150),nc=2)
> chisq.test(depresion1)
9
Test exacto de Fisher n<5 en algunas de las celdas
El Test exacto de Fisher, para muestras pequeas, al igual que el Test chi-cuadrado, se puede
obtener a partir de datos tabulados o de variables de un dataframe.
10
2. Test de Student
Anlisis de comparacin de medias.
H0: = 0
H1: 0
Problema 6.
1. Genere el vector idea con 5 datos que permita rechazar la hipotesis nula.
11
Problema 6.
A un total de 10 pacientes con diagnostico de VIH se les midi el nmero de linfocitos T
En la sangre. La siguiente tabla muestra el conteo de linfocitos antes y despus de un
tratamiento naturista.
1.. Genere los vectores de la tabla conservando los nombres de cabecera. Determine si
existen diferencias significativas en el nmero de linfocitos antes y despus del
tratamiento
H0: 1 = 2
H1: 1 2
13
Problema 7
xlab=HTA
P e s o (k g )
ylab=Peso(kg)
col=green # o bien col=3
20 40 60 80
HTA
16
Problema 8.
Genere un grafico de bigotes, lo mas completo posible, para los datos del ejercicio 8.
Propuesta
17
3. Test de Kruskal-Wallis
Anlisis de comparacin de medianas entre dos o mas poblaciones.
18
4. Test de Normalidad
Anlisis para comparar distribuciones de variables frente a una normal.
El comando ks.test permite determinar si un vector x tiene distribucin Normal.
H0: p1 = p2 Son normales
H1: p1 p2 No son normales
xyz=cbind(x,y,z)
> cor(xyz) 20
Grfico de dos variable numricas. Comando plot
El comando plot (adems de hacer el Index Graph) permite hacer un grfico de dispersin de
dos variables numricas.
ylab=Peso(kg)
xlim=c(1.2,1.9)
Peso(kg)
80 100
ylim=c(20,160)
col=forestgreen # borde de symbol
bg=white # interior (default)
60
Talla(mts)
21
Tarea 2.
22
6. Modelos de Regresin.
Es una tcnica para analizar una variable dependiente numrica (Y) frente
a una o mas variables independientes (X) tambin numricas sean
categricas o continuas.
Y = 0 + 1 x1 + + n xn + e
23
Modelos de regresin Lineal simple
24
Problema X.
1. Lee la base datos en Excel llamada bacteria1 y luego bacteria2 en R.
Porque razon bacteria1 no se puede leer?.
2. Realiza una prueba de normalidad para la variable cantbact.
3. Realiza un modelo de regresin lineal simple para cada una de las
variables.
4. Realiza un modelo de regresin lineal mltiple.
25
GRACIAS
26
Grfico de dos grupos de datos: points y legend
El comando points permite agregar puntos a un dispositivo grfico abierto. El
comando legend permite agregar leyendas a un grfico.
> points(x,y) > legend(locator(1))
Ejemplo: grfico de dispersin de peso (eje Y) segn talla (eje X), diferenciando
los puntos segn sexo (1=Masc y 2=Fem).
> plot(peso~talla, main="Peso segn Talla", type="n")
> points(talla[sexo==1],peso[sexo==1], col=black, bg="red", pch=19, cex=1.2)
> points(talla[sexo==2],peso[sexo==2], col=black, bg="green", pch=19, cex=1.2)
> legend(locator(1), pch=c(19,19), col=c("red","green"), c("Masc","Fem"))
27
Grfico de dos grupos de datos: points y legend
Masc
Fem
80 100
peso
60
40
talla
28
BONUS TRACK
Agregar lnea de tendencia a un plot
El comando abline permite agregar una lnea de tendencia (regresin lineal simple) a
un grfico de dispersin. El intercepto y pendiente se pueden obtener de un modelo
(ajustado con comando lm) o se pueden indicar directamente en abline.
> plot(peso~talla)
> abline( lm(peso~talla) )
Talla(mts)
29