Escolar Documentos
Profissional Documentos
Cultura Documentos
2
1
-3
-2
-2
-1
Sample Quantiles
0
-1
Sample Quantiles
-2
-1
-3
Theoretical Quantiles
-2
-1
Theoretical Quantiles
Note que el grafico de la izquierda ha sido generado con 100 observaciones provenientes de una
distribucion N (0, 1) mientras que el grafico de la derecha ha sido generado con 300 observaciones
provenientes de la misma distribucion. Claramente el patron del grafico de la derecha se ajusta
mejor a la lnea recta indicada con color rojo.
Observaci
on 1. Notemos que este tipo de herramientas visuales tambien pueden ser usadas
cuando se trabaja con otras distribuciones. Es decir, la construccion de los percentiles teoricos y
muestrales no es una tecnica dise
nada exclusivamente para la distribucion normal.
MAT-043
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica
0
-2
Sample Quantiles
-3
-2
-1
Theoretical Quantiles
Note que en la figura que se muestra arriba, la cual fue generada (con 200 observaciones)
desde una distribucion t student con 5 grados de libertad se muestra una desviacion desde la lnea
recta especialmente en la parte superior del grafico. Entonces podemos poner en duda que estos
datos provienen de una distribucion normal. Como este es un ejemplo en que hemos simulado las
observaciones desde otra distibucion, este es un patron esperado.
Test de Kolmogorov-Smirnov
El test de Kolmogorov- Smirnov (K-S) es una prueba de hipotesis dise
nada para chequear la
normalidad de una muestra de tama
no n.
Sea X1 , X2 , . . . , Xn una muestra de tama
no n proveniente de una variable aleatoria con funcion
de distribucion FX (x). Sea F0 (x) la funcion de distribucion propuesta. Entonces planteamos las
hipotesis
H0 : FX (x) = F0 (x)
versus
H1 : FX (x) 6= F0 (x).
Para dilucidar entre estas dos hipotesis construimos la funcion de distribucion emprica. Denotamos
los datos ordenados como X(1) , X(2) , . . . , X(n) . Entonces la distribucion emprica se define como
o, x < x(1) ,
Sn (x) = nk , x(k) x < x(k+1) ,
1, x > x(n) .
Luego, una forma de medir la discrepancia entre las funciones F0 (x) y Sn (x) es usando la distancia
MAT-043
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica
Para tomar una decision repecto a las hipotesis H0 y H1 consideramos una probabilidad de error
maximo del 5%. Por otro lado el valor p se calcula usando la distribucion de Dn y calculando la
probabilidad de la cola superior desde el valor observado de Dn . Luego
si p > se rechaza H0
si p < No se rechaza H0
En R podemos correr el siguiente codigo para testear si una muestra de 200 n
umeros aleatorios
provienen de una distribucion normal.
x=rnorm(200,0,1)
ks.test(x,"pnorm")
El output de R es el siguiente:
One-sample Kolmogorov-Smirnov test
data: x
D = 0.0512, p-value = 0.6701
alternative hypothesis: two-sided
Si consideramos = 0.05, claramente p > . Por lo tanto, de acuerdo al test K-S no se rechaza la
hipotesis de que la muestra proviene de una distribucion normal.
dg 1 (y)
= ey .
dy
3
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica
X
.
MAT-043
X. Encuentre la funcion de