Você está na página 1de 4

Universidad T

ecnica Federico Santa Mara


Departamento de Matematica

Profesor: Ronny Vallejos

Clase 16: Variables Aleatorias Continuas Cont.


QQ-Plot
El QQ-plot es un grafico que permite observar la concordancia o desviacion de una muestra desde
la distribucion normal. A continuacion describiremos su construccion.
Consideremos que disponemos de las variables X1 , X2 , . . . , Xn . Primero se ordenan estas observaciones. Recordemos que hemos denotado X(1) , . . . , X(n) las variables ordenadas. Calculamos los
valores porcentuales de tal manera que a la observacion i-esima le corresponde el porcentaje
100(1 0 5)/n, i = 1, 2, . . . , n.
Por otro lado se determinan los percentiles 100(1 0 5)/n, i = 1, 2, . . . , n desde la distribucion
normal. El grafico de los pares en el plano correspondientes a los percentiles teoricos versus los
percentiles muestrales se denomina QQ-plot.
En el software R es posible generar este tipo de graficos. Consideremos
x=rnorm(100,0,1)
qqnorm(x)
qqline(x,col=2)
Estos comandos generan el grafico que se muestra en la siguiente figura.
Normal Q-Q Plot

2
1
-3

-2

-2

-1

Sample Quantiles

0
-1

Sample Quantiles

Normal Q-Q Plot

-2

-1

-3

Theoretical Quantiles

-2

-1

Theoretical Quantiles

Note que el grafico de la izquierda ha sido generado con 100 observaciones provenientes de una
distribucion N (0, 1) mientras que el grafico de la derecha ha sido generado con 300 observaciones
provenientes de la misma distribucion. Claramente el patron del grafico de la derecha se ajusta
mejor a la lnea recta indicada con color rojo.
Observaci
on 1. Notemos que este tipo de herramientas visuales tambien pueden ser usadas
cuando se trabaja con otras distribuciones. Es decir, la construccion de los percentiles teoricos y
muestrales no es una tecnica dise
nada exclusivamente para la distribucion normal.
MAT-043

Noviembre 26, 2013

Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Profesor: Ronny Vallejos

0
-2

Sample Quantiles

Normal Q-Q Plot

-3

-2

-1

Theoretical Quantiles

Note que en la figura que se muestra arriba, la cual fue generada (con 200 observaciones)
desde una distribucion t student con 5 grados de libertad se muestra una desviacion desde la lnea
recta especialmente en la parte superior del grafico. Entonces podemos poner en duda que estos
datos provienen de una distribucion normal. Como este es un ejemplo en que hemos simulado las
observaciones desde otra distibucion, este es un patron esperado.

Test de Kolmogorov-Smirnov
El test de Kolmogorov- Smirnov (K-S) es una prueba de hipotesis dise
nada para chequear la
normalidad de una muestra de tama
no n.
Sea X1 , X2 , . . . , Xn una muestra de tama
no n proveniente de una variable aleatoria con funcion
de distribucion FX (x). Sea F0 (x) la funcion de distribucion propuesta. Entonces planteamos las
hipotesis
H0 : FX (x) = F0 (x)
versus
H1 : FX (x) 6= F0 (x).
Para dilucidar entre estas dos hipotesis construimos la funcion de distribucion emprica. Denotamos
los datos ordenados como X(1) , X(2) , . . . , X(n) . Entonces la distribucion emprica se define como

o, x < x(1) ,
Sn (x) = nk , x(k) x < x(k+1) ,

1, x > x(n) .
Luego, una forma de medir la discrepancia entre las funciones F0 (x) y Sn (x) es usando la distancia
MAT-043

Noviembre 26, 2013

Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Profesor: Ronny Vallejos

maxima entre estas funciones en los puntos observados X1 , X2 , . . . , Xn . Es decir,


Dn = max{Sn (x) F0 (x)}.
x

Para tomar una decision repecto a las hipotesis H0 y H1 consideramos una probabilidad de error
maximo del 5%. Por otro lado el valor p se calcula usando la distribucion de Dn y calculando la
probabilidad de la cola superior desde el valor observado de Dn . Luego
si p > se rechaza H0
si p < No se rechaza H0
En R podemos correr el siguiente codigo para testear si una muestra de 200 n
umeros aleatorios
provienen de una distribucion normal.
x=rnorm(200,0,1)
ks.test(x,"pnorm")
El output de R es el siguiente:
One-sample Kolmogorov-Smirnov test
data: x
D = 0.0512, p-value = 0.6701
alternative hypothesis: two-sided
Si consideramos = 0.05, claramente p > . Por lo tanto, de acuerdo al test K-S no se rechaza la
hipotesis de que la muestra proviene de una distribucion normal.

Teorema de Cambio de Variables


Teorema 1. Sea X una variable aleatoria continua con una funcion de densidad de probabilidad
dada por fX (x), x A. Sea
Y = g(X)
una funcion diferenciable y 1-1. Entonces la funcion de densidad de probabilidad de Y es:
1
dg (y)
1
Ig(A) (x).
fY (y) = fX (g (y))
dy
Este teorema permite encontrar la densidad de funciones de variables aleatorias de nuestro
interes.
Ejemplo 1. Sea X U [0, 1]. Consideremos Y = ln(X). Determine fY (y), E[Y ] y V[Y ]. Note
que
fX (x) = I[0,1] (x).
Tambien note que g(X) = ln(X) es diferenciable y 1-1. Entonces
g 1 (y) = ey y
MAT-043

dg 1 (y)
= ey .
dy
3

Noviembre 26, 2013

Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Profesor: Ronny Vallejos

Por el teorema de transformacion tenemos que




fY (y) = fX (ey ) ey I(0,+) (y) = ey I(0,+) (y).
Claramente Y Exp(1), entonces E[Y ] = 1 y V[Y ] = 1.
Ejemplo 2. Sea X N(, 2 ). Encuentre la densidad de la variable
Z=

X
.

Esta es una funcion lineal, por lo tanto es diferenciable y 1-1. Luego


1
2
fZ (z) = fX (z + ) || IR (z) = ez /2 IR (z)
2
Luego Z N (0, 1).
Ejercicio. Sea X (1/2, 2). Considere la transformacion Y =
densidad de la variable Y.

MAT-043

X. Encuentre la funcion de

Noviembre 26, 2013

Você também pode gostar