Você está na página 1de 7

PRUEBAS ESTADSTICA. (PRUEBAS DE BONDAD DE AJUSTE).

En la construccin del modelo de simulacin es importante decidir si un conjunto


de datos se ajusta apropiadamente a una distribucin especfica de probabilidad.
Al probar la bondad del ajuste de un conjunto de datos, se comparan las
frecuencias observadas FO realmente en cada categora o intervalo de clase con
las frecuencias esperadas tericamente FE.
La prueba Ji cuadrada hace uso de la distribucin del mismo nombre para probar
la bondad del ajuste al comparar el estadstico de prueba Xo2 con el valor en
tablas de la mencionada distribucin Ji cuadrada con v grados de libertad y un
nivel de significancia alfa. En la siguiente seccin aplicaremos esta prueba para
probar la hiptesis nula de que los nmeros aleatorios (provenientes de un
generador) se ajustan a la distribucin terica uniforme continua.
Sea X una variable aleatoria discreta con valores x1, x2,......., xn Se propone la
hiptesis nula H0, de que la distribucin de donde proviene la muestra se
comporta segn un modelo terico especfico tal como la uniforme, la exponencial,
la normal, etc. Entonces FOi, representa el nmero de veces que ocurre el valor xi
mientras que FEi, es la frecuencia esperada proporcionada por el modelo terico
propuesto. A menudo ocurre que muchas de las frecuencias FEi, (y tambin las
FOi) son muy pequeas, entonces, como regla prctica adoptamos el criterio de
agrupar los valores consecutivos de estas frecuencias esperadas hasta que su
suma sea de al menos cinco. La medida estadstica de prueba para la hiptesis
nula es:

Para n grande este estadstico de prueba tiene una distribucin X2 aproximada


con V grados de libertad dados por:
V = (k 1) (nmero de parmetros estimados)

As, si se estiman dos parmetros como la media y la varianza, la medida


estadstica tendr (k 3) grados de libertad. Se puede aplicar esta prueba a
variables continuas agrupando adecuadamente los valores en un nmero
adecuado de subintervalos o clases k. Una regla emprica para seleccionar el
nmero de clases es:

EJEMPLO. La siguiente muestra de tamao 50 ha sido obtenida de una poblacin


que registra la vida til (en unidades de tiempo) de bateras alcalinas tipo AAA.
Prubese la hiptesis nula de que la variable aleatoria vida til de las bateras
sigue una distribucin exponencial negativa. Considrese un nivel de significancia
alpha de 5%.

SOLUCIN. Calculamos los valores min = 0.023 y max = 8.223. Resultando ser el
rango o recorrido igual a 8.2. El valor promedio es de 2.3. A continuacin
ordenamos los valores de manera ascendente y construimos el histograma de
frecuencias relativas con seis clases cada una de longitud 1.5. (Esto es debido a
que 8.2 / 6 = 1.3)

Re agrupamos las clases de modo que la FO sea de al menos 5

Como nuestra hiptesis nula es que los datos se ajustan a la funcin de


probabilidad exponencial negativa, emplearemos tal funcin para calcular
mediante integracin el porcentaje de probabilidad esperado para cada
subintervalo. Ya vimos que el valor promedio es de 2.3, sin embargo para fines
prcticos lo consideraremos como 2.0. El clculo de la integral para la primer clase
es:

Entonces se tiene el valor:

Ahora compararemos este valor calculado contra el valor tabulado de la


distribucin Ji cuadrada con un nivel de significancia alpha de 5% y el nmero de
grados de libertad V = (k 1) 1 = (4 1) 1 = 2. (Obsrvese que se estim el
parmetro promedio). Entonces

Como vemos el valor calculado es menor que el valor tabulado, por tanto la
conclusin es que no se puede rechazar la hiptesis nula de que la muestra
proviene de una distribucin exponencial con media 2.0.

Prueba de Kolmogorov - Smirnov


Otra prueba para la bondad de ajuste se apoya en la distribucin de Kolmogorov
Smirnov la que al ser desarrollada para variables continuas la hace ms poderosa
por ejemplo, en el caso de los nmeros aleatorios, que la Ji cuadrada. Por esta
razn, en esta seccin la presentamos para un caso distinto al de la distribucin
continua. Definamos la siguiente funcin de distribucin emprica. Supngase que
Y es una variable aleatoria continua que tiene una funcin de distribucin F(y).
Una muestra aleatoria de n realizaciones de Y produce las observaciones y1,
y2, ..., yn. Reordenemos esos valores observados de menor a mayor, y las yi
ordenadas se representan mediante y(1) y(2) ..., y(n). Es decir, si y1 = 7, y2 = 9 y
y3 = 3, entonces y(1) = 3, y(2) = 7 y y(3) = 9. Ahora bien, la funcin de distribucin
acumulada emprica esta definida por: F n(y) = fraccin de la muestra menor o
igual a y Supngase que se toma una variable aleatoria continua Y, bajo la
hiptesis nula, que tiene una funcin de distribucin representada por F (y). La
hiptesis alterna es que F (y) no es la funcin verdadera de distribucin de es la
funcin verdadera de distribucin de Y. Despus de observar una muestra
aleatoria de n valores de Y, F (y) debe estar cerca de F n(y) siempre y cuando
sea verdadera la hiptesis nula. Por lo tanto, la medida estadstica debe apreciar
la cercana de F(y) a Fn(y) en todo el intervalo de valores de y. La medida
estadstica D de K-S se basa en la distancia mxima entre F(y) y Fn(y), es decir, D
= mx F(y) - Fn(y)
Se rechaza la hiptesis nula si D es demasiado grande. Como F(y) y Fn(y) no
son decrecientes y Fn(y) es constante entre observaciones de muestra, la
desviacin mxima entre F(y) y Fn(y), se presentar ya sea en uno de los puntos
de observacin y1 , ... yn , o inmediatamente a la izquierda de uno de ellos. Para
determinar el valor observado de D, se necesita entonces comprobar tan slo.

Si en H0 se supone la forma de F (y), pero se deja sin especificar algunos de los


parmetros, entonces stos se deben estimar a parir de los datos de la muestra
antes de poder llevar a cabo la prueba. Stephens (1974) dio valores de corte de
reas superiores de 0.15, 0.10, 0.05, 0.025 y 0.01 para una forma modificada de la
tabla K S para D (presentada en el apndice de este libro), los cuales se
muestran en la siguiente tabla para tres casos. Estos casos son para la hiptesis
nula de una F(y) completamente especificada, una F(y) normal con promedio y
variancia desconocidos, y una F(y) exponencial con promedio desconocido.
TABLA DE KOLMOGOROV SMIRNOV DE STEPHENS. Puntos porcentuales
del extremo superior para D modificada.

EJEMPLO. Considrese que las diez observaciones siguientes son una muestra
aleatoria de una distribucin continua. Probar la hiptesis de que esos datos
provienen de una distribucin exponencial con promedio 2, en el nivel de
significacin 0.05. 0.406, 2.343, 0.538, 5.088, 5.587, 2.563, 0.023, 3.334, 3.491,
1.267. Solucin. Se ordenan las diez observaciones ascendentemente y entonces

se calcula, para cada y(i), el valor de F(yi), donde H0 establece que F (y) es
exponencial con teta=2. Por tanto, F(yi) = 1 - e-yi/2 Registraremos los datos
ordenados as como los clculos en la siguiente
TABLA

D+ es el valor mximo en la columna 6 y D- el mximo en la columna 7. Entonces


D + = 0.0886 y D = 0.2901, lo cual da D = 0.2901. Para determinar el valor crtico
a partir de la tabla K - S, se necesita calcular.

Você também pode gostar