Você está na página 1de 30

UNIVERSIDAD NACIONAL

DECAJAMARCA
• ESCUELA ACADEMICO PROFESIONAL DE INGENIERIA CIVIL

Distribución Log Normal 2 Parámetros Pruebas De Bondad De Ajuste


(Kolmogorov Smirnov y Chi Cuadrado )AGUA EN LA RED
DE DISTRIBUCION
ALUMNO: CAMPOS BARBOZA WILMER
CURSO: INGENIERIA DE DRENAJE CERDAN CUEVA WILMER IVAN
CHUGNAS RAMIREZ OSCAR
DOCENTE: Ing. JULIO PAIMA ARROYO JULCA CASAS MARCO
Distribución Log Normal 2 Parámetros Pruebas De
Bondad De Ajuste (Kolmogorov Smirnov) y Chi Cuadrado

• La distribución Log Normal de 2 Parámetros es muy usada para el


cálculo de valores extremos por ejemplo Qmax, Qmínimos, Pmax,
Pmínima .
• Por otro lado con las pruebas de bondad de ajuste lo que se desea es probar
la hipótesis que un modelo de probabilidad teórico (normal, exponencial,
poissón etc) en particular será un modelo satisfactorio de la población en
estudio.
I. OBJETIVOS

GENERAL.
Conocer la aplicación de la distribución Log Normal de 2 Parámetros y la prueba de bondad de ajuste de
Kolmogorov Smirnov y Chi Cuadrado.
ESPECIFICOS.
 Aplicar la distribución de Log Normal de 2 Parámetros en problemas de Hidrología.
 Aplicar la prueba de bondad de ajuste de Chi cuadrado para determinar cuándo un conjunto de datos sigue una
distribución teórica.
 Aplicar la prueba de bondad de ajuste de Kolmogorov Smirnov para determinar cuándo un conjunto de datos sigue
una distribución teórica
I. REVISION TEORICA

1. Distribución Log Normal 2 Parámetros.


función de distribución de probabilidad es

Donde X y S son los parámetros de la distribución.


Si la variable x de la ecuación se reemplaza por una función y=f(x), tal que y=log(x), la función puede normalizarse,
transformándose en una ley de probabilidades denominada log –normal, N(Y, Sy).
Los valores originales de la variable aleatoria x, deben ser transformados a y = log x, de tal manera que:

Donde Y es la media de los datos de la muestra transformada.

Donde Sy es la desviación estándar de los datos de la muestra transformada.


EJEMPLO DE APLICACIÓN
Un proyectista en hidráulica necesita considerar la
probabilidad de excedencia utilizando la función log normal de
2 parámetros, de la serie de descargas medias anuales
(m3/seg) de la estación hidrométrica aguas arriba de la
bocatoma para riego, en el rio majes para fines de desarrollo
de nuevos cultivos. Se pide:
a) Estimar la probabilidad de descargas menores a 75 m3/ seg.
b) Un cierto cultivo experimental requiere entre 120 m3/seg y
60 m3/seg de módulo de descarga media anual para su
crecimiento, estimar la probabilidad entre dichos.
hallamos la media y la desviación
estándar de Y=Ln(Q)

(u) = 4.55171419
= 0.18118163

A) estimar la probabilidad de
descargas menores a 75 m3/ seg

x=75m3/seg
hallamos:
Y=Ln(X)=Ln(75) = 4.317488114
sabiendo que:

Y=U+ *z
 4.3174  4.5517 
PX  75  P  Z    PZ  1.29
 0.18118 

PZ  1.29  0.0985 ……………..De tablas

Como Z es negativo: P  1  P[ Z ]

P  1  0.0985  0.9015
b) la probabilidad de descarga entre 60  Q  120m3 / seg

P  PX  Z 2   PX  Z1 

 Ln(60)  U   Ln(120)  U 
P  P   P  
  

P  PZ  2.52  PZ  1.30

P  1  PZ  2.52  PZ  1.30

P  1  0.0059  0.0968

P  0.9941  0.0968

P  0.8973
PRUEBAS DE BONDAD DE AJUSTE

Las pruebas de bondad de ajuste, consisten en


comprobar gráfica o estadísticamente, si los datos
disponibles se ajustan a una determinada distribución
teórica seleccionada a priori, con los parámetros
estimados con base a los valores muestrales.
¿CUÁLES SON?
Entre las pruebas de bondad de ajuste más conocidas,
cabe mencionar las siguientes:
 Ajuste grafico
 Ajuste estadístico:
- Prueba de Chi Cuadrado
- Prueba de Kolmogorov Smirnov
PRUEBA CHI-CUADRADO
Esta prueba trata de determinar si las frecuencias observadas en la
muestra están lo suficientemente cerca de las frecuencias esperadas
bajo la hipótesis nula formulada.
Para aplicar esta prueba se debe agrupar las observaciones de la
muestra en intervalos de clase, preferiblemente del mismo tamaño.

VALOR ESTADÍSTICO DEL CHI-CUADRADO CALCULADO:


El estadístico de prueba, 2C queda definido por la expresión:

 DONDE:
- Oí: Frecuencia observada en el intervalo i,
de acuerdo a la muestra considerada.
- Ei: Frecuencia esperada en el intervalo i, de
acuerdo a la distribución seleccionada.
- K: Número de intervalos de clase en que se
han agrupado las observaciones.
VALOR TABULAR DE CHI-CUADRADO:

En función:
- Grados de libertad:
g. d. l = k − 1 − p

Donde: NOTA:
K: Número de intervalos de P=2, para la distribución normal.
clase
P=3, para la distribución log-normal de tres
P: Número de parámetros que
definen completamente a la parámetros
distribución seleccionada

- El nivel de significación elegido.


El nivel de significación () usualmente es 5% o
1%
- FUENTE: HIDROLOGIA ESTADISTICA –MAXIMO VILLON
CRITERIO DE DECISIÓN:

- Si el valor estadístico del Chi-cuadrado calculado es menor o igual que el valor tabular, es
decir:
 2C   2t
Entonces, se acepta la hipótesis nula, que establece que los valores observados se
ajustan a la distribución considerada, al nivel de significación seleccionado (usualmente
 = 5% o 1%).
- Si el valor estadístico Chi-cuadrado calculado es mayor que el valor tabular, es decir:
 2C >  2t

Entonces, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, que establece


que los valores observados no se ajustan a la distribución considerada, al nivel de
significación seleccionado (usualmente  = 5% o 1%); siendo necesario probar con otra
distribución teórica.
CONSIDERACIONES:

- El análisis debe efectuarse con datos agrupados en intervalos de


clase.
- El número de intervalos de clase debe ser por lo menos 5, se
recomienda también que, para facilidad de los cálculos, el número
de intervalos de clase no sea mayor a 20.
- Es aplicable solo para ajustes a la distribución normal, puesto que
ha sido desarrollado con base en los datos normales e
independientes.
- En la práctica es usa para cualquier modelo de ajuste, pero
estrictamente es válido para la distribución normal.
APLICACIÓN DE LA PRUEBA CHI-CUADRADO
1.Determinar el Número de Intervalos de Clase 2. Cálculo de la amplitud de cada intervalo:

Método de Sturget:

NC =1+3.332*LOG(N)

 NC = número de intervalos de clase


 N = número de datos El límite inferior del primer intervalo de
clase se determina con la relación:
Método de Yevjevich:

NC =1+1.33*Ln(N) Límite inferior = Xmin - X/2

 NC = número de intervalos de clase


 N = número de datos
APLICACIÓN DE LA PRUEBA CHI-CUADRADO
1.Determinar el Número de Intervalos de Clase 2. Cálculo de la amplitud de cada intervalo:

Método de Sturget:

NC =1+3.332*LOG(N)

 NC = número de intervalos de clase


 N = número de datos El límite inferior del primer intervalo de
clase se determina con la relación:
Método de Yevjevich:

NC =1+1.33*Ln(N) Límite inferior = Xmin - X/2

 NC = número de intervalos de clase


 N = número de datos
APLICACIÓN DE LA PRUEBA CHI-CUADRADO
3. Cálculo de los intervalos de clase, marcas 4. Cálculo de la media y desviación
de clase, frecuencias absoluta y relativa estándar para los datos agrupados
observadas y frecuencia acumulada

 La frecuencia absoluta observada corresponde al


número de valores comprendido en el intervalo de
clase. La suma de todas las frecuencias
absolutas debe ser igual al total de datos, N.
 La frecuencia relativa se obtiene de dividir la Donde:
frecuencia absoluta entre el número de datos, N.
• fi = frecuencia absoluta.
 La frecuencia acumulada resulta de acumular los
• xi = marca de clase.
valores correspondientes a la frecuencia relativa.
La frecuencia acumulada en el último intervalo de • k = número de intervalos de
clase debe dar 1. clase.
• N = Número total de datos.
5. Adoptar alguna distribución probabilística y determinar la frecuencia esperada para
cada intervalo de clase.

6. Calcular los estadísticos chi-cuadrado y aplicar el criterio de decisión:

 2C   2t  2C >  2t
Entonces, se acepta la hipótesis nula, que Entonces, se rechaza la hipótesis nula y
afirma que la serie de datos se ajusta a la se afirma que la serie de datos no se
distribución seleccionada. ajusta a la distribución seleccionada.
EJEMPLO 1:
EJEMPLO 2:
PRUEBA KOLMOGOROV-SMIRNOV

La prueba de ajuste de KOLMOGOROV-SMIRNOV, consiste en comparar las diferencias existentes, entre


la probabilidad empírica de los datos de la muestra y la probabilidad teórica, tomando el valor máximo del
valor absoluto, de la diferencia entre el valor observado y el valor de la recta teórica del modelo, es decir:

Δ=Δmax 𝐹 𝑥 − 𝑃(𝑥)

Δ= estadístico de kolmogorov-smirnov.
F(x)= probabilidad de la distribución teórica
P(x)= probabilidad empírica de los datos, también llamada frecuencia
acumulada

Para un mejor entendimiento desarrollaremos un ejrcicio.


EJEMPLO DE APLICACION:

Realizar la prueba de bondad de ajuste SMIRNOW-KOLMOGOROV, para ver si se ajustan


a una distribución normal:
121.3 26.7 110.1 63.4 122.4 64.2 59.6
144.9 92.8 95.6 76.3 162.1 110.2 40.3
142.4 58.8 48.8 52.3 97.2 144.7 112.2
205.8 57.4 148.3 36.3 52.5 109.2 137.1
114.5 79.0 67.5 88.0 165.6 48.5 32.9
72.5 76.9 70.0
SOLUCION:
1. Calculo de P(x):
Ordenando los datos de los caudales en forma creciente y calculando la probabilidad
empírica P(x), usando la fórmula de Weibull:
𝑚
P(x)= 𝑛+1

2. Calculo de la media y S, de los datos no agrupados:


1
=𝑛 σ 𝑋𝑖 = 92.32

1
S= σ(𝑥 − 𝑥)2 = 42.80
𝑛

3.Calculo de la variable estandarizada Z:


Usando la ecuación:
𝑋−𝑋ത
Z= 𝑆
4. Calculo del F(Z)= F(X) (probabilidad teórica)

Usando la tabla de la normal acumulada se obtiene F(z). Para valores positivos de Z, los valores se
obtienen de manera directa, para los valores negativos de Z, lo resultados se obtiene de la resta de 1
con el valor obtenido de la tabla.

En caso de no encontrar el valor requerido se debe interpolar.

*NOTA: si se quiere aplicar el procedimiento grafico, se utiliza un papel probabilístico especial donde
F(x) puede representarse como una línea recta, en la cual se pueden trazar dos o tres puntos, los
puntos son:
Valor Probabilidad
X 50
X+S 80.13
X-S 15.87
5. Calculo de Δ = 𝐹 𝑧 − 𝑃(𝑥) para todos los valores de x.

6. Selección de la máxima diferencia:


De la tabla se observa que:
Δ=Δmax 𝐹 𝑧 − 𝑃(𝑥) = 0.1094
7. Del cálculo del valor critico del estadístico Δ0 crítico para un α= 0.05 y n= numero de datos = 38

1.36 1.36
Δ0 = =
𝑛 38
Δ0 = 0.22
8. Criterio de decisión:
Comparar el valor del estadístico, con el valor de la tabla. Los criterios de decisión son:
 Δ < Δ0: EL AJUSTE ES BUENO, AL NIVEL DE SIGNIFICACION SELECCIONADO
 Δ ≥ Δ0 :EL AJUSTE NO ES BUENO, AL NIVEL DE SIGNIFICACION SELECCIONADO, SIENDO
NECESARIO PROBAR CON OTRA DISTRIBUCION.
Como:
Δ = 0.1094 < Δ0 = 0.22
Se concluye que los datos de caudales se ajustan a la distribución normal, con un nivel de
significación del 5% o una probabilidad del 95%.
20 88.00 0.5128 -0.10
PRUEBA DE KOLMOGOROV 0.4598 0.0530
21 92.80 0.5385 0.01
0.5045 0.0340
ORDEN X (Qmax, m3/s Weibull z=(x - M)/S F(z) Diferencia, Δ
22 95.60 0.5641 0.08
0.5305 0.0336
23 97.20 0.5897 0.11
1 26.70 0.0256 -1.53 0.5454 0.0444
0.0626 0.0370
24 109.20 0.6154 0.39
2 32.90 0.0513 -1.39 0.6534 0.0380
0.0825 0.0312
25 110.10 0.6410 0.42
3 36.30 0.0769 -1.31 0.6611 0.0201
0.0953 0.0184
26 110.20 0.6667 0.42
4 40.30 0.1026 -1.22 0.6619 0.0047
0.1121 0.0095
27 112.20 0.6923 0.46
5 48.50 0.1282 -1.02 0.6789 0.0135
0.1530 0.0248

6 48.80 0.1538 -1.02


28 114.50 0.7179 0.52
0.1546 0.0008
0.6978 0.0201

7 52.30 0.1795 -0.94 29 121.30 0.7436 0.68


0.1749 0.0046 0.7508 0.0072

8 52.50 0.2051 -0.93 30 122.40 0.7692 0.70


0.1761 0.0290 0.7589 0.0103

9 57.40 0.2308 -0.82 31 137.10 0.7949 1.05


0.2073 0.0235 0.8523 0.0574

10 58.80 0.2564 -0.78 32 142.40 0.8205 1.17


0.2168 0.0396 0.8790 0.0585

11 59.60 0.2821 -0.76 33 144.70 0.8462 1.22


0.2223 0.0598 0.8895 0.0433

12 63.40 0.3077 -0.68 34 144.90 0.8718 1.23


0.2496 0.0581 0.8904 0.0186
13 64.20 0.3333 -0.66 35 148.30 0.8974 1.31
0.2556 0.0777 0.9046 0.0071
14 67.50 0.3590 -0.58 36 162.10 0.9231 1.63
0.2810 0.0780 0.9485 0.0254
15 70.00 0.3846 -0.52 37 165.50 0.9487 1.71
0.3010 0.0836 0.9563 0.0076
16 72.50 0.4103 -0.46 38 205.80 0.9744 2.65
0.3217 0.0886 0.9960 0.0216
17 76.30 0.4359 -0.37 Media,M= 92.32
0.3541 0.0818

18 76.90 0.4615 -0.36


0.3593 0.1022
42.80
19 79.00 0.4872 -0.31
0.3778 0.1094 Desv.St, S=

Você também pode gostar