Escolar Documentos
Profissional Documentos
Cultura Documentos
MODELOS PROBABILISTICOS
2.1
2.1.1
Funciones de Probabilidad
Variable Discreta
p
x y
p
x
XY
XY
( x 0 , y0 ) = 1
( x0 , y0 ) = pY ( y0 )
p
y
XY
( x0 , y0 ) = p X ( x0 )
En particular, son importantes algunos casos especiales de la funcin g(x) como ser
el valor esperado de potencias enteras de x, los cuales se denominan momentos de x. Se
puede definir tambin, la potencia centrada con respecto al valor esperado o momento
central n-simo de x. El primer momento de x se conoce tambin como valor esperado o
promedio de x (E(x)) y el segundo momento central se conoce como varianza de x (sx2) :
E ( x n ) = x n p X ( x0 )
x
E ( x ) = x0 p X ( x0 )
x
sx2 = {E ( x E ( x )) 2 } = ( x0 E ( x)) 2 p X ( x0 )
x
2.1.2
Variable Continua
Prob(a x b) =
f
a
( x )dx
f X (x) dx = 1
f x (x)
x
a
f x (x) dx
Fx (-) = 0
E(g(x)) =
g(x) fX(x) dx
g (x, y) f(x,y) dx dy
Distribucin
x
F (x ) = exp e
Valores extremos
tipo I
(Gumbel o EV1)
Valores extremos
generalizados
(GEV)
1
x u
F (x ) = exp 1 k
Rangos de variable
aleatoria y parmetros
x
>0
>0
u + x Si k < 0
k
< x u+
Si k >0
k
a
x
f (x ) =
exp
a ( )
a
Si > 0
Si < 0
1
(
x / a)
x
f (x ) =
exp
( )
a
Gama:
Pearson Tipo III
con = 0
Exponencial:
Pearson Tipo III
con = 1
Lognormal-2
(LN2)
f (x ) =
f (x ) =
1
x
exp
a
a
1 log x 2
1
exp
2x
2
0< x
Funcin densidad de
probabilidades f (x )
o Funcin distribucin acumulada
F (x)
Distribucin
Lognormal-3
(LN3)
Valores extremos
de dos
componentes
(TCEV)
Wakeby (WAK)
2.2
f (x ) =
Rangos de variable
aleatoria y parmetros
1 log(x )
1
exp
2 .(x )
2
<x
F (x ) = exp A1e x / 1 A2 e x / 2
] [
x>0
1 > 0
2 > 0
x = m + a 1 (1 F (x )) c 1 (1 F (x ))
b
Estimacin de Parmetros
Modelo
n ln 2 n ln ln xi
2 i =1
i =1
Log-normal-3
1 ln (xi )
n ln 2 n ln ln(xi )
2
Valores Extremos I
Valores Extremos
Generalizada
k (xi u )
n ln exp ln1
i =1
1/ k
k (xi u )
(1 k ) exp ln1
i =1
Gama-2
1/ k
i =1
i =1
n ln ( ) n ln + ( 1) ln xi
n
n
(x )
1 n xi
e i
i =1
i =1
n ln
xi
n ln ( ) n ln + ( 1) ln (xi )
i =1
2.2.2
Log-normal-2
xi
xbar =
1 n
x
n i =1 i
1 n
( x xbar ) 2
n i =1 i
n 1 i =1
2
Parmetro
Parmetro
xbar
Normal
Log-normal-2
1
ln ln 1 + C v2
z 2
Parmetro
ln(1 + C v2 )
xbar (1 C v / z )
Lognor
mal-3
Valores
Extremos I
Gama-2
Pearson III
2.2.3
ln
z
1
2
ln 1 + C v
2
ln(1 + C v2 )
1,2825 /
xbar 0,45005
xbar S 2
S 2 xbar
(2 g1 )2
2
1
z = 1 w 3 / w 3
w = 1 * g + g2 + 4
2
xbar S
M i , j ,k = E ( x i F j (1 F ) k ) = x i F j (1 F ) k dF
0
Los momentos convencionales son un caso especial de los MPP, ya que en ellos el
exponente i es unitario y los otros dos exponentes son nulos.
Para facilitar el clculo de los MPP se usan valores particulares para los exponentes.
Por ejemplo, para la distribucin Wakeby se recomienda usar un valor unitario para el
exponente i y nulo para el exponente j. En este caso se denomina M1.0.k al MPP de orden k, y
se designa simplemente por Mk (Greenwood et al., 1979). Para las distribuciones de valores
extremos generalizados y tipo I se recomienda un exponente unitario para i y nulo para k,
obtenindose los momentos Mj.
Landwehr y otros autores (1979a) recomiendan calcular estimadores de los MPP a
partir de la muestra, utilizando la siguiente expresin, que entrega MPP sesgados para k
positivo, en funcin del tamao de la muestra (n), de los valores de caudales ordenados en
forma creciente (xi) y del nmero de orden (i) de cada valor en la lista:
Mk =
1 n
x ((n i + 0,35) / n) k
n i =1 i
Los autores nombrados tambin exploraron el empleo de estimadores sin sesgo para
los MPP, pero reportan que los estimadores moderadamente sesgados proporcionan mejores
resultados, particularmente al estimar los valores de los cuantiles superiores, lo cual es
especialmente relevante en el contexto del anlisis de frecuencia de crecidas.
Para encontrar estimadores con este mtodo, se debe establecer una igualdad entre
los momentos ponderados del modelo y los correspondientes de la muestra, formndose un
sistema de ecuaciones con tantas ecuaciones como parmetros hay que estimar.
Los momentos de la muestra se calculan ponderando cada valor por la probabilidad
Fi :
Fi =
i 0,35
N
F
i =1
xi
o bien
1 N
$
M K = (1 Fi ) k xi
N i =1
GEV
Wakeby
] )
] [
x = m + a 1 (1 F ) c 1 (1 F )
M 10 k =
2.3
{1n(1 + j ) + 0,57721}
+
1+ j
1+ j
k
1 ( ln F )
k
1
k
=
u + 1 ( j + 1) (1 + k ) / k
1+ j
x=u+
M 1 jo
F=Prob ( X x )
],
m
ac
a
c
+
+
1+ k 1+ k 1+ k + b 1+ k d
Seleccin de Modelos
Mtodos grficos
modo que el modelo probabilstico se representa en l por una recta. Para ello, se deforma la
escala de las abscisas de modo de estirar los extremos de la distribucin.
Para preparar un grfico de probabilidades para un conjunto de valores se sigue el
siguiente procedimiento :
i) Se obtiene un papel especial, llamado papel de probabilidades, diseado para el
modelo en estudio. Existen papeles para la distribucin normal, log-normal y valores
extremos tipo I.
ii) Se ordenan las observaciones en orden creciente en magnitud.
iii) Se grafican las observaciones en el papel de probabilidades, asignndoles a cada
una, una probabilidad o posicin de ploteo. Existen varias posiciones de ploteo y en la
actualidad una de las preferidas es la propuesta por Weibull, que entrega un estimador no
sesgado de probabilidad. En este caso la probabilidad se calcula con la siguiente expresin:
Prob( x X ) =
m
n +1
siendo
m = nmero de orden
n = nmero de datos.
1
1 Prob( x X )
o bien,
Tr =
iv)
n +1
nm
2.3.2
Mtodos cuantitativos
Los mtodos anteriores permiten juzgar en forma grfica la bondad del ajuste de los
datos a un determinado modelo probabilstico. Sin embargo, en ciertas ocasiones es
preferible contar con procedimientos cuantitativos, que permitan una decisin objetiva sobre
el ajuste. A continuacin se describen dos procedimientos cuantitativos: el test chi-cuadrado
y el test Kolmogosov-Smirnov.
Los tests de hiptesis sobre modelos de distribucin cuentan con las siguientes etapas
generales: Primero, se calcula un estadgrafo a partir de los datos observados. Luego, se
calcula la probabilidad de obtener el estadgrafo calculado, en el supuesto que el modelo sea
correcto. Esto se realiza refirindose a una tabla probabilstica que entregue los percentiles
del modelo de distribucin del estadgrafo. Finalmente, si la probabilidad de obtener el valor
del estadgrafo calculado es baja, se concluye que el modelo supuesto no provee una
adecuada representacin de la muestra. Debe hacerse notar que este procedimiento permite
rechazar un modelo por no ser adecuado, pero no permite probar que el modelo
probabilstico elegido sea el correcto.
(a) Test Chi-Cuadrado
Es el test ms usado para medir la bondad de ajuste de un modelo y es aplicable
estrictamente a cualquier tipo de distribucin siempre que los parmetros de ella, hayan sido
estimados mediante el mtodo de mxima verosimilitud. El test consiste en comparar, en
intervalos previamente definidos de la variable aleatoria, el nmero de casos observados en
ese intervalo con el terico, el cual es funcin del modelo probabilstico en estudio.
Si O1, O2,.........Ok son las frecuencias absolutas observadas y E1, E2,...... Ek son las
frecuencias tericas, en cada una de las clases, se define un estadgrafo.
(Oi Ei ) 2
=
Ei
i =1
k
Tamao
muestra
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
n>50
2.3.3
Nivel de significancia
0,20
0,90
0,68
0,57
0,49
0,45
0,41
0,38
0,36
0,34
0,32
0,31
0,30
0,28
0,27
0,27
0,26
0,25
0,24
0,24
0,23
0,21
0,19
0,18
0,17
0,16
0,15
1,07/n
0,15
0,93
0,73
0,60
0,53
0,47
0,44
0,41
0,38
0,36
0,34
0,33
0,31
0,30
0,29
0,28
0,27
0,27
0,26
0,25
0,25
0,22
0,20
0,19
0,18
0,17
0,16
1,14/n
0,10
0,95
0,78
0,64
0,56
0,51
0,47
0,44
0,41
0,39
0,37
0,35
0,34
0,33
0,31
0,30
0,30
0,29
0,28
0,27
0,26
0,24
0,22
0,21
0,19
0,18
0,17
1,22/n
0,05
0,98
0,84
0,71
0,62
0,56
0,52
0,49
0,46
0,43
0,41
0,39
0,38
0,36
0,35
0,34
0,33
0,32
0,31
0,30
0,29
0,26
0,24
0,23
0,21
0,20
0,19
1,36/n
0,01
0,99
0,93
0,83
0,73
0,67
0,62
0,58
0,54
0,51
0,49
0,47
0,45
0,43
0,42
0,40
0,39
0,38
0,37
0,36
0,35
0,32
0,29
0,27
0,25
0,24
0,23
1,63/n
Consideraciones adicionales