Escolar Documentos
Profissional Documentos
Cultura Documentos
GONZLEZ-MURILLO
Tabla de Contenido
3. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS Y CONTINUAS 3 5 5 7 7 8 12 12 13 13 13 13 14 15 16 17 17 17 18 20 23 23 24 27 3.1 Algunas Distribuciones Discretas de Probabilidad 3.1.1 Distribucin Uniforme Discreta 3.1.2. Proceso BERNOULLI 2.1.2.1 Distribucin Bernoulli 3.1.2.2 Distribucin Binomial 3.1.2.3 Distribucin Geomtrica 3.2 Relacin con el periodo de Retorno (T) 3.3 Algunas Distribuciones Continuas de Probabilidad 3.3.1 Distribuciones tiles en el muestreo estadstico 3.3.1.1 La distribucin P 2 o de Chi cuadrado 3.3.1.2. La distribucin t o de students 3.3.1.3 La distribucin F 3.4 Distribuciones de probabilidad tiles en hidrologa 3.4.1 Parmetros de una distribucin de probabilidad 3.4.2 Estimacin de parmetros 3.4.2.1 Mtodo de momentos 3.4.2.2. Mtodo de Mxima Verosimilitud 3.4.2.3 Mtodo de Momentos ponderados por probabilidad (Probability Weighted Moments: PWM) 3.4.2.4 Mtodo grfico 3.4.3 Distribuciones de Probabilidad 3.4.3.1 Distribucin Normal. Estimacin de parmetros 3.4.3.2. Distribucin Pearson Tipo 3 1
Estimacin de parmetros 3.4.3.3. Distribucin Gamma Estimacin de parmetros 3.4.3.4 Distribucin Exponencial 3.4.3.5 Distribucin General de Valores Extremos (GVE) 3.4.3.6 Distribucin General de Valores Extremos Tipo 1 (EV1) o Distribucin Gumbel Estimacin de parmetros 3.4.3.6 Distribucin General de Valores Extremos Tipo 2 (EV2) Estimacin de parmetros 3.4.3.7 Distribucin General de Valores Extremos Tipo 3 (EV3) Estimacin de parmetros 3.4.3.8. Distribucin Weibull de tres parmetros Estimacin de parmetros 3.4.3.9. Distribucin Weibull de dos parmetros Estimacin de parmetros 3.4.3.10 Distribucin Logaritmico-Normal de dos parmetros Estimacin de parmetros 3.4.3.11 Distribucin Logaritmico-Normal de tres parmetros Estimacin de parmetros
27 28 29 31 32 33 34 35 36 38 38 40 40 41 42 43 44 45 45
1.00
F(x)
fda
Pobabilidad
0.50
f(x)
fdp
10.00
f ( x)dx .
x
F(x) se le conoce como funcin de distribucin acumulada, fda, y representa la integral de la funcin de densidad de probabilidades, fdp, f(x) entre x y x+dx. Para que f(X) represente verdaderamente una densidad de probabilidades, es necesario que el valor de la integral a lo largo del intervalo de variacin de X sea
igual a uno (1),
f ( x)dx = 1 . Se supondr aqu que la v.a puede tomar todos los valores
esta representacin se d para el caso de variables
P ( X xi ) =
f ( x)dx = F ( x) ,
La probabilidad es siempre un valor positivo entre 0 y 1, la funcin de distribucin acumulada ser una funcin creciente que cumple con lo siguiente:
lim F ( x) = 1 y lim F ( x) = 0
n n
1 fdp= f ( x, k ) = k 0
1 E ( X ) = = xp( x ) = x i f (x, k ) = xi = k x i =1 i =1
k k 2 k 2
x
i =1
k
k 2
Var ( X ) = 2 = ( x ) p(x ) = (x i ) f ( x, k ) = ( xi )
x i =1 i =1
1 = k
(x
i =1
Ejemplo: Supngase que el nmero de rayos que se producen durante una tormenta elctrica se distribuye uniformemente (x;5), el dominio de la variable SX = {1, 2, 3,4, 5 }. Construya la funcin de probabilidad para la variable aleatoria que indica el nmero de rayos que se producen durante una tormenta elctrica. a) Qu tipo de distribucin se puede asociar a esta variable? b) Halle la media y la varianza de la variable aleatoria. c) Cul es la probabilidad de que al seleccionar al azar una tormenta, el nmero de rayos que se dieron sea al menos de cuatro? Solucin:
0.30
Probabilidad
0.20
0.10
0.00
1 3 5
b) La distribucin ms adecuada es la Uniforme Discreta. Esto equivale a suponer que toda las tormentas tienen igual probabilidad de que se produzcan un nmero entre 1 y 5 de rayos. c)
1+ 2 + 3 + 4 + 5 = (1 / 5)(15) = 3 5
(x )
d) P( x 4) = P( x = 4) + P( x = 5) =
1 1 + = 0.4 5 5
La probabilidad de que al seleccionar una tormenta al azar, el nmero de rayos que haya tenido sea al menos de cuatro es de 0.4
p x (1 p )1 x fdp= f ( x; p ) = 0
E ( X ) = = xp( x ) = x p x (1 p )
x i =0 2 2 1
1 x
= 0 p 0 (1 p )
2
1 0
+ 1 p 1 (1 p )
11
=0+ p= p
Var ( X ) = = ( x ) p ( x ) = ( x ) p x (1 p )
x i =0
1 x
= (0 p ) p 0 (1 p )
2
1 0
= p 2 p 3 + 1 2 p + p 2 p = p 2 p 3 + p 2 p 2 + p 3 = p p 2 = p(1 p )
Ejemplo: Suponga que la probabilidad que en un mes se de una creciente en un determinado sitio de una cuenca es de 0.30. Considere el experimento aleatorio de escoger un mes y observar si se d la creciente. Ahora, considere a W como la variable aleatoria que cuenta el nmero de meses con creciente en una muestra aleatoria de n meses Establezca los valores que puede tomar la variable W.
+ (1 p ) p 1 (1 p )
2
11
= p 2 (1 p ) + (1 p ) p
2
a) Exprese la frmula de la funcin de probabilidad para W. b) Halle, usando la frmula de b), la probabilidad de que el mes creciente. c) Halle la media y la varianza de W.
no presente
Solucin. a) Como solamente se tiene la realizacin de un solo experimento- un solo mes-, los valores posibles de W son cero y uno. (0.3) w (0.7) 1 w , w = 0, 1 b) Funcin de probabilidad: f ( w,0.3) = e.o.c. 0
c) P (no creciente= P (W=0)= f (0,0.3) = (0.3) 0 (0.7) 1 = 0.7 Un resultado coherente debido a que P(no creciente) = 1- P(creciente)=1- 0.3 = 0.7. d) = wf ( w,0.3) =0. f (0,0.3) + 1. f (1,0.3) = 0.3
lleva a cabo y 1-p la probabilidad de fracaso. Tambin suponga que el experimento se realiza n veces y cada una de stas es independiente de todas las dems, y sea X la variable aleatoria que representa el nmero de xitos en los n ensayos. El inters est en determinar la probabilidad de obtener exactamente X=x xitos durante los n ensayos. Las dos suposiciones claves para la distribucin binomial son: 1. La probabilidad de xito p permanece constante para cada ensayo. 2. Los n ensayos son independientes entre si.
n x n x p (1 p ) ( ) ; , = b x n p fdp = x 0
Sea X una variable aleatoria binomial con n = 5 y p = 0.4. Calcular la funcin de probabilidad:
5 x 5 x x = 0,1,2,3,4,5 0.4 (1 0.4 ) b(x;5,0.4 ) = x 0 en otro caso 5 0 5 x=0 0 0.4 0.6 5 1 4 x =1 1 0.4 0.6 0.07776 0.2592 5 2 3 x=2 2 0.4 0.6 0.3456 b( X = x;5,0.4 ) = 5 3 2 b( X = x;5,0.4) = 0.2304 x=3 0.0768 3 0.4 0.6 5 4 1 0.01024 x=4 0 4 0.4 0.6 5 5 0 x=5 5 0.4 0.6 en otro caso 0
Suponga que se tienen las mismas condiciones del ejemplo anterior pero seleccionando cinco meses, los cuales responden de manera independiente a la presencia o ausencia de crecientes. a) Establezca los valores que puede tomar la variable W. b) Exprese la frmula de la funcin de probabilidad para W. c) Halle la probabilidad de que ningn mes de los seleccionados presente creciente. d) Encuentre la probabilidad de que mximo tres meses presenten crecientes. e) Indique el nmero esperado de meses que presenten crecientes. a) El nmero de meses que presentan crecientes puede tomar los valores 0,1,2,3,4 y 5. b) La variable aleatoria W es binomial (x;5,0.3) porque se tienen n=5 experimentos independientes de Bernoulli, con probabilidad de xito igual a 0.3, constante en cada experimento. Por tanto, la funcin de probabilidad correspondiente ser: 5 w 5 w w = 0, 1,2,3,4,5 (0.3) (0.7) b( w; 5, 0.3) = w 0 e.o.c. c) Como la variable aleatoria W cuenta el nmero de meses con creciente, entre los seleccionados, se tiene: 5 0 5 5 P(ningn mes tenga creciente)=P(W=0) = 0 (0.3) (0.7) = (0.7) = 0.16807 La probabilidad de que ningn mes tenga creciente es de 0.16807. d) P(mximo 3 meses con creciente)=P(W 3) = P(W=0) + P(W=1) + P(W=2) + P(W=3) = ? **
5 5 5 5 0 5 1 5 1 2 5 2 3 53 P(W 3) = (0.3) (0.7) 3 (0.3) (0.7) + 2 (0.3) (0.7) + 1 (0.3) (0.7) + 0 = 0.16807 + 0.36015 + 0.3087 + 0.1323 = 0.96922
Entonces, la probabilidad de que tres o menos meses con creciente es del 97%. d) El nmero esperado de meses con crecientes es np = (5)(0.3) = 1.5
10
As, entre uno y dos meses se espera que presenten creciente de los cinco meses seleccionados aleatoriamente.
Ejemplo: Un agricultor que siembra fruta afirma que 2/3 de su cosecha de duraznos ha sido contaminada por la mosca del mediterrneo. Encuentre la probabilidad de que al inspeccionar 4 duraznos: a. Los 4 estn contaminados por la mosca el mediterrneo b. Cualquier cantidad entre 1 y 3, inclusive, est contaminada c. Menos de 2 duraznos estn contaminados Sea X: un durazno esta contaminado por la mosca del mediterrneo. Y, como: 1. La probabilidad de estar contaminado por la mosca del mediterrneo xito p, permanece constante para cada durazno inspeccionado y 2. Las n=4 selecciones son independientes entre si. Se puede inferir que X tiene una distribucin binomial B(x;n,p) con n=4 y p=2/3. As, para a) Los 4 estn contaminados por la mosca el mediterrneo, la probabilidad es p(X=4): 4 0 2 4 2 2 b X = 4;4, = 1 = 0.1975 3 4 3 3 Entonces, la probabilidad de que los cuatro duraznos estn contaminados por la mosca el mediterrneo es 0.1975 o de un 20%. Para b) Cualquier cantidad entre 1 y 3, inclusive, est contaminada, nos interesa
p(1X3):
11
p( X < 2 ) = p( X 1) = p( X = 0 ) + p( X = 1) 4 2 = 0 3
0
4 2 2 + 1 3 3
12
3.3 Algunas Distribuciones Continuas de Probabilidad 3.3.1 Distribuciones tiles en el muestreo estadstico 3.3.1.1 La distribucin P 2 o de Chi cuadrado X Z= , es la variable aleatoria, de la distribucin normal estandarizada, Y se Si
i =1 define como , esta tiene una distribucin Chi cuadrado, con N grados de libertad. Esta distribucin es un caso especial de la distribucin Gamma X 1e X X , , > 0 ( ) , cuando = 1 / 2 . El parmetro de la distribucin es
Y = Z i2
X (1 / 2) e X / 2 X , > 0 /2 2 ( / 2 ) f(x)=
El promedio y la varianza de la distribucin est dadas por: E(X)= < Var(X)= 2 < Si Z1, Z2,...... Zn es una muestra aleatoria de la distribucin Normal estandarizada, Y = Z i2 = ( xi X ) 2 / la variable aleatoria , tiene una Distribucin Chi cuadrado con grados de libertad igual a (N-1). Adicionalmente dado que S 2 = ( xi X ) 2 / N 1 , la cantidad (N-1)S2/ 2 tiene una distribucin Chi cuadrado con (N-1) grados de libertad. Haan C.T., 2002, pg. 142.
X =Y
f (t ) =
[( + 1) / 2)] (1 + t 2 / ) (1+ ) / 2
( / 2)
13
Var(t)= n/(n-2) ; n >2 Uno de los usos ms recurrentes de la distribucin t es cuando se tratan de hacer X E= S 2 / N , es pruebas acerca de la media en donde se considera que el estadstico t distribuido. Si se multiplica tanto el numerador como el denominador por F y se manipula el trmino N-1, se obtiene: X X / N = Y N 1 t= U , obsrvese que en este caso Y= 2 / N , U considerada la S 2 / 2
2 2 variable que se distribuye Chi cuadrado sera ( N 1) S / , ello dejara la posibilidad del uso de N 1 , en el numerador. Haan C.T., 2002, pg. 143.
La distrubucin t es una distribucin acampanada simtrica, similar a la distribucin Normal, pero las colas de la distribucin son ms amplias que las de la distribucin Normal. El ancho de la distribucin t depende del grado de incertidumbre en 2 , lo cual es medido por los grados de libertad < con los que se hace la estimacin de 2 . Cuando el tamao de la muestra es infinito, no hay mucha incertidumbre en la estimacin de 2 y la distribucin t se vuelve la distribucin Normal estndar. Cuando el tamao de la muestra es pequeo (< 30 ), la variacin de 2 aumenta. Esto se refleja en el aumento del esparcimiento de la distribucin t cuando los grados de libertad disminuyen.
t=
2 es distribuida independientemente del promedio, es decir la varianza de la muestra no aumente o disminuye con el aumento o disminucin del promedio. La cantidad 2 , la cual tiene < grados de libertad es calculada de observaciones independientes, Normalmente distribuidas cuya varianza es 2 . Mc Berthouex y Brown 2002, pg. 16.
3.3.1.3 La distribucin F
14
Si U y V son dos variables independientes que se distribuyen Chi cuadrado con 1 y U /1 X= V /2 2 grados de libertad respectivamente, luego la variable aleatoria , tiene una distribucin F con 1 y 2 grados de libertad. La fdp, est dada por:
f (F ) =
2 /2 [( 1 + 2 ) / 2)] 1 1 / 2 ( F ) ( 1 2 ) / 2 * ( 2 + 1 F ) ( 1 + 2 ) / 2 2
( 1 / 2) ( 2 / 2)
1 , 2 ;F > 0
1 2 2
2 ( 1 + 2) 2
1
Var ( F ) =
1 * ( 2 2) * ( 2 4)
15
con un estadgrafo muestral; hay que conformarse con saber lo bueno que es ese estimativo en promedio, es decir, saber que tan bien se comporta en un muestreo repetido, o saber cuantos valores muestrales se puede esperar que caigan dentro de un intervalo dado en torno a un parmetro. Hasta donde son los estadsticos buenos estimativos de los parmetros?. Existen varias propiedades que son deseables para un buen estimador de parmetros, entre los cuales se pueden mencionar: Insesgamineto: Un estimador de un parmetro se dice que es insesgado si E ( ) = . El sesgo, est dado por E ( ) . El hecho que un estimador sea insesgado, no garantiza que sea igual que , esto solo significa que el promedio de valores independientes estimados por sea igual a . Varianza mnima: Se dice que un estimador produce varianza mnima cuando este obtiene la menor de las varianzas del conjunto de datos producidos por el conjunto de estimadores. Eficiencia: Una medida de la calidad de un estimador. La eficiencia es inversamente proporcional a la varianza. Una muestra es ms eficiente que otra, si esta tiene una varianza menor que la otra. Un estimador es el ms eficiente si es insesgado y tiene varianza mnima. Consistencia: Una propiedad de los nmeros que se relacionan con el tamao de la muestra. As, si la muestra aumenta de tamao, la media de la muestra no debe apartarse de la de la poblacin ms all de un rango establecido. Exactitud: Cuando produce la medida ms cercana al valor verdadero de una medida dada. Precisin: Es la variacin de una observacin o conjunto de observaciones a consecuencia de un error aleatorio. Esta es la medida de la repetibilidad de una serie de observaciones o medidas. Suficiencia: El grado en el que un parmetro derivado de una muestra dada, representa o extracta informacin de la correspondiente poblacin.
16
funciones de distribucin puede apreciarse como los parmteros las identifican y caracterizan.
NATURAL Enviromental Research Council. Flood Studies Report. Hydrological Studies. Vol. 1. London: 27 Chaning Cross Road, 1975.p.65
CUSTODIO E. Y Llamas M.R. Hidrologa subterrnea. Tomo I. 2 ed. Barcelona: Editorial Omega S.A. , 1983.p.3.38
3 4
17
V = f ( x; , ...)
i =1
( 1)
llamado verosimilitud. El mtodo es utilizado para estimar los parmetros , , ... , en el que se maximiza V . Esto se obtiene hallando las derivadas parciales de V respecto a sus parmetros e igualando a cero. Frecuentemente se utiliza Ln(V) en lugar de V, para simplificar los clculos, por el carcter exponencial de la funcin.
(Probability
Es un mtodo de estimacin de parmetros para aquellas distribuciones que puedan ser explcitamente definidas en forma inversa, de la forma X=X(f). Fu introducido por Greenwood et al (1979). Este procedimiento es simple e insesgado. (Cunnane, 1985). Los PWM estn definidos como:
Mi , j , k = E x i F j (1 F ) k = [ x( F )] F j (1 F ) k dF
i 0
Donde i, j, k son nmeros reales y F=F(x)=P(Xx). Esta expresin es una generalizacin de los momentos convencionales. Por ejemplo, si j=k=0, se tiene Mi,0,0, que representa el momento de orden i alrededor del origen. Las relaciones entre los parmetros y los PWM son de estructura analtica ms simple que las encontradas entre stos y los momentos convencionales (Greenwood et al, 1 979) especialmente cuando se utiliza X elevado a la primera potencia. Para estimar los parmetros de las distribuciones Weibull, Gumbel, Lambda generalizada, logstica, Wakeby y Kappa, Greenwood et al, (1979) usaron la expresin M1.o.k. definida como: k k j M 1,0,k = (1) M 1, j , 0 j j =0 Hosking et al, (1985) usaron la expresin m1,j,0 para estimar los parmetros de la distribucin general de valores extremos (GVE), definida de la siguiente forma:
j j k M 1, j ,0 = (1) M 1, 0,k k k =0
Captulo extractado de: Gonzlez-Murillo, Carlos A. Regional flow Analysis for the Valle del Cauca region in Colombia. A dissertation submitted of the requirements for the degree of Master of Science (hydrology). Department of Engineering Hydrology, University College, Galway, Ireland, September 1986.
18
Cuando se usa M1,0,.k donde k es un entero positivo, un estimador no sesgado de M1,0,k es dado por Landwehr et al, (1 979) como:
M 1,0,k
N j k 1 N K Xj = N J =1 N 1 k
XN
Landwehr et al, (1979) encontraron que el algoritmo PWM dio buenos resultados usando un estimador moderadamente sesgado de M1,o,k cuando se determinaron los parmetros de la distribucin Wakeby. Este estimador se expresa como:
1 N
M 1, 0, k =
X
i =1
(1 Pi ) k
Pi = (i - 0.35)/N
Donde Pi es isima frecuencia i es el orden del evento, ordenados de menor a mayor N: es el tamao de la muestra. La misma frmula de frecuencia (P), fue encontrada apropiada por Hosking et al, (1985) cuando se us la expresin M1.j.0 en lugar de la expresin M1,o,k para estimar los parmetros de la distribucin GVE. El mtodo PWM ha sido comparado por Landwehr et al, (1979), con mtodos tradicionales de estimacin de parmetros, tales como momentos y mxima verosimilitud para la distribucin Gumbel; ellos concluyeron que esta tcnica produce estimados no sesgados de los parmetros y de los cuantiles cuando las muestras son extradas de un proceso aleatorio. Hosking et al, (1985), usando esta tcnica para ajustar los parmetros de la GVE, encontraron que este mtodo tiene una menor varianza y un sesgo no severo, comparando de forma favorable con los estimados obtenidos por el mtodo de mxima verosimilitud y sextiles. Ellos tambin encontraron que el mtodo PWM tiene consistentemente la ms baja desviacin estndar entre los tres estimadores del parmetro de forma k, su ventaja es particularmente marcada en muestras de
19
tamao pequeo. El mtodo tuvo en general un mayor sesgo que los otros estimadores, pero ste es pequeo, cercano al importante valor de k igual a cero. Similares resultados se obtuvieron con la estimacin de los parmetros de escala y localizacin. En cuanto a la estimacin de los cuantiles especialmente en las colas de las distribuciones usadas para propsitos hidrolgicos, los estimados obtenidos para perodos de retorno altos son algo sesgados, sin embargo son an preferibles a los estimados obtenidos por el mtodo de mxima probabilidad.
20
Gonzlez-Murillo 6 (1992), seala que de acuerdo con Cunnane (1978): la posicin del graficamiento insesgado es E(Yi), el promedio de la i-sima estadstica de orden en muestras provenientes de una poblacin de variables aleatorias estandarizadas. Una buena aproximacin para cada distribucin se encuentra en el dominio de la probabilidad, tomando la forma general (m-b)/(n+1-2b) ...Si una frmula de probabilidad fuese a ser usada en el caso del desconocimiento de la frmula de distribucin de probabilidad b=2/5 sera el mejor compromiso. Este valor de b=2/5, corresponde a lo que se conoce como la frmula de Cunnane. El valor de b depende del tipo de distribucin de probabilidad que ha de utilizarse. De hecho, Chow 7 indica que la mayor parte de las frmulas de posicin de graficamiento estn representadas por la forma general anteriormente mencionada. Gumbel en 1958 estableci los 5 postulados que deben cumplir las relaciones de posicin de graficamiento (Haan, 1975 8 ; Kite, 1977 9 ): 1. La posicin de graficamiento debe ser tal que todos los datos puedan ser graficados. 2. La posicin de graficamiento debe caer entre las frecuencias observada (m-1)/n y m/n donde m es el nmero de orden del valor observado comenzando con m=1 para el mayor (menor) valor, y n es el nmero de aos de registros o el nmero de observaciones. 3. El perodo de retorno igual o mayor que la mayor observacin y el perodo de retorno igual o menor que la menor observacin debe converger hacia n. 4. Las observaciones deben estar igualmente espaciadas en la escala de frecuencias 5. La posicin de graficamiento debe tener un significado intuitivo, debe ser analticamente simple y de fcil uso.
Gonzlez-Murillo. Carlos A. Ajuste de la distribucin Gumbel a fenmenos hidrolgicos. Documento presentado como requisito parcial para acceder a la categora de profesor asociado. Bogot: Septiembre 1992. p.7 CHOW, Ven Te et al. Hidrologa aplicada. Mc.Graw Hill, 1994. p. 407 HAAN. Opt.Cit.p.134-135 KITE. Opt.Cit. p.19
7 8 9
21
Existen diferentes frmulas de probabilidad partiendo de la frmula general, las cuales tienen sus ventajas relativas unas respecto a las otras de acuerdo al tamao de la serie y a la distribucin a que se ajuste. En la tabla 3.1 se muestran algunas de ellas.
TABLA 3.1. Frmulas de posicin de graficamiento
Nombre Cunnane (1978) Weibull (1939) b California (1923)b Chegodayev ( )a Tukey ( )a Hazen (1930 )a-b Blom (1958)a Gringorten (1963)a
a b
Frmula (m-0.4)/(N+0.2) m/(n+1) m/n (m-.03)/(n+0.4) (m-1/3)/ (n+1/3) (2m-1)/2n (m-3/8)/(n+1/4) (m-.44)/(n+0.12)
Adaptado de CHOW, Ven Te. Hidrologa aplicada. 1994 Adaptado de HAAN, Charles T. Statistical methods in hydrology. 1977
Chow 10 menciona que Cunanne (1978) estudi los diferentes mtodos disponibles para las posiciones de graficamiento utilizando criterios de varianza mnima y sesgo. Cunanne concluy que la posicin de graficamiento de Weibull es sesgada y grafica los valores mximos de una muestra con perodos de retorno muy pequeos; adems encontr que la frmula de posicin de graficamiento de Blom, para datos Normalmente distribuidos, est muy cercana a ser no sesgada; y que la frmula de Gringorten es la ms adecuada para datos que se distribuyen de acuerdo con la distribucin EV1. El mtodo de papeles de probabilidad puede desarrollarse como se describe a continuacin. Se ordenan los datos de la muestra por orden de magnitud y se calcula una probabilidad acumulada de acuerdo con la frmula de probabilidad asignada, probabilidad que corresponde a la probabilidad de no excedencia, si se ordenan lo datos de menor a mayor. Una vez los datos han sido ordenados de menor a mayor, se les asigna un nmero de orden (m), a estos y se les determina la probabilidad de no excedencia de acuerdo con la frmula seleccionada. Una vez determinada la probabilidad se calcula la variable de la distribucin que se haya elegido. Por ltimo se grafica linealmente la
10
CHOW. Opt.Cit.p.407-408
22
variable de la distribucin en el eje de las abscisas, contra el valor de la magnitud del evento en el eje de las ordenadas, para determinar sobre los puntos graficados la ecuacin de la recta trazada. En la estimacin grfica la lnea es colocada subjetivamente y puede variar de un anlisis a otro. Esta subjetividad es considerada como una desventaja y por ello puede dar una estimacin imprecisa 11 .
Z=
11
NERC. Opt.Cit.p.62
23
f ( z) =
z 2 1 exp 2 2
En este caso se dice que Z se distribuye normalmente con media cero y varianza uno. La funcin de distribucin acumulada (fda) que da la probabilidad de no excedencia es:
F ( z) =
f ( z)dz
Una distribucin normal est definida si se conocen sus parmetros de localizacin () y escala (), corrientemente se expresa como: distribucin normal N( , ). La relacin entre x y Z es:
x=+Z
Llamando Y=Z , como la variable estandarizada o reducida se tiene la anterior relacin x=+Y
la cual es la representacin lineal de la correspondiente poblacin y usando esta relacin se determinan los cuantiles para los perodos de retorno deseados.
Estimacin de parmetros
Mtodo de los momentos: La estimacin de parmetros de la poblacin se hace utilizando los parmetros de la muestra. El mtodo de momentos para la distribucin Normal es el siguiente. La media y la varianza son:
Media = E ( x ) =
x f ( x)dx =
2
Varianza = E ( x E ( x )) =
Desviacin estndar =
( x u)
f ( x )dx = 2
Coeficiente de asimetra = Cs = 0 Los parmetros de localizacin () y escala () son la media () y la desviacin estndar () respectivamente, que son estimados por medio de x y s respectivamente.
= ; = = x =; = = s
24
1 2
2
2 1 exp (( x i ) / ) 2
dejando
V V =0 y = 0 ; y resolviendo
1 xi n 2 1 2 = ( xi ) n
= 2
El parmetro de localizacin () es la media () y el de escala () es la desviacin estndar (), estimados por medio de x y s respectivamente. = ; = = x
=; = = s
De lo anterior, se hace notar que, particularmente para la Distribucin Normal, la estimacin de parmetros por el mtodo de momentos y de mxima verosimilitud llegan al mismo resultado.
Mtodo grfico:
La posicin de graficamiento en la estimacin grfica, expresado como probabilidad es: Fi=(i-3/8)/(n+1/4), i=1,2,...,n Esta frmula fue dada por Blom (1958), menciona NERC (1975) 12 . El valor de la variable reducida yi, correspondiente a este Fi constituyendo una buena aproximacin para obtener E(yi). Una vez construido el papel de probabilidad 13 se traza una lnea recta a travs de los puntos. El valor de la ordenada cuando Y=0 corresponde al valor estimado del
12 13
25
26
G (Y ) =
0
Y 1 exp( Y / ) dY ( )
mostrando que esta variable Y tiene una distribucin Gamma con parmetros y ; lo que significa que la distribucin Pearson Tipo 3 con parmetros (, , ) puede considerarse como una distribucin Gamma con parmetros y la cual tiene el origen en x= es decir con parmetro de localizacin. La relacin entre la variable aleatoria x y la variable reducida es x=+Y, donde Y es la variable reducida de la distribucin Gamma con el parmetro de localizacin ().
Estimacin de parmetros
Mtodo de los Momentos La relacin entre los momentos y los parmetros es la siguiente: media = E(x) = = + Varianza = E(x-E(x))2 = 2 = 2 = 1/2 coeficiente de asimetra = g1 =2 -1/2 donde g1 est dado por 3/23/2, que es lo mismo 3/3 Si x , s y g1 ,son los estimadores de la muestra de , , g1 respectivamente, se tienen los estimadores de los parmetros de la poblacin
_
= 4 / g12 ; = 4 / g1
= g1 / 2 ; = g1
= g1
s s = 2
27
= = - 2 / g1 ; = x = x 2 s / g1
Mtodo de Mxima Verosimilitud La funcin de verosimilitud est dada por n exp( ( xi ) / ) ( xi ) 1 V(x/ , ,)= ( ) i =1 La estimacin debe satisfacer LV/ =0 ; LV/=0 y LV/=0 Al realizar las derivadas se obtiene n/(-1)(xi- )-1=0 o -+1/n (xi- )=0 -n/+1/2 (xi- )=0 -nln / (ln())+ln(xi- )=0 o reemplazando por ()= (ln())/ ln+()1/nln(xi- )=0 las cuales no son lineales para valores desconocidos de los parmetros estimados. El procedimiento sugerido por Clarke R.T.(1978), mencionado por The Natural Enviromental Research Council (NERC), es asumir un valor para y utilizarlo iterativamente tal que resuelva las anteriores ecuaciones para y , partiendo de =D/(D-1) donde D= 1/n2(xi- ) (xi- )-1 y =(xi- )/(n)=1/n (xi- )-n/((xi- )-1) Kite 14 (1977), describiendo este mtodo de estimacin de parmetros, menciona que: ...el mtodo no es siempre aplicable. Wallis & Matalas (1963), notaron que para valores muy pequeos del sesgo de la muestra, no es posible una solucin. Adems, para valores del parmetro de forma menores que uno (<1), una solucin por mxima verosimilitud no es posible. Si este parmetro es mayor que uno (>1), el coeficiente de asimetra de la muestra debe ser menor que dos (g1<2). Finalmente, si el coeficiente de asimetra de la muestra es negativo, la distribucin tendr lmite superior y no ser conveniente para anlisis de eventos mximos....En general no es posible con un procedimiento automtico, garantizar encontrar la solucin con una varianza mnima en cada anlisis. Cada arreglo de datos requiere de una cuidadosa investigacin de la forma de la funcin.
KITE, Opt.Cit.p.107-108
28
donde >0 donde () es la funcin Gamma completa evaluada para el valor de y la integral es conocida como la funcin gamma incompleta. Para valores dados de y la integral debe ser evaluada por integracin numrica. La relacin entre la variable reducida o estandarizada Y y la variable aleatoria x es Y=x/ con la funcin de densidad de probabilidad (fdp) dada por Y 1 exp( Y ) g (Y ) = y ( )
G (Y ) = g (Y )dY
0
de aqu se tiene que F(x)=G(Y)=G(x/) y su inversa es x=Y. Cada valor de determina una funcin de distribucin.
Estimacin de parmetros
Mtodo de los Momentos La media y la desviacin estndar dados en trminos de y son: Media = E(x) = = Varianza = E(x-E(x))2 = 2 = 2 reordenando se tiene que = 2/ 2 = 1/CV2
= / = 2/
Los estimadores muestrales de y son x , s, los cuales son sustituidos en los momentos para obtener los estimadores de y
_ 2 _ 2 x x 1 / cv 2 = = 2 s2
= / x = s2 / x
Mtodo de Mxima Verosimilitud La funcin de verosimilitud es 1 n exp( xi / ) xi V(x/,)= ( ) i =1 La estimacin debe satisfacer LV/=0 y LV/=0 esto da:
x/ = ln+ / (ln())1/n((lnxi))=0 Siendo ()= (ln())/
_
29
_ x ln()()=ln Mo
= x Thom (1958), seala Haan (1977) 15 , propone una relacin aproximada para estimar dada por =(1+(1+4A/3)1/2)/4A- donde
_
A=ln x -(lnx)/n y es un trmino de correccin. La tabla da el valor de para valores de comprendidos entre 0.2 y 5.6 ya que para valores superiores a 5.6 el error es despreciable.
TABLA 1.1 Valores de y
0.2 0.034 1.0 0.009 1.8 0.004 0.3 0.029 1.1 0.008 1.9 0.003 0.4 0.025 1.2 0.007 2.2 0.003 0.5 0.021 1.3 0.006 2.3 0.002 0.6 0.017 1.4 0.006 3.1 0.002 0.7 0.014 1.5 0.005 3.2 0.001 0.8 0.012 1.6 0.005 5.5 0.001 0.9 0.011 1.7 0.004 5.6 0.000 Tomado de Statistical Methods in Hydrology de Charles T. Haan (1977) Greenwood y Duran (1960), menciona Haan (1977), presentan la siguiente relacin para estimacin por mxima verosimilitud, partiendo de los siguientes polinomios: =(0.5000876+0.1648852A-0.0544274A2)/A para 0A0.5772 y =(8.898919+9.05995A+0.9775373A2)/(A(17.79728+11.968477A+A2)) para 0.5772<A17.0 Haan (1977) 16 citando a Bowman & Shenton (1968), presenta una relacin para estimar el error causado por las aproximaciones al estimar el sesgo; la cual puede ser aproximadamente E( ) = 3 /n el cual da la relacin E() = (n-3) /n n4 Una vez conocido , se determina
= x/
15 16
30
f ( x) =
( x ) exp 1
= ; = = s = ; = = x s El coeficiente de sesgo, (g1), es igual a dos; lo que quiere decir que es una distribucin sesgada hacia la derecha para todos los valores de . 17
Mtodo de Mxima Verosimilitud La funcin de verosimilitud es: n 1 V(x1,x2,...,xn/ ,)= exp( ( xi ) / )) i =1
17
Ibidem. p.99
31
LV/ =0
da como resultado n n ( xi ) =0 +
i =1
y de aqu se obtiene _ 1 = ( xi ) = x n Si los dos parmetros son desconocidos la estimacin de estos no es directa porque LV/ y LV/ al hacerlas igual a cero no son independientes en y . Ahora bien, si es conocido, el menor valor de la serie ,x(1)=min(x1,x2,...,xn),es un estadstico suficiente para ; mientras si es conocido x lo es para . Dado que x(1) tiene una distribucin exponencial, puede mostrarse que: n _ = ( x x (1) ) n 1 y
_
= x (1)
Mtodo grfico Partiendo de la forma general Fi=(i-b)/(n+1-2b) es conveniente utilizar la frmula de Gringorten en la que b=0.44 para determinar la posicin de graficamiento, menciona Cunanne(1978), citado por Chow (1994) 18 ; quedando expresada como: Fi=(i-0.44)/(n+0.12) El correspondiente valor de la variable reducida yi=-ln(1-Fi) es utilizada para trazar la posicin en papel de escala lineal. Los valores esperados son fcilmente calculados por: i 1 E ( yi ) = j =1 n +1 j la cual es una muy buena aproximacin de yi Si es conocida a priori puede trazarse una lnea a travs de los puntos pasando por el punto x= , y=0. La pendiente de esta lnea es el valor estimado de (parmetro de escala). De otro modo, si no es conocida a priori, una lnea es trazada a travs de los datos y el punto que intercepta a y=0 es el valor estimado de y la pendiente de la lnea es el valor estimado de .
32
extremos. La familia de distribucin GVE puede ser dividida en tres clases, correspondientes al valor que toma el parmetro de forma, ; tales son Tipo 1, Tipo 2 y Tipo 3 (Fisher and Tippet, 1928), conocidas tambin como EV1, EV2 y EV3 respectivamente. En la prctica el valor de toma valores comprendidos entre -0.6 y +0.6. El rango es dividido entre las tres clases as: <0 Tipo 2 =0 Tipo 1 >0 Tipo 3 Esta distribucin tiene tres parmetros; y son los parmetros de localizacin y escala respectivamente. Si =0 se tiene la distribucin EV1 o Gumbel. Si es negativo se tiene la distribucin EV2 con lmite inferior y, si es positivo es EV3 , distribucin con frontera superior. La relacin entre el coeficiente de asimetra (sesgo) y el parmetro de forma est tambin marcado, as, a =0 corresponde el valor del coeficiente de asimetra de 1.14 (EV1) y el valor terico de la kurtosis es 5.4 . Muestras con sesgo mayor a 1.14 corresponden a una distribucin EV2, mientras que si dicho valor es inferior a 1.14 corresponden a una distribucin EV3. Cuando se dispone de datos, se pueden ajustar a la distribucin GVE por varios mtodos. El ajuste consiste en determinar el valor de y se define a que tipo pertenece. Si =0 se ajusta directamente a EV1 ya que y son ms eficientemente estimados por EV1 que por GVE.
y la funcin de distribucin acumulada (fda) puede expresarse G ( y) = exp{ exp( y)} En donde f(x) = g(Y) y F(x) = G(Y) Los cuantiles se determinan por medio de la relacin x= + Y donde Y = -ln(-ln(F(x)))
33
Estimacin de parmetros
Mtodo de los Momentos La media y la desviacin estndar, dados en trminos de los parmetros y , son Media = E(x) = E( + Y) = = + 0.0577 Varianza = E(x-E(x))2 = 2= 22/6 Desviacin estndar = Var(x))1/2 = /6 Los parmetros de la poblacin y son estimados por x y y la estimacin por momentos de estos es 6 = _ _ = x 0.577 = x 0.45 Mtodo de Mxima Verosimilitud La funcin de verosimilitud est dada por V(x/ ,)= f ( xi / , )
i =1 n
=
i =1
exp{( ( xi ) / ) exp( ( xi ) / )}
exp{ ( xi ) / exp( ( xi ) / )}
Requiere resolver es siguiente par de ecuaciones LV/ =(n+exp(-y))/=P/ LV/=(ny+exp(-y))/=R/ La estimacin debe satisfacer LV ( x / , ) / = 0 ; LV ( x / , ) / = 0 Estas ecuaciones no tienen una solucin explcita, pero con un mtodo iterativo como el dado por Jenkinson (1969), mostrado en Natural Enviromental Research Council (pginas 85 a 87), puede darse solucin a estas. PWM Desarrollada por Greeenwood et al (1979), citado por Gonzlez (1996) 19 La expresin general para PWM, en trminos de M1,j,0 es: (ln(1 + j ) + 0.5772) M 1, j ,0, = + 1+ j 1+ j El estimador de M1,0,k es E{x(1-F(x))k} , utilizando el estimador Pi, posicin de graficamiento, se tiene: 1 n M 1,0,k = xi (1 Pi ) k n i =1 donde
19
34
= ( M 1,0,0 2 M 1,0,1 ) / ln 2
Mtodo grfico Para la estimacin grfica de los parmetros y la posicin de graficamiento, Gringorten (1963) da la siguiente expresin para la probabilidades Fi=(i-0.44)/(n+0.12) Los valores de la variable reducida yi correspondientes a Fi estn dados por yi=-ln(-ln Fi) Si se utiliza papel de probabilidad Gumbel los valores de la muestra ordenada son trazados por Fi , de otra manera si se usa papel de escala lineal se trazan dichos valores por yi .
<0,
>0, +
Esta distribucin tiene tres parmetros, , parmetro de localizacin; , de escala y , el de forma, que debe ser negativo. Los valores de la variable aleatoria tienen una frontera inferior la cual es menor que . La funcin de densidad de probabilidad (fdp) es 1/ 1 1/ x (x ) 1 f ( x) = 1 exp 1 La variable reducida Y , dada por x Y = 1 ,0 Y su funcin de distribucin acumulada (fda) es G(Y)=exp(-Y)1/ y Y 1/ 1 g (Y ) = exp( Y 1/ )
La inversa de la variable estandarizada es x = + / - /Y = + / (1 - Y) relacin con las que se estiman los cuantiles, donde 35
Y = [ ln( F ( x ))] La inversa de la variable estandarizada es de la forma x=A+BY donde A = +/; y B=-/>0 . Los cuantiles se determinan por medio de la relacin
x=
ln( F ( x )) 1
Estimacin de parmetros
Mtodo de los Momentos La inversa de la variable estandarizada es x= +//Y es de la forma x=A+By donde A = +/ ; y B=-/>0 . Los momentos son funcin de los cuales pueden ser tabulados, o partiendo de: g1=3/23/2, coeficiente de sesgo o de asimetra donde 2=(1+2)-2(1+) 3=(1+3)-3(1+2) (1+)+23(1+) valor que se utiliza en los siguientes polinomios
12 . g1 < 31 .
=0.28732449-0.35732233 g1+0.11195823 g12-0.0187768 g13+0.001322037 g14 =0.27759-0.32188 g1+0.06203 g12-0.01383 g13+0.007012 g14
0.21665 < g1 1.08
8.2 g1 318508 . (Tomado de Consolidated Frecuency Analysis Package, 1985) Una vez estimado a partir de los polinomios se estima y as: = 1/ 2 /2 = x + (1 (1 + )) / 1 2
=
i =1
(1 k ( xi ) / ) 1/ 1 exp (1 ( xi ) / ) 1/
36
Jenkinson (1969), sugiere el siguiente procedimiento utilizando la siguiente forma F(x)=exp(-exp(-y)) donde x= +(1-exp(-y))/ el cual se desarrolla en NERC (1975, paginas 92 y 93)
LV ( x / , , ) / = 0 ; LV ( x / , , ) / = 0 ( 2) Estas ecuaciones se resuelven con un proceso iterativo ya que no tienen una solucin explcita, y su demostracin matemtica se muestra en NERC (1975, paginas 94 y 95)
PWM Desarrollada por Hosking et al (1985). El momento M1,j,0 se define como: M 1, j ,0 = ( j + 1) 1 + {1 ( j + 1) ( + 1)} /
Para la estimacin de parmetros basta solo determinar Mi,0,0 , M1,1,0 y M1,2,0 .El estimador de M1,0,0 es E{xF(x)}, calculado utilizando la posicin de graficamiento, que es un buen estimador del momento. j 1 n = pi xi M 1, j ,0 n i =1 Los parmetros se calculan de la siguiente manera: = 7.859c + 2.9554c 2 c= 2 M 1,1,0 3 M 1,2 ,0
1,0 ,0
M M
2 M M 1,1, 0 1, 0 , 0 = (1 2 ) (1 + )
1,0,0
1, 0 , 0
+ [ (1 + ) 1] /
Mtodo grfico En la distribucin de valores extremos la relacin variable aleatoria - variable reducida es curva, y est dada por x= +/(1-exp(-Y)) donde Y=(xi- )/ y es cncava hacia arriba; si la curvatura es moderada puede utilizarse Fi=(i-0.44)/(n+0.12) , correspondiente a EV1. Pero si la curva es muy pronunciada se introduce un sesgo en el extremo superior el cual produce una sobreestimacin. Otro mtodo que evita esta desventaja, cuando la curva es muy pronunciada, es reescribir la relacin variable aleatoria - variable reducida como x= +W 37
donde W=(1-exp(-Y))/ el cual depende del parmetro de forma . Se pueden trazar los valores de Fi convertidos a Wi si el valor de es conocido a priori, convirtiendo primero los valores a Yi=-ln(-lnFi)
>0,
>0, x +
que es de la misma forma de la funcin de distribucin de EV2 pero con el valor de positivo. A diferencia de EV2 tiene lmite superior de +/ el cual es mayor que donde y son positivos. La funcin de densidad de probabilidad es 1/ 1 1/ x (x ) 1 f ( x) = 1 exp 1 La variable reducida Y es x Y = 1 , Y 0 La inversa de la variable estandarizada es x = + / + /Y = + / (1 + Y) y la funcin de distribucin acumulada (fda) es G(Y)=exp-(-Y)1/ y Y 1/ 1 g (Y ) = exp ( Y 1/ ) que es de la misma forma de EV2 x=A+BY donde A = +/ > ; y B=/>0 .
Estimacin de parmetros
Por la similitud con EV2 la estimacin solo tiene diferencias que pesan por el valor de , que es positivo en este tipo. Mtodo de los Momentos La inversa de la variable estandarizada esta dada por x = + / + /Y donde Y, la variable reducida , toma valores menores o igual a cero. La variable estandarizada es de la forma x=A+BY donde A =+/ es el parmetro de localizacin , frontera superior de x ; y B=/, es el parmetro de escala. Los momentos dependen de los cuales pueden ser tabulados, o partiendo de: coeficiente de sesgo g1 = - 3 / 23/2, valor que se utiliza en los polinomios 38
1.2 g1 < 31 .
=0.28732449-0.35732233 g1+0.11195823 g12-0.0187768 g13+0.001322037 g14 =0.27759-0.32188 g1+0.06203 g12-0.01383 g13+0.007012 g14
0.21665 < g1 1.08
8.2 g1 318508 . Ntese que =0 en el rango de g1 desde 1.08 a 1.20 (Tomado de Consolidated Frecuency Analysis Package, pginas 128 y 129) Una vez estimado a partir de los polinomios se estima y as: = 1/ 2
Mtodo de Mxima Verosimilitud El procedimiento para estimar los parmetros por este mtodo es el mismo que se utiliza para EV2. PWM Los parmetros se estiman de la misma manera como se estiman para EV2. Mtodo grfico En la distribucin de valores extremos la relacin variable aleatoria - variable reducida es curva, y est dada por x= +/(1-exp(-Y)) donde Y=(xi- )/ y es convexa hacia arriba; si la curvatura es moderada puede utilizarse, igualmente que en EV2 Fi=(i-0.44)/(n+0.12) , correspondiente a EV1. Otro mtodo que evita esta desventaja, cuando al curva es muy pronunciada, es reescribir la relacin variable aleatoria - variable reducida como x= +W 39
donde W=(1-exp(-Y))/ el cual depende del parmetro de forma . Se pueden trazar los valores de Fi convertidos a Wi si el valor de es conocido a priori, convirtiendo primero los valores a Yi=-ln(-lnFi)
Estimacin de parmetros
Mtodo de los Momentos Los momentos de la distribucin, la media, la varianza y el coeficiente de sesgo, pueden expresarse en trminos de los parmetros de la siguiente manera E(x)=+()(1+1/) Var(x)=()2{(1+2/)-2(1+1/)} g1=((1+3/)-3(1+2/)(1+1/)+23(1+1/))/((1+2/)-2(1+1/))3/2 si los momentos son reemplazados por sus mejores estimados de la muestra, y se reagrupa, se obtiene:
= +A() =- B()
donde: A()= (1-(1+1/)) B() B()= ((1+2/)- 2(1+1/))-1/2 PWM Greenwood et al (1979), expresaron PWM para la distribucin como: (1 + 1 / k ) M 1,0,k = 1 + m + (1 + m) 1+1/ k Los parmetros se estiman de la siguiente manera: 2 4 M 1,0,3 M 1,0,0 M 1,0,1 =
4 M 1,0,3 +
1, 0 , 0
4 M 1,0,1
ln{ M 1,0,0 2 M 1,0,1 } / ( M 1,0,1 2 M 1,0,3 )} / ln 2.0 ln 2.0 = ln ( M 1,0,0 2 M 1,0,1 ) / (2 M 1,0,1 4 M 1,0,3 )
1, 0 , 0
41
Estimacin de parmetros
Mtodo de los Momentos
Los momentos de la distribucin, la media, la variaza y el coeficiente de sesgo, pueden expresarse en trminos de los parmetros de la siguiente manera E(x) = (1+1/) Var(x) = 2{(1+2/)-2(1+1/)} g1 = ((1+3/)-3(1+2/)(1+1/)+23(1+1/))/((1+2/)-2(1+1/))3/2 si los momentos son reemplazados por sus mejores estimados de la muestra, y se reagrupa, se obtiene:
Cuando el coeficiente de sesgo ha sido estimado puede calcularse por algn mtodo numrico, como alternativa se presentan los siguientes polinomios que dan una muy buena estimacin para 1/.
1/ =0.27730+0.3252g1+0.07632g12+0.00388g13 (-1.08<g1<0.158308) 1/ =0.27586+0.33071 g1+0.05004 g12-0.01737 g13 (0.158308< g1<1.910765) 1/ =1.27421ln(0.58452 g1+1.02291) (1.910765< g1<5) Otro procedimiento ms sencillo de utilizar, menciona Haan, propuesto por Gumbell (1958), es a travs de manipulaciones algebraicas; reescribiendo se tiene: =+A() donde A()= (1-(1+1/)) B() Mtodo de Mxima Verosimilitud
donde n n = n / ( i =1 xi ln xi ln xi )
i =1
1/
PWM
1,0 ,k
M ln( M /M
1, 0 , 0
1, 0 , 0
1, 0 ,1
) / ln 2.0
ln 2.0 ln M 1,0,0 /
1, 0 ,1
( z ) 2 1 f ( z) = exp 2 2 2 de aqu la funcin de densidad de probabilidad (fdp) de x es (ln x ) 2 f ( x) = exp 2 2 x 2 Esta es una distribucin acampanada y de sesgo positivo, que tiene dos parmetros, los cuales son la media, parmetro de escala y la desviacin estndar, parmetro de forma. El coeficiente de variacin (CV), que es funcin solamente de 2 , es CV = (exp(2 )-1)1/2 2 = ln(1+Cv2) el coeficiente de asimetra es: g1=3/22/3 = (exp(2 )-1)1/2(exp(2 )+2) Para valores de 2 comprendidos entre 0.1 y 0.6 se tiene una relacin casi lineal, as: g1=0.52+4.85 2 es decir, para valores de g1 entre 1.005 y 3.43 En la prctica, menciona Kite 20 (1977),cuando los registros aparecen con un valor de cero, y cuando se toman los logaritmos se convierte el valor en - , y no pueden ser procesados. Varias soluciones se han propuesto a este problema, entre los cuales se citan: 1. sumar uno a todos los datos 1
2. sumar un valor positivo pequeo (como 0.1, 0.01, 0.001, etc.) a todos los datos 3. sustituir los registros de valor cero por el valor de uno 4. sustituir un valor positivo pequeo (como 0.1, 0.01, 0.001, etc.) a todos los datos 5. ignorar los registros con valor cero
20
Hann, Opt.Cit. p. 56
43
todas estas soluciones afectan los parmetros de la distribucin (1 y 2 afectan la media, 3,4,y 5 afectan tanto la media como la varianza)
Estimacin de parmetros
Mtodo de los Momentos
La relacin entre los dos primeros momentos y los parmetros y es: Media = E(x) = =exp(z+ 2/2) Varianza = E(x-E(x))2 = =exp(2 + 2)(exp(2)-1) donde el coeficiente de variacin CV es: CV=(exp2-1)1/2 despejando y 2 se tiene 2 = ln(CV2+1) ; = ln( CV 2 + 1) = ln 2 / 2; = ln x 2 / 2 Mtodo de Mxima Verosimilitud Para el caso de la distribucin de dos parmetros se tiene que la verosimilitud es n 1 1 exp ((ln xi ) / ) 2 V(X/ ,2)= 2 xi 2 i =1
=
1 2 s
2 1 exp ( xi x ) / s 2
1 ln xi n 2 1 2 = (ln xi ) n Esto da un estimador sesgado de 2 . De aqu, 2 1 2 = ln xi n+1 el cual es no sesgado como estimador de 2 , por el mtodo de mxima verosimilitud.
Mtodo Grfico Partiendo de que z=lnx la estimacin grfica se realiza de la misma manera como se hace para la distribucin normal. El procedimiento ms simple es localizar los puntos xi contra yi en papel semi-logartmico, xi en escala logartmica y yi en escala lineal. Se traza una recta a travs de los datos graficados y el valor de z cuando y=0 es el estimado de y la pendiente el de .
44
Estimacin de parmetros
Mtodo de los Momentos La relacin entre los tres primeros momentos y los parmetros , y g1 es: Media = E(x) = = x0+ exp( + 2/2) Varianza= E(x-E(x))2 = 2 =exp(2 + 2)(exp2-1) g1=(ex 2 1/2 2 p -1) (exp +2) para valores de 2 comprendidos entre 0.1 y 0.6 la relacin es casi lineal, es decir cuando 1.005< g1<3.43, de dada por g1 = 0.52 + 4.85 2 la cual es muy aproximada, y este valor puede utilizarse para comenzar iterativamente la estimacin de 2 As, con los mejores estimadores de , 2, y g1, se estiman los parmetros: 1/ 2 g 0.52 = 1 4.85
ln(exp( 2 ) 1) = ln( s) 2 2
Sangal & Biswas (1970), menciona NERC, proponen unos estimadores que no dependen del coeficiente de sesgo de la muestra g1.Suponiendo que tiene un valor pequeo x0 = Me - 2 /(2(Me)) donde Me, 2 y son la mediana, la varianza y la media de la distribucin de x; y utilizando los valores estimados de la muestra se tiene -x0= exp( + 2/2) / ( -x0) = (exp2-1)1/2 2 = ln(1+(/ -x0)2 ) estimado por:
45
s = ln 1 + x x0
de la definicin de la media, , se tiene: = ln(-x0)- 2/2 estimado por: = ln( x x 0 ) 2 / 2 Por otra parte, conociendo que la media y la varianza son el primer y segundo momento respectivamente y, si Z1 y Z2 representan los coeficientes de variacin de las distribuciones x y (xx0) , entonces: Z1= / Z2 =/( x0) x0= (1- Z1/Z2 )= / Z2 El valor de Z1 puede ser calculado directamente de los valores observados. El segundo y tercer momento de la distribucin (x-x0) no incluyen trminos en x0 , el valor de Z2 puede obtenerse de la relacin g1=3Z2+Z22 donde g1 es el coeficiente de asimetra o sesgo de la distribucin x. La solucin de esta ecuacin es: Z2 =(1-w2/3)/w1/3 donde w=(-g1+(g12+4)1/2)/2 El procedimiento consiste en determinar la media (), desviacin estndar () y coeficiente de variacin (g1) de la muestra, x; calcular Z1 y Z2 , calcular x0 , y luego =ln(Z2 2+1))1/2 = ln(/ Z2)-(ln(Z2 2+1))/2 Mtodo de Mxima Verosimilitud Para el caso de la distribucin de dos parmetros se tiene que la verosimilitud es
[ln( xi x0 ) ] n i =1 LV= ln( xi x 0 ) ln(2 ) n ln 2 2 2 i =1 Derivando respecto a , 2 y x0, e igualando a cero se tiene
n
= ln( x i x 0 ) / n
i =0
2 = [ln( x i x 0 ) ] / n
2
i =0
( xi x 0 ) 1 ( 2 ) = [(1 / ( xi x 0 )) ln( xi x 0 ) ]
i =0 i =0
46
47