Você está na página 1de 47

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A.

GONZLEZ-MURILLO

Tabla de Contenido
3. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS Y CONTINUAS 3 5 5 7 7 8 12 12 13 13 13 13 14 15 16 17 17 17 18 20 23 23 24 27 3.1 Algunas Distribuciones Discretas de Probabilidad 3.1.1 Distribucin Uniforme Discreta 3.1.2. Proceso BERNOULLI 2.1.2.1 Distribucin Bernoulli 3.1.2.2 Distribucin Binomial 3.1.2.3 Distribucin Geomtrica 3.2 Relacin con el periodo de Retorno (T) 3.3 Algunas Distribuciones Continuas de Probabilidad 3.3.1 Distribuciones tiles en el muestreo estadstico 3.3.1.1 La distribucin P 2 o de Chi cuadrado 3.3.1.2. La distribucin t o de students 3.3.1.3 La distribucin F 3.4 Distribuciones de probabilidad tiles en hidrologa 3.4.1 Parmetros de una distribucin de probabilidad 3.4.2 Estimacin de parmetros 3.4.2.1 Mtodo de momentos 3.4.2.2. Mtodo de Mxima Verosimilitud 3.4.2.3 Mtodo de Momentos ponderados por probabilidad (Probability Weighted Moments: PWM) 3.4.2.4 Mtodo grfico 3.4.3 Distribuciones de Probabilidad 3.4.3.1 Distribucin Normal. Estimacin de parmetros 3.4.3.2. Distribucin Pearson Tipo 3 1

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Estimacin de parmetros 3.4.3.3. Distribucin Gamma Estimacin de parmetros 3.4.3.4 Distribucin Exponencial 3.4.3.5 Distribucin General de Valores Extremos (GVE) 3.4.3.6 Distribucin General de Valores Extremos Tipo 1 (EV1) o Distribucin Gumbel Estimacin de parmetros 3.4.3.6 Distribucin General de Valores Extremos Tipo 2 (EV2) Estimacin de parmetros 3.4.3.7 Distribucin General de Valores Extremos Tipo 3 (EV3) Estimacin de parmetros 3.4.3.8. Distribucin Weibull de tres parmetros Estimacin de parmetros 3.4.3.9. Distribucin Weibull de dos parmetros Estimacin de parmetros 3.4.3.10 Distribucin Logaritmico-Normal de dos parmetros Estimacin de parmetros 3.4.3.11 Distribucin Logaritmico-Normal de tres parmetros Estimacin de parmetros

27 28 29 31 32 33 34 35 36 38 38 40 40 41 42 43 44 45 45

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

3. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS Y CONTINUAS


El anlisis del comportamiento de algunas variables aleatorias hidrolgicas ha llevado a la formulacin de ciertos modelos particulares que permiten describir las probabilidades asociadas a la variable aleatoria mediante una forma funcional en particular. En este captulo se har referencia a algunos de estos casos. VARIABLE ALEATORIA (v.a): Es una funcin cuyos valores son nmeros reales asociados con cada evento elemental del espacio muestral , resultante de un experimento aleatorio. Se identifica generalmente con letras maysculas, (X,Y,Z,W) dejando las minsculas para los valores que puede asumir (x,y,z,w). Formalmente una v.a. X es una funcin definida asi: X: {--------R; w--------X(w) }; X se llama v.a si {w:X(w):r, para algn r R}. (Pacheco P.N. 2002) Una variable es aleatoria (Variate) v.a si toma diferentes valores como resultado de un experimento aleatorio, puede ser discreta o continua. La Variable Aleatoria Discreta se considera como tal, si solamente puede asumir un conjunto finito contable de valores al ser aplicada sobre los eventos correspondientes del experimento aleatorio. Es decir, X es v.a discreta si su recorrido se puede poner en correspondencia con los nmeros enteros positivos. (Pacheco P.N. 2002) Se considera la v.a continua si su recorrido como funcin sobre los eventos de una experiencia aleatoria pertenece a un conjunto de intervalos de nmeros reales. Se dice de la variable aleatoria continua X lo ser si puede asumir valores en escalas continuas en el intervalo de definicin de la v.a. X. (Pacheco P.N. 2002). La representacin de probabilidades es una curva como se muestra en la figura 2 3

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

1.00

F(x)

fda

Pobabilidad

0.50

f(x)
fdp

0.00 -10.00 0.00


Variable Estandarizada Z

10.00

Figura 2. Representacin de la fdp y fda.


x + dx

La probabilidad de que x este comprendida entre x y x+dx se denota F(x)=

f ( x)dx .
x

F(x) se le conoce como funcin de distribucin acumulada, fda, y representa la integral de la funcin de densidad de probabilidades, fdp, f(x) entre x y x+dx. Para que f(X) represente verdaderamente una densidad de probabilidades, es necesario que el valor de la integral a lo largo del intervalo de variacin de X sea
igual a uno (1),

f ( x)dx = 1 . Se supondr aqu que la v.a puede tomar todos los valores
esta representacin se d para el caso de variables

posibles de - hasta , sin considerar esto como una condicin restrictiva.

P ( X xi ) =

f ( x)dx = F ( x) ,

continuas en el caso de las variables discretas la fda es: F ( x) = f ( xi ) = P ( X xi ) .


i =1

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

La probabilidad es siempre un valor positivo entre 0 y 1, la funcin de distribucin acumulada ser una funcin creciente que cumple con lo siguiente:

lim F ( x) = 1 y lim F ( x) = 0
n n

3.1 Algunas Distribuciones Discretas de Probabilidad

3.1.1 Distribucin Uniforme Discreta


Se utiliza cuando la variable aleatoria asume cada uno de sus valores con idntica probabilidad.

1 fdp= f ( x, k ) = k 0

x = x1 , x2 , x3 ,..., xk En otro caso .

1 E ( X ) = = xp( x ) = x i f (x, k ) = xi = k x i =1 i =1
k k 2 k 2

x
i =1

k
k 2

Var ( X ) = 2 = ( x ) p(x ) = (x i ) f ( x, k ) = ( xi )
x i =1 i =1

1 = k

(x
i =1

Ejemplo: Supngase que el nmero de rayos que se producen durante una tormenta elctrica se distribuye uniformemente (x;5), el dominio de la variable SX = {1, 2, 3,4, 5 }. Construya la funcin de probabilidad para la variable aleatoria que indica el nmero de rayos que se producen durante una tormenta elctrica. a) Qu tipo de distribucin se puede asociar a esta variable? b) Halle la media y la varianza de la variable aleatoria. c) Cul es la probabilidad de que al seleccionar al azar una tormenta, el nmero de rayos que se dieron sea al menos de cuatro? Solucin:

1 a) La funcin de probabilidad es: f ( x;5) = 5 0,


5

x = 1, 2 3,4 ,5 . en otro caso

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

0.30

Probabilidad

0.20

0.10

0.00
1 3 5

Nmero de rayos que caen

Figura 3. Representacin del Ejemplo de la Distribucin Uniforme Discreta

b) La distribucin ms adecuada es la Uniforme Discreta. Esto equivale a suponer que toda las tormentas tienen igual probabilidad de que se produzcan un nmero entre 1 y 5 de rayos. c)

= xf ( x) =1.(1 / 5) + 2.(1 / 5) + 3.(1 / 5) + 4.(1 / 5) + 5.(1 / 5) =


x

1+ 2 + 3 + 4 + 5 = (1 / 5)(15) = 3 5

(1 3) 2 + ( 2 3) 2 + (3 3) 2 + ( 4 3) 2 + (5 3) 2 = =2 = 5 k As, el valor esperado de rayos por tormenta es de 3 y su varianza es de 2.


2 x

(x )

d) P( x 4) = P( x = 4) + P( x = 5) =

1 1 + = 0.4 5 5

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

La probabilidad de que al seleccionar una tormenta al azar, el nmero de rayos que haya tenido sea al menos de cuatro es de 0.4

3.1.2. Proceso BERNOULLI


Un proceso Bernoulli tiene las siguientes propiedades: 1. El experimento consiste en n intentos repetidos. 2. Los resultados de cada uno de los intentos pueden clasificarse como un xito o como un fracaso. 3. La probabilidad de xito, representada por p, permanece constante para todos los intentos. 4. Los n intentos repetidos son independientes. Si el proceso Bernoulli consiste de un solo intento y la variable aleatoria X es 1 si hubo un xito y 0 si hubo un fracaso, la distribucin de probabilidad de esta variable aleatoria discreta se le llama Distribucin Bernoulli.

2.1.2.1 Distribucin Bernoulli

p x (1 p )1 x fdp= f ( x; p ) = 0

x = 0,1 en otro caso

con p entro 0 y 1 (0p1)

E ( X ) = = xp( x ) = x p x (1 p )
x i =0 2 2 1

1 x

= 0 p 0 (1 p )
2

1 0

+ 1 p 1 (1 p )

11

=0+ p= p

Var ( X ) = = ( x ) p ( x ) = ( x ) p x (1 p )
x i =0

1 x

= (0 p ) p 0 (1 p )
2

1 0

= p 2 p 3 + 1 2 p + p 2 p = p 2 p 3 + p 2 p 2 + p 3 = p p 2 = p(1 p )
Ejemplo: Suponga que la probabilidad que en un mes se de una creciente en un determinado sitio de una cuenca es de 0.30. Considere el experimento aleatorio de escoger un mes y observar si se d la creciente. Ahora, considere a W como la variable aleatoria que cuenta el nmero de meses con creciente en una muestra aleatoria de n meses Establezca los valores que puede tomar la variable W.

+ (1 p ) p 1 (1 p )
2

11

= p 2 (1 p ) + (1 p ) p
2

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

a) Exprese la frmula de la funcin de probabilidad para W. b) Halle, usando la frmula de b), la probabilidad de que el mes creciente. c) Halle la media y la varianza de W.

no presente

Solucin. a) Como solamente se tiene la realizacin de un solo experimento- un solo mes-, los valores posibles de W son cero y uno. (0.3) w (0.7) 1 w , w = 0, 1 b) Funcin de probabilidad: f ( w,0.3) = e.o.c. 0

c) P (no creciente= P (W=0)= f (0,0.3) = (0.3) 0 (0.7) 1 = 0.7 Un resultado coherente debido a que P(no creciente) = 1- P(creciente)=1- 0.3 = 0.7. d) = wf ( w,0.3) =0. f (0,0.3) + 1. f (1,0.3) = 0.3

= ( w ) 2 f ( w,0.3) = (0 0.3) 2 (0.7) + (1 0.3) 2 (0.3) = 0.21


2 w

3.1.2.2 Distribucin Binomial


Sea X la variable aleatoria que determina el nmero de xitos en un experimento Bernoulli que se realiza n veces, esta variable recibe el nombre de variable aleatoria BINOMIAL. A la distribucin de probabilidad de esta variable aleatoria discreta se le llama distribucin Binomial. Por lo tanto, la distribucin Bernoulli es un caso particular de la distribucin Binomial, cuando n = 1. Cabe notar, que se llama xito a la ocurrencia del evento y Fracaso a su noocurrencia. Adems, sea p la probabilidad de xito cada vez que el experimento se

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

lleva a cabo y 1-p la probabilidad de fracaso. Tambin suponga que el experimento se realiza n veces y cada una de stas es independiente de todas las dems, y sea X la variable aleatoria que representa el nmero de xitos en los n ensayos. El inters est en determinar la probabilidad de obtener exactamente X=x xitos durante los n ensayos. Las dos suposiciones claves para la distribucin binomial son: 1. La probabilidad de xito p permanece constante para cada ensayo. 2. Los n ensayos son independientes entre si.

n x n x p (1 p ) ( ) ; , = b x n p fdp = x 0

x = 0,1,2,3,..., n en otro caso

con n entero positivo y p entro 0 y 1 (0p1)

Sea X una variable aleatoria binomial con n = 5 y p = 0.4. Calcular la funcin de probabilidad:

5 x 5 x x = 0,1,2,3,4,5 0.4 (1 0.4 ) b(x;5,0.4 ) = x 0 en otro caso 5 0 5 x=0 0 0.4 0.6 5 1 4 x =1 1 0.4 0.6 0.07776 0.2592 5 2 3 x=2 2 0.4 0.6 0.3456 b( X = x;5,0.4 ) = 5 3 2 b( X = x;5,0.4) = 0.2304 x=3 0.0768 3 0.4 0.6 5 4 1 0.01024 x=4 0 4 0.4 0.6 5 5 0 x=5 5 0.4 0.6 en otro caso 0

x=0 x =1 x=2 x=3 x=4 x=5 e. o. c.

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Suponga que se tienen las mismas condiciones del ejemplo anterior pero seleccionando cinco meses, los cuales responden de manera independiente a la presencia o ausencia de crecientes. a) Establezca los valores que puede tomar la variable W. b) Exprese la frmula de la funcin de probabilidad para W. c) Halle la probabilidad de que ningn mes de los seleccionados presente creciente. d) Encuentre la probabilidad de que mximo tres meses presenten crecientes. e) Indique el nmero esperado de meses que presenten crecientes. a) El nmero de meses que presentan crecientes puede tomar los valores 0,1,2,3,4 y 5. b) La variable aleatoria W es binomial (x;5,0.3) porque se tienen n=5 experimentos independientes de Bernoulli, con probabilidad de xito igual a 0.3, constante en cada experimento. Por tanto, la funcin de probabilidad correspondiente ser: 5 w 5 w w = 0, 1,2,3,4,5 (0.3) (0.7) b( w; 5, 0.3) = w 0 e.o.c. c) Como la variable aleatoria W cuenta el nmero de meses con creciente, entre los seleccionados, se tiene: 5 0 5 5 P(ningn mes tenga creciente)=P(W=0) = 0 (0.3) (0.7) = (0.7) = 0.16807 La probabilidad de que ningn mes tenga creciente es de 0.16807. d) P(mximo 3 meses con creciente)=P(W 3) = P(W=0) + P(W=1) + P(W=2) + P(W=3) = ? **

5 5 5 5 0 5 1 5 1 2 5 2 3 53 P(W 3) = (0.3) (0.7) 3 (0.3) (0.7) + 2 (0.3) (0.7) + 1 (0.3) (0.7) + 0 = 0.16807 + 0.36015 + 0.3087 + 0.1323 = 0.96922
Entonces, la probabilidad de que tres o menos meses con creciente es del 97%. d) El nmero esperado de meses con crecientes es np = (5)(0.3) = 1.5

10

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

As, entre uno y dos meses se espera que presenten creciente de los cinco meses seleccionados aleatoriamente.

Ejemplo: Un agricultor que siembra fruta afirma que 2/3 de su cosecha de duraznos ha sido contaminada por la mosca del mediterrneo. Encuentre la probabilidad de que al inspeccionar 4 duraznos: a. Los 4 estn contaminados por la mosca el mediterrneo b. Cualquier cantidad entre 1 y 3, inclusive, est contaminada c. Menos de 2 duraznos estn contaminados Sea X: un durazno esta contaminado por la mosca del mediterrneo. Y, como: 1. La probabilidad de estar contaminado por la mosca del mediterrneo xito p, permanece constante para cada durazno inspeccionado y 2. Las n=4 selecciones son independientes entre si. Se puede inferir que X tiene una distribucin binomial B(x;n,p) con n=4 y p=2/3. As, para a) Los 4 estn contaminados por la mosca el mediterrneo, la probabilidad es p(X=4): 4 0 2 4 2 2 b X = 4;4, = 1 = 0.1975 3 4 3 3 Entonces, la probabilidad de que los cuatro duraznos estn contaminados por la mosca el mediterrneo es 0.1975 o de un 20%. Para b) Cualquier cantidad entre 1 y 3, inclusive, est contaminada, nos interesa

p(1X3):

p(1 X 3) = p( X = 1) + p( X = 2 ) + p( X = 3) 4 2 4 2 2 4 2 2 2 = 3 1 3 = 3 3 1 3 + 2 3 1 3 + 1 0.09877 + 0.2963 + 0.3951 = 0.7901


Por tanto, la probabilidad de que cualquier cantidad entre 1 y 3, inclusive, est contaminada es e 0.7901 o 79%. Para c) Menos de 2 duraznos estn contaminados, interesa p(X<2):
1 3 2 2 3 1

11

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

p( X < 2 ) = p( X 1) = p( X = 0 ) + p( X = 1) 4 2 = 0 3
0

4 2 2 + 1 3 3

2 = 0.01235 + 0.09877 = 0.1111 3

3.1.2.3 Distribucin Geomtrica


En una secuencia de experimentos de Bernoulli independientes. El xito se observa con probabilidad p y deja de observarse con probabilidad 1-p, el nmero de rplicas antes de la primera observacin de xito tiene una distribucin geomtrica o de Pascal, G(p). Para cada nmero natural r, la funcin de densidad de probabilidad de que haya r fallos antes del primer xito es: 1 p E (r ) = p f (r ) = p(1 p) r 1 p Var (r ) = 2 p

1 E (r ) = p f (n) = p(1 p) n 1 1 p Var (r ) = 2 p

3.2 Relacin con el periodo de Retorno (T)


El valor esperado de una variable aleatoria con distribucin geomtrica se denomina en algunas reas como la financiera y la hidrolgica PERIODO DE RETORNO. Asi, el Nmero de ao que trascurren hasta que se observa un fenmeno de inters,(ej. Caudal mximo), suponiendo que en cada ao se pueden dar caudales mximos con una probabilidad fija p y que las ocurrencias del evento son independientes de ao a ao, presenta un comportamiento geomtrico. El nmero de aos esperado hasta que se presente un caudal mximo dado, se interpreta como el periodo de retorno del fenmeno. Periodo de retorno de 5 aos quiere decir que se espera que trascurran 5 aos desde la ltima sequa hasta la prxima.

12

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

3.3 Algunas Distribuciones Continuas de Probabilidad 3.3.1 Distribuciones tiles en el muestreo estadstico 3.3.1.1 La distribucin P 2 o de Chi cuadrado X Z= , es la variable aleatoria, de la distribucin normal estandarizada, Y se Si
i =1 define como , esta tiene una distribucin Chi cuadrado, con N grados de libertad. Esta distribucin es un caso especial de la distribucin Gamma X 1e X X , , > 0 ( ) , cuando = 1 / 2 . El parmetro de la distribucin es

Y = Z i2

conocido como los grados de libertad. Su fdp se expresa como:

X (1 / 2) e X / 2 X , > 0 /2 2 ( / 2 ) f(x)=
El promedio y la varianza de la distribucin est dadas por: E(X)= < Var(X)= 2 < Si Z1, Z2,...... Zn es una muestra aleatoria de la distribucin Normal estandarizada, Y = Z i2 = ( xi X ) 2 / la variable aleatoria , tiene una Distribucin Chi cuadrado con grados de libertad igual a (N-1). Adicionalmente dado que S 2 = ( xi X ) 2 / N 1 , la cantidad (N-1)S2/ 2 tiene una distribucin Chi cuadrado con (N-1) grados de libertad. Haan C.T., 2002, pg. 142.

3.3.1.2. La distribucin t o de students


Si Y y U son variables independientes. Y es una variable aleatoria estandarizada y U es una variable aleatoria Chi cuadrado, con grados de libertad , por lo tanto, dada por:

X =Y

U , tiene una distribucin t con grados de libertad. Su fdp, est

f (t ) =

[( + 1) / 2)] (1 + t 2 / ) (1+ ) / 2

( / 2)

< t < ; > 0

El promedio y la varianza de la distribucin est dadas por: E(t)= 0

13

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Var(t)= n/(n-2) ; n >2 Uno de los usos ms recurrentes de la distribucin t es cuando se tratan de hacer X E= S 2 / N , es pruebas acerca de la media en donde se considera que el estadstico t distribuido. Si se multiplica tanto el numerador como el denominador por F y se manipula el trmino N-1, se obtiene: X X / N = Y N 1 t= U , obsrvese que en este caso Y= 2 / N , U considerada la S 2 / 2
2 2 variable que se distribuye Chi cuadrado sera ( N 1) S / , ello dejara la posibilidad del uso de N 1 , en el numerador. Haan C.T., 2002, pg. 143.

La distrubucin t es una distribucin acampanada simtrica, similar a la distribucin Normal, pero las colas de la distribucin son ms amplias que las de la distribucin Normal. El ancho de la distribucin t depende del grado de incertidumbre en 2 , lo cual es medido por los grados de libertad < con los que se hace la estimacin de 2 . Cuando el tamao de la muestra es infinito, no hay mucha incertidumbre en la estimacin de 2 y la distribucin t se vuelve la distribucin Normal estndar. Cuando el tamao de la muestra es pequeo (< 30 ), la variacin de 2 aumenta. Esto se refleja en el aumento del esparcimiento de la distribucin t cuando los grados de libertad disminuyen.

Las condiciones para los cuales la cantidad grados de libertad son:

t=

x s tenga una distribucin t con <

X sea Normalmente distribuida, con media : y varianza F 2 .

2 es distribuida independientemente del promedio, es decir la varianza de la muestra no aumente o disminuye con el aumento o disminucin del promedio. La cantidad 2 , la cual tiene < grados de libertad es calculada de observaciones independientes, Normalmente distribuidas cuya varianza es 2 . Mc Berthouex y Brown 2002, pg. 16.

3.3.1.3 La distribucin F

14

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Si U y V son dos variables independientes que se distribuyen Chi cuadrado con 1 y U /1 X= V /2 2 grados de libertad respectivamente, luego la variable aleatoria , tiene una distribucin F con 1 y 2 grados de libertad. La fdp, est dada por:

f (F ) =

2 /2 [( 1 + 2 ) / 2)] 1 1 / 2 ( F ) ( 1 2 ) / 2 * ( 2 + 1 F ) ( 1 + 2 ) / 2 2

( 1 / 2) ( 2 / 2)

1 , 2 ;F > 0

El promedio y la varianza de la distribucin estn dadas por:


E(F ) =

1 2 2
2 ( 1 + 2) 2
1

Var ( F ) =

1 * ( 2 2) * ( 2 4)

3.4 Distribuciones de probabilidad tiles en hidrologa


Las funciones de distribucin estn definidas por el modelo matemtico que ajusta el comportamiento frecuencial de una caracterstica cuantitativa para todos los elementos de una poblacin. Dicho modelo se identifica por los elementos que lo determinan, los cuales se denominan parmetros. De acuerdo con Chow (1994), pg. 374, una distribucin de probabilidad es una funcin que representa la probabilidad de ocurrencia de una variable aleatoria. La informacin del comportamiento de la serie se define mediante el ajuste a una distribucin del conjunto de datos, que se resume en la funcin de distribucin y en los parmetros asociados a ella. Parmetros de la distribucin de probabilidades: El objetivo del uso de la estadstica en el anlisis de series cronolgicas es extraer la informacin esencial de un gran nmero de datos (la serie) para expresarlos con un reducido nmero de valores, que representen e identifiquen su comportamiento adecuadamente. Estimacin e inferencia: La estadstica se ocupa en gran medida de la inferencia de parmetros poblacionales, inferencias que son inciertas debido a que se basan en comprobaciones obtenidas de las muestras. A menos que se conozcan los parmetros, no se puede saber la bondad de estimacin que alcanza un parmetro

15

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

con un estadgrafo muestral; hay que conformarse con saber lo bueno que es ese estimativo en promedio, es decir, saber que tan bien se comporta en un muestreo repetido, o saber cuantos valores muestrales se puede esperar que caigan dentro de un intervalo dado en torno a un parmetro. Hasta donde son los estadsticos buenos estimativos de los parmetros?. Existen varias propiedades que son deseables para un buen estimador de parmetros, entre los cuales se pueden mencionar: Insesgamineto: Un estimador de un parmetro se dice que es insesgado si E ( ) = . El sesgo, est dado por E ( ) . El hecho que un estimador sea insesgado, no garantiza que sea igual que , esto solo significa que el promedio de valores independientes estimados por sea igual a . Varianza mnima: Se dice que un estimador produce varianza mnima cuando este obtiene la menor de las varianzas del conjunto de datos producidos por el conjunto de estimadores. Eficiencia: Una medida de la calidad de un estimador. La eficiencia es inversamente proporcional a la varianza. Una muestra es ms eficiente que otra, si esta tiene una varianza menor que la otra. Un estimador es el ms eficiente si es insesgado y tiene varianza mnima. Consistencia: Una propiedad de los nmeros que se relacionan con el tamao de la muestra. As, si la muestra aumenta de tamao, la media de la muestra no debe apartarse de la de la poblacin ms all de un rango establecido. Exactitud: Cuando produce la medida ms cercana al valor verdadero de una medida dada. Precisin: Es la variacin de una observacin o conjunto de observaciones a consecuencia de un error aleatorio. Esta es la medida de la repetibilidad de una serie de observaciones o medidas. Suficiencia: El grado en el que un parmetro derivado de una muestra dada, representa o extracta informacin de la correspondiente poblacin.

3.4.1 Parmetros de una distribucin de probabilidad


Los parmetros ms comunes son los de localizacin ( ), de escala ( ) y de forma ( ). El primero, parmetro de localizacin, ubica la posicin de la poblacin en el eje de las abscisas; el parmetro de escala controla el despliegue o la extensin de los valores de la variable alrededor del parmetro de localizacin y, por ltimo, el parmetro de forma define la caracterstica de la distribucin respecto a la agudeza en la cima de la curva que representa. En la representacin grfica de las

16

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

funciones de distribucin puede apreciarse como los parmteros las identifican y caracterizan.

3.4.2 Estimacin de parmetros


Existen diferentes mtodos de estimacin de parmetros. Entre los ms usados se encuentran el de momentos y el de mxima verosimilitud. FSR (1975) 1 . Sin embargo, en hidrologa particularmente, existe otro mtodo comnmente utilizado que es el grfico o el uso de papeles de probabilidad el cual, pese a su extendido uso, es subjetivo y los resultados cambian dependiendo del analista que los utilice. Otro mtodo que est siendo utilizado desde 1979 es el de momentos ponderados de probabilidad , conocido como PWM (Probability weighted moments).

3.4.2.1 Mtodo de momentos


La estimacin de los parmetros depende de la distribucin a la que se supone que pertenece la muestra. El nmero de momentos que se requiere conocer para definir una determinada distribucin es igual al nmero de parmetros de la distribucin en cuestin; esto es porque un parmetro de localizacin es anlogo al primer momento, un parmetro de escala al del segundo momento y un parmetro de forma depende del tercer momento. En otras palabras, el mtodo, menciona Custodio 2 (1983), consiste en igualar tantos momentos respecto al origen en la poblacin a los correspondientes momentos de la muestra, como parmetros haya que estimar.. Kite (1977) pg. 28, menciona las ecuaciones para los momentos centrales y respecto al origen tal como son descritas en el captulo 2.

3.4.2.2. Mtodo de Mxima Verosimilitud


Este mtodo fu desarrollado por Fisher a partir de 1912 3 . Kite 4 , (1977), describe este mtodo de la siguiente manera: Para una funcin de densidad de probabilidad (fdp) f(x; , , ... ) , donde y son los parmetros a estimar, la probabilidad de obtener un valor dado x , xi , es proporcional a f(xi ; , , ... ) y la probabilidad conjugada, V, de obtener una muestra de n valores x1 , x2 , ..., xn es proporcional al producto

NATURAL Enviromental Research Council. Flood Studies Report. Hydrological Studies. Vol. 1. London: 27 Chaning Cross Road, 1975.p.65

CUSTODIO E. Y Llamas M.R. Hidrologa subterrnea. Tomo I. 2 ed. Barcelona: Editorial Omega S.A. , 1983.p.3.38
3 4

CUSTODIO. Opt.Cit. p3.37 KITE. Opt.Cit. p.30

17

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

V = f ( x; , ...)
i =1

( 1)

llamado verosimilitud. El mtodo es utilizado para estimar los parmetros , , ... , en el que se maximiza V . Esto se obtiene hallando las derivadas parciales de V respecto a sus parmetros e igualando a cero. Frecuentemente se utiliza Ln(V) en lugar de V, para simplificar los clculos, por el carcter exponencial de la funcin.

3.4.2.3 Mtodo de Momentos ponderados por probabilidad 5 Weighted Moments: PWM)

(Probability

Es un mtodo de estimacin de parmetros para aquellas distribuciones que puedan ser explcitamente definidas en forma inversa, de la forma X=X(f). Fu introducido por Greenwood et al (1979). Este procedimiento es simple e insesgado. (Cunnane, 1985). Los PWM estn definidos como:

Mi , j , k = E x i F j (1 F ) k = [ x( F )] F j (1 F ) k dF
i 0

Donde i, j, k son nmeros reales y F=F(x)=P(Xx). Esta expresin es una generalizacin de los momentos convencionales. Por ejemplo, si j=k=0, se tiene Mi,0,0, que representa el momento de orden i alrededor del origen. Las relaciones entre los parmetros y los PWM son de estructura analtica ms simple que las encontradas entre stos y los momentos convencionales (Greenwood et al, 1 979) especialmente cuando se utiliza X elevado a la primera potencia. Para estimar los parmetros de las distribuciones Weibull, Gumbel, Lambda generalizada, logstica, Wakeby y Kappa, Greenwood et al, (1979) usaron la expresin M1.o.k. definida como: k k j M 1,0,k = (1) M 1, j , 0 j j =0 Hosking et al, (1985) usaron la expresin m1,j,0 para estimar los parmetros de la distribucin general de valores extremos (GVE), definida de la siguiente forma:
j j k M 1, j ,0 = (1) M 1, 0,k k k =0

Captulo extractado de: Gonzlez-Murillo, Carlos A. Regional flow Analysis for the Valle del Cauca region in Colombia. A dissertation submitted of the requirements for the degree of Master of Science (hydrology). Department of Engineering Hydrology, University College, Galway, Ireland, September 1986.

18

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Cuando se usa M1,0,.k donde k es un entero positivo, un estimador no sesgado de M1,0,k es dado por Landwehr et al, (1 979) como:

M 1,0,k

N j k 1 N K Xj = N J =1 N 1 k
XN

Donde X1 X2 X3 ... N: Tamao de la muestra.

Landwehr et al, (1979) encontraron que el algoritmo PWM dio buenos resultados usando un estimador moderadamente sesgado de M1,o,k cuando se determinaron los parmetros de la distribucin Wakeby. Este estimador se expresa como:
1 N

M 1, 0, k =

X
i =1

(1 Pi ) k

Pi = (i - 0.35)/N
Donde Pi es isima frecuencia i es el orden del evento, ordenados de menor a mayor N: es el tamao de la muestra. La misma frmula de frecuencia (P), fue encontrada apropiada por Hosking et al, (1985) cuando se us la expresin M1.j.0 en lugar de la expresin M1,o,k para estimar los parmetros de la distribucin GVE. El mtodo PWM ha sido comparado por Landwehr et al, (1979), con mtodos tradicionales de estimacin de parmetros, tales como momentos y mxima verosimilitud para la distribucin Gumbel; ellos concluyeron que esta tcnica produce estimados no sesgados de los parmetros y de los cuantiles cuando las muestras son extradas de un proceso aleatorio. Hosking et al, (1985), usando esta tcnica para ajustar los parmetros de la GVE, encontraron que este mtodo tiene una menor varianza y un sesgo no severo, comparando de forma favorable con los estimados obtenidos por el mtodo de mxima verosimilitud y sextiles. Ellos tambin encontraron que el mtodo PWM tiene consistentemente la ms baja desviacin estndar entre los tres estimadores del parmetro de forma k, su ventaja es particularmente marcada en muestras de

19

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

tamao pequeo. El mtodo tuvo en general un mayor sesgo que los otros estimadores, pero ste es pequeo, cercano al importante valor de k igual a cero. Similares resultados se obtuvieron con la estimacin de los parmetros de escala y localizacin. En cuanto a la estimacin de los cuantiles especialmente en las colas de las distribuciones usadas para propsitos hidrolgicos, los estimados obtenidos para perodos de retorno altos son algo sesgados, sin embargo son an preferibles a los estimados obtenidos por el mtodo de mxima probabilidad.

3.4.2.4 Mtodo grfico


Consiste en representar grficamente los valores muestrales, ajustarlos a la distribucin de la poblacin del tipo que se supone a la que pertenece la muestra y obtener, de dicha representacin, la funcin de distribucin y los parmetros que se desean estimar. Generalmente, cada tipo de distribucin requiere de un papel de probabilidad especfico para lograr una lnea recta, aunque la representacin de datos para distribuciones de ms de tres parmetros no necesariamente de una lnea recta. La construccin del papel de probabilidad es un proceso de transformacin de la escala hasta lograr obtener dicha lnea recta. Para conseguirla debe tenerse una relacin matemtica lineal entre la funcin F(x) y la variable x, en otras palabras la funcin debe ser lineal, del tipo F(x)= a+bx . En el uso prctico del papel de probabilidad es necesario conocer como graficar las observaciones. Generalmente, los valores de la serie son ordenados ascendente o descendentemente, si los ordena ascendentemente y asigna una probabilidad a cada dato ello correspondera a la probabilidad de no-excedencia, despus debe decidirse donde sern graficados los eventos. Con este propsito se hace necesario el uso de las frmulas de probabilidad, facilitando el despliegue grfico de la serie. Los datos de la muestra son graficados como una serie de n puntos discretos en un sistema coordenado x-y. Los puntos representan la distribucin de la muestra, y la lnea dibujada a travs de estos es considerada como la estimacin de la poblacin. Arnell et al (1986) indican que si el grfico es utilizado para estimar cuantiles o parmetros de la distribucin, debe ser usada una frmula de probabilidad insesgada, tal como lo seala Cunnane (1978).

20

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Gonzlez-Murillo 6 (1992), seala que de acuerdo con Cunnane (1978): la posicin del graficamiento insesgado es E(Yi), el promedio de la i-sima estadstica de orden en muestras provenientes de una poblacin de variables aleatorias estandarizadas. Una buena aproximacin para cada distribucin se encuentra en el dominio de la probabilidad, tomando la forma general (m-b)/(n+1-2b) ...Si una frmula de probabilidad fuese a ser usada en el caso del desconocimiento de la frmula de distribucin de probabilidad b=2/5 sera el mejor compromiso. Este valor de b=2/5, corresponde a lo que se conoce como la frmula de Cunnane. El valor de b depende del tipo de distribucin de probabilidad que ha de utilizarse. De hecho, Chow 7 indica que la mayor parte de las frmulas de posicin de graficamiento estn representadas por la forma general anteriormente mencionada. Gumbel en 1958 estableci los 5 postulados que deben cumplir las relaciones de posicin de graficamiento (Haan, 1975 8 ; Kite, 1977 9 ): 1. La posicin de graficamiento debe ser tal que todos los datos puedan ser graficados. 2. La posicin de graficamiento debe caer entre las frecuencias observada (m-1)/n y m/n donde m es el nmero de orden del valor observado comenzando con m=1 para el mayor (menor) valor, y n es el nmero de aos de registros o el nmero de observaciones. 3. El perodo de retorno igual o mayor que la mayor observacin y el perodo de retorno igual o menor que la menor observacin debe converger hacia n. 4. Las observaciones deben estar igualmente espaciadas en la escala de frecuencias 5. La posicin de graficamiento debe tener un significado intuitivo, debe ser analticamente simple y de fcil uso.

Gonzlez-Murillo. Carlos A. Ajuste de la distribucin Gumbel a fenmenos hidrolgicos. Documento presentado como requisito parcial para acceder a la categora de profesor asociado. Bogot: Septiembre 1992. p.7 CHOW, Ven Te et al. Hidrologa aplicada. Mc.Graw Hill, 1994. p. 407 HAAN. Opt.Cit.p.134-135 KITE. Opt.Cit. p.19

7 8 9

21

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Existen diferentes frmulas de probabilidad partiendo de la frmula general, las cuales tienen sus ventajas relativas unas respecto a las otras de acuerdo al tamao de la serie y a la distribucin a que se ajuste. En la tabla 3.1 se muestran algunas de ellas.
TABLA 3.1. Frmulas de posicin de graficamiento

Nombre Cunnane (1978) Weibull (1939) b California (1923)b Chegodayev ( )a Tukey ( )a Hazen (1930 )a-b Blom (1958)a Gringorten (1963)a
a b

B b=2/5 b=0 b=1 b=0.3 b=1/3 b=1/2 b=3/8 b=0.44

Frmula (m-0.4)/(N+0.2) m/(n+1) m/n (m-.03)/(n+0.4) (m-1/3)/ (n+1/3) (2m-1)/2n (m-3/8)/(n+1/4) (m-.44)/(n+0.12)

Adaptado de CHOW, Ven Te. Hidrologa aplicada. 1994 Adaptado de HAAN, Charles T. Statistical methods in hydrology. 1977

Chow 10 menciona que Cunanne (1978) estudi los diferentes mtodos disponibles para las posiciones de graficamiento utilizando criterios de varianza mnima y sesgo. Cunanne concluy que la posicin de graficamiento de Weibull es sesgada y grafica los valores mximos de una muestra con perodos de retorno muy pequeos; adems encontr que la frmula de posicin de graficamiento de Blom, para datos Normalmente distribuidos, est muy cercana a ser no sesgada; y que la frmula de Gringorten es la ms adecuada para datos que se distribuyen de acuerdo con la distribucin EV1. El mtodo de papeles de probabilidad puede desarrollarse como se describe a continuacin. Se ordenan los datos de la muestra por orden de magnitud y se calcula una probabilidad acumulada de acuerdo con la frmula de probabilidad asignada, probabilidad que corresponde a la probabilidad de no excedencia, si se ordenan lo datos de menor a mayor. Una vez los datos han sido ordenados de menor a mayor, se les asigna un nmero de orden (m), a estos y se les determina la probabilidad de no excedencia de acuerdo con la frmula seleccionada. Una vez determinada la probabilidad se calcula la variable de la distribucin que se haya elegido. Por ltimo se grafica linealmente la
10

CHOW. Opt.Cit.p.407-408

22

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

variable de la distribucin en el eje de las abscisas, contra el valor de la magnitud del evento en el eje de las ordenadas, para determinar sobre los puntos graficados la ecuacin de la recta trazada. En la estimacin grfica la lnea es colocada subjetivamente y puede variar de un anlisis a otro. Esta subjetividad es considerada como una desventaja y por ello puede dar una estimacin imprecisa 11 .

3.4.3 Distribuciones de Probabilidad


En este aparte se dar una breve descripcin de las distribuciones de probabilidad consideradas y sus caractersticas principales, la funcin de densidad de probabilidad (fdp) y la funcin de distribucin acumulada de probabilidad (fda); as como la estimacin de parmetros por los mtodos anteriormente descritos en las distribuciones que sean aplicables.

3.4.3.1 Distribucin Normal.


La distribucin de probabilidad de mayor uso e importancia es la Gaussiana o la Normal. Su importancia radica en que ha sido usada desde muy temprano en la teora de errores y porque tiene ciertos usos en propiedades matemticas. Muchas tcnicas estadsticas asumen, a priori, que los datos se distribuyen normalmente. Esta distribucin se caracteriza porque es simtrica respecto a un valor medio, es continua y de forma acampanada. La funcin de densidad de probabilidad (fdp) es: (x )2 1 exp f ( x) = 2 2 2 El rea total limitada por la curva f(x) y el eje de las abscisas tiene un valor de uno. En esta distribucin la media, la mediana y la moda coinciden. La variable estandarizada de la distribucin Normal est dada por:

Z=

la funcin queda tipificada y tiene la forma

11

NERC. Opt.Cit.p.62

23

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

f ( z) =

z 2 1 exp 2 2

En este caso se dice que Z se distribuye normalmente con media cero y varianza uno. La funcin de distribucin acumulada (fda) que da la probabilidad de no excedencia es:

F ( z) =

f ( z)dz

Una distribucin normal est definida si se conocen sus parmetros de localizacin () y escala (), corrientemente se expresa como: distribucin normal N( , ). La relacin entre x y Z es:
x=+Z

Llamando Y=Z , como la variable estandarizada o reducida se tiene la anterior relacin x=+Y

la cual es la representacin lineal de la correspondiente poblacin y usando esta relacin se determinan los cuantiles para los perodos de retorno deseados.

Estimacin de parmetros
Mtodo de los momentos: La estimacin de parmetros de la poblacin se hace utilizando los parmetros de la muestra. El mtodo de momentos para la distribucin Normal es el siguiente. La media y la varianza son:
Media = E ( x ) =

x f ( x)dx =
2

Varianza = E ( x E ( x )) =
Desviacin estndar =

( x u)

f ( x )dx = 2

Coeficiente de asimetra = Cs = 0 Los parmetros de localizacin () y escala () son la media () y la desviacin estndar () respectivamente, que son estimados por medio de x y s respectivamente.

= ; = = x =; = = s
24

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Mtodo de mxima verosimilitud:


Los valores de la media y la varianza poblacionales dada una muestra de valores observados X={x1,x2,...xn} son: n n 1 1 2 exp [( xi ) / ] V(X/,2) = f ( xi ) = 2 2 i =1 i =1 2
=

1 2
2

2 1 exp (( x i ) / ) 2

dejando

V V =0 y = 0 ; y resolviendo

1 xi n 2 1 2 = ( xi ) n

= 2
El parmetro de localizacin () es la media () y el de escala () es la desviacin estndar (), estimados por medio de x y s respectivamente. = ; = = x

=; = = s
De lo anterior, se hace notar que, particularmente para la Distribucin Normal, la estimacin de parmetros por el mtodo de momentos y de mxima verosimilitud llegan al mismo resultado.

Mtodo grfico:
La posicin de graficamiento en la estimacin grfica, expresado como probabilidad es: Fi=(i-3/8)/(n+1/4), i=1,2,...,n Esta frmula fue dada por Blom (1958), menciona NERC (1975) 12 . El valor de la variable reducida yi, correspondiente a este Fi constituyendo una buena aproximacin para obtener E(yi). Una vez construido el papel de probabilidad 13 se traza una lnea recta a travs de los puntos. El valor de la ordenada cuando Y=0 corresponde al valor estimado del
12 13

NERC, Opt.Cit. p. 71 Procedimiento descrito en el capitulo 1.2.1.3

25

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

parmetro de localizacin, y el valor de la pendiente al valor estimado del parmetro de escala.

26

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

3.4.3.2. Distribucin Pearson Tipo 3


La distribucin Pearson Tipo 3 tiene tres parmetros. El de localizacin (), el de escala () y el de forma (). Un caso especial de la distribucin Pearson Tipo 3 es la distribucin Gamma, cuando =0 ; y otro, es la distribucin Exponencial, cuando =1. La funcin de densidad de probabilidad (fdp) de la distribucin Pearson Tipo 3 tiene la siguiente forma: ( x ) 1 exp( ( x ) / ) f ( x) = ( ) donde () es la funcin gamma evaluada en (). Si se introduce la variable Y=(x-) se tiene la funcin de distribucin acumulada (fda), de la siguiente manera

G (Y ) =
0

Y 1 exp( Y / ) dY ( )

mostrando que esta variable Y tiene una distribucin Gamma con parmetros y ; lo que significa que la distribucin Pearson Tipo 3 con parmetros (, , ) puede considerarse como una distribucin Gamma con parmetros y la cual tiene el origen en x= es decir con parmetro de localizacin. La relacin entre la variable aleatoria x y la variable reducida es x=+Y, donde Y es la variable reducida de la distribucin Gamma con el parmetro de localizacin ().

Estimacin de parmetros
Mtodo de los Momentos La relacin entre los momentos y los parmetros es la siguiente: media = E(x) = = + Varianza = E(x-E(x))2 = 2 = 2 = 1/2 coeficiente de asimetra = g1 =2 -1/2 donde g1 est dado por 3/23/2, que es lo mismo 3/3 Si x , s y g1 ,son los estimadores de la muestra de , , g1 respectivamente, se tienen los estimadores de los parmetros de la poblacin
_

= 4 / g12 ; = 4 / g1

= g1 / 2 ; = g1

= g1

s s = 2

27

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

= = - 2 / g1 ; = x = x 2 s / g1
Mtodo de Mxima Verosimilitud La funcin de verosimilitud est dada por n exp( ( xi ) / ) ( xi ) 1 V(x/ , ,)= ( ) i =1 La estimacin debe satisfacer LV/ =0 ; LV/=0 y LV/=0 Al realizar las derivadas se obtiene n/(-1)(xi- )-1=0 o -+1/n (xi- )=0 -n/+1/2 (xi- )=0 -nln / (ln())+ln(xi- )=0 o reemplazando por ()= (ln())/ ln+()1/nln(xi- )=0 las cuales no son lineales para valores desconocidos de los parmetros estimados. El procedimiento sugerido por Clarke R.T.(1978), mencionado por The Natural Enviromental Research Council (NERC), es asumir un valor para y utilizarlo iterativamente tal que resuelva las anteriores ecuaciones para y , partiendo de =D/(D-1) donde D= 1/n2(xi- ) (xi- )-1 y =(xi- )/(n)=1/n (xi- )-n/((xi- )-1) Kite 14 (1977), describiendo este mtodo de estimacin de parmetros, menciona que: ...el mtodo no es siempre aplicable. Wallis & Matalas (1963), notaron que para valores muy pequeos del sesgo de la muestra, no es posible una solucin. Adems, para valores del parmetro de forma menores que uno (<1), una solucin por mxima verosimilitud no es posible. Si este parmetro es mayor que uno (>1), el coeficiente de asimetra de la muestra debe ser menor que dos (g1<2). Finalmente, si el coeficiente de asimetra de la muestra es negativo, la distribucin tendr lmite superior y no ser conveniente para anlisis de eventos mximos....En general no es posible con un procedimiento automtico, garantizar encontrar la solucin con una varianza mnima en cada anlisis. Cada arreglo de datos requiere de una cuidadosa investigacin de la forma de la funcin.

3.4.3.3. Distribucin Gamma


La distribucin Gamma tiene dos parmetros, que son el de escala (), y el de forma (). Esta distribucin es un caso especial de la distribucin Pearson Tipo 3, cuando el valor de su parmetro de localizacin, , es cero. La funcin de densidad de probabilidad (fdp) es: x 1 exp( x / ) f ( x) = ( )
14

KITE, Opt.Cit.p.107-108

28

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

donde >0 donde () es la funcin Gamma completa evaluada para el valor de y la integral es conocida como la funcin gamma incompleta. Para valores dados de y la integral debe ser evaluada por integracin numrica. La relacin entre la variable reducida o estandarizada Y y la variable aleatoria x es Y=x/ con la funcin de densidad de probabilidad (fdp) dada por Y 1 exp( Y ) g (Y ) = y ( )

G (Y ) = g (Y )dY
0

de aqu se tiene que F(x)=G(Y)=G(x/) y su inversa es x=Y. Cada valor de determina una funcin de distribucin.

Estimacin de parmetros
Mtodo de los Momentos La media y la desviacin estndar dados en trminos de y son: Media = E(x) = = Varianza = E(x-E(x))2 = 2 = 2 reordenando se tiene que = 2/ 2 = 1/CV2

= / = 2/

Los estimadores muestrales de y son x , s, los cuales son sustituidos en los momentos para obtener los estimadores de y
_ 2 _ 2 x x 1 / cv 2 = = 2 s2

= / x = s2 / x
Mtodo de Mxima Verosimilitud La funcin de verosimilitud es 1 n exp( xi / ) xi V(x/,)= ( ) i =1 La estimacin debe satisfacer LV/=0 y LV/=0 esto da:
x/ = ln+ / (ln())1/n((lnxi))=0 Siendo ()= (ln())/
_

29

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

_ x ln()()=ln Mo

= x Thom (1958), seala Haan (1977) 15 , propone una relacin aproximada para estimar dada por =(1+(1+4A/3)1/2)/4A- donde
_

A=ln x -(lnx)/n y es un trmino de correccin. La tabla da el valor de para valores de comprendidos entre 0.2 y 5.6 ya que para valores superiores a 5.6 el error es despreciable.
TABLA 1.1 Valores de y

0.2 0.034 1.0 0.009 1.8 0.004 0.3 0.029 1.1 0.008 1.9 0.003 0.4 0.025 1.2 0.007 2.2 0.003 0.5 0.021 1.3 0.006 2.3 0.002 0.6 0.017 1.4 0.006 3.1 0.002 0.7 0.014 1.5 0.005 3.2 0.001 0.8 0.012 1.6 0.005 5.5 0.001 0.9 0.011 1.7 0.004 5.6 0.000 Tomado de Statistical Methods in Hydrology de Charles T. Haan (1977) Greenwood y Duran (1960), menciona Haan (1977), presentan la siguiente relacin para estimacin por mxima verosimilitud, partiendo de los siguientes polinomios: =(0.5000876+0.1648852A-0.0544274A2)/A para 0A0.5772 y =(8.898919+9.05995A+0.9775373A2)/(A(17.79728+11.968477A+A2)) para 0.5772<A17.0 Haan (1977) 16 citando a Bowman & Shenton (1968), presenta una relacin para estimar el error causado por las aproximaciones al estimar el sesgo; la cual puede ser aproximadamente E( ) = 3 /n el cual da la relacin E() = (n-3) /n n4 Una vez conocido , se determina

= x/

15 16

HAAN. Opt.Cit.p.103 Ibidem. p. 104

30

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

3.4.3.4 Distribucin Exponencial


La funcin de densidad de probabilidad (fdp) es:

f ( x) =

( x ) exp 1

y la funcin de distribucin acumulada (fda) es:


( x ) F ( x ) = 1 exp
El parmetro de localizacin (), determina el lmite inferior para los valores de la variable; el parmetro de escala (), determina la extensin de los valores. Esta distribucin es un caso espacial de la distribucin Pearson Tipo 3, cuando el parmetro de forma, , tiene el valor de uno. Si se considera que: Y=(x- )/ se tiene que y es la variable exponencial estandarizada o reducida y se obtiene la funcin de densidad de probabilidad (fdp), dada por: y G(Y)= 1 - exp(-Y) g(Y)= (1/) exp(-Y) donde f(x)=g(Y) y F(x)=G(Y). Su inversa, la relacin entre la variable aleatoria y la variable reducida es: x= +Y Estimacin de parmetros Mtodo de los momentos La media y la desviacin estndar se relacionan con y por medio de: Media = E(x) = = + Varianza = E(x-E(x))2 = 2 = 2 Desviacin estndar = = De esta manera los parmetros y son estimados por medio de y , as:

= ; = = s = ; = = x s El coeficiente de sesgo, (g1), es igual a dos; lo que quiere decir que es una distribucin sesgada hacia la derecha para todos los valores de . 17
Mtodo de Mxima Verosimilitud La funcin de verosimilitud es: n 1 V(x1,x2,...,xn/ ,)= exp( ( xi ) / )) i =1
17

Ibidem. p.99

31

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Si es conocido y es desconocido, haciendo

LV/ =0
da como resultado n n ( xi ) =0 +

i =1

y de aqu se obtiene _ 1 = ( xi ) = x n Si los dos parmetros son desconocidos la estimacin de estos no es directa porque LV/ y LV/ al hacerlas igual a cero no son independientes en y . Ahora bien, si es conocido, el menor valor de la serie ,x(1)=min(x1,x2,...,xn),es un estadstico suficiente para ; mientras si es conocido x lo es para . Dado que x(1) tiene una distribucin exponencial, puede mostrarse que: n _ = ( x x (1) ) n 1 y
_

= x (1)

Mtodo grfico Partiendo de la forma general Fi=(i-b)/(n+1-2b) es conveniente utilizar la frmula de Gringorten en la que b=0.44 para determinar la posicin de graficamiento, menciona Cunanne(1978), citado por Chow (1994) 18 ; quedando expresada como: Fi=(i-0.44)/(n+0.12) El correspondiente valor de la variable reducida yi=-ln(1-Fi) es utilizada para trazar la posicin en papel de escala lineal. Los valores esperados son fcilmente calculados por: i 1 E ( yi ) = j =1 n +1 j la cual es una muy buena aproximacin de yi Si es conocida a priori puede trazarse una lnea a travs de los puntos pasando por el punto x= , y=0. La pendiente de esta lnea es el valor estimado de (parmetro de escala). De otro modo, si no es conocida a priori, una lnea es trazada a travs de los datos y el punto que intercepta a y=0 es el valor estimado de y la pendiente de la lnea es el valor estimado de .

3.4.3.5 Distribucin General de Valores Extremos (GVE)


Esta distribucin se destaca en la hidrologa por su amplio y extendido uso; intenta, de manera puramente terica, deducir como estn distribuidos los caudales
18

CHOW, Opt.Cit. p. 408

32

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

extremos. La familia de distribucin GVE puede ser dividida en tres clases, correspondientes al valor que toma el parmetro de forma, ; tales son Tipo 1, Tipo 2 y Tipo 3 (Fisher and Tippet, 1928), conocidas tambin como EV1, EV2 y EV3 respectivamente. En la prctica el valor de toma valores comprendidos entre -0.6 y +0.6. El rango es dividido entre las tres clases as: <0 Tipo 2 =0 Tipo 1 >0 Tipo 3 Esta distribucin tiene tres parmetros; y son los parmetros de localizacin y escala respectivamente. Si =0 se tiene la distribucin EV1 o Gumbel. Si es negativo se tiene la distribucin EV2 con lmite inferior y, si es positivo es EV3 , distribucin con frontera superior. La relacin entre el coeficiente de asimetra (sesgo) y el parmetro de forma est tambin marcado, as, a =0 corresponde el valor del coeficiente de asimetra de 1.14 (EV1) y el valor terico de la kurtosis es 5.4 . Muestras con sesgo mayor a 1.14 corresponden a una distribucin EV2, mientras que si dicho valor es inferior a 1.14 corresponden a una distribucin EV3. Cuando se dispone de datos, se pueden ajustar a la distribucin GVE por varios mtodos. El ajuste consiste en determinar el valor de y se define a que tipo pertenece. Si =0 se ajusta directamente a EV1 ya que y son ms eficientemente estimados por EV1 que por GVE.

3.4.3.6 Distribucin General de Valores Extremos Tipo 1 (EV1) o Distribucin Gumbel


La funcin de densidad de probabilidad (fdp) est dada por: 1 ( x ) ( x ) f ( x ) = exp exp La funcin de distribucin acumulada (fda) puede expresarse ( x ) F ( x ) = exp exp La variable estandarizada Y se relaciona con la variable aleatoria x de la siguiente manera Y=(x-)/ quedando definida la funcin de distribucin de probabilidad (fdp) en funcin de Y como: 1 g( y) = exp{ y exp( y)}

y la funcin de distribucin acumulada (fda) puede expresarse G ( y) = exp{ exp( y)} En donde f(x) = g(Y) y F(x) = G(Y) Los cuantiles se determinan por medio de la relacin x= + Y donde Y = -ln(-ln(F(x)))

33

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Estimacin de parmetros
Mtodo de los Momentos La media y la desviacin estndar, dados en trminos de los parmetros y , son Media = E(x) = E( + Y) = = + 0.0577 Varianza = E(x-E(x))2 = 2= 22/6 Desviacin estndar = Var(x))1/2 = /6 Los parmetros de la poblacin y son estimados por x y y la estimacin por momentos de estos es 6 = _ _ = x 0.577 = x 0.45 Mtodo de Mxima Verosimilitud La funcin de verosimilitud est dada por V(x/ ,)= f ( xi / , )
i =1 n

=
i =1

exp{( ( xi ) / ) exp( ( xi ) / )}

exp{ ( xi ) / exp( ( xi ) / )}

Requiere resolver es siguiente par de ecuaciones LV/ =(n+exp(-y))/=P/ LV/=(ny+exp(-y))/=R/ La estimacin debe satisfacer LV ( x / , ) / = 0 ; LV ( x / , ) / = 0 Estas ecuaciones no tienen una solucin explcita, pero con un mtodo iterativo como el dado por Jenkinson (1969), mostrado en Natural Enviromental Research Council (pginas 85 a 87), puede darse solucin a estas. PWM Desarrollada por Greeenwood et al (1979), citado por Gonzlez (1996) 19 La expresin general para PWM, en trminos de M1,j,0 es: (ln(1 + j ) + 0.5772) M 1, j ,0, = + 1+ j 1+ j El estimador de M1,0,k es E{x(1-F(x))k} , utilizando el estimador Pi, posicin de graficamiento, se tiene: 1 n M 1,0,k = xi (1 Pi ) k n i =1 donde
19

Gonzlez, Opt.Cit. p. 7-12

34

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

i 0.35 n Los parmetros se calculan de la siguiente manera: = M 1,0,0 + 0.5772 Pi =

= ( M 1,0,0 2 M 1,0,1 ) / ln 2
Mtodo grfico Para la estimacin grfica de los parmetros y la posicin de graficamiento, Gringorten (1963) da la siguiente expresin para la probabilidades Fi=(i-0.44)/(n+0.12) Los valores de la variable reducida yi correspondientes a Fi estn dados por yi=-ln(-ln Fi) Si se utiliza papel de probabilidad Gumbel los valores de la muestra ordenada son trazados por Fi , de otra manera si se usa papel de escala lineal se trazan dichos valores por yi .

3.4.3.6 Distribucin General de Valores Extremos Tipo 2 (EV2)


Tambin conocida con el nombre de distribucin Log-Gumbel; cuya funcin de distribucin acumulada (fda) est dada por 1/ (x ) F ( x ) = exp 1 donde

<0,

>0, +

Esta distribucin tiene tres parmetros, , parmetro de localizacin; , de escala y , el de forma, que debe ser negativo. Los valores de la variable aleatoria tienen una frontera inferior la cual es menor que . La funcin de densidad de probabilidad (fdp) es 1/ 1 1/ x (x ) 1 f ( x) = 1 exp 1 La variable reducida Y , dada por x Y = 1 ,0 Y su funcin de distribucin acumulada (fda) es G(Y)=exp(-Y)1/ y Y 1/ 1 g (Y ) = exp( Y 1/ )

La inversa de la variable estandarizada es x = + / - /Y = + / (1 - Y) relacin con las que se estiman los cuantiles, donde 35

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Y = [ ln( F ( x ))] La inversa de la variable estandarizada es de la forma x=A+BY donde A = +/; y B=-/>0 . Los cuantiles se determinan por medio de la relacin

x=

ln( F ( x )) 1

Estimacin de parmetros
Mtodo de los Momentos La inversa de la variable estandarizada es x= +//Y es de la forma x=A+By donde A = +/ ; y B=-/>0 . Los momentos son funcin de los cuales pueden ser tabulados, o partiendo de: g1=3/23/2, coeficiente de sesgo o de asimetra donde 2=(1+2)-2(1+) 3=(1+3)-3(1+2) (1+)+23(1+) valor que se utiliza en los siguientes polinomios

=0.0330113-0.106601 g1+0.0145418 g12-0.000940242 g13+0.0000231652 g14


31 . g1 118 .

12 . g1 < 31 .

=0.28732449-0.35732233 g1+0.11195823 g12-0.0187768 g13+0.001322037 g14 =0.27759-0.32188 g1+0.06203 g12-0.01383 g13+0.007012 g14
0.21665 < g1 1.08

=0.27752-0.320791 g1+0.068949 g12-0.0315096 g13+0.00359341 g14


318508 . < g1 0.21665

8.2 g1 318508 . (Tomado de Consolidated Frecuency Analysis Package, 1985) Una vez estimado a partir de los polinomios se estima y as: = 1/ 2 /2 = x + (1 (1 + )) / 1 2

=0.2179163-0.470657 g1-0.041434557 g12-0.001662769 g13

Mtodo de Mxima Verosimilitud La funcin de verosimilitud es V(x/,,)= f ( xi / , , )


i =1 n

=
i =1

(1 k ( xi ) / ) 1/ 1 exp (1 ( xi ) / ) 1/

36

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Jenkinson (1969), sugiere el siguiente procedimiento utilizando la siguiente forma F(x)=exp(-exp(-y)) donde x= +(1-exp(-y))/ el cual se desarrolla en NERC (1975, paginas 92 y 93)
LV ( x / , , ) / = 0 ; LV ( x / , , ) / = 0 ( 2) Estas ecuaciones se resuelven con un proceso iterativo ya que no tienen una solucin explcita, y su demostracin matemtica se muestra en NERC (1975, paginas 94 y 95)

La estimacin debe satisfacer LV ( x / , , ) / = 0 ;

PWM Desarrollada por Hosking et al (1985). El momento M1,j,0 se define como: M 1, j ,0 = ( j + 1) 1 + {1 ( j + 1) ( + 1)} /

Para la estimacin de parmetros basta solo determinar Mi,0,0 , M1,1,0 y M1,2,0 .El estimador de M1,0,0 es E{xF(x)}, calculado utilizando la posicin de graficamiento, que es un buen estimador del momento. j 1 n = pi xi M 1, j ,0 n i =1 Los parmetros se calculan de la siguiente manera: = 7.859c + 2.9554c 2 c= 2 M 1,1,0 3 M 1,2 ,0
1,0 ,0

M M

Log 2.0 Log 3.0

2 M M 1,1, 0 1, 0 , 0 = (1 2 ) (1 + )

1,0,0

1, 0 , 0

+ [ (1 + ) 1] /

Mtodo grfico En la distribucin de valores extremos la relacin variable aleatoria - variable reducida es curva, y est dada por x= +/(1-exp(-Y)) donde Y=(xi- )/ y es cncava hacia arriba; si la curvatura es moderada puede utilizarse Fi=(i-0.44)/(n+0.12) , correspondiente a EV1. Pero si la curva es muy pronunciada se introduce un sesgo en el extremo superior el cual produce una sobreestimacin. Otro mtodo que evita esta desventaja, cuando la curva es muy pronunciada, es reescribir la relacin variable aleatoria - variable reducida como x= +W 37

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

donde W=(1-exp(-Y))/ el cual depende del parmetro de forma . Se pueden trazar los valores de Fi convertidos a Wi si el valor de es conocido a priori, convirtiendo primero los valores a Yi=-ln(-lnFi)

3.4.3.7 Distribucin General de Valores Extremos Tipo 3 (EV3)


La funcin de distribucin est dada por 1/ (x ) F ( x ) = exp 1 donde

>0,

>0, x +

que es de la misma forma de la funcin de distribucin de EV2 pero con el valor de positivo. A diferencia de EV2 tiene lmite superior de +/ el cual es mayor que donde y son positivos. La funcin de densidad de probabilidad es 1/ 1 1/ x (x ) 1 f ( x) = 1 exp 1 La variable reducida Y es x Y = 1 , Y 0 La inversa de la variable estandarizada es x = + / + /Y = + / (1 + Y) y la funcin de distribucin acumulada (fda) es G(Y)=exp-(-Y)1/ y Y 1/ 1 g (Y ) = exp ( Y 1/ ) que es de la misma forma de EV2 x=A+BY donde A = +/ > ; y B=/>0 .

Estimacin de parmetros
Por la similitud con EV2 la estimacin solo tiene diferencias que pesan por el valor de , que es positivo en este tipo. Mtodo de los Momentos La inversa de la variable estandarizada esta dada por x = + / + /Y donde Y, la variable reducida , toma valores menores o igual a cero. La variable estandarizada es de la forma x=A+BY donde A =+/ es el parmetro de localizacin , frontera superior de x ; y B=/, es el parmetro de escala. Los momentos dependen de los cuales pueden ser tabulados, o partiendo de: coeficiente de sesgo g1 = - 3 / 23/2, valor que se utiliza en los polinomios 38

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

=0.0330113-0.106601 g1+0.0145418 g12-0.000940242 g13+0.0000231652 g14


31 . g1 118 .

1.2 g1 < 31 .

=0.28732449-0.35732233 g1+0.11195823 g12-0.0187768 g13+0.001322037 g14 =0.27759-0.32188 g1+0.06203 g12-0.01383 g13+0.007012 g14
0.21665 < g1 1.08

=0.27752-0.320791 g1+0.068949 g12-0.0315096 g13+0.00359341 g14


318508 . < g1 0.21665

8.2 g1 318508 . Ntese que =0 en el rango de g1 desde 1.08 a 1.20 (Tomado de Consolidated Frecuency Analysis Package, pginas 128 y 129) Una vez estimado a partir de los polinomios se estima y as: = 1/ 2

=0.2179163-0.470657 g1-0.041434557 g12-0.001662769 g13

/2 = x (1 (1 + )) / 1 2 como es estimado por y s2, se tiene s2 = 1/ 2


/2 = x (1 (1 + )) s 2 / 1 2

Mtodo de Mxima Verosimilitud El procedimiento para estimar los parmetros por este mtodo es el mismo que se utiliza para EV2. PWM Los parmetros se estiman de la misma manera como se estiman para EV2. Mtodo grfico En la distribucin de valores extremos la relacin variable aleatoria - variable reducida es curva, y est dada por x= +/(1-exp(-Y)) donde Y=(xi- )/ y es convexa hacia arriba; si la curvatura es moderada puede utilizarse, igualmente que en EV2 Fi=(i-0.44)/(n+0.12) , correspondiente a EV1. Otro mtodo que evita esta desventaja, cuando al curva es muy pronunciada, es reescribir la relacin variable aleatoria - variable reducida como x= +W 39

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

donde W=(1-exp(-Y))/ el cual depende del parmetro de forma . Se pueden trazar los valores de Fi convertidos a Wi si el valor de es conocido a priori, convirtiendo primero los valores a Yi=-ln(-lnFi)

3.4.3.8. Distribucin Weibull de tres parmetros


La distribucin general de valores extremos para valores mnimos es conocida como Distribucin Weibull y ha encontrado gran uso en hidrologa. Esta distribucin puede ser ajustada a muestras tales que su coeficiente de sesgo sea tan pequeo como -1.08. Esta distribucin tiene un lmite inferior y permanece sin frontera superior. La funcin de densidad de probabilidad (fdp) est definida por f ( x ) = ( x ) 1 ( ) exp( ( x ) / ( )) y la funcin de distribucin puede ser escrita de la siguiente manera F ( x ) = 1 exp( ( x ) / ( )) utilizando la transformada Y=((x- )/()) puede reescribirse la funcin de distribucin como: F(x)=1-e-y

Estimacin de parmetros
Mtodo de los Momentos Los momentos de la distribucin, la media, la varianza y el coeficiente de sesgo, pueden expresarse en trminos de los parmetros de la siguiente manera E(x)=+()(1+1/) Var(x)=()2{(1+2/)-2(1+1/)} g1=((1+3/)-3(1+2/)(1+1/)+23(1+1/))/((1+2/)-2(1+1/))3/2 si los momentos son reemplazados por sus mejores estimados de la muestra, y se reagrupa, se obtiene:

= x - (1+1/)/ ((1+2/)- 2(1+1/))1/2


Cuando el coeficiente de sesgo ha sido estimado puede calcularse por algn mtodo numrico, como alternativa se presentan los siguientes polinomios que dan una muy buena estimacin para 1/. 1/ =0.27730+0.3252g1+0.07632g12 +0.00388g13 (-1.08<g1<0.158308) 1/ =0.27586+0.33071g1 +0.05004g12 -0.01737g13 (0.158308<g<1.910765) 1/ =1.27421ln(0.58452g1+1.02291) (1.910765<g1<5) Otro procedimiento ms sencillo de utilizar, menciona Haan, propuesto por Gumbell (1958), es a travs de manipulaciones algebraicas; reescribiendo los momentos se tiene: 40

= x +(1- (1+1/))/ ((1+2/)- 2(1+1/))1/2

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

= +A() =- B()
donde: A()= (1-(1+1/)) B() B()= ((1+2/)- 2(1+1/))-1/2 PWM Greenwood et al (1979), expresaron PWM para la distribucin como: (1 + 1 / k ) M 1,0,k = 1 + m + (1 + m) 1+1/ k Los parmetros se estiman de la siguiente manera: 2 4 M 1,0,3 M 1,0,0 M 1,0,1 =
4 M 1,0,3 +

1, 0 , 0

4 M 1,0,1

ln{ M 1,0,0 2 M 1,0,1 } / ( M 1,0,1 2 M 1,0,3 )} / ln 2.0 ln 2.0 = ln ( M 1,0,0 2 M 1,0,1 ) / (2 M 1,0,1 4 M 1,0,3 )

1, 0 , 0

3.4.3.9. Distribucin Weibull de dos parmetros


Cuando en la distribucin Weibull el parmetro de localizacin, , tiene valor cero, se dice que se tiene la distribucin Weibull de dos parmetros. Esta distribucin puede ser ajustada a muestras tales que su coeficiente de sesgo sea tan pequeo como -1.08. Esta distribicin tiene un lmite inferior y permanece sin frontera superior. La funcin de densidad de probabilidad (fdp) est definida por f ( x ) = x 1 exp( x / ) y la funcin de distribucin puede ser escrita de la siguiente manera F ( x ) = 1 exp( x / ) utilizando la transformada Y = (x/) puede reescribirse la funcin de distribucin como: F(x)=1-e-y

41

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

Estimacin de parmetros
Mtodo de los Momentos

Los momentos de la distribucin, la media, la variaza y el coeficiente de sesgo, pueden expresarse en trminos de los parmetros de la siguiente manera E(x) = (1+1/) Var(x) = 2{(1+2/)-2(1+1/)} g1 = ((1+3/)-3(1+2/)(1+1/)+23(1+1/))/((1+2/)-2(1+1/))3/2 si los momentos son reemplazados por sus mejores estimados de la muestra, y se reagrupa, se obtiene:

= x +(1- (1+1/))/ ((1+2/)- 2(1+1/))1/2

Cuando el coeficiente de sesgo ha sido estimado puede calcularse por algn mtodo numrico, como alternativa se presentan los siguientes polinomios que dan una muy buena estimacin para 1/.
1/ =0.27730+0.3252g1+0.07632g12+0.00388g13 (-1.08<g1<0.158308) 1/ =0.27586+0.33071 g1+0.05004 g12-0.01737 g13 (0.158308< g1<1.910765) 1/ =1.27421ln(0.58452 g1+1.02291) (1.910765< g1<5) Otro procedimiento ms sencillo de utilizar, menciona Haan, propuesto por Gumbell (1958), es a travs de manipulaciones algebraicas; reescribiendo se tiene: =+A() donde A()= (1-(1+1/)) B() Mtodo de Mxima Verosimilitud

definiendo = - y resolviendo la ecuacin n = n xi


i =1

donde n n = n / ( i =1 xi ln xi ln xi )
i =1

resolviendo simultneamente para y para . Se obtiene

1/

PWM

Greenwood et al (1979), expresaron PWM para la distribucin como: 42

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

u (1 + 1 / k ) + 1 + m (1 + m)1+1/ k Los parmetros se estiman de la siguiente manera:

1,0 ,k

M ln( M /M
1, 0 , 0

1, 0 , 0

1, 0 ,1

) / ln 2.0

ln 2.0 ln M 1,0,0 /

1, 0 ,1

3.4.3.10 Distribucin Logaritmico-Normal de dos parmetros


Dada una variable aleatoria x, si la funcin z=lnx, tiene una distribucin Normal se dice que los valores de x presentan una distribucin Logaritmico-Normal. La funcin de densidad de probabilidad (fdp) de z es

( z ) 2 1 f ( z) = exp 2 2 2 de aqu la funcin de densidad de probabilidad (fdp) de x es (ln x ) 2 f ( x) = exp 2 2 x 2 Esta es una distribucin acampanada y de sesgo positivo, que tiene dos parmetros, los cuales son la media, parmetro de escala y la desviacin estndar, parmetro de forma. El coeficiente de variacin (CV), que es funcin solamente de 2 , es CV = (exp(2 )-1)1/2 2 = ln(1+Cv2) el coeficiente de asimetra es: g1=3/22/3 = (exp(2 )-1)1/2(exp(2 )+2) Para valores de 2 comprendidos entre 0.1 y 0.6 se tiene una relacin casi lineal, as: g1=0.52+4.85 2 es decir, para valores de g1 entre 1.005 y 3.43 En la prctica, menciona Kite 20 (1977),cuando los registros aparecen con un valor de cero, y cuando se toman los logaritmos se convierte el valor en - , y no pueden ser procesados. Varias soluciones se han propuesto a este problema, entre los cuales se citan: 1. sumar uno a todos los datos 1
2. sumar un valor positivo pequeo (como 0.1, 0.01, 0.001, etc.) a todos los datos 3. sustituir los registros de valor cero por el valor de uno 4. sustituir un valor positivo pequeo (como 0.1, 0.01, 0.001, etc.) a todos los datos 5. ignorar los registros con valor cero
20

Hann, Opt.Cit. p. 56

43

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

todas estas soluciones afectan los parmetros de la distribucin (1 y 2 afectan la media, 3,4,y 5 afectan tanto la media como la varianza)

Estimacin de parmetros
Mtodo de los Momentos

La relacin entre los dos primeros momentos y los parmetros y es: Media = E(x) = =exp(z+ 2/2) Varianza = E(x-E(x))2 = =exp(2 + 2)(exp(2)-1) donde el coeficiente de variacin CV es: CV=(exp2-1)1/2 despejando y 2 se tiene 2 = ln(CV2+1) ; = ln( CV 2 + 1) = ln 2 / 2; = ln x 2 / 2 Mtodo de Mxima Verosimilitud Para el caso de la distribucin de dos parmetros se tiene que la verosimilitud es n 1 1 exp ((ln xi ) / ) 2 V(X/ ,2)= 2 xi 2 i =1
=

1 2 s

2 1 exp ( xi x ) / s 2

La solucin de mxima verosimilitud para z y z2 debe satisfacer V V = 0 ; resolviendo esto da: =0 y

1 ln xi n 2 1 2 = (ln xi ) n Esto da un estimador sesgado de 2 . De aqu, 2 1 2 = ln xi n+1 el cual es no sesgado como estimador de 2 , por el mtodo de mxima verosimilitud.

Mtodo Grfico Partiendo de que z=lnx la estimacin grfica se realiza de la misma manera como se hace para la distribucin normal. El procedimiento ms simple es localizar los puntos xi contra yi en papel semi-logartmico, xi en escala logartmica y yi en escala lineal. Se traza una recta a travs de los datos graficados y el valor de z cuando y=0 es el estimado de y la pendiente el de .

44

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

3.4.3.11 Distribucin Logaritmico-Normal de tres parmetros


A diferencia de la distribucin Logaritmico-Normal de dos parmetros, esta distribucin si tiene un lmite inferior, se tendra una distribucin de tres parmetros cuyo tercer parmetro, x0, es el de localizacin. Se tiene Z=ln(x-x0) y la funcin de densidad de probabilidad (fdp) de x es:

(ln( x x 0 ) ) 2 1 exp 2 2 ( x x 0 ) 2 Z se relaciona con la variable estandarizada o Normal-reducida, Y, de la siguiente manera: Z = + y f ( x) =

Estimacin de parmetros
Mtodo de los Momentos La relacin entre los tres primeros momentos y los parmetros , y g1 es: Media = E(x) = = x0+ exp( + 2/2) Varianza= E(x-E(x))2 = 2 =exp(2 + 2)(exp2-1) g1=(ex 2 1/2 2 p -1) (exp +2) para valores de 2 comprendidos entre 0.1 y 0.6 la relacin es casi lineal, es decir cuando 1.005< g1<3.43, de dada por g1 = 0.52 + 4.85 2 la cual es muy aproximada, y este valor puede utilizarse para comenzar iterativamente la estimacin de 2 As, con los mejores estimadores de , 2, y g1, se estiman los parmetros: 1/ 2 g 0.52 = 1 4.85

ln(exp( 2 ) 1) = ln( s) 2 2
Sangal & Biswas (1970), menciona NERC, proponen unos estimadores que no dependen del coeficiente de sesgo de la muestra g1.Suponiendo que tiene un valor pequeo x0 = Me - 2 /(2(Me)) donde Me, 2 y son la mediana, la varianza y la media de la distribucin de x; y utilizando los valores estimados de la muestra se tiene -x0= exp( + 2/2) / ( -x0) = (exp2-1)1/2 2 = ln(1+(/ -x0)2 ) estimado por:

45

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

s = ln 1 + x x0

de la definicin de la media, , se tiene: = ln(-x0)- 2/2 estimado por: = ln( x x 0 ) 2 / 2 Por otra parte, conociendo que la media y la varianza son el primer y segundo momento respectivamente y, si Z1 y Z2 representan los coeficientes de variacin de las distribuciones x y (xx0) , entonces: Z1= / Z2 =/( x0) x0= (1- Z1/Z2 )= / Z2 El valor de Z1 puede ser calculado directamente de los valores observados. El segundo y tercer momento de la distribucin (x-x0) no incluyen trminos en x0 , el valor de Z2 puede obtenerse de la relacin g1=3Z2+Z22 donde g1 es el coeficiente de asimetra o sesgo de la distribucin x. La solucin de esta ecuacin es: Z2 =(1-w2/3)/w1/3 donde w=(-g1+(g12+4)1/2)/2 El procedimiento consiste en determinar la media (), desviacin estndar () y coeficiente de variacin (g1) de la muestra, x; calcular Z1 y Z2 , calcular x0 , y luego =ln(Z2 2+1))1/2 = ln(/ Z2)-(ln(Z2 2+1))/2 Mtodo de Mxima Verosimilitud Para el caso de la distribucin de dos parmetros se tiene que la verosimilitud es

[ln( xi x0 ) ] n i =1 LV= ln( xi x 0 ) ln(2 ) n ln 2 2 2 i =1 Derivando respecto a , 2 y x0, e igualando a cero se tiene
n

= ln( x i x 0 ) / n
i =0

2 = [ln( x i x 0 ) ] / n
2
i =0

( xi x 0 ) 1 ( 2 ) = [(1 / ( xi x 0 )) ln( xi x 0 ) ]
i =0 i =0

por sustitucin de , y pueden resolverse numricamente.


2

46

CAPITULO 3 DISTRIBUCIONES DISCRETAS Y CONTINUAS_________________________________CARLOS A. GONZLEZ-MURILLO

47

Você também pode gostar