Você está na página 1de 41

Estatstica Aplicada Hidrologia 1

CURSO DE PEQUENAS BARRAGENS DE TERRA


MAPUTO, 19-27 DE MAIO DE 2008

CHEIA DE PROJECTO MTODOS ESTATSTICOS


Texto de apoio

Prof. lvaro Carmo Vaz

NOTA IMPORTANTE:

O texto que se segue uma verso preliminar de um captulo do livro


Hidrologia e Recursos Hdricos da autoria do Prof. Joo Hiplito
(IST) e do Prof. lvaro Carmo Vaz (UEM), a ser editado pela IST
Press.

Curso organizado por:


LEM Laboratrio de Engenharia de Moambique
LNEC Laboratrio Nacional de Engenharia Civil (Portugal)
UEM-FE Faculdade de Engenharia da Universidade Eduardo Mondlane

Leccionado por:
Doutor Eng. Joo Marcelino Investigador e Chefe do Ncleo de
Barragens e Obras de Terra do Departamento de Geotecnia do LNEC
Prof. lvaro Carmo Vaz Professor Catedrtico da Faculdade de
Engenharia da Universidade Eduardo Mondlane
Estatstica Aplicada Hidrologia 2

REVISO DE CONCEITOS DE PROBABILIDADES E


ESTATSTICA
A.1 OBJECTIVOS
A Estatstica uma das ferramentas mais importantes disposio do Hidrologista na anlise
e resoluo de problemas que se lhe colocam na prtica da Engenharia. Constituem
objectivos deste Anexo fazer uma reviso sumria de conceitos bsicos de Probabilidades e
Estatstica e desenvolver a sua aplicao a problemas especficos de Hidrologia,
particularmente no que se refere utilizao de distribuies de extremos e a regresso e
correlao lineares.

A.2 DEFINIES
Uma varivel aleatria um varivel que toma valores no resultantes de processos e leis
fsicas ou relaes matemticas bem determinadas, sendo por isso atribudos sorte (acaso). Por
exemplo: o nmero de pontos no lanamento dum dado.

Uma varivel aleatria pode ser discreta ou contnua. discreta se s pode tomar valores
descontnuos, por exemplo, o nmero de dias de chuva num ano. A varivel aleatria diz-se
contnua quando, num determinado intervalo de valores, limitado ou no, puder tomar qualquer
valor desse intervalo, por exemplo, a precipitao anual.

A populao o conjunto de todos os valores que podem ser assumidos por uma varivel
aleatria. Designa-se por amostra a parte observada da populao.

Um acontecimento Ai qualquer subconjunto da populao.

A frequncia (ou frequncia relativa) dum acontecimento Ai definida por

n
f =
N

em que n o nmero de vezes em que o acontecimento Ai ocorre e N o tamanho da amostra. Por


exemplo, se num registo de 10 anos de precipitao o acontecimento definido por Pano > 1200
mm ocorre 2 vezes na amostra, ento f = 2/10 = 0.2 .

A probabilidade P dum acontecimento Ai

P( Ai ) = lim f
N

A moderna teoria das probabilidades baseia-se numa axiomtica apresentada por A. Kolmogorov
Estatstica Aplicada Hidrologia 3

em 1933:

P(Ai) 0;
P() = 1;
P(A B) = P(A) + P(B) - P(A B);
P(A B) = P(A | B) x P(B) = P(B|A) x P(A);

Deste ltimo axioma se deduz que os acontecimentos A e B so independentes se


P(A B) = P(A) x P(B)

Tambm se pode deduzir:


- a probabilidade do acontecimento impossvel, P() = 0;
- a probabilidade do complemento dum acontecimento, P(Ac) = 1 P(A);
- a probabilidade de qualquer sub-acontecimento B tal que B A , P(B) P(A).

A.3 FUNES DE DISTRIBUIO, DURAO E


DENSIDADE DE PROBABILIDADE
Considere-se uma amostra de N valores duma varivel aleatria e classifique-se essa amostra por
ordem crescente:
x1 x2 ... xN

A probabilidade de que a varivel aleatria assuma um valor no superior a xi


P ( xi) = i/N = F(xi)

F(xi) a funo de distribuio emprica (FDE).

Se se classificar a amostra por ordem decrescente:

x1 x2 ... xN

A probabilidade de que a varivel aleatria assuma um valor no inferior a xi

P ( xi) = i/N = G(xi)

G (xi) a funo de durao.

Note-se que P( xi) + P ( xi) = P ( xi) + P( >xi) + P( =xi) = 1 + P ( = xi) = F(xi) + G(xi)

Para variveis aleatrias contnuas, P ( =xi) = 0 F(x) + G(x) = 1. No entanto, isto j no se


verifica para variveis aleatrias discretas, F(x) + G(x) = 1 + P( =xi) > 1, uma vez que P( =xi)
no ser nula.

Para uma varivel aleatria contnua, define-se a funo densidade de probabilidade f(x):
Estatstica Aplicada Hidrologia 4

dF(x)
f(x) =
dx
dx dx
f ( x ) = Pr ob( x x+ )
2 2

Figura 1 Funes de distribuio, durao e densidade de probabilidade

A figura 1 ilustra as relaes entre F(x), G(x) e f(x) para uma varivel aleatria contnua.

Para as variveis aleatrias discretas, a funo densidade de probabilidade substituda pela


funo de massa de probabilidade, definida simplesmente como a probabilidade P( = x) para
todos os valores possveis de x.

Pode verificar-se teoricamente que o estimador i/N para a probabilidade do acontecimento (


xi) um estimador com vis, i.e., quando a dimenso da amostra cresce indefinidamente o valor
do estimador no tende para o valor correcto da probabilidade. Assim, prefervel utilizar para
as funes de distribuio e de durao.

F (xi) = Prob (x xi) = i/N+1


G (xi) = Prob (x xi) = i/N+1

fazendo-se assim a correco do viez.

A.4 PERODO DE RETORNO E RISCO HIDROLGICO


Considere-se uma srie de 50 valores, por exemplo de precipitao anual, ordenados por ordem
crescente. O valor de ordem i = 41 igualado ou excedido 10 vezes na srie correspondendo-lhe
uma probabilidade de no excedncia F = 0.804. O intervalo mdio entre ocorrncias
sucessivas do acontecimento ( x41) seria ento de cerca de 5 anos. Este intervalo mdio entre
ocorrncias sucessivas dum acontecimento designado por perodo de retorno T.

O perodo de retorno do acontecimento ( xi) relaciona-se com a probabilidade de excedncia,


G(xi), ou de no excedncia, F(xi), pelas expresses:
Estatstica Aplicada Hidrologia 5

T(xi) = 1 / G(xi) = 1 / {1-F(xi)}

Assim, no exemplo anteriormente referido, ter-se-ia

F(x41) = P( x41) = 0.804


G(x41) = P( x41) = 0.196
T(x41) = 1 / 0.196 5 anos

Importa deixar bem claro que o conceito de perodo de retorno no est associado a qualquer
ideia de repetio cclica e regular do acontecimento. Se, por exemplo, um acontecimento tem
um perodo de retorno de 10 anos, isso no quer dizer que tal acontecimento ocorre regularmente
de 10 em 10 anos: ele pode ocorrer em dois anos consecutivos assim como pode no ocorrer
durante trinta anos. Se, porm, dispusermos duma srie suficientemente longa, ento o intervalo
mdio entre ocorrncias consecutivas do acontecimento seria de 10 anos.

Considere-se agora o acontecimento ( x) com uma probabilidade de ocorrncia G(x)


relativamente baixa. A probabilidade de no ocorrncia do acontecimento em 2 anos sucessivos
ser [F(x)]2 e a de no ocorrncia em N anos sucessivos ser [F(x)]N.

Ento, a probabilidade de que o acontecimento ocorra pelo menos uma vez em N anos
sucessivos ser dada por 1-[F(x)]N. Essa probabilidade designa-se por risco hidrolgico R(x, N),
conceito com bastante interesse prtico como se pode ver pelos exemplos seguintes.

A.5 PARMETROS ESTATSTICOS DA POPULAO E DA


AMOSTRA
5.1 INTRODUO

Na Estatstica, a populao ou a amostra com que se est a lidar so representadas por um


nmero relativamente pequeno de parmetros estatsticos. Trata-se de uma forma sinttica de
apresentar as principais caractersticas da populao ou da amostra, em relao s quais interessa
definir:

- a tendncia central;
- a dispenso;
- a assimetria;
- os quantis.

5.2 MOMENTOS DA POPULAO E DA AMOSTRA

Define-se momento de ordem r em relao origem para a populao como


+
r' = x r f ( x )dx

Estatstica Aplicada Hidrologia 6

e para a amostra

N
1
m r' =
N
x i =1
r
i

A mdia da populao, , ou da amostra, x , so os momentos de ordem 1 em relao origem:

= 1'
x = m1'

Define-se momento centrado de ordem r como o momento de ordem r tomando a mdia como
origem:
+
r = (x - )r f(x) dx para a populao
N

( x - x )
i=1
i
r

mr = para a amostra
N

5.3 TENDNCIA CENTRAL

Os parmetros que caracterizam a tendncia central indicam volta de que valor se distribuem os
valores da populao ou da amostra.

Os parmetros mais utilizados so a mdia ou x e a mediana , xm .

A mdia da populao e da amostra so dadas respectivamente por


+
= x f(x) dx

N
1
x=
N
xi =1
i

A mediana o valor que divide a populao ou a amostra em duas partes de igual probabilidade
acumulada. Para uma populao, a mediana tal que:

+

f(x) dx =

f(x) dx = 0.5

Para uma amostra a mediana, xm definida tal que (amostra ordenada)

- se N mpar, m = int(N/2) + 1

Por exemplo, se N=25 m=13


Estatstica Aplicada Hidrologia 7

- se N par:
xN + xN
+1
2 2
xm =
2

Por exemplo, se N=24, xm = (x12 + x13)/2

5.4 DISPERSO

Os parmetros que caracterizam a disperso indicam se os elementos da populao ou da


amostra esto muito ou pouco concentrados em torno da mdia. Os parmetros mais utilizados
para a populao e para a amostra respectivamente so:

- Varincia 2, s2
- Desvio padro , s
- Coeficiente de variao v, cv

A varincia o momento centrado da 2 ordem:


+
2 = (x - ) f(x)dx
2

N N

2
( x - x )i
2

N ( x - x )
i
2

s = i=1
* = i=1
N N -1 N -1

A varincia da amostra inclui o factor de correco do vis (N/N-1).

O desvio padro a raiz quadrada da varincia. Note-se que o desvio padro expresso nas
mesmas unidades que a mdia e que os elementos da amostra ou da populao.

O coeficiente de variao a relao entre o desvio padro e a mdia:

s
v = cv =
x

O coeficiente de variao apresenta a vantagem de ser um parmetro adimensional.

A figura 2 apresenta duas sries com as mesmas mdias mas com diferentes desvios padro.
Estatstica Aplicada Hidrologia 8

Figura 2 Distribuies do mesmo tipo, com s mesmas mdia e varincias diferentes

5.5 ASSIMETRIA

As populaes e as amostras (e as distribuies que as caracterizam) podem ser simtricas


(assimetria nula) ou assimtricas (assimetria positiva ou negativa). A figura 3 apresenta
distribuies com assimetria nula, negativa e positiva.

Figura 3 Distribuies com diferentes assimetrias

Quando a assimetria nula, a mdia e a mediana coincidem; quando a assimetria positiva, a


mdia superior mediana e, quando negativa, a mdia inferior mediana. Isto acontece
porque a mdia muito mais influenciada pelos valores extremos que a mediana.

O parmetro que caracteriza a assimetria o coeficiente de assimetria, ou g, que o momento


centrado de 3 ordem transformado em parmetro adimensional pela diviso por 3 ou s3.
+

=

(x - )3 f(x) dx
3
N N

( xi - x )3 N
2 ( x - x )
i
3

N
g= i=1
3
* = i=1
3
*
Ns (N - 1)(N - 2) s (N - 1)(N - 2)
Estatstica Aplicada Hidrologia 9

Tal como anteriormente, tambm na expresso de g se introduziu um factor de correco do vis


dado por N2/[(N-1)(N-2)] .

5.6 QUANTIS

O quantil da ordem p o valor p ou xp (para a populao ou para a amostra) definido por:

p = f(x) dx = p
-

Numa amostra ordenada o quantil xp o valor de ordem j = N * p.

0p1

A mediana o quantil de ordem 0.5.

A.6 AJUSTAMENTO DUMA AMOSTRA A UMA


DISTRIBUIO TERICA
6.1 METODOLOGIA
Nos estudos de Hidrologia Aplicada, a amostra habitualmente uma srie cronolgica de valores
extremos de precipitaes ou de caudais. A partir duma dada amostra possvel definir a sua
funo de distribuio emprica FDE. A FDE , no entanto, afectada pela dimenso limitada da
amostra e, por outro lado, no permite extrapolar para perodos de retorno superiores durao
da amostra, quando muitas das aplicaes da Hidrologia em Engenharia lidam precisamente com
valores extremos com perodos de retorno muito altos.

Por essa razo, faz-se o ajustamento da amostra a uma funo de distribuio terica (ou lei de
probabilidades ou simplesmente distribuio), procurando-se de entre as vrias que tm sido
propostas na bibliografia especializada aquela que melhor se adapte FDE.

A sequncia de clculo que se adopta para a extrapolao de valores correspondentes a perodos


de retorno elevados, necessrios para o dimensionamento de obras hidrulicas, ento a
seguinte:

- seleco de uma de entre as distribuies tericas;


- especificao ou ajustamento da distribuio;
- avaliao do ajustamento;
- utilizao da distribuio para a previso de valores (extrapolao).
Estatstica Aplicada Hidrologia 10

6.2 TESTES DE ALEATORIEDADE


Nesta metodologia, pressupe-se que a amostra aleatria, isto , que os elementos da srie so
independentes e tm a mesma distribuio de probabilidades, razo pela qual a amostra deve
ser submetida a testes de aleatoriedade.

Com efeito, geralmente os factores naturais que determinam a ocorrncia de valores extremos
podem ser considerados independentes, nos diferentes anos hidrolgicos. No entanto, esta
situao pode ser alterada quer devido a modificaes nas condies fsicas das bacias
hidrogrficas (por exemplo, pelo desenvolvimento de actividades humanas como a
urbanizao, agricultura intensiva, desflorestao, etc.) quer devido a modificaes
relacionadas com o sistema de medio dos caudais (como a mudana do equipamento ou do
local da medio) ou outras.

A aleatoriedade das sries de registos no pode ser provada mas a hiptese de aleatoriedade
pode ser rejeitada se a srie mostrar desvios sistemticos tais como:

persistncia no tempo: os elementos da srie no so independentes;


os elementos da srie no tem todos a mesma distribuio;
efeito de tendncia: os valores da srie parecem ir aumentando (ou diminuindo) com
o tempo.

Para analisar a aleatoriedade duma srie utilizam-se diversos testes estatsticos dos quais se
iro referir apenas os seguintes:

teste do coeficiente de autocorrelao;


teste de Wald-Wolfowitz;
teste da ordenao.

6.2.1 Teste do coeficiente de autocorrelao

O teste do coeficiente de autocorrelao procura identificar a existncia de persistncia no


tempo, i.e., se o valor xi+1 da srie X independente do valor de xi. A persistncia pode ser
detectada atravs do coeficiente de autocorrelao de ordem 1, r1, dado pela seguinte
expresso:

( x - x )( x
i=1
i i+1 - x)
N
r1 = N
*
N -1
( x - x )
2
i
i=1

Passando de r1 para a varivel transformada Z:


Estatstica Aplicada Hidrologia 11

1 (1 + r1 )
Z = ln
2 (1 - r1 )

A distribuio da varivel Z aproximadamente Normal com mdia nula e varincia 1/N. Se


Z tiver um valor elevado, tal significa que existe uma autocorrelao linear significativa
na srie X. A hiptese de independncia no tempo pode ser rejeitada para um nvel de
confiana de 95% se Z> 1,96 / N.

6.2.2 Teste de Wald-Wolfowitz

O teste de Wald-Wolfowitz verifica se os elementos da srie X tm todos a mesma


distribuio, constituindo um teste geral de homogeneidade da srie.

Considere-se a srie Y obtida por ordenao da srie X e considere-se a srie X dividida em


duas sub-sries X1 e X2, em que X1 contem a primeira metade da srie X, e X2 a segunda
metade. Considere-se agora a srie Z definida da seguinte maneira (i = 1, 2, ....., N):

zi = 1 se yi um elemento de X1
zi = 2 se yi um elemento de X2

A estatstica do teste R = nmero de vezes em que zi+1 zi. Se a srie X for homognea, os
sucessivos elementos de Y estaro bem repartidos pelas sub-sries X1 e X2 e o valor de R
ser mdio.

Se a srie X no for homognea, os elementos sucessivos de Y aparecero concentrados


numa das sub-sries X1 ou X2 (dando um valor de R baixo) ou com uma disperso excessiva
pelas duas sub-sries (dando um valor de R alto). O quadro que se apresenta corresponde a
um nvel de confiana de 95% e d os valores limite de R em funo do nmero de valores N
da srie X.
N 15 17 19 21 23 25 27 29 31 33 35
Rinf. 6 6 7 8 9 10 11 11 12 13 13
Rsup. 12 13 14 15 16 17 18 20 21 22 24

Sempre que o valor de R no esteja entre os limites definidos neste quadro pode rejeitar-se a
hiptese de homogeneidade da srie X com um nvel de confiana de 95%.

6.2.3 Teste de ordenao

O teste da ordenao procura detectar a presena dum efeito de tendncia na srie X.

Considere-se a srie ordenada Y e defina-se o ndice de posicionamento Ki da varivel xi na


srie Y como sendo o nmero de elementos de X no superiores a xi. Se se verificar a
presena duma correlao significativa entre o ndice de posicionamento Ki e o ndice
cronolgico i, isso indica a existncia dum efeito de tendncia na srie X.
Estatstica Aplicada Hidrologia 12

A estatstica de teste o coeficiente de correlao de Spearman:

N
6 ( K i i )2
i=1
RT = 1 -
(N 3 N)

Um valor alto de RT indica a existncia dum efeito de tendncia. Para o teste, utiliza-se uma
transformao de RT:

1
N 2 2
Z = RT
2
1 RT

Z segue uma distribuio de Student com N-2 graus de liberdade. O quadro seguinte d
valores limite superiores para Z para diversos valores de N, considerando um nvel de
confiana de 95%.

N-2 10 15 20 25 30
Zsup. 2.228 2.131 2.086 2.060 2.042

Quando a hiptese de aleatoriedade for rejeitada em mais do que um dos testes, pode-se
considerar que a srie no aleatria ao nvel de confiana de 95% e no deve ser utilizada
para se fazer extrapolaes para perodos de retorno elevados a partir do ajustamento a uma
distribuio de extremos.

No entanto, pode ser possvel atravs duma anlise mais profunda da srie determinar as
causas da no aleatoriedade e, a partir da, transformar por meio duma modificao adequada
a srie dada numa outra, aleatria. Poder ento utilizar-se a srie transformada para se fazer
o ajustamento a uma distribuio de extremos.

6.3 ESPECIFICAO OU AJUSTAMENTO DA DISTRIBUIO

6.3.1 Mtodos para a especificao ou ajustamento da distribuio

A especificao ou ajustamento da distribuio consiste na estimao dos respectivos


parmetros a partir da informao contida na amostra. Existem diversos mtodos para fazer o
ajustamento sendo os mais utilizados o mtodo dos momentos, o mtodo da mxima
verosimilhana e o mtodo dos mnimos quadrados.

6.3.2 Mtodo dos momentos

O ajustamento pelo mtodo dos momentos o mais simples de se fazer e consiste em


seleccionar os valores dos m parmetros da distribuio por forma a que os primeiros m
momentos da distribuio (ou suas transformaes) sejam iguais aos correspondentes
Estatstica Aplicada Hidrologia 13

momentos ou transformaes da amostra. No caso de distribuies com 2 parmetros, a


mdia e o desvio padro da distribuio e da amostra devem ser iguais. No caso de
distribuies com 3 parmetros, os parmetros so calculados de forma a que tambm o
coeficiente de assimetria da distribuio tenha o mesmo valor que o da amostra.

6.3.3 Mtodo da mxima verosimilhana

O mtodo da mxima verosimilhana consiste em estimar os parmetros da distribuio


por forma a maximizar a funo de verosimilhana L(x), definida por:

N
L( | x) = f( xi | )
i=1

em que f(x) a funo densidade da probabilidade de x com parmetros . Com efeito, a


probabilidade de se obter um valor no intervalo [xi-dx/2; xi+dx/2] proporcional a f (xi) e
a probabilidade conjunta de se obterem n valores xi, x2,... xn proporcional ao produto:

f( x | )
i=1
i

que a funo de verosimilhana. A estimao dos parmetros faz-se tomando derivadas


parciais da funo de verosimilhana ou da sua transformao logartmica em relao a cada
um dos parmetros e igualando a zero o que d um nmero de equaes igual ao nmero de
parmetros.

6.3.4 Mtodo dos mnimos quadrados

O mtodo dos mnimos quadrados consiste em estimar os parmetros da distribuio por


forma a minimizar a soma S dos quadrados dos desvios entre as probabilidades empricas, Yi,
e as probabilidades tericas indicadas pelo modelo F(xi):

N
S = [ Y i - F( xi | ) ] 2
i=1

A estimao dos parmetros faz-se tomando derivadas parciais de S em relao a cada um


dos parmetros e igualando a zero.

Embora geralmente a estimao pelo mtodo da mxima verosimilhana seja a mais


eficiente, a derivao dos estimadores morosa e frequentemente torna-se necessrio recorrer
a processos iterativos para a sua determinao.

O mtodo dos momentos conduz a bons resultados quando a amostra tem uma grande
dimenso mas em pequenas amostras os erros de amostragem originam estimadores de fraca
qualidade, particularmente para distribuies de mais de 2 parmetros.
Estatstica Aplicada Hidrologia 14

Feitas estas reservas, ir-se- utilizar no que se segue o mtodo dos momentos para a
estimao dos parmetros. Apresentam-se, no entanto, para algumas distribuies expresses
para a estimao dos parmetros pelo mtodo da mxima verosimilhana, adaptadas de KITE
1978 onde se apresentam as respectivas derivaes.

6.4 FUNES DE DISTRIBUIO UTILIZADAS


Os modelos tericos de distribuies de extremos a que se procura ajustar as amostras devem,
por um lado, ser compatveis com as condies fsicas que determinam os valores extremos
(precipitaes intensas, cheias) e, por outro lado, reproduzir as caractersticas genricas das
funes de distribuio empricas dessas amostras. As caractersticas mais importantes a
considerar so, do ponto de vista fsico, a continuidade e o limite inferior no negativo; do
ponto de vista das funes de distribuio empricas das sries, a assimetria positiva e a
unicidade da moda.

De entre o grande nmero de modelos de distribuies de probabilidades tericas, alguns so


habitualmente mais utilizados para ajustamento s sries hidrolgicas, satisfazendo na
generalidade as caractersticas referidas no pargrafo anterior:

a) distribuies derivadas a partir da distribuio Normal;


b) distribuies derivadas da distribuio generalizada de extremos ou de Fisher-Tippet;
c) distribuies baseadas na funo Gama.

A distribuio Normal ou Lei de Gauss a distribuio mais conhecida e estudada em


Estatstica. Apresenta, no entanto, dificuldades para a utilizao em estudos hidrolgicos
devido a no ser limitada inferiormente e, mais importante do ponto de vista prtico, ter
assimetria nula. Para resolver estas dificuldades, utilizam-se distribuies derivadas a partir
da distribuio Normal:

- distribuio Log-Normal de 2 parmetros (Lei de Galton), que corresponde a ajustar


uma distribuio Normal aos logaritmos dos valores da srie;
- distribuio Log-Normal de 3 parmetros, semelhante anterior mas introduzindo um
terceiro parmetro correspondente ao limite inferior da srie.

A distribuio de Gumbel um caso particular da distribuio de Fisher-Tippett


generalizada (trata-se da distribuio generalizada de extremos de Fisher-Tippett tipo I). A
distribuio de Gumbel, de 2 parmetros, muito utilizada, at devido sua relativa
simplicidade matemtica. Outras distribuies derivadas da distribuio generalizada de
extremos so a distribuio de Weibull (distribuio generalizada de extremos de tipo III),
de 2 parmetros, e a distribuio de Goodrich, obtida a partir da anterior por introduo
dum terceiro parmetro, definindo o limite inferior do domnio.

As distribuies baseadas na funo Gama so assimtricas e mostram grande flexibilidade


no ajustamento s sries de valores mximos. As mais utilizadas so:
Estatstica Aplicada Hidrologia 15

- distribuio Gama de 2 parmetros;


- distribuio de Pearson tipo III, obtida da anterior por introduo dum terceiro
parmetro, de localizao;
- distribuio Log-Pearson tipo III corresponde a ajustar a distribuio de Pearson tipo
III aos logaritmos dos valores da srie.

Embora tenham sido apresentados muitos argumentos tericos em favor de cada uma destas
distribuies, todos se baseiam em premissas que so violadas nas aplicaes. Assim, tem-se
adoptado uma atitude mais pragmtica de aceitar todas estas distribuies como modelos
possveis, fazer a especificao do modelo e posteriormente a sua avaliao.

A distribuio Normal a mais estudada em Estatstica, pelo que iremos comear por ela para
uma boa compreenso da metodologia.

6.4.1 Distribuio Normal (Lei de Gauss)

A distribuio Normal a lei de probabilidades que melhor tem sido estudada do ponto de vista
terico. Tem um enorme campo de aplicao no apenas em Hidrologia mas em muitas outras
reas de Engenharia, Cincias Naturais e Cincias Sociais.

A funo densidade de probabilidade expressa por:

1 -(x -b )2
f(x) = e 2a2
a 2

A funo de distribuio tem a seguinte expresso:

x 1 -(x -b )2
F(x) = e 2 a 2 dx

a 2

A distribuio simtrica, no sendo integrvel analiticamente. F(x) obtida por integrao


numrica e dada em tabelas. Existem tambm expresses analticas obtidas a partir de
aproximaes funo por desenvolvimento em srie. A distribuio tem 2 parmetros: a, b.

Os parmetros da distribuio so obtidos em funo dos respectivos momentos centrados,


obtendo-se as mesmas expresses pelo mtodo dos momentos e pelo mtodo da mxima
verosimilhana:

- b=
- a=
O coeficiente de assimetria da distribuio nulo e, por isso, a distribuio Normal no se
ajusta bem s sries hidrolgicas que tm normalmente assimetria no desprezvel.

frequente escrever a expresso de f(x) substituindo a e b por e :


Estatstica Aplicada Hidrologia 16

1 -(x - )2
f(x) = e 2 2
2

Demonstra-se que a distribuio Normal goza da propriedade de invarincia linear: Se x uma


varivel aleatria com distribuio Normal, com mdia x e desvio padro x, y = c1x + c2
tambm uma varivel aleatria normal, com mdia y = c1x + c2 e desvio padro y= c1x.

As tabelas da distribuio Normal so construdas para uma varivel z, varivel normal


reduzida, definida por

z = (x x)/x

Com esta definio e atendendo propriedade da invarincia linear da distribuio Normal,


imediato que z = 0 e z = 1. Diz-se ento que z uma varivel N(0,1). A tabela 1, reproduzida
de LENCASTRE e FRANCO (1984), d os valores de F(z) para z de 0.00 a 3.49 em intervalos
de 0.01.

Atendendo simetria da distribuio, a tabela permite obter valores de F(z) para 3.49 z 0
uma vez que F(-z) = 1 F(z). A tabela permite igualmente determinar valores de z(F). Para
valores de F inferiores a 0.5, a simetria da distribuio permite escrever que z(F) = - z (1-F).
Da tabela tira-se que as probabilidades de x estar entre + e -; +2 e -2; +3 e -3 so
respectivamente de 68.3%, 95.4% e 99.7%. As probabilidades de 90%, 95% e 99%
correspondem aos intervalos 1.645, 1.96, 2.575.

Esta tabela pode ser utilizada para qualquer distribuio Normal, bastando para isso fazer a
transformao z = (x-x)/x.

A utilizao duma extensa tabela no prtica para integrao em programas de computador.


Para tal, podem utilizar-se expresses resultantes de desenvolvimento em srie como, por
exemplo, as seguintes expresses apresentadas em Abramovitz e Stegun 1972:

1
F ( z) = 1 (1 + d1 z + d 2 z 2 + ... + d 6 z 6 ) 16 + ( z )
2

com d1 = 0.049867347
d2 = 0.0211410061
d3 = 0.0032776263
d4 = 0.0000380036
d5 = 0.0000488906
d6 = 0.000053830
e (z) < 1.5 x 10 -7
Estatstica Aplicada Hidrologia 17

c0 + c1t + c2 t 2
z( F ) = t + (F )
1 + d 1t + d 2 t 2 + d 3 t 3

com c0 = 2.515517
c1 = 0.802853
c2 = 0.010328
d1 = 1.432788
d2 = 0.189269
d3 = 0.001308
e (z) < 4.5 x 10 -4

Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09


0 0.5 0.504 0.508 0.512 0.516 0.5199 0.5239 0.5279 0.5319 0.5359

0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.591 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.648 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.67 0.6736 0.6772 0.6808 0.6844 0.6879

0.5 0.6915 0.695 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.719 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.758 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.791 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.834 0.8365 0.8389

1 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.877 0.879 0.881 0.883
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.898 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319

1.5 0.9332 0.9345 0.9357 0.937 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.975 0.9756 0.9761 0.9767

2 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.983 0.9834 0.9838 0.9642 0.9846 0.985 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.989
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.992 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936

2.5 0.9938 0.994 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.996 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.997 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.998 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986

3 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.999 0.999
3.1 0.999 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

Tabela 1 Funo de distribuio Normal (=0; = 1)


Estatstica Aplicada Hidrologia 18

6.4.2 Distribuio Log-Normal de 2 parmetros (LN2)

Diz-se que uma varivel se ajusta a uma distribuio Log-Normal de 2 parmetros ou Lei de
Galton quando possvel ajustar uma distribuio Normal transformao logartmica dessa
varivel.

Se x se ajusta a uma distribuio LN2 isso significa que y = ln(x) se ajusta a uma distribuio
Normal. O domnio da varivel x ser 0 < x < +, ie, x sempre positivo. Por outro lado, a
distribuio LN2 tem assimetria positiva. As funes de distribuio emprica de sries de
precipitaes ou de caudais apresentam estas duas caractersticas (valores no negativos e
assimetria positiva). A funo de distribuio LN2 :

x 2
1 1 ln (x)- y
F(x) = - (
e2 y
)
dx - 0 < x < +
0 x y 2

Os parmetros y e y, calculados pelo mtodo dos momentos so:


2
y
y = ln( x ) -
2
2
1
y = [ ln(1 + x2 ) ] 2
x

O mtodo da mxima verosimilhana conduz simplesmente a que y e y sejam a mdia e o


desvio padro da srie y = ln(x).

Obtidos os parmetros estatsticos da amostra, x e x, obtm-se os parmetros da


transformada logartmica y, y e y, com os quais se trabalha facilmente no espao Normal
utilizando a varivel normal reduzida z.

Tendo apenas 2 parmetros, a distribuio LN2 permite o ajustamento a uma varivel com
dadas mdia e varincia e com assimetria positiva mas no permite garantir que a assimetria
da distribuio iguale a assimetria da varivel. O coeficiente de assimetria da distribuio
LN2 obtido em funo do coeficiente de variao de x, cv:

= Cv3 + 3 Cv

Um problema que por vezes surge na utilizao da distribuio LN2 (e, em geral, com
distribuies que utilizam transformaes logartmicas) a existncia de zeros na srie de
registos. KITE 1978 sugere duas alternativas:
Adicionar 1.0 a todos os valores da srie tem o inconveniente de aumentar a mdia
Considerar a distribuio de probabilidades como a soma duma massa de
probabilidades para o valor zero e uma distribuio contnua de probabilidades para o
restante domnio da varivel.
Estatstica Aplicada Hidrologia 19

6.4.3 Distribuio Log-Normal de 3 parmetros (LN3)

Diz-se que uma varivel se ajusta a uma distribuio Log-Normal de 3 parmetros quando
possvel ajustar uma distribuio Normal varivel transformada y:

y = ln (x x0)

A distribuio LN3 permite normalmente uma maior flexibilidade no ajustamento graas


introduo do parmetro adicional x0. O dominio da varivel x ser x0 < x < +. O
ajustamento distribuio LN3 apenas possvel quando x tem assimetria positiva. Caso se
disponha de uma amostra com assimetria negativa, deve ajustar-se a funo aos simtricos da
amostra e considerar o complemento da probabilidade:
y = x
F( x ) = 1 F ( y )
x = F 1 (F( y )) = F 1 (1 F( x ))

A funo de distribuio LN3 :


x
1 1 ln (x - x 0 )- y 2
F(x) = e 2 y ) dx x0 < x < +
- (

x0
(x - x0 ) y 2

sendo os trs parmetros x0, y e y calculados pelo mtodo dos momentos atravs de:

1
- + ( 2x + 4 )2
G= x
2
2
1 - G3
C= 1
G3
1
y = [ ln(1 + C 2 ) ] 2
2
= ln( x ) - y
y
C 2
x
x0 = x -
C

Os trs parmetros permitem garantir a igualdade da mdia, varincia e coeficiente de


assimetria da amostra e da distribuio.

Utilizando o mtodo da mxima verosimilhana, os valores de y e y so calculados como a


mdia e o desvio padro da srie y = ln (x x0). O valor de x0, porm, calculado por um
processo de aproximao numrica de resoluo da equao
n 2 n
ln ( xi x0 )
=
y y

i =1 x i x 0 i =1 xi x 0
Estatstica Aplicada Hidrologia 20

Arbitrando um valor inicial de x0 (que permite obter valores iniciais de y e y), pode-se
utilizar uma rotina como a Solver do Excel para chegar ao valor correcto de x0.

Obtidos os parmetros da distribuio LN3, x0, y, y, trabalha-se facilmente no espao


Normal utilizando a varivel normal reduzida z. Com efeito, neste caso

y - y ln(x - x0 ) - y
z= =
y y

Se, por exemplo, se pretender obter o valor de x correspondente a determinado perodo de


retorno T, basta calcular:

F = 1 1/T
z = z(F)
y = z y + y
x = ey + x0

Se, ao invs, se quiser determinar o perodo de retorno T que corresponde a certo valor x,
basta seguir o caminho inverso:

y = ln(x-x0)
z = (y-y)/y
F = F(z)
T = 1/(1-F)

Obviamente, os mesmos procedimentos aplicam-se distribuio LN2.

6.4.4 Distribuio de Gumbel

A distribuio de Gumbel ou distribuio generalizada de extremos tipo I tem a seguinte


expresso:
a ( x x0 )
F(x) = e-e -< x<

sendo, portanto, uma distribuio com apenas 2 parmetros, a e x0. Os parmetros a e x0


podem ser estimados pelo mtodo dos momentos pelas seguinte expresses:

a = /(6*x) = 1.2825/x

x0 = x 0,57721/a = x 0.4501x

O ajustamente iguala a mdia e a varincia da distribuio s da amostra mas no permite


impr um dado valor do coeficiente de assimetria. Este constante para o caso da
distribuio de Gumbel:
Estatstica Aplicada Hidrologia 21

= 1.1396

Assim, se o valor do coeficiente de assimetria da amostra for muito diferente de 1.14, a


amostra ter um fraco ajustamento distribuio de Gumbel.

O clculo dos parmetros a e x0 pelo mtodo da mxima verosimilhana obriga a um


processo iterativo para o cculo do parmetro a.
n
1 n a xi
i =1
x i e a xi e = 0
a i =1

Feita a determinao de a, o parmetro x0 obtido atravs de:




1 n
x0 = ln n
a
e i
a x

i =1

O calculo da probabilidade de no excedncia, F(x), para um dado valor x da varivel, faz-se


substituindo o valor de x na expresso da funo de distribuio. Para se determinar o valor
da varivel correspondente a um determinado perodo de retorno T = 1/(1-F), basta inverter a
expresso da funo de distribuio de Gumbel:

ln [- ln(F)]
x= + x0
a

6.4.5 Distribuio de Weibull

A distribuio de Weibull ou distribuio generalizada de extremos tipo III tem a seguinte


expresso:
b
x

F(x) = 1 e a
0< x<

sendo, portanto, uma distribuio com 2 parmetros, a e b. Os parmetros podem ser


estimados pelo mtodo dos momentos pelas seguinte expresses:
1
x = a 1 +
b
2
x 2 = a 2 1 + x 2
b

(r) a funo Gama definida por:



(r) = t r -1 e t dt
0
Estatstica Aplicada Hidrologia 22

a qual dada em tabelas ou pode ser obtida por um mtodo de aproximao numrica. Para a
resoluo em computador, sugere-se a utilizao de rotinas como a Solver do software Excel.

Sendo uma distribuio com apenas dois parmetros, no possvel ajustar a assimetria da
amostra e da distribuio. O coeficiente de assimetria da distribuio dado pela seguinte
expresso:
3
1 + a 3 3 2 3
b
3

Uma vez calculados os parmetros a e b, o calculo da probabilidade de no excedncia, F(x),


para um dado valor x da varivel, faz-se substituindo o valor de x na expresso da funo de
distribuio. Para se determinar o valor correspondente a um determinado perodo de retorno
T = 1/(1-F), basta inverter a expresso da funo de distribuio de Weibull:

1
X = a[ ln(1 F )]b

6.4.6 Distribuio de Goodrich

A distribuio de Goodrich derivada da distribuio de Weibull pela introduo dum


terceiro parmetro, x0, que corresponde ao limite inferior do domnio. Assim, a sua funo de
distribuio a seguinte:
1
a ( x x0 ) b
F(x) = 1 e x0 < x <

A determinao dos parmetros a, b e x0 feita igualando a mdia, desvio padro e


coeficiente de assimetria da amostra e da distribuio.

(3b + 1) 3(2b + 1) (b + 1) + 2 3 (b + 1)
x =
[(2b + 1) (b + 1)]2
3
2

3
(2b + 1) 2 (b + 1) 2
a=
x2
1
x0 = x b (b + 1)
a

A primeira das equaes permite determinar o parmetro b por um processo iterativo de


aproximaes numricas, utilizando por exemplo a rotina Solver do Excel em associao com
a funo Gama. A obteno dos outros dois parmetros, a e x0, faz-se de forma directa.

Depois de calculados os trs parmetros, o calculo da probabilidade de no excedncia, F(x),


Estatstica Aplicada Hidrologia 23

para um dado valor de x, faz-se substituindo esse valor na expresso da funo de


distribuio. Para se resolver o problema inverso de determinar o valor da varivel
correspondente a um determinado perodo de retorno, necessrio inverter a expresso da
funo de distribuio de Weibull:

1
x= [ ln(1 F )]b + x0
a

6.4.7 Distribuio Gama de 2 parmetros (G2)

A distribuio Gama de 2 parmetros tem a seguinte expresso:

x
-1 -
x x e
F(x) = dx 0<x<
0
| | ( )
-1

sendo e os seus parmetros.

Os parmetros da distribuio G2 so estimados pelo mtodo dos momentos igualando a


mdia e a varincia da distribuio s da amostra, chegando-se s seguintes expresses:
2
=x
x
2
x x
= =
x
2

Os parmetros e podem ser determinados pelo mtodo da mxima verosimilhana,


embora com algumas limitaes que adiante se referem. Considerando a mdia geomtrica da
srie:
1
n n
B = xi
i =1

e C = ln x ln B

GREENWOOD e DURAND 1960, citados em KITE 1978, apresentam uma aproximao


polinomial para o clculo de a partir de C:

= (0.5000876 + 0.1648852 C 0.054427 C2) / C para C < 0.5772

8.898919 + 9.05995 C + 0.9775373 C 2


e = para 0.5772 < C < 17.0
C (17.79728 + 11.968477 C + C 2 )
x
=

Estatstica Aplicada Hidrologia 24

O coeficiente de assimetria da distribuio no pode ser ajustado ao da amostra, tomando um


valor sempre positivo.
2
=

No existem solues pelo mtodo da mxima verosimilhana para valores muito pequenos
do coeficiente de assimetria da amostra nem para valores superiores a 2.

Numa resoluo manual, a complexidade da expresso matemtica da funo de distribuio


G2 leva a utilizar-se uma transformao que permite passar duma varivel gama para uma
varivel Normal, trabalhando depois no espao Normal. Essa transformao a
transformao de Wilson-Hilferty:

1 1 3
x = (1 - +z )
9 9

em que x a varivel Gama e z a varivel Normal reduzida de igual probabilidade. Note-se


que a transformao de Wilson-Hilferty s se mantem vlida para 3, podendo usar-se a
transformao de Kirby para valores de superiores a 3 (VAZ 1983).

Desta forma, para se calcular o valor x correspondente a um determinado perodo de retorno


T e correspondente probabilidade de no excedncia F(x), basta determinar:

- z = z(F) da distribuio Normal;


- x = x)z) atravs da transformao de Wilson-Hilferty.

O problema de determinar a probabilidade ou o perodo de retorno correspondente a um dado


valor x exige a inverso da transformao de Wilson-Hilferty:

x 1 1
( )3 - 1 +
9
z=
1
9

donde se obtm imediatamente F = F(z).

A utilizao do Excel e das suas funes GAMMADISTR e GAMMAINV permite resolver


directamente os problemas de determinar F ou x, a partir do conhecimento dos parmetros da
distribuio.

6.4.8 Distribuio de Pearson tipo III (P3)

A distribuio de Pearson tipo III pode obter-se a partir da distribuio G2, atravs da
introduo dum parmetro adicional de localizao, x0:
Estatstica Aplicada Hidrologia 25

x - x0
(x - ) -1 e-
x
F(x) = -1x0 dx x0 < x <
0
| | ( )

Os trs parmetros da distribuio so , e x0. A sua estimao pelo mtodo dos momentos
faz-se igualando a mdia, a varincia e o coeficiente de assimetria da distribuio aos
correspondentes valores da amostra, atravs das seguintes expresses:


=x x
2
4
= 2
x
2 x
x0 = x -
x

O clculo dos parmetros pelo mtodo da mxima verosimilhana obriga a um processo


iterativo:
n
n 1
( 1) =0
i =1 x i x 0
1
n n
B = ( xi x0 )
i =1
C = ln x ln B

As expresses para o clculo de e so as j apresentadas para a distribuio G2.

A distribuio de Pearson tipo III apenas se pode utilizar se a amostra tiver assimetria
positiva. Caso se disponha de uma amostra com assimetria negativa, deve ajustar-se a funo
aos simtricos da amostra e considerar o complemento da probabilidade:
y = x
F ( x) = 1 F ( y )
x = F 1 ( F ( y )) = F 1 (1 F ( x))

Tambm para a distribuio P3 se torna mais simples trabalhar no espao normal atravs da
transformao de Wilson-Hilferty (ou, no caso de > 3, atravs da transformao de Kirby).
A transformao de Wilson-Hilferty neste caso:

3
1 1
x = 1 - +z + x0

9 9

em que x a varivel P3 com parmetros , e x0, e z a varivel normal reduzida de igual


Estatstica Aplicada Hidrologia 26

probabilidade.

Assim, calculados os parmetros, a determinao do valor x que corresponde a um certo


perodo de retorno T e probabilidade de no excedncia F(x) torna-se bastante simples:

- obtm-se z = z(F) da distribuio Normal;


- obtm-se x = x(z) atravs da transformao de Wilson-Hilferty.

Para o problema oposto, a inverso da transformao conduz a

x - x0 1 1
( )3 - 1 +
9
z=
1
9

e imediato obter F = F(z) da distribuio Normal.

Novamente se refere o interesse de utilizar as funes do Excel da distribuio Gama, que


permitem calcular directamente valores de x(F) ou F(x) depois de se ter feito o clculo dos
parmetros.

6.4.9 Distribuio Log-Pearson tipo III (LP3)

Uma varivel x ajusta-se a uma distribuio Log-Pearson tipo III se a sua transformada
logartmica se ajusta a uma distribuio de Pearson tipo III. Assim, basta fazer:

y = ln(x)

e proceder ao ajustamento da srie y distribuio de Pearson tipo III.

6.5 AVALIAO DOS MODELOS

6.5.1 Metodologia de avaliao dos modelos


Depois de se ter seleccionado um modelo de distribuio de extremos para o ajustamento a
uma dada srie histrica e feito a especificao do modelo atravs da estimao dos seus
parmetros, necessrio avaliar o modelo, i.e., verificar se ele se ajusta bem srie dada. Os
testes de ajustamento mais utilizados so:

- grficos, com base em papel de probabilidade;


- mtodos analticos, entre os quais os testes do qui-quadrado (2) e de Kolmogorov-
Smirnov.

Os testes apoiam a tomada da deciso sobre se a hiptese de que determinada funo de


distribuio se ajusta amostra deve ser aceite ou rejeitada. Nessa deciso pode cometer-se
um de dois tipos de erros:
Estatstica Aplicada Hidrologia 27

- rejeitar a hiptese de ajustamento quando ela correcta e deveria ter sido aceite; erro do
tipo I;
- aceitar a hiptese quando ela errada e deveria ter sido rejeitada; erro do tipo II.

Em geral, no possvel minimizar simultaneamente os dois tipos de erros. No estudo do


ajustamento de distribuies de extremos, pretende-se minimizar a probabilidade de
ocorrncia do erro do tipo I. Para tal, exige-se que a rejeio da hiptese de ajustamento se
faa com um nvel de confiana n = 1- elevado, normalmente n = 0,95. o nvel de
significncia.

6.5.2 Ajustamento grfico e papel de probabilidade

possvel para funes montonas duma varivel, como o caso das funes de distribuio
de probabilidades, adoptar um sistema de eixos coordenados tal que a funo aparea nessa
sistema de eixos como uma recta.

Veja-se, por exemplo, o caso da funo y = x2 que uma parbola do 2 grau. Se no entanto,
a funo for implantada num sistema de eixos log-log ela aparece como uma recta. A funo
tambm aparece como uma recta se o eixo dos xx for linear e, no eixo dos yy, valores de y
forem marcados a distncia y.

Torna-se assim possvel desenhar os chamados papis de probabilidade: papeis onde esto
implantadas quadrculas correspondentes a sistema de eixos tais que a representao neles de
determinadas funes de distribuio aparece como uma recta. So especificamente
utilizados papis de probabilidade para as seguintes distribuies:

- Normal;
- Log-Normal;
- Gumbel;
- Log-Gumbel.

Se uma varivel aleatria x segue a distribuio Normal, ento a implantao dos pontos com
coordenadas (Pi, xi) aparecer no papel de probabilidade Normal com um alinhamento
rectilneo. Pi a probabilidade de no excedncia do valor xi da amostra, em que os xi so
ordenados por ordem crescente. O clculo do valor de Pi, probabilidade emprica, pode ser
feito por vrias frmulas (plotting position):

- Califrnia i/N;
- Hazen (2i-1)/2N;
- Weibull i/(N+1);
- Chegadayev (i-0.3)/(N+0.4);
- Blom (i-0.375)/(N+0.25);
- Tukey (3i-1)/(3N+1).

em que N a dimenso da amostra. A frmula mais eficiente e a mais utilizada a de Weibull.


Estatstica Aplicada Hidrologia 28

Caso a implantao dos pontos origine uma configurao rectilnea, pode-se fazer o traado
duma recta que minimize as distncias (ou os seus quadrados) aos pontos e utilizar essa recta
para obter o valor que corresponde a um certo perodo de retorno e vice-versa. Se a
configurao dos pontos no rectilnea isso constitui um indicativo que a distribuio
Normal no um modelo que se ajusta bem srie em estudo.

O papel de probabilidade Log-Normal apenas difere do papel de probabilidade Normal por o


eixo das ordenadas ser logartmico e no linear. Se a implantao dos pontos neste papel
resultar aproximadamente num alinhamento rectilneo, provvel que a amostra se ajuste
bem a uma distribuio LN2. Tal como no caso anterior, pode-se traar a recta que passa
pelos pontos e utiliz-la para calcular o caudal para um certo perodo de retorno ou para
resolver o problema inverso.

O papel de probabilidade Log-Normal pode ainda ser utilizado para testar o ajustamento a
uma distribuio LN3. Surge, no entanto, neste caso uma dificuldade: no eixo das ordenadas
devem ser marcados os valores de (x-x0) o que obriga ao clculo analtico de x0 ou a
traarem-se grficos com diversos valores de x0 a ver se algum dos grficos se configura
como uma recta.

O papel de probabilidade Gumbel usa um eixo (das ordenadas) linear para os valores da
varivel e o outro eixo (das abcissas) com escala duplamente logartmica para as
probabilidades. Se o eixo das ordenadas for logartmico em vez de linear, o papel permitir
testar o ajustamento a uma distribuio Log-Gumbel, distribuio em que a amostra
logartmizada que se ajusta a uma distribuio Gumbel.

A grande variedade de formas possveis com as distribuies baseadas na funo Gama no


permite que haja um papel de probabilidade para estas distribuies embora seja possvel
construir um papel de probabilidade especfico para uma amostra com um dado valor do
coeficiente de assimetria.

Uma outra via grfica para testar a qualidade do ajustamento representar em papel
logartmico os pontos que tm por abcissa o valor da varivel xi e por ordenada o valor dado
pela distribuio terica para a respectiva probabilidade emprica, F-1(i / (N+1)), caso se use a
frmula de Weibull. Se o ajustamento for bom, os pontos devem alinhar-se segundo uma
recta a 45 .

O ajustamento grfico apresenta em relao aos testes analticos a grande desvantagem de


introduzir uma certa dose de subjectividade e ser por isso menos rigoroso.

6.5.3 Teste do qui-quadrado (2)

O teste do qui-quadrado consiste em dividir o domnio da funo de distribuio em M


intervalos e comparar o nmero de elementos da amostra contidos em cada intervalo, Oj, com
a esperana matemtica indicada pelo modelo do nmero de elementos correspondentes a
cada intervalo, Ej. Assim, define-se a estatstica 2:
Estatstica Aplicada Hidrologia 29

M
( O j - E j )2
2=
j=1 Ej

Os intervalos no tm de ser iguais embora haja vantagem em que o sejam. Quando os


intervalos so iguais, Ej constante para qualquer j, Ej = N/M.

M
M
2= N +
N
O
j=1
2
j

Os valores de Oj so obtidos calculando os valores limites de x que correspondem aos limites


dos intervalos em termos de probabilidades, i/M, e contabilizando os elementos da amostra
contidos em cada intervalo.

A estatstica 2 tem aproximadamente uma distribuio 2 com um nmero de graus de


liberdade v = M np - 1 em np o nmero de parmetros da distribuio estimados a partir
da amostra. O teste do qui-quadrado diz que se deve rejeitar a hiptese do ajustamento com
um nvel de confiana n = 1- se 2 > 1-2 em que 1-2 o quantil 1- da distritbuio 2
com v graus de liberdade.

O nmero de intervalos M aconselhvel funo da dimenso da amostra N. Apresentam-se


duas propostas frequentemente adoptadas para os valores de M:

N 15-20 21-25 26-30 31-40


M 5 6 7 8

N 15-25 26-30 31-35 36-40


M 5 6 7 8

O quadro seguinte apresenta valores da distribuio 2 para 1- = 0.95 em funo do nmero


de graus de liberdade:

v 1 2 3 4 5 6
0,952 3.841 5.991 7.815 9.488 11.070 12.592

6.5.4 Teste de Kolmogorov-Smirnov

O teste de Kolmogorov-Smirnov consiste em determinar a estatstica D que a maior


distncia entre a funo de distribuio terica e a funo de distribuio emprica.

Considere-se a srie X ordenada por ordem crescente (x1 < x2 < ... < xN) e que a
probabilidade emprica de no excedncia do valor xi dada pela plotting position de
Weibull:
Estatstica Aplicada Hidrologia 30

Pi = i / N+1

A funo de distribuio emprica uma funo em escada e por isso a distncia entre ela e
a funo de distribuio terica deve ser medida esquerda e direita de cada ponto. A
expresso para o clculo de D :

i -1 i
Di = max [| - F( xi ) | ;| - F( xi ) |]
N +1 N +1

em que F(xi) o valor da funo de distribuio terica. O teste de Kolmogorov-Smirnof


baseia-se na estatstica D:

D = max [Di] i = 1, 2, ..., N

O teste pode formular-se da seguinte maneira: a hiptese de que a distribuio terica se


ajusta srie em estudo rejeitada com nvel de confiana 1- se D > D1-, em que D1- o
valor crtico, mximo aceitvel para esse nvel de confiana.

Para o caso das distribuies Normal e Log-Normal com os parmetros estimados pelo
mtodo dos momentos, o valor crtico para um nvel de confiana de 95% dado por

1.094
D0.95 = 0.85
N - 0.01 +
N

No caso da distribuio de Gumbel com os parmetros estimados pelo mtodo dos


momentos, o valor crtico para o nvel de confiana 1- = 0.95 dado por

0.935
D0.95 = 0.85
N - 0.01 +
N

Para as distribuies baseadas na funo Gama no possvel definir com rigor o valor
crtico mas apenas um limite superior desse valor crtico. Esse limite superior dado por:

1.358
D s,0.95 = 0.11
N + 0.12 +
N

Os valores de Ds, 0.95 devem ser reduzidos entre 20% e 35% para se ter uma melhor estimativa
dos valores crticos.

6.5.5 Utilizao do modelo para previso de valores extremos


Estatstica Aplicada Hidrologia 31

Se um modelo de distribuio de extremos no rejeitado nem pelo teste do 2 nem pelo teste
de Kolmogorov-Smirnov ento ele pode ser utilizado para a previso de valores extremos,
correspondentes a perodos de retorno elevados.

Uma questo que pode surgir quando se experimenta ajustar diversas distribuies tericas
a uma dada srie e mais do que uma dessas distribuies no rejeitada por nenhum dos
testes de ajustamento. Nessas condies, torna-se necessrio discriminar entre as
distribuies no rejeitadas para escolher aquela que proporciona o melhor ajustamento. Um
dos processos para se fazer esta escolha a utilizao dos chamados ndices de
adaptabilidade de que a seguir se apresenta um exemplo:

2
N
i
IA j = - F j ( xi )
i=1 N + 1

em que a srie X est ordenada por ordem crescente, Fj a j-sima distribuio no rejeitada
pelos testes de ajustamento e IAj o correspondente valor ndice de adaptabilidade. Como
evidente, deve ser escolhida a distribuio que apresenta o menor valor do ndice de
adaptabilidade.

A.7 CORRELAO E REGRESSO LINEARES


7.1 CORRELAO E REGRESSO LINEAR SIMPLES
A correlao e regresso lineares constituem uma das ferramentas mais utilizadas em Hidrologia,
essencialmente para preencher falhas numa srie de registos e para estender uma srie
hidrolgica a partir de outras mais longas.

A figura 4 representa genericamente o domnio das variveis aleatrias X e Y com funes de


densidade de probabilidade respectivamente f(x) e g(y).

Figura 4 Correlao entre duas variveis aleatrias


Estatstica Aplicada Hidrologia 32

A probabilidade do valor da varivel X se situar num intervalo infinitesimal dx volta de x (e de


forma semelhante para a varivel Y) dada por:

dx dx
P(x - x x + ) = P(x) = f(x)dx
2 2
P(y) = g(y)d(y)

A probabilidade da ocorrncia simultnea desses dois acontecimentos dada por:


dx dx dy dy
P(x - x x+ y - y y + ) = P(x, y) = P ( x | y ) . P ( y )
2 2 2 2

Se os acontecimentos forem independentes, P(x | y) = P(x), donde resulta:

P( x, y ) = P ( x ) . P ( y ) = f ( x ) g ( y ) dx dy

Se os acontecimentos no forem independentes, diz-se que h entre as varveis uma dependncia


estocstica. Quando essa dependncia linear, ela medida pelo coeficiente de correlao
linear xy:
y x

(x - x )(y - y ) f(x)g(y) dxdy


xy = para a populao;
x y

N N

( xi - x )( yi - y ) x y - Nxy
i i

r xy = i=1
= i=1
para a amostra.
(N - 1) s x s y (N - 1) s x s y

Demonstra-se que rxy, xy 1. Quando o coeficiente de correlao iguala a unidade, a


correlao perfeita e os pontos (x,y) alinham-se segundo uma recta. Quando a apresentao
dos pontos (x,y) sugere uma "nuvem" (figura 5), o coeficiente de correlao aproxima-se de zero.
Estatstica Aplicada Hidrologia 33

Figura 5 Coeficiente de correlao

O coeficiente de correlao exprime o grau de associao, mais ou menos elevado, entre duas
variveis aleatrias. Quando a correlao elevada, pode estabelecer-se uma regresso linear
duma varivel (dependente) sobre a outra (independente), isto , tentar explicar a variao da
varivel dependente como uma funo linear da variao da varivel independente. Por exemplo,
pode tentar-se estabelecer uma regresso linear do escoamento anual numa bacia hidrogrfica em
funo da precipitao ponderada sobre a bacia.

Figura 6 Regresso linear

A expresso da regresso linear y = ax + b em que a e b so os coeficientes da regresso (figura


6), determinados, por exemplo, pelo mtodo dos mnimos quadrados.

Como se sabe, o mtodo dos mnimos quadrados determina os coeficientes de forma a


minimizar a soma dos quadrados dos desvios. Designando por y,^ a estimativa de y fornecida
pela regresso linear, ter-se-:
Estatstica Aplicada Hidrologia 34

^
Z= ( y i yi ) 2 = [ yi ( axi + b) ]2
i i

Os coeficientes a e b da regresso so calculados de forma a minimizar Z, para o que se torna


necessrio que as derivadas parciais de Z em ordem a a e b se anulem.

Z
= 2( ( a x i x i y i + b x i ) = 0
2

a i

Z
= 2( ( a x i y i + b ) = 0
b i

Daqui se obtm as chamadas equaes normais:

x
i=1
i yi - N x y
a= N

x
i=1
i
2
- N x2

b= y - ax

fcil de ver que a = rxy sy/sx.

Chama-se erro padro da estimativa, se, ao desvio padro dos resduos


ei = yi - y i

Como y = y , e = 0

Pode verificar-se a seguinte relao entre sy e se:

se2 = sy2 (1- rxy2)

Esta relao evidencia como a varincia residual se2 varia com o coeficiente de correlao.
Quando a correlao perfeita, r2 = 1, os pontos alinham-se todos segundo uma recta e a
varincia residual ou varincia no explicada pela regresso nula. medida que r diminui, se2
vai tendendo para sy2, ie, a regresso explica cada vez menos a varincia de y.

A varincia explicada pela regresso

2 2
s y = s y r 2

Se, por exemplo, r = 0.80, a regresso explica 64% da varincia total de y. O coeficiente de
Estatstica Aplicada Hidrologia 35

determinao, cd, d a percentagem da varincia total que explicada pela regresso, donde cd =
r2.

Interessa ter uma regra prtica que indique quando que vale a pena utilizar regresso linear, ou
seja, qual o limite inferior para o coeficiente de correlao. Chow (1964) sugere que se pode usar
regresso linear quando r > 0.60, o que corresponde a explicar cerca de 1/3 da varincia de y
atravs da regresso. Talvez seja prefervel, no entanto, adoptar como limite inferior para r
um valor um pouco mais alto como 0.70 (cerca de metade da varincia de y explicada pela
regresso) ou 0.80 (a varincia explicada cerca de 2/3 da varincia total). Antes disso, no
entanto, importa sempre ver se h uma base fsica para o estabelecimento da regresso afim de
evitar correlaes esprias (fruto do acaso, do tamanho limitado da amostra ou da transformao
de variveis).

Normalmente, a regresso de y sobre x no coincide com a regresso de x sobre y, como se


ilustra na figura 7. Tal coincidncia s acontece se a correlao for perfeita.

Figura 7 Exemplo de regresso linear simples

Um aspecto importante a notar quando se utiliza regresso linear para estimar um nmero grande
de valores em falta que a varincia da srie estendida se reduz em relao srie original,
devido ao facto da regresso no entrar em conta com a varincia residual (os valores estimados
y,^i situam-se sobre a recta de regresso e no volta dela como os valores utilizados para
estabelecer a regresso). Assim as estatsticas da srie mudam, o que no desejvel.

Para obviar a esse inconveniente, pode-se modificar a expresso da regresso linear para:
Estatstica Aplicada Hidrologia 36

y = ax + b + se z = ax + b + s y 1 - r 2 z

A nova parcela uma componente aleatria, obtida por multiplicao do erro padro da
estimativa por um valor da varivel aleatria Z N(0,1), varivel Normal reduzida. possvel
obter sucessivos valores de Z recorrendo a um gerador de nmeros aleatrios, actualmente
correntes em computadores e em mquinas de calcular. Esta parcela adicional faz com que a
varincia de y se mantenha, colocando os pontos volta da recta de regresso e no em cima
dela.

No possvel nestas notas introdutrias aprofundar este tema que , no entanto, extremamente
importante por ser a base dos chamados modelos autoregressivos de gerao sinttica.

7.2 TRANSFORMAO DE VARIVEIS

Considere-se o exemplo representado na figura 8. O coeficiente de correlao anteriormente


definido uma medida da associao linear entre x e y. Se se fizesse a sua determinao para o
exemplo da figura 8, obter-se-ia um valor baixo embora o grfico evidencie que x e y esto
fortemente associados.

Figura 8 Correlao e regresso no lineares

Em situaes como esta, em que h evidncia duma correlao mas ela no linear, uma
transformao das variveis x e y permite mudar uma associao no linear para uma associao
linear a que se podem aplicar as tcnicas de correlao e regresso lineares anteriormente
descritas no tpico. A transformao mais correntemente utilizada em Hidrologia a logartmica
que pressupe que x e y estariam ligadas por uma relao do tipo:

y = axb,

que, logaritmizada, origina:

ln(y) = ln(a) + b ln(x),


Estatstica Aplicada Hidrologia 37

ou seja, uma relao linear entre os logaritmos de x e y. Um exemplo a equao da curva de


recesso dum rio alimentado por um aqufero, Qt = Qo e t, que se transforma em:

ln(Qt) = ln(Q0) - t

dando uma relao linear entre ln(Qt) e t.

7.3 CORRELAO E REGRESSO LINEARES MLTIPLAS

Quando se considera a associao apenas entre duas variveis, x e y, a correlao e regresso


lineares dizem-se simples. possvel, no entanto, generalizar o conceito para a associao entre
uma varivel dependente, y, e m variveis independentes x1, x2, x3, ......., xm.

A expresso da regresso linear mltipla :


y = c0 + c1x1 + c2x2 + .... + cmxm.

Se o nmero de valores da amostra for N, m deve ser bastante inferior a N, no devendo como
regra prtica exceder N/5. Pode-se ento escrever:

y1 = c0 + c1x11 + c2x21 + .... + cmxm1


y2 = c0 + c1x12 + c2x22 + .... + cmxm2
................. etc.
yN = c0 + c1x1N + c2x2N + .... + cmxmN

Assim temos N equaes com m+1 incgnitas (N > m+1), nomeamente c0, c1, c2, ...., cm.
Determinam-se os coeficientes c0, c1, c2, ...., cm pelo mtodo dos mnimos quadrados. Assim
deve-se minimizar o valor de

z = i [yi - f(x1i,x2i,....,xmi)]2

A minimizao de z implica que as derivadas parciais de z em ordem aos ci se anulem. Obtm-se


assim m+1 equaes lineares com m+1 incgnitas, as equaes normais da regresso linear
mltipla. A sua resoluo permite calcular os valores dos coeficientes da regresso.

As medidas de correlao linear mltipla mais utilizadas so o erro padro, o coeficiente de


correlao mltipla, o coeficiente de determinao e os coeficientes de correlao parciais.

Erro padro dos resduos

O erro padro o desvio padro dos resduos e calcula-se da mesma forma que para a regresso
linear simples:

ei = y i - y i , e = 0
N
1
se2 = ei2
( N 1) i =1
Estatstica Aplicada Hidrologia 38

se2 exprime a varincia residual ou no explicada.

Coeficiente de correlao mltipla

O coeficiente de correlao mltipla, R, definido como


s
R = y
sy

Verifica-se imediatamente que se2 = (1 - R2) sy2.

Coeficiente de determinao

O coeficiente de determinao, Cd = R2 d a varincia explicada em percentagem da varincia


total de y.

Coeficientes de correlao parciais

Os coeficientes de correlao parciais ri medem o grau de associao de y com cada uma das
variveis xi e determinam a parte da varincia de y explicada por cada xi.

Para calcular um dado ri, comea-se por se determinar o coeficiente de correlao mltipla, R-i,
obtido sem incluir xi na regresso. Ento:
2 2
2
= R - R -i
ri
1 - R -i 2

R2 - R-i2 d o acrscimo da varincia explicada originado pela incluso de xi na regresso.


Quanto maior for, maior ser ri e mais importante a incluso de xi na regresso.

A obteno dos coeficientes de correlao parciais trabalhosa mas bastante til pois permite
excluir da regresso variveis que no ajudam a aumentar a varincia explicada.
Estatstica Aplicada Hidrologia 39

PROBLEMAS

1) Calcule a mdia e o desvio padro das seguintes sries de precipitaes anuais.

Srie 1: 805 903 875 867 912 849 815 882


Srie 2:1014 1209 480 720 545 512 984 1444

Comente os resultados.

2) Uma barragem levar 4 anos a ser construda. A sua construo far-se- com a proteco
de ensecadeiras e desvio do rio atravs de galerias (como se fez, por exemplo, com a barragem
de Cahora Bassa em Moambique). Se adoptar como caudal de dimensionamento das galerias o
correspondente a uma cheia com o perodo de retorno T = 20 anos, qual a probabilidade das
ensecadeiras serem galgadas durante a construo?

3) Se no caso anterior se pretender que a probabilidade de galgamento das ensecadeiras


durante a construo (i.e., o risco hidrolgico) no exceda 10%, qual dever ser o perodo de
retorno do caudal de dimensionamento das galerias?

4) Reactores nucleares, grandes barragens, diques altos, etc. devem ser projectados de tal
maneira que a probabilidade da sua danificao / galgamento seja da ordem de 1 vez em 10,000
anos (perodo de retorno de 10,000 anos). Calcule o risco de danos num reactor nuclear assim
dimensionado nos primeiros 100 anos do seu funcionamento.

5) Qual o risco que um acontecimento com perodo de retorno de N anos ocorra (pelo
menos uma vez) em N anos.

6) O valor da precipitao anual numa zona pode ser caracterizada pela distribuio
Normal. A precipitao anual mdia de 723 mm. O desvio padro de 212 mm.
a) Calcule a probabilidade duma precipitao anual maior que 1000 mm.
b) Calcule a probabilidade duma precipitao anual menor que 300 mm.
c) Determine a precipitao com probabilidade de excedncia de 1 e 10 %.
d) Determine a precipitao com probabilidade de no-excedncia de 1 e 10 %.
e) Determine a precipitao com probabilidade de no-excedncia de 50 %.
f) Determine a precipitao com perodo de retorno de 30 anos.

7) Dada a seguinte srie de 23 valores de precipitao anual num posto udomtrico,


expressa em mm,
1803 1295 1118 1626 1120 1116 1473 1194 1016 1372 2015 1662 1549 1448
1753 1914 1422 1346 1092 1489 1397 1245 1219
a) Ajuste a distribuio Normal srie dada. Trace o grfico em papel de
probabilidade.
b) Calcule a precipitao anual correspondente aos perodos de retorno de 10 e 50
anos.
c) Determine os perodos de retorno tericos a que correspondem as precipitaes
anuais de 1000 mm e 2015 mm (maior valor da srie).
Estatstica Aplicada Hidrologia 40

8) dada uma srie de 25 anos de caudais instantneos mximos anuais dum rio.
a) Teste a aleatoriedade da srie dada.
b) Ajuste srie as distribuies Log-Normal de 2 e 3 parmetros, Gumbel e
Pearson tipo III.
c) Teste a bondade do ajustamento a cada uma das distribuies tericas
experimentadas.
d) Determine os caudais de cheia correspondentes a perodos de retorno de 100 e
1000 anos. Compare os resultados das vrias distribuies.
e) Calcule o perodo de retorno para um caudal de 5000 m3/s. Compare os
resultados das vrias distribuies.
f) Qual o risco hidrolgico dum caudal de 5000 m3/s acontecer nos prximos
100 anos?

Caudais instantneos mximos anuais no rio (m3/s)

Ano Caudal Ano Caudal Ano Caudal


1953 450 1961 2724 1969 637
1954 672 1962 700 1970 510
1955 824 1963 553 1971 1626
1956 896 1964 485 1972 218
1957 699 1965 723 1973 851
1958 948 1966 1609 1974 1104
1959 483 1967 195 1975 2924
1960 789 1968 930 1976 853
1977 1219

9) Considerem-se as sries de precipitaes anuais em dois postos udomtricos P1 e P2,


relativamente prximos. A srie P1 tem 19 valores e a P2 tambm tem 19 valores, sendo o
perodo comum de 10 anos. Pretende-se estender a srie P2 para os primeiros nove anos por
regresso sobre P1 e estender esta para os ltimos nove anos por regresso sobre P2.
Ano 1 2 3 4 5 6 7 8 9 10
P1 (mm) 1162 1069 957 1058 1108 1155 805 936 921 732
P2 (mm) - - - - - - - - - 600
Ano 11 12 13 14 15 16 17 18 19 20
P1 (mm) 858 1094 1027 1139 1047 972 1212 1354 876 -
P2 (mm) 923 1087 1166 1064 1298 931 1121 1249 697 976
Ano 21 22 23 24 25 26 27 28
P1 (mm) - - - - - - - -
P2 (mm) 1316 766 1129 1187 794 1125 890 880
Estatstica Aplicada Hidrologia 41

BIBLIOGRAFIA

Ang, A. e W. Tang, 1975. Probability Concepts in Engineering Planning and Design. John
Wiley, New York.

Greenwood, J.A. e D. Durand, 1960. Aids for Fitting the Gamma Distribution.
Technometrics, vol 2, n 1, pp 55-66.

Kite, G.W., 1978. Frequency and Risk Analyses in Hydrology. Water Resources
Publications, Fort Collins, Colorado.

Kottegoda, N. e R. Rosso, 1998. Statistics, Probability and Reliability for Civil and
Environmental Engineers. McGraw-Hill, New York.

Lencastre, A. e F. M. Franco, 1984. Lies de Hidrologia. Universidade Nova de Lisboa.

Montgomery, CD; Runger, GC, 2003. Estatstica Aplicada e Probabilidade para Engenheiros,
2a Edio, Livros Tcnico-Cientficos, Rio de Janeiro.

Vaz, A. C., 1983. Transformao de Variveis Aleatrias Normais em Variveis Aleatrias


Assimtricas. LNEC, ITH 21, Lisboa.

Yevjevich, V., 1972. Probability and Statistics in Hydrology. Water Resources Publications,
Fort Collins, Colorado.