Você está na página 1de 13

UNIVERSIDADE FEDERAL DE ALAGOAS – UFAL

CAMPUS A. C. SIMÕES
CENTRO DE TECNOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM RECURSOS HÍDRICOS E SANEAMENTO

ISRAEL SILVA LEMOS


PAULO FERNANDO ARAÚJO FEITOSA LEITE

DISTRIBUIÇÕES DE VALORES EXTREMOS APLICADAS A UMA SÉRIE DE


VAZÕES E À ANÁLISES DE DADOS DA PRODUÇÃO DE HIDROGÊNIO

Maceió/AL
29 de maio de 2017
ISRAEL SILVA LEMOS
PAULO FERNANDO ARAÚJO FEITOSA LEITE

DISTRIBUIÇÕES DE VALORES EXTREMOS APLICADAS A UMA SÉRIE DE


VAZÕES E À ANÁLISES DE DADOS DA PRODUÇÃO DE HIDROGÊNIO

Trabalho apresentado à disciplina de Estatística


Aplicada – RHS 106 – do Programa de Pós-
graduação em Recursos Hídricos e Saneamento da
Universidade Federal de Alagoas – Campus A. C.
Simões, como requisito parcial avaliativo.

Prof.º Dr. Marllus Gustavo Ferreira Passos das


Neves

Maceió/AL
29 de maio de 2017
LISTA DE SIGLAS

GEV – Generalizada de Valores Extremos

Tr– Tempos de Retorno

MATLAB – MATrix LABoratory

FAP – Função Acumulada de Probabilidade

IC – Intervalo de Confiança
SUMÁRIO

1. INTRODUÇÃO ..................................................................................................... 2
1.1 OBJETIVOS .................................................................................................. 3
3. METODOLOGIA .................................................................................................. 4
4. RESULTADOS E DISCUSSÕES ......................................................................... 5
5. CONSIDERAÇÕES FINAIS ................................................................................ 9
6. REFERÊNCIAS BIBLIOGRÁFICAS .................................................................. 10
2

1. INTRODUÇÃO

A estimativa de vazões máximas é fundamental no controle de inundação e dimensionamento


de obras hidráulicas. Quando se fala em vazões máximas, tem-se um risco associado a sua
ocorrência, que pode ser interpretado através do tempo de retorno (Tr). O Tr é um critério
utilizado em projetos. Desse modo o mesmo será um valor de entrada para as distribuições
extremais. As distribuições de valores extremos permitem que sejam obtidos valores extremos
de modo mais facilitado, ao contrário das distribuições exatas de valores extremos, que com
exceção de algumas distribuições, como a exponencial da variável original, as expressões
analíticas são de difícil obtenção, por depender da distribuição que gera a variável original e
do tamanho da amostra, dessa forma a teoria assintótica dos valores extremais demonstra os
limites máximos e mínimos caudais independentemente do conhecimento da função da
variável original. Assim a aplicação dos modelos extremais podem ser feitos à variáveis
hidrológicas, neste caso, a uma série de vazões. Explorando um pouco mais da estatística,
pode-se estabelecer intervalos de confiança de modo que seja garantido, a determinado nível
de confiança, que possíveis valores estarão contidos em um intervalo descrito, neste caso na
construção de uma intervalo de confiança para média e variância de dosagens de glicose na
produção de hidrogênio.
3

1.1. OBJETIVOS

O trabalho possui dois objetivos distintos, são eles:

 Aplicar distribuições de valores extremos a uma série de vazões para extrair os


quantis referentes as vazões com tempo de retorno de 2, 50 e 100 anos, na
primeira etapa; e,
 Estimar o intervalo de confiança, com 95% de confiabilidade, para média e
variância de dosagens de glicose para produção de hidrogênio, na segunda etapa.
4

2. METODOLOGIA

Neste tópico serão apresentados os procedimentos realizados para obtenção dos quantis
referentes às vazões com tempo de retorno de 2, 50 e 100 anos (etapa 1) e para estimativa do
intervalo de confiança (etapa 2) de modo que os objetivos sejam atendidos.

2.1. ETAPA 1

Para esta etapa foram calculados os valores extremais máximos a partir das
distribuições: Gumbel, Fréchet, Pearson III, Generalizada de Valores Extremais (GEV); e
mínimos por Weibull. Os valores máximos foram retornados adotando-se um tempo de
retorno de 2, 50 e 100 anos para a série de vazões fornecidas por NEVES, M. G. F. P.
Para tanto o software MATLAB foi utilizado como referência para implementação das
funções descritas, de forma que os valores extremos para uma série de vazões fossem
alcançados.

2.2. ETAPA 2

Para a construção dos intervalos de confiança foi adotado um nível de confiança de


95%. A aplicação deste intervalo, típico na engenharia, nos diz que os intervalos de confiança
encontrados realmente contêm o verdadeiro valor populacional da média e da variância, em
95% das vezes. Para tanto, foi aplicado o método descrito por TRIOLA (Introdução à
Estatística, 2008), para determinação dos intervalo de confiança para uma série de dados de os
quais foram monitorados durante aplicação de glicose para produção de hidrogênio.

2.2.1. Intervalo de confiança para a média populacional

Para a criação do intervalo de confiança para a média populacional sem conhecer o valor
do desvio padrão populacional utilizamos a distribuição t de Student, que a medida que o
tamanho amostral se torna maior ela se aproxima da distribuição normal padrão.

Para prosseguir verificamos o atendimento ao seguinte requisito: “A amostra provem de


uma população normalmente distribuída ou possui um tamanho n > 30.”. A amostra possui
um tamanho n = 89 dados, logo se atendeu o requisito imposto.
5

A dosagem de glicose do reator possui uma média amostral x = 3974,80 mg/L e desvio
padrão amostral s =328,27 mg/L. Tem-se 89 – 1 = 88 graus de liberdade, assim verificou-se
na tabela de t de Student e encontrou-se para um nível de confiança de 95%, t = 1,99.

2.2.2. Intervalo de confiança para a variância populacional

Para a criação do intervalo de confiança para a variância populacional utilizamos a


distribuição qui-quadrado, que não é simétrica e se torna mais simétrica com o aumento dos
graus de liberdade. Para prosseguir verificamos o atendimento ao seguinte requisito: “A
amostra provem de uma população normalmente distribuída independentemente do tamanho
da amostra.”.

Consideramos que a população é normalmente distribuída. A dosagem de glicose do


reator possui uma média amostral x = 3974,80 mg/L e desvio padrão amostral s =328,27
mg/L. Tem-se 89 – 1 = 88 graus de liberdade e verificou-se na tabela da distribuição qui-
quadrado que v1 = 65,60, para α/2 = 0,025 e 88 graus de liberdade, e que v2 = 118,10, para
α/2 = 0,975 e 88 graus de liberdade.

3. RESULTADOS E DISCUSSÕES

Neste capítulo serão apresentados e discutidos os resultados com as distribuições extremais


aplicadas para uma série de vazões, bem como para os intervalos de confiança para os dados
de dosagem de glicose.

3.1. ETAPA 1

A distribuição generalizada de valores extremos – GEV, possui os parâmetros k, α e β


(parâmetros de forma, escala e posição, respectivamente). K representa o parâmetro de forma e para K
> 0 a GEV representa a distribuição do tipo II (ou Fréchet), para K=0 a GEV corresponde a Gumbel e
se K < 0 a GEV representa a distribuição do tipo III. Sendo assim não foi possível aplicar Fréchet no
MATLAB porque o k foi menor que zero, dessa forma a GEV ajusta-se ao tipo III, uma vez que gerou
um valor de K = -0,0114633.
Ademais, aplicando-se as distribuições, cada função apresentou suas particularidades
(GRÁFICO 1).
6

Gráfico 1– Funções densidade de probabilidade das distribuições Gumbel, GEV, Pearson III e Weibull

A função inversa da função acumulada de probabilidades (FAP) de Gumbel está


descrita (GRÁFICO 1) a partir da série de vazões fornecidas por NEVES, M. G. F. P., para os
tempos de retorno (Tr) 2, 50 e 100 anos, denotando o tempo médio em anos de vazões
extremas serem retornadas para cada Tr (TABELA 1).

Tabela 1 – Vazões retornadas pela distribuição de Gumbel para cada valor de Tr de entrada

Tr (anos) 2 50 100
Vazão (m³/s) 1.081,50 2.247,70 2.357,70

A distribuição de Gumbel (Dupla Exponencial ou Fisher-Tippet do tipo I) tem grande


aplicação na hidrologia em casos de precipitações máximas e vazões máximas, por trazer
resultados que se ajustam mais adequadamente a estes eventos naturais de cheias, e como
vemos (TABELA 1) a função retorna vazões máximas bem semelhantes para 50 e 100 anos
de retorno. Percebe-se sua forma no gráfico de destacando das demais funções, ressaltando
7

que Gumbel apresenta momento central de ordem 3 (1,1396) e possui parâmetros de escala e
posição.
A distribuição máxima de valores extremos apresenta-se em forma de pico mais
acentuada no gráfico, mostra os valores máximos menos frequentes. Nota-se que a escolha da
função não é simples, este fato é percebido no gráfico, desse modo aplicar uma ou outra
função deve-se levar em conta as aplicações já realizadas anteriormente por outros autores, e
se, depois de aplicadas, notou-se que a função se ajusta bem a descrição de determinado
fenômenos, nesse caso as vazões máxima. A GEV do tipo III apresentou forma muito similar
a Pearson III e vazões próximas para os tempos de retorno dados. Notas que as vazões obtidas
para todas as funções são semelhantes, de modo geral.

Tabela 2 – Vazões retornadas pela distribuição Generalizada de Valores Extremos para cada valor
de Tr de entrada

Tr (anos) 2 50 100
Vazão (m³/s) 989,9 2262 2507,2

Para Pearson Tipo III, que tem grande aplicação em estudos hidrológicos, destacando-se
para máximas de vazões e precipitações, os valores obtidos para os tempos de retorno
(TABELA 3) também se mostraram semelhantes as demais distribuições, porém não se sabe
ao certo qual seria a melhor distribuição para representar os valores máximos, visto que não
foi realizado teste de aderência para tal, afim de verificar a partir da qual distribuição os dados
seriam melhor representados. Pearson do Tipo III se mostrou tão semelhante (GRÁFICO 1)
com a GEV, que se for realizada a diferença entre os valores máximos para Tr 2 dessas
distribuições, obtém-se apenas 4,8m³/s.

Tabela 3 – Vazões retornadas pela distribuição de Pearson Tipo III para cada valor de Tr de entrada

Tr (anos) 2 50 100
Vazão (m³/s) 994,70 2.195,30 2.401,80

A distribuição de Weibull, aplicada para extremos mínimos, retornou vazões também


próximas as demais distribuições aplicada para máximas. Este fato se deve às características
dos dados, que são apresenta muita discrepância entre um valor e outro, no geral. Porém não
cabe adotar esta conclusão para este caso como verdadeira pelo fato também, de não ter sido
8

realizado teste de aderência dos dados à esta distribuição, dessa forma o fim foi realizar a
aplicação da distribuição de modo que ela desse como respostas vazões mínimas para cada Tr
de entrada (TABELA 4).

Tabela 4 – Vazões retornadas pela distribuição de Weibull para cada valor de Tr de entrada

Tr (anos) 2 50 100
Vazão (m³/s) 1.020,20 2.156,10 2.313,70

3.2. PARTE 2

Para a construção dos intervalos de confiança foi adotado um nível de confiança de 95%.
O que significa que estamos 95% confiantes de que os intervalos de confiança
encontrados realmente contêm o verdadeiro valor populacional da média e da variância.

3.2.1. Intervalo de confiança para a média populacional

Para um intervalo de confiança de 95% foi possível encontrar o Erro E = 69,24 (mg/L) e
montar 3905,56 < µ < 4044,04 (mg/L). Assim o IC a 95% para µ é [3905,56; 4044,04]
(mg/L). Nota-se que este intervalo seria similar a curva Z, pois a distribuição t converge
para normal conforme aumenta-se os graus de liberdade.

3.2.2. Intervalo de confiança para a variância populacional

Adotando um intervalo de confiança de 95%, encontrou-se 80294,27 < σ² <


144554,17(mg/L)². Assim o IC a 95% para σ² é [80294,27; 144554,17] (mg/L)². Uma
forma de melhorar ainda mais esta eficiência de estimativa de intervalo de confiança, seria
a ter uma distribuição ainda mais „‟ fina‟‟, ou seja, com menor variância possível, deste
modo a probabilidade de termos erros é ainda menor, sendo possível através de
amostradas ainda maiores.
9

4. CONSIDERAÇÕES FINAIS

A partir da aplicação das distribuições extremais, foi possível obter valores para os tempos de
retorno fixados, com exceção da distribuição de Fréchet que não foi possível realizar, como
foi mostrado nos resultados, com a GEV sendo do Tipo III, conforme metodologia adotada
pelo MATLAB. Com este trabalho não se pode concluir o método de distribuição para vazões
mais adequado, pelo fato de não ter sido realizado testes de aderência. Os teste de aderência
poderiam mostrar resultados satisfatórios permitindo conclusões mais pertinentes e coerentes,
os quais possibilitariam melhor identificação e adequabilidade das distribuições aplicadas
para a série de vazões utilizada.
Em relação aos intervalos de confiança para a média e variância os mesmos foram realizados
conforme metodologia adotada já considerando inicialmente um nível de confiança de 95%,
ou seja, do intervalo possuir o verdadeiro valor, que tiveram boa aplicabilidade aos dados da
dosagem de glicose.
10

5. REFERÊNCIAS BIBLIOGRÁFICAS

 TRIOLA, MARIO F. (2008) Introdução à Estatística. 10a Edição. Editora LTC.

 MAURO NAGHETTINI; ÉBER JOSÉ DE ANDRADE PINTO. Hidrologia


estatística. Belo Horizonte: CPRM, 2007.552 p.