Você está na página 1de 12

1

UNIVERSIDADE FEDERAL DE PERNAMBUCO

CENTRO ACADÊMICO DO AGRESTE

ENGENHARIA CIVIL

PREENCHIMENTO DE FALHAS E ANÁLISE DE CONSISTÊNCIA EM


DADOS PLUVIOMÉTRICOS DO ESTADO DO AMAZONAS

Alunos: Gustavo Henrique Norat Pintor

Matheus Felipe da Silva

Thiago Alexandre Alves de Lima

Disciplina: Hidrologia Aplicada

Professores: Artur Paiva Coutinho e Larissa Fernandes Costa

Caruaru, 24 de setembro de 2019


2

Sumário

Pág

1 Apresentação.........................................................................................................03

2 Introdução..............................................................................................................04

3 Preenchimento de falhas........................................................................................05

3.1 Os Dados...........................................................................................................05

3.2 Método da ponderação regional........................................................................05

3.3 Método da regressão linear simples..................................................................07

3.4 Método da regressão linear múltipla.................................................................08

3.5 Método da ponderação regional com regressões lineares.................................08

3.6 Método do vetor regional..................................................................................09

4 Análise de consistências.........................................................................................10

4.1 Método da Dupla Massa....................................................................................10

5 Conclusão...............................................................................................................11

6 Referências Bibliográficas......................................................................................11

7 Anexos....................................................................................................................12
3

1 Apresentação
Esta atividade consiste na análise de índices pluviométricos mensais e anuais do
estado do Amazonas (Brasil), a descrição do trabalho pedia a análise de estações com ao
menos 30 anos de dados, porém, entre os anos de 1990 e 1993 nenhuma das estações possuia
dados utilizáveis, portanto, nossa análise foi feita para vinte e seis anos de dados de
precipitação oriundos de dez diferentes estações presentes no estado, e que estão
relativamente próximas.

O intuito da análise desses dados foi identificar possíveis falhas de medição nas
diferentes estações. Foram considerados como falhas medições mensais de menos de 5 mm,
e assumiu-se como falha anual os anos que tiveram mais de dois meses com precipitação
abaixo dos 5 mm. A região amazônica (onde se localizam os postos utilizados), tem um
clima equatorial úmido com média de mais de 2000 mm de precipitação anuais, e
mensalmente raramente se tem menos de 60 mm de precipitação, desse modo se considera
plausível presumir que meses com menos de 5 mm de precipitação medida se tratam de
falhas. Para as falhas anuais foram consideradas falhas os anos com pelo menos 2 falhas
naquela estação.

Para corrigir as falhas foram utilizados quatro diferentes métodos, o método da


ponderação regional, da regressão linear simples, regressão linear múltipla, método de
ponderação regional com base em regressões lineares e o método do vetor regional. Além
disso, também foi realizada uma análise de consistência das séries pluviométricas, com o
método da dupla massa.
4

2 Introdução
O objetivo de um posto de medição de chuvas é o de obter uma série ininterrupta de
precipitações ao longo dos anos (ou o estudo de chuva ao longo das tormentas). Em qualquer
caso pode ocorrer a existência de períodos sem informações ou com falhas nas observações,
devido a problemas com os aparelhos de registro e/ou com o operador do posto. Os dados
coletados devem ser submetidos a uma análise antes de serem utilizados. As causas mais
comuns dos erros grosseiros nas observações são: a) preenchimento errado do valor da
caderneta de campo; b) soma errada do número de provetas, quando a precipitação é alta; c)
valor estimado pelo observador, por não se encontrar no local no dia da amostragem; d)
crescimento de vegetação ou outra obstrução próxima ao posto de observação; e) danificação
do aparelho; f) problemas mecânicos no registrador gráfico.

O primeiro passo para a preparação dos dados para o tratamento estatístico consiste na
identificação e correção desses erros. Identificado os erros as séries poderão apresentar
lacunas que devem ser preenchidas por algum método estatístico. Neste trabalho estaremos
usando os métodos da ponderação regional, da regressão linear simples, regressão linear
múltipla, método de ponderação regional com base em regressões lineares e o método do
vetor regional. Além da análise de consistência realizada com o método da dupla massa.
5

3 Preenchimento de falhas

3.1 Os Dados

Os dados de precipitação foram obtidos através do Instituto Nacional de Meteorologia


do Brasil(INMET), em todo o Amazonas havia somente catorze postos de informações
pluviométricas, escolhemos os dez mais próximos que possuem as mesmas características
climáticas, ou seja não estão entre divisores naturais, o detalhe é que devido ao estado ser tão
extenso, os postos são relativamente distantes para padrões de outros estados por exemplo.
Abaixo segue imagem da distribuição dos postos de coleta de dados do estado:

Como foi relatado anteriormente foi elegido como falha mensal os meses que tiveram
na série histórica menos de 5 mm de precipitação, algo incompatível com as menores médias
de precipitação da região e com o clima equatorial úmido dos postos escolhidos. E como
falha anual os anos que tiveram ao menos duas falhas mensais. Os postos dez postos
escolhidos para nossa série de dados foram: Barcelos, Benjamin Constant, Eirunepe, Fonte
Boa, Iuarete, Itacotiara, Labrea, Manaus, Manicore e São Gabriel da Cachoeira, que
correspondem aos postos de 1 a 10 respectivamente.

3.2 Método da Ponderação Regional

É um método simplificado normalmente utilizado para o preenchimento de séries


mensais ou anuais de precipitações, visando a homogeneização do período de informações à
análise estatística das precipitações. Para um grupo de postos são selecionados pelo menos
três que possuam no mínimo dez anos de dados. Para um posto Y que apresenta falhas, as
mesmas são preenchidas com a seguinte equação:
1 x1 x2 xn
yc= [ +
n xm 1 xm2
+ …+ ]
y
xmn m
6

Onde y c é a precipitação do posto Y a ser estimada; x1,x2,...,xn= as precipitações


correspondentes ao mês(ou ano) que se deseja preencher, observada em n estações vizinhas;
y m a precipitação média do posto Y; xm1, xm2, ..., xmn= as precipitações médias das n
estações circunvizinhas.

Para realização do método de preenchimento de falhas da ponderação regional, foi criado um


algoritmo no software MATLAB, abaixo segue o código:
clear all, clc

A = xlsread('Tabela-5.3-pag-194-ponderacao-regional.xlsx','B2:M27')%lê dados

col = mean(A,1,'omitnan') %vetor com médias dos valores das colunas


row = mean(A,2,'omitnan') %vetor com médias dos valores das linhas

q = length(col) %comprimento 'x' da planilha


h = length(row) %comprimento 'yx' da planilha

for j = 1:h %leitura ponto a ponto da planilha


for i=1:q
if isnan(A(j,i)) %se encontra um valor nulo o mesmo é substituido
parte1 = 0
x=0
for k = 1:q %faz somatório dos pontos vizinhos ao em branco
if k~=i && isnan(A(j,k))~=1 %garante q não inclui valores nulos
x=x+1 %dividendo da equação é igual ao número de valores vizinhos
não nulos

parte1 = parte1 + A(j,k)/col(1,k) %primeiro termo da ponderação


regional
end
end
parte2 = col(1,i)/x %segundo termo da ponderação regional
B = parte1*parte2
A(j,i) = B %substitui o valor branco pelo valor ponderado
end
end
end
xlswrite('Tabela-5.3-pag-194-ponderacao-regional.xlsx',A) %gera planilha corrigida

Aqui segue o resultado do preenchimento de falhas anuais (destacado em azul), para as


falhas mensais será disponibilizado a planilha digital para checagem (devido ao tamanho da
tabela), o princípio que rege as duas é o mesmo.
Estação Estação Estação Estação Estação Estação Estação Estação Estação Estação
Data 1 2 3 4 5 6 7 8 9 10
1993 194,17 199,45 155,77 174,15 289,02 187,57 237,58 210,28 230,90 265,89
1994 195,49 203,93 219,53 197,42 248,76 216,02 226,51 191,84 215,03 227,82
1995 188,37 192,92 190,52 154,33 285,20 182,06 169,85 188,45 256,58 239,52
1996 223,51 216,98 223,85 186,32 231,81 227,38 203,12 216,27 115,87 271,13
1997 192,80 210,29 211,75 223,00 224,62 162,71 131,66 118,91 162,67 211,20
1998 167,91 57,20 197,33 260,40 216,03 192,48 138,53 183,37 174,73 255,22
1999 203,83 240,58 199,08 237,58 306,23 248,98 189,12 218,36 205,82 266,16
2000 200,74 203,87 224,73 207,78 335,28 219,90 183,85 216,63 217,38 277,54
2001 179,45 254,22 260,60 213,98 283,46 187,07 215,20 149,87 217,83 217,84
7

2002 202,22 246,58 232,60 226,67 379,18 198,19 192,27 210,79 218,18 284,34
2003 191,23 241,45 253,09 161,47 331,92 177,57 242,25 162,91 180,01 233,92
2004 181,22 191,35 181,80 185,58 266,08 206,03 159,68 171,41 155,81 226,56
2005 252,97 216,37 209,74 218,07 302,38 175,64 162,72 184,01 163,35 259,63
2006 187,76 238,36 101,78 240,71 257,75 204,59 171,02 192,06 219,20 274,52
2007 192,90 262,75 116,76 210,71 331,75 205,55 165,11 200,52 178,02 228,27
2008 225,84 245,05 234,53 254,35 282,90 255,47 190,46 263,09 224,42 260,18
2009 203,41 292,54 259,68 232,28 252,05 240,29 171,33 177,66 269,22 248,01
2010 173,38 234,83 226,92 194,60 240,85 161,88 138,60 180,99 207,50 248,52
2011 205,10 219,63 242,00 222,82 267,51 286,08 170,69 231,67 244,88 253,08
203,011 260,827
2012 282,31 201,01 230,07 245,49 320,99 235,44 4 192,67 3 265,69
2013 204,06 187,82 210,39 247,31 319,42 226,17 188,56 226,92 239,42 281,26
212,458 233,036
2014 2 211,92 195,63 264,57 304,44 250,58 176,54 4 226,93 253,92
172,921 189,082 203,272 192,481
2015 1 4 247,43 138,75 209,41 7 138,84 144,64 8 266,14
190,524 271,093 246,163
2016 6 169,27 186,55 174,53 8 249,04 151,33 191,25 6 268,93
95,8545 238,181 289,803 193,881
2017 5 8 265,83 187,29 8 235,96 8 220,75 257,7 254,88
214,581 229,224 298,281 191,282
2018 8 5 269,12 224,81 5 204,71 8 178,97 225,28 267,18

3.3 Método da regressão linear simples

Na regressão linear simples, as precipitações do posto com falhas são correlacionadas


com a de um posto vizinho. As estimativas dos dois parâmetros da equação podem ser
obtidas graficamente ou através do critério de mínimos quadrados.

Em nosso caso foram feitas todas as permutações possíveis entre as estações, foi
escolhida a com maior R2 para preencher as falhas de cada estação. Abaixo está a tabela com
falhas preenchidas com a metodologia, a correlação estará na planilha fornecida.
Data Esta 1 Esta 2 Esta 3 Esta 4 Esta 5 Esta 6 Esta 7 Esta 8 Esta 9 Esta 10
1993 194.17 199.45 155.77 174.15 289.02 187.57 237.58 210.28 230.90 265.89
1994 195.49 203.93 219.53 197.42 248.76 216.02 226.51 191.84 215.03 227.82
1995 188.37 192.92 190.52 154.33 285.20 182.06 227.11 188.45 256.58 239.52
1996 223.51 216.98 223.85 186.32 231.81 227.38 203.12 216.27 115.87 271.13
1997 192.80 210.29 211.75 223.00 224.62 162.71 131.66 118.91 162.67 211.20
1998 167.91 57.20 197.33 260.40 216.03 192.48 138.53 183.37 174.73 255.22
1999 203.83 240.58 199.08 237.58 306.23 248.98 189.12 218.36 205.82 266.16
2000 200.74 203.87 224.73 207.78 335.28 219.90 183.85 216.63 217.38 277.54
2001 179.45 254.22 260.60 213.98 283.46 187.07 215.20 149.87 217.83 217.84
2002 202.22 246.58 232.60 226.67 379.18 198.19 192.27 210.79 218.18 284.34
2003 191.23 241.45 253.09 161.47 331.92 177.57 242.25 162.91 180.01 233.92
2004 181.22 198.67 181.80 185.58 266.08 206.03 206.45 171.41 155.81 226.56
2005 252.97 216.37 205.94 218.07 302.38 175.64 162.72 184.01 163.35 259.63
2006 187.76 238.36 101.78 240.71 257.75 208.15 171.02 192.06 219.20 274.52
2007 192.90 262.75 116.76 210.71 331.75 205.55 165.11 200.52 178.02 228.27
8

2008 225.84 245.05 234.53 254.35 282.90 255.47 190.46 263.09 224.42 260.18
2009 203.41 292.54 259.68 232.28 252.05 240.29 171.33 177.66 269.22 248.01
2010 173.38 234.83 226.92 194.60 240.85 161.88 138.60 180.99 207.50 248.52
2011 205.10 219.63 242.00 222.82 267.51 286.08 170.69 231.67 244.88 253.08
2012 282.31 201.01 230.07 245.49 320.99 235.44 166.84 192.67 260.8273 265.69
2013 204.06 187.82 210.39 247.31 319.42 226.17 188.56 226.92 239.42 281.26
2014 208.8668 211.92 195.63 264.57 304.44 250.58 176.54 233.0364 226.93 253.92
2015 194.5941 189.99 247.43 138.75 209.41 203.2727 138.84 144.64 192.4818 266.14
2016 208.4041 169.27 186.55 174.53 264.1779 249.04 151.33 191.25 246.1636 268.93
2017 95.85455 238.1818 265.83 187.29 287.8816 235.96 193.8818 220.75 257.7 254.88
2018 214.5818 242.68 269.12 224.81 295.9317 204.71 180.52 178.97 225.28 267.18

3.4 Método da regressão linear múltipla

Este método, que advém da Regressão Linear, é um modelo estático de previsão de valores
de uma ou mais variáveis dependentes, através de um conjunto de variáveis independentes.
Quanto mais significativo o peso de uma variável isolada, ou de conjunto de variáveis
independentes, mais se pode afirmar que alguns fatores afetam mais o comportamento de
uma variável dependente, da resposta ou lacuna procurada, do que outros. O método é
representado pela seguinte equação:
Y =a1 ∙ X 1 +a 2 ∙ X 2 +a3 ∙ X 3 +⋯+ a p ∙ X p

Onde Y é a variável dependente; X 1 , X 2 , X 3 ,… X p são variáveis independentes; a 1 , a2 , … a p são


os coeficientes da regressão, que podem ser definidos pelo método dos mínimos quadrados.
Ainda, é necessária a verificação da qualidade da equação ajustada, realizada por meio do
coeficiente de determinação R², que deve estar nos limites (0 ≤ R ² ≤1).

No preenchimento de dados pluviométricos, a variável dependente Y, associada ao posto


com a falta de dado, é correlacionada com as variáveis independentes X, correspondentes as
observações efetuadas em vários postos vizinhos.

Para este método, preencheu-se os dados vazios com o auxílio da função de análise do Excel,
implementando a equação representativa do método. Os resultados obtidos estão em anexo

3.5 Método da ponderação regional com regressões lineares

Este método combina os métodos da regressão linear e da ponderação regional e,


consiste em estabelecer regressões lineares entre o posto com dados faltantes, variável
dependente Y, com os dados dos postos vizinhos, variáveis independentes X. De cada uma
das regressões feitas, obtém-se o coeficiente de correlação r, e são estabelecidos fatores de
peso, para cada um dos postos através da seguinte expressão:
rY X
WX=i n
i

(∑ r Y X ) j
j=1
9

Onde W X é o fator de peso entro o posto Y e X i , e o somatório de todos estes fatores de


i

n
ponderação devem ser 1; r Y X é o coeficiente de correlação entres os mesmos postos; ∑ r Y X é
i j
j=1

o somatório dos n coeficientes de correlação. A partir dos pesos encontrados, o valor a ser
preenchido no posto Y pode ser obtido por:
n
Y =∑ X i .W X i
i=1

Para auxílio dos cálculos, implementou-se um algoritmo para a ponderação regional


no Matlab (em Anexo). O código recebe entrada de duas tabelas, uma com os dados
pluviométricos com falhas, e outra com os valores de “r” obtidos do método de regressão
linear. A rotina percorre toda a planilha de dados a procura de valores nulos, que são
substituídas pelo valor ponderado calculado com a equação de ponderação.

3.6 Método do vetor regional

O método do vetor regional, desenvolvido por Hiez (1977,1978) constitui outra


alternativa para realizar as análises de consistência e preenchimento de dados pluviométricos
em nível mensal e anual. No nosso caso, utilizaremos somente para preenchimento de falhas
nas séries de dados de precipitação que é o que nos foi solicitado. O vetor regional é definido
como uma série cronológica, sintética de índices pluviométricos anuais (ou mensais),
oriundos da extração por um método de máxima verossimilhança da informação mais
provável contida nos dados de um conjunto de estações de observação, agrupadas
regionalmente.

O método consiste em determinar dois vetores ótimos, L e C cujo produto é uma


aproximação da matriz de precipitações P. O vetor L é um vetor coluna de dimensão n o qual
recebe o nome de vetor regional, enquanto que o vetor C é um vetor linha de dimensão m
que representa os coeficientes característicos de cada estação. A estimativa da altura
precipitada no ano i, no posto j, resulta, portanto em: Pij =Li∗C j

Tudo começa com uma estimativa inicial para o vetor L:


m
1
Li = ∑ Pij
m j=1

Após isso acha-se o vetor C em função desse valor inicial:


n

∑ Li P ij
C j= i=1n ; j=1 , … , m
2
∑ Li
i=1

Por fim acha-se o vetor regional definitivo:


10

∑ C j P ij
Li= j=1m ; i=1 , … , n
2
∑ Cj
j=1

Aqui segue o código usado no MATLAB para realização do mesmo:


clear all clc
P = xlsread('VETOR_REGIONAL',1,'B2:K27'); %Leitura dos dados da tabela
[n,m] = size(P) %Leitura do número de anos/meses(n) e do número de estações (m)
L=zeros(n,1);
C=zeros(1,m);
for i=1:n
for j=1:m
L(i,1)=L(i,1)+((1/m)*P(i,j)); %Chute inicial para o vetor regional
end
end
for j=1:m
for i=1:n
C(1,j)=C(1,j)+((L(i,1)*P(i,j))/(L(i,1)^2)); %Vetor linha "C" com os
coeficientes
end % característicos de cada estação
end
L=zeros(n,1);
for i=1:n
for j=1:m
L(i,1)=L(i,1)+((C(1,j)*P(i,j))/(C(1,j)^2)); %Vetor regional "L" definitivo
end
end
for i=1:n
for j=1:m
if P(i,j)<1 %Preenchimento das falhas
P(i,j)=L(i,1)*C(1,j); % na nova matriz de
end % precipitações "P"
end
end
xlswrite('VETOR_REGIONAL.xlsx',P) %gera planilha corrigida

Os resultados obtidos seguem em anexo.

4 Análise de consistências

4.1 Método da Dupla Massa

Após o preenchimento de uma série de dados pluviométricos, é necessário analisar a


consistência dos dados obtidos pelos diversos métodos, com relação às observações
registradas nos postos vizinhos, a fim de identificar mudanças no comportamento da
precipitação, das condições físicas e climáticas da região, erros sistemáticos ou grosseiros
nas leituras dos dados etc.

O método Dupla massa, ou duplo-acumulativo, é baseado no princípio que, a


precipitação acumulada de um posto plotada contra a precipitação acumulada dos postos
vizinhos, num mesmo período, deve ser linear, sempre que as quantidades sejam
11

proporcionais. Assim, se o gráfico plotado não gera uma reta, é bem provável que tenha
ocorrido alguma das alterações citadas anteriormente.

Com as tabelas já preenchidas usando todos os métodos vistos no trabalho, fez-se no


Excel a plotagem dos gráficos para verificar se eles geram uma reta. As tabelas com
resultados estão em anexo.

5 Conclusão

Após a utilização de tantos métodos diferentes para o preenchimento de falhas em


séries históricas de dados de precipitação, além da análise da consistência dos mesmos pelo
método da Dupla Massa, se constata a importância do estudo destes métodos, bem como o
entendimento da aplicabilidade de cada um deles, os distintos métodos diferem em eficiência
e abordagem dos dados, há sim os que entregam dados mais consistentes, mas cabe ao
pesquisador eleger o método mais apropriado dependendo da finalidade da atividade.

A utilização de dados pluviométricos deve atender o critério de confiabilidade,


considerando a sua importância no planejamento e na gestão de recursos hídricos. Dessa
forma é fundamental a atenção aos procedimentos metodológicos necessários para entregar
uma série de dados consistente.

6 Referências Bibliográficas

BERTONI, J. C. & TUCCI, C. E. M. Precipitação. In.: Hidrologia: ciência e aplicação, Org.


Carlos E. M. Tucci, 2ª ed., 2. reimpr., Porto Alegre: Ed. Universidade/UFRGS: ABRH,
2001.

www.inmet.gov.br/portal/index.php?r=bdmep/bdmep
12

7 Anexos

Você também pode gostar