Você está na página 1de 13

S ÉRIES T EMPORAIS E P REVISÃO

P REVISÃO DA P RECIPITAÇÃO EM C ABREIRO

T RABALHO DE GRUPO

Andressa Litwinski (202103489); Lirielly Ruela Vitorugo Nascimento (202100370); Maria da


Glória Salgado Gonçalves (200305541)

22 de dezembro de 2021
Conteúdo

1 Introdução 1

2 Análise descritiva dos dados 2

3 Resultados 5

4 Discussão 6

5 Conclusão 7

6 Referências Bibliográficas 8

7 Apendice 9

1
Lista de Figuras

2.1 Série Temporal da precipitação em Cabreiro. . . . . . . . . . . . . . . . . . . . . . . . . 2


2.2 Gráficos da correlação dos Lags da precipitação em Cabreiro. . . . . . . . . . . . . . . . 3
2.3 Gráfico das médias da precipitação em Cabreiro. . . . . . . . . . . . . . . . . . . . . . . 3
2.4 Gráfico da sazonalidade da precipitação em Cabreiro. . . . . . . . . . . . . . . . . . . . 3
2.5 ACF da precipitação em Cabreiro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.6 PACF da precipitação em Cabreiro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2
Resumo
A previsão de séries temporais exige modelos matemáticos adequados ao conjunto de dados reais,
sujeitos a algum nível de variação, embora possamos efetuar as transformações recomendadas para
aplicar determinados modelos que aqui iremos tratar. Para este trabalho utilizados dados da precipitação
diária da estação meteorológica de Cabreiro para serem analizados como sendo uma série temporal. Na
primeira fase efetuamos a análise descritiva dos dados para na fase seguinte recorrer à comparação de
métodos de suavização (ES) com modelos sazonais de média móvel autoregressiva intergrada ou "seasonal
autoregressive integrated moving average" (SARIMA). Utilizamos o modelo SARIMA por a série ser do
tipo instável, por existirem ciclos e há anos onde chove mais no Inverno. Este tipo de série temporal tem
picos com aumentos muito rápido, mas depois decresce muito devagar. Desta forma, temos um modelo
não linear que modela a série não estacionária, e ao mesmo tempo consideramos os incrementos anuais e
mensais da chuva, a sazonalidade. Para análise do conjunto de dados recorremos ao RStudio.
C APÍTULO 1

I NTRODUÇÃO

O desenvolvimento e a avaliação de diversos modelos aplicados a uma série temporal diferem de cada
desafio preditivo. Há modelos que podem variar de muito simples a complexos, e variam em função das
condições ou parâmetros de treinamento. Mas as pequenas diferenças no desempenho entre os modelos
podem ser explicadas pela variância. O conjunto de dados reais são um recurso escasso (Skiena, 2017)
que exige muito trabalho para se obter uma previsão futura.
Para a realização deste trabalho utilizamos dados quantitativos da precipitação diária em Cabreiro, Arcos
de Valdevez. Estes são os disponibilizados pelo Sistema Nacional de Informação de Recursos Hídricos
(SNIRH) para o períódo entre 1961 e 1989, e recolhido às 9h de cada dia. Efetuamos uma análise
descritiva dos dados, visualizando o conjunto de dados para identificar observações outliers, examinamos
se existe tendência e sazonalidade por meio de gráficos específicos. Testamos ainda a estacionariedade
dos dados. Na primeira fase fazemos a análise descritiva da sérire de dados da precipitação registada em
Cabreiro e na segunda fase o objetivo é analisar a série de tempo real para previsão.

1
C APÍTULO 2

A NÁLISE DESCRITIVA DOS DADOS

O conjunto de dados diários de precipitação (medida em milimetros) em Cabreiro, entre 1961 e 1989,
corresponde a 10592 observações. Efetuamos uma agregação dos dados diários, através da soma, e os
transformamos em mensais, contabilizando 348 meses. As caraterísticas da série temporal são:
> str(r)
Time-Series [1:348, 1] from 1961 to 1989: 3.08 2.36 0.1 3.18 1.1 0.46 0.93 0.08 0.81 3.25 ...
- attr(*, "dimnames")=List of 2
..$ : NULL
..$ : chr "c"

Na continuação, referindo-nos à precipitação da série de dados reais, visualmente notamos na Figura


2.1 que a série não é estacionária, a média e a variância não são constantes durante todo o período em
estudo. Posteriormente, confirmaremos a não estacionariedade com outros gráficos e testes estatísticos
específicos.

F IGURA 2.1
Série Temporal da precipitação em Cabreiro.

Realizamos os gráficos de correlação para o Lag dos 12 meses (Figura 2.2): analisando o gráfico não
vemos correlação significativa (> 0.7) em nenhum dos Lags. A correlação maior corresponde ao r(t−12),
com valor de 0.33.

2
C HAPTER 2 – A NÁLISE DESCRITIVA DOS DADOS

F IGURA 2.2
Gráficos da correlação dos Lags da precipitação em Cabreiro.

Nos gráficos das figuras 2.3 e 2.4 confirma-se que há sazonalidade nos dados, o padrão repete-se ao longo
dos meses. Confirmamos também gráficamente que não há estacionariedade, conforme já referimos, a
média e a variância não se mantêm constantes. Identificamos ainda que a tendência é difícil de ver nestes
gráficos. Praticamente podemos dizer que não vemos tendência no gráfico abaixo.

F IGURA 2.3
Gráfico das médias da precipitação em Cabreiro.

F IGURA 2.4
Gráfico da sazonalidade da precipitação em Cabreiro.

Procedemos à realização do gráfico da autocorrelação (ACF) para verificar se as correlações mudam


com o atraso de K (Lag). Os primeiros três meses têm correlação positiva, seguido de dois meses sem
correlação, os seguintes três com correlação negativa, seguido de dois meses sem correlação, e por fim os
dois últimos com correlação positiva. Vemos que os Lags seguintes seguem o mesmo padrão de correlação,

3
C HAPTER 2 – A NÁLISE DESCRITIVA DOS DADOS

confirmando a sazonalidade dos dados (formato "recortado"). O maior valor de correlação está nos Lags
de meio em meio ano, em múltiplos de 0.5 (Figura 2.5). Este motivo prende-se com a sazonalidade das
estações do ano.

F IGURA 2.5
ACF da precipitação em Cabreiro.

A função de autocorrelação parcial (PACF) apresenta um grande pico no Lag 1 seguido por ondas
amortecidas que se alternam entre as correlações positivas e negativas, indicando um termo de média
móvel de ordem superior nos dados. A PACF calcula os coeficientes de correlação após o efeito de todas
os Lags "anteriores"(ordem inferior) ter sido removido (por estimativa de projeção linear), Figura 2.6.
Quer no gráfico ACF quer no gráfico PACF verificamos que existe alguma autocorrelação nos Lags.

F IGURA 2.6
PACF da precipitação em Cabreiro.

4
C APÍTULO 3

R ESULTADOS

Neste capítulo iremos descrever o resultado do modelo SARIMA aplicado à série temporal e de previsão
referente ao conjunto de dados da precipitação em Cabreiro.

5
C APÍTULO 4

D ISCUSSÃO

Neste capítulo iremos efetuar a discussão dos resultados obtidos no modelo SARIMA, ou seja, das
caraterísticas estatísticas da série temporal utilizada. Discutimos o problema em lidar com dados reais
devido à dificuldade em aplicar qualquer modelo de previsão. Em diversas bibliografias da área da
hidrologia defende-se que há tendência para uma diminuição da precipitação mas com eventos de maior
intensidade, ou seja, chove mais em menor período de tempo.

6
C APÍTULO 5

C ONCLUSÃO

Embora este trabalho ainda esteja em andamento, podemos já adiantar que, conforme os gráficos ACF e
PACF há indicação da exclusão de alguns modelos, como por exemplo o de médias móveis e ARIMA. O
modelo SARIMA é indicado para sérires de dados não estacionárias. Podemos escolher um dos modelos
SARIMA mais adequado usando por exemplo critérios como o critério AIC ou outros.

7
C APÍTULO 6

R EFERÊNCIAS B IBLIOGRÁFICAS

Chatfield, C., Xing, H. (2019)The analysis of time series: an introduction with R.The analysis of time
series: an introduction with R. Chapman and hall/CRC.
Cowpertwait, P. S., Metcalfe, A. V. (2009). Introductory time series with R. Springer Science Business
Media.
Skiena, S. S. (2017). The data science design manual. Springer.
Shumway, R. H., Stoffer, D. S. (2011). Time series and its applications: With R examples. Springer
Science, 1-202.

8
C APÍTULO 7

A PENDICE

O t r a b a l h o no R s e g u e em a n e x o em f o r m a t o . h t m l e . Rmd .

Você também pode gostar