Você está na página 1de 33

Modelagem e previsão da ocorrência de manchas solares

Isaac Victor Silva Rodrigues

Rio de Janeiro
ISAAC VICTOR SILVA RODRIGUES

MODELAGEM E PREVISÃO DA OCORRÊNCIA DE


MANCHAS SOLARES.

Trabalho de Conclusão de Curso subme-


tido à Escola Nacional de Ciências Esta-
tísticas, como requisito necessário para
obtenção do grau de Bacharel em Estatís-
tica.

Rio de janeiro, 2022

ii
Autorizo a reprodução e divulgação total ou parcial desse trabalho, por parte
da Escola Nacional de Ciências Estatísticas, através dos seus recursos
eletrônicos, para fins de estudo e pesquisa, desde que citada a fonte.

R696m Rodrigues, Isaac Victor Silva.


Modelagem e previsão da ocorrência de manchas solares / Isaac Victor Silva
Rodrigues. – Rio de Janeiro, 2022.
25 f.
Inclui referências.
Orientador: Prof. MSc. Sandra Canton Cardoso.
Monografia (Graduação em estatística) – Escola Nacional de Ciências
Estatísticas.
1. Estatística matemática. I. Cardoso, Sandra Canton. II. Escola Nacional de
Ciências Estatísticas. III. IBGE. IV. Título.
CDU: 519.2
Resumo
Este trabalho tem por objetivo modelar e prever a quantidade de manchas solares. Tal
fenômeno ocorre no Sol e está diretamente relacionados com o chamado ciclo solar. A
atividade solar pode refletir na vida moderna, principalmente quando consideramos a rede
elétrica, o que justifica o seu estudo. Para a modelagem da série temporal de manchas
solares foi aplicado o modelo estatístico chamado de TBATS, que é uma adaptação do
modelo conhecido como Holt Winters. A principal característica do TBATS está na pos-
sibilidade de acomodar múltiplas sazonalidades complexas. Como resultado, foi possível
modelar a série temporal com o TBATs mas a previsão enfrentou desafios de autocorrela-
ção nos resíduos da modelagem. Como os resíduos do modelo apresentaram um padrão
que indica alguma correlação, outras modelagens alternativas foram exploradas envol-
vendo manchas solares hemisféricas e o número de manchas solares suavizada em 13
meses.
Palavras-chave: TBATS; Manchas Solares; Séries temporais.

v
Lista de Figuras
1 Número de manchas solares ao decorrer dos anos desde de janeiro de
1900 até o abril de 2022. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Número de manchas solares ao decorrer dos anos desde de janeiro de
1900 até junho de 2022, suavizado em 13 meses. . . . . . . . . . . . . . . 4
3 Mothplot dos dados contagem de manchas solares. Os dados são as mé-
dias mensais feita entre janeiro de 1900 e abril de 2022. . . . . . . . . . . . 5
4 Gráfico da função de auto correlação dos dados de contagem de manchas
solares. Os dados são as médias mensais feita entre janeiro de 1900 e abril
de 2022. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
5 Gráfico da função de auto correlação dos dados sem tendência e sem a
sazonalidade de aproximadamente 10 anos. . . . . . . . . . . . . . . . . . 6
6 Histograma dos dados de contagem de manchas solares. Os dados são as
médias mensais feita entre janeiro de 1900 e abril de 2022. . . . . . . . . . 7
7 Boxplot dos dados de contagem manchas solares. Os dados são as médias
mensais feita entre janeiro de 1900 e abril de 2022. . . . . . . . . . . . . . 7
8 QQplot sob dados de contagem de manchas solares. Os dados são as
médias mensais feita entre janeiro de 1900 e abril de 2022. . . . . . . . . . 8
9 Decomposição da série temporal utilizando o modelo TBATS. . . . . . . . 13
10 Predição 1 ano a frente segundo o modelo TBATS juntamente com os en-
velopes de incerteza de 85% e 95% de confiança. . . . . . . . . . . . . . . 13
11 Resíduos resultantes da modelagem TBATS. . . . . . . . . . . . . . . . . . 14
12 Gráfico da FAC dos resíduos com o modelo sob dados mensais. . . . . . . 15
13 Teste de Ljung-Box para os resíduos sob dados mensais, os pontos em
vermelho, abaixo da linha pontilhada, refletem pontos que a hipótese de
normalidade não pode ser verificada com nível de significância igual ou
menor de 5%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
14 Decomposição da série temporal de dados mensais suavizados em 13 meses. 17
15 Resíduos do modelo sob os dados suavizados em 13 meses. . . . . . . . . 18
16 Teste de Ljung Box sob os resíduos do modelo sob os dados suavizados
em 13 meses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
17 FAC dos resíduos do modelo sob os dados suavizados em 13 meses. . . . 19
18 Previsão do modelo T BAT S(0, 473; {5; 2}; −; {12; 2; 120, 42; 6}) sob os da-
dos suavizados em 13 meses. . . . . . . . . . . . . . . . . . . . . . . . . . 19
19 Manchas solares por hemisférios do Sol. . . . . . . . . . . . . . . . . . . . 20
20 Decomposição da série de manchas solares hemisfério Norte. . . . . . . . 21
21 Decomposição da série de manchas solares hemisfério Sul. . . . . . . . . 21
22 Resíduos do modelo para o hemisfério Norte. . . . . . . . . . . . . . . . . . 22
23 Resíduos do modelo para o hemisfério Sul. . . . . . . . . . . . . . . . . . . 22
24 Resíduos resultantes do método de modelagem de forma cadenciada. . . . 23
*

vi
Lista de Quadros
1 Característica dos dados de contagem de manchas soalres. . . . . . . . . 8
2 Coeficientes do modelo T BAT S(1; {0, 3}; 0, 9362; {120, 42; 3}; {12; 1}) ajus-
tados pela a função do pacote TBATS da linguagem de programação R. . 12

vii
Sumário
1 Introdução 1

2 Análise exploratória da série temporal de manchas solares. 3

3 Metodologia Estatística 9

4 Aplicando o modelo TBATS nos dados 12


4.1 Modelagem e previsão sob série suavizada em 13 meses . . . . . . . . . . 17
4.2 Modelagem e previsão sob as manchas hemisféricas . . . . . . . . . . . . 20
4.3 Modelagem de forma cadenciada . . . . . . . . . . . . . . . . . . . . . . . . 23

5 Conclusão 24

viii
1 Introdução
Com a maior porção de massa de todo o sistema solar, o Sol é um dos corpos celestes
mais importantes do sistema. Quando se pensa em vida, tudo que conhecemos hoje de-
pende em grau do Sol. A percepção da importância do Sol vem de tempos remotos com
os gregos e outras civilizações associando-o a deuses. No caso de procurar observa-
ções científicas e mais modernas, pode-se dizer que Thomas Harriot foi um dos primeiros
a fazer tais observações, com o auxílio de um telescópio [Vasilyeva (2021)]. Ele notou
que existiam partes do Sol que eram mais escuras do que outras partes, tornando-se
provavelmente a primeira pessoa que observou diretamente manchas solares. Manchas
solares são regiões que aparecem no Sol devido a diversos processos magnéticos e tér-
micos. Em geral representam regiões no Sol que a temperatura ficou mais baixa do que
a temperatura do seu contorno daí aparentam serem mais escuras. As primeiras obser-
vações destas manchas são importantes para mostrar que o Sol é um corpo celeste com
comportamento dinâmico, visto que tais manchas aparecem e somem com o passar do
tempo.
Ao decorrer dos anos ficou claro que o registro de manchas solares poderia ser im-
portante. Principalmente após a percepção da sua relação com o fenômeno chamado
de Ejeção de Massa Coronal algo que levanta estudos até hoje [Ramesh (2010)]. Massa
coronal é a massa que se situa na ‘atmosfera superior do Sol’ conhecida como Corona.
Da Corona saem os chamados ventos solares que podem influenciar no clima do planeta
Terra. Como exemplo disso, no ano de 1859 diversos astrônomos, dentre eles Richard Ch-
ristopher Carrington, observaram um sinistro na atividade solar que viria a ser conhecido
como Evento Carrington. Este evento foi uma ejeção brutal de massa coronal que coli-
diu com o campo magnético da Terra algumas horas depois causando apagões, queima
de linhas telegráficas e auroras boreais de tamanhos raramente registrados [Hayakawa
et al. (2019)]. Esses fenômenos ocorrem o tempo todo, com diferentes intensidades e
podem causar problemas graves em equipamentos eletrônicos. Contudo, boa parte do
dano colateral é evitada por conta do campo magnético do planeta Terra.
Dada a correlação, um dos meios para prever possíveis picos da atividade solar é
monitorar o número de manchas solares. Assim sendo, o risco de um evento similar ao
registrado em 1859 se repetir e o perigo justificam tal monitoramento. Sobre as manchas,
hoje em dia sabemos que existe um efeito sazonal no registro delas e que a série é pra-
ticamente estacionária. Notoriamente sabemos que a sazonalidade costuma durar entre
9,5 a 14 anos e consideramos isto um ciclo solar. Os astrônomos registram manchas so-
lares com frequência a cerca de 2 séculos. Este registro serve como monitoramento para
possíveis sinistros como o Evento de Carrington. Normalmente tais dados são públicos e
podem ser obtidos em diferentes observatórios de destaque.
Quando pensamos em uma fonte de dados segura, podemos utilizar o banco de da-
dos fornecido pelo Observatório Real da Bélgica. Por meio do departamento Solar Influ-
ences Data analysis Center (SIDC) pode-se acessar dados de contagens da ocorrência
de manchas solares nos últimos séculos, incluindo diversas informações sobre os ciclos.
Os dados são fornecidos juntamente com a quantidade de observadores que notaram
aquela mancha e com erros de medição de contagem devido a observação de diferentes
observadores. Além disso, a anos os dados são diariamente coletados e armazenados.

1
Como diversos outros institutos e observatórios, o Observatório Real da Bélgica costuma
registrar dados e prever comportamentos futuros da série temporal de manchas solares.
Em particular, o Observatório Real da Bélgica fornece estas previsões com base em dife-
rentes formas, com destaque a técnica conhecida como filtro de Kalman [Podladchikova
(2012)]. Tal filtro é um método de previsão de séries temporais que apresenta resultados
muito robustos, consistentes e de altíssima qualidade. Apesar de apresentar resultados
bons esta técnica requer um nível elevado de compreensão de séries temporais, o que
pode limitar um pouco o seu entendimento para um público mais diversificado.
É possível encarar a ocorrência diária de manchas solares essencialmente como uma
série temporal e isto pode ser útil para comunicar os resultados para diversos pesquisado-
res de diferentes áreas. A variedade dos métodos de previsão de séries temporais e sua
devida exploração servem para apresentar o assunto para diferentes profissionais que
muitas vezes não compreendem o filtro de Kalman. Além disto, por se relacionar com um
fenômeno com elevado potencial de danos colaterais, é recomendável que busquemos
sempre previsões que sejam mais precisas, exatas e que sejam facilmente replicáveis.
O filtro de Kalman apresenta um resultado muito promissor (como pode ser explorado
no já citado site do SIDC e no [Podladchikova (2012)]) ao mesmo tempo que utiliza uma
matemática complexa para muitos pesquisadores.
Com esta colocações, o objetivo deste estudo é aplicar a abordagem envolvendo uma
adaptação de um modelo de amortecimento exponencial com dupla sazonalidade pro-
posta por [Taylor (2003)]. Essa adaptação é chamada de Box–Cox transform, ARMA er-
rors, Trend and Trigonometric Seasonal components(TBATS) feita por [Livera et al. (2011)].

2
2 Análise exploratória da série temporal de manchas so-
lares.
Nesta seção será feita uma análise exploratória da série temporal com o objetivo de
identificar sazonalidades, qualidade dos dados, nível e a existência ou não de tendências.
A Figura 1 apresenta o gráfico da série temporal de interesse. O intervalo de tempo que
será abordado nesta primeira parte do trabalho está entre janeiro de 1900 e abril de 2022.
Nesta Figura nota-se o padrão cíclico anteriormente indicado. Este gráfico apresenta o
número de manchas na escala de Wolf, que é uma padronização feita para reduzir o
viés de contagem de manchas solares em diferentes partes do mundo, por aparelhos
diferentes e em diferentes condições de observação.

Figura 1: Número de manchas solares ao decorrer dos anos desde de janeiro de 1900
até o abril de 2022.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

O site do SIDC1 indica as datas para os mínimos e máximos de cada ciclo. A tabela
apresenta o mês e o ano dos mínimos de cada ciclo, com base na série suavizada em
13 meses. Esta informação possibilita simplesmente calcular a duração média dos ciclos
entre o ciclo de número 14 até o ciclo de número 25 (que é aproximadamente o intervalo
de tempo abordado neste trabalho). Com isto é possível obter que cada ciclo dura em
média 10, 0347 anos com variância 1, 3369 anos2 . Reitero que os métodos de predição que
serão utilizados conseguem modelar séries com sazonalidades descritas com números
não inteiros. isto será adotado essa última sazonalidade de 10, 0347 anos para este ciclo
mais aparente na série temporal, por entender que diminuirá o viés nos modelos.
1
https://www.sidc.be/silso/cyclesminmax

3
Ainda no gráfico, é perceptível que os ‘picos de máximo’ apresentam um padrão bem
mais ruidoso do que os ‘vales de mínimos’. Isto provavelmente se traduzirá nos resí-
duos de um eventual modelo. Dificilmente será possível modelar adequadamente estas
oscilações. Para evitar esses problemas uma das técnicas utilizadas quando se estuda
manchas solares é fazer a média ponderada de 13 em 13 meses. Isto diminui a hetero-
cedasticidade, apesar de perder um pouco a informação local (Figura 2).

Figura 2: Número de manchas solares ao decorrer dos anos desde de janeiro de 1900
até junho de 2022, suavizado em 13 meses.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

O gráfico na Figura 3 é chamado Monthplot e separa os dados nos diferentes meses.


Ele indica que a série é estacionária e que existe ao menos um ciclo devido ao formato de
‘u’ invertido em todos os meses. A duração deste ciclo é claramente maior do que 1 ano.
Ao observar o gráfico da autocorrelação (FAC), apresentado na Figura 4, nota-se que o
ciclo parece durar entre 119 ∼ 135 meses, o que corrobora com a informação de que o
ciclo dura em média entre 9, 5 e 11 anos.

4
Figura 3: Mothplot dos dados contagem de manchas solares. Os dados são as médias
mensais feita entre janeiro de 1900 e abril de 2022.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 4: Gráfico da função de auto correlação dos dados de contagem de manchas


solares. Os dados são as médias mensais feita entre janeiro de 1900 e abril de 2022.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

5
Na FAC anual sem a tendência (Figura 5), é possível notar uma pequena sazonalidade.
Esta sazonalidade anual pode se referir a diferentes distribuições dos observadores na
Terra, o que influência na observação das manchas. Apesar dos dados estarem na escala
de Wolf para reduzir este efeito é possível que a coleta em localidades diferentes com di-
ferentes equipamentos e condições meteorológicas tenha alguma influência no resultado
de contagens, mesmo que ela seja mínima.

Figura 5: Gráfico da função de auto correlação dos dados sem tendência e sem a sazo-
nalidade de aproximadamente 10 anos.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Os gráficos histograma (Figura 6), boxplot (Figura 7) e o qqplot (Figura 8) dos dados
indicam que os dados não são normalmente distribuídos. Pelo boxplot se nota que há
presença de outliers acima da cauda superior.
Além das informações acima, por considerar que o próprio dado é coletado de forma
sazonal todos os dias do ano e ainda, a distribuição de telescópios ao redor da Terra não é
homogênea, foi decidido colocar mais uma sazonalidade para o ano, de 12 meses. Apesar
dos dados na escala de Wolf reduzirem bastante os problemas citados acima, partiu-se
da hipótese que a inserção da sazonalidade poderia contribuir positivamente na redução
da incerteza na modelagem. Os dados armazenados pelo observatório apresentam uma
incerteza devido a ser uma média da quantidade de manchas solares contabilizadas di-
ariamente por diferentes observadores. Inicialmente para facilitar a implementação do
modelo não foi considerada esta incerteza na medição.

6
Figura 6: Histograma dos dados de contagem de manchas solares. Os dados são as
médias mensais feita entre janeiro de 1900 e abril de 2022.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 7: Boxplot dos dados de contagem manchas solares. Os dados são as médias
mensais feita entre janeiro de 1900 e abril de 2022.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

7
Figura 8: QQplot sob dados de contagem de manchas solares. Os dados são as médias
mensais feita entre janeiro de 1900 e abril de 2022.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Quadro 1: Característica dos dados de contagem de manchas soalres.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

EstatÍstica Valor
MÍnimo 0, 00
Primeiro quartil 24, 25
Mediana 69, 75
Média 85, 33
Terceiro quartil 131, 53
Máximo 359, 40

8
3 Metodologia Estatística
Nesta etapa do trabalho, será apresentado o processo de modelagem e previsão uti-
lizando o TBATS cujo artigo de origem é [Livera et al. (2011)]. Este modelo é uma ge-
neralização do Holt Winters, a generalização se reflete no fato deste modelo acomodar
múltiplas sazonalidades(incluindo sazonalidades descritas com números decimais).
Inicialmente, a suposição de duas sazonalidade nos remeteria ao Double Seasonal
Holt Winters [Taylor (2003)] em detrimento do Holt Winters tradicional. Apesar disso, ana-
lisando a série temporal nota-se mais características que impossibilitam utilização deste
método, dentre elas pode-se destacar:

• Sazonalidades Complexas: Como já dito, a sazonalidade do fenômeno não é um


número inteiro. A componente de sazonalidade é a referente ao próprio ciclo solar
dura em média de 10, 0347 anos devido a média anual escolhida.

• O dado contém zeros: Em determinados períodos/meses o Sol está tão sereno que
não se nota nenhuma mancha solar. Por se tratar de uma contagem, não existem
valores negativos no dado. Isto poderia ser resolvido simplesmente acrescentando
1 em todos os totais mensais. Seria como se tivéssemos aplicando uma transfor-
mação no dado e, ao invés de trabalhar com o total médio mensal, estaríamos tra-
balhando com o total médio mensal mais um. Contudo, não há interesse em alterar
o dado com uma transformação.

Os pontos citados justificam a implementação e utilização do modelo TBATS. Para


explicar este modelo primeiramente vamos apreciar o Holt Winters Double Seasonal, que
é escrito da seguinte forma:
(1) (2)
yt = ℓt−1 + bt−1 + st + st + dt
ℓt = ℓt−1 + bt−1 + αdt
bt = bt−1 + βdt
(1) (1)
st = st−m1 + γ1 dt
(2) (2)
st = st−m2 + γ2 dt

Onde yt são os valores observados; m1 e m2 são os períodos da série; dt é o resíduo,


espera-se que o mesmo seja parte de uma amostra aleatória de um ruído branco; lt é
o nível; bt é a tendência e as constantes (α, β, γ) são constantes de amortecimento. Os
autores no artigo já citado [Livera et al. (2011)] criaram os modelos chamados de BATS e
o TBATS. A grandes diferenças do BATS com o Holt Winters Double Seasonal é a incor-
poração de uma transformação Box-Cox sob os dados e alteraram o resíduo resultante
do Holt Winters Double Seasonal, dt , de forma a seguir um ARMA(p,q) cujo o resultado é:

9
{ ytω −1
(ω) ,ω≠ 0,
yt = ω
log yt , ω = 0,
(ω)

T
(i)
yt = ℓt−1 + ϕbt−1 + st−mi + dt ,
i=1
ℓt = ℓt−1 + ϕbt−1 + αdt
bt = (1 − ϕ)b + ϕbt−1 + βdt
(i) (i)
st = st−mi + γi dt ,

p

q
dt = φi dt−i + θi εt−i + εt
i=1 i=1
(ω)
Onde yt são os valores transformados; m1 , ..., mt são os períodos sazonais da série;
dt ∼ ARM A(p, q); εt é o resíduo, espera-se que seja proveniente de um ruído branco com
média zero e variância σ 2 ; lt é o nível local; b é a tendência global; bt é a tendência no
período t; α, β e γi para i = 1, ..., T são constantes de amortecimento. Observe que o
método BATS suporta múltiplas sazonalidades. Ao considerar a estrutura do modelo, isto
implica que o BATS é uma generalização dos Holt Winters mais tradicionais. Já o TBATS
é um modelo muito similar ao BATS com uma pequena alteração, no TBATS supõe-se que
as sazonalidades sejam combinações lineares de funções trigonométricas no formato:

(i)

ki
(i)
st = sj,t
j=1
(i) (i) (i) ∗(i) (i) (i)
sj,t = sj,t−1 cos λj + sj,t−1 sin λj + γ1 dt
∗(i) (i) ∗(i) (i) (i)
sj,t = −sj,t−1 sin λj + sj,t−1 cos λj + γ2 dt ,
Para transformar um BATS em um TBATS alteramos as equação da sazonalidade do
modelo BATS e, para cada sazonalidade que desejamos adicionar, adicionamos estas três
equações acima (no nosso caso são duas uma de 12 meses e outra de 10, 0347 anos). Por
(i) (i)
um lado adicionamos mais constantes para estimar ( ki ,γ1 e γ2 para cada sazonalidade
que deseja-se estimar). Por outro lado a grande vantagem do TBATS sob o BATS é o ga-
nho em algebrismo por trabalhar com séries de fourier para cada sazonalidade. As novas
constantes para estimar são: ki é o número de componentes trigonométricas para cada
série de fourier; Os γ’s originais do BATS são trocados por dois novos gamas para cada
(i) (i)
sazonalidade (γ1 , γ2 ). Assim como um ARM A(p, q), um TBATS pode ser representado
da seguinte forma: T BAT S (ω, ϕ, p, q, {m1 , k1 } , {m2 , k2 } , . . . , {mT , kT }).
A estimação do modelo TBATS vem das equações abaixo conhecidas como equação
de estado [Anderson and Moore (2012)] e do tratamento da função de log verossimilhança,
buscando sua maximização após ser ajustada sob os dados e sob as informações forne-
cidas apriori [Hyndman and Khandakar (2008) e [Livera et al. (2011)].

yt = w′ xt−1 + εt ,
(ω)

xt = Fxt−1 + gεt ,

10
Onde xt é o vetor de estado do sistema no instante t, definido como:
( )′
(1) (T )
xt = ℓt , bt , st , . . . , st , dt , dt−1 , . . . , dt−p+1 , εt , εt−1 , . . . , εt−q+1
(
(i) (i) (i) (i) ∗(i) ∗(i) ∗(i)
Com st igual a s1,t , s2,t , . . . , ski ,t , s1,t , s2,t , . . . ski ,t )
A variável F é uma matriz, definida por:( )
(i) (i) (i) (i) (i) (i) ( )
Seja, γ 1 = γ1 1ki , γ 2 = γ2 1ki , γ (i) = γ 1 , γ 2 , γ = γ (1) , . . . , γ (T ) , φ = (φ1 , φ2 , . . . , φp ),
e θ = (θ1 , θ2 , . . . , θp ); seja Ou,v uma matriz de zeros u×v e Iu,v uma matriz retangular ( (1) com 1)
nos elementos da diagonal. Seja, a = (1ki , 0ki ) e a = (1ki , 0ki ) and a = a , . . . , a(T )
(i) (i)

B = γ ′ φ, C = γ ′ θ assim a matriz F fica:


 
1 ϕ 0τ αφ αθ
 0 ϕ 0τ βφ βθ 
 ′ 
 0τ 0 ′
A B C 
 τ 
F=  ′0 0 0τ φ θ 
 0p−1 0′p−1 Op−1,τ Ip−1,p Op−1,q 
 
 0 0 0τ 0p 0q 
0′q−1 0′q−1 Oq−1,τ Oq−1,p Iq−1,q
Com [ ] [ ]
C(i) S(i) 0mi −1 1 ⊕
Ai = , Ãi = ′ , A = Ti=1 Ai
−S (i)
C (i)
Imi −1 0mi −1
Todas essas quantidades acima podem ser obtidas na estimação do modelo a partir da
função de log verossimilhança. Isto fica muito bem documentado no artigo já citado [Livera
et al. (2011)]. Seguindo por este caminho conseguimos obter as seguintes equações de
previsão:
( )
E yn+h|n = w′ Fh−1 xn
(ω)

,
{
( ) σ 2 ,[ if h = 1,
(ω)
∑h−1 ]
V yn+h|n =
σ 2
1+ 2
j=1 cj , if h ≥ 2,
Tal que:

w = (1, ϕ, a, φ, θ)′

cj = w′ Fj−1 g

g = (α, β, γ, 1, 0p−1 , 1, 0q−1 )′

11
4 Aplicando o modelo TBATS nos dados
Nesta seção será apresentada a aplicação do modelo TBATS sob os dados de inte-
resse. A estimação do modelo foi configurada com duas sazonalidades, uma de 10, 0347
anos e outra de 12 meses. Com isso pode-se escrever o TBATS associado. No Qua-
dro 2 tem-se os coeficientes estimados pelo modelo. Como comentado anteriormente os
coeficientes estimados são obtidos ajustando o modelo segundo a log verossimilhança.
Na Figura 9 pode-se ver a decomposição dos dados seguindo o modelo. Sobre essa
decomposição nota-se os seguintes pontos:
• Nível: Nota-se um breve aumento ao longo dos anos que se sobrepõe ao período
de 10, 0347 anos porem este aumento não é muito impactante.
• Tendência: Pode-se notar que, considerando a escala dos dados, que a tendência
é praticamente nula. O que reforça a ideia de que a série é estacionária.
• Sazonalidades: S1 e S2 são as sazonalidades de 12 meses e de 10, 0347 anos res-
pectivamente. Nota-se que o modelo captou as duas sazonalidades, no entanto
também é possível notar que a sazonalidade de 12 meses afeta muito pouco o
dado(visto a escala que ela apresenta) em comparação com a sazonalidade de
10, 0347 anos. É perceptível que a sazonalidade de 10, 0347 anos apresenta uma
subida muito mais rápida do que as decidas, reforçando o que foi indicado durante
a análise descritiva da série.

Quadro 2: Coeficientes do modelo T BAT S(1; {0, 3}; 0, 9362; {120, 42; 3}; {12; 1}) ajusta-
dos pela a função do pacote TBATS da linguagem de programação R.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Coeficientes do modelo, T BAT S(1; {0, 3}; 0, 9362; {120, 42; 3}; {12; 1})
ω 1
m12 meses 12
k12 meses 1
m10,0347 anos 120, 42
k10,0347 anos 3
α 0, 1612
β 0, 0242
ϕ 0, 9362
γ1 0, 0012 0, 0011
γ2 −0, 0011 −0, 0035
AR(p = 0)
M A(q = 3) 0, 3950 0, 1161 0, 0113

Na Figura 10 é possível ver a previsão de 1 ano à frente. Tal resultado é bem coerente
com o fato de o ciclo durar de 9,5 a 11 anos e o fato do ciclo de número 25(ciclo atual) ter
começado por 2019.

12
Figura 9: Decomposição da série temporal utilizando o modelo TBATS.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 10: Predição 1 ano a frente segundo o modelo TBATS juntamente com os envelo-
pes de incerteza de 85% e 95% de confiança.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Como no modelo TBATS os dt são observações de um modelo ARM A(p, q) deve-se


verificar se o conjunto dos resíduos deste modelo aparenta ser uma amostra aleatória de

13
um ruído branco centrada em zero e com variância σ 2 . Na Figura 11 podemos ver que,
como previsto durante a analise exploratória, os resíduos ainda aparentam apresentar
alguma estrutura, visto que o gráfico dos resíduos apresenta um comportamento de ba-
timentos muito característico. Com a Figura 12 podemos verificar a autocorrelação entre
os resíduos seguindo os lag de interesse, em particular as auto correlações entre os re-
síduos do modelo com diferença de lags de 24 e 25 são bem elevadas. Além disto, para
além da auto correlação, quando verificamos o teste de normalidade para os 50 primeiros
lags, nota-se que nem todos os lags confirmam a hipótese de normalidade proposta por
Ljung-Box. Na Figura 13 abaixo, todos os pontos abaixo da linha pontilhada vermelha
representam os lags que a partir do qual se rejeita a hipótese nula de normalidade con-
siderando um p-valor de 0, 05. Talvez esse problema tenha relação com o fato que não
ser considerado a incerteza original do dado, como descrito na parte da motivação, os
dados diários são coletados de diferentes observadores e se faz uma média do número
de observações registrados no dia. A média mensal vem desta média diária, logo também
é um dado com uma incerteza associada.

Figura 11: Resíduos resultantes da modelagem TBATS.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Os resultados indicam que o modelo é bom para previsões até no máximo de 23 lags,
aproximadamente 2 anos. Contudo, como o gráfico dos resíduos pode indicar algum pa-
drão (Figura 11), isso é um problema para o modelo. Quando se usa o TBATS é esperado
que os resíduos sejam uma amostra aleatória de um ruído branco, porém, este padrão
confronta esta hipótese. Para tentar resolver esse problema mantendo o modelo TBATS,
diferentes abordagens foram tentadas, como:

• Executar um TBATS considerando 13 meses suavizados e verificar o resultado. São


13 meses centrados, o que é uma tática da comunidade para reduzir as variações

14
Figura 12: Gráfico da FAC dos resíduos com o modelo sob dados mensais.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 13: Teste de Ljung-Box para os resíduos sob dados mensais, os pontos em verme-
lho, abaixo da linha pontilhada, refletem pontos que a hipótese de normalidade não pode
ser verificada com nível de significância igual ou menor de 5%.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

15
pontuais da série temporal de manchas solares.

• Construir um modelo TBATS para cada uma das séries temporais de manchas sola-
res hemisféricas. Estas manchas são simplesmente as manchas solares separadas
por hemisférios.

• Executar Uma previsão um pouco mais ”cadenciada”, modelando um TBATS apenas


com a sazonalidade de 12 meses e, sob os resíduos deste novo modelo, executar
um segundo TBATS apenas com a sazonalidade de 10, 0347 anos. O problema de
executar isto é que não teríamos como encontrar os envelopes de incerteza corre-
tamente. No entanto poderia servir para verificar se os resíduos continuariam se
comportando de forma problemática.

A seguir será descrito os resultados para cada uma dessas 3 abordagens alternativas.

16
4.1 Modelagem e previsão sob série suavizada em 13 meses
Suavizar em 13 meses de forma centralizada faz com que seja perdido 6 meses de
cada uma das extremidades da série temporal. Para compensar esta perca, nesta etapa
do trabalho utilizou-se dados entre janeiro de 1900 e junho de 2022. Com isso é possível
obter dados até dezembro de 2021, levando-se em conta a perda das extremidades. O
modelo foi construído novamente com as mesmas sazonalidades, uma para 12 meses e
outra para 10, 0347 anos. A decomposição deste TBATS está em Figura 14, o modelo é
T BAT S(0, 473; {5; 2}; −; {12; 2; 120, 42; 6}). Como resultado da suavização em 13 meses,
podemos notar que a sazonalidade anual praticamente é anulada. A tendência da série
se torna praticamente nula, com menos importância do que na série temporal original. A
sazonalidade de 10, 0347 anos apresenta um efeito mais reduzido.
Neste caso essas características podem indicar que a série temporal não pode ser mo-
delada adequadamente com esta configuração(com essas sazonalidades) no TBATS sob
os dados suavizados. Analisando a decomposição novamente, vemos que a informação
coletada pelo o modelo está principalmente agregada apenas no nível, as sazonalidades
e a tendência não parecem ter tanta relevância pois elas não representam uma grande
variação quando comparamos ela com a escala dos dados.

Figura 14: Decomposição da série temporal de dados mensais suavizados em 13 meses.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Analisando o resíduos dessa série Figura 15 visivelmente apresenta um comporta-


mento aparentemente melhor, com menos padrões, do que o resíduo para o modelo com
a série temporal original. Contudo, ao analisar o teste de Ljung Box (Figura 16), nota-se
que mesmo para lags muito pequenos o teste aponta para a hipótese de não ser uma
amostra aleatória de um ruído branco. Este resultado é confirmado pela FAC apresen-
tada na Figura 17. Na Figura 18 apresentamos o resultado da previsão da série para os

17
próximos meses.

Figura 15: Resíduos do modelo sob os dados suavizados em 13 meses.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 16: Teste de Ljung Box sob os resíduos do modelo sob os dados suavizados em
13 meses.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

18
Figura 17: FAC dos resíduos do modelo sob os dados suavizados em 13 meses.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 18: Previsão do modelo T BAT S(0, 473; {5; 2}; −; {12; 2; 120, 42; 6}) sob os dados
suavizados em 13 meses.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

19
4.2 Modelagem e previsão sob as manchas hemisféricas
A segunda alternativa é abordar o problema a partir de manchas solares hemisféricas.
Obtemos acesso ao registro desse tipo de mancha solar a partir de janeiro de 1992, como
pode ser consultado na nota de rodapé2 . Nesta parte do trabalho utilizou-se médias men-
sais entre janeiro de 1992 e junho de 2022. Na Figura 19 é possível ver a representação
das séries temporais para o hemisfério norte e sul do Sol. É perceptível que algumas
variações nos picos, que na série temporal original causavam certa confusão, nesta série
estão divididas entre as duas séries temporais distintas, o que visualmente indica séries
temporais menos ruidosas do que a original(por exemplo o pico próximo a 2012∼ 2013).
Apesar disso, o problema desses dados é que como eles são registrados a partir do ano
de 1992 existem poucos dados sazonais para executar estimativas da sazonalidade de
10, 0347 anos. Isso se reflete nos modelos em que, apesar de inicialmente introduzirmos
as sazonalidades para iniciar a estimativa, o algoritmo deduz que a menor perda de in-
formação (critério de AIC) se dá quando remove-se as sazonalidades (Figuras 20 e 21).
Além disto, infelizmente, quando verificamos os resultados dos resíduos percebemos que
não conseguimos remover a estrutura de batimentos nos resíduos (Figuras 22 e 23). Isso
indica esta abordagem não solucionaria o problema que buscávamos resolver.

Figura 19: Manchas solares por hemisférios do Sol.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

2
https://www.sidc.be/silso/infosnmhem

20
Figura 20: Decomposição da série de manchas solares hemisfério Norte.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 21: Decomposição da série de manchas solares hemisfério Sul.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

21
Figura 22: Resíduos do modelo para o hemisfério Norte.
Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

Figura 23: Resíduos do modelo para o hemisfério Sul.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

22
4.3 Modelagem de forma cadenciada
A última alternativa que visamos não permitiria executar previsões, pois as incertezas
das previsões seriam desconhecidas. Aplicou-se esta alternativa para verificar se seria
possível retornar resíduos mais simples e coerentes com o que era esperado para um
ruído branco. Esta abordagem poderia também indicar novos caminhos. A chamada
’modelagem de forma cadenciada’ seria feita da seguinte forma:

1. Sobre os dados de médias mensais entre janeiro de 1900 e abril de 2022, modelar
um TBATS apenas com a sazonalidade de 12 meses.

2. Sob os resíduos deste modelo anterior construir um TBATS apenas com a sazona-
lidade de 10, 0347 anos.

Ao fazer isto o objetivo era simplesmente verificar o padrão do resíduo final. Pois, após
aplicar as duas etapas de modelagem, talvez o padrão de batimento fosse removido. Com
isso, segue o gráfico dos resíduos (Figura 24) deste método e fica perceptível que esta
modelagem alternativa não resolvera o problema.

Figura 24: Resíduos resultantes do método de modelagem de forma cadenciada.


Fonte: Elaboração do autor com base nos dados do WDC-SILSO, Observatório Real da
Bélgica, Bruxelas.

23
5 Conclusão
O objetivo inicial deste trabalho era tentar modelar e prever manchas solares por méto-
dos alternativos dos que já são utilizados. Devemos levar em conta que a série, apesar de
interessante, possui um comportamento que é difícil de modelar. As reiteradas tentativas,
todas envolvendo modelo TBATS, infelizmente não retornaram um resultado completa-
mente satisfatório. O principal problema foi relacionado aos resíduos que indicavam uma
estrutura diferente de uma amostra aleatória de um ruído branco. Esta estrutura apenas foi
parcialmente removida no modelo envolvendo dados suavizados em 13 meses e mesmo
nesta abordagem um estudo da FAC indica que existe alguma autocorrelação para lags
pequenos, que não conseguimos remover. Apesar da utilização do TBATS ser muito rica
e normalmente conseguir capturar muitos detalhes, neste caso isto não foi possível.
Nas tentativas de melhoria dos resultados encontrados foi percebido que ao conside-
rar a estrutura do modelo TBATS nota-se que ele apresenta um modelo ARM A(p, q) sob
os resíduos do Holt Winters tradicional. Outra alternativa seria utilizar uma equação de
batimentos, no lugar da equação deste ARM A(p, q). Para se fazer isso seria necessário
modificar a equação de estado e as equações de previsão do modelo. Outra possível
alternativa seria utilizar os conhecidos modelos ARCH [Engle and Engle (1995)] ao invés
deste modelo ARM A(p, q). A abordagem com ARCH teria potencial de captar os resulta-
dos que encontramos no resíduo final.
Apesar do resultado ter limitações, um estudo como esse é importante uma vez que
revendo a bibliografia não foi possível encontrar uma modelagem envolvendo TBATS e
manchas solares.

24
Referências
Anderson, B. and Moore, J. (2012). Optimal filtering dover books on electrical engineering.

Engle, R. and Engle, C. (1995). ARCH: Selected Readings. Advanced texts in econome-
trics. Oxford University Press.

Hayakawa, H., Ebihara, Y., Willis, D. M., Toriumi, S., Iju, T., Hattori, K., Wild, M. N., Oli-
veira, D. M., Ermolli, I., Ribeiro, J. R., Correia, A. P., Ribeiro, A. I., and Knipp, D. J.
(2019). Temporal and spatial evolutions of a large sunspot group and great auroral
storms around the carrington event in 1859. Space Weather, 17(11):1553–1569.

Hyndman, R. J. and Khandakar, Y. (2008). Automatic time series forecasting: The forecast
package for r. Journal of Statistical Software, 27(3):1–22.

Livera, A. M. D., Hyndman, R. J., and Snyder, R. D. (2011). Forecasting time series
with complex seasonal patterns using exponential smoothing. Journal of the American
Statistical Association, 106(496):1513–1527.

Podladchikova, T. ; Van der Linden, R. (2012). A kalman filter technique for improving
medium-term predictions of the sunspot number. Solar Physics, 277:397–416.

Ramesh, K. B. (2010). Coronal mass ejections and sunspots-solar cycle perspective. The
Astrophysical Journal Letters, 712:77–88.

Taylor, J. W. (2003). Short-term electricity demand forecasting using double seasonal


exponential smoothing. Journal of the Operational Research Society, 54(8):799–805.

Vasilyeva, Irina ; Pishkalo, M. (2021). History of sunspot research and forecast of the
maximum of solar cycle 25. Kinematics and Physics of Celestial Bodies, 37:200––211.

25

Você também pode gostar