Você está na página 1de 6

CÁLCULO DE ANOMALIAS NA PESQUISA CLIMÁTICA: USOS E ABUSOS

Airton Fontenele Sampaio Xavier (1) e Teresinha de Ma. Bezerra S. Xavier


(1) Prof. do Curso de Mestrado em Ciência da Computação e no Departo. de Estatística e Matemática
Aplicada / UFC, através do PROPAP-UFC – da Academia Cearense de Ciências
R. Oswaldo Cruz 176/400 (Meireles), CEP: 60.125-150 Fortaleza-CE--BRASIL
Fone: (085) 242.3702 · e-mail: txavier@sec.secrel.com.br CC: atxavier@lia.ufc.br

ABSTRACT: In the context of the climatic research, when series of geophysical data (meteorological,
oceanographic, etc.) carrying seasonal variabilities are compared among themselves, as it is the case of
sequences of monthly observations, it turns frequently necessary to make a previous calculation of their
anomalies. That allows to eliminate spurious correlations due to the presence of the seasonal cycles in
the data. In general the professionals of those areas are already alerted for such problem, early
acquiring the habit of systematically working with the anomalies instead of the original data. Even
when that would be absolutely unnecessary. And what is more serious, also in situations where that
practice can come to distort the analyses. This presentation it is destined to illuminate several pertinent
aspects to the subject.
PALAVRAS-CHAVE: Anomalias; Desvios Padronizados; Ciclos; Regressão; Vento; ZCIT

1. INTRODUÇÃO
Entre séries de observações contendo ciclos sazonais costumam aparecer correlações elevadas,
em valor absoluto, por vezes alcançando altos níveis de significância. Embora, a rigor, possam ser
consideradas espúrias, por triviais e assim desprovidas de qualquer interesse prático ou teórico para
finalidades da previsão ou da análise climática.
Uma forma de expurgar tais correlações espúrias consiste na substituição dos dados numéricos
originais por suas “anomalias”, procedimento hoje padrão na literatura em Climatologia e áreas afins.
A ponto de ser corrente que os pesquisadores trabalhem exclusivamente com “anomalias”, mesmo
quando essa precaução de fato é desnecessária. Com o agravante de em alguns casos constituir abuso
imperdoável, em especial se implicar numa distorção de resultados e análises. O motivo de tal uso
indiscriminado decorre do desconhecimento dos fundamentos do Cálculo de Probabilidades e da
Estatística Matemática e, consequentemente, de uma utilização desavisada dos conceitos subjacentes.
Por outro lado, o advento dos computadores, se de uma parte veio permitir a execução de tarefas
de cálculo numérico e/ou estatístico antes impraticáveis, também conduziu a que essas máquinas
também passassem a ser usadas de forma por vezes um tanto irrefletida, sem o devido aprofundamento
sobre a natureza dos métodos ou dos algorítmos envolvidos.
2. DISCUSSÃO DO PROBLEMA
2.1 O CONCEITO DE ANOMALIA
Vamos nos restringir ao caso de variáveis aleatórias de expressão mensal. Ora, se X é uma tal
variável, os valores por ela assumidos poderão ser representados por X im , onde i = 1,2,...,M (ano) e m
= 1,2,..., 12 (mês). Obviamente, estamos supondo dispor de observações ao longo de um período de M
anos, donde o número total de dados numéricos será N = 12 M. Poderemos, então, calcular : 1) a
média X m e a variância Vm (e o desvio padrão S m  V m ) em cada mês m = 1,2,...,12 , que se
definem da forma usual. Poderíamos, decerto, considerar a oportunidade para introduzir um terceiro
índice k, situação que fica em jôgo quando a variável descreve um campo climático (meteorológico,
oceânico, etc.) distribuído conforme as várias localizações geográficas ou “pontos de grade” (o índice
k identificaria cada uma dessas localizações ou nós da grade). Assim, também calcularíamos : 3) a
anomalia com respeito à variável X , para cada mês m , ano i e também se for o caso, para cada
localização ou ponto k, isto é :  i, m (k) = X i , m (k) - X m (k) .
Note-se que a "anomalia" mede o "desvio" do valor observado com respeito à sua média
climática ou histórica. Pode-se, decerto, também trabalhar com o respectivo “desvio padronizado”.
2
2.2 QUANDO É IMPRESCINDÍVEL TRABALHAR COM “ANOMALIAS” ?
O conceito de "anomalia" é fundamental, no caso de se querer explicar uma dada variável Z a
partir de outra variável X , se ambas estão submetidas a variabilidades de carácter sazonal, ou seja,
ligadas ao curso das estações do ano. Isso geralmente se verifica quando os dados numéricos têm
expressão mensal . Nas duas figuras seguintes temos reproduzida graficamente a relação entre duas
variáveis identificadas como “bleu” (azul) e “rouge” (vermelho), cada uma exibindo um ciclo sazonal
nítido (são variáveis “fictícias”, construídas para ilustrar a questão que discutimos). A Figura 1 é
montada com os valores supostos originais e a Figura 2 com as anomalias.

V A L O R E S O R IG IN A IS ro u g e A N O M A L IA S a ro u g e
b le u a b le u

100 50

30
75

10
50
-1 0

25 -3 0

0 -5 0
0 12 24 36 48 0 12 24 36 48

Figura 1 Figura 2

Note-se que na Figura 1 , tanto “bleu” como “rouge” exibem variacões sazonais que se casam.
Tanto assim, que ao se calcular a correlação entre as duas variáveis, obtem-se R = 0,61. A
probabilidade de êrro é p=0,0000; donde ser esta correlação altamente significativa (embora baixa a
2
explicação da variância, R  37%). À primeira vista, poder-se-ia pensar que “bleu” servisse para
explicar “rouge”, ou vice-versa. Contudo, examinando mais detidamente a figura, denota-se que : 1)
no “primeiro” ano os dois gráficos evoluem muito próximos, entre si ; 2) no “segundo” e no “quarto”
anos, “rouge” supera “bleu”; 3) já no “terceiro” ano, é “bleu” que supera “rouge”. Portanto, constata-
se que “bleu” possui um papel medíocre para a explicação de “rouge” (ou vice-versa). Passemos,
então, a considerar os gráficos das anomalias para “bleu” e “rouge”, na Figura 2 . Conforme se percebe
fica agora revelado, de fato, o medíocre poder explicativo da cada variável com relação à outra. Com
efeito, o coeficiente de correlação entre as anomalias é R = 0,11 e a probabilidade de erro p=0,4519; ou
seja, tem-se uma correlação muito baixa e estatisticamente não significativa. Em tais condições, pois, é
absolutamente necessário sejam sempre consideradas as anomalias, para expurgar a sazonalidade.
2.3 OUTRAS SITUAÇÕES EM QUE O EMPRÊGO DE “ANOMALIAS” É INDICADO
Não fazeremos levantamento exaustivo de outras situações em que empregar “anomalias” se
torna conveniente ou aconselhável. Um caso típico, bem conhecido, é quando se trabalha com um
campo, sobre uma grade. Por exemplo, o de temperaturas da superfície do mar na bacia do Atlântico
(digamos, entre 30 N e 30 S). Assim, ao representar as anomalias das temperaturas, uma inspeção do
mapa respectivo permite claramente identificar as áreas que num dado período de tempo estejam mais
frias (ou mais quentes) do que as normais climáticas nessas áreas. A tempo, lembramos outra
indicação, que é na aplicação de modelos de Análise Multivariada; quando, com freqüência, é
recomendável previamente transformar as variáveis mediante o cálculo de “anomalias” ou, mesmo, de
“desvios ou anomalias padronizadas”. É claro que a transformação a ser escolhida, em tal caso,
depende das intenções do pesquisador e do tipo de resultado que pretende obter. Não se discute tal
questão pois exigiria mais tempo e uma análise à luz da sua fundamentação teórica, ou seja, da Análise
Linear.
2.4 ”ANOMALIAS” NO CONTEXTO DOS MODELOS DE REGRESSÃO
Temos o costume, ao utilizarmos Modelos Lineares (Regressão Múltipla Clássica ou Modelos
Lineares Generalizados) de não necessariamente submeter a variável resposta (a explicar ou a prever) e
as covariáveis envolvidas (explicativas ou preditivas), a transformações prévias (mediante o cálculo de
“anomalias” ou de “anomalias padronizadas”). Aliás, pessoas desavisadas chegaram a nos chamar a
3
atenção a esse respeito, acreditando que estivéssemos incorrendo num êrro! De fato nesse caso, a rigor,
é inútil ou contra-producente tal cuidado: 1) por conduzir a desnecessário tempo de processamento
(com o cálculo das anomalias); 2) por os resultados se expressarem em termos das anomalias previstas
e não dos valores da variável independente (por exemplo a chuva medida em milímetros), mas que é o
que nos interessaria mais diretamente. Ademais, num caso e outro, mostraremos como os dois
modelos de regressão obtidos são inteiramente equivalentes, isto é, seja trabalhando com os valores
originais das variáveis, seja com suas anomalias. Não procede a alegativa de que autoridades
internacionais na área climática exigem o emprego sistemático de “anomalias”. Isso somente comprova
como o desconhecimento dos fundamentos teóricos da Estatística Matemática não é apanágio apenas
de nós, brasileiros ... Na verdade, vale o seguinte resultado teórico :

PROPOSIÇÃO Consideremos a equação de regressão Z = A + B1 X1 + B2 X2 + ... + BC


xC +  para os dados originais (não transformados) e a equação análoga para o caso das
anomalias (com letras minúsculas ) : z = a + b1 x + b2 x + ... + bC x +  ; bem como,
1 2 C

R e r os coeficientes de correlação entre os valores observados e os valores previstos, com


2 2
respeito aos dois modelos ( R  100% e r  100% são os respectivos porcentuais de
1
explicação da variância ). Aqui, temos uma variável a prever Z e covariáveis preditivas X ,
X2, ... ,XC . Então: (i) a = 0; (ii) bj = Bj (c=1,...,C); (iii) r = R e r2 = R2 .

Demonstração – Omite-se. Basicamente, utilizar-se-ia a propriedade de que a covariância entre


duas variáveis aleatórias quaisquer e entre suas anomalias, são sempre iguais, o que se estende para
matrizes de covariâncias ! Passamos então, simplesmente, a apresentar um exemplo.

Exemplo

a) Com os valores originais de : FORS1 = chuva acumulada em Fortaleza-CE no primeiro


1
semestre, em milímetros ; e as covariáveis X = TSMBR6 = TSM média na área B do Atlântico Sul,
2
adjacente à costa da África, em OC, e X = WOLFR6 = atividade solar em termos do índice de Wolf ,
ambas no Bimestre 6 (Novembro-Dezembro) do ano anterior. Então, temos as seguintes saídas :

Modelo para o ajuste de : Z = FORS1 ; Modelo Linear : A + BX1 + CX2


--------------------------------------------------------------------------
variáveis independentes coeficientes erro padrão t p
--------------------------------------------------------------------------
CONSTANT A = -1.236522E4 2761.936596 -4.4770 0.0001
TSMBR6 B = 605.119424 118.096495 5.1239 0.0000
WOLFR6 C = -4.801512 0.945859 -5.0764 0.0000
--------------------------------------------------------------------------
2 2
R = 65,4% (R ajustado = 63,0% )

Análise de Variância para a Regressão


-----------------------------------------------------------------
Origem Soma de quadrados GDL Média Qd. F p
-----------------------------------------------------------------
Modelo 4583696. 2 2291848. 27.3497 0.0000
Erro 2430143. 29 83798.1
-----------------------------------------------------------------
Total (Corr.) 7013839. 31
2 2
R = 0.653522 R ajustado = 0.629627
Outros resultados da ANOVA para as Variáveis
-----------------------------------------------------------------
Origem Soma de Quadrados GDL Média Qd. F p
-----------------------------------------------------------------
TSMBR6 2424273.05 1 2424273.0 28.93 0.0000
WOLFR6 2159422.68 1 2159422.7 25.77 0.0000
-----------------------------------------------------------------
4
Modelo 4583695.72 2

b) Com as “anomalias” respectivas (o prefixo A indica “anomalia”) :

Modelo para o ajuste de : z = AFORS1 ; Modelo Linear : a + bx1 + cx2


--------------------------------------------------------------------------
variáveis independentes coeficientes erro padrão t p
--------------------------------------------------------------------------
CONSTANTE a = 0  4.128867E-12 51.173129 0.0000 1.0000
ATSMBR6 b = 605.119424 118.096495 5.1239 0.0000
AWOLFR6 c = -4.801512 0.945859 -5.0764 0.0000
--------------------------------------------------------------------------------
2 2
R = 65,4% (R ajustado = 63,0% )

Análise de Variância para a Regressão


------------------------------------------------------------------
Origem Soma de quadrados GDL Média Qd. F p
------------------------------------------------------------------
Model 4583696. 2 2291848. 27.3497 0.0000
Error 2430143. 29 83798.1
------------------------------------------------------------------
Total (Corr.) 7013839. 31
R2 = 0.653522 R2 ajustado = 0.629627
Outros resultados da ANOVA para as Variáveis
-----------------------------------------------------------------
Origem Soma de Quadrados GDL Média Qd. F p
-----------------------------------------------------------------
ATSMBR6 2424273.05 1 2424273.0 28.93 0.0000
AWOLFR6 2159422.68 1 2159422.7 25.77 0.0000
-----------------------------------------------------------------
Modelo 4583695.72 2

Conforme se percebe a partir do exemplo acima, não apenas os resultados anunciados na


2 2
Proposição ocorrem, isto é, (i) a = 0 ; (ii) bj = Bj (c=1,...,C) ; (iii) r = R e r = R , mas,
além disso, são reproduzidos exatamente os mesmos valores para o demais elementos das tabelas das
regressões e também das análises de variância dessas regressões. Nas Figuras 3 e 4 , abaixo, temos
os gráficos de valores observados versus valores ajustados (ou previstos) pelos dois modelos, resp.

Gráfico de FORS1 G r á f ic o d e F O R S 1
2700 1200

2300 800

400
observ. o b serv .
1500 0

1100 -4 0 0

700 -8 0 0

700 1100 1500 1900 2300 2700 -8 0 0 -4 0 0 0 400 800 1200


p r e v is t o
previsto

Figura 3 (dados originais) Figura 4 (anomalias)

Assim, vê-se também que do ponto de vista gráfico os resultados são exatamente os mesmos, a
menos da mudança de escala (bastando comparar as “geometrias” das duas “nuvens de pontos”).
Omitimos um outro exemplo, no qual temos a chuva em Fortaleza, em maio, como função da chuva
nos meses anteriores, desde novembro até abril (6 covariáveis), pois neste caso pegamos todo um
intervalo de variação “sazonal”, desde a pre-estação chuvosa até à chuvosa. É óbvio que na prática da
previsão este exemplo não interessaria pois “lags” de chuva são em geral maus preditores da própria
5
chuva. Porém, verifica-se o resultado, mais uma vez, de que o emprêgo ou não das anomalias não vai
influenciar nos resultados dos modelos de regressão, aliás conforme dita a Proposição precedente.

2.4 QUANDO UTILIZAR ”ANOMALIAS” É UMA “ESTUPIDEZ” ?


Há casos, ademais, em que utilizar as “anomalias” seria não apenas uma tolice, porém uma
estupidez ! Em trabalho recente, conforme XAVIER & al (1997), mostrou-se que a partir do campo
de componentes meridionais do vento no Atlântico é possível obter a posição média da ZCIT (zona de
covergência intertropical) que corresponde, como se sabe, à posição média da linha de convergência
dos ventos superficiais (“trade winds”) de NE (hemisfério Norte) e SE (hemisfério Sul). Remete-se à
Figura 5, referente à situação em Abril de 1974 (ano muito chuvoso). Ora, é virtualmente impossível
chegar a tais resultados a partir de campos de anomalias para as componentes do vento !
Componente Meridional da "pseudo-tensão" do Vento Abril de 1974
@@@@@@ = Zona de Convergência ao Nivel do Mar  ZCIT
I=====================================================================I
I-18-22-27-33-35-36-36-38-39-38-38-44-50-56-57-52-44CCCCCCCCCCCCCCCCCCI 14o
I-18-22-27-33-35-36-36-38-39-38-38-44-50-56-57-52-44CCCCCCCCCCCCCCCCCCI N
I-24-31-39-44-45-41-40-41-42-41-39-40-43-46-43-36-26-14CCCCCCCCCCCCCCCI
I-24-31-39-44-45-41-40-41-42-41-39-40-43-46-43-36-26-14CCCCCCCCCCCCCCCI
I-33-40-49-53-51-45-43-43-44-44-40-37-36-33-29-21-13 -7 -4CCCCCCCCCCCCI 10o
I-33-40-49-53-51-45-43-43-44-44-40-37-36-33-29-21-13 -7 -4CCCCCCCCCCCCI N
I-41-47-53-57-55-49-45-45-48-48-42-35-30-25-19-12 -6 -4 -3 -4CCCCCCCCCI
I-41-47-53-57-55-49-45-45-48-48-42-35-30-25-19-12 -6 -4 -3 -4CCCCCCCCCI
I-44-47-52-56-55-50-47-49-52-50-44-34-27-20-14 -8 -5 -3 -2 -2 -1 0 2I
I-44-47-52-56-55-50-47-49-52-50-44-34-27-20-14 -8 -5 -3@@@@@@@@@ 0 2I
I-43-43-47-51-51-47-47-50-51-48-41-32-22-16-11 -7 -4 -2@@@@@@@@@ 3 5I
I-43-43-47-51-51-47-47-50-51-48-41-32-22-16-11 -7 -4@@@ 0 1 1 3 5I
I-38-39-41-43-43-41-42-44-44-41-35-26-17-10 -6 -3 -1@@@ 2 4 6 8 10I
I-38-39-41-43-43-41-42-44-44-41-35-26-17-10@@@@@@@@@ 0 2 4 6 8 10I
I=====================================================================I Oo
ICCC-35-37-36-35-32-32-32-31-29-23-16 -8 -2@@@@@@@@@ 5 5 7 10 13 16I
ICCC-35-37-36-35-32-32-32-31-29-23-16@@@@@@ 2 6 7 5 5 7 10 13 16I
ICCCCCCCCC-30-28-23-19-17-16-13-10 -4@@@@@@ 14 20 19 14 9 9 12 17 20I
ICCCCCCCCC-30-28-23-19-17-16-13@@@@@@ 1 7 14 20 19 14 9 9 12 17 20I
ICCCCCCCCCCCCCCCCCC -7 -5 -3 -2@@@@@@ 6 15 26 34 31 23 15 12 15 20 23I
ICCCCCCCCCCCCCCCCCC -7@@@@@@@@@ 0 2 6 15 26 34 31 23 15 12 15 20 23I
ICCCCCCCCCCCCCCCCCCCCC@@@@@@@@@ 3 4 8 19 32 41 38 29 20 15 19 24 26I
ICCCCCCCCCCCCCCCCCCCCC 3 4 3 3 4 8 19 32 41 38 29 20 15 19 24 26I
ICCCCCCCCCCCCCCCCCCCCC 6 6 6 4 4 7 16 29 38 36 29 21 19 25 30 31I
ICCCCCCCCCCCCCCCCCCCCC 6 6 6 4 4 7 16 29 38 36 29 21 19 25 30 31I 10o
I=====================================================================I S
55oW 6oE

Figura 5 CCCCCCCCC = continente (América do Sul / África)


2 5 4 6 4 =áreas de componente meridional enfraquecida
-32 (valor negativo)  comp.merid. N

S
14 (valor positivo)  comp.merid. S N
4. CONCLUSÕES
Apesar do pouco espaço (e tempo) disponível, pensamos haver elucidado vários dos aspectos
ligados ao uso e abuso de “anomalias” na pesquisa climática, no sentido de não só dirimir dúvidas
como também desmitificar certas idéias que, embora errôneas, possuem amplo curso e são motivadas
pelo desconhecimento dos fundamentos do Cálculo de Probabilidades e da Estatística Matemática, por
parte dos usuários. As várias questões tratadas, por sua vez, podem ser estendidas (mutadis mutandis)
para o caso do emprêgo de “devios (ou anomalias) padronizadas”. Evidentemente, em caso de dúvida
do usuário, é preferível utilizar sistematicamente “anomalias”, a menos dos casos em que tal
procedimento contribui para distorcer e falsear os resultados e a sua análise.

5. REFERÊNCIA

XAVIER, T.DE M.B.S., XAVIER, A.F.S., SILVA DIAS, P.L.da & SILVA DIAS, M.A.F. da (1997),
Papel da Componente Meridional do Vento na Costa do Nordeste e de Outras Covariáveis para
Prever a Chuva no Estado do Ceará (1964-1997), CADERNOS ATENA, No. 7A , 20 de dezembro
de 1997, Fortaleza-Ceará, 23 pp. (artigo submetido à Revista Brasileira de Recursos Hídricos) .
6

Você também pode gostar