Você está na página 1de 42

aa/bb/cc/dd-RPQ

ESTUDOS PRELIMINARES PARA MODELAMENTO DA QUANTIDADE DE L IQUIDO INTEGRADO VERTICALMENTE UTILIZANDO SATELITE, E VALIDADO POR RADAR DE SUPERF ICIE

Sylvio Luiz Mantelli Neto, Leandro Coser, Maximiliano Pessoa Junior, Adiel Mitmann, Mathias Henrique Weber, Eros Comunello, Aldo von Wangenheim, M ario A. Ribeiro Dantas, Izabelly Carvalho da Costa, Carlos Frederico Angelis

Relat orio de pesquisas CST, CEMADEN.

URL do documento original: <http://urlib.net/xx/yy>

INPE S ao Jos e dos Campos 2012

PUBLICADO POR: Instituto Nacional de Pesquisas Espaciais - INPE Gabinete do Diretor (GB) Servi co de Informa c ao e Documenta c ao (SID) Caixa Postal 515 - CEP 12.245-970 S ao Jos e dos Campos - SP - Brasil Tel.:(012) 3945-6923/6921 Fax: (012) 3945-6919 E-mail: pubtc@sid.inpe.br E PRESERVAC DA PRODUC CONSELHO DE EDITORAC AO AO AO INTELECTUAL DO INPE (RE/DIR-204): Presidente: Dr. Gerald Jean Francis Banon - Coordena c ao Observa ca o da Terra (OBT) Membros: Dra Inez Staciarini Batista - Coordena ca o Ci encias Espaciais e Atmosf ericas (CEA) Dra Maria do Carmo de Andrade Nono - Conselho de P os-Gradua ca o Dra Regina C elia dos Santos Alval a - Centro de Ci encia do Sistema Terrestre (CST) Marciana Leite Ribeiro - Servi co de Informa c ao e Documenta ca o (SID) Dr. Ralf Gielow - Centro de Previs ao de Tempo e Estudos Clim aticos (CPT) Dr. Wilson Yamaguti - Coordena ca o Engenharia e Tecnologia Espacial (ETE) Dr. Hor acio Hideki Yanasse - Centro de Tecnologias Especiais (CTE) BIBLIOTECA DIGITAL: Dr. Gerald Jean Francis Banon - Coordena c ao de Observa ca o da Terra (OBT) Marciana Leite Ribeiro - Servi co de Informa c ao e Documenta ca o (SID) E NORMALIZAC DOCUMENTARIA: REVISAO AO Marciana Leite Ribeiro - Servi co de Informa c ao e Documenta ca o (SID) Yolanda Ribeiro da Silva Souza - Servi co de Informa c ao e Documenta ca o (SID) ELETRONICA: EDITORAC AO Viv eca SantAna Lemos - Servi co de Informa ca o e Documenta c ao (SID)

aa/bb/cc/dd-RPQ

ESTUDOS PRELIMINARES PARA MODELAMENTO DA QUANTIDADE DE L IQUIDO INTEGRADO VERTICALMENTE UTILIZANDO SATELITE, E VALIDADO POR RADAR DE SUPERF ICIE

Sylvio Luiz Mantelli Neto, Leandro Coser, Maximiliano Pessoa Junior, Adiel Mitmann, Mathias Henrique Weber, Eros Comunello, Aldo von Wangenheim, M ario A. Ribeiro Dantas, Izabelly Carvalho da Costa, Carlos Frederico Angelis

Relat orio de pesquisas CST, CEMADEN.

URL do documento original: <http://urlib.net/xx/yy>

INPE S ao Jos e dos Campos 2012

The computer is not a competitor for the human brain. The computer is just a big, patient number cruncher. It doesnt get bored. It doesnt get sleepy and make mistake. It will do the same taxing calculation over and over and over and over - for several milions overs - again.

David Salsburg on The Lady Tasting Tea (2006, pag. 68).

ii

AGRADECIMENTOS Os autores agradecem ao grupo de pessoas envolvido nas atividades deste trabalho mas especialmente para as seguintes pessoas.

a) Aos membros do grupo de pesquisas do UFSC-INE-LAPIX, que auxiliaram no desenvolvimento das t ecnicas de processamento de imagens, especialmente para M.Sc. Antonio Carlos Sobieranski. Home page do LAPIX http://www.lapix.ufsc.br/ b) Membros da equipe operacional do INPE-DSA que auxiliou na obten c ao de imagens de radar e esclareceu d uvidas acerca de algumas t ecnicas ans, mas especialmente para Wagner Flauber Rocha. Home page do INPE-DSA sigma.cptec.inpe.br/radar/ c) Ao grupo operacional do DECEA, Departamento de Controle do Espa co A ereo do Minist erio da Aeron autica. Home page do DECEA http://www.fab.mil.br/portal/capa/index. php?page=decea d) Ao suporte nanceiro do CNPQ no pagamento da bolsa de Adiel Mittman. Processo CNPQ: 380649/2012-8, durante o programa de incentivo aos INCTs relativo ao INCoD (Intituto Nacional de Ci encia e Tecnologia para a Converg encia Digital), e da Rede Clima. Home page do programa INCT do CNPQ http://estatico.cnpq.br/ portal/programas/inct/_apresentacao/ Home page da Rede Clima http://redeclima.ccst.inpe.br/org.html e) Ao suporte t ecnico operacional e cient co fornecido pelo CEMADEN (Centro Nacional de Monitoramento e Alertas de Desastres Naturais). Home page do CEMADEN http://www.cemaden.gov.br/

iii

PRELIMINARY STUDIES FOR MODELING VERTICALLY INTEGRATED LIQUID USING SATELLITE, VALIDATED BY SURFACE RADAR.

ABSTRACT This technical report describes the development of a model to estimate the Vertically Integrated Liquid (VIL) on the atmosphere using GOES-12 satellite, and 80 surface radar images (Z) obtained on April 25th 2012 from Morro da Igreja in Santa Catarina State, Brazil. Images from S ao Roque radar in State of S ao Paulo were used for model validation. Exploratory Data Analysis (EDA), Principal Component Analysis (PCA) and Design and Analysis of Experiments, were used to assess the domain and signicance of variables and minimize uncontrolled factors on modeling. During this work it was developed routines for 3-D image reading and processing in C ++ and resizing techniques to use images in the same spatial scale for statistical analysis. The results indicated the existence of several patterns (multi modal), related to dierent sources of intense precipitation. Linear regression modeling used described only 13.2% of observed phenomena variability and not very appropriate as preliminarly indicated. To improve this analysis it is recommended a new modeling paradigm and a new experiment, analyzing the patterns separately under the supervision of a meteorologist. According to the results, it is suggested the use of Gaussian Mixture Models (GMM) or equivalent ones instead of Linear Regression Models for VIL estimations.

iv

RESUMO Neste trabalho foi realizado o desenvolvimento de um modelo para a estimativa do conte udo de a gua l quida integrada verticalmente (VIL) na atmosfera a partir dos dados obtidos das imagens do sat elite GOES-12 e dos valores de Z de 80 imagens de superf cie obtidas no dia 25 de abril de 2012 do Radar do Morro da Igreja em Santa Catarina. As Imagens do Radar de S ao Roque em S ao Paulo foram utilizados na valida ca o do modelo desenvolvido. Durante o modelamento foram utilizadas t ecnicas estat sticas de An alise Explorat oria de Dados (EDA), de Componentes Principais (PCA) e de Projeto e An alise de Experimentos (PAE); para conhecer o dom nio e a signic ancia das vari aveis independentes propostas e minimizar a inu encia de fatores incontrol aveis no modelo. Durante o trabalho foram desenvolvidas rotinas de leitura e processamento em C ++ de imagens 3-D de radar e estudadas t ecnicas de redimensionamento das imagens para serem utilizadas na mesma escala espacial durante a an alise estat stica. Os resultados indicaram a exist encia de v arios padr oes (multi modais), coincidentes ` a ocorr encia de eventos de grande precipita c ao de diversas origens. O modelo de regress ao linear proposto para todos os padr oes em conjunto, descreve somente 13, 2% da variabilidade dos fen omenos observados e n ao e muito adequado como preliminarmente indicado. Para melhorar esta valia c ao, recomenda-se um novo paradigma de modelamento em um novo experimento mais renado analisando separadamente os padr oes, supervisionado por um especialista em meteorologia. De acordo com os resultados obtidos, sugere-se utilizar um modelo de Misturas Gaussianas (GMM) ou similar ao inv es do modelo de regress ao linear para as estimativas de VIL.

SUMARIO P ag. 1 INTRODUC AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 MATERIAIS E METODOS . . . . . . . . . . . . . . . . . . . . . . 2.1 2.2 2.3 2.4 2.4.1 2.4.2 2.4.3 2.4.4 2.4.5 2.4.5.1 As imagens de radar do Morro da Igreja utilizadas no modelamento . . . As imagens de sat elite do GOES-12 utilizadas no modelamento . . . . .

1 3 4 5

Processamento preliminar de imagens e obten c ao de par ametros de an alise 6 An alise Estat stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 An alise Explorat oria de dados . . . . . . . . . . . . . . . . . . . . . . . 14 An alise dos componentes principais ou PCA . . . . . . . . . . . . . . . 16 Modelo de regress ao linear m ultipla . . . . . . . . . . . . . . . . . . . . 18 Verica c ao da adequa c ao do modelo de regress ao . . . . . . . . . . . . 19 Teste de signic ancia do modelo de regress ao linear multipla . . . . . . 19 An alise residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.4.5.2 An alise das superf cies de resposta . . . . . . . . . . . . . . . . . . . 22 2.5 Valida c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.6 Coment arios acerca da an alise estat stica . . . . . . . . . . . . . . . . . . 25 27 29

3 CONCLUSOES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . REFERENCIAS BIBLIOGRAFICAS . . . . . . . . . . . . . . . . . .

vi

LISTA DE FIGURAS P ag. 2.1 2.2 2.3 Ilustra ca o acerca da visualiza ca o geral do presente m etodo utilizado . . . Ilustra ca o acerca do pr e-processamento utilizado para obter os par ametros de modelamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ilustra ca o acerca da regi ao de an alise utilizada no entorno do radar real cada em azul, para a confec c ao do modelo. 14 14 e 38 38 em pixels A corespondem a areas de 56 56 e 152 152 em km. OBSERVAC AO. gura encontra-se fora de propor ca o especialmente na dimens ao vertical 2.4 para ilustrar melhor o procedimento utilizado. . . . . . . . . . . . . . . . 13 Gr acos dos dados obtidos simultaneamente a partir de 80 amostras de imagens dos canais do GOES, dos seus dados derivados e tamb em do c alculo do VIL limitado ` a regi ao de maior sensibilidade a partir das imagens 2.5 2.6 2.7 do radar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Gr aco do tipo scree plot, ilustrando a import ancia de cada regressor atrav es dos autovalores na an alise de componentes principais. . . . . . . 17 Figura indicando a an alise dos res duos do modelo de regress ao utilizado. 21 Figura indicando os gracos de contorno do VIL em rela ca o aos canais do GOES e seus derivados. As unidades de VIL est ao em kg.m2 , as de 2.8 2.9 C3 e C4 em K e X3 e X4 s ao adimensionais. . . . . . . . . . . . . . . . . 22 Ilustra ca o acerca da AED realizada nos dados do c alculo do VIL utilizados na valida c ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Figura comparando estatisticamente os resultados do c alculo do VIL entre o modelo de regress ao obtido pelo sat elite GOES e pelo radar de S ao Roque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 4 7

vii

LISTA DE TABELAS P ag. 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 Tabela indicando os detalhes do imageador do GOES. FONTE: http: //noaasis.noaa.gov/NOAASIS/ml/imager.html . . . . . . . . . . . . . Tabela comparando a escolha da matriz b asica de redimensionamento para a regi ao de alcance do radar em rela c ao ` a imagem do GOES. . . . Vantagens e desvantagens dos m etodos de interpola ca o candidatos a resampling levantados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . An alise dos autovalores pela matriz de covari ancia . . . . . . . . . . . . An alise dos autovalores pela matriz de correla ca o . . . . . . . . . . . . matriz de covari ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . matriz de correla ca o . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela dos coecientes encontrados no estabelecimento da regress ao linear m ultipla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela da an alise de vari ancia do modelo de regress ao linear m ultipla. .

. 10 . . . . . 12 17 17 18 18

. 19 . 19

viii

LISTA DE ABREVIATURAS E SIGLAS

AED alt BIN CEMADEN CCST DN GOES-12 HDF Viewer HDF-5 INCoD INE INPE LAPIX lat lon MCT MVOL OPENCV OUTLIERS PCA R SC SP UFSC VCP VIL 2-D 3-D

An alise Explorat oria de dados Altitude em metros BINS do radar Centro Nacional de Monitoramento e Alerta de Desastres Naturais Centro de Ciencias do Sistema Terrestre do INPE Digital Number, n umero digital obtido a partir das imagens Geoestationary Operational Environment Satellite, n umero 12 Ferramenta de visualiza ca o de dados HDF-5 em c odigo aberto Hirarchial Data Format version 5 Instituto Nacional de Ciencia e Tecnologia para a Convergencia Digital Departamento de Inform atica e Estat stica da UFSC Instituto Nacional de Pesquisas Espaciais Laboratorio de Processamento de Imagens e Computa ca o Graca do INE Latitude em graus Longitude em graus Ministerio da Ci encia e Tecnologia Arquivo de sa da do radar, referenciado a partir de sua extens ao Biblioteca em c odigo aberto na linguagem C ++ utilizada em processamento de imagens Dados anormais com problemas ou fora da escala de observa c ao An alise de Componentes principais Pacote estat stico em c odigo aberto Estado de Santa Catarina, Brasil Estado de S ao Paulo, Brasil Universidade Federal de Santa Catarina Florianopolis SC Brasil Padr oes de cobertura de volume executada pelo radar ou Volume Coverage Patterns Conte udo de a gua l quida integrada verticalmente ou Vertically Integrated Liquid Imagens ou dados apresentados em duas dimens oes Imagens ou dados apresentados em tr es dimens oes

ix

LISTA DE S IMBOLOS

a C3 C4 C43

dBZ h r V IL X3 X4 Z

e o raio m edio da terra em metros Canal de vapor de a gua do GOES-12 Canal de infra-vermelho do GOES-12 Diferen ca entre os canais de infra-vermelho e de vapor de a gua do GOES-12 em graus kelvin valor da reetividade do radar em decib eis ver equacao 2.3 altura do feixe expressa em m e a linha de alcance do radar em ??? Conte udo de agua l quida em kgm2 Vari ancia do canal de vapor de agua do GOES-12 a partir de uma matriz de 9 9 pixels em graus kelvin Vari ancia do canal de infra-vermelho de agua do GOES-12 a partir de uma matriz de 9 9 pixels em graus kelvin valor da reetividade obtido a partir da imagem do radar em mm6 m3 Altura expressa em metros do feixe do radar

1 INTRODUC AO O presente documento e um relat orio parcial de pesquisas, que est ao sendo desenvolvidas como parte de uma coopera ca o cient ca entre o Instituto Nacional de Pesquisas Espaciais (INPE), o Centro de Monitoramento e Alerta de Desastres Naturais (CEMADEN) e o Instituto Nacional de Ci encia e Tecnologia para a Converg encia Digital (INCoD) da Universidade Federal de Santa Catarina (UFSC). O presente trabalho tamb em faz parte das atividades desenvolvidas pela Rede Clima. O objetivo deste relat orio e descrever as atividades de pesquisas em andamento, para o desenvolvimento de um modelo de estimativa do conte udo de a gua l quida integrada verticalmente (VIL) Greene e Clark (1972) presente na atmosfera utilizando simultaneamente imagens de sat elite e radar. O modelo desenvolvido ser a utilizado para estimar o VIL fora das regi oes de cobertura do radar a partir das imagens do sat elite GOES-12. Ser ao utilizados os canais do sat elite GOES-12 C3 (Vapor de a gua), C4 (Infra-vermelho), a vari ancia destes dois canais, obtidos a partir de uma matriz com 3x3 pixels denominadas de X3 e X4 e a diferen ca entre eles C43. O VIL ser a calculado a partir das imagens 3-D do radar meteorol ogico do Morro da Igreja em SC. A pesquisa prev e tamb em o desenvolvimento de rotinas de leitura e processamento das imagens 3-D do radar para o c alculo do VIL. Todos estes requisitos ou par ametros foram previamente estabelecidos pelos pesquisadores do INPE e do CEMADEN. Foi denido tamb em, utilizar o desenvolvimento de um modelo de regress ao linear m ultipla e de t ecnicas estat sticas multivariadas durante os trabalhos para estimar o VIL. Esta abordagem param etrica fornecer a um modelamento matem atico mais rigoroso para a estimativa do VIL. O modelo que estima o VIL ser a validado a partir dos dados do Radar de S ao Roque em S ao Paulo e os resultados desta compara ca o ser ao apresentados no decorrer do presente trabalho. Para o desenvolvimento da presente pesquisa est a sendo utilizado o m etodo Bayesiano Yuille e Kersten (2006), Charter et al. (2006a), Charter et al. (2006b) em duas fases: an alise supevisionada e classica c ao NIST (2009, cap. 1). N ao est ao sendo utilizadas redes neurais, por causa do aspecto caixa-preta, envolvidos no processo de modelamento Johannet et al. (2007), Zhang (2007). Depois que o modelo Bayesiano estiver implementado e consolidado, ser a poss vel obter as condi co es necess arias para a valida ca o do funcionamento da rede neural, embora n ao seja este objetivo do presente trabalho de pesquisa. O presente documento est a organizado de acordo com a seguinte estrutura. 1

Cap tulo 1 Apresenta uma introdu ca o e descri ca o sum aria do presente relat orio. Cap tulo 2 Apresenta os materias e m etodos utilizados durante a pesquisa. Cap tulo 3 Descreve os resultados preliminares utilizados durante a an alise do presente modelo em estudo, alem da valida c ao. Cap tulo 4 Conclus ao.

2 MATERIAIS E METODOS Neste cap tulo ser ao descritos os m etodos utilizados no modelo estat stico de estimativa do VIL. Antes do modelamento propriamente dito foi necess ario o desenvolvimento de um conjunto de rotinas para extrair os par ametros das imagens de radar correspondentes a `a rea de cobertura do sat elite. Os dados do VIL (vari avel dependente do modelo) foram obtidos a partir de 80 imagens do radar meteorol ogico, localizado no Morro da Igreja em Santa Catarina (SC) (lat. = 28.1285956 , lon. = 49.47176413 alt. = 1822.0 m). A valida ca o foi feita a partir de imagens do radar meteorol ogico localizado em S ao Roque em S ao Paulo (SP) (lat. = 23.6019 , lon. = 47.0943 , alt. = 1150.0 m) e das respectivas imagens simult aneas do sat elite GOES-12 (vari aveis independentes do modelo). A partir destas imagens foi estabelecida uma metodologia para a analise supervisionada, em que a partir de condi co es conhecidas pode-se denir o resultado da an alise. Em seguida os modelos foram avaliados qualitativamente e nalmente estabelecidas as estimativas do VIL fora da area de cobertura do radar. Este cap tulo esta estruturado nas seguintes se c oes.

Se c ao 2.1 : descreve preliminarmente como s ao obtidas as imagens de radar e a varredura utilizadas no presente trabalho. Se c ao 2.2 : descreve sumariamente as imagens de sat elite utilizadas no presente trabalho. Se c ao 2.3 : descreve sumariamente o pr e-processamento necess ario para obter os par ametros obtidos a partir das imagens que ser ao utilizadas no modelo. Esta se ca o tamb em aborda o procedimento de redimensionamento e o volume de maior sensibilidade do radar utilizado para o modelamento. Se c ao 2.4 : descreve a an alise estat stica dos dados. Se c ao 2.5 : descreve a valida c ao do modelo calculado na se c ao anterior utilizando os dados do Radar de S ao Roque. Se c ao 2.6 : descreve uma an alise dos dados e do modelo proposto com coment arios acerca dos resultados. 3

Uma gura geral descrevendo a metodologia utilizada no m etodo proposto, encontrase ilustrado na gura 2.1. Conforme mencionado na introdu ca o deste relat orio ser a utilizado o m etodo Bayesiano que possui duas fases: an alise supervisionada e classica ca o NIST (2009, cap. 1).

Figura 2.1 - Ilustra c ao acerca da visualiza c ao geral do presente m etodo utilizado

2.1

As imagens de radar do Morro da Igreja utilizadas no modelamento

O radar emite ondas a partir de um conjunto de trem de pulsos de alta pot encia (aproximadamente 450.000 W) em determinados angulos de azimute e eleva ca o e analisa o retorno destas reex oes. Estas ondas s ao emitidas atrav es de um conjunto 4

de feixes c onicos com um a ngulo de abertura de 1, 98 , a cada grau de azimute horizontal (360 angulos) para um determinado n umero de eleva co es chamados de padr oes de cobertura de volume ou Volume Coverage Patterns (VCP). Estas eleva c oes s ao estabelecidas de acordo com o modus operandi da equipe operacional do radar e tamb em de acordo com as condi co es atmosf ericas vigentes. Em geral para as condi co es de c eu claro s ao monitoradas menos eleva co es do que nas condi co es de precipita c ao. Este procedimento e adotado pelas equipes operacionais para evitar armazenamento de informa c oes desnecess arias, racionalizar o uso da energia, preservar a vida u til do radar, etc. Mas nas imagens disponibilizadas pela equipe operacional do Minist erio da Aeron autica, somente foram utilizadas imagens com somente um tipo de VCP com o maior n umero de eleva c oes. O VCP congurado utiliza as seguintes eleva c oes. 0 4, 5 9, 5 0, 5 5, 5 11, 5 1, 5 6, 5 13, 5 2, 5 7, 5 15, 5 3, 5 8, 5 17, 5

Desta maneira o radar obt em uma amostragem espacial ao seu redor em um determinado raio de alcance que pode chegar a 250 km. O resultado desta an alise e um conjunto de imagens 3-D fornecidas no formato HDF-5 1 em coordenadas cilindricas, al em de outros par ametros operacionais do radar. Os arquivos do radar possuem extens ao MVOL, e foram visualizados atrav es da ferramenta HDF Viewer 2 . O mesmo padr ao de VCP foi utilizado para o conjunto de imagens do radar do Morro da Igreja utilizadas na an alise supervisionada e na valida ca o para o radar de S ao Roque, para maximizar a sensibilidade do modelo. 2.2 As imagens de sat elite do GOES-12 utilizadas no modelamento

O Sat elite GOES-12 3 e utilizado basicamente para a previs ao do tempo na Am erica do Sul e monitorar o movimento de tempestades, ciclones e deslizamentos. As imagens do sat elite GOES-12 s ao obtidas a partir de uma o rbita aproximadamente a 36.370 km acima do solo na linha do equador. A tabela 2.1 descreve os sensores
HDF-5 Hierarchical Data Format, desenvolvido pelo National Center for Supercomputing Applications (NCSA) http://www.ncsa.illinois.edu/ 2 HDF Viewer e desenvolvido pelo The HDF Group em c odigo aberto est a dispon vel no link http://www.hdfgroup.org/hdf-java-html/hdfview/ 3 O GOES e administrado pela ag encia Americana NOAA (National Oceanic and Atmospheric Administration) http://www.noaanews.noaa.gov/stories2010/20100525_satellite.html
1

correspondentes aos canais dispon veis neste sat elite. O canal C1 vis vel (Vis), o C2 ondas curtas (OC), o C3 vapor de agua ou umidade (Um) e dois C4 e C5 infravermelhos (Iv1 e Iv2). Conforme pode ser observado, o canal C3 possui resolu ca o espacial distinta do C4.

Tabela 2.1 - Tabela indicando os detalhes do imageador do GOES. FONTE: http:// noaasis.noaa.gov/NOAASIS/ml/imager.html

Sensor Canal 1 (Vis) 2 (OC) 3 (Um) 4 (Iv1) 5 (Iv2) Comp. de Onda em m 0,55-0,75 3,80-4,00 6,50-7,00 10,20-11,20 11,50-12,50 resolu ca o em km 1 4 8 4 4 5% max Iv 1K incerteza

A partir dos canais C3 vapor de agua e C4 infra-vermelho, foram obtidas as imagens e dados, calculadas a variabilidade dos canais respectivamente denominados X3 e X4 e a sua diferen ca denominado C43. A variabilidade foi calculada a partir de uma matriz de 3x3 pixels ao redor do pixel central. 2.3 Processamento preliminar de imagens e obten c ao de par ametros de an alise

Antes de utilizar os par ametros necess arios para o modelamento e necess ario extra los das imagens. Dois tipos de imagens diferentes foram utilizadas: as do sat elite GOES-12 e as de radar. Cada uma delas necessita de uma rotina espec ca de leitura. Foram desenvolvidos algor tmos de leitura destes arquivos em linguagem C++ e utilizados um conjunto de bibliotecas em c odigo aberto espec ca para aplica c oes em Vis ao Computacional chamada OPENCV 4 . Um esquema geral ilustrando o procedimento utilizado no pr e-processamento pode ser observado na gura 2.2. Para a confec ca o de um modelo preliminar, foram utilizadas 80 imagens do dia 25 de abril de 2012, obtidas a cada 15 minutos do radar do Morro da Igreja em Santa Catarina. O volume ao redor do radar n ao e completamente amostrado, permitindo por esta raz ao, a ocorr encia de um cone de sil encio e lacunas (ou pixels ausentes) de dados
4

OPENCV est a dispon vel no link http://opencv.org/

Figura 2.2 - Ilustra c ao acerca do pr e-processamento utilizado para obter os par ametros de modelamento.

nas imagens. O cone de sil encio localiza-se na a rea imediatamente acima do radar, e e descartado do processamento de imagem durante o modelamento. As lacunas de dados ocorrem por dois motivos. Em primeiro lugar porque o radar n ao consegue varrer completamente a regi ao ao seu redor e em segundo lugar por causa do processo de convers ao de coordenadas esf ericas para cartesianas. Estas lacunas poder ao ser preenchidas completamente em um trabalho futuro, atrav es de interpola ca o logar tmica Deserno (March 24, 2004), porque os dados de radar nas imagens MVOL se apresentam nesta escala logar tmica em decibeis. Atualmente a interpola ca o e aplicada somente no mesmo plano de eleva ca o 2-D. A interpola ca o logar tmica 3-D 7

esta prevista em outra fase deste projeto de pesquisas. Logo em seguida, e efetuado o c alculo do conte udo de agua l quida, a partir de uma equa ca o de convers ao entre o o valor da reetividade Z e o VIL fornecida pelos pesquisadores do CEMADEN. A equa ca o 2.1 e baseada no m etodo desenvolvido por Greene e Clark (1972), utilizada no presente trabalho encontra-se ilustrada a seguir.
topo

V IL = 3.44 10 em que:

6 base

Z1 + Z2 4 ) 7 dh 2

(2.1)

Z1 : e o valor da reetividade do radar em mm6 m3 . Z2 : e o valor da reetividade do radar da camada superior em mm6 m3 . VIL : tem unidades em kg.m2 e representa a massa de gotas em um volume unit ario h : e a altura do feixe, obtida a partir da equa ca o 2.2 expressa em metros.

h=

r2 cos2 + r sin 8 a 3

(2.2)

em que: : eoa ngulo de eleva ca o em radiano. r : e a linha de alcance do radar em metros. a : e o raio da Terra (6.378.137) em metros
5

para an alise dos dados.

Os valores de Z podem assumir valores em uma grande variabilidade de escala que pode ir desde 0, 001 mm6 m3 para neblina at e valores da ordem de 40.000.000 6 3 mm m para granizo de tamanho grande WMO (2005, pag. 13). Por esta raz ao
O valor do raio da Terra foi obtido a partir de WGS 84 (World Geodetic System of 1984) http://home.online.no/~sigurdhu/WGS84_Eng.html
5

os valores de Z s ao expressos em escala logar timica ou em dBZ em um intervalo aproximadamente entre 30 a +76 dBZ. Os dados de radar em dBZ podem ser obtidos a partir da equa c ao 2.3

dBZ = 10 log10 Z

(2.3)

Quando os dados forem fornecidos em dBZ pode-se utilizar a formula descrita na equa ca o 2.4 para o no c alculo do VIL a partir dos arquivos MVOL.
dBZ 10

Z = 10

(2.4)

Todas as imagens de radar com o VIL calculado, possu am imagens correspondentes do sat elite GOES-12 formando tuplas
6

de dados. O n umero de tuplas em cada

imagem, pode variar de uma condi ca o atmosf erica de c eu claro ou na presen ca de tempestades, e depende do tipo e da magnitude do fen omeno observado. No presente trabalho a t tulo de modelamento, foram utilizadas condi c oes xas. A partir destas tuplas foram realizadas as an alises estat sticas. As imagens de radar e as de sat elite n ao possuem a mesma resolu ca o espacial. A resolu ca o espacial do radar e de 0, 75km/pixel, enquanto que a de sat elite e de 4km/pixel. Antes de utiliz a-las e necess ario convert e-las para a mesma resolu ca o atrav es de um precedimento conhecido como redimensionamento. O m etodo sugerido preliminarmente pelo grupo de pesquisas do CEMADEN foi pela m edia dos pixels, para reduzir a dispers ao dos dados. Mas a m edia dos dados sem o redimensionamento n ao permite o casamento exato na geometria das imagens causando fracionamento (por exemplo encaixar 5,3 pixels de radar em 1 pixel de sat elite). Nestas condi co es o uso do valor m edio poderia ocasionar erros de aproxima c ao na atribui ca o de valores por descasamento geom etrico. Para resolver este problema foi escolhida uma matriz b asica quadrada de valores m edio, m aximo e m nimo dos pixels do VIL, de maneira a obter uma resolu ca o mais pr oxima poss vel entre as duas imagens preservando a geometria quadrada.
Tupla e um termo t ecnico derivado do ingl es, comumente utilizado na area de computa c ao. Representa um conjunto ordenado de dados. Fonte http://www.merriam-webster.com/dictionary/ -tuple
6

Por exemplo se utilizarmos uma matriz b asica de 5x5 pixels obteremos um m ultiplo de pixels mais pr oximo da resolu c ao da imagem do sat elite para a regi ao de an alise. A tabela 2.2 indica o tamanho da matriz b asica e o tamanho da imagem obtida em rela ca o a imagem do GOES.

Tabela 2.2 - Tabela comparando a escolha da matriz b asica de redimensionamento para a regi ao de alcance do radar em rela c ao ` a imagem do GOES.

Matriz b asica Resolu c ao nal Diferen ca GOES 125 0 4x4 166 41 5x5 133 8 6x6 166 14

Desta maneira o redimensionamento por interpola ca o ca restrita a ` menor diferen ca poss vel de 8 pixels entre as imagens. Para o redimensionamento de uma imagem de 133x133 para uma de 125x125 foram utilizadas rotinas de redimensionamento por interpola ca o dispon veis na biblioteca OPENCV. Vale a pena destacar que a interpola c ao por redimensionamento e diferente da interpola c ao logar tmica mencionada anteriormente, para o preenchimento das lacunas dos dados da varredura do radar. Cinco m etodos de redimensionamento por interpola ca o para uma resolu c ao maior ou menor est ao dispon veis na biblioteca OPENCV, conforme descrito a seguir.

NEAREST: nearest neighbor. LINEAR: bilinear (default). AREA: resampling. CUBIC: bicubic 4x4 pixel neighborhood. LANCZOS4: Lanczos over 8x8 pixel neighborhood.

Vale a pena salientar que durante o redimensionamento da imagem, n ao podem haver lacunas de dados, pois estas causam erros sem anticos durante a interpola c ao utilizada no redimensionamento. Esta e outra raz ao pela qual as imagens sao interpoladas somente em 2-D. Por exemplo, a interpola ca o CUBIC utiliza a vizinhan ca 10

4x4 dos pixels. Se houver uma ou mais lacunas, a interpola c ao apresentar a resultados matematicamente v alidos por em sinteticamente gerados. As lacunas ocorrem predominantemente entre os n veis de eleva c oes. No presente trabalho o redimensionamento e aplicado somente nas imagens planas (ou que se encontram no mesmo plano) e n ao em imagens volum etricas em diferentes altitudes. Cada um dos m etodos de redimensionamento mencionados foi utilizado, e todos eles apresentaram resultados diferentes nas imagens. Por isto uma an alise mais detalhada precisou ser realizada, para saber quais eram as diferen cas entre eles. Lillesand e Kiefer (1994, cap. 7.2), comparam os m etodos de redimensionamento aplicados ao processamento de imagens em sensoriamento remoto e os chama de resampling. Em geral o resampling e utilizado para aumentar o tamanho das imagens upsampling ou reduzir downsampling como no presente trabalho. Entretanto o mais importante a ser analisado, s ao os efeitos causados nas imagens de acordo com a aplica ca o. No pr oximo par agrafo ser ao analisadas algumas destas caracter sticas para saber qual dos m etodos e o mais apropriado para a presente pesquisa. Lillesand e Kiefer (1994, sect. 7.2), Schowengerdt (2007, sect. 7.2.3), Dodgson (1992) e Parker et al. (1983), Richards (1995, cap. 2) mencionam os mesmos m etodos de interpola ca o utilizados no redimensionamento (nearest neighbor, bilinear, cubic) dispon veis na biblioteca OPENCV. Lillesand e Kiefer (1994, sect. 7.2) comentam que a interpola ca o CUBIC possui vantagens sobre os m etodos NEAREST e LINEAR na apar encia nal da imagem. Lillesand e Kiefer (1994) n ao comentam acerca dos m etodos AREA e LANCZOS4. Parker et al. (1983) tamb em comparam 5 m etodos de interpola ca o utilizados em imagens m edicas, com tr es varia co es do m etodo CUBIC (cubic- BSpline, high-resolution cubic spline with edge enhancement e high-resolution cubic spline). Parker et al. (1983) concluiram que os m etodos CUBIC possuem uma melhor resposta de frequ encia do que o NEAREST e o LINEAR. Apesar das vantagens do m etodos LINEAR e CUBIC apresentando uma imagem mais n tida, estes m etodos acrescentam pixels na imagem e n ao preservam os valores originais. Por esta raz ao estes m etodos s ao aplicados depois do reconhecimento de padr oes, classica ca o Richards (1995, cap. 11) ou n ao s ao utilizados antes da an alise estat stica das imagens. A tabela 2.3, apresenta um sum ario das vantagens e desvantagens dos m etodos 11

avaliados. Um estudo mais profundo acerca da deni c ao do melhor m etodo de interpola c ao excede ao escopo do presente trabalho, mas pode ser encontrado em Dodgson (1992). Baseado na indica c ao de Schowengerdt (2007, pag. 306) e Richards (1995, cap. 2) foi utilizado o redimensionamento NEAREST, para preservar os valores originais da imagem durante a an alise estat stica.
Tabela 2.3 - Vantagens e desvantagens dos m etodos de interpola c ao candidatos a resampling levantados.

M etodo NEAREST

Desvantagem aliasing oset -

Vantagem simplicidade n ao altera original n ao introduz novos pixels smothing reduz aliasing blurring

Uso t ecnicas estat sticas

LINEAR

sint etico altera original problemas p os an alise e executado depois do reconhecimento de padr oes introduz novos pixels

upsampling

CUBIC

aumenta um pouco produz undershooting problemas da LINEAR halos

melhor aliasing introduz halos precis ao e rapidez mais precisa que LINEAR

upsampling downsampling

As imagens do radar foram redimensionadas de (0,75 x 0,75 km) para a resolu c ao espacial do sat elite (4 x 4 km). Foi utilizado na an alise uma regi ao de formato c ubica oca, onde a varredura do radar e mais intensa, conforme ilustrada na gura 2.3. A proje c ao desta regi ao est a indicada na a rea em azul na gura. Foram retirados das imagens a regi ao relativa ao cone de sil encio indicado em cinza na gura, centralizada em uma area de aproximadamente 14 x 14 pixels (ou 56 x 56 km). Foram retirados tamb em todos os pixels al em de uma a rea de 38 x 38 pixels (ou 152 x 152 km), por que apresentavam ru dos sistem aticos e aleat orios. Estes procedimentos s ao recomendados para eliminar fatores incontrol aveis do processo de modelamento estat stico Montgomery (2005, cap. 1).

12

Figura 2.3 - Ilustra c ao acerca da regi ao de an alise utilizada no entorno do radar real cada em azul, para a confec ca o do modelo. 14 14 e 38 38 em pixels corespondem A gura encontra-se a areas de 56 56 e 152 152 em km. OBSERVAC AO. fora de propor c ao especialmente na dimens ao vertical para ilustrar melhor o procedimento utilizado.

Depois de conclu do o redimensionamento, foram extra dos das imagens os dados em formato texto geogracamente coincidentes necess arios para o desenvolvimento do modelo estat stico, conforme descrito na pr oxima se ca o. 2.4 An alise Estat stica

Nesta se c ao ser a descrito como foi constru do o modelo de regress ao linear estat stico Montgomery e Peck (1992, sec. 1.2), utilizado para a estimativa do conte udo de agua l quida. Os dados obtidos a partir do pr e-processamento descrito na se ca o anterior s ao m ultiplos, por isto ser ao utilizadas t ecnicas de regress ao linear m ultipla conforme sugerido por Wilks (2005, cap. 6). O m etodo experimental utilizado para o desenvolvimento do modelo estat stico ser a o recomendado por Montgomery

13

(2005). Ser a utilizado tamb em um pacote estat stico de arquitetura aberta o R o MINITAB
8

para an alise dos dados.

Montgomery (2005) recomenda que os fatores incontrol aveis existentes em um experimento estat stico devem ser eliminados. De uma certa forma a interpola ca o das lacunas, o redimensionamento das imagens e a utiliza ca o da regi ao maior sensibilidade de amostragem e conabilidade dos dados monitorada pelo radar, s ao parte na mitiga ca o destes fatores. Vale a pena salientar que as imagens e dados do radar fornecem uma amostragem incompleta da regi ao monitorada verticalmente resultando na ocorr encia de lacunas. Como o VIL e integrado verticalmente, o modelo calculado neste relat orio pode subestimar os valores de VIL calculados, por n ao integrar completamente todos os dados poss veis de Z existentes na eleva c ao por causa destas lacunas. Esta amostragem incompleta possibilita a ocorr encia de erros sistem aticos, aumentando a incerteza do modelo. Este tipo de erro poderia ser reduzido atrav es de uma interpola ca o vertical. Entretanto no presente trabalho n ao ser a utilizada a interpola c ao vertical para o estabelecimento do presente modelo, por tratar-se de processamento de imagens 3-D, exigindo recursos de computa ca o gr aca, extrapolando muito o escopo do presente trabalho. Este tipo de erro sistem atico pode ser mitigado tamb em, atrav es de uma calibra c ao renada e ou ajustes utilizando s eries temporais mais longas nas estimativas dos dados. 2.4.1 An alise Explorat oria de dados

A an alise explorat oria de dados tem como objetivo conhecer mais detalhadamente o comportamento dos par ametros utilizados no modelo. A partir de uma s erie de imagens obtidas da regi ao de interesse ilustrada na gura 2.3, procedeu-se a uma an alise explorat oria (AED) nas tuplas de dados obtidos a partir das imagens. Foi utilizado um programa estat stico para gerar os gr acos para o canal do vapor de a gua do sat elite C3 ilustrado na gura 2.4(a), para o canal infra-vermelho do sat elite C4 ilustrado na gura 2.4(b), para as diferen cas entre estes dois canais ou C43 ilustrado na gura 2.4(c), para a vari ancia do canal do vapor d agua ou X3 ilustrado na gura 2.4(d), para a vari ancia do canal infravermelho ou X4 ilustrado na gura 2.4(e) e por u ltimo do c alculo do VIL a partir do radar ilustrado na gura 2.4(f). Uma curva de distribui ca o normal foi sobreposta aos gr acos das guras para facilitar a an alise.
7 8

The R Project for Statistical Computing, dispon vel no link http://www.r-project.org/ MINITAB http://http://www.minitab.com/

14

(a) C3 vapor de agua

(b) C4 infravermelho

(c) diferen ca C4 - C3

(d) variabilidade do canal C3

(e) variabilidade do canal C4

(f) c alculo do VIL em kg/m2

Figura 2.4 - Gr acos dos dados obtidos simultaneamente a partir de 80 amostras de imagens dos canais do GOES, dos seus dados derivados e tamb em do c alculo do VIL limitado ` a regi ao de maior sensibilidade a partir das imagens do radar.

Conforme pode ser observado na gura 2.4(a), pode-se notar dois padr oes de dados t picos no canal de vapor d agua do GOES. O primeiro entre aproximadamente 220 a 240 K e um segundo de amplitude maior acima destes valores. Fisicamente estes dados s ao correspondentes a dois tipos diferentes de nuvens com temperaturas frias e quentes. Tamb em nota-se a presen ca em menor quantidade de dados intermedi arios entre os dois padr oes. Apesar de individualmente os dois padr oes apresentarem um 15

perl de distribui c ao normal, o perl dos dois padr oes em conjunto n ao se aproxima de uma distribui ca o normal. Conforme pode ser observado na gura 2.4(b) no canal de infra-vermelho, pode-se notar tamb em pelo menos dois padr oes de dados t picos no canal C4 de infravermelho do GOES. O primeiro entre aproximadamente 220 a 253 K e um segundo acima destes valores. O segundo padr ao maior, aparentemente possui dois padr oes de dados menores misturados, mas como n ao foi encontrado ainda um signicado f sico ou evento justic avel para separ a-los, ser ao considerados um s o padr ao. Ainda n ao foi determinado se estes dois padr oes maiores possuem o mesmo signicado f sico indicado na an alise do C3. A distribui c ao dos padr oes em conjunto n ao se aproxima da distribui c ao normal. Conforme pode ser observado na gura 2.4(c), pode-se notar pelo menos tr es padr oes t picos de dados sobrepostos, na diferen ca entre os canais C43 do GOES. Da mesma forma que na an alise do C4, tamb em n ao foi determinado ainda o signicado f sico destes padr oes. A distribui ca o dos padr oes em conjunto n ao se aproxima da distribui ca o normal. Fisicamente valores negativos nestes dados, s ao relativos a nuvens que apresentam grande movimento convectivo vertical, granizo ou a tespestades e descargas el etricas. De acordo com Walck (2007, Cap. 12) dados com este perl podem ser descritos a partir de uma distribui ca o do tipo Doubly Non-Central t-Distribution. Conforme pode ser observado nas guras 2.4(d), 2.4(e) e 2.4(f), pode-se observar que os dados de variabilidade de X3, X4 e VIL n ao possuem o comportamento da distribui ca o normal. Aparentemente os dados s ao todos acima de zero e podem ser descritos a partir de uma distribui c ao gama espec cas a cada caso. 2.4.2 An alise dos componentes principais ou PCA

Deseja-se vericar a contribui ca o de cada uma das cinco vari aveis sugeridas pelos pesquisadores do CEMADEN C3, C4, C43, X3 e X4 como regressores e o de VIL como resposta. Mas antes e necess ario investigar qual a poss vel contribui ca o de cada um deles na resposta, atrav es da an alise de componentes principais ou PCA. Existem dois tipos de an alise de componentes principais a partir da matriz de covari ancia e da matriz de correla ca o. Gracamente os componentes s ao ilustrados atrav es de gr acos chamados de scree plot, conforme indicado na gura 2.5.

16

(a) matriz de covari ancia

(b) matriz de correla c ao

Figura 2.5 - Gr aco do tipo scree plot, ilustrando a import ancia de cada regressor atrav es dos autovalores na an alise de componentes principais.

A an alise dos componentes principais tamb em indica a import ancia dos componentes principais, obtidos a partir dos autovalores, a sua propor ca o em rela c ao a ` variabilidade total e o acumulado, conforme pode ser observado nas tabelas 2.4 e 2.5. Nestas tabelas est ao descritos os autovalores (Aut), a sua propor c ao individual do total da vari ancia da popula ca o amostrada devido ao componente analizado (Prop) e a sua contribui ca o cumulativa na variabilidade (Acum).

Tabela 2.4 - An alise dos autovalores pela matriz de covari ancia An C3 C4 C43 X3 X4 Aut 610.12 31.88 1.57 0.07 0 Prop 0.948 0.050 0.002 0 0 Acum 0.948 0.997 1 1 1

Tabela 2.5 - An alise dos autovalores pela matriz de correla c ao An C3 C4 C43 X3 X4 Aut 3.0087 1.5035 0.3389 0.1489 0 Prop 0.602 0.301 0.068 0.030 0 Acum 0.602 0.902 0.970 1 1

As tabelas 2.6 e 2.7 indicam as matrizes de covari ancia e correla ca o obtidas nos c alculos respectivamente a partir da an alise da matriz de covari ancia e de correla ca o. A partir dos resultados obtidos na an alise dos componentes principais, pode-se estabelecer quais s ao as principais vari aveis dentre as propostas que contribuem para a confec c ao do modelo de regress ao linear m ultipla na pr oxima se c ao. De acordo com o indicado na tabela 2.6, C3 e C4 respondem cumulativamente com 99, 7% da variabilidade do fen omeno modelado.

17

Tabela 2.6 - matriz de covari ancia Var C3 C4 C43 X3 X4 PC1 -0.399 -0.816 -0.417 0.008 0.001 PC2 0.710 0.010 -0.700 -0.038 -0.055 PC3 -0.044 -0.001 0.043 -0.211 -0.976 PC4 -0.022 -0.007 0.015 -0.977 0.213 PC5 0.577 -0.577 0.577 0 0

Tabela 2.7 - matriz de correla c ao Var C3 C4 C43 X3 X4 PC1 -0.545 -0.560 -0.497 0.364 0.094 PC2 -0.044 -0.185 -0.296 -0.560 -0.750 PC3 -0.358 0.101 0.530 0.493 -0.581 PC4 -0.629 -0.091 0.441 -0.577 0.302 PC5 0.420 -0.796 0.436 0 0

O regressor C43 foi respons avel por 6, 8% da variabilidade segundo a matriz de correla c ao, e 0, 2% pela matriz de covari ancia. C43 n ao foi inclu do na equa ca o de regress ao porque cancelava os termos C3 e C4 e tamb em por sua contribui ca o n ao ser signicativa de acordo com a an alise da matriz de covari ancia. 2.4.3 Modelo de regress ao linear m ultipla

Apesar dos inconvenientes levantados nas subse co es anteriores com rela ca o ` a normalidade dos dados, ser a utilizado um modelo de regress ao linear m ultipla com a nalidade de estabelecer um par ametro de compara c ao para a an alise de previs ao dos dados. O modelo de regress ao obtido na an alise est a descrito na equa ca o 2.5.

V IL = 3.13 0.005132 C 3 0.00533 C 4 +

(2.5)

Segundo Montgomery e Runger (2003, Sec. 10.4), modelos de regress ao n ao s ao necessariamente v alidos para nalidade de extrapola c ao e que as rela c oes de regress ao s ao v alidas somente para a faixa de valores dos dados originais. Portanto no presente caso para um bom modelo de regress ao recomenda-se um conjunto de amostragem mais representativo de toda a faixa de variabilidade dos dados. Vale a pena salientar que no presente relat orio, est a sendo realizada uma an alise preliminar para vericar a viabilidade de utiliza c ao do m etodo. Os coecientes obtidos no modelo de regress ao est ao descritos na tabela 2.8. A an alise de vari ancia obtida no modelo de regress ao encontra-se descrita na tabela 2.9. importante observar o resultado obtido do coeciente de determina E c ao R2 = 13.2% ou R-Sq na tabela 2.8. Este coeciente indica a quantidade da variabilidade dos

18

Tabela 2.8 - Tabela dos coecientes encontrados no estabelecimento da regress ao linear m ultipla.

Predictor Coef SE Coef T P Constant 3.13305 0.06969 0.06969 0.000 C3 -0.0051308 0.0005604 -9.16 0.000 C4 -0.0053306 0.0002959 -18.01 0.000 erros S = 0.408505 R-Sq = 13.2% R-Sq(adj) = 13.2%

Tabela 2.9 - Tabela da an alise de vari ancia do modelo de regress ao linear m ultipla.

Fonte de variabilidade Regress ao Residual Total

Soma dos MQ quadrados 2 851.11 425.56 33464 5584.35 0.17 33466 6435.47

DF

F0

2550.13 0.000

dados, considerada no modelo de regress ao Montgomery e Runger (2003, Sec. 10.8.2). Em geral este coeciente varia entre 0 R2 100%. 2.4.4 Verica c ao da adequa c ao do modelo de regress ao

Nesta se ca o ser a vericado se o modelo est a se comportando de maneira linear de primeira ordem, atrav es do teste de signic ancia, an alise dos res duos, ao coeciente de regress ao e falta de ajuste. Para isto supomos que os erros a componente do erro do modelo tenham distribui c ao normal com m edia zero e vari ancia 2 ou N (0, 2 ). 2.4.5 Teste de signic ancia do modelo de regress ao linear multipla

O teste e realizado para vericar se existe uma rela c ao linear entre a vari avel de resposta (VIL) e o conjunto de rergressores C3 e C4. As hip oteses apropriadas s ao as seguintes:

H0 : C 3 = C 4 = 0 H1 : Cj = 0

(2.6)

onde a rejei c ao de H0 implica que pelo menos um dos regreessores contribui signicativamente para o modelo. A partir da tabela 2.9 ANOVA do coeciente de regress ao,

19

obtemos os valores 1 = 2, 2 = 43276 =

graus de liberdade respectivamente

para o numerador e denominador e F0 = 5341, 24. A partir de uma tabela estat stica (MONTGOMERY; RUNGER, 2003, tab. v) , obtemos os seguintes pontos percentuais da distribui c ao F: f=0,25;1 =2;2 = = 1, 39 f=0,10;1 =2;2 = = 2, 30 f=0,05;1 =2;2 = = 3, 00 f=0,025;1 =2;2 = = 3, 69 f=0,01;1 =2;2 = = 4, 61 Como F0 > f ; 1 ; 2 para quaisquer indicado acima, rejeitamos H0 e com isto conclu mos que no m nimo um dos regressores (C3 ou C4) contribui signicativamente para o modelo. 2.4.5.1 An alise residual

Conforme pode ser observado na an alise dos res duos ilustrado na gura 2.6(a), esta pode ser considerada boa suposi ca o. A partir dos dados da gura 2.6(a) (probabilidade normal dos res duos padronizados). 95 % dos valores residuais devem se encontrar no intervalo [2, +2] (MONTGOMERY; RUNGER, 2003, sec 10.8.1). conforme pode ser observado no gr aco existem alguns outliers entre os dados. Outra observa c ao importante obtida a partir do gr aco res duos versus valores dos dados VIL, e que a vari ancia das observa co es cresce com o valor da magnitude (MONTGOMERY; RUNGER, 2003, sec 10.8.1). A vari ancia pode ser estabilizada com o uso de uma das seguintes transforma co es V IL, ln V IL ou 1/V IL. O perl de distribui ca o dos res duos indicam a presen ca de mais de um padr ao, de acordo com os gr acos das guras 2.4(a) e 2.4(b). A resposta dos res duos em rela ca o ao regressor C3 (vapor de agua) na gura 2.6(b), indica que o modelo subestima os valores de VIL para temperaturas entre 220 e 240
Observa c ao: 2 = 43276?. Nas tabelas de distribui c ao F, valores acima de 120 s ao considerados graus de liberdade.
9

20

(a) An alise dos res duos em rela c ao ao VIL

(b) An alise dos res duos em rela c ao ao regressor C3

(c) An alise dos res duos em rela c ao ao regressor C4

Figura 2.6 - Figura indicando a an alise dos res duos do modelo de regress ao utilizado.

e tamb em acima de 245. Aparentemente esta rela c ao n ao e linear e pode requerer 2 um termo C 3 . Outro fato a ser observado e que a vari ancia dos dados decresce com a magnitude de C3 e tamb em que a vari ancia n ao e constante. O Valor dos res duos aumentam na proximidade da ocorr encia de nuvens do tipo convectiva e estratiforme e e menor para a ocorr encia de valores intermedi arios entre os dois tipos de nuvens. A resposta dos res duos em rela c ao ao regressor C4 (infra-vermelho) 2.6(c), indica tamb em que o modelo subestima os dados aproximadamente em 230. Como no 21

caso de C3, a vari ancia tamb em decresce, mas de uma forma mais constante com o aumento da magnitude da temperatura. 2.4.5.2 An alise das superf cies de resposta

A partir da an alise das guras de contorno ilustradas na gura 2.7, as seguintes observa c oes podem ser elicitadas. Na gura 2.7(a), observa-se duas ocorr encias distintas de VIL acima de 4 kg.m2 , podendo resultar em duas categorias distintas causado por valores diferentes de C3 e C4. Duas categorias tamb em foram observadas acima de 4 kg.m2 quando analisamos C43 e C3 no gr aco 2.7(c) e quatro 2 categorias distintas acima de 3 kg.m . Quando analisamos C43 e C4 no gr aco 2.7(d) duas categorias de dados distintas s ao observadas acima de 3 kg.m2 . O gr aco de contorno 2.7(b) de X3 e X4 que apresentou tr es categorias para valores acima de 3 kg.m2 .

(a) Contorno de VIL em rela c ao a C3 e C4

(b) Contorno de VIL em rela c ao a X3 e X4

(c) Contorno de VIL em rela c ao a C43 e C3

(d) Contorno de VIL em rela c ao a C43 e C4

Figura 2.7 - Figura indicando os gracos de contorno do VIL em rela c ao aos canais do GOES e seus derivados. As unidades de VIL est ao em kg.m2 , as de C3 e C4 em K e X3 e X4 s ao adimensionais.

22

Conforme ilustrado na gura 2.7, pode-se observar que existem v arios picos de grande descontinuidade nos gr acos. Estas descontinuidades dicultam o estabelecimento de um modelo de regress ao, que em geral e utilizado para modelar fen omenos com variabilidade mais suave. A partir deste ponto e indispens avel a participa c ao de um especialista da area para auxiliar no estabelecimento de um dom nio apropriado de an alise dos fen omenos. 2.5 Valida c ao

A valida c ao do modelo foi realizada, comparando os dados do modelo de VIL estimados a partir do sat elite com dados obtidos a partir do radar de S ao Roque. Foram utilizados dados de 47 imagens do dia 21 de abril de 2012, na valida ca o. Vale a pena salientar o seguinte: os dados analisados s ao da mesma regi ao e est ao na mesma resolu c ao espacial; somente os bins da regi ao de maior sensibilidade do radar est ao sendo considerados; 913 bins de radar de S ao Roque foram utilizados na valida ca o. A AED do VIL estimado est a ilustrado na gura 2.8(a) e o do VIL obtido a partir do radar de S ao Roque est a ilustrado na gura 2.8(b).

(a) Dados do VIL estimados obtidos a partir do modelo (b) Dados do VIL estimados obtidos a partir do radar de de regress ao S ao Roque

Figura 2.8 - Ilustra c ao acerca da AED realizada nos dados do c alculo do VIL utilizados na valida c ao.

23

As diferen cas entre os dois resultados para o mesmo pixel podem ser observadas na gura 2.9. Conforme pode ser observado nesta gura, as diferen cas entre os dois dados tem uma distribui c ao aproximadamente normal conforme indicado nas guras 2.9(a) e 2.9(b). A m edia e a mediana est ao muito pr oximas, mas n ao possuem um valor pr oximo de zero indicando um bias de aproximadamente 0, 83 kg.m2 . A estimativa do modelo de regress ao obtido a partir de sat elite est a subestimando os dados de VIL, em rela ca o ao dado obtido a partir do radar de S ao Roque. S ao indicativos de erros sistem aticos que podem signicar diferen cas entre os entre os radares ou problemas no modelo. Mas este fato precisa ser investigado mais detalhadamente para ser conclusivo.

(a) Diferen cas entre os valores estimados e calculados

(b) Distribui c ao de probabilidade entre as diferen cas

(c) Gr aco de contorno ilustrando a incid encia das maiores diferen cas nos valores de VIL entre os dois modelos

Figura 2.9 - Figura comparando estatisticamente os resultados do c alculo do VIL entre o modelo de regress ao obtido pelo sat elite GOES e pelo radar de S ao Roque.

Outra observa ca o importante a ser notada e a grande variabilidade nas diferen cas entre os valores acima de 2, 50 kg.m2 de acordo com o ilustrado na gura 2.9(c). 24

Isto pode ser explicado pelo fato do modelo de regress ao ter sido estabelecido em uma faixa de valores inferior aos dados observados pelo radar de S ao Roque. Isto e de acordo com a gura 2.4(f) os valores dos dados do coeciente de regress ao estavam em sua maioria abaixo de 1, 6 kg.m2 com um m aximo de 2, 85 kg.m2 . Os dados do radar de S ao Roque estavam monitorando um fen omeno mais intenso com valores bem acima dos utilizados para estabelecer o modelo de regress ao com um m aximo na ordem de 3, 77 kg.m2 . Conforme recomendado por Montgomery e Peck (1992, cap. 1) os modelos de regress ao s ao validos somente dentro da faixa de variabilidade dos dados utilizados para a confec ca o do modelo. A gura 2.9(c) demonstra claramente este problema, indicando que as maiores diferen cas existem para valores de VIL estimados para o Radar de S ao Roque aproximadamente acima de 2, 50 kg.m2 . 2.6 Coment arios acerca da an alise estat stica

Vale a pena salientar que a an alise realizada aqui e um estudo de caso. As 80 imagens de radar e sat elite utilizadas s ao relativas a um s o dia, para vericar a viabilidade do modelo proposto. Para um estudo mais renado e necess ario estabelecer um experimento estat stico que considere eventos distintos al em da variabilidade di aria e sazonal. A quantidade de dados analisada utilizada tamb em foi muito grande. Para uma an alise mais renada recomenda-se o planejamento de um experimento e um conjunto de dados mais racionalizado, para reduzir a grande quantidade de fatores n ao controlados a ser considerados no modelo . Inicialmente acreditava-se que todos os fen omenos pudessem ser modelados simultaneamente atrav es de distribui c oes do tipo normal. Mas, conforme pode ser observado na an alise dos gr acos na se c ao 2.4.1, o modelo de distribui c ao normal n ao e muito bom para representar simultaneamente os dois tipos de precipita c ao (estratiforme e convectiva) que aparecem em destaque nos dados. Estes fen omenos devem ser modelados separadamente. Sob o ponto de vista estat stico, utilizar um s o modelo de regress ao linear para abranger os dois padr oes em um s o, teria os seguintes inconvenientes.

O modelamento assumiria que o comportamento dos dados teria distribui ca o normal, de acordo com o indicado na linha azul dos gr acos da gura 2.4. 25

Os sistemas do tipo estratiforme e convectivo seriam subestimadas. As nuvens intermedi arias seriam superestimadas. Os erros envolvidos no modelamento seriam maiores e a an alise de consist encia dos res duos indicaria uma vari ancia n ao constante. Para tentar reduzir estes problemas um modelo em separado para cada tipo de sistema deve ser estabelecido. Recomenda-se tamb em um conjunto de amostragem mais representativo de toda a faixa de variabilidade dos dados.

26

3 CONCLUSOES Neste relat orio est ao descritas as atividades relativas ao desenvolvimento de um modelo para a estimativa do conte udo de agua l quida (VIL), a partir de um estudo de caso, utilizando imagens de sat elite, validado por imagens de radar meteorol ogico (Z). Foram utilizados os canais C3 e C4 do sat elite GOES-12, alem da diferen ca entre os canais C43 e suas vari ancias X3 e X4. Para a constru ca o do modelo foram utilizadas 80 imagens do dia 25 de Abril de 2012 obtidas a cada 15 minutos do radar do Morro da Igreja em Santa Catarina validado com as imagens do radar de S ao Roque no Estado de S ao Paulo. Durante o modelamento, foi utilizada uma an alise explorat oria de dados (EDA) para determinar as distribui c oes de dados presentes e estabelecer um modelo de regress ao linear m ultipla. A an alise de componentes principais (PCA) foi utilizada para eliminar os par ametros redundantes da an alise estat stica. Regi oes como o cone de sil encio e o ru do foram removidas das imagens para melhorar a qualidade do modelo. Somente a regi ao com monitoramento mais detalhado do radar foi utilizada no modelo. Devido a diferente resolu ca o espacial existente entre as imagens de radar e sat elite, foram utilizados algoritmos de redimensionamento para reduzir as imagens a mesma resolu ca o. A interpola ca o Nearest Neighbour(NN) foi utilizada no algoritmo de redimensionamento para n ao inserir pixeis articiais nas imagens. O modelo deve apresentar uma ligeira sub estimativa do VIL, por causa da amostragem incompleta devido a lacunas existentes nas imagens de radar utilizadas. Este problema poder a ser resolvido utilizando interpola c ao 3-D. A AED indicou a presen ca de dados multimodais nos diferentes canais, o modelo de regress ao foi mantido para vericar o comportamento dos dados. Pelo menos uma separa c ao dos padr oes convectivos e estratiformes deveriam ser utilizados para um modelo mais preciso. PCA indicou que os canais C3 e C4 eram 99 % signicantes do modelo de vari ancia. O coeciente de regress ao indicou que o modelo representava somente 13.2 % da variabilidade dos dados. A grande quantidade de outliers e dados intermedi arios, inuenciaram tendenciosamente os resultados devido a natureza m edia quadr atica do modelo de regress ao linear. Acredita-se que estes outliers nos dados representem uma grande quantidade de ru dos nas imagens que precizariam ser removidos para uma an alise mais renada do modelo 27

O gr aco de contorno dos canais C3 e C4 pelo VIL apresentou v arios picos ou padr oes conrmando a natureza multimodal de padr oes, indicando que existem m ultiplas causas de precipita co es intensas. Durante a valida c ao dos dados as diferen cas entre o modelo e os dados do radar de S ao Roque apresentaram uma distribui c ao normal, mas com uma tend encia de estimativa maior pelo radar de S ao Roque. Estas diferen cas ocorreram por que o intervalo de dados do modelo de regress ao utilizado no radar do Morro da Igreja era menor que os dados utilizados no radar de S ao Roque. De acordo com a literatura especializada a maior escala de dados poss vel deve ser utilizada para construir o modelo de regress ao. As causas f sicas das distribuicoes multi modais devem ser investigadas em um experimento controlado mais rigorosamente. Durante as atividades, foram desenvolvidas rotinas para leitura e processamento de imagens utilizando bibliotecas de c odigo em aberto OPENCV para extrair par ametros das imagens 3-D de radar e de sat elite, para redimensiona-las e compar a-las simultaneamente. Estas rotinas facilitar ao os trabalhos futuros a serem desenvolvidos nesta area. Finalmente recomenda-se a realiza ca o de um novo experimento mais controlado sob a supervis ao de um especialista em meteorologia que utilizando o seu conhecimento t acito poder a direcionar o experimento de maneira mais controlada utilizando um novo conjunto de dados.

28

REFERENCIAS BIBLIOGRAFICAS

CHARTER, N.; TENENBAUN, J. B.; A., Y. Probabilistic models of cognition: Conceptual foundations. Trends in cognitive sciences, v. 10, p. 287291, 2006. 1 . Probabilistic models of cognition: where next? Trends in cognitive sciences, v. 10, p. 292293, 2006. 1 DESERNO, M. Linear and Logarithmic Interpolation. [s.n.], March 24, 2004. Dispon vel em: <www.cmu.edu/biolphys/deserno/pdf/log_interpol.pdf>. 7 DODGSON, N. A. Image resampling. Disserta ca o (Mestrado) University of Cambridge, 1992. 11, 12 GREENE, D. R.; CLARK, R. A. Vertically integrated liquid water aa new analysis tool. mon. wea. rev., 100, 548 a552. Monthly Weather Review, v. 100, p. 548 a552, 1972. 1, 8 JOHANNET, A.; VAYSSADE, B.; BERTIN, D. Neural networks: From black box towards transparent box application to evapotranspiration modeling. World Academy of Science, Engineering and Technology, v. 30, p. 162169, 2007. Dispon vel em: <http://www.waset.org/journals/waset/v30.php>. 1 LILLESAND, T. M.; KIEFER, R. W. Remote Sensing and Image Interpretation. [S.l.]: John Wiley & Sons, 1994. 750 p. 11 MONTGOMERY, D. C. Design and Analisys of Experiments. [S.l.]: John Wiley and Sons Inc., 2005. 643 p. 12, 14 MONTGOMERY, D. C.; PECK, E. A. Introduction to Linear Regression Analysis. 2nd. ed. [S.l.]: John Wiley & Sons, 1992. 13, 25 MONTGOMERY, D. C.; RUNGER, R. C. Applied Statistics and Probability for Engineers. 3 rd. ed. [S.l.: s.n.], 2003. 976 p. 18, 19, 20 NIST. Engineering Statistics Handbook. NIST - National Institute of Standards, 2009. Dispon vel em: <http://www.itl.nist.gov/div898/handbook/eda/eda.htm>. 1, 4 29

PARKER, J. A.; KENYON, R. V.; TROXEL, D. E. Comparison of interpolating methods for image restoration. IEEE TRANSACTIONS ON MEDICAL IMAGING, MI-2, p. 3139, 1983. 11 RICHARDS, J. Remote Sensing Digital Image Analysis: An Introduction. 2nd. ed. Springer, 1995. ISBN 9783540251286. Dispon vel em: <http://books.google.com.br/books?id=4PB5vhPBdJ4C>. 11, 12 SCHOWENGERDT, R. A. Remote Sensing Models and Methods for Image Processing. 3rd. ed. [S.l.]: Academic Press, 2007. 515 p. 11, 12 WALCK, C. Handbook on Statistical Distributions for Experimentalists. [s.n.], 2007. Dispon vel em: <www.physto.se/~walck(0)>. 16 WILKS, D. S. Statistical methods in the atmospheric sciences. [S.l.]: Academic Press, 2005. 627 p. (International Geophysics Series). 13 WMO, W. M. O. Training Course on Weather Radar Systems. ALANYA FACILITIES, ANTALYA, TURKEY: [s.n.], September 2005. 8 YUILLE, A.; KERSTEN, D. Vision as bayesian inference: analysis by synthesis? Trends in Cognitive Sciences, v. 10, n. 7, p. 301 308, 2006. ISSN 1364-6613. Special issue: Probabilistic models of cognition. Dispon vel em: <http://www.sciencedirect.com/science/article/B6VH9-4K717XN-1/2/ f574d61f93f8906ccc3f9457d3dba11d>. 1 ZHANG, P. G. Avoiding pitfalls in neural network research. IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS PART C APPLICATIONS AND REVIEWS., v. 37, p. 316, January 2007. 1

30

Você também pode gostar