Você está na página 1de 29

Modelo espacial para descrever a

ocorrência de tornados nos Estados


Unidos da América.

Estatística Espacial
Professora: Renata Bueno
Aluno: Isaac Victor Silva Rodrigues
Justificando a construção do slide:

Como o slide não será apresentado eu decidi fazer algo que não costumo fazer,
que é um slide mais escrito e denso para explicar melhor os pontos.
Motivação:
Durante a elaboração do trabalho meu primeiro objetivo era descrever a radiação
na zona de exclusão de Chernobyl. Apesar de ter achado dados atuais das
medições de radiação na região de Chernobyl e da cidade Pripyat, eu tive grande
dificuldade em encontrar os shapefiles cartográficos dos Oblast(estados da
Ucrânia). Após pesquisar um tempo decidi abandonar a oportunidade de trabalhar
com Chernobyl e comecei a pensar em outras bases.
Tive a idéia de estudar fenômenos naturais e eventualmente surgiu a reflexão de
tentar descrever a ocorrência de tornados nos estados americanos. Como
Tornados são essencialmente fenômenos climáticos, minhas reflexões me levaram
a pensar em descrever o número total de tornados em um ano, pore estado
americano, em função das características climáticas de cada estado dos Estados
Unidos da América.
Motivação:
As variáveis que tive inicial interesse foram:

● Número total de tornados em cada estado num ano específico.

● Temperatura média dos estados em um ano específico.

● Umidade média dos estados em um ano específico.

● Precipitação média dos estados em um ano específico.

● Elevação média dos estados com relação ao nível do mar.


Motivação:
Ao decorrer da sexta, sábado, do domingo e da segunda estive empenhado em
encontrar as bases necessárias para fazer o trabalho ( segunda acordei 8 da
manhã e fiquei até 11 da noite procurando a base), justifico assim que tive muita
dificuldade para encontrar algumas bases. Em particular, aconteceu algo similar ao
que aconteceu com Chernobyl, parte das bases necessárias pro trabalho eu
encontrei e outra parte simplesmente não consegui encontrar.
Mas como o dado parecia ser mais simples de encontrar do que dados em alfabeto
Cirilico com esta pesquisa.
Motivação:
No final consegui encontrar:

● O número total de tornados para um ano específico 2020.


● Dados referentes ao relevo dos estados.
● Mapas dos estados, fornecendo os limites geográficos de cada um.

E tive dificuldade de encontrar os dados climatológicos referentes a um ano


específico.
Em geral achei dados médios, que abrangiam vários anos. Então como a
precipitação e a umidade pode variar muito em um ano, principalmente por
fenômenos no Oceano Atlântico eu decidi utilizar apenas a temperatura média para
os estados americanos. Apesar de existir o aquecimento global, a temperatura
global variou pouco mais de 1 grau e meio nos últimos 50 anos, então não me
pareceu grosseiro utilizar esta temperatura média como uma variável de referência.
Motivação:
Tive problemas para obter os dados do site https://www.ncdc.noaa.gov/cdo-web/
que serviria de referência climatologica nos Estados Unidos. Em particular no site
eles só fornecem estas tabelas prontas, com médias de vários anos e também
fornecem alguns gráficos pré-elaborados.

Para obter as informações para um ano específico podemos utilizar API para R
chamada rnoaa. O problema é que não consegui me entender com os comandos
da API.
Dados utilizados:
Os dados que obtive foram:
● Shapefiles dos estados americanos, obtidos no Censo americano de 2018
https://www.census.gov/geographies/mapping-files/time-series/geo/carto-b
oundary-file.html
● Dados referentes a elevação média dos Estados americanos obtido por web
scrapping no site :
https://www.infoplease.com/us/geography/highest-lowest-and-mean-elevati
ons-united-states e verificado em outros sites.
● Temperatura média dos estados americanos durante os anos de 1971-2000
coletada por web scrapping no site:
https://www.currentresults.com/Weather/US/average-annual-state-temperat
ures.php e verificada nos mapas do site do NOAA
● Número total de tornados nos estados americanos no ano de 2020 cuja a
base foi coletada no site de previsão de tempestades
https://www.iii.org/table-archive/20621
Dados utilizados:
● Os dados das variáveis de interesse foram pareados com base nos nomes
dos estados americanos pelo o próprio R.

● Foram utilizados apenas dados do Estados Unidos Continental(Alaska


excluso para facilitar a análise e também por não existir tornados em ilhas
oceânicas como o Hawaii ou no Alaska.
Gráficos iniciais:
Eu utilizei o mapa dos Estados Unidos Continental para avaliar inicialmente os
dados, seguem os gráficos obtidos:

● Número total de tornados por estado no ano de 2020:

Comentário
do gráfico:
Podemos
notar uma
tendência
dos tornados
ocorrem ao
sudeste e ao
sul. Isso se
repete para
outros anos
Gráficos iniciais:
Eu utilizei o mapa dos Estados Unidos Continental para avaliar inicialmente os dados,
seguem os gráficos obtidos:

● Elevação média em metros dos estados americanos com relação ao nível do mar

Parece
indicar uma
correlação
negativa com
o gráfico
anterior.
Gráficos iniciais:
Eu utilizei o mapa dos Estados Unidos Continental para avaliar inicialmente os dados,
seguem os gráficos obtidos:

● Temperatura média nos anos de 1971-2000 em graus celsius, para cada estado.

Pareceu
existir uma
correlação
positiva com
a ocorrência
de tornados.
Gráficos iniciais:

● Olhando os gráficos iniciais me pareceu que o modelo com estas duas variáveis
ficaria promissor e serviria para descrever bem a variável de interesse.
Análises Espaciais:
● Comecei verificando os vizinhos de cada estado e como eles estavam
distribuídos:

Descrição Valor

Número de estados 48

Número de conexões 214

Porcentagem de pesos não nulos 9,2882

Número médio de conexões 4,458

Achei que estes números estão razoáveis, principalmente as conexões que apresentam
quase conexões com 5 estados ‘em média’. 5 estados fazendo fronteira com cada estado
me parece um mapa razoavelmente denso.
Análises Espaciais:
● Decidi então verificar o Índice de Moran para verificar dependência espacial,
calculei a matriz de distâncias e após isso calculei este índice.
Como indicado no
gráfico, o p-valor
estimado deu
bastante pequeno
e o índice de
Moran deu um
valor razoável o
que demonstra
uma correlação
espacial.
‘Rejeitamos a
hipótese nula com
base no pseudo p
valor
Análises Espaciais:
● Decidi então verificar o Índice de Moran para verificar dependência espacial,
calculei a matriz de distâncias e após isso calculei este índice.
Como indicado no
gráfico, o p-valor
estimado deu
bastante pequeno
e o índice de
Moran deu um
valor razoável o
que demonstra
uma correlação
espacial.
‘Rejeitamos a
hipótese nula com
base no pseudo p
valor
Análises Espaciais:
● Fiz o teste de resíduos para um modelo linear, utilizando o comando lm.morantest

Modelo Índice Moran obs Esperança Variância

Minimal 0,5628 -0,02128 0,0095

Tornados em função das 0.2723 -0,0558 0,0085


variáveis preditoras

Podemos ver que quando comparado com o modelo minimal apenas o índice de moran obs e
a expectativa tiveram uma redução substancial, indicando uma diminuição da dependência
espacial
Análises Espaciais:
● Ainda sobre os teste com o modelo linear, segue os Moran I desvio padrão da
estatística e os p-valores destas quantidades.

Modelo Moran I desvio p-valores


padrão da estatística

Minimal 6,0049 9,575e-10

Tornados em função das 3,5388 0,000201


variáveis preditoras

Podemos observar que os Moran I desvio padrão da estatística com as variáveis preditoras parece
ter reduzido bastante, quase a metade, com relação ao modelo minimal. Podemos notar também
que ambos os modelos rejeitam a hipótese de aleatoriedade espacial. Talvez deve-se ter usado
outras variáveis preditoras.
Análises Espaciais:
● Ainda sobre os teste com o modelo linear, segue os Moran I desvio padrão da
estatística e os p-valores destas quantidades.

Modelo Moran I desvio p-valores


padrão da estatística

Minimal 6,0049 9,575e-10

Tornados em função das 3,5388 0,000201


variáveis preditoras

Podemos observar que os Moran I desvio padrão da estatística com as variáveis preditoras parece
ter reduzido bastante, quase a metade, com relação ao modelo minimal. Podemos notar também
que ambos os modelos rejeitam a hipótese de aleatoriedade espacial. Talvez deve-se ter usado
outras variáveis preditoras. Mais a frente poderemos ver melhor se existe alguma variável que
compromete o modelo.
Análises Espaciais:
● Ainda sobre os teste com o modelo linear, segue os Moran I desvio padrão da
estatística e os p-valores destas quantidades.

Modelo Moran I desvio p-valores


padrão da estatística

Minimal 6,0049 9,575e-10

Tornados em função das 3,5388 0,000201


variáveis preditoras

Podemos observar que os Moran I desvio padrão da estatística com as variáveis preditoras parece
ter reduzido bastante, quase a metade, com relação ao modelo minimal. Podemos notar também
que ambos os modelos rejeitam a hipótese de aleatoriedade espacial. Talvez deve-se ter usado
outras variáveis preditoras. Mais a frente poderemos ver melhor se existe alguma variável que
compromete o modelo.
Análises Espaciais:
● Daí decidi calcular o Diagrama de Espalhamento mde Moran

Podemos ver Também é possível


que texas e perceber que a
Missippi são imensa maioria dos
outliers com estados apresentam
relação ao valores no quadrante
resto dos baixo-baixo do
dados. Eles gráfico, indicando
apresentam que a ocorrência de
valores de tornados tende a ser
tornado muito baixa e se restringir a
acima do resto. um grupo muito
Já Louisiana específico de
faz divisa com estados.
estes outros
estados
Análises Espaciais:
● Daí decidi calcular o Diagrama de Espalhamento de Moran segue o gráfico
indicando o resultado do diagrama.
Análises Espaciais:
● Também calculei o índice local de Moran, os estados que se destacaram estão
indicados no mapa com a coloração correspondente ao índice local
Modelos SAR e SEM:
● Daí por fim decidi partir para os modelos. Primeiro tentei modelo SAR.

Termos Estimativas Erro Padrão Valor Z Pr(>|z|)

Intercepto -8,719 9,895 -0,881 0,378

Temperatura(C) 2,228 0,833 2,674 0,007

Altitude(m) -0,004 0,005 -0,826 0,409

Podemos ver que nem a altitude nem o intercepto deram significativos. A altitude relativa ao nível
do mar me surpreendeu, eu realmente achei que daria significativo com base nos primeiros
gráficos. Contudo essa foi uma interpretação equivocada, olhando novamente percebo diversos
estados que estão próximos ao nível do mar que não apresentam tornados. Então considerando o
Estados Unidos continental como um todo, a altitude com relação ao nível do mar não serve para
descrever bem a ocorrência ou não de tornados de fato.
Análises Espaciais:
● Daí por fim decidi partir para os modelos. Primeiro tentei modelo SAR.

Termos Estimativas Erro Padrão Valor Z Pr(>|z|)

Intercepto -8,719 9,895 -0,881 0,378

Temperatura(C) 2,228 0,833 2,674 0,007

Altitude(m) -0,004 0,005 -0,826 0,409

Ainda neste modelo SAR, segue o Rho mostrando que existe alguma dependência espacial bem
como o p-valor do modelo mostrando que o modelo é significativo por conta da temperatura:

Rho: 0,49437

p-value: 0,0016249
Modelos SAR e SEM:
● Apesar de o modelo ser significativo tanto o teste de shapiro, bem como o
histograma dos resíduos indicam que não foi possível obter uma representação
de uma distribuição normal. O que invalida o modelo pois os resíduos não
parecem ser observações aleatórias de uma distribuição normal.

Histograma muito
assimétrico
Modelos SAR e SEM:
● Tentei executar o modelo sem a variável altura, apenas com a variável
temperatura para ver se isso estava influenciando na distribuição dos resíduos, e
infelizmente o resultado foi o mesmo, não foi possível obter observações
aleatórias de uma normal nos resíduos.

Histograma Resultado:
muito
assimétrico Modelo SAR se
mostrou invaido
para os meus
dados e
variáveis por
não apresentar
normalidade
nos resíduos
Modelos SAR e SEM:
Por fim tentei utilizar o modelo SEM, no entanto assim como SAR ele
apresentou problemas nos resíduos como indicado no histograma dos resíduos
abaixo. A assimetria dos resíduos é muito presente
Conclusão:
Fiquei insatisfeito com o resultado do modelo pois a primeira vista parecia que a s
variáveis descrevem bem os dados. Vale destacar que a temperatura foi significativa
nos modelos apesar de o modelo em sí não apresentar uma amostra aleatória de
uma distribuição normal nos resíduos. Infelizmente tive muita dificuldade de achar as
variáveis na internet, talvez se tivesse mais tempo eu teria conseguido achar as
variáveis climatológicas e as vezes alguma resolveria o problema nos resíduos ‘Até
porque todas elas são positivas o que poderia ser útil para resolver uma assimetria
positiva’. Além disso quando se olha os gráficos no site do noaa nota-se uma
razoável correlação entre a precipitação e umidade e o número de tornados. Contudo,
assim como aconteceu com a altitude relativa ao nível do mar, devemos testar antes
de concluir se esta correlação de fato existe, as vezes é apenas uma correlação
aparente a primeira vista.

Você também pode gostar