Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística Espacial
Professora: Renata Bueno
Aluno: Isaac Victor Silva Rodrigues
Justificando a construção do slide:
Como o slide não será apresentado eu decidi fazer algo que não costumo fazer,
que é um slide mais escrito e denso para explicar melhor os pontos.
Motivação:
Durante a elaboração do trabalho meu primeiro objetivo era descrever a radiação
na zona de exclusão de Chernobyl. Apesar de ter achado dados atuais das
medições de radiação na região de Chernobyl e da cidade Pripyat, eu tive grande
dificuldade em encontrar os shapefiles cartográficos dos Oblast(estados da
Ucrânia). Após pesquisar um tempo decidi abandonar a oportunidade de trabalhar
com Chernobyl e comecei a pensar em outras bases.
Tive a idéia de estudar fenômenos naturais e eventualmente surgiu a reflexão de
tentar descrever a ocorrência de tornados nos estados americanos. Como
Tornados são essencialmente fenômenos climáticos, minhas reflexões me levaram
a pensar em descrever o número total de tornados em um ano, pore estado
americano, em função das características climáticas de cada estado dos Estados
Unidos da América.
Motivação:
As variáveis que tive inicial interesse foram:
Para obter as informações para um ano específico podemos utilizar API para R
chamada rnoaa. O problema é que não consegui me entender com os comandos
da API.
Dados utilizados:
Os dados que obtive foram:
● Shapefiles dos estados americanos, obtidos no Censo americano de 2018
https://www.census.gov/geographies/mapping-files/time-series/geo/carto-b
oundary-file.html
● Dados referentes a elevação média dos Estados americanos obtido por web
scrapping no site :
https://www.infoplease.com/us/geography/highest-lowest-and-mean-elevati
ons-united-states e verificado em outros sites.
● Temperatura média dos estados americanos durante os anos de 1971-2000
coletada por web scrapping no site:
https://www.currentresults.com/Weather/US/average-annual-state-temperat
ures.php e verificada nos mapas do site do NOAA
● Número total de tornados nos estados americanos no ano de 2020 cuja a
base foi coletada no site de previsão de tempestades
https://www.iii.org/table-archive/20621
Dados utilizados:
● Os dados das variáveis de interesse foram pareados com base nos nomes
dos estados americanos pelo o próprio R.
Comentário
do gráfico:
Podemos
notar uma
tendência
dos tornados
ocorrem ao
sudeste e ao
sul. Isso se
repete para
outros anos
Gráficos iniciais:
Eu utilizei o mapa dos Estados Unidos Continental para avaliar inicialmente os dados,
seguem os gráficos obtidos:
● Elevação média em metros dos estados americanos com relação ao nível do mar
Parece
indicar uma
correlação
negativa com
o gráfico
anterior.
Gráficos iniciais:
Eu utilizei o mapa dos Estados Unidos Continental para avaliar inicialmente os dados,
seguem os gráficos obtidos:
● Temperatura média nos anos de 1971-2000 em graus celsius, para cada estado.
Pareceu
existir uma
correlação
positiva com
a ocorrência
de tornados.
Gráficos iniciais:
● Olhando os gráficos iniciais me pareceu que o modelo com estas duas variáveis
ficaria promissor e serviria para descrever bem a variável de interesse.
Análises Espaciais:
● Comecei verificando os vizinhos de cada estado e como eles estavam
distribuídos:
Descrição Valor
Número de estados 48
Achei que estes números estão razoáveis, principalmente as conexões que apresentam
quase conexões com 5 estados ‘em média’. 5 estados fazendo fronteira com cada estado
me parece um mapa razoavelmente denso.
Análises Espaciais:
● Decidi então verificar o Índice de Moran para verificar dependência espacial,
calculei a matriz de distâncias e após isso calculei este índice.
Como indicado no
gráfico, o p-valor
estimado deu
bastante pequeno
e o índice de
Moran deu um
valor razoável o
que demonstra
uma correlação
espacial.
‘Rejeitamos a
hipótese nula com
base no pseudo p
valor
Análises Espaciais:
● Decidi então verificar o Índice de Moran para verificar dependência espacial,
calculei a matriz de distâncias e após isso calculei este índice.
Como indicado no
gráfico, o p-valor
estimado deu
bastante pequeno
e o índice de
Moran deu um
valor razoável o
que demonstra
uma correlação
espacial.
‘Rejeitamos a
hipótese nula com
base no pseudo p
valor
Análises Espaciais:
● Fiz o teste de resíduos para um modelo linear, utilizando o comando lm.morantest
Podemos ver que quando comparado com o modelo minimal apenas o índice de moran obs e
a expectativa tiveram uma redução substancial, indicando uma diminuição da dependência
espacial
Análises Espaciais:
● Ainda sobre os teste com o modelo linear, segue os Moran I desvio padrão da
estatística e os p-valores destas quantidades.
Podemos observar que os Moran I desvio padrão da estatística com as variáveis preditoras parece
ter reduzido bastante, quase a metade, com relação ao modelo minimal. Podemos notar também
que ambos os modelos rejeitam a hipótese de aleatoriedade espacial. Talvez deve-se ter usado
outras variáveis preditoras.
Análises Espaciais:
● Ainda sobre os teste com o modelo linear, segue os Moran I desvio padrão da
estatística e os p-valores destas quantidades.
Podemos observar que os Moran I desvio padrão da estatística com as variáveis preditoras parece
ter reduzido bastante, quase a metade, com relação ao modelo minimal. Podemos notar também
que ambos os modelos rejeitam a hipótese de aleatoriedade espacial. Talvez deve-se ter usado
outras variáveis preditoras. Mais a frente poderemos ver melhor se existe alguma variável que
compromete o modelo.
Análises Espaciais:
● Ainda sobre os teste com o modelo linear, segue os Moran I desvio padrão da
estatística e os p-valores destas quantidades.
Podemos observar que os Moran I desvio padrão da estatística com as variáveis preditoras parece
ter reduzido bastante, quase a metade, com relação ao modelo minimal. Podemos notar também
que ambos os modelos rejeitam a hipótese de aleatoriedade espacial. Talvez deve-se ter usado
outras variáveis preditoras. Mais a frente poderemos ver melhor se existe alguma variável que
compromete o modelo.
Análises Espaciais:
● Daí decidi calcular o Diagrama de Espalhamento mde Moran
Podemos ver que nem a altitude nem o intercepto deram significativos. A altitude relativa ao nível
do mar me surpreendeu, eu realmente achei que daria significativo com base nos primeiros
gráficos. Contudo essa foi uma interpretação equivocada, olhando novamente percebo diversos
estados que estão próximos ao nível do mar que não apresentam tornados. Então considerando o
Estados Unidos continental como um todo, a altitude com relação ao nível do mar não serve para
descrever bem a ocorrência ou não de tornados de fato.
Análises Espaciais:
● Daí por fim decidi partir para os modelos. Primeiro tentei modelo SAR.
Ainda neste modelo SAR, segue o Rho mostrando que existe alguma dependência espacial bem
como o p-valor do modelo mostrando que o modelo é significativo por conta da temperatura:
Rho: 0,49437
p-value: 0,0016249
Modelos SAR e SEM:
● Apesar de o modelo ser significativo tanto o teste de shapiro, bem como o
histograma dos resíduos indicam que não foi possível obter uma representação
de uma distribuição normal. O que invalida o modelo pois os resíduos não
parecem ser observações aleatórias de uma distribuição normal.
Histograma muito
assimétrico
Modelos SAR e SEM:
● Tentei executar o modelo sem a variável altura, apenas com a variável
temperatura para ver se isso estava influenciando na distribuição dos resíduos, e
infelizmente o resultado foi o mesmo, não foi possível obter observações
aleatórias de uma normal nos resíduos.
Histograma Resultado:
muito
assimétrico Modelo SAR se
mostrou invaido
para os meus
dados e
variáveis por
não apresentar
normalidade
nos resíduos
Modelos SAR e SEM:
Por fim tentei utilizar o modelo SEM, no entanto assim como SAR ele
apresentou problemas nos resíduos como indicado no histograma dos resíduos
abaixo. A assimetria dos resíduos é muito presente
Conclusão:
Fiquei insatisfeito com o resultado do modelo pois a primeira vista parecia que a s
variáveis descrevem bem os dados. Vale destacar que a temperatura foi significativa
nos modelos apesar de o modelo em sí não apresentar uma amostra aleatória de
uma distribuição normal nos resíduos. Infelizmente tive muita dificuldade de achar as
variáveis na internet, talvez se tivesse mais tempo eu teria conseguido achar as
variáveis climatológicas e as vezes alguma resolveria o problema nos resíduos ‘Até
porque todas elas são positivas o que poderia ser útil para resolver uma assimetria
positiva’. Além disso quando se olha os gráficos no site do noaa nota-se uma
razoável correlação entre a precipitação e umidade e o número de tornados. Contudo,
assim como aconteceu com a altitude relativa ao nível do mar, devemos testar antes
de concluir se esta correlação de fato existe, as vezes é apenas uma correlação
aparente a primeira vista.