Ws 001 Ok

22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
Computação Pervasiva e Móvel

Volume 53, fevereiro de 2019 , páginas 62-74
Resumir
Previsões de crimes espaço-temporais em cidades inteligentes: uma

abordagem e experimentos baseados em dados
Charlie Catlett e b,Eugênio Cesário c d ,Domenico Talia e,Andrea Vinci d.
Mostre mais
Contorno Compartilhar Citar
https://doi.org/10.1016/j.pmcj.2019.01.003
Obtenha direitos e conteúdo
Abstrato
A crescente urbanização está a causar transformações económicas e sociais significativas nas áreas urbanas, colocando vários desafios
relacionados com a gestão e os serviços das cidades. Em particular, em cidades com taxas de criminalidade mais elevadas, garantir eficazmente a
segurança pública é uma tarefa cada vez mais complexa. Para lidar com esta complexidade, as novas tecnologias estão a permitir que os
departamentos de polícia acedam a volumes crescentes de dados relacionados com a criminalidade que podem ser analisados para compreender
padrões e tendências. Estas tecnologias têm potencial para aumentar a distribuição eficiente de recursos policiais num determinado território e,
em última análise, apoiar uma prevenção mais eficaz do crime. Este artigo apresenta uma abordagem preditiva baseada em análise espacial e
modelos auto-regressivos para detectar automaticamente regiões de crime de alto risco em áreas urbanas e prever com segurança as
tendências da criminalidade em cada região. O resultado do algoritmo é um modelo espaço-temporal de previsão de crimes, composto por um
conjunto de regiões densas em crimes com preditores de crimes associados, cada um representando ummodelo preditivo para estimar o número
de crimes que provavelmente ocorrerão em sua região associada. A avaliação experimental foi realizada em dois conjuntos de dados reais
coletados nas cidades de Chicago e Nova York. Esta avaliação mostra que a abordagem proposta atinge uma boa precisão na previsão espacial e
temporal da criminalidade ao longo de horizontes temporais contínuos.
anterior Próximo
Palavras-chave
Previsão de crimes; Cidade inteligente; Computação urbana; Análise de dados
1 . Introdução
Contexto de referência. O século XXI é frequentemente referido como o “Século da Cidade”, reflectindo a migração global sem precedentes
para as áreas urbanas que está em curso [1] , [2] . Esta urbanização cada vez maior está a trazer perturbadoras transformações sociais,
económicas e ambientais às áreas urbanas. Por exemplo, está a apresentar desafios às organizações encarregadas da gestão da cidade e da
prestação de serviços essenciais, como o planeamento de recursos (água, eletricidade), trânsito, qualidade do ar e da água e segurança pública
[3] .. Além disso, para as cidades com taxas de criminalidade mais elevadas, o aumento da criminalidade está a tornar-se um dos problemas
sociais mais importantes, afectando não só a segurança pública, mas também a saúde, a educação, o desenvolvimento infantil e o estatuto
socioeconómico dos adultos [4], [ 5 ] .
Motivações e Contribuições. Um volume cada vez maior de dados urbanos, com atributos espaciais e temporais, desde o clima à qualidade
do ar e à actividade económica, está disponível para organizações públicas, incluindo departamentos de polícia, para integração com dados
internos. Isto oferece a oportunidade de aplicar metodologias de análise de dados para extrair modelos preditivos úteisrelacionados com eventos
criminais, o que pode permitir aos departamentos de polícia utilizar melhor os seus recursos limitados e desenvolver estratégias mais eficazes
para a prevenção do crime. Em particular, extensos estudos de justiça criminal mostram que a incidência de eventos criminais não está
distribuída igualmente dentro de uma cidade. Na verdade, as taxas de criminalidade podem mudar em relação à localização geográfica da área
(existem áreas de baixo e alto risco) e as tendências da criminalidade podem variar (padrões sazonais, picos, quedas) em relação ao período do
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 1/15
ano. Por esta razão, um modelo preditivo precisodeve ser capaz de detectar automaticamente quais áreas da cidade são mais afetadas por
eventos criminais e como a taxa de criminalidade de cada área específica varia em relação ao período temporal. Este conhecimento pode
permitir que os departamentos de polícia aloquem eficientemente os seus recursos para pontos críticos de criminalidade específicos, permitindo
o destacamento eficaz de agentes para áreas de alto risco ou a remoção de agentes de áreas com níveis decrescentes de criminalidade,
prevenindo assim de forma mais eficiente ou respondendo rapidamente a situações criminais. atividade.
Este artigo apresenta o desenho e implementação de uma abordagem baseada em análise espacial e modelos auto-regressivos para detectar
automaticamente regiões de crime de alto risco em áreas urbanas e prever de forma confiável as tendências da criminalidade em cada região. O
algoritmo é composto de várias etapas. Primeiro, as áreas de alta densidade de criminalidade (chamadas regiões densas de criminalidade ou
focos de criminalidade) são descobertas através de uma abordagem de análise espacial, onde as formas das regiões detectadas são
automaticamente traçadas pelo algoritmo sem qualquer divisão pré-fixada em áreas. Em seguida, um modelo específico de previsão de crimes é
descoberto em cada região detectada, analisando as partições descobertas na etapa anterior. O resultado final do algoritmo é um modelo espaço-
temporal de previsão de crimes, composto por um conjunto de regiões densas de crimes e um conjunto de preditores de crimes associados,
Como estudo de caso, apresentamos aqui a análise de crimes em (i) uma grande área de Chicago e (ii) no bairro de Manhattan, na cidade de
Nova Iorque, envolvendo cerca de dois milhões de eventos criminais (durante um período de 16 anos) e 1,5 milhões de eventos criminais
(durante um período de 11 anos), respectivamente. Os dados criminais de Chicago foram coletados pela plataforma Plenario [6] , uma estrutura
da Web que fornece acesso público a mais de cem conjuntos de dados urbanos, enquanto os dados criminais da cidade de Nova York foram
coletados pela plataforma Opendata da cidade de Nova York [7 ]. Os resultados da avaliação experimental mostram a eficácia da abordagem, ao
alcançar uma boa precisão na previsão espacial e temporal da criminalidade ao longo de horizontes temporais contínuos. Apresentamos também
uma análise comparativa dos resultados obtidos através de nossa abordagem com outros algoritmos apresentados na literatura, demonstrando
maior precisão do algoritmo proposto em relação a outras abordagens regressivas propostas na literatura. Para maior clareza, este artigo
estende o trabalho apresentado em [8] e fornece diversas contribuições originais em relação ao anterior. A extensão mais significativa diz
respeito à avaliação experimental na Seção 5, que foi ampliado testando o algoritmo proposto em um segundo estudo de caso do mundo real
(cidade de Nova York) e realizando uma análise comparativa com outras abordagens de análise de regressão propostas na literatura.
Plano do Papel. O resto do artigo está organizado da seguinte forma. A Seção 2 relata as abordagens mais importantes na literatura de
mineração de dados criminais e os projetos mais representativos nesse campo de pesquisa. A Seção 3 descreve a definição do problema e os
objetivos de nossa análise. A Seção 4 apresenta o algoritmo de Predição de Crimes Espaço-Temporais, descrevendo detalhadamente suas
etapas. A seção 5 descreve a avaliação experimental, realizada em dois estudos de caso reais. Finalmente, a Seção 6 conclui o artigo e planeja
trabalhos de pesquisa futuros .
2 . Trabalho relatado
Várias técnicas de mineração de dados têm sido utilizadas para análise de crimes. Algumas abordagens foram propostas para previsão de
localização de crimes [4] , [9] , enquanto outras visam a detecção de padrões de crime [10] , [11] , [12] , [13] . Nesta seção revisamos
brevemente os trabalhos de pesquisa mais representativos em ambas as áreas. Em seguida, relatamos uma comparação crítica (com base em
algumas características específicas) entre o método que desenvolvemos e as soluções de última geração.
Previsão de localização de crimes . CrimeTracer [4] é baseado em uma estrutura probabilística para modelar o comportamento espacial de
infratores conhecidos nas áreas que eles frequentam, chamadas espaços de atividades . Experimentos realizados com dados criminais do mundo
real mostraram que os criminosos frequentemente cometem crimes dentro dos seus espaços de atividade, em vez de se aventurarem em
territórios desconhecidos. Os autores em [9] modelam as previsões de localização de crimes como um caso especial de tarefa de classificação de
mineração de dados espaciais e exploram máquinas de vetores de suporte (SVM) de uma classe para classificar locais como áreas de crime com
ou sem pontos críticos.
Detecção de padrões de crime . A abordagem proposta em [10] explora a regressão binomial negativa para inferir taxas de criminalidade em
diferentes áreas da cidade, integrando dados geográficos, demográficos, POIs e fluxos de táxi. Agrupamento multivariado de séries temporais e
modelos ARIMA são propostos em [12] e [14] , para descobrir tendências de crimes semelhantes e fazer previsões de crimes de curto prazo,
respectivamente. Modelos de Redes Neurais Recorrentes , que exploram informações espaciais e temporais para prever focos de crime, são
apresentados em [11] . Em [13] Suavização Exponencial de Holtfoi experimentado usando dados de toda a cidade e resultou como um modelo
de previsão preciso para séries de crimes em nível de delegacia.
A Tabela 1 apresenta uma comparação mais detalhada e crítica entre a abordagem proposta e algumas outras soluções propostas na literatura.
A comparação leva em consideração quatro características, conforme detalhado a seguir.
Detecção de pontos de acesso ao crime . Esta característica descreve se a abordagem implementa um método para detectar automaticamente
focos de crime, o que é uma questão crucial para a precisão e a eficácia de toda a tarefa de previsão do crime. O algoritmo proposto e as
abordagens apresentadas em [4] , [9] implementam métodos para detectar pontos críticos de crimes a partir de dados brutos de crimes,
enquanto o restante dos trabalhos relacionados dependem de regiões predefinidas, como Áreas Comunitárias [10] , Distritos [13 ] , células da
cidade [11]. O limite destas últimas abordagens é que se baseiam numa subdivisão estática de regiões e na sua categorização como regiões de
interesse criminal, o que poderia levar a regiões não interessantes em termos de análise criminal. Diferentemente, nossa abordagem e os
trabalhos em [4] , [9] são capazes de identificar locais relevantes baseados em dados, em vez de serem definidos estaticamente a priori.
Abordagem de detecção de pontos críticos de crime . Também classificamos os sistemas comparados com base na abordagem utilizada para
detectar regiões densamente criminosas, quando aplicável. As abordagens propostas em [4] , [9] exploram uma estrutura probabilística e
abordagens de Support Vector Machine (SVM), oportunamente adaptadas para lidar com dados criminais. Por outro lado, as abordagens
apresentadas em [10] , [11] , [13] , conforme destacado anteriormente, não utilizam abordagem de detecção, pois dependem de regiões pré-
definidas.
Tabela 1 . Comparação de diversas abordagens propostas na literatura.
Detecção de pontos críticos Abordagem de detecção de Formas de pontos de Abordagem de Preditores de

de crime hotspot crime Crime
A abordagem Sim Clustering baseado em qualquer formato ARIMA

proposta densidade
Ref. [4] Sim (ActivitySpace) Estrutura probabilística qualquer formato Não disponível (apenas previsão de
localização)
Ref. [10] Não (área de comunicação) Não (área predefinida) Com. Formato da área Regressão Binomial Negativa (NBR)
Ref. [13] Não (distrito) Não (área predefinida) Formato do distrito Suavização Exponencial Holt (HES)
Ref. [9] Sim Máquina de vetores de suporte qualquer formato Não disponível (apenas previsão de
localização)
Ref. [11] Não (células da grade) célula de grade de tamanho igual quadrado Redes Neurais Recorrentes (RNN)
Formas de pontos de acesso ao crime . Outra característica importante para efeitos de classificação é a forma dos focos de crime. Na verdade,
esta característica permite avaliar a capacidade da abordagem de detecção em identificar qualquer possível área espacial densa,
independentemente da forma. Quanto mais formas o algoritmo for capaz de capturar, melhor será a precisão e a eficácia das regiões densas
detectadas. Nossa abordagem e o trabalho descrito em [4] , [9] são capazes de detectar regiões de qualquer formato (por exemplo, circular,
retangular, linear), enquanto os outros trabalhos [10] , [11] , [13] tratam apenas de regiões específicas. formas da região.
Abordagem do Preditor de Crime . Este recurso classifica os sistemas com base na abordagem utilizada para detectar preditores de crime.
Especificamente, nossa abordagem explora modelos ARIMA, enquanto as abordagens apresentadas em [10] , [11] , [13] utilizam modelos de
Regressão Binomial Negativa, HES e RNN, respectivamente. Diferentemente da nossa, as outras abordagens [4] , [9] realizam apenas a
previsão da localização do crime e não consideram a análise de tendências do crime.
3 . Definição e objetivo do problema

Começamos fixando uma notação adequada a ser usada ao longo do artigo. Deixar ser uma lista ordenada de carimbos de
data/hora, tal que , e onde todos ocorrem em intervalos de tempo iguais (por exemplo, a cada hora, dia, semana ou ano).
Deixar ser um conjunto de dados que coleta instâncias de crimes, , onde cada é uma tupla de dados descrita pelos
seguintes recursos: e (coordenadas dos locais onde ocorre o crime), (hora em que o crime acontece, com ), (a tipologia
do crime, ou seja, roubo, furto, agressão, etc.). Agora, vamos considerar um horizonte temporal futuro, , com . O objetivo
da análise é encontrar modelos para prever com segurança o número e a localização dos crimes em um determinado carimbo de data/hora.
. Mais especificamente, a nossa análise visa atingir os seguintes objetivos:
1. descubra um conjunto de regiões densamente criminosas ( ou ), , onde uma região

densamente criminosa é uma área espacial onde ocorrem eventos criminais com maior densidade do que outras áreas da cidade;
2. extrair uma função , que dado um carimbo de data / hora indica o número de crimes que estão
previstos para acontecer em cada região densamente criminosa no carimbo de data / hora .
4 . A abordagem proposta
Esta seção descreve o algoritmo que projetamos para descobrir modelos preditivos espaço-temporais a partir de dados criminais.
Especificamente, a Seção 4.1 descreve as principais etapas da abordagem proposta e seu metacódigo, enquanto as Seções 4.2 Detecção de
regiões densas de crime , 4.3 Extração de preditores de crime descrevem em detalhes os procedimentos para detecção de regiões densas de
crime e extração de preditores de crime.
4.1 . O algoritmo
A Figura 1 esboça a ideia geral do algoritmo através de uma representação gráfica de todo o processo como uma sequência de três etapas
principais. Os dados de entrada da análise são o conjunto de dados criminais recolhidos a serem processados. A primeira etapa do algoritmo
consiste na detecção de regiões densamente criminosas a partir do conjunto de dados original. O objetivo desta etapa é detectar áreas (ou seja,
polígonos, bolhas) onde ocorrem eventos criminais com maior densidade do que outras áreas adjacentes, traçadas automaticamente pelo
algoritmo sem qualquer divisão pré-fixada em áreas. Esta tarefa pode ser modelada como uma instância de clustering geoespacial e pode ser
resolvida, conforme descrito abaixo, usando algoritmos de clusteringque processam dados criminais espaciais e temporais. O resultado final
desta etapa consiste em clusters, onde cada cluster corresponde a uma região densamente criminosa. O número de regiões detectadas (ou seja,
número de clusters) pode ser fixado a priori ou detectado automaticamente, dependendo do algoritmo de cluster específico. A segunda etapa
consiste na divisão espacial dos dados criminais originais, com base no modelo de agrupamento descoberto na etapa anterior. Em outras
palavras, os pontos dos eventos de dados criminais originais atribuídos ao o cluster são transformados em uma série temporal e reunidos no o
conjunto de dados de saída, para . No final desta etapa, diferentes conjuntos de dados de séries temporais estão disponíveis, cada
um contendo a série temporal de crimes ocorridos em sua região densa associada. A terceira etapa visa extrair um modelo específico de
previsão de criminalidade para cada região densamente criminosa (ou as regiões mais representativas), analisando a divisão dos dados
criminais durante a etapa anterior.
O metacódigo do algoritmo de previsão de crime espaço-temporal (STCP) é relatado na Figura 2 . O algoritmo recebe na entrada , ou seja, o
conjunto de dados sobre crimes, e retorna os modelos de conhecimento descobertos, ou seja, o conjunto de regiões densas em crimes
e o conjunto de preditores de crime . É importante notar que este metacódigo é paramétrico em
relação ao algoritmo para detecção de regiões densas de crime e preditores de crime, e daremos detalhes adicionais (sobre os algoritmos
específicos explorados neste trabalho) nas duas subseções a seguir. O algoritmo começa executando uma tarefa de agrupamento espacial no
conjunto de dados , destinado a detectar regiões densas (isto é, pontos críticos) de crimes. Isso é realizado pelo método
DiscoverCrimeRegions (), que extrai aglomerados espaciais, cada um representando uma região densa de crimes detectada (linha L1). Assim
que esta etapa for concluída, o conjunto de dados criminais é transformado em conjuntos de dados de série temporal com base no modelo de
cluster descoberto extraído na etapa anterior. Especificamente, esta tarefa é executada pelo método BuildCrimeTSData () (linha L2), que
processa o conjunto de dados original e o transforma na coleção de conjuntos de dados de série temporal , onde cada éa
série temporal de crimes geolocalizados na área (detectado durante a etapa anterior). No final desta etapa, diferentes conjuntos
de dados de séries temporais estão disponíveis. Finalmente, para cada , o método DiscoverLocalCrimePredictor () descobre um modelo
preditivo (linhas L3–L6) para prever o número de crimes que acontecerão na área específica (Associado a ). Todo o modelo retornado
pelo algoritmo, compreendendo o conjunto de regiões densamente criminosas e o conjunto de preditores de crime
, pode ser usado para previsão de crimes espaço-temporais.
Baixar: Baixar imagem em alta resolução (148 KB)

Baixar: Baixe a imagem em tamanho real
Figura 1 . Etapas de previsão de crimes espaço-temporais.

Figura 2 . Algoritmo de previsão de crimes espaço-temporais.
4.2 . Detecção de regiões densamente criminosas

O método DiscoverCrimeRegions () (linha L1) realiza um agrupamento espacial do conjunto de dados, onde cada cluster representa uma região
densa de crimes. A noção baseada em densidade é uma abordagem comum para agrupamento, cuja ideia inspiradora é que os objetos que
formam uma região densa devem ser agrupados em um único agrupamento. Em nossa implementação, esta etapa é realizada aplicando
DBSCAN [15], um algoritmo popular de agrupamento baseado em densidade que encontra clusters a partir da distribuição de densidade
estimada dos dados considerados. Escolhemos o algoritmo DBSCAN porque ele tem a capacidade de descobrir clusters com formato arbitrário,
como linear, côncavo, oval, etc. e (em contraste com outros algoritmos de cluster propostos na literatura) não requer a predeterminação do
número de clusters. para ser descoberto. Basicamente, o algoritmo encontra clusters com relação à noção de alcançabilidade de densidade entre
pontos: um ponto é diretamente alcançável por densidade a partir de outro ponto se não estiver mais distante do que uma determinada
distância ( ) (ou seja, faz parte de sua vizinhança) e se estiver cercado por um número suficiente de pontos ( ). No contexto considerado,
um cluster corresponde a uma região densamente criminosa. Além disso, para capturar a mudança dinâmica dos clusters, calculamos a
densidade de cada ponto de dados, ponderando-o através de um fator de decaimento que dá menos importância às informações históricas e
mais peso aos dados recentes: para cada registro de dados , atribuímos a ele um coeficiente de densidade que diminui com idades: se
ocorre no carimbo de data/hora , seu coeficiente de densidade é ponderado por , onde é uma constante chamada fator de
decaimento, e é o carimbo de data/hora mais recente. Finalmente, DBSCAN exige que o usuário especifique o raio da vizinhança (ou seja, )
e o número mínimo de objetos que ele deve ter (ou seja, ), cujos valores afetam o tamanho e a densidade dos clusters descobertos.
Geralmente, uma configuração ótima de seus parâmetros é complexa de ser alcançada e requer técnicas específicas; no entanto, tal tópico está
fora do escopo deste artigo.
4.3 . Extração de preditores de crime

Dada uma região densa de crime específica (ou hotspot de crime), o método DiscoverLocalCrimePredictor () (linha L4 na Fig. 2 ) descobre
um modelo preditivo para prever o número de crimes que acontecerão em sua área específica. Em nossa implementação, isso foi realizado pelo
modelo Sazonal AutoRegressive Integrated Moving Average (Seasonal ARIMA, ou SARIMA [16] ), que é definido como uma combinação de
auto-regressão, média móvel e modelagem de diferença. Resumidamente, tendo a série temporal , onde é o valor da série
temporal no carimbo de data/hora , um modelo é escrito na forma
onde é um fator de correção, são os coeficientes de regressão da parte auto-regressiva, são o coeficiente de regressão da parte
da média móvel, são valores defasados de e erros atrasados ( preditores) e é o ruído branco e leva em
consideração o erro de previsão. Em nosso estudo exploramos modelos ARIMA sazonais , que são uma extensão do ARIMA clássico. Um modelo
ARIMA sazonal é formado pela inclusão de termos sazonais adicionais nos modelos ARIMA clássicos introduzidos anteriormente. A parte
sazonal do modelo consiste em termos muito semelhantes aos componentes não sazonais do modelo. Na fórmula final, os termos sazonais
adicionais são simplesmente multiplicados pelos termos não sazonais. Um modelo ARIMA sazonal é definido como ,
onde é um fator de periodicidade, e são as ordens da parte auto-regressiva, diferencial e da média móvel para o modelo não
sazonal e sazonal, respectivamente [16] .
5 . Análise e resultados experimentais

Para avaliar o desempenho e a eficácia da abordagem descrita acima, realizamos uma extensa análise experimental executando diferentes testes
em dois estudos de caso do mundo real, ou seja, duas grandes áreas de Chicago (CHI) e Nova Iorque (NYC). . Para cada cidade, o objetivo da
nossa análise consiste em detectar as regiões com maior densidade de criminalidade e descobrir modelos preditivos eficazes, que possam
estimar o número de crimes que provavelmente acontecerão no futuro. Também realizamos uma análise comparativa de nossos resultados em
relação a outros algoritmos propostos na literatura. O restante desta seção está organizado da seguinte forma. A seção 5.1 apresenta a análise e
os resultados mais importantes realizados com os dados de Chicago. Seção 5.2descreve os resultados obtidos através da análise dos dados da
cidade de Nova York. A Seção 5.3 compara os resultados obtidos pela exploração de modelos autoregressivos com outras abordagens utilizadas
para análise de regressão.
5.1 . Chicago: resultados experimentais

Nas subseções a seguir descrevemos as principais etapas de nossa análise realizada nos dados de Chicago: descrição e coleta de dados,
detecção de região densa de crime, treinamento e avaliação dos modelos regressivos.
5.1.1 . Descrição de dados

Os dados que usamos para treinar os modelos e realizar a avaliação experimental estão armazenados no Plenario, uma plataforma de pesquisa e
exploração de dados disponível publicamente que foi desenvolvida (e atualmente gerenciada) pelo Centro Urbano de Computação e Dados da
Universidade de Chicago. Os dados criminais foram coletados a partir do conjunto de dados 'Crimes - 2001 até o presente' , uma coleção da vida
real de instâncias que descrevem eventos criminais ocorridos em Chicago de 2001 até o presente (o repositório é atualizado toda semana, por
isso é mantido atualizado menos os sete dias mais recentes). Como um estudo piloto, neste trabalho focamos nossos experimentos em uma
grande área de Chicago, que é mostrada na Figura 3 , Figura 3.. A área selecionada inclui diferentes zonas da cidade, algumas em crescimento
em termos de população, outras em termos de atividades empresariais, com diferentes densidades de criminalidade no seu território (tornando-
a interessante para a análise da criminalidade). Seu perímetro é cerca de e sua área é de aproximadamente . A partir do
conjunto de dados 'Crimes - 2001 até o presente' , coletamos todos os eventos criminais dentro da área delimitada ao longo de 16 anos (834
semanas), de janeiro de 2001 a dezembro de 2016. O número total de crimes coletados é 1.897.682, enquanto o número médio de crimes crimes
por semana é 2.275. O tamanho total deste conjunto de dados é 418 MB.
A Figura 4 mostra uma visão preliminar dos dados criminais coletados, que fornece algumas dicas sobre tendências e distribuição dos dados. A
Figura 4(a) mostra o gráfico temporal dos dados de crimes observados, no qual o número de crimes é plotado em função do tempo de
observação. O enredo revela imediatamente algumas características interessantes. Em primeiro lugar, é evidente que o número de crimes está a
diminuir ao longo do período, mostrando uma clara tendência geral decrescente nos dados. Em segundo lugar, um padrão sazonal
repetidodentro de cada ano é claramente observável, e parece diminuir em tamanho (magnitude) à medida que a contagem geral de crimes na
série diminui. A partir do enredo, vemos que a ocorrência de crimes normalmente aumenta no final da primavera, atinge o pico durante o verão,
diminui no outono e geralmente diminui no inverno. Uma visão mais clara da sazonalidade escondida nos dados pode ser vista na Figura 4(b) ,
que mostra a distribuição do número médio de crimes por mês. O histograma mostra que o número de crimes na área da cidade sob observação
varia significativamente entre os diferentes períodos do ano. Em particular, o número de eventos criminais é mais elevado em Julho (com 11.050
crimes, em média), e mais baixo em Fevereiro (com 8.124 crimes, em média).

Figura 3 . Área selecionada de Chicago e eventos criminais geolocalizados (2001–2016).
Para executar a tarefa de regressãoe sua validação, dividimos o conjunto de dados original em duas partições: o conjunto de treinamento e o
conjunto de teste. O primeiro é usado para descobrir os relacionamentos dentro dos dados, enquanto o segundo é usado para avaliar se os
relacionamentos descobertos são válidos de maneira geral. No nosso caso, o conjunto geral de dados criminais foi dividido em relação ao número
de anos: o conjunto de treinamento contém os dados criminais dos primeiros 13 anos (2001-2013, 678 semanas), enquanto o conjunto de teste
contém os dados criminais dos primeiros 13 anos (2001-2013, 678 semanas). últimos 3 anos (2014–2016, 156 semanas). Conforme descrito nas
subseções a seguir, treinamos o modelo de conhecimento (ou seja, regiões densas de criminalidade e preditores de criminalidade) usando dados
de janeiro de 2001 a dezembro de 2013 e usamos o modelo treinado para prever os eventos criminais de janeiro de 2014 a dezembro de 2016,
para avaliar a qualidade das previsões.

Figura 4 . Dados criminais CHI: número de crimes versus tempo e sua distribuição por mês.
5.1.2 . Detecção de regiões densamente criminosas a partir do conjunto de treinamento

Conforme descrito na Seção 4.2 , regiões densamente criminosas são detectadas aplicando-se uma versão modificada ad-hoc do DBSCAN, que
explora um fator de decaimento que dá um peso maior a eventos criminais recentes. Além disso, para detectar regiões densamente criminosas
de alta qualidade, é necessário ajustar os parâmetros-chave do algoritmo para melhorar o desempenho dos resultados. Em particular, os valores
dos parâmetros do DBSCAN e determina o tamanho dos clusters, pois representam a densidade mínima de criminalidade exigida por
uma área para fazer parte de um cluster. Por um lado, quanto maior , maior é a extensão das regiões densas detectadas: isto resulta na
descoberta de grandes regiões que na verdade não são mais densas. Por outro lado, quanto menor , menores serão os tamanhos dos clusters,
resultando em um grande número de regiões densas detectadas que podem (devido ao seu pequeno tamanho) não ser significativas para a
análise. Por outro lado, o crescimento do valor resulta no aumento da fragmentação da atribuição de cluster produzida. Os valores de e
são, portanto, críticos para a precisão da fase de detecção da região densa e para o equilíbrio certo entre separabilidade , compactação e
significância dos clusters. Apresentamos aqui os resultados alcançados pela fixação e , que foram avaliados através de
diversos testes experimentais e que melhor se adequam ao nosso cenário de aplicação e ao conjunto de dados considerado.
As regiões densamente criminosas descobertas através da nossa análise são mostradas na Fig. 5 , onde cada região é representada por uma cor
diferente. Curiosamente, esta imagem mostra como os eventos criminais são agrupados com base em critérios de densidade; por exemplo, o
algoritmo detecta oito regiões de criminalidade significativas claramente reconhecíveis através de cores diferentes: uma grande região de
criminalidade (em vermelho) na parte central da área, juntamente com sete áreas menores (em verde, azul e azul claro) à esquerda e lado
direito, correspondendo às zonas de maior concentração de crimes. As três maiores regiões densamente criminosas ( CDR1 , CDR2 e CDR3 )
estão ampliadas no lado esquerdo da Fig.. Muitas outras regiões mais pequenas que representam zonas de criminalidade muito locais e de
elevada densidade estão distribuídas por toda a área. A Tabela 2 mostra a extensão das três regiões com maior densidade de criminalidade (
CDR1 , CDR2 e CDR3 ), em relação a toda a área. No geral, estas regiões cobrem cerca de 20,5% de toda a extensão da área e cerca de 40% dos
eventos criminais detectados em toda a área entre 2001 e 2016.

Figura 5 . Detectadas regiões densamente criminosas na área selecionada de Chicago. (Para interpretação das referências à cor nesta legenda da
figura, o leitor deve consultar a versão web deste artigo.)
Tabela 2 . A extensão das regiões mais amplas com densidade de criminalidade em relação a toda a área considerada.
Região Extensão (KM ) Extensão (%) Crimes (#) Crimes (%)
Área inteira 135.02 100,00% 1.896.782 100%
Região densa de crime 1 17.04 12,62% 461.996 24,35%
Região Densa de Crime 3 4,59 3,40% 131.154 6,91%
5.1.3 . Treinando e avaliando os modelos de crime regressivo

Conforme descrito na Seção 4 , as próximas etapas do algoritmo consistem em a divisão de dados espaciais do conjunto de dados criminais
original (com o objetivo de construir uma série temporal para cada região densa descoberta), e a formação de preditores locais de
criminalidade (como modelos ARIMA) para cada região densa. Especificamente, considerando as três maiores regiões densamente criminais
detectadas pelo nosso algoritmo, os modelos auto-regressivos treinados a partir dos dados de entrada foram ,
e para a primeira, segunda e terceira região, respectivamente. É importante notar que os
modelos preditivos de criminalidade diferem entre as regiões, mostrando que cada área apresenta tendências e padrões de criminalidade
específicos.
Para avaliar a eficácia e a precisão das funções regressivas, realizamos uma análise de avaliação no conjunto de testes que consiste nos últimos
três anos de dados (ou seja, anos 2014–2016). Em particular, para cada região densa de crime e para toda a área, o seu respectivo modelo
ARIMA tem sido utilizado para prever valores futuros do número de crimes que são prováveis de acontecer naquela região, semana a semana.
A previsão do tipo de crimes foge ao âmbito deste trabalho e será estudada numa futura actividade de investigação. A Figura 6 mostra dados
observados e previstos (plotados em azul e verde, respectivamente) para o período do conjunto de testes. Observamos que os dados previstos
aderem muito bem aos dados observados durante todo o período do conjunto de teste.

Figura 6 . Número de crimes observados e previstos (linhas azuis e verdes) no conjunto de testes de Chicago, para toda a área e para as três
principais regiões com maior densidade de crimes. (Para interpretação das referências à cor nesta legenda da figura, o leitor deve consultar a
versão web deste artigo.)
Agora, vamos fazer uma avaliação quantitativa sobre o desempenho dos modelos regressivos e sua eficácia em fazer previsões nos conjuntos de
testes correspondentes. Para este fim, calculamos quatro medidas de erro ( MAE , MAPE , ME , RMSE ), que são comumente usadas na
literatura de análise regressiva para quantificar o desempenho das previsões.
A Tabela 3 apresenta os valores das quatro medidas de erro descritas acima para toda a área e as três regiões com maior densidade de
criminalidade, considerando horizontes de previsão com um ano de antecedência, dois anos de antecedência e três anos de antecedência.
Observando os valores da tabela, podemos observar que o MAE diminui à medida que as áreas das regiões são cada vez menores. Por exemplo,
considerando a previsão com um ano de antecedência, o MAE diminui monotonamente de 88,86 (toda a área) para 30,20, 14,47 e 11,15 (três
regiões densas em criminalidade, ordenadas por tamanho decrescente), e de forma semelhante em todos os outros anos. Este é um resultado
razoável, porque as previsões parecem mais precisas tanto em termos de identificação específica das áreas como em termos de precisão das
previsões ., fornecendo assim informações mais detalhadas aos administradores municipais e policiais para planejarem como distribuir recursos
e esforços nas diferentes regiões da cidade. Por fim, considerando o MAPE, observamos que os erros percentuais também são muito baixos. Na
verdade, a tabela mostra que o erro máximo de previsão do MAPE varia de 8,68% a 11,90% para o primeiro ano, de 7,60% a 9,62% para o
segundo ano, e de 10,14% a 18,66% para o terceiro ano, o que representa um resultado muito interessante. Até onde sabemos, esses resultados
excedem os de outras abordagens propostas na literatura de previsão de crime. Como consideração final, observamos na Figura 6 que os
modelos regressivos para cada área tendem a superestimar ligeiramente o número de crimes em relação aos que realmente ocorreram.
Tabela 3 . Medidas de erro de previsão versus anos, para toda a área e para as três regiões com maior densidade de criminalidade em Chicago.
T empo MAE MAPE
Área CDR1 CDR2 CDR3 Área CDR1 CDR2 CDR3
2014 88,86 30h20 14h47 11h15 6.19 8,68 10,86 11h90
2015 74,54 28.24 12.13 9.24 5.42 7,60 8,94 9,62
2016 81,47 31.04 12,86 13,83 6.29 10.14 9,99 18,66
T empo MEU REQM
linha 2014 −62,96 30.19 −8,36 −2,67 108,34 35,98 19.01 13.57
2015 −27.05 4,75 −1,80 −1,57 97,77 34,61 14,98 11h43
2016 −48,77 −24,94 −5,36 −11.02 115.16 38,31 15,95 16,66
5.2 . Cidade de Nova York: resultados experimentais
Esta seção apresenta a análise realizada nos dados criminais da cidade de Nova York. Tal como acontece com o estudo de caso anterior, as
principais etapas são descritas em quatro subseções: descrição e coleta de dados, detecção de regiões densamente criminosas e
treinamento e avaliação dos modelos regressivos.
5.2.1 . Descrição de dados

Os dados que usamos para treinar os modelos e realizar a avaliação experimental para a cidade de Nova York estão armazenados no NYC
Opendata [7] , um recurso disponível publicamente gerenciado pelo Gabinete de Análise de Dados do Prefeito (MODA) e pelo Departamento de
Tecnologia da Informação e Telecomunicações (DoITT). Concentramos nossos experimentos no bairro de Manhattan, na cidade de Nova York,
que é mostrado na Figura 7 , Figura 7 . A área selecionada representa uma das áreas urbanas mais conhecidas e densas do mundo, crescendo
em termos de população, atividades empresariais e padrões de mobilidade. Seu perímetro é cerca de e sua área é aproximadamente
. A partir do conjunto de dados 'Histórico de dados de reclamações da polícia de Nova York' , coletamos todos os eventos criminais
que foram registrados dentro da área delimitada em 11 anos (572 semanas), de janeiro de 2006 a dezembro de 2016. O número total de crimes
coletados é 1.472.305, e a média o número de crimes por semana é 2.573. O tamanho total dos dados é de cerca de 1,3 GB.
As tendências e distribuição dos dados da cidade de Nova York são mostradas na Figura 8 , Figura 8 . Como visão preliminar, observamos que
existem diversas diferenças com a distribuição dos dados de Chicago. A Figura 8(a) mostra o gráfico temporal dos dados de crimes observados,
nos quais o número de crimes é plotado em função do tempo de observação. Em contraste com os dados de Chicago (que mostram uma
diminuição constante no total de crimes ao longo do tempo), o gráfico mostra claramente que o número de crimes apresenta uma tendência
estável até ao ano 2010, seguida por uma tendência decrescente suave de 2010 a 2012, e uma tendência estávelnovamente a partir de 2012.
Em segundo lugar, é observável um padrão sazonal anual, que aumenta de tamanho (magnitude) e se torna mais evidente a partir do ano de
2012. Em geral, podemos inferir que as ocorrências de crimes costumam atingir picos durante a Primavera e o Verão. (diferentemente dos
dados de Chicago), diminuem no outono e geralmente apresentam quedas no inverno. O componente de sazonalidade pode ser observado na
Figura 8 (b), que mostra a distribuição da média de crimes por mês. O número médio de eventos criminais é mais elevado durante o Verão (11
910 em Julho e 11 188 em Agosto), mas também existem alguns picos na Primavera (11 586 em Março e 11 742 em Maio). A contagem mais
baixa é em fevereiro (com 9.615 crimes em média). A divisão dos dados em conjunto de treinamento e conjunto de teste foi realizada da seguinte
forma: o conjunto de treinamento contém os dados criminais dos primeiros 8 anos (2006–2013; 416 semanas), enquanto o conjunto de teste
contém os dados criminais dos últimos 3 anos (2014). –2016; 156 semanas). As regiões densas em crime e os preditores de crime descobertos no
conjunto de treinamento, bem como uma discussão sobre a avaliação da qualidade dos modelos no conjunto de teste, são descritos nas duas
subseções a seguir.

Figura 7 . Área selecionada da cidade de Nova York e eventos criminais geolocalizados (2001–2016).
Figura 8 . Dados criminais de Nova York: número de crimes versus tempo e sua distribuição por mês.
5.2.2 . Detecção de regiões densamente criminosas a partir do conjunto de treinamento

Conforme discutido na Seção 4.2 , o ajuste ideal dos parâmetros do DBSCAN para descobrir regiões densamente criminosas não é uma tarefa
fácil. O objetivo é detectar uma sintonia adequada de e valores, que são fatores-chave para a precisão da fase de detecção de regiões
densas e para o equilíbrio certo entre separabilidade, densidade, compactação e significância dos clusters. Apresentamos aqui os resultados
alcançados pela fixação e , que foram avaliados através de diversos testes experimentais para melhor se adequar ao
nosso cenário de aplicação e ao conjunto de dados considerado.
As regiões densamente criminosas da cidade de Nova Iorque, descobertas através do algoritmo DBSCAN, são mostradas na Fig . O algoritmo
detecta sete regiões de crime significativas claramente reconhecíveis através de cores diferentes: uma grande região de crime (em vermelho)
cobrindo Midtown e Lower Manhattan (incluindo o Distrito Financeiro) e outras seis áreas menores (em verde, roxo, azul e azul claro). nos lados
superior Leste e Oeste, correspondendo às zonas de maior concentração de crimes. As três maiores regiões densamente criminosas ( CDR1 ,
CDR2 e CDR3 ) estão ampliadas no lado esquerdo da Fig.. Observamos que existem muitas outras regiões mais pequenas que representam
zonas de criminalidade muito locais e de elevada densidade, cujo pequeno tamanho as torna menos interessantes para a nossa análise. A Tabela
4 mostra a extensão das três regiões com maior densidade de criminalidade ( CDR1 , CDR2 e CDR3 ), em relação a toda a área. No geral, estas
regiões cobrem cerca de 24,5% de toda a área e cerca de 40% dos eventos criminais detectados em toda a área entre 2006 e 2016.

Figura 9 . Regiões densamente criminais detectadas na área selecionada da cidade de Nova York. (Para interpretação das referências à cor nesta
legenda da figura, o leitor deve consultar a versão web deste artigo.)
Tabela 4 . A extensão das regiões mais amplas com densidade de criminalidade em relação a toda a área considerada.
Região Extensão (KM ) Extensão (%) Crimes (#) Crimes (%)
Área inteira 76,41 100,00% 1.472.305 100%
Região Densa de Crime 3 2,71 3,55% 69.268 4,70%
5.2.3 . Treinando e avaliando os modelos de crime regressivo

Modelos regressivos de criminalidade foram extraídos para as três regiões com maior densidade de criminalidade detectadas pelo nosso
algoritmo para Manhattan. Especificamente, os modelos auto-regressivos treinados a partir dos dados de entrada foram
, e para a primeira, segunda e terceira regiões, respectivamente.
Vale a pena notar que os modelos preditivos de criminalidade diferem entre regiões (como também visto no estudo de caso de Chicago), como
prova de que cada área apresenta tendências e padrões de criminalidade específicos.
A avaliação das funções regressivas treinadas nos dados da cidade de Nova Iorque foi realizada no conjunto de testes, que consiste nos últimos
três anos de dados (ou seja, anos 2014–2016). A Figura 10 mostra dados observados e previstos (plotados em azul e verde, respectivamente)
para o período do conjunto de testes. Vale a pena notar que os dados previstos aderem muito bem aos dados observados durante todo o período
do conjunto de testes. Apenas no caso da Região Densa de Crime 2, observamos que existe uma diferença evidente entre as duas curvas e, em
particular, como a tendência de previsão assume valores inferiores à tendência real.
Agora, vamos fazer uma avaliação quantitativa sobre o desempenho dos modelos regressivos e sua eficácia em fazer previsões nos conjuntos de
testes correspondentes. Para tal, o desempenho da previsão foi avaliado utilizando as medidas de erro MAE , MAPE , ME e RMSE , para vários
horizontes temporais.
Os valores das quatro medidas de erro são relatados na Tabela 5, para toda a área e para as três principais regiões com maior densidade de
criminalidade, considerando horizontes de previsão com um ano de antecedência, dois anos de antecedência e três anos de antecedência.
Podemos observar que os valores do MAE diminuem quando as áreas das regiões são menores. Por exemplo, considerando a previsão com um
ano de antecedência, o MAE diminui de 135,30 (toda a área) para 52,15, 10,56 e 12,46 (três regiões densas em criminalidade, ordenadas por
tamanhos decrescentes), e da mesma forma todos os outros anos. Uma tendência semelhante foi observada também para o estudo de caso de
Chicago, e é confirmada para o estudo de caso de Nova Iorque. Vale ressaltar que é um resultado razoável, pois as previsões parecem mais
precisas tanto em termos de identificação específica das áreas quanto em termos de precisão das previsões. Como consideração final,
observamos na Fig.que os modelos regressivos para toda a área, Região Densa de Crime 1 e 3 ( Figs. 10 (b) e 10 (d)) aderem aos dados
observados muito melhor do que o caso da Região Densa de Crime 2 ( Fig. 10 (c)) .

Figura 10 . Número de crimes observados e previstos (linhas azuis e verdes) no conjunto de testes de Nova Iorque, para toda a área e para as
três principais regiões com maior densidade de crimes. (Para interpretação das referências à cor nesta legenda da figura, o leitor deve consultar
a versão web deste artigo.)
Tabela 5 . Erros de previsão MAE, MAPE, ME e RMSE em relação aos anos, para toda a área e para as três principais regiões com maior
densidade de criminalidade na cidade de Nova York.
T empo MAE MAPE
2014 135,30 52,15 10.56 12h46 6.17 7.26 8h15 12h59
2015 141,68 51,51 20,86 11.06 6.04 7,42 14h95 9,87
2016 117,49 47,85 25.05 11h80 4,79 6.41 16,64 10.58
T empo MEU REQM
2014 −80,05 −41,17 2.11 −6,55 184,81 70,99 14.23 14,73
2015 −0,6 −28,57 15,63 1,51 177.08 66.08 24h60 14h45
2016 31.21 −8,00 23,84 2,68 143,73 57,80 29,85 16.19
5.3 . Análise comparativa com outras abordagens

Para tornar nossa avaliação mais precisa e completa, realizamos uma análise comparativa de diversas abordagens para extração de preditores
de crime. Especificamente, avaliamos o desempenho dos modelos ARIMA versus três algoritmos de regressão clássicos (ou seja, RandomForest
[17] , REPTree [18] , ZeroR [19] ) e versus as abordagens [10] e [13]especificamente proposto na literatura de previsão do crime. Para
realizar a análise comparativa, avaliamos o desempenho da previsão das diferentes abordagens no conjunto de testes das três áreas (ambas em
Chicago e na cidade de Nova York), versus diferentes horizontes de previsão. Os resultados dos algoritmos foram obtidos realizando um ajuste
preciso dos parâmetros de entrada: para cada conjunto de dados, diferentes execuções foram executadas para diferentes valores dos
parâmetros e, em seguida, foram selecionados os melhores resultados. Os resultados mostrados abaixo referem-se apenas à execução com a
melhor combinação de parâmetros. A Figura 11 resume os resultados da comparação, mostrando o Erro Médio Absoluto alcançado ( ) para
previsões com um ano de antecedência, para as três regiões com maior densidade de criminalidade em Chicago e na cidade de Nova Iorque. Em
particular, podemos ver que a abordagem ARIMA geralmente atinge maior precisão do que outros algoritmos. Na verdade, considerando os
conjuntos de dados de Chicago e Nova Iorque, os modelos ARIMA apresentam melhor desempenho para todas as regiões com maior densidade
de criminalidade. Na verdade, a diferença de desempenho é mais evidente para áreas maiores. Estes resultados confirmam a adequação do
modelo autorregressivo e o seu bom desempenho no domínio da previsão da criminalidade.

Figura 11 . Análise comparativa entre diversas abordagens, avaliando o Erro Médio Absoluto ( ) das regiões densamente criminosas, para
CHI (a) e NYC (b).
6 . Conclusão
Este artigo apresentou um algoritmo geral para previsão de crimes espaço-temporais em áreas urbanas, implementado no contexto da divisão
de grandes áreas de cidades em subáreas, detectando regiões densas de crime (de formatos arbitrários). Essas regiões são então analisadas e um
modelo auto-regressivo de previsão diferente é adaptado especificamente para cada região detectada. A avaliação experimental, realizada em
dois conjuntos de dados, relacionados aos dados criminais de amplas áreas da cidade de Chicago e Nova York, mostrou que a metodologia
proposta pode prever o número de crimes com alta precisão. Além disso, a abordagem fornece informações refinadas sobre onde se espera que
os eventos criminais ocorram. Apresentamos também uma análise comparativa com outros algoritmos regressivos, mostrando que (até onde
sabemos) os resultados alcançados superam os de outras abordagens propostas na literatura de previsão de crime até o momento. Em trabalhos
futuros, outras questões de pesquisa poderão ser investigadas. Primeiro, podemos explorar ainda mais a aplicação de outras abordagens de
análise espacial para a detecção de regiões densamente criminosas, para prever tendências de criminalidade nessas regiões. Especificamente,
estamos interessados em estudar a aplicação de algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus
tamanhos são muito grandes. Em segundo lugar, correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as
relações entre eles, bem como para explorar o uso destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. outras
questões de pesquisa podem ser investigadas. Primeiro, podemos explorar ainda mais a aplicação de outras abordagens de análise espacial para
a detecção de regiões densamente criminosas, para prever tendências de criminalidade nessas regiões. Especificamente, estamos interessados
em estudar a aplicação de algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito
grandes. Em segundo lugar, correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem
como para explorar o uso destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. outras questões de pesquisa
podem ser investigadas. Primeiro, podemos explorar ainda mais a aplicação de outras abordagens de análise espacial para a detecção de regiões
densamente criminosas, para prever tendências de criminalidade nessas regiões. Especificamente, estamos interessados em estudar a aplicação
de algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito grandes. Em segundo
lugar, correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem como para explorar o
uso destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. estamos interessados em estudar a aplicação de
algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito grandes. Em segundo lugar,
correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem como para explorar o uso
destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. estamos interessados em estudar a aplicação de algoritmos
espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito grandes. Em segundo lugar,
correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem como para explorar o uso
destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos.
Artigos de edição especial Artigos recomendados
Referências
[1] Programa de Assentamentos das Nações Unidas, o estado das cidades do mundo 2004/2005: Globalização e cultura
urbana. Varredura terrestre
( 2004 )
[2] Cidades: O século da cidade

Natureza , 467 ( 2010 ) , pp . 900-901
[3] Cicirelli F. , Guerrieri A. , Spezzano G. , Vinci A.

Uma plataforma baseada na borda para aplicações dinâmicas de cidades inteligentes
Futuro Gener. Computação. Sist. , 76 ( 2017 )
Google Scholar
[4] M. Tayebi, M. Ester, U. Glasser, P. Brantingham, CRIMETRACER: Previsão de localização de crimes baseada no espaço de atividades,
em: Avanços em Análise e Mineração de Redes Sociais, ASONAM, 2014 IEEE/ACM International Conference on, 2014, pp. –480.
Google Scholar
[5] Wang H. , Kifer D. , Graif C. , Li Z.

Inferência da taxa de criminalidade com big data
Processo. da 22ª Conferência Internacional ACM SIGKDD sobre Descoberta de Conhecimento e Mineração de Dados , KDD '16 , ACM (
2016 )
Google Scholar
[6] Catlett C. , Malik T. , Goldstein B. , Giuffrida J. , Shao Y. , Panella A. , Eder D. , van Zanten E. , Mitchum R. , Thaler S. , Foster I.T.
Plenário: Uma plataforma aberta de descoberta e exploração de dados para ciência urbana
Engenheiro de Dados IEEE. Touro. , 37 ( 4 ) ( 2014 )
Google Scholar
[7] Dados abertos da cidade de Nova York, 30/09/2018.

Google Scholar
[8] C. Catlett, E. Cesario, D. Talia, A. Vinci, Uma abordagem baseada em dados para previsões de crimes espaço-temporais em cidades
inteligentes, em: Proceedings of the 2018 IEEE International Conference on Smart Computing, SMARTCOMP'18, 2018, pp. 17–24.
Google Scholar
[9] K. Kianmehr, R. Alhajj, Previsão de pontos críticos de crime usando máquina de vetores de suporte, em: Computer Systems and
Applications, 2006. IEEE International Conference on, 2006, pp.
Google Scholar
[10] Wang H. , Kifer D. , Graif C. , Li Z.

Inferência da taxa de criminalidade com big data
Processo. da 22ª Conferência Internacional ACM SIGKDD sobre Descoberta de Conhecimento e Mineração de Dados , ACM ( 2016 ) , pp
.
Referência Cruzada View in Scopus Google Scholar
[11] Y. Zhuang, M. Almeida, M. Morabito, W. Ding, Crime hot spot forecasting: A recurrent model with spatial and temporal information, in:
2017 IEEE International Conference on Big Knowledge, ICBK, 2017, pp. 143–150, http://dx-
doi.ez46.periodicos.capes.gov.br/10.1109/ICBK.2017.3 .
Google Scholar
[12] B. Chandra, M. Gupta, M. Gupta, A multivariate time series clustering approach for crime trends prediction, in: Systems, Man and
Cybernetics, 2008. SMC 2008. IEEE International Conference on, 2008.
Google Scholar
[13] Gorr W., Olligschlaeger A., Thompson Y.

Short-term forecasting of crime
Int. J. Forecast., 19 (4) (2003), pp. 579-594
View PDF View article View in Scopus Google Scholar
[14] P. Chen, H. Yuan, X. Shu, Forecasting crime using the ARIMA model, in: Fuzzy Systems and Knowledge Discovery, 2008. FSKD ’08.
Fifth International Conference on, vol. 5, 2008, pp. 627–630.
Google Scholar
[15] Ester M., Kriegel H.-P., Sander J., Xu X.

A density-based algorithm for discovering clusters in large spatial databases with noise
Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, KDD’96, AAAI Press (1996)
Google Scholar
[16] Hyndman R.J., Athanasopoulos G.

Forecasting: Principles and Practice
OTexts.com (2014)
Google Scholar
[17] Breiman L.
Random forests
Mach. Learn., 45 (1) (2001), pp. 5-32
Google Scholar
[18] Hall Mark A., Witten Ian H., Frank Eibe

Data Mining: Practical Machine Learning Tools and Techniques
Morgan Kaufmann (2011)
Google Scholar
[19] Nasa C. S.
Evaluation of different classification techniques for WEB data
Int. J. Comput. Appl., 52 (9) (2012), pp. 34-40
Google Scholar
Cited by (67)
Information fusion in crime event analysis: A decade survey on data, features and models
2023, Information Fusion
Show abstract
Multi-density urban hotspots detection in smart cities: A data-driven approach and experiments
2022, Pervasive and Mobile Computing
Citation Excerpt :
…Given the availability of geo-referenced data, urban hotspots can be considered as dense regions in spatial data, serving as a valuable organization technique
for framing detailed knowledge of a metropolitan area. Such knowledge models provide high-level summaries for spatial datasets, which are valuable for
planners, scientists, and policymakers [2,4,5]. For example, environmental scientists are interested in partitioning a city into uniform regions based on pollution
density and other environmental characteristics.…
Show abstract
An anticrime information support system design: Application of K-means-VMD-BiGRU in the city of Chicago
2022, Information and Management
Citation Excerpt :
…The reason is that beyond the familiar scope of their activity, criminals will have to seek opportunities to commit crimes and are very likely to face uncertain
or unpredictable risks. In addition, crime occurrences can vary across temporal periods, which is often called the seasonality of crime [19]. The routine activity
theory [20] contends crime opportunities focus on place and time.…
Show abstract
Multi-layer data integration technique for combining heterogeneous crime data
2022, Information Processing and Management
Citation Excerpt :
…We make this dataset available so that other can expand on the drug and human trafficking analysis in the future. Possible avenues of future work are
leveraging other datasets made available from Louisville’s Open Data initiative to expand on smart city crime analysis research done by Catlett et al. (2019) to
the city of Louisville. Additionally, implementing the methodology proposed in this paper to other states that make crime data available to complement the
NIBRS dataset could offer additional insights, especially in states that see inconsistent NIBRS participation.…
Show abstract
Static or dynamic? Characterize and forecast the evolution of urban crime distribution
2022, Expert Systems with Applications
Citation Excerpt :
…Repeat victimization is when after one criminal incident, the target and nearby areas are more likely to suffer from the same or similar criminal activities
(Groff et al., 2015; Youstin, Nobles, Ward, & Cook, 2011), which leads to a spatial and temporal concentration of the same or similar crimes (Chalfin & McCrary,
2017; Weisburd, 2015). Catlett, Cesario, Talia, and Vinci (2019) found that 60 percent of crimes occurred in 6 percent of places and resulted in an obvious repeat
victimization crime distribution. Though the likelihood of repeat victimization varies with the targets, a common feature of near-repeat crime in hotspots is that
when they occur again, the occurrence tends to be very rapid, which indicates that information or experience against the targets is passed on from one criminal
to another within a certain space and time (Johnson, Bowers, & Hirschfield, 1997).…
Mostrar resumo
Um pipeline de anonimato híbrido para melhorar o equilíbrio entre privacidade e utilidade em conjuntos de dados confidenciais
para fins de ML
2023, Série de Anais da Conferência Internacional ACM
Veja todos os artigos que citam no Scopus

Ver Resumo
© 2019 Elsevier BV Todos os direitos reservados.
Todo o conteúdo deste site: Copyright © 2023 Elsevier BV, seus licenciadores e colaboradores. Todos os direitos são reservados, incluindo aqueles para mineração de texto e dados, treinamento em IA e tecnologias
similares. Para todo o conteúdo de acesso aberto, aplicam-se os termos de licenciamento Creative Commons.

Ws 001 Ok

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Ws 001 Ok

Enviado por

Direitos autorais:

Formatos disponíveis

22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect

Computação Pervasiva e Móvel

Previsões de crimes espaço-temporais em cidades inteligentes: uma

Contorno Compartilhar Citar

Tabela 1 . Comparação de diversas abordagens propostas na literatura.

Detecção de pontos críticos Abordagem de detecção de Formas de pontos de Abordagem de Preditores de

A abordagem Sim Clustering baseado em qualquer formato ARIMA

3 . Definição e objetivo do problema

1. descubra um conjunto de regiões densamente criminosas ( ou ), , onde uma região

Baixar: Baixar imagem em alta resolução (148 KB)

Figura 1 . Etapas de previsão de crimes espaço-temporais.

Baixar: Baixar imagem em alta resolução (245 KB)

Figura 2 . Algoritmo de previsão de crimes espaço-temporais.

4.2 . Detecção de regiões densamente criminosas

4.3 . Extração de preditores de crime

5 . Análise e resultados experimentais

5.1 . Chicago: resultados experimentais

5.1.1 . Descrição de dados

Baixar: Baixar imagem em alta resolução (533 KB)

Figura 3 . Área selecionada de Chicago e eventos criminais geolocalizados (2001–2016).

Baixar: Baixar imagem em alta resolução (744 KB)

5.1.2 . Detecção de regiões densamente criminosas a partir do conjunto de treinamento

Baixar: Baixar imagem em alta resolução (887 KB)

Região Extensão (KM ) Extensão (%) Crimes (#) Crimes (%)

Área inteira 135.02 100,00% 1.896.782 100%

Região densa de crime 1 17.04 12,62% 461.996 24,35%

Região densa de crime 2 6.03 4,47% 168.159 8,86%

Região Densa de Crime 3 4,59 3,40% 131.154 6,91%

5.1.3 . Treinando e avaliando os modelos de crime regressivo

Baixar: Baixar imagem em alta resolução (663 KB)

T empo MAE MAPE

Área CDR1 CDR2 CDR3 Área CDR1 CDR2 CDR3

2014 88,86 30h20 14h47 11h15 6.19 8,68 10,86 11h90

2015 74,54 28.24 12.13 9.24 5.42 7,60 8,94 9,62

2016 81,47 31.04 12,86 13,83 6.29 10.14 9,99 18,66

T empo MEU REQM

Área CDR1 CDR2 CDR3 Área CDR1 CDR2 CDR3

2015 −27.05 4,75 −1,80 −1,57 97,77 34,61 14,98 11h43

2016 −48,77 −24,94 −5,36 −11.02 115.16 38,31 15,95 16,66

5.2 . Cidade de Nova York: resultados experimentais

5.2.1 . Descrição de dados

Baixar: Baixar imagem em alta resolução (777 KB)

Baixar: Baixar imagem em alta resolução (726 KB)

5.2.2 . Detecção de regiões densamente criminosas a partir do conjunto de treinamento

Baixar: Baixar imagem em alta resolução (694 KB)

Região Extensão (KM ) Extensão (%) Crimes (#) Crimes (%)

Área inteira 76,41 100,00% 1.472.305 100%

Região densa de crime 1 13.57 17,77% 452.113 30,70%

Região densa de crime 2 2.33 3,05% 79.803 5,42%

Região Densa de Crime 3 2,71 3,55% 69.268 4,70%

5.2.3 . Treinando e avaliando os modelos de crime regressivo

Baixar: Baixar imagem em alta resolução (719 KB)

T empo MAE MAPE

Área CDR1 CDR2 CDR3 Área CDR1 CDR2 CDR3

2014 135,30 52,15 10.56 12h46 6.17 7.26 8h15 12h59

2015 141,68 51,51 20,86 11.06 6.04 7,42 14h95 9,87

2016 117,49 47,85 25.05 11h80 4,79 6.41 16,64 10.58

T empo MEU REQM

Área CDR1 CDR2 CDR3 Área CDR1 CDR2 CDR3

2014 −80,05 −41,17 2.11 −6,55 184,81 70,99 14.23 14,73

2015 −0,6 −28,57 15,63 1,51 177.08 66.08 24h60 14h45

2016 31.21 −8,00 23,84 2,68 143,73 57,80 29,85 16.19

5.3 . Análise comparativa com outras abordagens