Escolar Documentos
Profissional Documentos
Cultura Documentos
Mostre mais
https://doi.org/10.1016/j.pmcj.2019.01.003
Obtenha direitos e conteúdo
Abstrato
A crescente urbanização está a causar transformações económicas e sociais significativas nas áreas urbanas, colocando vários desafios
relacionados com a gestão e os serviços das cidades. Em particular, em cidades com taxas de criminalidade mais elevadas, garantir eficazmente a
segurança pública é uma tarefa cada vez mais complexa. Para lidar com esta complexidade, as novas tecnologias estão a permitir que os
departamentos de polícia acedam a volumes crescentes de dados relacionados com a criminalidade que podem ser analisados para compreender
padrões e tendências. Estas tecnologias têm potencial para aumentar a distribuição eficiente de recursos policiais num determinado território e,
em última análise, apoiar uma prevenção mais eficaz do crime. Este artigo apresenta uma abordagem preditiva baseada em análise espacial e
modelos auto-regressivos para detectar automaticamente regiões de crime de alto risco em áreas urbanas e prever com segurança as
tendências da criminalidade em cada região. O resultado do algoritmo é um modelo espaço-temporal de previsão de crimes, composto por um
conjunto de regiões densas em crimes com preditores de crimes associados, cada um representando ummodelo preditivo para estimar o número
de crimes que provavelmente ocorrerão em sua região associada. A avaliação experimental foi realizada em dois conjuntos de dados reais
coletados nas cidades de Chicago e Nova York. Esta avaliação mostra que a abordagem proposta atinge uma boa precisão na previsão espacial e
temporal da criminalidade ao longo de horizontes temporais contínuos.
anterior Próximo
Palavras-chave
Previsão de crimes; Cidade inteligente; Computação urbana; Análise de dados
1 . Introdução
Contexto de referência. O século XXI é frequentemente referido como o “Século da Cidade”, reflectindo a migração global sem precedentes
para as áreas urbanas que está em curso [1] , [2] . Esta urbanização cada vez maior está a trazer perturbadoras transformações sociais,
económicas e ambientais às áreas urbanas. Por exemplo, está a apresentar desafios às organizações encarregadas da gestão da cidade e da
prestação de serviços essenciais, como o planeamento de recursos (água, eletricidade), trânsito, qualidade do ar e da água e segurança pública
[3] .. Além disso, para as cidades com taxas de criminalidade mais elevadas, o aumento da criminalidade está a tornar-se um dos problemas
sociais mais importantes, afectando não só a segurança pública, mas também a saúde, a educação, o desenvolvimento infantil e o estatuto
socioeconómico dos adultos [4], [ 5 ] .
Motivações e Contribuições. Um volume cada vez maior de dados urbanos, com atributos espaciais e temporais, desde o clima à qualidade
do ar e à actividade económica, está disponível para organizações públicas, incluindo departamentos de polícia, para integração com dados
internos. Isto oferece a oportunidade de aplicar metodologias de análise de dados para extrair modelos preditivos úteisrelacionados com eventos
criminais, o que pode permitir aos departamentos de polícia utilizar melhor os seus recursos limitados e desenvolver estratégias mais eficazes
para a prevenção do crime. Em particular, extensos estudos de justiça criminal mostram que a incidência de eventos criminais não está
distribuída igualmente dentro de uma cidade. Na verdade, as taxas de criminalidade podem mudar em relação à localização geográfica da área
(existem áreas de baixo e alto risco) e as tendências da criminalidade podem variar (padrões sazonais, picos, quedas) em relação ao período do
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 1/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
ano. Por esta razão, um modelo preditivo precisodeve ser capaz de detectar automaticamente quais áreas da cidade são mais afetadas por
eventos criminais e como a taxa de criminalidade de cada área específica varia em relação ao período temporal. Este conhecimento pode
permitir que os departamentos de polícia aloquem eficientemente os seus recursos para pontos críticos de criminalidade específicos, permitindo
o destacamento eficaz de agentes para áreas de alto risco ou a remoção de agentes de áreas com níveis decrescentes de criminalidade,
prevenindo assim de forma mais eficiente ou respondendo rapidamente a situações criminais. atividade.
Este artigo apresenta o desenho e implementação de uma abordagem baseada em análise espacial e modelos auto-regressivos para detectar
automaticamente regiões de crime de alto risco em áreas urbanas e prever de forma confiável as tendências da criminalidade em cada região. O
algoritmo é composto de várias etapas. Primeiro, as áreas de alta densidade de criminalidade (chamadas regiões densas de criminalidade ou
focos de criminalidade) são descobertas através de uma abordagem de análise espacial, onde as formas das regiões detectadas são
automaticamente traçadas pelo algoritmo sem qualquer divisão pré-fixada em áreas. Em seguida, um modelo específico de previsão de crimes é
descoberto em cada região detectada, analisando as partições descobertas na etapa anterior. O resultado final do algoritmo é um modelo espaço-
temporal de previsão de crimes, composto por um conjunto de regiões densas de crimes e um conjunto de preditores de crimes associados,
Como estudo de caso, apresentamos aqui a análise de crimes em (i) uma grande área de Chicago e (ii) no bairro de Manhattan, na cidade de
Nova Iorque, envolvendo cerca de dois milhões de eventos criminais (durante um período de 16 anos) e 1,5 milhões de eventos criminais
(durante um período de 11 anos), respectivamente. Os dados criminais de Chicago foram coletados pela plataforma Plenario [6] , uma estrutura
da Web que fornece acesso público a mais de cem conjuntos de dados urbanos, enquanto os dados criminais da cidade de Nova York foram
coletados pela plataforma Opendata da cidade de Nova York [7 ]. Os resultados da avaliação experimental mostram a eficácia da abordagem, ao
alcançar uma boa precisão na previsão espacial e temporal da criminalidade ao longo de horizontes temporais contínuos. Apresentamos também
uma análise comparativa dos resultados obtidos através de nossa abordagem com outros algoritmos apresentados na literatura, demonstrando
maior precisão do algoritmo proposto em relação a outras abordagens regressivas propostas na literatura. Para maior clareza, este artigo
estende o trabalho apresentado em [8] e fornece diversas contribuições originais em relação ao anterior. A extensão mais significativa diz
respeito à avaliação experimental na Seção 5, que foi ampliado testando o algoritmo proposto em um segundo estudo de caso do mundo real
(cidade de Nova York) e realizando uma análise comparativa com outras abordagens de análise de regressão propostas na literatura.
Plano do Papel. O resto do artigo está organizado da seguinte forma. A Seção 2 relata as abordagens mais importantes na literatura de
mineração de dados criminais e os projetos mais representativos nesse campo de pesquisa. A Seção 3 descreve a definição do problema e os
objetivos de nossa análise. A Seção 4 apresenta o algoritmo de Predição de Crimes Espaço-Temporais, descrevendo detalhadamente suas
etapas. A seção 5 descreve a avaliação experimental, realizada em dois estudos de caso reais. Finalmente, a Seção 6 conclui o artigo e planeja
trabalhos de pesquisa futuros .
2 . Trabalho relatado
Várias técnicas de mineração de dados têm sido utilizadas para análise de crimes. Algumas abordagens foram propostas para previsão de
localização de crimes [4] , [9] , enquanto outras visam a detecção de padrões de crime [10] , [11] , [12] , [13] . Nesta seção revisamos
brevemente os trabalhos de pesquisa mais representativos em ambas as áreas. Em seguida, relatamos uma comparação crítica (com base em
algumas características específicas) entre o método que desenvolvemos e as soluções de última geração.
Previsão de localização de crimes . CrimeTracer [4] é baseado em uma estrutura probabilística para modelar o comportamento espacial de
infratores conhecidos nas áreas que eles frequentam, chamadas espaços de atividades . Experimentos realizados com dados criminais do mundo
real mostraram que os criminosos frequentemente cometem crimes dentro dos seus espaços de atividade, em vez de se aventurarem em
territórios desconhecidos. Os autores em [9] modelam as previsões de localização de crimes como um caso especial de tarefa de classificação de
mineração de dados espaciais e exploram máquinas de vetores de suporte (SVM) de uma classe para classificar locais como áreas de crime com
ou sem pontos críticos.
Detecção de padrões de crime . A abordagem proposta em [10] explora a regressão binomial negativa para inferir taxas de criminalidade em
diferentes áreas da cidade, integrando dados geográficos, demográficos, POIs e fluxos de táxi. Agrupamento multivariado de séries temporais e
modelos ARIMA são propostos em [12] e [14] , para descobrir tendências de crimes semelhantes e fazer previsões de crimes de curto prazo,
respectivamente. Modelos de Redes Neurais Recorrentes , que exploram informações espaciais e temporais para prever focos de crime, são
apresentados em [11] . Em [13] Suavização Exponencial de Holtfoi experimentado usando dados de toda a cidade e resultou como um modelo
de previsão preciso para séries de crimes em nível de delegacia.
A Tabela 1 apresenta uma comparação mais detalhada e crítica entre a abordagem proposta e algumas outras soluções propostas na literatura.
A comparação leva em consideração quatro características, conforme detalhado a seguir.
Detecção de pontos de acesso ao crime . Esta característica descreve se a abordagem implementa um método para detectar automaticamente
focos de crime, o que é uma questão crucial para a precisão e a eficácia de toda a tarefa de previsão do crime. O algoritmo proposto e as
abordagens apresentadas em [4] , [9] implementam métodos para detectar pontos críticos de crimes a partir de dados brutos de crimes,
enquanto o restante dos trabalhos relacionados dependem de regiões predefinidas, como Áreas Comunitárias [10] , Distritos [13 ] , células da
cidade [11]. O limite destas últimas abordagens é que se baseiam numa subdivisão estática de regiões e na sua categorização como regiões de
interesse criminal, o que poderia levar a regiões não interessantes em termos de análise criminal. Diferentemente, nossa abordagem e os
trabalhos em [4] , [9] são capazes de identificar locais relevantes baseados em dados, em vez de serem definidos estaticamente a priori.
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 2/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
Abordagem de detecção de pontos críticos de crime . Também classificamos os sistemas comparados com base na abordagem utilizada para
detectar regiões densamente criminosas, quando aplicável. As abordagens propostas em [4] , [9] exploram uma estrutura probabilística e
abordagens de Support Vector Machine (SVM), oportunamente adaptadas para lidar com dados criminais. Por outro lado, as abordagens
apresentadas em [10] , [11] , [13] , conforme destacado anteriormente, não utilizam abordagem de detecção, pois dependem de regiões pré-
definidas.
Ref. [4] Sim (ActivitySpace) Estrutura probabilística qualquer formato Não disponível (apenas previsão de
localização)
Ref. [10] Não (área de comunicação) Não (área predefinida) Com. Formato da área Regressão Binomial Negativa (NBR)
Ref. [13] Não (distrito) Não (área predefinida) Formato do distrito Suavização Exponencial Holt (HES)
Ref. [9] Sim Máquina de vetores de suporte qualquer formato Não disponível (apenas previsão de
localização)
Ref. [11] Não (células da grade) célula de grade de tamanho igual quadrado Redes Neurais Recorrentes (RNN)
Formas de pontos de acesso ao crime . Outra característica importante para efeitos de classificação é a forma dos focos de crime. Na verdade,
esta característica permite avaliar a capacidade da abordagem de detecção em identificar qualquer possível área espacial densa,
independentemente da forma. Quanto mais formas o algoritmo for capaz de capturar, melhor será a precisão e a eficácia das regiões densas
detectadas. Nossa abordagem e o trabalho descrito em [4] , [9] são capazes de detectar regiões de qualquer formato (por exemplo, circular,
retangular, linear), enquanto os outros trabalhos [10] , [11] , [13] tratam apenas de regiões específicas. formas da região.
Abordagem do Preditor de Crime . Este recurso classifica os sistemas com base na abordagem utilizada para detectar preditores de crime.
Especificamente, nossa abordagem explora modelos ARIMA, enquanto as abordagens apresentadas em [10] , [11] , [13] utilizam modelos de
Regressão Binomial Negativa, HES e RNN, respectivamente. Diferentemente da nossa, as outras abordagens [4] , [9] realizam apenas a
previsão da localização do crime e não consideram a análise de tendências do crime.
2. extrair uma função , que dado um carimbo de data / hora indica o número de crimes que estão
previstos para acontecer em cada região densamente criminosa no carimbo de data / hora .
4 . A abordagem proposta
Esta seção descreve o algoritmo que projetamos para descobrir modelos preditivos espaço-temporais a partir de dados criminais.
Especificamente, a Seção 4.1 descreve as principais etapas da abordagem proposta e seu metacódigo, enquanto as Seções 4.2 Detecção de
regiões densas de crime , 4.3 Extração de preditores de crime descrevem em detalhes os procedimentos para detecção de regiões densas de
crime e extração de preditores de crime.
4.1 . O algoritmo
A Figura 1 esboça a ideia geral do algoritmo através de uma representação gráfica de todo o processo como uma sequência de três etapas
principais. Os dados de entrada da análise são o conjunto de dados criminais recolhidos a serem processados. A primeira etapa do algoritmo
consiste na detecção de regiões densamente criminosas a partir do conjunto de dados original. O objetivo desta etapa é detectar áreas (ou seja,
polígonos, bolhas) onde ocorrem eventos criminais com maior densidade do que outras áreas adjacentes, traçadas automaticamente pelo
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 3/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
algoritmo sem qualquer divisão pré-fixada em áreas. Esta tarefa pode ser modelada como uma instância de clustering geoespacial e pode ser
resolvida, conforme descrito abaixo, usando algoritmos de clusteringque processam dados criminais espaciais e temporais. O resultado final
desta etapa consiste em clusters, onde cada cluster corresponde a uma região densamente criminosa. O número de regiões detectadas (ou seja,
número de clusters) pode ser fixado a priori ou detectado automaticamente, dependendo do algoritmo de cluster específico. A segunda etapa
consiste na divisão espacial dos dados criminais originais, com base no modelo de agrupamento descoberto na etapa anterior. Em outras
palavras, os pontos dos eventos de dados criminais originais atribuídos ao o cluster são transformados em uma série temporal e reunidos no o
conjunto de dados de saída, para . No final desta etapa, diferentes conjuntos de dados de séries temporais estão disponíveis, cada
um contendo a série temporal de crimes ocorridos em sua região densa associada. A terceira etapa visa extrair um modelo específico de
previsão de criminalidade para cada região densamente criminosa (ou as regiões mais representativas), analisando a divisão dos dados
criminais durante a etapa anterior.
O metacódigo do algoritmo de previsão de crime espaço-temporal (STCP) é relatado na Figura 2 . O algoritmo recebe na entrada , ou seja, o
conjunto de dados sobre crimes, e retorna os modelos de conhecimento descobertos, ou seja, o conjunto de regiões densas em crimes
e o conjunto de preditores de crime . É importante notar que este metacódigo é paramétrico em
relação ao algoritmo para detecção de regiões densas de crime e preditores de crime, e daremos detalhes adicionais (sobre os algoritmos
específicos explorados neste trabalho) nas duas subseções a seguir. O algoritmo começa executando uma tarefa de agrupamento espacial no
conjunto de dados , destinado a detectar regiões densas (isto é, pontos críticos) de crimes. Isso é realizado pelo método
DiscoverCrimeRegions (), que extrai aglomerados espaciais, cada um representando uma região densa de crimes detectada (linha L1). Assim
que esta etapa for concluída, o conjunto de dados criminais é transformado em conjuntos de dados de série temporal com base no modelo de
cluster descoberto extraído na etapa anterior. Especificamente, esta tarefa é executada pelo método BuildCrimeTSData () (linha L2), que
processa o conjunto de dados original e o transforma na coleção de conjuntos de dados de série temporal , onde cada éa
série temporal de crimes geolocalizados na área (detectado durante a etapa anterior). No final desta etapa, diferentes conjuntos
de dados de séries temporais estão disponíveis. Finalmente, para cada , o método DiscoverLocalCrimePredictor () descobre um modelo
preditivo (linhas L3–L6) para prever o número de crimes que acontecerão na área específica (Associado a ). Todo o modelo retornado
pelo algoritmo, compreendendo o conjunto de regiões densamente criminosas e o conjunto de preditores de crime
, pode ser usado para previsão de crimes espaço-temporais.
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 4/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
pontos: um ponto é diretamente alcançável por densidade a partir de outro ponto se não estiver mais distante do que uma determinada
distância ( ) (ou seja, faz parte de sua vizinhança) e se estiver cercado por um número suficiente de pontos ( ). No contexto considerado,
um cluster corresponde a uma região densamente criminosa. Além disso, para capturar a mudança dinâmica dos clusters, calculamos a
densidade de cada ponto de dados, ponderando-o através de um fator de decaimento que dá menos importância às informações históricas e
mais peso aos dados recentes: para cada registro de dados , atribuímos a ele um coeficiente de densidade que diminui com idades: se
ocorre no carimbo de data/hora , seu coeficiente de densidade é ponderado por , onde é uma constante chamada fator de
decaimento, e é o carimbo de data/hora mais recente. Finalmente, DBSCAN exige que o usuário especifique o raio da vizinhança (ou seja, )
e o número mínimo de objetos que ele deve ter (ou seja, ), cujos valores afetam o tamanho e a densidade dos clusters descobertos.
Geralmente, uma configuração ótima de seus parâmetros é complexa de ser alcançada e requer técnicas específicas; no entanto, tal tópico está
fora do escopo deste artigo.
onde é um fator de correção, são os coeficientes de regressão da parte auto-regressiva, são o coeficiente de regressão da parte
da média móvel, são valores defasados de e erros atrasados ( preditores) e é o ruído branco e leva em
consideração o erro de previsão. Em nosso estudo exploramos modelos ARIMA sazonais , que são uma extensão do ARIMA clássico. Um modelo
ARIMA sazonal é formado pela inclusão de termos sazonais adicionais nos modelos ARIMA clássicos introduzidos anteriormente. A parte
sazonal do modelo consiste em termos muito semelhantes aos componentes não sazonais do modelo. Na fórmula final, os termos sazonais
adicionais são simplesmente multiplicados pelos termos não sazonais. Um modelo ARIMA sazonal é definido como ,
onde é um fator de periodicidade, e são as ordens da parte auto-regressiva, diferencial e da média móvel para o modelo não
sazonal e sazonal, respectivamente [16] .
A Figura 4 mostra uma visão preliminar dos dados criminais coletados, que fornece algumas dicas sobre tendências e distribuição dos dados. A
Figura 4(a) mostra o gráfico temporal dos dados de crimes observados, no qual o número de crimes é plotado em função do tempo de
observação. O enredo revela imediatamente algumas características interessantes. Em primeiro lugar, é evidente que o número de crimes está a
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 5/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
diminuir ao longo do período, mostrando uma clara tendência geral decrescente nos dados. Em segundo lugar, um padrão sazonal
repetidodentro de cada ano é claramente observável, e parece diminuir em tamanho (magnitude) à medida que a contagem geral de crimes na
série diminui. A partir do enredo, vemos que a ocorrência de crimes normalmente aumenta no final da primavera, atinge o pico durante o verão,
diminui no outono e geralmente diminui no inverno. Uma visão mais clara da sazonalidade escondida nos dados pode ser vista na Figura 4(b) ,
que mostra a distribuição do número médio de crimes por mês. O histograma mostra que o número de crimes na área da cidade sob observação
varia significativamente entre os diferentes períodos do ano. Em particular, o número de eventos criminais é mais elevado em Julho (com 11.050
crimes, em média), e mais baixo em Fevereiro (com 8.124 crimes, em média).
Para executar a tarefa de regressãoe sua validação, dividimos o conjunto de dados original em duas partições: o conjunto de treinamento e o
conjunto de teste. O primeiro é usado para descobrir os relacionamentos dentro dos dados, enquanto o segundo é usado para avaliar se os
relacionamentos descobertos são válidos de maneira geral. No nosso caso, o conjunto geral de dados criminais foi dividido em relação ao número
de anos: o conjunto de treinamento contém os dados criminais dos primeiros 13 anos (2001-2013, 678 semanas), enquanto o conjunto de teste
contém os dados criminais dos primeiros 13 anos (2001-2013, 678 semanas). últimos 3 anos (2014–2016, 156 semanas). Conforme descrito nas
subseções a seguir, treinamos o modelo de conhecimento (ou seja, regiões densas de criminalidade e preditores de criminalidade) usando dados
de janeiro de 2001 a dezembro de 2013 e usamos o modelo treinado para prever os eventos criminais de janeiro de 2014 a dezembro de 2016,
para avaliar a qualidade das previsões.
Figura 4 . Dados criminais CHI: número de crimes versus tempo e sua distribuição por mês.
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 6/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
significância dos clusters. Apresentamos aqui os resultados alcançados pela fixação e , que foram avaliados através de
diversos testes experimentais e que melhor se adequam ao nosso cenário de aplicação e ao conjunto de dados considerado.
As regiões densamente criminosas descobertas através da nossa análise são mostradas na Fig. 5 , onde cada região é representada por uma cor
diferente. Curiosamente, esta imagem mostra como os eventos criminais são agrupados com base em critérios de densidade; por exemplo, o
algoritmo detecta oito regiões de criminalidade significativas claramente reconhecíveis através de cores diferentes: uma grande região de
criminalidade (em vermelho) na parte central da área, juntamente com sete áreas menores (em verde, azul e azul claro) à esquerda e lado
direito, correspondendo às zonas de maior concentração de crimes. As três maiores regiões densamente criminosas ( CDR1 , CDR2 e CDR3 )
estão ampliadas no lado esquerdo da Fig.. Muitas outras regiões mais pequenas que representam zonas de criminalidade muito locais e de
elevada densidade estão distribuídas por toda a área. A Tabela 2 mostra a extensão das três regiões com maior densidade de criminalidade (
CDR1 , CDR2 e CDR3 ), em relação a toda a área. No geral, estas regiões cobrem cerca de 20,5% de toda a extensão da área e cerca de 40% dos
eventos criminais detectados em toda a área entre 2001 e 2016.
Figura 5 . Detectadas regiões densamente criminosas na área selecionada de Chicago. (Para interpretação das referências à cor nesta legenda da
figura, o leitor deve consultar a versão web deste artigo.)
Tabela 2 . A extensão das regiões mais amplas com densidade de criminalidade em relação a toda a área considerada.
Para avaliar a eficácia e a precisão das funções regressivas, realizamos uma análise de avaliação no conjunto de testes que consiste nos últimos
três anos de dados (ou seja, anos 2014–2016). Em particular, para cada região densa de crime e para toda a área, o seu respectivo modelo
ARIMA tem sido utilizado para prever valores futuros do número de crimes que são prováveis de acontecer naquela região, semana a semana.
A previsão do tipo de crimes foge ao âmbito deste trabalho e será estudada numa futura actividade de investigação. A Figura 6 mostra dados
observados e previstos (plotados em azul e verde, respectivamente) para o período do conjunto de testes. Observamos que os dados previstos
aderem muito bem aos dados observados durante todo o período do conjunto de teste.
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 7/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
Figura 6 . Número de crimes observados e previstos (linhas azuis e verdes) no conjunto de testes de Chicago, para toda a área e para as três
principais regiões com maior densidade de crimes. (Para interpretação das referências à cor nesta legenda da figura, o leitor deve consultar a
versão web deste artigo.)
Agora, vamos fazer uma avaliação quantitativa sobre o desempenho dos modelos regressivos e sua eficácia em fazer previsões nos conjuntos de
testes correspondentes. Para este fim, calculamos quatro medidas de erro ( MAE , MAPE , ME , RMSE ), que são comumente usadas na
literatura de análise regressiva para quantificar o desempenho das previsões.
A Tabela 3 apresenta os valores das quatro medidas de erro descritas acima para toda a área e as três regiões com maior densidade de
criminalidade, considerando horizontes de previsão com um ano de antecedência, dois anos de antecedência e três anos de antecedência.
Observando os valores da tabela, podemos observar que o MAE diminui à medida que as áreas das regiões são cada vez menores. Por exemplo,
considerando a previsão com um ano de antecedência, o MAE diminui monotonamente de 88,86 (toda a área) para 30,20, 14,47 e 11,15 (três
regiões densas em criminalidade, ordenadas por tamanho decrescente), e de forma semelhante em todos os outros anos. Este é um resultado
razoável, porque as previsões parecem mais precisas tanto em termos de identificação específica das áreas como em termos de precisão das
previsões ., fornecendo assim informações mais detalhadas aos administradores municipais e policiais para planejarem como distribuir recursos
e esforços nas diferentes regiões da cidade. Por fim, considerando o MAPE, observamos que os erros percentuais também são muito baixos. Na
verdade, a tabela mostra que o erro máximo de previsão do MAPE varia de 8,68% a 11,90% para o primeiro ano, de 7,60% a 9,62% para o
segundo ano, e de 10,14% a 18,66% para o terceiro ano, o que representa um resultado muito interessante. Até onde sabemos, esses resultados
excedem os de outras abordagens propostas na literatura de previsão de crime. Como consideração final, observamos na Figura 6 que os
modelos regressivos para cada área tendem a superestimar ligeiramente o número de crimes em relação aos que realmente ocorreram.
Tabela 3 . Medidas de erro de previsão versus anos, para toda a área e para as três regiões com maior densidade de criminalidade em Chicago.
linha 2014 −62,96 30.19 −8,36 −2,67 108,34 35,98 19.01 13.57
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 8/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
Esta seção apresenta a análise realizada nos dados criminais da cidade de Nova York. Tal como acontece com o estudo de caso anterior, as
principais etapas são descritas em quatro subseções: descrição e coleta de dados, detecção de regiões densamente criminosas e
treinamento e avaliação dos modelos regressivos.
As tendências e distribuição dos dados da cidade de Nova York são mostradas na Figura 8 , Figura 8 . Como visão preliminar, observamos que
existem diversas diferenças com a distribuição dos dados de Chicago. A Figura 8(a) mostra o gráfico temporal dos dados de crimes observados,
nos quais o número de crimes é plotado em função do tempo de observação. Em contraste com os dados de Chicago (que mostram uma
diminuição constante no total de crimes ao longo do tempo), o gráfico mostra claramente que o número de crimes apresenta uma tendência
estável até ao ano 2010, seguida por uma tendência decrescente suave de 2010 a 2012, e uma tendência estávelnovamente a partir de 2012.
Em segundo lugar, é observável um padrão sazonal anual, que aumenta de tamanho (magnitude) e se torna mais evidente a partir do ano de
2012. Em geral, podemos inferir que as ocorrências de crimes costumam atingir picos durante a Primavera e o Verão. (diferentemente dos
dados de Chicago), diminuem no outono e geralmente apresentam quedas no inverno. O componente de sazonalidade pode ser observado na
Figura 8 (b), que mostra a distribuição da média de crimes por mês. O número médio de eventos criminais é mais elevado durante o Verão (11
910 em Julho e 11 188 em Agosto), mas também existem alguns picos na Primavera (11 586 em Março e 11 742 em Maio). A contagem mais
baixa é em fevereiro (com 9.615 crimes em média). A divisão dos dados em conjunto de treinamento e conjunto de teste foi realizada da seguinte
forma: o conjunto de treinamento contém os dados criminais dos primeiros 8 anos (2006–2013; 416 semanas), enquanto o conjunto de teste
contém os dados criminais dos últimos 3 anos (2014). –2016; 156 semanas). As regiões densas em crime e os preditores de crime descobertos no
conjunto de treinamento, bem como uma discussão sobre a avaliação da qualidade dos modelos no conjunto de teste, são descritos nas duas
subseções a seguir.
Figura 7 . Área selecionada da cidade de Nova York e eventos criminais geolocalizados (2001–2016).
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 9/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
Baixar: Baixe a imagem em tamanho real
Figura 8 . Dados criminais de Nova York: número de crimes versus tempo e sua distribuição por mês.
As regiões densamente criminosas da cidade de Nova Iorque, descobertas através do algoritmo DBSCAN, são mostradas na Fig . O algoritmo
detecta sete regiões de crime significativas claramente reconhecíveis através de cores diferentes: uma grande região de crime (em vermelho)
cobrindo Midtown e Lower Manhattan (incluindo o Distrito Financeiro) e outras seis áreas menores (em verde, roxo, azul e azul claro). nos lados
superior Leste e Oeste, correspondendo às zonas de maior concentração de crimes. As três maiores regiões densamente criminosas ( CDR1 ,
CDR2 e CDR3 ) estão ampliadas no lado esquerdo da Fig.. Observamos que existem muitas outras regiões mais pequenas que representam
zonas de criminalidade muito locais e de elevada densidade, cujo pequeno tamanho as torna menos interessantes para a nossa análise. A Tabela
4 mostra a extensão das três regiões com maior densidade de criminalidade ( CDR1 , CDR2 e CDR3 ), em relação a toda a área. No geral, estas
regiões cobrem cerca de 24,5% de toda a área e cerca de 40% dos eventos criminais detectados em toda a área entre 2006 e 2016.
Figura 9 . Regiões densamente criminais detectadas na área selecionada da cidade de Nova York. (Para interpretação das referências à cor nesta
legenda da figura, o leitor deve consultar a versão web deste artigo.)
Tabela 4 . A extensão das regiões mais amplas com densidade de criminalidade em relação a toda a área considerada.
A avaliação das funções regressivas treinadas nos dados da cidade de Nova Iorque foi realizada no conjunto de testes, que consiste nos últimos
três anos de dados (ou seja, anos 2014–2016). A Figura 10 mostra dados observados e previstos (plotados em azul e verde, respectivamente)
para o período do conjunto de testes. Vale a pena notar que os dados previstos aderem muito bem aos dados observados durante todo o período
do conjunto de testes. Apenas no caso da Região Densa de Crime 2, observamos que existe uma diferença evidente entre as duas curvas e, em
particular, como a tendência de previsão assume valores inferiores à tendência real.
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 10/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
Agora, vamos fazer uma avaliação quantitativa sobre o desempenho dos modelos regressivos e sua eficácia em fazer previsões nos conjuntos de
testes correspondentes. Para tal, o desempenho da previsão foi avaliado utilizando as medidas de erro MAE , MAPE , ME e RMSE , para vários
horizontes temporais.
Os valores das quatro medidas de erro são relatados na Tabela 5, para toda a área e para as três principais regiões com maior densidade de
criminalidade, considerando horizontes de previsão com um ano de antecedência, dois anos de antecedência e três anos de antecedência.
Podemos observar que os valores do MAE diminuem quando as áreas das regiões são menores. Por exemplo, considerando a previsão com um
ano de antecedência, o MAE diminui de 135,30 (toda a área) para 52,15, 10,56 e 12,46 (três regiões densas em criminalidade, ordenadas por
tamanhos decrescentes), e da mesma forma todos os outros anos. Uma tendência semelhante foi observada também para o estudo de caso de
Chicago, e é confirmada para o estudo de caso de Nova Iorque. Vale ressaltar que é um resultado razoável, pois as previsões parecem mais
precisas tanto em termos de identificação específica das áreas quanto em termos de precisão das previsões. Como consideração final,
observamos na Fig.que os modelos regressivos para toda a área, Região Densa de Crime 1 e 3 ( Figs. 10 (b) e 10 (d)) aderem aos dados
observados muito melhor do que o caso da Região Densa de Crime 2 ( Fig. 10 (c)) .
Figura 10 . Número de crimes observados e previstos (linhas azuis e verdes) no conjunto de testes de Nova Iorque, para toda a área e para as
três principais regiões com maior densidade de crimes. (Para interpretação das referências à cor nesta legenda da figura, o leitor deve consultar
a versão web deste artigo.)
Tabela 5 . Erros de previsão MAE, MAPE, ME e RMSE em relação aos anos, para toda a área e para as três principais regiões com maior
densidade de criminalidade na cidade de Nova York.
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 11/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
[17] , REPTree [18] , ZeroR [19] ) e versus as abordagens [10] e [13]especificamente proposto na literatura de previsão do crime. Para
realizar a análise comparativa, avaliamos o desempenho da previsão das diferentes abordagens no conjunto de testes das três áreas (ambas em
Chicago e na cidade de Nova York), versus diferentes horizontes de previsão. Os resultados dos algoritmos foram obtidos realizando um ajuste
preciso dos parâmetros de entrada: para cada conjunto de dados, diferentes execuções foram executadas para diferentes valores dos
parâmetros e, em seguida, foram selecionados os melhores resultados. Os resultados mostrados abaixo referem-se apenas à execução com a
melhor combinação de parâmetros. A Figura 11 resume os resultados da comparação, mostrando o Erro Médio Absoluto alcançado ( ) para
previsões com um ano de antecedência, para as três regiões com maior densidade de criminalidade em Chicago e na cidade de Nova Iorque. Em
particular, podemos ver que a abordagem ARIMA geralmente atinge maior precisão do que outros algoritmos. Na verdade, considerando os
conjuntos de dados de Chicago e Nova Iorque, os modelos ARIMA apresentam melhor desempenho para todas as regiões com maior densidade
de criminalidade. Na verdade, a diferença de desempenho é mais evidente para áreas maiores. Estes resultados confirmam a adequação do
modelo autorregressivo e o seu bom desempenho no domínio da previsão da criminalidade.
Figura 11 . Análise comparativa entre diversas abordagens, avaliando o Erro Médio Absoluto ( ) das regiões densamente criminosas, para
CHI (a) e NYC (b).
6 . Conclusão
Este artigo apresentou um algoritmo geral para previsão de crimes espaço-temporais em áreas urbanas, implementado no contexto da divisão
de grandes áreas de cidades em subáreas, detectando regiões densas de crime (de formatos arbitrários). Essas regiões são então analisadas e um
modelo auto-regressivo de previsão diferente é adaptado especificamente para cada região detectada. A avaliação experimental, realizada em
dois conjuntos de dados, relacionados aos dados criminais de amplas áreas da cidade de Chicago e Nova York, mostrou que a metodologia
proposta pode prever o número de crimes com alta precisão. Além disso, a abordagem fornece informações refinadas sobre onde se espera que
os eventos criminais ocorram. Apresentamos também uma análise comparativa com outros algoritmos regressivos, mostrando que (até onde
sabemos) os resultados alcançados superam os de outras abordagens propostas na literatura de previsão de crime até o momento. Em trabalhos
futuros, outras questões de pesquisa poderão ser investigadas. Primeiro, podemos explorar ainda mais a aplicação de outras abordagens de
análise espacial para a detecção de regiões densamente criminosas, para prever tendências de criminalidade nessas regiões. Especificamente,
estamos interessados em estudar a aplicação de algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus
tamanhos são muito grandes. Em segundo lugar, correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as
relações entre eles, bem como para explorar o uso destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. outras
questões de pesquisa podem ser investigadas. Primeiro, podemos explorar ainda mais a aplicação de outras abordagens de análise espacial para
a detecção de regiões densamente criminosas, para prever tendências de criminalidade nessas regiões. Especificamente, estamos interessados
em estudar a aplicação de algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito
grandes. Em segundo lugar, correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem
como para explorar o uso destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. outras questões de pesquisa
podem ser investigadas. Primeiro, podemos explorar ainda mais a aplicação de outras abordagens de análise espacial para a detecção de regiões
densamente criminosas, para prever tendências de criminalidade nessas regiões. Especificamente, estamos interessados em estudar a aplicação
de algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito grandes. Em segundo
lugar, correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem como para explorar o
uso destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. estamos interessados em estudar a aplicação de
algoritmos espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito grandes. Em segundo lugar,
correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem como para explorar o uso
destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos. estamos interessados em estudar a aplicação de algoritmos
espaciais hierárquicos, que podem conseguir maior divisão de clusters quando seus tamanhos são muito grandes. Em segundo lugar,
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 12/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
correlacionaremos a tendência de crimes e outros eventos da cidade para compreender as relações entre eles, bem como para explorar o uso
destes algoritmos de previsão espaço-temporal para prever outros tipos de eventos.
Referências
[1] Programa de Assentamentos das Nações Unidas, o estado das cidades do mundo 2004/2005: Globalização e cultura
urbana. Varredura terrestre
( 2004 )
[4] M. Tayebi, M. Ester, U. Glasser, P. Brantingham, CRIMETRACER: Previsão de localização de crimes baseada no espaço de atividades,
em: Avanços em Análise e Mineração de Redes Sociais, ASONAM, 2014 IEEE/ACM International Conference on, 2014, pp. –480.
Google Scholar
[6] Catlett C. , Malik T. , Goldstein B. , Giuffrida J. , Shao Y. , Panella A. , Eder D. , van Zanten E. , Mitchum R. , Thaler S. , Foster I.T.
Plenário: Uma plataforma aberta de descoberta e exploração de dados para ciência urbana
Engenheiro de Dados IEEE. Touro. , 37 ( 4 ) ( 2014 )
Google Scholar
[8] C. Catlett, E. Cesario, D. Talia, A. Vinci, Uma abordagem baseada em dados para previsões de crimes espaço-temporais em cidades
inteligentes, em: Proceedings of the 2018 IEEE International Conference on Smart Computing, SMARTCOMP'18, 2018, pp. 17–24.
Google Scholar
[9] K. Kianmehr, R. Alhajj, Previsão de pontos críticos de crime usando máquina de vetores de suporte, em: Computer Systems and
Applications, 2006. IEEE International Conference on, 2006, pp.
Google Scholar
[11] Y. Zhuang, M. Almeida, M. Morabito, W. Ding, Crime hot spot forecasting: A recurrent model with spatial and temporal information, in:
2017 IEEE International Conference on Big Knowledge, ICBK, 2017, pp. 143–150, http://dx-
doi.ez46.periodicos.capes.gov.br/10.1109/ICBK.2017.3 .
Google Scholar
[12] B. Chandra, M. Gupta, M. Gupta, A multivariate time series clustering approach for crime trends prediction, in: Systems, Man and
Cybernetics, 2008. SMC 2008. IEEE International Conference on, 2008.
Google Scholar
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 13/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
Int. J. Forecast., 19 (4) (2003), pp. 579-594
View PDF View article View in Scopus Google Scholar
[14] P. Chen, H. Yuan, X. Shu, Forecasting crime using the ARIMA model, in: Fuzzy Systems and Knowledge Discovery, 2008. FSKD ’08.
Fifth International Conference on, vol. 5, 2008, pp. 627–630.
Google Scholar
[17] Breiman L.
Random forests
Mach. Learn., 45 (1) (2001), pp. 5-32
Google Scholar
[19] Nasa C. S.
Evaluation of different classification techniques for WEB data
Int. J. Comput. Appl., 52 (9) (2012), pp. 34-40
Google Scholar
Cited by (67)
Information fusion in crime event analysis: A decade survey on data, features and models
2023, Information Fusion
Show abstract
Multi-density urban hotspots detection in smart cities: A data-driven approach and experiments
2022, Pervasive and Mobile Computing
Citation Excerpt :
…Given the availability of geo-referenced data, urban hotspots can be considered as dense regions in spatial data, serving as a valuable organization technique
for framing detailed knowledge of a metropolitan area. Such knowledge models provide high-level summaries for spatial datasets, which are valuable for
planners, scientists, and policymakers [2,4,5]. For example, environmental scientists are interested in partitioning a city into uniform regions based on pollution
density and other environmental characteristics.…
Show abstract
An anticrime information support system design: Application of K-means-VMD-BiGRU in the city of Chicago
2022, Information and Management
Citation Excerpt :
…The reason is that beyond the familiar scope of their activity, criminals will have to seek opportunities to commit crimes and are very likely to face uncertain
or unpredictable risks. In addition, crime occurrences can vary across temporal periods, which is often called the seasonality of crime [19]. The routine activity
theory [20] contends crime opportunities focus on place and time.…
Show abstract
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 14/15
22/09/2023, 17:12 Previsões de crimes espaço-temporais em cidades inteligentes: uma abordagem e experimentos baseados em dados - ScienceDirect
2022, Information Processing and Management
Citation Excerpt :
…We make this dataset available so that other can expand on the drug and human trafficking analysis in the future. Possible avenues of future work are
leveraging other datasets made available from Louisville’s Open Data initiative to expand on smart city crime analysis research done by Catlett et al. (2019) to
the city of Louisville. Additionally, implementing the methodology proposed in this paper to other states that make crime data available to complement the
NIBRS dataset could offer additional insights, especially in states that see inconsistent NIBRS participation.…
Show abstract
Static or dynamic? Characterize and forecast the evolution of urban crime distribution
2022, Expert Systems with Applications
Citation Excerpt :
…Repeat victimization is when after one criminal incident, the target and nearby areas are more likely to suffer from the same or similar criminal activities
(Groff et al., 2015; Youstin, Nobles, Ward, & Cook, 2011), which leads to a spatial and temporal concentration of the same or similar crimes (Chalfin & McCrary,
2017; Weisburd, 2015). Catlett, Cesario, Talia, and Vinci (2019) found that 60 percent of crimes occurred in 6 percent of places and resulted in an obvious repeat
victimization crime distribution. Though the likelihood of repeat victimization varies with the targets, a common feature of near-repeat crime in hotspots is that
when they occur again, the occurrence tends to be very rapid, which indicates that information or experience against the targets is passed on from one criminal
to another within a certain space and time (Johnson, Bowers, & Hirschfield, 1997).…
Mostrar resumo
Um pipeline de anonimato híbrido para melhorar o equilíbrio entre privacidade e utilidade em conjuntos de dados confidenciais
para fins de ML
2023, Série de Anais da Conferência Internacional ACM
Todo o conteúdo deste site: Copyright © 2023 Elsevier BV, seus licenciadores e colaboradores. Todos os direitos são reservados, incluindo aqueles para mineração de texto e dados, treinamento em IA e tecnologias
similares. Para todo o conteúdo de acesso aberto, aplicam-se os termos de licenciamento Creative Commons.
https://www-sciencedirect.ez46.periodicos.capes.gov.br/science/article/pii/S157411921830542X?via%3Dihub 15/15