Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstrato
Este artigo apresenta uma análise de padrões espaciais multidimensionais de eventos criminais
em São Francisco. Nossa análise inclui o impacto da resolução espacial na identificação de
pontos críticos, efeitos temporais nos padrões espaciais do crime e relações entre várias
categorias de crimes. Neste trabalho, a previsão do crime é vista como um problema de
classificação. Quando são feitas previsões para uma categoria específica, um modelo baseado
em classificação binária é elaborado e, quando todas as categorias são consideradas para
análise, um modelo multiclasse é formulado. O modelo de previsão de crime proposto (HotBlock)
utiliza análise espaço-temporal para prever o crime em uma região espacial fixa durante um
período de tempo. É robusto sob variação dos parâmetros do modelo. Os resultados do HotBlock
são comparados com conjuntos de dados básicos de crimes do mundo real.
1. INTRODUÇÃO
Décadas de estudo estabeleceram firmemente que o crime apresenta padrões geográficos (isto é,
espaciais) [ 1 ]. A análise de padrões espaciais é uma abordagem de pesquisa padrão em
criminologia, assim como em ecologia, epidemiologia e outros campos. Os padrões espaciais
podem ter diferentes dimensionalidades, pois podem envolver pontos, linhas ou áreas; eles também
podem variar com a resolução. A análise dos padrões de criminalidade pode ser conduzida ao nível
dos sectores censitários, unidades de códigos postais, segmentos de rua, condados, estados ou
países. Neste trabalho, depois de considerar uma série de soluções possíveis, encontramos e
utilizamos aquela que parece ideal para a previsão do crime.
A análise de padrões espaciais pode ser baseada em densidade (baseada em área) ou baseada
em distância. No entanto, a distância euclidiana nem sempre é útil na identificação de padrões de
criminalidade urbana: os locais que estão próximos uns dos outros num mapa (em termos de
distância euclidiana) podem, de facto, estar muito isolados uns dos outros se não estiverem unidos
por ruas, se estiverem em lados opostos. de um rio com poucas pontes, ou estão em bairros
separados por alguma barreira econômica ou social invisível que separa os moradores. Por outro
lado, a análise de padrões espaciais baseada na densidade ou na área parece enquadrar-se
naturalmente no conceito intuitivo de que as cidades são constituídas por bairros. A análise baseada
na densidade pode ser categorizada como global ou local. A primeira considera a relação entre os
eventos criminais observados e a área da região em estudo; o último mede a incidência do crime em
diferentes unidades daquela região.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 1/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
O objetivo da análise espaço-temporal dos padrões de crime [ 4 ] é encontrar pontos críticos [ 5], ou
seja, áreas do mapa onde a concentração da criminalidade é maior do que em qualquer outro
lugar. Os hotspots podem ter várias dimensionalidades. Eles podem ter dimensão zero se o crime
ocorrer em locais muito específicos. Por exemplo, um mapa que mostra a localização de assaltos a
bancos normalmente mostrará a localização de vários bancos como pontos. Um local discreto
(exemplo: banco) onde os crimes são frequentes é denominado hotplace e, na análise, é
normalmente mostrado num mapa com um ponto, cujo tamanho é proporcional ao número de eventos
criminais naquele local. Assim, um banco frequentemente roubado seria mostrado por um ponto
grande, enquanto um banco que nunca foi roubado seria mostrado por um ponto minúsculo. Na
análise unidimensional do hotspot, uma rua (estrutura linear) é identificada como o hotspot. Na
análise bidimensional de hotspots, por outro lado, os hotspots podem ter qualquer formato: circular,
elíptico,
2 REVISÃO DE LITERATURA
Andresen [ 6] realizaram uma análise espacial de eventos criminais ocorridos em Vancouver,
Canadá. As taxas de criminalidade em diferentes regiões espaciais foram calculadas e interpretadas
a partir de um ponto de vista que integra dois dos quadros teóricos mais populares em criminologia:
a teoria da desorganização social e a teoria da atividade rotineira. Em vez de utilizar a população
residencial da região espacial para calcular a taxa de criminalidade, o autor sugeriu empregar a
população ambiente, uma medida melhor do número esperado de pessoas em qualquer região num
determinado momento. As taxas de criminalidade para três categorias (roubo de automóveis,
arrombamento e invasão e crimes violentos) foram calculadas utilizando tanto a população
residencial como a ambiental; constatou-se que a população ambiental representou melhor a
população em risco do que a residencial.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 2/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
Mais tarde, Andresen [ 7 ] investigou a importância dos vizinhos espaciais imediatos na análise de
padrões de criminalidade locais. Alguns dos métodos padrão utilizados para testes de padrões
espaciais, como o de Moran I, são de natureza global, ou seja, fornecem uma estatística única para
toda a área de estudo, mesmo que a área de estudo seja uma coleção de muitas regiões
pequenas. Isto pode ser problemático quando uma área estatisticamente insignificante é adjacente a
uma área de grande importância. Por esta razão, Andresen utilizou Indicadores Locais de
Associação Espacial (LISA) [ 8 ] para classificar as regiões como clusters locais.
Cowen e outros [ 9 ] realizaram uma análise espaço-temporal de eventos criminais nos bairros do
condado de Miami-Dade. O modelo previu padrões de criminalidade no espaço e no tempo com
base no uso do solo e na facilidade de locomoção. A regressão dos mínimos quadrados ordinários e
a análise espacial incorporando a teoria da desorganização social e a teoria das atividades
rotineiras foram usadas para investigar a relação entre o uso da terra e as taxas de criminalidade
violenta. Um índice de caminhabilidade foi calculado com base em quatro fatores: distância do
transporte público, distância das ciclovias, densidade de interseções de ruas e acesso a
comodidades. Verificou-se que uma maior capacidade de caminhar estava correlacionada com um
maior número de agressões agravadas, enquanto o aumento na diversidade do uso da terra estava
correlacionado com aumentos tanto em agressões agravadas como em furtos.
Zheng e outros [ 11 ] propuseram uma nova estrutura para previsão de crimes baseada em redes
neurais. O seu modelo, denominado DeepCrime, considera toda a dinâmica do crime e foi
considerado consideravelmente mais eficiente do que as linhas de base do estado da arte. O modelo
DeepCrime enquadra uma matriz criminal que representa todas (no estudo, quatro) categorias de
sequências criminais em intervalos de tempo específicos em uma região. DeepCrime foi testado em
um conjunto de dados de Nova York. A sensibilidade do modelo foi testada variando cada parâmetro
mantendo os demais fixos. Verificou-se que o DeepCrime era robusto e que não houve grande
degradação de desempenho com pequenas alterações nos parâmetros.
3 METODOLOGIA PROPOSTA
Esta investigação aborda as seguintes questões: (a) Existe alguma correlação entre crimes em
diferentes categorias de crimes ou os eventos criminais são completamente
independentes? (Secção 3.2 ) (b) Existe alguma relação entre as características da comunidade
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 3/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
numa área e a categoria proeminente de crime nessa área? (Secção 3.2 ) (c) O nível de resolução
da análise espacial tem algum impacto nos resultados dos hotspots? (Secção 3.3 ) (d) Existe uma
influência temporal nos padrões espaciais do crime? (Seção 3.4 ) (e) A análise espaço-temporal
pode ser usada para criar um modelo de previsão de crime? (Seção 3.5 ) (f) Em caso afirmativo, o
modelo de previsão é sensível aos parâmetros espaço-temporais usados para análise? (Seção 4.3 ).
1. Conjunto de dados criminais de São Francisco : este conjunto de dados contém eventos
criminais coletados de janeiro de 2014 a dezembro de 2014 com 37 categorias diferentes de
crimes. Destes, 13 contêm número suficiente de instâncias para avaliação e análise dos
modelos propostos.
2. Conjunto de dados criminais da cidade de Nova York (NYC) : Este conjunto de dados contém
eventos criminais coletados de janeiro de 2014 a dezembro de 2014 com 68 categorias
diferentes de crimes. Destes, apenas quatro foram selecionados. O mesmo conjunto de quatro
categorias de crimes é considerado na linha de base (DeepCrime [ 11 ]) com a qual
comparamos nosso modelo proposto.
3. Conjunto de dados do censo de São Francisco : O conjunto de dados criminais de São
Francisco contém distritos de departamentos de polícia, enquanto os dados do censo são
organizados por código postal. Estes dados devem ser devidamente agregados de acordo
com os distritos a serem utilizados para análise. A partir dos dados do censo, extraímos
informações sobre quantas pessoas nos distritos de São Francisco têm um rendimento anual
elevado (mais de 50 000 dólares), estão abaixo do limiar da pobreza, têm um nível educacional
baixo (menos de 12º ano) (apenas homens ) ou viver em moradias de alto preço (que custam
mais de US$ 500 mil).
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 4/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
Pode-se inferir da Tabela 1 que os distritos de Mission e Southern têm as taxas de criminalidade
mais elevadas, enquanto Taraval, Bayview, Ingleside e Richmond estão no lado mais baixo. O roubo é
menos comum no distrito de Bayview, que tem a menor percentagem da população com rendimentos
elevados. Tenderloin tem uma grande percentagem da população com baixa escolaridade e abaixo
da linha da pobreza; também tem grandes problemas com drogas, assaltos, roubos e
transgressões. Esses resultados verificam a teoria da desorganização social que relaciona as
características da comunidade que vive em uma área com a categoria de crime e a taxa de
criminalidade [ 15]. Observa-se que a percentagem da população abaixo da linha da pobreza e a
percentagem da população masculina com baixa escolaridade tendem a ser semelhantes em todos
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 5/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
os distritos (ou seja, um distrito que tem uma baixa percentagem da população masculina com pouca
escolaridade normalmente tem uma baixa percentagem da população abaixo da linha da pobreza,
como mostra a Figura 1 ). O elevado preço da habitação (mais de 500 000 dólares) e o elevado
rendimento anual (mais de 50 000 dólares) também estão distribuídos de forma semelhante entre os
distritos, como mostra a Figura 2 . (Os limites para rendimentos elevados e preços de habitação são
simplesmente os valores médios retirados dos dados do censo de São Francisco). No entanto, os
distritos do Norte (#2) e Ingleside (#9) são anómalos em ambos os gráficos.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 6/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
Apenas 13 das 37 categorias de crimes têm um número suficiente de ocorrências para análise de
correlação. O coeficiente de correlação de Pearson é calculado entre todos os pares destas 13
categorias; o total de casos de crime também é tratado como uma categoria separada. Fica claro na
Tabela 2 que cada categoria de crime está positivamente correlacionada com todas as outras nos
distritos. O coeficiente de correlação é alto especialmente para certos pares: Lei de Roubo e Armas,
Roubo e Invasão, Lei de Agressões e Armas, Embriaguez e Delitos Sexuais (Forçosos). Por outro
lado, as correlações entre Drogas e Roubo de Veículos, Prostituição e Roubo, Prostituição e Drogas
e Embriaguez e Roubo, embora positivas, foram muito baixas.
C1 _ C2 _ C3 _ C4 _ C5 _
Total C1 _
Furto/furto C 2 0,8851
desaparecida C 10
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 7/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
Conforme discutido na Seção 1 , a análise de padrões espaciais pode ser feita em diferentes
resoluções. Este estudo tem como objetivo identificar o impacto da resolução espacial na detecção
de hotspots. A análise do padrão espacial é feita em três resoluções, nomeadamente em nível de
setor censitário, código postal e distrito. (Na Seção 3.5 , será introduzida uma abordagem baseada
em grade (a abordagem HotBlock), que opera em ainda outra resolução espacial.) A melhor
resolução da análise espacial é o nível do setor censitário, conforme mostrado na Figura 3 .. Neste
trabalho, realizamos análise de densidade poligonal, um método estatístico baseado em vizinhança
que fornece uma densidade de eventos criminais dentro de cada polígono (célula raster). Uma célula
raster pode ser um setor censitário, uma área de CEP, um distrito ou até mesmo a área de estudo
completa. Os intervalos mostrados à esquerda de todos os mapas de padrões espaciais
representam a densidade do crime. Em todas as análises realizadas neste trabalho, apenas crimes
devidamente geocodificados foram incluídos no estudo e os eventos criminais são geocodificados
com taxa de acerto mais do que aceitável [ 16 ].
Na secção anterior, as taxas de criminalidade por distrito foram calculadas e discutidas. Embora as
taxas de criminalidade levem em consideração a população do distrito, os mapas de densidade
poligonal consideram a área. Pode-se inferir a partir da análise espacial no nível do setor censitário,
no nível do código postal (Figura 4 ) e no nível distrital (Figura 5 ) que as áreas identificadas como
pontos críticos na análise em uma resolução podem não ser identificadas em outra, por exemplo ,
quando uma pequena área com alta taxa de criminalidade é cercada por uma grande área com uma
taxa de criminalidade muito baixa. É por isso que a seleção do nível de análise (resolução) é vital na
análise de padrões espaciais.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 8/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
nível distrital
Outro aspecto vital da análise espacial é investigar a correlação espacial entre padrões
espaciais. Para identificar unidades de hotspot em padrões espaciais, todas as unidades espaciais
devem ser comparadas entre si para determinar qual tem uma maior concentração relativa de
crime. A correlação espacial [ 17 ] visa identificar o número de vizinhos em torno de um ponto dentro
de uma distância especificada [ 18 ]. Essa distância desempenha um papel vital na avaliação [ 19]:
Se for tomada de forma inadequada, toda a análise estará longe da realidade. Por esse motivo,
antes de realizar a análise de hotspots utilizando a conhecida abordagem Getis-Ord, a distância é
identificada utilizando o modelo de autocorrelação espacial incremental. A abordagem Getis-Ord
identifica aglomerados intensos de eventos criminais na área de estudo. A intensidade do
agrupamento é representada por escores Z , escores Z grandes correspondendo a agrupamentos
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 9/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
mais intensos de eventos criminais. Antes de aplicar a abordagem Getis-Ord, deve-se identificar uma
distância crítica, dentro da qual se pode dizer um ponto na vizinhança do centróide. Os picos dos
escores Z são encontrados em 2.080 m e 3.360 m, conforme mostrado na Figura 6 ; estes são
usados para identificar os pontos de acesso mostrados na Figura 7 .
Conforme discutido anteriormente na Seção 1 , pesquisas anteriores provaram que existe um efeito
temporal nos padrões espaciais do crime [ 21 ]. Para investigar isso, um parâmetro temporal
apropriado deve ser escolhido. Dividir os eventos criminais de acordo com a época em que ocorrem
é uma dessas abordagens. Embora isto possa ser eficaz em regiões com diferenças pronunciadas
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 10/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
entre as estações, não o utilizámos neste estudo: São Francisco não sofre mudanças climáticas
sazonais acentuadas, com a temperatura e a precipitação variando apenas ligeiramente de estação
para estação.
Outra abordagem investigativa analisa as mudanças no padrão espacial do dia da semana para o
fim de semana. Nos fins de semana, as rotinas das pessoas muitas vezes mudam drasticamente e
as pessoas que costumam ficar em casa tarde da noite podem ser encontradas do lado de fora. De
acordo com a teoria da actividade rotineira, esta mudança na rotina pode ter um impacto nos
padrões espaciais do crime, mas isto não é muito acentuado em São Francisco e Nova Iorque. O
efeito temporal nos padrões espaciais do crime em São Francisco é mostrado na Figura 8A–8D . A
Figura 8D , mostrando o crime no fim de semana em São Francisco, apresenta uma mancha azul
adicional na parte superior direita do mapa, não vista no mapa dos dias da semana
(Figura 8C); portanto, há alguma mudança nos padrões espaciais. Curiosamente, esta mudança no
fim de semana ocorre principalmente à noite (22h00-5h00), como pode ser visto comparando as
Figuras 8B e 8D . Tendências semelhantes são visíveis nos mapas de Nova Iorque mostrados na
Figura 9A–9D . Todos os eventos criminais ocorridos entre 5h00 e 22h00 estão contidos nos mapas
de densidade diurnos, enquanto aqueles ocorridos entre 22h00 e 5h00 estão contidos nos mapas de
densidade noturnos. (Uma análise semelhante é feita em [ 22 ].) As luzes da rua também podem
desempenhar um papel em eventos criminais ao ar livre que ocorrem das 19h00 às 5h00. A influência
da iluminação pública é investigada em [ 23 ] e [ 24 ], mas não é considerada no presente trabalho.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 11/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 12/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 13/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
O modelo de previsão de crime proposto usando análise espaço-temporal consiste em duas fases
principais: identificação de locais de crime e previsão de crime.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 14/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 15/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
(1)
(2)
Então,
(3)
(4)
De forma similar,
(5)
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 16/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 17/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
meta = NB)
meta = REPTree)
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 18/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
(NB)
(REPTree)
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 19/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
(NB)
(REPTree)
REPTree)
(REPTree)
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 20/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
análise de hotspot
(NB)
(NB -k)
(REPTree)
k)
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 21/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
REPTree)
(NB -k)
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 22/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
Algoritmo Roubo
(NB)
REPTree)
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 23/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
(REPTree)
4. RESULTADOS E DISCUSSÃO
4.1 Parâmetros de desempenho
4.1.1 Métricas de avaliação padrão
Neste trabalho, métricas padrão são utilizadas para avaliar o modelo proposto: precisão, taxa de
verdadeiros positivos ( taxa TP ), taxa de falsos positivos ( taxa FP ), precisão, característica de
operação do receptor (ROC), curva de recuperação de precisão (PRC) e pontuação F1.
Para previsões melhores e mais confiáveis, um modelo deve ter alta precisão, alta taxa de TP, baixa taxa
deFP , alta precisão e uma alta pontuação F1. A curva ROC é um gráfico da taxa TP em função
da taxa FP . Neste trabalho, a área sob esta curva é chamada de valor ROC; um valor ROC grande
indica que o modelo é capaz de distinguir entre classes. O PRC mostra a compensação entre
precisão e recall para diferentes limites; uma grande área sob esta curva indica alta recuperação e
alta precisão, onde alta precisão está relacionada a uma baixa taxa de falsos positivos, e alta
recuperação está relacionada a uma baixa taxa de falsos negativos.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 24/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
A pontuação de confiança é um indicador da força das previsões feitas pelo modelo. Esta pontuação
é derivada da fase de identificação do hotspot. Se uma instância de teste estiver localizada na região
do hotspot, a pontuação de confiança será alta; caso contrário, será baixo. É calculado da seguinte
forma:
Os resultados obtidos para São Francisco sem realizar análise de hotspot são mostrados na
Tabela 5 . O conjunto de dados foi pré-processado simplesmente empregando os Algoritmos 1 e 2 e
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 25/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
usado para treinar e testar o modelo de previsão de crime com diferentes abordagens de base que
podem incluir um único classificador de base ou um conjunto de classificadores. Para avaliar o
desempenho, 60% dos dados são considerados conjunto de treinamento e o restante é usado para
testar o modelo. A precisão varia de 44,51 (classificador base: Stacking com Naive Bayes) a 54,56
(classificador base: Bagging com REPTree).
O desempenho também foi avaliado utilizando todos os parâmetros para o tamanho de grade ideal
para o mapa de São Francisco, conforme discutido anteriormente nesta seção. Pode-se observar na
Tabela 6 que há uma melhoria considerável em termos de precisão e outros parâmetros de
desempenho. O melhor desempenho é observado com Stacking com Naive Bayes e REPTree como
classificadores base e Naive Bayes como metaclassificador.
Uma abordagem semelhante foi testada para o conjunto de dados de Nova Iorque. A
Tabela 7 contém os resultados do modelo de previsão de criminalidade sem utilizar a análise de
hotspots. A precisão máxima é alcançada pelo modelo Bagging com Naive Bayes (usando um
estimador de kernel) como classificador base. No entanto, quando os mesmos modelos são
aplicados ao conjunto de dados pré-processado usando análise de hotspot e experimentos de
tamanho de grade ideal, há uma melhoria considerável na precisão. Pode-se observar na
Tabela 8 que, incluindo a análise de hotspots, a precisão máxima alcançada aumenta para 81,25%.
O conjunto de dados criminais de Nova York é pré-processado para que cada categoria possa ser
tratada separadamente. O modelo proposto para todos os classificadores de última geração é
comparado com a linha de base (DeepCrime). Uma pontuação F1 é registrada para todos os
experimentos realizados para as categorias individuais de crime. Cada modelo é testado para
conjuntos de dados mensais de agosto a dezembro. Pode-se observar nas Tabelas 9 e 10 que o
modelo proposto supera o modelo de referência na maioria dos casos.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 26/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
A Figura 11 mostra a variação da precisão com o número de intervalos de tempo para todas as
quatro categorias em estudo para o conjunto de dados de Nova Iorque para agosto; A
Figura 12 mostra a variação com o tamanho da grade. Observe que o valor da precisão é a média
de todas as precisões para as categorias de crime correspondentes. Pode ser visto nas
Figuras 11 e 12que a precisão é consideravelmente melhor com um menor número de passos de
tempo e menos blocos na grade (ou seja, menor resolução espacial). A razão por detrás destes
resultados é que é relativamente fácil prever eventos criminais numa grande região num futuro
próximo, mas tentar prevê-los com uma semana de antecedência obviamente diminui a precisão. Da
mesma forma, é um desafio prever eventos criminais numa região muito pequena (um bloco que
ocupa apenas uma pequena fração da rede).
York
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 27/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
York
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 28/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
5. CONCLUSÕES
Neste trabalho, é proposta uma nova abordagem baseada em classificação para a previsão do
crime. Nosso modelo, HotBlock, utiliza modelos de classificação de última geração, mas também
inclui algumas abordagens de aprendizagem em conjunto. O modelo HotBlock realiza análises
espaço-temporais do conjunto de dados antes de fornecer previsões de crimes. Assim, toda a
dinâmica do crime no cenário do mundo real é levada em conta pelo modelo proposto. Neste
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 29/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
CONFLITO DE INTERESSES
Os autores declaram não haver conflito potencial de interesses.
Biografias
Gaurav Hajela recebeu seu diploma de Bacharel em Engenharia em Tecnologia da Informação por
Rajiv Gandhi Proudyogiki Vishwavidyalaya, Bhopal, Índia em 2012, e seu diploma MTech em Ciência
da Computação e Engenharia do Instituto Nacional de Tecnologia Maulana Azad (MANIT), Bhopal,
Índia em 2014. Desde Em 2015, ele trabalhou no Departamento de Ciência da Computação e
Engenharia, MANIT, Bhopal, Índia, onde está cursando seu doutorado. Seus principais interesses de
pesquisa são análise de Big Data, aprendizado de máquina e previsão de séries temporais.
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 30/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
Akhtar Rasool recebeu seu diploma de Bacharel em Engenharia em Ciência da Computação por
Rajiv Gandhi Proudyogiki Vishwavidyalaya, Bhopal, Índia em 2003, e seu diploma MTech em Ciência
da Computação e Engenharia pela MANIT, Bhopal, Índia em 2007. Ele recebeu seu PhD em Ciência
da Computação e Engenharia da MANIT em 2014 e atualmente é professor assistente lá. Publicou
mais de 35 artigos de pesquisa em revistas e conferências internacionais/nacionais. Suas áreas de
pesquisa incluem algoritmos de correspondência de strings, computação paralela, inteligência
artificial, ciência de dados, análise de Big Data, engenharia de software, análise e design de
algoritmos, computação em cluster e grade e computação quântica.
REFERÊNCIAS
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 31/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 32/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 33/34
23/09/2023, 16:11 A multi‐dimensional crime spatial pattern analysis and prediction model based on classification - Hajela - 2021 - ETRI Journal - Wiley …
https://onlinelibrary.wiley.com/doi/full/10.4218/etrij.2019-0306 34/34