Escolar Documentos
Profissional Documentos
Cultura Documentos
Júri
Novembro de 2010
Agradecimentos
Quero agradecer ao meu orientador de mestrado Dr. Gabriel Pestana e ao meu co-
orientador Eng. José Sousa, pelo excelente apoio técnico e suporte motivacional dos quais
tive grande privilégio de usufruir durante a minha escalada final do último pico desta honrosa
cordilheira académica.
Resumo
Road transport is going through a crisis, mainly due to the rising number of congestions.
Today, various lines of research study congestions. One of these focuses in the estimation of
impact and duration of congestions. This information is especially important for the road
freight business, because it enables them to reroute vehicles on course to congestions,
considered by the professionals as the most important problem for their business.
Nonetheless, current methodologies do not present information sufficiently precise and
reliable for practical use. This investigation identified the main causes for this lack of
information, and follows with the elaboration of a methodology for the estimation of impact
and duration of incidents. This methodology uses the freight drivers as main traffic data
sources, but allows the inclusion of all kinds of other data sources. A simple data model was
developed for the registration of traffic notifications, that contains all information considered
relevant for the impact and duration estimation process, where much of these information
was neglected in previous studies. The estimation of impact and duration of traffic incidents is
done using the result of the data fusion as query input to an historical database that maps
incidents with measured impacts and durations. A prototype was developed, that implements
the main functionalities, which proved to work in a test environment. For future work this
methodology should be tested in the field, in order to provide relevant feedback for
improvement.
Keywords: Road Transport; Data Fusion; Incident Management; Decision Support; Traffic
Indicators;
Índice
1 INTRODUÇÃO .............................................................................................................................1
2 ENQUADRAMENTO ....................................................................................................................7
I
Lista de Quadros e Figuras
II
Figura 26 - Apresentação de um resumo sobre um conjunto de causas que podem estar a
contribuir para um congestionamento. .................................................................................... 65
Figura 27 – Exemplo de como as extensões obtidas pelos intervalos de confiança são
alteradas para terminarem sobre o centro de massa. ............................................................ 65
Figura 28 – Exemplo de dois tipos gerais de situações que podem provocar
congestionamentos. ................................................................................................................ 67
Figura 29 – Exemplo de como diferentes sequências de notificações podem ajudar à
determinação das fases de crescimento e redução de ocorrências. ...................................... 69
Figura 30 – Exemplo de relação entre a duração e impacto estimados com a evolução de um
congestionamento. .................................................................................................................. 70
Figura 31 – Modelo em estrela para o registo histórico de ocorrências ................................. 72
Figura 32 – Fluxograma geral que descreve os passos que são feitos pelo componente de
análise aquando de uma iteração. .......................................................................................... 74
Figura 33 – Exemplificação dos desvios calculados para um utilizador em três fases do
decorrer de ocorrências. ......................................................................................................... 75
Figura 34 – Arquitectura interna do protótipo desenvolvido. .................................................. 78
Figura 35 – Apresentação da interface para a monitorização de situações de tráfego actuais.
À direita são apresentadas as ocorrências agrupadas pelo componente de fusão, ordenadas
pelo seu impacto ..................................................................................................................... 81
Figura 36 – Apresentação do cálculo de duas rotas diferentes entre dois pontos. ................ 83
Figura 37 – Apresentação das extensões calculadas para as ocorrências de tráfego que
foram agrupadas pelo sistema. ............................................................................................... 83
Figura 38 – Apresentação da secção de consulta histórica de ocorrências ........................... 84
III
Lista de Abreviações
IC Itinerário Complementar
IP Itinerário Principal
PROMETHEUS Program for a European Traffic System with Higher Efficiency and
Unprecedented Safety
UE União Europeia
IV
1 Introdução
Outros Aéreo
6% 1% Ferroviário
10%
Marítimo
Rodoviário
39%
44%
1
permitiu identificar que estamos a chegar a uma era de crise no transporte rodoviário,
instigada pelos crescentes congestionamentos, e o aumento da poluição emitida.
De acordo com estudos apresentados pela Comissão Europeia em 2008 [2], o crescimento
do transporte rodoviário, estimado de aumentar em 55% no transporte de mercadorias e em
33% no transporte de passageiros até 2020, tal como o consumo de energia e respectivo
impacto no ambiente – estima-se um crescimento de 15% nas emissões de CO2, mesmo
contemplando os planos de mudança para as energias renováveis -, pedem por uma
resposta rápida e inovadora, que vise a implementação de novas metodologias de suporte
ao transporte e à mobilidade com o objectivo de tornar o sector mais competitivo e eficiente,
quer em termos de desempenho, quer ao nível do impacto ambiental.
Existem contudo diversos factores externos que podem comprometer esta optimização de
rotas, como congestionamentos, desvios e cortes nas estradas. Destes vários, os
congestionamentos são considerados os mais problemáticos. De acordo com um estudo
feito sobre o impacto dos congestionamentos no transporte rodoviário de mercadorias [5], no
qual foram entrevistados aproximadamente 1200 operadoras, mais de 80% destas
consideravam os congestionamentos como problemas “sérios” ou “críticos” para o seu
negócio.
2
para os clientes. Torna-se premente a capacidade de alterar as rotas em tempo real tendo
em conta o estado actual do trânsito.
Sem estes dados, a informação disponibilizada não é suficiente para as operadoras poderem
decidir informadamente sobre possíveis alterações às suas rotas. Para as operadoras, saber
apenas que existe um congestionamento em dada via não é suficiente. Estas necessitam de
saber a duração do congestionamento e a fiabilidade da informação transmitida, para assim,
caso haja um veículo em rota com o congestionamento, poderem decidir se devem ou não
alterar a sua rota.
3
1.1 Definição de Problema
1.2 Contribuições
4
ℵ Definição de uma metodologia para a fusão e análise de dados de tráfego
rodoviário fornecidas por fontes de dados heterogéneas.
5
que esta se enquadra dentro das metodologias actuais, e quais as mais-valias procura
trazer.
6
2 Enquadramento
De acordo com a perspectiva apresentada por Lautso et al. em 2005, onde este prevê o
impacto da globalização sobre o comércio mundial e resultantes fluxos de transporte [6], esta
discrepância entre importações e exportações deve-se ao crescimento das economias
asiáticas. À medida que estas se fortificam, os fluxos de transporte entre a Europa e Ásia
tenderão aumentar, verificando-se o oposto com os fluxos de transporte entre a Europa e
Estados Unidos.
7
remata que, dentro dos próximos vinte anos, os fluxos de transporte entre a Europa e Ásia
tenderão a ter os seus níveis duplicados.
Desde meados de 1950 que têm vindo a haver esforços na elaboração de uma rede
ferroviária Eurasiática. Porém, atritos políticos e económicos entre os anos 60 e 80 travaram
travara
fortemente este empreendimento, permitindo somente depois do fim da Guerra
G Fria uma
retoma do interesse da elaboração de uma rede ferroviária internacional.
UE Exportações e Importações
1,8
1,6
1,4
Biliões de Euros
1,2
1
Exportações
0,8
Importações
0,6
0,4
0,2
0
2000 2001 2002 2003 2004 2005 2006 2007 2008
A fig. 3 apresenta uma vista geral das principais bitolas utilizadas na comunidade
Eurasiática. Nota-se
se que tanto os países
países da antiga USSR, assim como a Índia, apresentam-
apresentam
8
se como obstáculos para o transporte ferroviário internacional, na medida em que utilizam
bitolas diferentes da bitola internacional ou bitola de Stephenson,, de 1435 mm [8]. Existem
projectos em curso para
a a elaboração de eixos de carruagem que permitam diversas bitolas,
não obstante com várias limitações.
9
fig.4 apresenta
nta a evolução da performance por modo de transporte dentro da União
Europeia. Esta inclinação para a utilização do meio rodoviário tem sido objecto de
preocupação e de grande debate internacional.
2000
1500
Aéreo
1000 Ferroviário
Marítimo
500
Rodoviário
0
2000 2001 2002 2003 2004 2005 2006 2007
Dando seguimento a esta preocupação, foram desenvolvidos vários programas, dos quais se
destacam o programa Marco Polo [10],, destinado a transferir o transporte do rodoviário para
o ferroviário, marítimo e aéreo, e a iniciativa INSPIRE [11],, que visa a integração de todo o
tipo de dados e informação espacial dentro da comunidade europeia, com especial foco no
combate à situação
ção ambiental corrente.
10
Paralelamente, o desenvolvimento de Sistemas Inteligentes de Transporte (ITS) tem sido
alvo de grande investimento. Em finais de 2008 a Comissão Europeia aprovou o plano de
acção para o desenvolvimento de ITS, com o objecto de contribuir para um sistema de
transporte mais seguro, menos poluente, e globalmente mais eficiente [2].
11
O estudo acrescenta que, das situações supra-citadas, as mais difíceis de prever são os
acidentes de trânsito e as avarias de sistemas. Seguem-se as condições ambientais, os
eventos especiais e por último as zonas de trabalho. Destas últimas, apesar de as zonas de
trabalho poderem ser facilmente anunciadas com antecedência, é necessário que assim o
sejam, para poderem ser consideradas situações de natureza pouco ou nada imprevisível.
Se não o forem, são completamente imprevisíveis, e podem constituir um grande impacto no
fluxo do trânsito.
De forma semelhante temos os eventos especiais, porque mesmo considerando que se tem
conhecimento prévio do evento e do número esperado de pessoas que o irão atender, nem
sempre é possível determinar quais serão os meios de transporte mais utilizados pelos
atendentes, podendo a sua escolha variar de acordo com o tipo de evento, a sua
localização, as condições ambientais na altura e o dia do mês, entre outros factores.
12
um ponto de vista mais global, verifica-se que a realidade dos congestionamentos é bastante
mais imprevisível do que anteriormente pensada.
O estudo de ITS já é algo datado. De acordo com um resumo histórico, elaborado por Hideo
Tokuyama em 1996, sobre a evolução dos ITS no Japão [13], o início da investigação de ITS
data de 1960. Tokuyama conta que esta estava localizada principalmente no Japão e
Estados Unidos, onde se procurava desenvolver os primeiros sistemas de controlo de
transporte, com especial ênfase no suporte ao cálculo de rotas.
Devido às limitações tecnológicas da altura, estes sistemas nunca chegaram a sair dos
laboratórios. Tokuyama continua, dizendo que, entre 1980 e meados de 1990 foram dados
grandes avanços dentro do tema, com o desenvolvimento do RACS (Road/Automobile
Communication System) no Japão, do PROMETHEUS (Program for a European Traffic
System with Higher Efficiency and Unprecedented Safety), do DRIVE (Dedicated Road
Infrastructure for Vehicle Safety in Europe) na Europa, e do IVHS (Intelligent Vehicle-
Highway Systems) nos Estados Unidos.
Estes foram os primeiros sistemas a serem postos em prática, trazendo conhecimento sobre
a aplicabilidade e impacto dos ITS nos sistemas de transporte, despoletando novas
investigações para uma melhor adequação, abrangência e alinhamento dos ITS com a
realidade do transporte.
13
O objectivo principal dos ITS de nova geração é o de melhorar, a um nível global, a
eficiência e eficácia dos sistemas de transporte. Existe uma grande variedade de programas
de desenvolvimento de ITS:
14
transportado, a segurança do veículo, a verificação de credenciais e autorização de
viagem.
Segundo a revisão bibliográfica apresentada por Bertini et Al. em 2005, sobre ITS em áreas
urbanas [14], vários são os benefícios que podem ser obtidos através de ITS. Estes incluem
melhor segurança, eficiência, fiabilidade, mobilidade e acessibilidade, assim como a redução
de congestionamentos, consumo de combustíveis e tempos de viagem, levando a uma maior
satisfação dos utentes assim como dos operadores.
15
De facto, todo um ITS se alavanca sobre os dados que tem acesso. Cada um destes
descreve um pequeno fragmento da realidade das vias, permitindo aos ITS a construção de
uma base de conhecimento que melhor descreve a realidade de acordo com o seu foco
específico. O acesso a dados é, por isso, obrigatório. Infelizmente, este requisito não é fácil
de ser cumprido.
Porém, tem-se vindo a verificar que estas técnicas são cada vez menos satisfatórias. Para
além de serem dispendiosas de instalar e manter, têm de ser instaladas em grande número
para ser possível monitorizar uma grande extensão de via. Ademais, segundo a
16
EUROSTAT, entre 1990 e 2005, o comprimento total das auto-estradas na UE cresceu 47%,
atingindo aproximadamente 61 mil quilómetros [1].
17
Outra desvantagem deste método é específica ao transporte rodoviário de mercadorias. Em
diversos casos, mercadorias têm que ser transportadas para zonas inóspitas. Nestas
situações, nas quais existem poucos veículos a atravessar as vias, saber apenas as
localizações dos veículos pode não ser suficiente para a detecção de vias obstruídas, o que
pode ter um impacto inesperado na performance do transporte.
Perante esta breve incursão dentro das miríades do transporte rodoviário de mercadorias,
verifica-se que os congestionamentos são considerados como um grande problema para o
negócio, e que o combate à sua mitigação já começou há bastante tempo. Porém as
soluções actuais apresentam alguns problemas, como na limitação da sua implantação - no
caso de infra-estruturas de sensores - ou na determinação das causas dos
congestionamentos e na estimação das suas durações - no caso do FCD.
Apesar de a arte da cartografia ser anterior ao tempo romano, apenas recentemente, algures
entre os anos 50 e 60, é que se viu aparecer o conceito de Sistemas de Informação
Geográfica. O seu primeiro fundamento seria o de tentar dar resposta a um conjunto de
problemas relacionados com a exploração e análise de dados e informação dentro de um
contexto espacial. A localização assumia a posição base para todo o processo, levando à
criação de um novo paradigma para a organização e estruturação de sistemas de
informação.
18
manutenção de uma representação actualizada sobre um conjunto de redes
rodoviárias. Esta actividade incorpora a criação, manutenção e integração de grafos
representativos da rede.
19
dissertação tem o foco geral nas primeiras quatro camadas, mas incide especialmente na
camada de eventos.
Com isto em consideração, dar-se-á especial atenção à camada física e à de rotas, dado
que a camada de eventos assenta sobre estas últimas duas. A camada de operações será
posteriormente introduzida no caso de estudo, para demonstrar como os eventos podem ser
utilizados para uma melhor gestão das operações.
A maioria dos ITS utilizam algum tipo de SIG como suporte para a manipulação e análise da
informação espacial que precisam de gerir. Esta informação contempla a rede viária da qual
o ITS é responsável, assim como toda a dinâmica sobrejacente. Para um ITS poder aferir
correctamente o estado de uma situação, assim como que operações deverão ser
efectuadas para a adereçar, necessita de possuir uma representação o mais fidedigna
possível da rede rodoviária. Como iremos ver a seguir, obter esta representação é mais
difícil do que pode parecer.
A maneira mais comum de modelar redes rodoviárias é com o uso de grafos. As ligações
entre nós são utilizadas para representar segmentos de via, e os nós para interligar esses
segmentos. Tanto as ligações como os nós podem possuir propriedades. Estas propriedades
servem para conferir uma melhor descrição da via que está a ser representada. Os arcos
podem conter diversos dados, como por exemplo o comprimento, o número de faixas, a
direccionalidade, a velocidade máxima e a inclinação, entre outros.
20
O segundo problema é o uso de datums diferentes dentro da representação de uma rede.
Datums representam pontos geográficos de referência, utilizados como âncoras para a
georefenciação de dados geográficos. Cada ligação está georeferenciada relativamente a
um datum, permitindo assim a identificação da sua localização geográfica. Contudo esta
localização não é totalmente precisa. De facto, quanto mais distante se encontrar a ligação
do datum ao qual está georeferenciada, mais imprecisa ou desviada tenderá a estar a sua
localização.
Por esta razão, certas redes de grande dimensão devem ser particionadas em secções
diferentes, sendo cada uma destas georeferenciada relativamente a um datum mais
adequado. Isto reduz a imprecisão das ligações dentro de cada conjunto, mas pode provocar
incongruências na rede quando os conjuntos são novamente reunidos. Devido a haver
desvios diferentes em cada um dos conjuntos, pode levar a uma quebra em ligações que
fazem a ponte entre dois conjuntos.
Nestes casos costuma-se efectuar aquilo a que se chama de “snapping” do ponto à rede.
Consiste em repor o ponto em cima da rede, simplesmente pela sua deslocação para a
ligação que lhe estiver mais próxima. Isto pode funcionar para a maioria dos casos, mas em
alguns destes esta deslocação pode ser mal feita – basta o ponto ter-se desviado o
suficiente para estar mais próximo de outra ligação que não a qual a que realmente se
destinava, sendo o snapping feito para essa outra ligação em vez de para a correcta.
21
2.4.2 Modelação e Gestão de Sistemas de Referenciamento Linear
Não se trata da escolha de um caminho através de uma rede, mas sim da composição de
um objecto agregador de um conjunto de segmentos da rede – ver fig. 6. Este objecto tem a
capacidade de determinar propriedades, acumuladas ou não, dentro da rota, determinando,
por exemplo, a distância de qualquer ponto na rota para com o início desta.
Segundo Harvey J. Miller and Shih-Lung Shaw [18], organismos públicos e privados,
relacionados com o transporte, desenvolvem sistemas de referenciamento linear para o
suporte à gestão de eventos dentro da rede de transporte, como acidentes, qualidade de
pavimento e fluxo de tráfego.
22
Existe contudo duas particularidades relativamente ao uso destes objectos que se podem
revelar como desvantajosas em certos casos. A primeira assenta sobre o uso de um sistema
de coordenadas cartográfico em contrapartida para com um sistema de coordenadas
elipsoidal.
Esta particularidade acaba por ser um problema de gestão, porque todas as entidades que
não são gestoras directas das rotas em questão, mas que estejam directamente
relacionadas com estas, têm que, de alguma forma, ou por iniciativa própria ou por acordo
formal, ser informadas das alterações que vão sendo feitas às mesmas.
A utilização de SIG para o transporte, também denominado por GIS-T (GIS for
Transportation), já remonta há algumas décadas. A gestão da rede física e de rotas de uma
rede rodoviária são tarefas fundamentais para a manutenção da representação digital da
rede. Sem estas, a representação da rede tende, com o passar do tempo, a divergir da
realidade. Esta dissertação enquadra-se principalmente sobre a gestão de eventos dentro de
uma rede rodoviária, especificamente nas auto-estradas, sendo que, por essa razão,
necessita de se alavancar sobre uma representação da rede que seja a mais fidedigna
possível.
23
2.5 Análise Gap e Abordagem
Procurando sobreviver dentro deste ambiente complexo, a indústria de transporte tem vindo
a transformar o seu modelo de negócio, de um baseado na gestão do armazenamento e
encaminhamento de mercadorias para um composto por complexas cadeias intermodais,
controladas por tecnologias de informação altamente especializadas no negócio.
Paralelamente, o desenvolvimento de ITS tem tido especial interesse e investimento. De
entre as várias vantagens proporcionadas pelos ITS, a mitigação dos congestionamentos é
considerada como a mais importante para o sector de transporte rodoviário de mercadorias.
O alicerce de qualquer ITS são os dados que este possui. Quanto mais fiáveis, actuais,
relevantes e completos forem, mais potencial terão de conferir uma capacidade de
visualização do estado actual das vias rodoviárias, permitindo assim uma melhor avaliação
das necessidades em curso, assim como as operações que deverão ser postas em prática
para adereçar essas necessidades. Foram desenvolvidas várias metodologias para a
recolha de dados de tráfego, sendo a FCD (Floating Car Data) a mais promissora e com
melhor relação custo-benefício, constituindo-se como o estado de arte de recolha de dados
de tráfego.
No entanto, esta metodologia apresenta certas desvantagens, por um lado pela potencial
propensão à intrusão na privacidade dos utentes, por outro pela falta de identificação das
causas que provocam os congestionamentos, dificultando assim uma correcta avaliação de
situação, assim como a estimação da sua eventual duração. Procura-se, por isso, uma
metodologia que se baseie no estado de arte identificado, mas que seja capaz de trazer
valor acrescentado pela mitigação dos problemas identificados.
24
congestionamento e suas causas, de tal forma que permita uma avaliação de situação, do
impacto que esta irá provocar nas vias, e da duração que a mesma deverá ter.
Para escolher qual o caminho mais adequado a tomar, decidiu-se fazer uma comparação
entre as vantagens e desvantagens dos dois principais métodos existentes para a recolha de
dados de tráfego, respectivamente a utilização de sensores fixos nas vias rodoviárias, e a
nova emergente metodologia FCD.
Com base na fig. 7 pode-se determinar que existe uma complementação entre as duas
metodologias, na qual a primeira permite acesso a informação muito rica sobre o trânsito
rodoviário, mas circunscrita a extensões de via curtas – devido aos custos de instalação e
manutenção -, em contrapartida para com a segunda, que permite uma extensão de
monitorização praticamente total, apenas limitada por zonas que não tenham cobertura de
rede para telemóveis, mas que disponibiliza apenas a localização e translação de veículos,
sendo assim uma fonte de informação muito específica.
Esta comparação permite fazer uma pequena análise Gap entre as tecnologias existentes e
a tecnologia/metodologia que se procura. Em suma, procura-se uma metodologia de recolha
de dados que permita abranger uma vasta área geográfica sem comprometer a qualidade e
completude dos dados, isto é, uma fusão entre os sensores fixos e o método FCD.
VANTAGENS DESVANTAGENS
Processamento sofisticado
Área de actuação muito abrangente
Tecnologia pouco madura e estudada
Custos de implementação baixos
Questões de privacidade
comparativamente com os sensores
FCD Incapacidade de detectar causas de
fixos
congestionamentos
Não afectado por condições
Informação pouco rica (contém apenas a
meteorológicas
localização e translação)
25
É aqui que a abordagem escolhida surge e o foco da restante dissertação toma forma. De
acordo com a EUROSTAT em [1], o número de veículos de transporte rodoviário de
mercadorias nos estados membros, em 2006, rondava os 32.000 veículos. Isto corresponde,
em média, a 1200 veículos por país. Necessariamente alguns países terão mais veículos do
que outros, principalmente os mais desenvolvidos.
Semelhantemente para com o Floating Car Data (FCD), os veículos assumem o papel de
sensores móveis que vão reportando o estado de tráfego à medida que navegam através
das vias. A diferença principal para com o método FCD é que neste caso, em vez de haver
uma recolha constante da posição, velocidade e direcção de cada veículo, cada condutor é
responsável por preencher um pequeno relatório modelo sobre a ocorrência com que se
depara no local, recorrendo a uma pequena aplicação, instalável sobre um aparelho móvel,
como um smartphone, palmtop ou outro semelhante, desde que este tenha suporte GPS e
comunicação GPRS. Esta abordagem contém três vantagens principais:
(1) A primeira é que as grandes transportadoras não têm que se alavancar completamente
em dados fornecidos por terceiros, o que pode ser considerado como vantajoso
estrategicamente e economicamente;
(2) A segunda é que, tendo em conta que a maior parte dos bens transportados são entre
grandes pólos económicos, é razoável assumir que a maioria dos veículos deverão seguir
pelas mesmas rotas, comummente chamadas de corredores. Logo, basta um veículo
detectar uma condição anormal de tráfego para poder avisar todos os outros que se
encontrem na mesma rota. Em retrospectiva temos o melhor de dois mundos, não só torna
as transportadoras menos dependentes de dados de terceiros, mas também não restringe a
informação rodoviária a apenas trechos que estejam capacitados com sensores de tráfego;
(3) A terceira vantagem consiste na mitigação dos problemas identificados no método FCD.
Neste caso não existe a intrusão na privacidade de terceiros. Em vez de haver informação
sobre a posição, direcção e velocidade de veículos, existem relatórios pontuais, descritivos
do estado actual da situação, assim como das suas causas, se estas forem passíveis de
26
serem observadas pelo condutor. O facto de os condutores contribuírem com informação
sobre o estado de situação constitui uma mais-valia para uma melhor avaliação da situação.
(1) A primeira é que, tendo em conta que não existe um formato comum mas que existe uma
iniciativa para a sua adopção, o formato escolhido deve basear-se no formato que se
procura adoptar, mas convém ser uma versão simplificada, para facilitar a integração de um
maior número de fontes de dados que estão a tentar implementar esse dito formato comum
mas que ainda não o conseguiram na totalidade;
(2) A segunda é que se não existe uma integração transparente de dados, dados
comunicados de duas fontes diferentes não são passíveis de integrar facilmente – não existe
nenhum identificador comum que possa relacionar duas notificações, referentes a uma
mesma ocorrência, mas por fontes diferentes. O sistema terá que lidar com esta falta de
informação e possuir um mecanismo de fusão de dados provindos de múltiplas fontes.
27
que no casos dos condutores, e obter o aplicativo para comunicação de dados, podendo
este estar disponibilizado online, por exemplo.
28
3 Trabalho Relacionado
29
3.1.2 Sistema de Avaliação de Trânsito e de Apoio à Decisão em
Tempo Real
ℵ Apoio à Decisão: Utiliza redes neuronais e processos de Data Mining para elaborar
cenários com base nos dados em tempo real. Os cenários são utilizados como
suporte para o apoio à decisão.
Esta arquitectura apresenta um não tão comum exemplo de um sistema que responde a
acontecimentos com base em um conhecimento histórico mutável, ao contrário da maioria
dos sistemas, que recorrem a uma base de conhecimento estanque para tomar as suas
decisões, sem nunca proceder a um melhoramento do conhecimento pela aprendizagem
adquirida da prática aplicada.
30
Figura 8 – Descrição da arquitectura do sistema de apoio à decisão. Fonte [21]
O segundo tipo de fontes de dados consiste de entidades de protecção civil, como a polícia
rodoviária, viaturas de emergência médica e viaturas de bombeiros. Estes utilizam algum
protocolo de transmissão de dados, não identificado no documento, para o suporte à
comunicação de informação de trânsito. A arquitectura do sistema é apresentada na fig. 9.
31
Figura 9 – Descrição da arquitectura do sistema SIG-T. Fonte [22]
O sistema está dividido em quatro secções, possíveis de identificar na fig. 10. A primeira
consiste de uma plataforma de comunicação com diversos sensores instalados nas vias,
32
tendo como propósito comunicar com os sensores, e converter os dados transmitidos por
estes para uma linguagem comum ao sistema.
Esta terceira secção, que contém as duas bases de dados, serve de base de apoio para a
elaboração de planos de resposta às ocorrências em curso. A plataforma de gestão de
eventos utiliza a informação reguladora para determinar que possíveis planos devem ser
seleccionados tendo em conta os eventos em questão. Depois de os melhores planos serem
seleccionados, estes são comunicados à sala de controlo, a qual constitui a quarta secção
do sistema.
33
consideram mais adequado para o problema em questão, coordenando de seguida o
desenrolar do plano.
34
A base de dados históricos foi construída recorrendo a uma compilação fornecida pela
Rijkswaterstaat – agência nacional holandesa de transporte. Estes dados, utilizados
anteriormente apenas como consulta de ocorrências de trânsito, serviram de base de
conhecimento para o sistema desenvolvido, alavancando a possibilidade de efectuar
pesquisas e comparações com ocorrências em curso, para assim determinar a duração das
mesmas.
35
Figura 12 – Exemplo de uma das árvores de decisão elaboradas. Fonte [24]
O sistema foi testado, na prática, durante um mês, sendo avaliados 1853 incidentes, e
comparadas as durações estimadas pelo sistema e as durações reais das ocorrências. O
sistema mostrou estar correcto em 65% dos casos.
36
base na identificação das características de uma dada ocorrência, os respectivos
coeficientes são consultados na tabela, e passados como parâmetro à função logística, a
qual retorna a duração estimada para a ocorrência.
O estudo reporta uma percentagem de sucesso de 47%, explicando que apesar de parecer
reduzida, o valor é promissor dada a inevitável variabilidade dos tempos de execução das
forças responsáveis por responder a estes tipos de eventos – forças policiais, médicas,
bombeiros, entre outros -, os quais contribuem directamente para a duração das ocorrências.
37
3.2.3 Previsão de Duração de Ocorrências utilizando Redes Neuronais
Ambas as redes neuronais são treinadas relativamente a uma base de dados histórica. Cada
registo histórico compreende o tipo de incidente, o número de veículos envolvidos, a
velocidade média dos restantes veículos durante a ocorrência, detectada por sensores
instalados nas vias, as distâncias da ocorrência para os dois sensores mais próximos,
respectivamente para a frente e para trás da ocorrência, e a localização da ocorrência.
38
O modelo foi testado em uma auto-estrada durante 6 meses, período onde decorreram 24
incidentes, sendo as suas durações cronometradas e o modelo aplicado. Este estudo
revelou que o modelo apresenta uma taxa de sucesso médio de 40%.
39
Segundo o estudo, as árvores preliminares demonstraram ser eficazes para ocorrências de
curta duração, não se verificando o mesmo com ocorrências de maior duração (acima de
uma hora). O estudo continua afirmando que a propriedade mais diferenciadora na duração
de uma ocorrência é a sua natureza. Por essa razão, na elaboração empírica dos modelos, a
natureza da ocorrência foi utilizada como primeiro factor diferenciador, e elemento de
escolha de qual árvore de decisão aplicar.
40
Apesar de haver alguma divergência relativamente aos dados considerados como relevantes
para o processo de decisão, a maioria dos estudos considera o tipo de ocorrência, tipo de
veículos envolvidos e número de fatalidades, como os dados mais importantes a contemplar
no processo de estimação de duração de ocorrências. Nem todos porém consideraram a
localização espacial e localização temporal - dia da semana/sazonalidade - como
importantes para o processo de decisão. A fiabilidade das fontes de informação também foi
descartada pela maioria.
Mais importante ainda, nenhum estudo incorporou no seu processo de decisão a densidade
de trânsito aquando de uma ocorrência, as condições meteorológicas na altura, assim como
o desfasamento temporal que necessariamente existe, entre o momento em que uma
ocorrência acontece e o momento em que esta chega ao sistema.
Os restantes trabalhos suportam este argumento de uma forma indirecta, dado que a
abordagem de ajuste manual é aquele que apresenta a taxa de sucesso mais elevada na
determinação de duração de ocorrências, com 80% de sucesso, 15% acima do estudo com
segunda maior taxa de sucesso, apresentado em [24]. Esta verificação reafirma a
necessidade de haver algum tipo de adaptação dos métodos ao contexto em que estão
inseridos.
Também é de relevo notar que ambos os estudos com maior sucesso utilizam árvores de
decisão para determinar a duração de ocorrências, enquanto os restantes, apresentam uma
taxa de sucesso média de 40%. Podemos assim argumentar que a metodologia que se
apresentou como mais adequada para o problema em questão foi a que utiliza árvores de
decisão, com um sucesso ainda maior quando enquadrada com informação de contexto.
Retomando o princípio seguido pela maioria dos estudos, que afirma que quanto mais rica
for a base de conhecimento, e mais completos forem as descrições sobre as ocorrências,
mais facilitada e provável se torna a determinação correcta da duração destas, o facto de as
metodologias apresentadas se focarem apenas na situação em sí (tipo de ocorrência,
número de veículos e número de pessoas acidentadas) é notável, dado que se acabam por
contrariar relativamente ao princípio seguido – a informação de contexto foi completamente
(ou quase) negligenciada.
41
A incorporação de informação que contextualiza a ocorrência – altura do dia (manhã, tarde,
noite, hora de ponta, etc.) dia da semana, sazonalidade, localização, congestionamento
actual, congestionamento esperado, condições meteorológicas, fontes de informação,
número de fontes e fiabilidade, assim como o desfasamento temporal de notificações
relativamente a ocorrências – é praticamente omissa em todos os trabalhos estudados.
ℵ Definir que fontes é que irão fornecer informação para o sistema. As fontes
escolhidas podem influenciar directamente o processo de decisão. Se apenas forem
consideradas fontes com fiabilidade elevada, torna-se mais provável haver um
número reduzido de fontes, correndo-se assim o risco de não ter cobertura total das
auto-estradas em consideração. Em contrapartida, se se considerarem apenas
fontes de fiabilidade baixa, sendo o melhor exemplo os utentes das vias, promove-se
a possibilidade de haver informação incorrecta. A utilização de todo o espectro de
fontes de dados é considerada como a mais informativa devido à cobertura e
dimensão de dados que proporciona, mas requer um tratamento de dados evoluído,
com foque especial no correlacionamento entre fiabilidade, dados e fontes.
42
ℵ Definir a metodologia de alimentação da base de conhecimento: deve esta ser
construída previamente e ficar estanque durante a sua utilização, ou deve ser
progressivamente aumentada e melhorada. Todos os estudos analisados utilizam
uma base de conhecimento estanque, descartando a hipótese de nas sucessivas
consultas à base de conhecimento para determinar durações de ocorrências, ir
melhorando a mesma, pelo registo das performances entre os valores estimados e
as durações observados no campo.
ℵ Definir uma metodologia que permita a fusão de dados referentes a uma mesma
ocorrência. É fundamental saber relacionar dados provindos de diferentes fontes
mas que sejam referentes a uma mesma ocorrência. O relacionamento de dados de
diferentes fontes pode levar a informação mais completa e precisa relativamente ao
acontecimento descrito.
43
ℵ A Associação Europeia de Operadores Profissionais de Infra-Estruturas de Portagens
Rodoviárias (ASECAP), com diversas publicações relativas a questões de mobilidade e
transporte em auto-estradas disponíveis em “http://www.asecap.com/english”.
44
4 Solução Proposta
Na secção de Enquadramento foi feita uma pequena viagem pelo mundo do transporte. Foi
atribuído especial foco ao transporte rodoviário de mercadorias, dado que este é o “target”
principal da dissertação. Verificou-se que os congestionamentos são um dos maiores
problemas do sector, contribuindo para, entre outras factores, tempos de entrega pouco
fiáveis, velocidades médias baixas, custos de transporte e de logística acrescidos, e uma
resultante insatisfação transversal a todo os intervenientes no negócio.
Este facto levou ao estudo dos principais métodos utilizados para a mitigação de
congestionamentos, dos quais, destacaram-se os ITS. Verificou-se que existem ITS
distintos, cada um específico para adereçar um conjunto de necessidades. Um
aprofundamento dos ITS permitiu determinar que a fundamental necessidade para estes
funcionarem é terem acesso a dados actualizados sobre condições de tráfego rodoviário.
Fez-se um estudo dos principais métodos utilizados para recolher dados de tráfego e
conclui-se que existem duas técnicas principais:
(1) A primeira, pela instalação de vários tipos de sensores ao longo das vias – a qual revelou
ser dispendiosa de manter e pouco abrangente, principalmente devido ao actual crescimento
acentuado das extensão das vias rodoviárias;
(2) A segunda denominada de Floating Car Data, que recorre a GPS ou a telemóveis para
determinar a localização, direcção e velocidade de veículos, podendo assim detectar
situações de congestionamentos caso se verifique um acumular desproporcional de veículos
ao longo de uma dada extensão de via – o qual também revelou algumas limitações,
principalmente na indeterminação das causas dos congestionamentos, reduzindo-se a
apenas uma detecção de congestionamentos em vez de uma análise das suas causas,
eliminando por completo qualquer correlação entre acontecimentos e suas consequências,
assim como a sua catalogação histórica.
Esta conclusão posiciona-se directamente sobre o foco desta dissertação. Tendo em conta
as limitações dos dois tipos de métodos identificados, propõe-se uma outra abordagem que
procura conjugar as virtudes de ambos, e combater as suas fraquezas individuais. Esta
abordagem incide sobre:
45
(1) O desenho de um modelo de dados para o registo de ocorrências de tráfego que seja
utilizável por um leque de tipos de utilizadores o mais abrangente possível;
Na secção do trabalho relacionado, foi feita uma análise crítica a um conjunto de estudos
criteriosamente escolhidos, a qual visou identificar as mais-valias e problemas das soluções
existentes, com o objectivo de suportar e fundamentar a abordagem escolhida, assim como
a solução proposta, aprofundada nas seguintes secções.
4.1 Arquitectura
Recorrendo aos serviços proporcionados pelo SCIR, a unidade de gestão está apta a
analisar o estado actual de situações de tráfego reportadas, a identificar veículos que
estejam em rota com congestionamentos correntes, a visualizar vários cenários que
contemplem rotas alternativas, e a comunicar com os condutores dos veículos das
transportadoras.
Uma vista mais concreta da arquitectura é apresentada na fig. 18. Aqui denota-se que o
SCIR serve de meio de organização entre os veículos transportadores e os controladores na
46
Sala de Controlo. O SCIR é responsável por agregar dados de tráfego enviados por diversas
fontes, e por fornecer um Dashboard aos controladores, incorporado com uma alarmística,
que mantém os operadores ao corrente das operações e de situações que possam
comprometer o correcto funcionamento do negócio, como congestionamentos, por exemplo.
Para além disto o sistema é responsável por fornecer um mecanismo de comunicação de
operações, adjudicadas pelos operadores, aos condutores dos veículos transportadores.
Perante uma situação em que um ou mais veículos estão em rota para com um
congestionamento previamente identificado, o controlador é avisado pelo SCIR, sendo-lhe
mostrada a localização do congestionamento, o tempo previsto para o seu término e os
veículos que estão em rota. Por sua vez, o controlador pode decidir correr cenários que
contemplam uma alteração às rotas de forma a contornar o congestionamento.
Quando o controlador ficar satisfeito com uma nova rota para um dado veículo, pode decidir
pô-la em prática, seleccionando-a e adjudicando-a ao devido veículo de transporte. O
condutor do veículo em causa recebe um aviso de alteração de rota que descreve o
congestionamento identificado e a nova rota que deve ser tomada.
O SCIR é o componente central desta arquitectura. Este é responsável por: (1) reunir dados
de tráfego e de localização transmitidos pelos condutores de veículos; de efectuar análises
periódicas para determinar situações anómalas ao negócio; (2) guardar um registo histórico
sobre congestionamentos registados e como é que estes evoluíram (se houver esses dados)
para poder melhorar as suas capacidades de análise e previsão de situação; (3) de manter
47
os controladores actualizados sobre congestionamentos, localização e rotas de veículos; (4)
de gerir a comunicação entre controladores e condutores.
A fig. 19 apresenta uma vista arquitectural, por camadas, da arquitectura interna do sistema.
O SCIR é composto por seis componentes principais. O primeiro componente é a camada de
serviços web. Este componente fornece um conjunto de serviços acessíveis via web, tanto
para os condutores dos veículos, como para os controladores na Sala de Controlo. Os
serviços são de natureza diferente para cada um dos intervenientes, mas desta maneira
garante-se que o acesso é feito sempre da mesma forma, independentemente da
localização de qualquer um destes, e da tecnologia que os implementa.
Qualquer chamada ao SCIR é tríada pelos serviços web para uma funcionalidade de negócio
correspondente. As funcionalidades referentes à comunicação de dados encontram-se todas
dentro da camada de lógica de negócio.
Esta camada é responsável por executar todos os passos relativos ao registo e consulta de
dados. Estes poderão ser a actualização das posições dos veículos, o registo de ocorrências
de tráfego, a consulta do estado de situação pelo Dashboard dos controladores e o registo e
consulta de operações a serem tomadas, como pela escolha de uma nova rota, e a sua
48
devida comunicação ao condutor do respectivo veículo. Todos os dados ficam guardados
dentro da base de dados, sendo o acesso à base de dados feito através de um ORM
1
(Object-Relational Mapping). O componente SIG é utilizado para a geocodificação inversa
das coordenadas GPS dos veículos e para cálculos de rotas óptimas tendo em conta os
dados de tráfego correntes.
1
Esta é a tradução que se considerou mais adequada para o processo de Reverse Geocoding. Para
mais informações sobre o processo de reverse geocoding pode-se consultar
http://wiki.gis.com/wiki/index.php/Reverse_geocoding.
49
No caso do componente de fusão, este é responsável por agrupar registos referentes a uma
mesma ocorrência. Isto deve-se ao facto de poder haver situações em que mais do que uma
fonte de dados, seja esta um veículo de transporte ou uma outra fonte terceira, comunicarem
dados relativos a uma mesma situação. O sistema deve ser capaz de detectar esta
sobreposição de dados e utilizá-la em sua vantagem. A maneira concreta como esta
sobreposição é detectada será explanada em pormenor mais à frente.
No caso do componente de análise, este é responsável por estimar o impacto e duração dos
congestionamentos registados, assim como por criar um histórico de situações registadas,
para assim efectuar análises em séries temporais de modo a melhorar as suas técnicas de
estimação de impacto e duração de congestionamentos, na medida em que o conhecimento
adquirido é utilizado no suporte a uma melhor contextualização das situações.
50
4.2.1 Datex2
O Datex2 representa uma versão mais evoluída do Datex, seu antecessor. A motivação para
criar esta norma resultou de um amadurecimento que se foi desenvolvendo ao longo da
utilização e implementação de sistemas de informação de tráfego. Foi efectuada uma
extensão ao modelo para incluir a comunicação com sistemas de informação de tráfego e de
viagens. O Datex2 especifica a estrutura e formatação das mensagens e dos dados a serem
transmitidos entre centros de tráfego. Em um guia para o utilizador, elaborado pela
Comissão Europeia [32] é apresentado um modelo em XSD (XML Schema Definition) que
especifica que estruturas de dados devem ser utilizadas.
O estudo segue informando que esta norma já atingiu um nível de maturidade tal que já está
a ser utilizada por vários estados membros. O Reino Unido já tem serviços Datex2
operacionais, e países como a Suécia, França e Holanda estão a desenvolver infra-
estruturas nacionais para dar suporte ao Datex2. Portugal também já tem o Datex2 em
utilização pela Brisa, e em implementação pelas Estradas de Portugal.
Alinhado com os objectivos da iniciativa INSPIRE, esta norma é uma referência actual para a
estruturação e transmissão de mensagens entre sistemas de controlo de tráfego. Apresenta
um modelo de dados extenso constituído por aproximadamente onze mil linhas de
especificação em XSD, no entanto simples o suficiente para ser facilmente interpretado.
Este modelo servirá de base para a elaboração das estruturas de dados necessárias para o
suporte ao modelo de dados do SCIR.O modelo resultante será uma simplificação do Datex2
dirigida aos profissionais do sector mas em conformidade com a nomenclatura de nomes,
tipos de dados e funções dos atributos especificados no Datex2.
4.2.2 WMS
O serviço Web Map Service da OGC, especificado em [34], é um serviço web destinado para
a transmissão de mapas digitais. Estes mapas consistem de imagens digitais de diversos
formatos que apresentam uma vista estática sobre um conjunto de dados geográficos. A
51
informação disponibilizada por estes mapas é tipicamente utilizada para consulta meramente
visual, não sendo possível efectuar uma análise espacial mais detalhada sobre os mesmos.
4.2.3 WFS
O serviço Web Feature Service, especificado em [35], providencia uma interface que permite
a requisição de features geográficas. Ao contrário de uma imagem, uma feature contém toda
a informação sobre um elemento geográfico. Esta informação é tipicamente formatada em
XML ou GML, apesar de outros formatos como shapefiles poderem ser utilizados para a sua
codificação.
52
O objectivo consiste em criar um modelo que seja utilizável tanto por serviços empresariais
automatizados,
os, que periodicamente enviam dados sobre condições de tráfego,
ego, até ao agente
da GNR no local de uma ocorrência, que, recorrendo a um simples
simp smart phone e a uma
aplicação
cação para o efeito, consegue elaborar um relatório de ocorrência em concordância com
o modelo, sendo este de seguida enviado para o sistema central.
53
Por esta razão, apresenta-se um modelo muito simples comparativamente para com o
Datex2. Cada registo deve conter a identificação do emissor, a descrição da ocorrência, e as
coordenadas geográficas da sua localização. Os restantes dados relativos à localização de
uma ocorrência não são obrigatórios no acto de registo. No caso do smart phone com uma
aplicação instalada para o efeito, um utilizador poderia simplesmente descrever a situação
que quer transmitir, sendo a sua identificação e localização anexadas transparentemente,
simplificando assim o registo.
Qualquer entidade que queira transmitir ocorrências e que esteja registada no sistema pode
recorrer ao modelo para a elaboração de notificações. Dada a sua simplicidade, e tendo em
conta que o modelo é resultante de uma simplificação do modelo Datex2, a adopção do
modelo é facilitada, tanto para as entidades que não seguem nenhum protocolo assim como
para aquelas que já seguem o Datex2.
O modelo de dados apresentado na secção anterior descreve os dados que devem ser
preenchidos por um condutor ou entidade terceira para transmitir dados para o sistema. A
parte do modelo que descreve a localização do registo não é preenchida pelo condutor. Os
únicos dados que são enviados sobre a localização do veículo são as suas coordenadas
GPS.
Adicionalmente, este precisa de saber em que via cada registo se encontra, para poder
distinguir entre registos próximos, mas que se encontrem em vias diferentes. E quando o
registo se encontra localizado sobre uma auto-estrada, ainda mais dados são precisos.
Neste caso, o ponto quilométrico da ocorrência é fundamental para determinar a localização
do evento ao longo da extensão da auto-estrada.
54
Para determinar a via (e ponto quilométrico caso se trate de uma auto-estrada) é preciso
utilizar uma ferramenta SIG de geoprocessamento capaz de efectuar a geocodificação
inversa de coordenadas geográficas. Enquanto a geocodificação consiste em determinar as
coordenadas geográficas através de uma morada, a geocodificação inversa consiste em
exactamente o oposto. Este processo implica a determinação da via mais próxima
relativamente a uma coordenada geográfica.
Isto funciona bem para ruas e avenidas, mas falha em precisão quando os registos se
encontram em auto-estradas. Nestas situações, a geocodificação inversa não é suficiente. É
necessário determinar o ponto quilométrico. Porém, determinar pontos quilométricos é tarefa
difícil. Para isto ser possível, é necessária a elaboração de objectos geométricos especiais,
que resultam de um outro processo chamado segmentação dinâmica.
No nosso caso, utilizamos o processo de segmentação dinâmica para criar uma ferramenta
de cálculo de distâncias sobre uma rota. O objecto resultante permite-nos determinar a
distância métrica de qualquer ponto que esteja contido dentro de uma rota pré-processada.
Uma das grandes vantagens da segmentação dinâmica é a abstracção que providencia dos
objectos geométricos que é composta. Alterações à rede subjacente podem ser feitas a
qualquer momento, sendo estas imediatamente reflectidas na forma e propriedades da rota.
Isto esconde-nos a complexidade das rotas e encapsula todas as alterações às rotas a um
único lugar.
55
Figura 21 - Exemplo de uma rota resultante do processo de segmentação dinâmica.
A tabela do lado esquerdo determina as extensões dos segmentos, e a do lado
direito os pontos quilométricos dos eventos.
Cada registo transmitido por uma fonte de dados contém uma descrição sobre um pequeno
fragmento da realidade que está a acontecer nas rodovias. O componente de fusão é
responsável por pegar nestes fragmentos, e tentar agrupá-los, de forma a criar uma visão
mais completa das situações e ocorrências que estão a decorrer.
56
2
antigos são removidos , o componente de fusão tem que ser executado periodicamente,
para manter os resultados de fusão o mais actualizados possível.
Por esta razão, este componente comporta um ciclo de processamento repetitivo, dentro do
qual são aplicados um conjunto de passos de tratamento de dados, que os levam desde a
sua versão original quando entram no sistema, até à sua versão final, na qual em vez de
registos existem ocorrências de tráfego, com localização, dimensão, fiabilidade e impacto
estimados. Um ciclo de processamento pode ser dividido em três passos:
(1) O primeiro consiste em agrupar registos de acordo com a sua proximidade, utilizando
para esse efeito um algoritmo de clustering hierárquico aglomerativo;
(2) O segundo passo consiste em procurar relacionar os registos agrupados pelo passo 1,
aplicando uma análise ontológica. Aqui o objectivo é identificar quais registos são referentes
às causas da ocorrência, quais são referentes às suas consequências, e quais são
referentes a possíveis agravantes;
(3) O terceiro passo consiste em estimar a fiabilidade dos dados, assim como o impacto que
a ocorrência está a ter no trânsito, naquele momento. A estimação do impacto permite uma
melhor visualização do estado de situação para os operadores na sala de controlo, mas
também será útil para o componente de análise, como poderemos ver mais à frente. Cada
um destes três passos será detalhado de seguida.
O primeiro passo consiste em separar os registos de acordo com as vias rodoviárias a que
se referem. Tendo em conta que os registos reportados devem ter apenas as coordenadas
geográficas como informação sobre a sua localização, é necessário proceder à
geocodificação inversa de todos os registos novos no sistema, ou alternativamente de todos
os registos que ainda não foram localizados cartograficamente. Depois de todos estes terem
sido identificados relativamente à via em que se encontram – caso não seja possível terão
que ser inevitavelmente descartados –, estes são agrupados por via a que se referem.
2
Para mais informações sobre como é que os registos são removidos do sistema, consulte a secção
de análise de dados.
57
O passo seguinte consiste em agrupar os registos de acordo com a sua proximidade
geográfica. Não nos esqueçamos que o âmbito desta dissertação é referente a ocorrências
dentro de auto-estradas, IPs e ICs. Para conseguirmos determinar a localização de um
registo dentro de vias desta dimensão, é necessário utilizar o processo de segmentação
dinâmica para encontrar o ponto quilométrico do registo, tal como foi dito na secção 4.4.
Desta maneira, sempre que dois clusters são agrupados, é recalculada a localização média
do novo cluster, podendo-se assim proceder a um novo agrupamento dos dois clusters
seguintes mais próximos. O algoritmo termina quando só existe um cluster restante e já não
é possível fazer um agrupamento. Formalmente, um conjunto C de registos agrupados, tem
uma posição média Pc definida por:
∑
,
58
Depois de o dendograma ter sido criado, o passo seguinte consiste em determinar como é
que este deve ser cortado em sub-árvores, para que cada sub-árvore tenha apenas nós
geograficamente próximos, para aferir a proximidade entre nós é utilizado o desvio padrão
dos pontos quilométricos dos registos de cada cluster.
Determinou-se que nós geograficamente próximos devem possuir um desvio padrão inferior
a um limite máximo. Desta maneira, cada nó do dendograma guarda o desvio padrão de
todos nós folha da sub-árvore da qual este é raiz:
1
1
O desvio padrão tende a crescer dos nós folha até à raiz do dendograma. Com uma
pesquisa em profundidade primeiro, ao chegar a um nó com um desvio padrão abaixo de um
limite predefinido, este é considerado como raiz de uma sub-árvore com nós
geograficamente próximos, sendo toda a sub-árvore cortada do dendograma (ver fig. 23), e
os seus nós folha guardados em um novo grupo.
59
Figura 23 - Separação do dendograma em sub-árvores com base no desvio padrão
acumulado em cada nó. Os nós a laranja em a) representam os nós raiz das sub-
árvores. Em b) são apresentados os resultados do agrupamento.
A fig. 24 descreve o modelo ontológico utilizado. Neste modelo, cada situação está
associada a um conjunto de causas, a um conjunto de consequências, e a um conjunto de
agravantes. Cada uma destas classes constitui um conjunto de tipos de registo. No caso das
causas, estas podem ser ou incidentes ou actividades. As agravantes podem ser más
condições de via ou mau tempo, e as consequências podem ser todo o tipo de
congestionamentos.
Por sua vez, as agravantes podem ser a razão das causas terem acontecido, podem
contribuir para consequências mais graves, ou podem ser as próprias causas em si. As
causas contribuem para as consequências (os congestionamentos), sendo estas verificadas
mais para trás na via - daí a relação de Backpropagates. Associado a cada registo existe
também a descrição do impacto que está a provocar. De igual forma, cada registo também
60
está associado a uma data/hora de entrada no sistema, a uma duração estimada, e a uma
localização.
O objectivo deste passo consiste em aplicar o modelo ontológico a cada grupo de registos
geograficamente próximos, para tentar descobrir que registos são mais prováveis de ser
referentes a uma mesma ocorrência. Primeiro insere-se cada registo dentro da categoria a
que pertence. Depois verifica-se quais dos registos estão, em conjunto, em concordância
com o modelo.
A única regra que é aplicada aqui e que está explicita no modelo é que os
congestionamentos devem aparecer antes das causas para poderem ser associados às
mesmas. Pode-se relaxar esta regra e dizer que registos de congestionamentos podem
aparecer no mesmo local que as causas, ou directamente a seguir. Mas se for acima de uma
distância máxima (“curta”) não devem ser considerados referentes a uma mesma ocorrência.
De notar que pode haver modelos correctos nos quais só existem causas, ou agravantes ou
congestionamentos, ou qualquer outra combinação entre estas três categorias. O importante
é as causas e os congestionamentos estarem em concordância. Sendo assim, cada conjunto
de registos agrupados dentro de uma categoria constitui um grupo de observações sobre um
certo tipo de situação.
61
4.5.3 Estimação de Impacto
O passo final consiste em proporcionar uma vista integrada das ocorrências agrupadas, que
seja ilustrativa da situação, e que permita uma aferição do impacto geral que estas estão a
ter sobre tráfego. Segundo o modelo, há seis tipos gerais de grupos de registos: grupos só
com causas, só com agravantes, ou só com consequências, grupos com causas e
consequências, grupos com causas e agravantes, e grupos com agravantes e
consequências.
Cada um destes grupos é tratado de uma forma ligeiramente diferente. As agravantes são
utilizadas para conferir um melhor enquadramento a uma dada situação, podendo, em certos
casos, contribuir também para o impacto geral que a situação está a provocar na via. Por
esta razão, as agravantes não são utilizadas logo de início para a estimação de impacto,
sendo posteriormente anexas ao resultado da estimação efectuado nos restantes registos.
, !
√
62
estimação de extensões de um congestionamento. As extensões resultantes estão
empilhadas de acordo com a confiança associada, conferindo uma perspectiva geral do
congestionamento: sendo o intervalo de mais elevada confiança aquele com a extensão
maior e representando o menor nível de congestionamento, em oposição para com o
intervalo de menor confiança, expressando a menor extensão mas a maior concentração do
congestionamento.
Para conjuntos com registos sobre causas apenas, o objectivo consiste em estimar uma
localização que seja representativa das localizações dos registos individuais. Apesar de as
causas poderem ser de natureza completamente diferente, como por exemplo “acidente” e
“defeito de infra-estrutura”, ambos devem estar a contribuir para o congestionamento em
questão. Por esta razão, decide-se agrupar as causas todas em um único ponto que
descreve todo o estado daquela situação, reduzindo assim o entulho informativo e futura
complexidade visual.
63
Existem cinco tipos de descrições de impacto, podendo cada uma ser associada a um peso
distinto: Highest→5, High→4, Medium→3, Low→2 e Lowest→1.
Deve-se também introduzir neste cálculo a fiabilidade atribuída a cada registo. A fiabilidade
dos condutores dos veículos é máxima, mas as de diferentes fontes pode variar. Como é
que a fiabilidade é determinada saí fora do âmbito, mas considerá-la como existente, não.
Logo, considera-se que a massa de um registo é calculada através da multiplicação do
impacto pela sua fiabilidade. Temos:
# $
$ %1,2,3,4,5*
# +0,1-
∑
.
∑
O cálculo do centro de massa dos registos permite determinar um ponto quilométrico que
descreve o centro de acontecimentos relativamente à fiabilidade e impacto associados. A fig.
26 apresenta um exemplo do resultado do cálculo do centro de massa. O ponto resultante
deve conter um resumo das fiabilidades e impactos, assim como a lista de causas
agrupadas.
Por último, os pontos quilométricos dos limites fim dos intervalos de confiança são
reajustados para ficarem sobre o centro de massa calculado para a ocorrência. A fig. 27
exemplifica o reajustamento das extensões obtidas pelos intervalos de confiança.
64
Figura 26 - Apresentação de um resumo sobre um conjunto de causas que podem
estar a contribuir para um congestionamento.
65
4.6 Análise de Dados
Apenas depois de uma situação se ter verificado por completo, desde o seu início até ao seu
fim, é que se pode afirmar o impacto que teve no trânsito e o tempo que demorou a ser
resolvida. Porém podemos considerar que duas ocorrências distintas no tempo mas
semelhantes em tipo e magnitude, que se verifiquem em um mesmo local em uma altura
onde haja um fluxo de tráfego semelhante, deverão provocar um impacto semelhante no
trânsito.
66
uma ocorrência, para desta maneira tentar determinar quanto tempo é que dada ocorrência
demoraria a ser tratada. Mas isto também sai fora do âmbito.
A abordagem tomada circunscrever-se-á aos dados sobre as ocorrências em sí. Estes dados
são a base de conhecimento do sistema, e devem ser utilizados da melhor maneira possível
de forma a providenciar uma mais-valia informativa relativamente à estimação da sua
duração.
Antes de considerar como os dados devem ser utilizados, convém estudar a dinâmica de
envio de ocorrências durante a evolução de congestionamentos. A fig. 28 apresenta, de uma
forma muito genérica, a influência de incidentes de trânsito ou horas de ponta nos
congestionamentos. A causa está na insuficiência – condicionada ou inerente - do fluxo
máximo de uma via para dar suporte ao fluxo de tráfego existente no momento.
67
Por questões de simplificação considera-se que, para todos os congestionamentos, a
3
duração do seu crescimento é igual à duração da sua redução . Nestes termos, pode-se
delinear que sequências de notificações existem, e como é que estas podem conferir
informação sobre o estado e evolução dos congestionamentos a que se referem.
Desta maneira pode-se calcular umas estimativas iniciais para a duração de uma ocorrência,
unicamente utilizando os dados e o seu encadeamento cronológico. O que esta figura
transmite é que em diversos casos, apenas recorrendo à natureza dos dados em si, é
possível inferir as dimensões temporais da fase de crescimento ou até de redução, podendo,
desta maneira, estimar a duração da ocorrência.
3
Esta assumpção será utilizada como base para a restante análise de dados. Não obstante, a mesma
pode ser melhorada, no sentido de definir uma relação de proporcionalidade entre o crescimento de um
congestionamento e a sua subsequente redução, dependendo esta dos factores condicionantes desta
relação. O aperfeiçoamento desta relação não invalida os subsequentes pressupostos apresentados
na análise de dados.
4
É de notar que estes dados foram preparados para apresentarem alguma correlação, sendo sempre
possível argumentar que isto pode bem não se verificar na realidade. Mas como nesta dissertação não
foi possível aceder a dados reais, considerámos que, apesar de esta assumpção não ser possível de
ser verificada empiricamente, deve, contudo, não fugir assim tanto à realidade prática. Considera-se
mais provável que, caso haja várias notificações relativas a uma mesma ocorrência, estas exibam
estimativas correlacionadas com o estado actual de evolução da ocorrência reportada, e não o
contrário. Podemos então assumir que, apesar de o gráfico apresentado não ser sustentado por dados
concretos, representa uma situação possível de se verificar na realidade.
68
Figura 29 – Exemplo de como diferentes sequências de notificações podem ajudar
à determinação das fases de crescimento e redução de ocorrências.
Perante isto, põe-se agora a seguinte questão: se tivéssemos um registo histórico com
apenas estes três registos apresentados na figura, e se recebêssemos uma notificação de
ocorrência com duração estimada de meia hora e com impacto estimado como “médio”, igual
à primeira das três notificações do registo histórico, poderíamos afirmar que a ocorrência
reportada iria demorar 1 hora, tal como a do registo histórico tinha demorado?
69
Figura 30 – Exemplo de relação entre a duração e impacto estimados com a
evolução de um congestionamento.
70
para comparação de situações, torna-se necessário converter o modelo de dados
5
apresentado em um em estrela , modelo típico utilizado em processos de data mining.
Sabendo que não é possível guardar, dentro de um modelo em estrela, todos os registos
associados a uma dada situação, é necessário fazer algum tipo de compromisso, como pela
elaboração de um resumo que descreva um dado conjunto de situações. Por esta razão
escolhem-se estas tabelas, servindo de resumo, cada uma, para uma metade de uma das
fases, ou de crescimento ou de redução.
É de notar que cada uma destas tabelas tem os campos “Fiabilidade”, “Causa”, “Agravante”,
“Impacto” e “Duração”. Cada um destes campos consiste de um resumo dos dados contidos
dentro da fase à qual corresponde. Há aqui uma consideração a fazer relativamente ao tipo
de dados que devem ser guardados em modelos de data mining: na maioria dos casos,
convém traduzir dados numéricos para alfanuméricos, na medida em que é aplicado um
gradiente, que traduz, por exemplo um conjunto de números que variam entre 0 e 1, para um
conjunto de níveis, como “baixo”, “médio” e “alto”.
A razão desta conversão incide sobretudo em questões de facilitação de pesquisa. Com isto
em mente, todos os campos excepto a fiabilidade são calculados da seguinte maneira: cada
campo é escolhido com base em dois factores, o tipo do campo, e a fiabilidade associada a
esse tipo.
Nestes termos, para cada campo, o tipo escolhido como resumo é aquele cujo somatório de
fiabilidades associadas a esse tipo apresenta o valor mais alto. Dando a escolha do tipo de
causa como exemplo, se tivermos o seguinte conjunto de dados relativos ao tipo de causa:
A causa escolhida será “Accident”, porque apesar de haver dois registos a dizer
“Obstruction” a soma das suas fiabilidades é menor que a de “Accident”.
5
Os modelos em estrela consistem de uma tabela central que determina o “facto” que estamos a
procurar, e um conjunto de tabelas circundantes, as “dimensões”, que contêm dados relacionados com
a determinação desse facto. Uma introdução exaustiva aos conceitos de data mining pode ser contrada
em [Data Mining : Concepts and Techniques , Jiawei Han and Micheline Kamber , 2001, Morgan
Kaufman Publishers]
71
Figura 31 – Modelo em estrela para o registo histórico de ocorrências. A tabela
central representa o facto que se quer pesquisar, e todas as circundantes
representam as dimensões associadas a esse facto.
Por fim, a fiabilidade é calculada com base na média aritmética das fiabilidades associadas a
cada um dos campos escolhidos, sendo esta depois convertida para um valor alfanumérico,
sendo feita a seguinte correspondência:
72
tabela tempo, que contém todos os dados temporais que podem ser traduzidos em algum
tipo de análise de sazonalidade.
Sabendo agora a estrutura do modelo em estrela e de como é que os dados são guardados
dentro deste, identifica-se os passos que o componente de análise efectua para a estimação
da duração de ocorrências. A fig. 32 apresenta o comportamento geral do componente de
análise de dados. Existem dois componentes internos, denominados de identificadores, que
são executados periodicamente.
Relativamente ao ajuste de desvios, esta fase final será explanada mais à frente, mas
adianta-se que tem a ver com a avaliação das estimativas feitas pelas fontes de dados,
tendo em conta a comparação entre as estimativas que estas fizeram e estimativas
calculadas pelo sistema. Esta metodologia de avaliação de desvios dará suporte a um outro
tipo de metodologia de previsão de duração e de impacto de ocorrências.
Antes disso, convém explicar melhor algumas das fases do pipeline que ainda não foram
apresentadas, especificamente a recolha de situações semelhantes e a estimação da
duração e do impacto.
73
Figura 32 – Fluxograma geral que descreve os passos que são feitos pelo
componente de análise aquando de uma iteração.
A maneira específica como as fases são pesquisadas, e ou os dados são adaptados para
obter um maior número de situações semelhantes, sai fora do âmbito devido à inerente falta
de dados experimentais. No entanto, deixa-se a nota de que a introdução de pequenos
desvios nos resumos, assim como a escolha acertada de quais fases procurar, deve ser a
chave para o afinamento das pesquisas.
Por fim, resta estimar a duração da ocorrência. Considerando que as situações obtidas são
situações semelhantes às actuais, basta fazer uma média aritmética das durações
calculadas pelo sistema para essas situações, e atribuí-la como estimativa para a situação
actual em análise. Ou seja, a estimativa da duração é calculada com base na identificação
de situações que se revelaram semelhantes.
Apresenta-se agora outra metodologia para estimar a duração de situações, que utiliza
também o histórico, mas em vez de comparar as situações em sí, utiliza o conceito de
análise de desvios das estimativas feitas por fontes de dados. Se se associar as fontes de
dados aos registos que transmitiram e às estimativas que forneceram, assim como às
74
durações que por fim foram calculadas pelo sistema para essas mesmas ocorrências, pode-
se identificar os desvios que essas fontes demonstram para com as estimativas do sistema.
Desta forma pode-se identificar fontes de dados que tenham tendência a exagerar ou a
minorar as suas estimativas perante certo tipo de situações. Este método de avaliação
distingue-se do anterior porque em vez de se basear em uma comparação histórica de
situações, alicerça-se sobre uma análise das tendências das fontes de dados para
estimarem acima do real, abaixo, ou acertarem em cheio.
A fig. 33 apresenta as três observações de desvios que seriam associadas a cada utilizador.
Neste caso trata-se de um utilizador específico que, depois de várias contribuições para o
6
sistema, revelou as tendências descritas na figura .
Estes desvios estão descritos na “Fase Inicial” da figura. Nota-se que estimativas de “mais o
que uma hora” tendem a ter desvios tanto para cima, como para baixo. À medida que a
estimação feita é de menor duração, o seu desvio (erro ou amplitude) tende a reduzir, o que
faz um certo sentido, dado que se o utilizador atribui uma duração curta a uma ocorrência,
então é porque realmente a ocorrência não deverá ser grave, tendo consequentemente uma
duração mais curta, por conseguinte mais fácil de ser estimada.
6
Este exemplo, apesar de não se basear em dados reais, não foi feito ao acaso. Seguindo um
raciocínio anterior, notificações efectuadas pouco tempo depois de uma ocorrência se ter verificado
têm uma maior probabilidade de apresentarem estimativas desviadas.
75
Passando agora para as fases intermédia e final, pode-se observar que as estimativas de
duração tendem a ter um desvio mais para baixo, o que também faz sentido, dado que nos
estamos cada vez mais a aproximar do fim da ocorrência. Utilizando o exemplo da “Fase
Final”, se a fonte de dados associada a estes desvios fizesse uma observação relativamente
a uma ocorrência da qual o sistema já tinha recebido outras notificações e já tinha
determinado que estava na fase final da ocorrência, e se essa mesma fonte determinasse
que a ocorrência iria durar ainda 45 minutos, o sistema poderia alterar a observação
fornecida e dizer que a aquilo que a fonte realmente queria dizer (mas não sabia melhor) era
que a duração da ocorrência ia ser entre os 15 e os 40 minutos.
Por fim, tendo acesso a dados fornecidos por várias fontes, cada uma com a sua fiabilidade
e desvio associado, pode-se, semelhantemente ao caso do cálculo do centro de massa,
determinar qual a duração estimada para a ocorrência.
76
5 Caso de Estudo
O presente caso de estudo tem com objectivo a demonstração prática da teoria apresentada
na solução proposta. Tendo em conta que esta dissertação foi desenvolvida dentro de um
contexto académico, sem contacto directo com nenhuma entidade fornecedora de dados, foi
necessário simular notificações de ocorrências de tráfego rodoviário fictícias. Por esta razão
antecipa-se já a afirmação de que os resultados apresentados estão suportados apenas
sobre os dados simulados, e não dados reais. Constata-se porém, que houve um esforço
considerável na elaboração de um simulador de dados que procura assemelhar-se ao
comportamento esperado de diversas entidades a fornecerem dados ao sistema.
Relembra-se que esta dissertação foi desenvolvida nas instalações da ESRI-Portugal, com o
acompanhamento técnico de um dos seus colaboradores séniores. Por esta razão, o sistema
alavanca-se sobre as tecnologias ESRI, nomeadamente sobre o ArcGIS Desktop 9.3.1 e
ArcGIS Server 9.3.1, assim como sobre os serviços online de mapas e de rotas da ESRI Inc.
77
resolução de ocorrência. Entre o início de uma ocorrência e a sua respectiva resolução, se
houver trânsito suficiente, formar-se-á um congestionamento que irá evoluir ao longo do
tempo – com tendência para crescer enquanto a situação não é resolvida, e para diminuir,
até à sua extinção eventual, depois da resolução da ocorrência.
Podem existir diversos tipos de ocorrências de tráfego, cada uma com o seu impacto e
duração específica. Por sua vez, cada uma destas ocorrências de tráfego pode ser
observada por um conjunto de observadores, sendo aqueles que nos interessam, os
observadores que transmitem dados para o sistema.
78
O número de observadores pode variar, a localização dos mesmos também, assim como a
altura em que decidem reportar a ocorrência ao sistema central. Todos estes factores
influenciam os dados que são preenchidos no acto de registo. O simulador procura ter em
conta todas estas variáveis para atingir uma simulação que se aproxime com a realidade.
Um cenário consiste de uma ocorrência de tráfego específica, com uma data de início, uma
duração específica, um impacto na via, e um congestionamento que evolui ao longo da
duração do cenário. Ademais, tem um conjunto de observadores associados, distribuídos
aleatoriamente ao longo da duração do cenário e da sua extensão na via, cada qual com a
sua respectiva observação sobre a ocorrência, assim como uma notificação para ser enviada
para o sistema. Esta é a constituição de um cenário.
Cada um dos cenários criados é, por sua vez, guardado em uma lista para processamento
subsequente. O segundo componente é responsável por atravessar esta lista e verificar se
existem cenários com data marcada para o momento. Se for o caso, esse cenário passa ao
estado activo.
De seguida o componente verifica que notificações é que estão associadas a esse cenário e
quais as datas de envio que lhes foram atribuídas. Quando o componente encontra uma
notificação com data marcada, remove-a do cenário e envia-a para o sistema. Quando já
não existem notificações associadas a um cenário, o mesmo é removido da lista. Os
cenários envidados são, por sua vez, guardados dentro da secção Raw Traffic Data da base
de dados.
79
executadas periodicamente. Tal como o ilustrado na imagem, o componente de fusão
recolhe os dados contidos dentro da secção de Raw Traffic Data e aplica-lhes as
metodologias estatísticas e ontológicas apresentadas na solução proposta, criando assim
novos registos que representam o agrupamento de registos considerados relativos a uma
mesma ocorrência, guardando-os de seguida na secção de Clustered Traffic Data da base
de dados.
O componente de análise é responsável por criar um registo histórico das situações que
foram identificadas, assim como a sua evolução ao longo do tempo. Este registo é utilizado
como uma base de conhecimento para o sistema, tal como o estipulado na solução
proposta. Esta base de conhecimento tem duas mais-valias:
(1) A primeira consiste da análise de quais as extensões de via, e dentro de que períodos
específicos, apresentam uma maior incidência de tráfego. Esta análise permite identificar as
extensões de via mais problemáticas, alavancando os operadores com um melhor
precavimento relativamente a situações de tráfego que possam ocorrer nessas zonas.
(2) A segunda está directamente associada com a estimação do término de ocorrências. Tal
como dito na solução proposta, o componente de análise associa as notificações de tráfego
com a evolução das ocorrências. Esta associação permite identificar os desvios que existem
entre as notificações e as ocorrências em si. Desta maneira, o sistema consegue estimar
que desvios são mais prováveis de estarem presentes nos dados transmitidos, podendo
estimar assim, com mais precisão, a verdadeira duração da ocorrência.
Como indicado na figura, o componente SIG contém dentro deste uma instância, em
memória, da aplicação ArcMap. A aplicação ArcMap é arrancada internamente, pelo SCIR,
no início da aplicação, sendo todos os processos de georeferenciação de pontos e de linhas
são feitos através do ArcMap. Aquando de um pedido de georeferenciação, o componente
SIG comunica com a instância do ArcMap através de objectos COM. O processo de
geoferenciação de pontos e de linhas utiliza como base a tecnologia de ArcObjects da ESRI.
5.3 Dashboard
80
também, adicionalmente, efectuar o cálculo de melhores rotas tendo em conta os eventos de
tráfego actuais.
A fig. 35 apresenta uma vista geral da interface, sendo destacados o menu principal, a
listagem de eventos de tráfego, os eventos de tráfego gereferenciados no mapa, e os
controlos de cálculo de rota. O menu principal permite saltar entre as interfaces de eventos
de tráfego, controlos de rota, e análise histórica de situações.
A listagem dos eventos de tráfego contempla todas as ocorrências de tráfego que foram
identificadas pelo SCIR após o processo de agrupamento de dados, sendo estes
apresentados de forma ordenada de acordo com o impacto estimado que estão a provocar
na via.
81
Adicionalmente é possível visualizar de que tipo de eventos se trata, qual a sua duração,
localização na via, e extensão de congestionamento estimada que estão a provocar. Todos
os eventos que aparecem destacados na lista aparecem também georeferenciados no
mapa. Um simples clique em qualquer um dos eventos listados efectua um zoom-in no mapa
sobre o evento seleccionado. Cada tipo de evento está associado a uma simbologia
específica, permitindo uma mais fácil identificação da categoria e tipo de evento que se trata.
Por esta razão, é possível calcular a rota destacada a vermelho, que evita os eventos de
tráfego que estão a decorrer. Contudo é feito um cuidado adicional. Apenas os eventos de
tráfego que apresentem uma duração acima do tempo médio estimado para o alcance do
mesmo desde o ponto de começo de rota é que são incluídos como barreiras. Isto é, se o
veículo em questão irá demorar mais tempo a chegar a esse evento do que o tempo
estimado para a sua duração, então o evento não deve constituir uma barreira no cálculo da
rota.
A fig. 37 apresenta os três eventos em questão no cálculo da rota. Como é possível ver,
cada um dos eventos apresenta três níveis de congestionamento, a amarelo, laranja e
vermelho, de acordo com o estipulado na solução proposta. Tanto o evento de manutenção
de via, como o evento de congestionamento, apresentam os três níveis de
congestionamento sobrepostos, sendo o de menor congestionamento o com maior extensão,
e o de maior congestionamento com menor.
82
Figura 36 – Apresentação do cálculo de duas rotas diferentes entre dois pontos. Ao
contrário da rota vermelha, a rota azul não contempla os dados de tráfego actuais.
83
Por fim tem-se a secção de visualização histórica de dados, apresentada na fig. 38. Esta
secção permite a visualização histórica do número de ocorrências verificadas por ano, mês,
e dia da semana, assim como a selecção específica de um período de dias, para a
efectuação de uma análise mais localizada e detalhada do que aconteceu dentro desse
período específico.
84
O resultado da selecção de um período específico faz actualizar o gráfico de barras e o
gráfico de pizza. No caso do de barras, é identificado por dia seleccionado, o tipo e número
de eventos ocorridos. No caso do gráfico de pizza é identificado o tipo e número de
ocorrências que se verificaram dentro do período seleccionado. Adicionalmente, o utilizador
pode activar o mapa de gradiente, e “picar” nas fatias do gráfico de pizza para visualizar,
geograficamente, as zonas de maior incidência. No exemplo fornecido, são escolhidos os
congestionamentos dentro do mês de Outubro, o que resulta no mapa de gradiente
apresentado à esquerda.
Tecnologias utilizadas:
85
6 Conclusões e Trabalho Futuro
A única coisa com que as fontes de dados se tinham que preocupar era em descrever as
ocorrências em sí, utilizando para esse efeito o modelo de dados fornecido. O componente
86
de fusão seria, por sua vez, responsável por fundir os diversos dados transmitidos,
procurando integrar os dados em uma vista concreta de ocorrências, com localização,
natureza, extensão e impacto estimados.
Também foi dado especial foco à determinação da duração de ocorrências. Saber identificar
ocorrências não constitui informação suficiente para o suporte às operações de uma
transportadora. Estas têm que possuir informação sobre a duração das ocorrências
registadas, para assim poderem decidir se alteram a rota de determinado veículo que esteja
a caminho de uma ocorrência identificada.
Para este efeito, foram apresentadas duas metodologias distintas para a estimação de
duração de ocorrências, ambas baseadas na elaboração de uma data warehouse para o
registo histórico de ocorrências, e em processos de data mining para o suporte à estimação.
O primeiro método consistiu na identificação de processos de pesquisa de ocorrências
semelhantes registadas no histórico, para motivos de consulta e comparação de durações
estimadas, e o segundo consistiu no estudo dos desvios das estimativas feitas pelas fontes
de dados, para proceder ao ajuste directo de estimativas feitas por dada fonte.
Foi feito um estudo criterioso do estado de arte relacionado com sistemas de monitorização
de trânsito, e com metodologias de previsão de duração de ocorrências em auto-estradas. O
estudo revelou que as metodologias correntes não apresentavam coeficientes de sucesso na
previsão suficientemente elevados para serem considerados fiáveis e úteis para os
profissionais do sector de transporte rodoviário de mercadorias.
A razão considerada como causadora principal para esta reduzida precisão e fiabilidade, foi
a falta de informação de contexto sobre as ocorrências de trânsito. A maioria das
metodologias focava-se apenas nos acidentes como causadores de congestionamentos, na
sua natureza, número de veículos envolvidos, e número de pessoas feridas. Foram
negligenciados os congestionamentos que acontecem apenas devido a falta de capacidade
das vias para dar vazão ao número de veículos, assim como todo o contexto envolvente e
causador de congestionamentos.
87
Determinou-se que o contexto de um congestionamento era praticamente negligenciado,
como a incorporação de informação sobre a altura do dia (manhã, tarde, noite, hora de
ponta) dia da semana, sazonalidade, localização, congestionamento actual,
congestionamento esperado, condições meteorológicas, fontes de informação, número de
fontes e fiabilidade, assim como o desfasamento temporal de notificações relativamente a
ocorrências.
Os métodos de fusão e de análise não foram testados apenas em ambientes de teste, não
sendo possível aplicá-los no campo. Para colmatar esta falta, foi desenvolvido um protótipo
que simula diversas situações de tráfego, dando especial foco à evolução temporal de
ocorrências e à elaboração de registos que apresentem dados correlacionados com a sua
evolução. Foram implementadas as características principais dos componentes de fusão e
de análise, assim como do componente SIG, para dar suporte à georeferenciação de
registos em auto-estradas.
A aplicação prática dos métodos apresentados é fundamental para a evolução dos mesmos.
A determinação de processos de fusão e de análise de dados só podem chegar até certo
ponto, se não forem testados na prática. Apenas com a experiência de utilização é que se
pode determinar quais as técnicas de fusão e de análise que resultam melhor. Não obstante,
as técnicas identificadas nesta dissertação constituem um passo nessa direcção.
Ainda totalmente dentro do campo teórico, apresentam uma metodologia concreta para o
estabelecimento de uma unidade de processamento central de dados de tráfego, com um
88
modelo de dados para o registo de ocorrências, e um conjunto de processos para o
tratamento e análise de dados, que se destacam fundamentadamente dos restantes
métodos constituintes do estado de arte. Como trabalho futuro para esta dissertação
identificam-se os seguintes tópicos:
89
ocorrências reais, a sua duração e o seu impacto na via, para poder comparar com
os registos transmitidos pelas fontes de dados, e com os resultados obtidos pelo
SCIR. Esta comparação pode ser crucial para o ajuste do registo e pesquisa de
dados históricos.
90
Referências
[1] EUROSTAT: Panorama of Transport, pp.56-58 (2009)
[2] European Commission: Proposal for a Directive of the European Parliament and of the Council
laying down the framework for the deployment of Intelligent Transport Systems in the field of road
transport and for interfaces with other transport modes, Brussels (2008)
[3] Pinto, R., Sousa, J., Pestana, G.: A Methodology for Real-Time Data Fusion, Georeferentiation and
Analysis of Road Traffic Data reported by Multiple Sources. In: 12th World Conference on Transport
Research, Lisbon (2010)
[4] Federal Highway Administration - Office of Transportation Policy Studies: An Initial Assessment of
Freight Bottlenecks on Highways. Cambridge Systematics White Paper (2005)
[5] Golob, F., Regan, A..: Impacts of highway congestion on freight operations: perceptions of trucking
industry managers. In: Transportation Research Part A: Policy and Practice pp.577-599 (2001)
[6] Lautso, K. et al.: Outlook for world trade, economic growth, globalization, and the resulting freight
flows, especially between the European Union and Russia. In: ETC Proceedings (2005)
[7] Otsuka, S.: Central Asia’s Rail Network and the Eurasian Land Bridge. In: Japan Railway and
Transport Review - Vol. No: 28. pp: 42-49 (2001)
[8] CIA – The World Fact Book – FieldListing: Railways. Available at:
https://www.cia.gov/library/publications/the-world-factbook/fields/2121.htm - 05/09/10
[9] Rodrigues R.: Mudança de Bitola Imperativo Nacional (2001). Available at: http://socgeografia-
lisboa.planetaclix.pt/transportes/bitola2.pdf - 05/09/10
[12] Texas Transportation Institute: Traffic Congestion and Reliability - Trends and Advanced Strategies
for Congestion Mitigation (2005)
[13] Tokuyama H.: Intelligent Transport Systems in Japan (1996) Available at:
http://www.tfhrc.gov/pubrds/fall96/p96au41.htm - 05/09/10
[14] Bertini, R., et Al.: Benefits of Intelligent Transportation Systems Technologies in Urban Areas: A
Literature Review - Final Report. Portland State University, Center for Transportation Studies (2005)
91
[15] Leduc G.: Road Traffic Data: Collection Methods and Applications. JRC Techcnical Notes, JRC
47967, European Commission (2008)
[17] Curtin, K., Noronha, V., Goodchild, M., Grisé, S.: ArcGIS Transportation Data Model (UNETRANS).
Technical Report (2003)
[18] Miller H., Shaw S.: GIS-T Data Models. In: Geographic Information Systems for Transportation:
Principles and Applications, Oxford University Press, ISBN 0195123948 (2001)
[19] Raines, A., Rowley, P.: Coordinated traffic management through data exchange. In: Road
Transport Information and Control 2008 and ITS United Kingdom Members' Conference. Manchester
(2008)
[20] European Commission: eMOTION Project (2006) Available at: http://www.emotion-project.eu/ - 05-
09-10
[21] HU, M., HaoTANG, Lee, D., SHI, Q.: Development of the Real-time Evaluation and Decision
Support System for Incident Management. In: Intelligent Transportation Systems, Vol.1 pp: 426-431,
IEEE Press (2003)
[22] Jiang, G., Gu, M., Han, G., Yang, X.: Traffic Incident Information Management Systems Based on
GIS-T. In: 7th International Conference on Intelligent Transportation Systems, Proceedings, pp: 527 -
530, IEEE Press (2004)
[23] Zhang, B., Deng, W., Mao, L.: Traffic Congestion Information Promulgating System Based on GIS-
T. In: Power Electronics and Intelligent Transportation Systems, pp: 467 - 471, IEEE (2008)
[24] Knibbe, W., Alkim, T., Otten, J., Aidoo, M.: Automated Estimation of Incident Duration on Dutch
Highways. In: Intelligent Transportation Systems, pp: 870-874, IEEE (2006)
[25] Chung, Y.: Development of an accident duration prediction model on the Korean Freeway Systems.
In: Accident Analysis and Prevention, Vol. 42, Issue: 1, pp:282-289, Elsevier (2010)
[26] Wei, C., Lee, Y.: Sequential forecast of incident duration using Artificial Neural Network models. In:
Accident Analysis and Prevention, Vol. 39, Issue: 5, pp:944-954, Elsevier (2007)
[27] Kim, W., Natarajan, S., Chang, G.: Empirical Analysis and Modeling of Freeway Incident Duration.
In: 11th International Conference on Intelligent Transportation Systems, pp: 453-457, IEEE (2008)
[28] Golob, T., Recker, W., Leonard, J.: An Analysis of the Severity and Incident Duration of Truck-
Involved Freeway Accidents. In: Accident Analysis and Prevention, Vol. 19, No. 4, pp. 375-395, August
(1987)
92
[29] Nam, D., Mannering, F.: An Exploratory Hazard-Based Analysis of Highway Incident Duration. In:
Transportation Research Part-A, Vol. 34A, No. 2, pp. 85-102, (2000)
[30] Khattak, A., Schofer, J., Wang, M.: A Simple Time Sequential Procedure for Predicting Freeway
Incident Duration. In: IVHS Journal, Vol. 2, No. 2, pp. 113-138, (1995)
[31] Smith, K., Smith, B.: Forecasting the Clearance Time of Freeway Accidents. In: Research Report,
STL-2001-01, Center for Transportation Studies, University of Virginia, Charlottesville, VA, (2001)
[32] European Commission: Directorate General for Transport and Energy: Datex II (version 1.0). User
Guide (2006)
[33] Raines, A., Rowley, P.: Coordinated Traffic Management through Data Exchange. In: Road
Transport Information and Control 2008 and ITS United Kingdom Members’ Conference. Manchester
(2008)
[34] Beaujardiere, W.: Web Map Service Implementation Specification (version 1.3.0). OGC Document
06-042 (2006)
[35] Vretanos, P.: Web Feature Service Implementation Specification (version 1.1.0). OGC Document
04-094 (2005)
[36] Gan, A., Liu, K.: A Robust Dynamic Segmentation Tool for Highway Safety Analysis. In:
Applications of Advanced Technology in Transportation, pp.263.268. Proceedings of 9th International
Conference, Chicago (2006)
[37] ESRI White Paper: Linear Referencing and Dynamic Segmentation in ArcGIS 8.1. Technical Report
(2001)
93