Você está na página 1de 103

Gestão de Ocorrências de Trânsito para o Sector de

Transporte Rodoviário de Mercadorias

Ricardo Alexandre Schiller Wolf Alegre Pinto

Dissertação para obtenção do Grau de Mestre em

Engenharia Informática e de Computadores

Júri

Presidente: Professor Catedrático José Tribolet

Orientador: Professor Doutor Gabriel Pestana

Vogais: Professor Catedrático Mário Serafim Nunes

Novembro de 2010
Agradecimentos

Quero agradecer ao meu orientador de mestrado Dr. Gabriel Pestana e ao meu co-
orientador Eng. José Sousa, pelo excelente apoio técnico e suporte motivacional dos quais
tive grande privilégio de usufruir durante a minha escalada final do último pico desta honrosa
cordilheira académica.
Resumo

O transporte rodoviário encontra-se actualmente em crise, em grande parte devido ao


crescente número de congestionamentos. Existem hoje várias linhas de investigação para o
combate a congestionamentos sendo que uma destas foca-se na estimação de impacto e
duração destes. Esta informação tem especial interesse para o sector do transporte
rodoviário de mercadorias, porque permite-lhes desviar veículos em rota com
congestionamentos, considerados pelos profissionais do sector como o maior problema para
o seu negócio. Porém, as metodologias actuais não apresentam informação suficientemente
precisa e fiável para esta ser útil para o negócio. Nesta investigação foram identificadas as
principais causas para esta falta, e foi elaborada uma metodologia de estimação de impacto
e duração de ocorrências, que evita as causas identificadas. Esta metodologia utiliza os
condutores dos veículos das transportadoras como principais fontes de dados, mas permite
a inclusão de todo outro tipo de fontes. Foi desenvolvido um modelo de dados simples para
o registo de notificações de ocorrências, que contém toda a informação considerada
relevante para o processo de estimação. A estimação de impacto e de duração de
ocorrências utiliza o resultado do processo de fusão como input de pesquisa em uma base
de dados históricos que mapeia ocorrências com impactos e durações medidas. Foi
desenvolvido um protótipo que implementa as principais funcionalidades desta metodologia,
o qual provou funcionar em ambiente de testes. Em trabalho futuro esta metodologia deve
ser testada na prática, para se poder melhorar o sistema com conhecimento de causa.

Palavras-chave: Transporte Rodoviário; Fusão de Dados; Gestão de Ocorrências; Apoio à


Decisão; Indicadores de Trânsito;
Abstract

Road transport is going through a crisis, mainly due to the rising number of congestions.
Today, various lines of research study congestions. One of these focuses in the estimation of
impact and duration of congestions. This information is especially important for the road
freight business, because it enables them to reroute vehicles on course to congestions,
considered by the professionals as the most important problem for their business.
Nonetheless, current methodologies do not present information sufficiently precise and
reliable for practical use. This investigation identified the main causes for this lack of
information, and follows with the elaboration of a methodology for the estimation of impact
and duration of incidents. This methodology uses the freight drivers as main traffic data
sources, but allows the inclusion of all kinds of other data sources. A simple data model was
developed for the registration of traffic notifications, that contains all information considered
relevant for the impact and duration estimation process, where much of these information
was neglected in previous studies. The estimation of impact and duration of traffic incidents is
done using the result of the data fusion as query input to an historical database that maps
incidents with measured impacts and durations. A prototype was developed, that implements
the main functionalities, which proved to work in a test environment. For future work this
methodology should be tested in the field, in order to provide relevant feedback for
improvement.

Keywords: Road Transport; Data Fusion; Incident Management; Decision Support; Traffic
Indicators;
Índice

1 INTRODUÇÃO .............................................................................................................................1

1.1 DEFINIÇÃO DE PROBLEMA ...............................................................................................................4


1.2 CONTRIBUIÇÕES ............................................................................................................................4
1.3 ORGANIZAÇÃO DA DISSERTAÇÃO ......................................................................................................5

2 ENQUADRAMENTO ....................................................................................................................7

2.1 TRANSPORTE RODOVIÁRIO DE MERCADORIAS NA EU ...........................................................................7


2.2 TIPOS DE CONGESTIONAMENTOS .................................................................................................... 11
2.3 SISTEMAS INTELIGENTES DE TRANSPORTE .........................................................................................13
2.4 SISTEMAS DE INFORMAÇÃO GEOGRÁFICA PARA O TRANSPORTE ............................................................18
2.5 ANÁLISE GAP E ABORDAGEM .........................................................................................................24

3 TRABALHO RELACIONADO ....................................................................................................... 29

3.1 SISTEMAS DE INFORMAÇÃO DE TRÂNSITO.........................................................................................29


3.2 METODOLOGIAS DE PREVISÃO DE DURAÇÃO DE OCORRÊNCIAS ............................................................34
3.3 DISCUSSÃO DO TRABALHO RELACIONADO ........................................................................................40
3.4 OUTRAS REFERÊNCIAS E LOCAIS DE CONSULTA ..................................................................................43

4 SOLUÇÃO PROPOSTA ............................................................................................................... 45

4.1 ARQUITECTURA ...........................................................................................................................46


4.2 ENQUADRAMENTO COM NORMAS DE COMUNICAÇÃO VIGENTES ..........................................................50
4.3 MODELO DE DADOS E REGISTO DE OCORRÊNCIAS ..............................................................................52
4.4 GEOREFERENCIAÇÃO DE DADOS ..................................................................................................... 54
4.5 FUSÃO DE DADOS........................................................................................................................56
4.6 ANÁLISE DE DADOS......................................................................................................................66

5 CASO DE ESTUDO ..................................................................................................................... 77

5.1 GERAÇÃO DE CENÁRIOS ................................................................................................................77


5.2 NÚCLEO SCIR.............................................................................................................................79
5.3 DASHBOARD...............................................................................................................................80

6 CONCLUSÕES E TRABALHO FUTURO......................................................................................... 86

I
Lista de Quadros e Figuras

Figura 1 - Performances por modo de transporte na União Europeia em 2006 ....................... 1


Figura 2 – Comparação de exportações e importações, em Biliões de Euros, na União
Europeia na última década........................................................................................................ 8
Figura 3 – Vista geral das principais bitolas utilizadas na comunidade Eurasiática. ................ 9
Figura 4 – Comparação entre as performances dos vários modos de transporte.................. 10
Figura 5 – Arquitectura genérica dos Sistemas Inteligentes de Transporte. .......................... 15
Figura 6 – Exemplo de dados associados a um sistema de referenciamento linear.............. 22
Figura 7 - Comparação das vantagens e desvantagens dos dois principais métodos
utilizados para a recolha de dados de tráfego rodoviário ....................................................... 25
Figura 8 – Descrição da arquitectura do sistema de apoio à decisão. ................................... 31
Figura 9 – Descrição da arquitectura do sistema SIG-T ......................................................... 32
Figura 10 – Descrição da arquitectura do sistema de gestão de emergências ...................... 33
Figura 11 – Listagem de parâmetros de categorização de ocorrências ................................. 35
Figura 12 – Exemplo de uma das árvores de decisão elaboradas ......................................... 36
Figura 13 – Gráfico da função “log-logística” aplicada ........................................................... 37
Figura 14 - Tabela que mapea características de ocorrência com respectivos
coeficientes de severidade ...................................................................................................... 37
Figura 15 – Fluxograma geral do sistema para a estimação da duração de uma ocorrência 38
Figura 16 – Árvore de decisão resultante do estudo empírico ............................................... 39
Figura 17 – Vista geral da arquitectura. .................................................................................. 47
Figura 18 – Vista geral da arquitectura com foco na transmissão de dados de tráfego e de
operações. ............................................................................................................................... 48
Figura 19 – Arquitectura interna do SCIR. .............................................................................. 49
Figura 20 – Modelo de dados para o registo de ocorrências de tráfego ................................ 53
Figura 21 - Exemplo de uma rota resultante do processo de segmentação dinâmica ........... 56
Figura 22 -Dendograma resultante do algoritmo de clustering hierárquico aglomerativo ...... 59
Figura 23 - Separação do dendograma em sub-árvores com base no desvio padrão
acumulado em cada nó. .......................................................................................................... 60
Figura 24 - Modelo ontológico que descreve como é que os diversos tipos de registos estão
relacionados entre si. .............................................................................................................. 61
Figura 25 - Exemplificação da aplicação de três níveis de confiança para obter três
extensões de congestionamento diferentes ............................................................................ 63

II
Figura 26 - Apresentação de um resumo sobre um conjunto de causas que podem estar a
contribuir para um congestionamento. .................................................................................... 65
Figura 27 – Exemplo de como as extensões obtidas pelos intervalos de confiança são
alteradas para terminarem sobre o centro de massa. ............................................................ 65
Figura 28 – Exemplo de dois tipos gerais de situações que podem provocar
congestionamentos. ................................................................................................................ 67
Figura 29 – Exemplo de como diferentes sequências de notificações podem ajudar à
determinação das fases de crescimento e redução de ocorrências. ...................................... 69
Figura 30 – Exemplo de relação entre a duração e impacto estimados com a evolução de um
congestionamento. .................................................................................................................. 70
Figura 31 – Modelo em estrela para o registo histórico de ocorrências ................................. 72
Figura 32 – Fluxograma geral que descreve os passos que são feitos pelo componente de
análise aquando de uma iteração. .......................................................................................... 74
Figura 33 – Exemplificação dos desvios calculados para um utilizador em três fases do
decorrer de ocorrências. ......................................................................................................... 75
Figura 34 – Arquitectura interna do protótipo desenvolvido. .................................................. 78
Figura 35 – Apresentação da interface para a monitorização de situações de tráfego actuais.
À direita são apresentadas as ocorrências agrupadas pelo componente de fusão, ordenadas
pelo seu impacto ..................................................................................................................... 81
Figura 36 – Apresentação do cálculo de duas rotas diferentes entre dois pontos. ................ 83
Figura 37 – Apresentação das extensões calculadas para as ocorrências de tráfego que
foram agrupadas pelo sistema. ............................................................................................... 83
Figura 38 – Apresentação da secção de consulta histórica de ocorrências ........................... 84

III
Lista de Abreviações

COM Component Object Model

DRIVE Dedicated Road Infrastructure for Vehicle Safety in Europe

FCD Floating Cellular Data

GPRS General Packet Radio Service

GPS Global Positioning System

INSPIRE Infrastructure for Spatial Information in Europe

IC Itinerário Complementar

IP Itinerário Principal

ITS Intelligent Transport Systems

IVHS Intelligent Vehicle-Highway Systems

OGC Open Geospatial Consortium

ORM Object Relational Model

PNB Produto Nacional Bruto

PROMETHEUS Program for a European Traffic System with Higher Efficiency and
Unprecedented Safety

RACS Road/Automobile Communication System

SCIR Sistema Central de Informação Rodoviária

SIG Sistema de Informação Geográfica

UE União Europeia

WFS Web Feature Service

WMS Web Map Service

XML Extensible Markup Language

XSD XML Schema Definition

IV
1 Introdução

O transporte é fundamental para o desenvolvimento da economia e do bem-estar


bem de
populações. A sua característica principal consiste na mobilidade proporcionada,
considerada como um doss requisitos mais importantes para o exercício da actividade
económica. Este dá suporte ao desenvolvimento de economias de escala, pela estruturação
de complexas redes de distribuição entre produtores e consumidores.
consumidores

Dos quatro meios de transporte mais importantes


im - o rodoviário, marítimo, ferroviário e aéreo
- o mais utilizado é o meio rodoviário. De acordo com a EUROSTAT, entre 1995 e 2006 a
quantidade de bens transportados cresceu de 1.3 bilião de tkm (toneladas-quilómetro)
quilómetro) a 1.9
biliões tkm (ver fig. 1),, dos quais, o meio de transporte rodoviário foi o mais presente,
assumindo 45% do total de bens transportados na Europa em 2006 [1].

Outros Aéreo
6% 1% Ferroviário
10%

Marítimo
Rodoviário
39%
44%

Figura 1 - Performances por modo de transporte na União Europeia


opeia em 2006. Fonte
EUROSTAT [1]

O facto de o modo de transporte mais


mais utilizado ser o rodoviário, foi o motivador principal para
a realização deste estudo, tendo este começado pela identificação do estado de arte do
negócio, quais as suas principais características, desafios e dificuldades. Este estudo inicial

1
permitiu identificar que estamos a chegar a uma era de crise no transporte rodoviário,
instigada pelos crescentes congestionamentos, e o aumento da poluição emitida.

De acordo com estudos apresentados pela Comissão Europeia em 2008 [2], o crescimento
do transporte rodoviário, estimado de aumentar em 55% no transporte de mercadorias e em
33% no transporte de passageiros até 2020, tal como o consumo de energia e respectivo
impacto no ambiente – estima-se um crescimento de 15% nas emissões de CO2, mesmo
contemplando os planos de mudança para as energias renováveis -, pedem por uma
resposta rápida e inovadora, que vise a implementação de novas metodologias de suporte
ao transporte e à mobilidade com o objectivo de tornar o sector mais competitivo e eficiente,
quer em termos de desempenho, quer ao nível do impacto ambiental.

Ao nível do transporte terrestre existe também o transporte ferroviário, o qual se apresenta


como uma alternativa ao rodoviário. No entanto, este modo de transporte tem uma
desvantagem para com o modo rodoviário, na medida em que é incapaz de transportar as
mercadorias directamente o destinatário final. Na maioria dos casos, é necessário transferir
as mercadorias do modo ferroviário para o rodoviário para assim se prosseguir com o
transporte até aos destinatários finais. Esta é uma das razões principais para a maior
adopção do modo rodoviário para com o ferroviário.

Focando-nos no transporte rodoviário de mercadorias apenas, este apresenta-se cada vez


mais competitivo. Os operadores procuram disponibilizar serviços que apresentem um valor
acrescentado a um preço o mais baixo possível, para assim se conseguirem diferenciar
dentro do mercado. A principal estratégia utilizada para obter esta margem de diferenciação
assenta sobre uma a optimização das rotas a serem tomadas, tendo em conta os
destinatários, as mercadorias e as janelas temporais de entrega a serem cumpridas.

Existem contudo diversos factores externos que podem comprometer esta optimização de
rotas, como congestionamentos, desvios e cortes nas estradas. Destes vários, os
congestionamentos são considerados os mais problemáticos. De acordo com um estudo
feito sobre o impacto dos congestionamentos no transporte rodoviário de mercadorias [5], no
qual foram entrevistados aproximadamente 1200 operadoras, mais de 80% destas
consideravam os congestionamentos como problemas “sérios” ou “críticos” para o seu
negócio.

Segundo estas, os congestionamentos provocam um aumento das durações de viagem e


uma resultante menor pontualidade, traduzindo-se em custos acrescidos para a companhia e

2
para os clientes. Torna-se premente a capacidade de alterar as rotas em tempo real tendo
em conta o estado actual do trânsito.

Para esse efeito, as operadoras têm vindo a recorrer a sistemas de detecção de


congestionamentos. Estes sistemas recorrem a infra-estruturas de sensores construídas
sobre os principais corredores de transporte para recolher dados de tráfego, e por sua vez,
transmitir informação de trânsito.

Contudo, a informação disponibilizada não se apresenta útil especificamente para o sector


de transporte rodoviário de mercadorias. O problema consiste na omissão de dois dados
fundamentais: qual a duração das ocorrências identificadas e qual a fiabilidade da
informação transmitida.

Sem estes dados, a informação disponibilizada não é suficiente para as operadoras poderem
decidir informadamente sobre possíveis alterações às suas rotas. Para as operadoras, saber
apenas que existe um congestionamento em dada via não é suficiente. Estas necessitam de
saber a duração do congestionamento e a fiabilidade da informação transmitida, para assim,
caso haja um veículo em rota com o congestionamento, poderem decidir se devem ou não
alterar a sua rota.

Existem várias frentes de investigação em comunidades tanto nacionais como internacionais


que procuram responder a estas questões. Nesta dissertação procura-se um enquadramento
com o estado de arte no combate aos congestionamentos, com objecto de realçar as mais-
valias e contributos que a investigação almeja alcançar. O foco será unicamente o sector de
transporte rodoviário de mercadorias, não obstante, considera-se que a investigação
apresentada poderá ser útil para outros sectores de transporte distintos deste.

De seguida apresenta-se, em forma de resumo, a definição do problema abordado nesta


dissertação, as contribuições resultantes da investigação efectuada e do trabalho escrito
apresentado, e finalmente a organização da dissertação.

Procura-se apresentar um resumo simples e conciso sobre o problema, enquadramento,


objectivo, contribuições e estrutura da dissertação, para, depois de posterior leitura da
dissertação, se possa sempre voltar a esta secção e ter realçado os pontos chaves desta
tese.

3
1.1 Definição de Problema

O objectivo deste subcapítulo consiste em apresentar de forma sucinta a definição do


problema que esta dissertação aborda, com o propósito de proporcionar uma linha condutora
da direcção que a dissertação tomará. Contudo, apresentar a definição do problema logo no
início da dissertação é difícil, dado que ainda não foi feito um enquadramento sobre o
contexto e âmbito da mesma, e sobre a investigação feita, da qual resultou a definição do
problema que se apresenta de antemão. Segue-se a definição do problema:

Definir uma metodologia que possibilite a identificação de ocorrências de


congestionamentos em auto-estradas, pela integração, fusão e análise de dados de
tráfego rodoviário transmitidos por fontes heterogéneas, e que permita a determinação
da natureza, localização, impacto e duração prevista das ocorrências identificadas.

Esta definição apresenta-se algo descontextualizada sem o suporte do enquadramento que


se irá seguir. Porém quando devidamente enquadrada, torna-se uma definição concreta
sobre o problema central que esta dissertação aborda. Por esta razão, aconselha-se o leitor
a revisitar esta subsecção depois de ter lido o enquadramento e trabalho relacionado da
dissertação.

1.2 Contribuições

Semelhantemente para com a subsecção ‘Definição de Problema’, esta subsecção é algo


difícil de apresentar sem o devido enquadramento da dissertação. Não obstante, considera-
se importante que a mesma esteja presente para, logo de início, apresentar as principais
contribuições da dissertação, proporcionando um resumo facilmente localizável das
contribuições e de aconselhada posterior revisita. Seguem-se as contribuições:

4
ℵ Definição de uma metodologia para a fusão e análise de dados de tráfego
rodoviário fornecidas por fontes de dados heterogéneas.

ℵ Estudo do suporte logístico e tecnológico necessário para a georeferenciação


de ocorrências de tráfego em auto-estradas.

ℵ Definição de um modelo de dados para o suporte à metodologia identificada,


baseado na norma Datex2, sendo resultante de várias iterações focadas na
simplificação da mesma, com o objectivo de facilitar a sua utilização prática.

ℵ Elaboração de um caso de estudo na auto-estada A1, onde são aplicadas, na


prática, as metodologias apresentadas nesta dissertação.

ℵ Escrita de um documento científico sobre a metodologia desenvolvida, sendo


este publicado na Conferência Mundial de Investigação em Transportes
(WCTR 2010) [3].

1.3 Organização da Dissertação

A restante dissertação é composta por cinco secções: Enquadramento, Trabalho


Relacionado, Solução Proposta, Caso de Estudo e Conclusões e Trabalho Futuro. Na
secção Enquadramento iremos dar introdução ao transporte e à sua importância para a
economia das nações. Serão apresentados os modos de transporte mais utilizados, e como
é que estes tenderão a evoluir nos anos vindouros.

Segue-se uma introdução aos congestionamentos e ao impacto que estes provocam no


transporte rodoviário de mercadorias. São apresentadas as principais metodologias
utilizadas no combate aos congestionamentos, quais as suas mais-valias e principais
lacunas. Finalmente, termina-se com a apresentação da nossa abordagem para o combate
aos congestionamentos dentro do contexto do transporte rodoviário de mercadorias, como é

5
que esta se enquadra dentro das metodologias actuais, e quais as mais-valias procura
trazer.

Na secção de Trabalho Relacionado, são apresentados os principais sistemas e


metodologias de gestão de ocorrências de trânsito. Todos os estudos apresentados resultam
de uma pesquisa e selecção cuidada, que teve por objectivo apresentar o estado de arte dos
sistemas de monitorização de trânsito, com foque nas metodologias de previsão de duração
de ocorrências. A secção finaliza com uma análise crítica aos trabalhos relacionados,
apresentando as mais-valias e problemas identificados, enquadrando paralelamente a
abordagem escolhida.

Na secção Solução Proposta iremos apresentar a arquitectura do sistema que foi


desenvolvida em linha com a abordagem escolhida. Quais as metodologias utilizadas para a
recolha, fusão e análise de tráfego rodoviário, e qual o modelo de dados escolhido para dar
suporte às metodologias apresentadas. Será, também, dado especial foco à
georeferenciação de ocorrências em auto-estradas, quais as dificuldades inerentes a esta
tarefa, e como é que estas podem ser contornadas.

No caso de estudo iremos apresentar um protótipo que implementa a arquitectura e


principais metodologias apresentadas na solução proposta. E, por fim, são apresentadas as
conclusões finais e delineado o trabalho futuro.

6
2 Enquadramento

Este enquadramento procura introduzir o leitor dentro do tema do transporte rodoviário de


mercadorias na União Europeia, dando especial relevo aos principais problemas que o
sector enfrenta, às soluções existentes para a mitigação desses problemas e às limitações
encontradas nessas soluções. O enquadramento termina com a proposta de uma
metodologia para o melhoramento das soluções actuais, com a identificação das mais-valias
da solução proposta, assim como o seu contributo e suporte para as soluções actuais.

2.1 Transporte Rodoviário de Mercadorias na EU

O transporte de mercadorias é fundamental para o desenvolvimento de economias de


escala. Este permite a estruturação de complexas redes de distribuição entre produtores e
consumidores, separados entre grandes distâncias espaciais, sendo reconhecido que a sua
eficiência tem impacto directo sobre a produtividade e competitividade de uma nação, tal
como sobre o crescimento do seu capital.

A União Europeia tem vindo a exibir um crescimento constante do transporte rodoviário de


mercadorias dentro da última década. Tal como observável na fig. 2, onde é apresentada a
evolução das importações e exportações na União Europeia [1], para além do crescimento
geral tanto das importações como das exportações, nota-se um ligeiro aumento das
importações relativamente às exportações.

De acordo com a perspectiva apresentada por Lautso et al. em 2005, onde este prevê o
impacto da globalização sobre o comércio mundial e resultantes fluxos de transporte [6], esta
discrepância entre importações e exportações deve-se ao crescimento das economias
asiáticas. À medida que estas se fortificam, os fluxos de transporte entre a Europa e Ásia
tenderão aumentar, verificando-se o oposto com os fluxos de transporte entre a Europa e
Estados Unidos.

Consequentemente, as importações provindas das nações asiáticas tenderão a destacar-se,


principalmente devido aos reduzidos custos de produção praticados nessas nações. Lautso

7
remata que, dentro dos próximos vinte anos, os fluxos de transporte entre a Europa e Ásia
tenderão a ter os seus níveis duplicados.

Este alinhamento dos corredores


dores de transporte na Eurásia dá especial destaque aos modos
de transporte
sporte rodoviário e ferroviário,
ferroviário devido a serem os modos de transporte menos
custosos, e à inerente ligação, por terra, entre os dois continentes. No entanto, o modo
ferroviário tem, até à altura, algumas desvantagens.

Desde meados de 1950 que têm vindo a haver esforços na elaboração de uma rede
ferroviária Eurasiática. Porém, atritos políticos e económicos entre os anos 60 e 80 travaram
travara
fortemente este empreendimento, permitindo somente depois do fim da Guerra
G Fria uma
retoma do interesse da elaboração de uma rede ferroviária internacional.

UE Exportações e Importações
1,8
1,6
1,4
Biliões de Euros

1,2
1
Exportações
0,8
Importações
0,6
0,4
0,2
0
2000 2001 2002 2003 2004 2005 2006 2007 2008

Figura 2 – Comparação de exportações e importações, em Biliões de Euros, na


União Europeia na última década. Nota-se
Nota se um crescimento maior das importações
para com as exportações desde 2003.

Actualmente não existe nenhuma rede consolidada de transporte ferroviário de mercadorias


entre a Europa e a Ásia, e isto deve-se
deve principalmente
incipalmente ao uso de diferentes bitolas (a
distância entre os carris) em vários dos países ou regiões que fazem a ligação por terra [7].
Esta diferença na bitola é um forte obstáculo para um transporte ferroviário internacional,
porque sempre que se verifica
veri uma destas diferenças, torna-se necessário fazer uma
transferência total de mercadorias para carruagens adequadas ao novo tamanho.

A fig. 3 apresenta uma vista geral das principais bitolas utilizadas na comunidade
Eurasiática. Nota-se
se que tanto os países
países da antiga USSR, assim como a Índia, apresentam-
apresentam

8
se como obstáculos para o transporte ferroviário internacional, na medida em que utilizam
bitolas diferentes da bitola internacional ou bitola de Stephenson,, de 1435 mm [8]. Existem
projectos em curso para
a a elaboração de eixos de carruagem que permitam diversas bitolas,
não obstante com várias limitações.

Figura 3 – Vista geral das principais bitolas utilizadas na comunidade Eurasiática.


Algumas bitolas foram omitidas da legenda. Esta figura foi criada com base em uma
imagem disponível na Wikipedia em http://en.wikipedia.org/wiki/Standard_gauge.
http://en.wikipedia.org/wiki/Standard_gauge

Este problema é especialmente crítico para a Península Ibérica, a qual, exceptuando a


Finlândia, utiliza uma bitola diferente da restante comunidade europeia. Esta medida,
adoptada
ada pelos Espanhóis no século XIX,
XIX, foi escolhida para dificultar as invasões francesas,
sendo posteriormente adoptada por Portugal, tornando-se
tornando por
or fim na bitola vigente na
Península Ibérica para o transporte ferroviário [9].

A diferença de bitola na Península Ibérica constitui um grande impedimento para o


transporte ferroviário de mercadorias, e uma desvantagem económica para Portugal. Esta
“barreira”
eira” ferroviária é responsável pela escolha da França, em vez de Portugal, como porto
Europeu para a grande fatia das importações/exportações por via marítima. Existe, não
obstante, a recente iniciativa para o desenvolvimento de um TGV Ibérico que adopte a bitola
internacional, porém ainda em fase embrionária.

O modo de transporte rodoviário apresenta-se,


apresenta se, por isso, como o mais favorável dentro da
Comunidade Europeia, com especial foco na Península Ibérica. De facto, de
d acordo com a
EUROSTAT, entre 1995 e 2006
2006 a quantidade de bens transportados cresceu de 1.3 bilião de
tkm (toneladas-quilómetro)
quilómetro) a 1.9 biliões tkm, dos quais, o meio de transporte rodoviário foi o
mais presente, assumindo 45% do total de bens transportados na Europa em 2006 [1]. A

9
fig.4 apresenta
nta a evolução da performance por modo de transporte dentro da União
Europeia. Esta inclinação para a utilização do meio rodoviário tem sido objecto de
preocupação e de grande debate internacional.

De acordo com estudos apresentados pela


p Comissão Europeia em 2008 [2],
[2] o crescimento
do transporte rodoviário, estimado de aumentar em 55% no transporte de mercadorias e em
33% no transporte de passageiros até 2020, tal como o consumo de energia e respectivo
impacto no ambiente – estima-se
estima um crescimento de 15% nas emissões de CO2, mesmo
contemplando os planos de mudança para as energias renováveis -,, pedem por uma
resposta rápida e inovadora, que vise a implementação de novas metodologias de suporte
ao transporte e à mobilidade com o objectivo de tornar o sector mais competitivo e eficiente
quer em termos de desempenho, quer ao nível do impacto ambiental.

EU-27 Performance Por Modo


2500
Bilião Toneladas-Quilómetro

2000

1500
Aéreo
1000 Ferroviário
Marítimo
500
Rodoviário
0
2000 2001 2002 2003 2004 2005 2006 2007

Figura 4 – Comparação entre as performances dos vários modos de transporte de


mercadorias. O rodoviário revela-se
revela sempre como o modo mais utilizado, e tem
vindo a distanciar-se
distanciar se ainda mais dos restantes. O aéreo tem tão pouca presença
que nem é visto no gráfico.

Dando seguimento a esta preocupação, foram desenvolvidos vários programas, dos quais se
destacam o programa Marco Polo [10],, destinado a transferir o transporte do rodoviário para
o ferroviário, marítimo e aéreo, e a iniciativa INSPIRE [11],, que visa a integração de todo o
tipo de dados e informação espacial dentro da comunidade europeia, com especial foco no
combate à situação
ção ambiental corrente.

10
Paralelamente, o desenvolvimento de Sistemas Inteligentes de Transporte (ITS) tem sido
alvo de grande investimento. Em finais de 2008 a Comissão Europeia aprovou o plano de
acção para o desenvolvimento de ITS, com o objecto de contribuir para um sistema de
transporte mais seguro, menos poluente, e globalmente mais eficiente [2].

A linha geral do plano consiste na aplicação de tecnologias de informação e de comunicação


para todos os modos de transporte, com especial foco no transporte rodoviário. Para o
transporte rodoviário de mercadorias, o objectivo será providenciar informação fiável e em
tempo real sobre condições de tráfego rodoviário, para dar suporte a um melhor
planeamento de rotas e reduzir atrasos causados por congestionamentos.

De acordo com a Comissão, ITS podem reduzir substancialmente as emissões de CO2,


assim como o custo associado a tempo e energia perdida em congestionamentos - estimado
em 1% do Produto Interno Bruto Europeu -, o qual pode ser reduzido em até 10% através da
implementação de um ITS global. Os ITS procuram trazer resposta ao problema dos
congestionamentos assim como a vários outros problemas inerentes ao transporte, sendo
este tema importante da dissertação. Não obstante, antes de ser apresentado o tópico dos
ITS, convém fazer uma breve introdução aos congestionamentos.

2.2 Tipos de Congestionamentos

Congestionamentos são fenómenos pertencentes ao mundo moderno. Maioritariamente


provocados por um excesso de veículos ao longo de uma certa extensão de via, resultam
em velocidades de navegação reduzidas comparativamente para com as exibidas durante o
fluxo livre do tráfego. De acordo com um estudo feito pela Cambridge Systematics em 2005,
sobre tendências e estratégias para a mitigação de congestionamentos [12], os
congestionamentos são causados por seis causas diferentes:

ℵ Capacidade de fluxo insuficiente – 40%


ℵ Acidentes de trânsito – 25%
ℵ Condições ambientais adversas – 15%
ℵ Zonas de trabalho nas vias – 10%
ℵ Sistemas de controlo de tráfego avariados ou defeituosos – 5%
ℵ Eventos especiais – 5%

11
O estudo acrescenta que, das situações supra-citadas, as mais difíceis de prever são os
acidentes de trânsito e as avarias de sistemas. Seguem-se as condições ambientais, os
eventos especiais e por último as zonas de trabalho. Destas últimas, apesar de as zonas de
trabalho poderem ser facilmente anunciadas com antecedência, é necessário que assim o
sejam, para poderem ser consideradas situações de natureza pouco ou nada imprevisível.
Se não o forem, são completamente imprevisíveis, e podem constituir um grande impacto no
fluxo do trânsito.

Relativamente às condições ambientais adversas e aos eventos especiais, apesar de ambos


poderem, na maioria dos casos, ser previstos com alguma relativa precisão, constituem-se
como ocorrências também de natureza imprevisível. No caso das condições ambientais,
nem sempre é possível prever com exactidão como estas irão evoluir, podendo constituir
diferenças significativas na performance do transporte.

De forma semelhante temos os eventos especiais, porque mesmo considerando que se tem
conhecimento prévio do evento e do número esperado de pessoas que o irão atender, nem
sempre é possível determinar quais serão os meios de transporte mais utilizados pelos
atendentes, podendo a sua escolha variar de acordo com o tipo de evento, a sua
localização, as condições ambientais na altura e o dia do mês, entre outros factores.

Considerando as probabilidades associadas a cada categoria de evento, conclui-se que 30%


(acidentes e avarias de sistema) têm uma imprevisibilidade quase total. Outros 20%
(condições ambientais e eventos especiais) também são algo imprevisíveis, mas podem ser
consideradas menos imprevisíveis que as primeiras. As zonas de trabalho constituem outros
15% que só podem ser previsíveis se houver suporte à comunicação da sua anunciação.
Resta a capacidade de fluxo insuficiente, que constitui os restantes 40% das causas, e que
pode ser estimulada por todas as outras restantes causas.

Perante esta observação, verifica-se que apesar de haver um conjunto de


congestionamentos previsíveis que são verificados diariamente nas horas de ponta, existe
um maior conjunto de congestionamentos provocados por situações maioritariamente
imprevisíveis.

Esta análise decorre do facto de os congestionamentos estarem normalmente associados à


hora de ponta, altura onde estes se costumam verificar com mais regularidade. No entanto,
esta disparidade permite considerar que a noção comum de congestionamentos regulares se
baseia apenas em uma experiência empírica, bastante toldada pela rotina citadina. Tomando

12
um ponto de vista mais global, verifica-se que a realidade dos congestionamentos é bastante
mais imprevisível do que anteriormente pensada.

2.3 Sistemas Inteligentes de Transporte

O estudo de ITS já é algo datado. De acordo com um resumo histórico, elaborado por Hideo
Tokuyama em 1996, sobre a evolução dos ITS no Japão [13], o início da investigação de ITS
data de 1960. Tokuyama conta que esta estava localizada principalmente no Japão e
Estados Unidos, onde se procurava desenvolver os primeiros sistemas de controlo de
transporte, com especial ênfase no suporte ao cálculo de rotas.

Devido às limitações tecnológicas da altura, estes sistemas nunca chegaram a sair dos
laboratórios. Tokuyama continua, dizendo que, entre 1980 e meados de 1990 foram dados
grandes avanços dentro do tema, com o desenvolvimento do RACS (Road/Automobile
Communication System) no Japão, do PROMETHEUS (Program for a European Traffic
System with Higher Efficiency and Unprecedented Safety), do DRIVE (Dedicated Road
Infrastructure for Vehicle Safety in Europe) na Europa, e do IVHS (Intelligent Vehicle-
Highway Systems) nos Estados Unidos.

Estes foram os primeiros sistemas a serem postos em prática, trazendo conhecimento sobre
a aplicabilidade e impacto dos ITS nos sistemas de transporte, despoletando novas
investigações para uma melhor adequação, abrangência e alinhamento dos ITS com a
realidade do transporte.

A evolução do Hardware e o conhecimento científico adquirido, aliados com as directivas


emergentes para uma normalização e integração de intra-estruturas e sistemas de
informação, serviram de base para uma nova e revigorante onda de investigação de ITS.
Encontramo-nos na era da globalização, onde a integração de processos e de informação é
a palavra de ordem.

Procura-se o desenvolvimento de modelos de processamento de grande escala, no qual


cada sistema assume o papel de um pequeno nó de processamento dentro de uma grande e
complexa rede de informação. Cada sistema apresenta um conjunto de serviços que podem
ser transparentemente consumidos por outros sistemas, permitindo uma integração e
distribuição de processamento e informação sem precedentes. A arquitectura genérica de
um ITS é descrita na fig.5.

13
O objectivo principal dos ITS de nova geração é o de melhorar, a um nível global, a
eficiência e eficácia dos sistemas de transporte. Existe uma grande variedade de programas
de desenvolvimento de ITS:

ℵ Sistemas de Gestão de auto-estradas: gerem o tráfego dentro das auto-estradas.


Recorrem a sensores e câmaras para monitorizarem o tráfego. Procuram melhorar o
fluxo de tráfego e aumentar a segurança dos utentes.

ℵ Sistemas de Gestão de Trânsito: gerem o tráfego dentro de zonas urbanas. Focam-


se no controlo de semáforos, ajustando os seus tempos de forma a gerir melhor o
fluxo de trânsito à medida que este varia durante o dia.

ℵ Sistemas de Gestão de Incidentes: procuram minimizar o tempo de resposta e


optimizar o apoio a incidentes na estrada, recorrendo a mecanismos de detecção e
avaliação de incidentes, para proceder à difusão do incidente a diversas entidades,
como a outros ITS, ou a unidades de resposta a incidentes.

ℵ Sistemas de Gestão de Emergências: funcionam em comunhão com os sistemas de


gestão de incidentes, procurando escolher as unidades mais adequadas para dar
resposta a um dado incidente, tendo em conta o tipo de incidente, o número e tipo
de veículos envolvidos, o número de feridos, impacto do incidente na via e nos
utentes, como pelo congestionamento que este possa provocar, ou o perigo que
possa impor, como por exemplo pelo derrame de materiais inflamáveis, químicos,
biológicos ou radioactivos.

ℵ Sistemas de Informação do Viajante: funciona em comunhão com os sistemas


anteriores, procurando informar o viajante do melhor caminho que este possa tomar,
tendo em conta os seus pontos de paragem e uma avaliação do estado actual das
vias. Funciona também dentro de um contexto intermodal, tentando escolher os
meios e caminhos mais rápidos e que melhor sincronizam a passagem entre os
diversos modos de transporte.

ℵ Sistemas de Gestão de Transporte de Mercadorias: estes sistemas procuram


providenciar valor acrescentado ao negócio pela optimização dos fluxos de
transporte entre contextos intermodais, recorrendo a informação de trânsito e de
incidentes providenciada por outros ITS, pela optimização da distribuição das
mercadorias pelos veículos disponíveis, tendo em conta os destinos, janelas de
entrega e estado actual do trânsito, e pela automatização de processos específicos
ao negócio, como pela inspecção e verificação automática de veículos, e.g. o peso

14
transportado, a segurança do veículo, a verificação de credenciais e autorização de
viagem.

Figura 5 – Arquitectura genérica dos Sistemas Inteligentes de Transporte. Fonte:


Serviço de Transporte de Kaohsiung – Taiwan:
http://www.tbkc.gov.tw/eng/index.asp

Segundo a revisão bibliográfica apresentada por Bertini et Al. em 2005, sobre ITS em áreas
urbanas [14], vários são os benefícios que podem ser obtidos através de ITS. Estes incluem
melhor segurança, eficiência, fiabilidade, mobilidade e acessibilidade, assim como a redução
de congestionamentos, consumo de combustíveis e tempos de viagem, levando a uma maior
satisfação dos utentes assim como dos operadores.

Sistemas Inteligentes de Transporte apresentam-se como uma excelente opção para o


combate aos congestionamentos. Contudo, existe um grande senão a esta estrutura, o qual
se revela transversal a todos os ITS, assumindo-se como a verdadeira necessidade e
alicerce para o funcionamento de qualquer ITS: o acesso a dados em tempo real. Esta
necessidade é fundamental e tem que ser satisfeita para qualquer ITS funcionar.

15
De facto, todo um ITS se alavanca sobre os dados que tem acesso. Cada um destes
descreve um pequeno fragmento da realidade das vias, permitindo aos ITS a construção de
uma base de conhecimento que melhor descreve a realidade de acordo com o seu foco
específico. O acesso a dados é, por isso, obrigatório. Infelizmente, este requisito não é fácil
de ser cumprido.

A evolução de ITS está directamente correlacionada com a criação de novas metodologias


para a recolha de dados sobre tráfego. Ao longo dos últimos anos, as metodologias
implementadas basearam-se maioritariamente na instalação de sensores de diversas
naturezas ao longo de extensões de via consideradas problemáticas.

Em um documento técnico elaborado por Guillaume Leduc para a Comissão Europeia em


2008, sobre métodos de recolha e aplicação de dados de tráfego rodoviário [15], são
apresentadas as tecnologias mais utilizadas para o efeito, das quais se destacam:

ℵ Tubos pneumáticos: detectam diferenças de pressão causadas pelo passar das


rodas dos veículos. Permitem contar o número de veículos, mas os resultados
podem ser influenciados por diferenças ambientais e de pressão atmosférica.

ℵ Sensores piezoeléctricos: colocados nas vias, convertem energia mecânica


conferida pelo passar dos veículos, em energia eléctrica. Permitem detectar o peso
de veículos e a velocidade.

ℵ Laços de Indução: é a forma mais convencional de contar veículos. Os laços são


colocados sob a forma de um quadrado, criando um campo magnético que é
influenciado pela passagem dos veículos. A grande desvantagem desta técnica é
que o material tem muito pouca durabilidade.

ℵ Sensores Infravermelhos: permitem detectar a presença de veículos mas não


funcionam bem em situações climáticas adversas.

ℵ Radares de Microondas: utilizam o efeito de Doppler para detectar os veículos.

Porém, tem-se vindo a verificar que estas técnicas são cada vez menos satisfatórias. Para
além de serem dispendiosas de instalar e manter, têm de ser instaladas em grande número
para ser possível monitorizar uma grande extensão de via. Ademais, segundo a

16
EUROSTAT, entre 1990 e 2005, o comprimento total das auto-estradas na UE cresceu 47%,
atingindo aproximadamente 61 mil quilómetros [1].

Este crescimento leva a considerar se a utilização de sensores é realmente a melhor


maneira para monitorizar tráfego. É importante notar que estamos apenas a contemplar a
extensão das auto-estradas, as vias rodoviárias no total têm uma extensão muito maior,
aproximadamente 5,6 milhões de quilómetros, de acordo com a União Federal Europeia [16].

Continuando com o estudo apresentado por Guillaume Leduc, a premente necessidade de


combater os congestionamentos aliada à explosão do crescimento das vias rodoviárias levou
a uma procura de novas metodologias de detecção de tráfego. Desta nasceu o Floating Car
Data (FCD), também conhecido por Floating Cellular Data (em Português: Dados de
Veículos Flutuantes).

Esta metodologia baseia-se na recolha da posição, direcção e velocidade de veículos a partir


da sua posição indicada ou por GPS, ou por telemóvel. Considerada como uma forma
promissora para a recolha de dados de tráfego, já é utilizada como fonte de dados por vários
ITS, podendo ser utilizada para produzir relatórios de tráfego em tempo real sem recorrer a
qualquer tipo de infra-estrutura de sensores instalados nas vias.

Existem contudo algumas desvantagens associadas a este método. A primeira está


relacionada com o anonimato dos dados. Considera-se a hipótese de haver resistência à
adopção deste método porque pode constituir uma intrusão na privacidade dos utentes. Se
os dados de localização forem associados às respectivas identidades, pode-se estar perante
uma situação de monitorização dos movimentos de pessoas, o que constitui um grave abuso
à liberdade e privacidade. Mesmo que a privacidade seja garantida, deverá ser dada a
escolha, aos utentes, de contribuírem ou não para os dados do sistema, o que poderá levar
a uma fraca adesão, devido aos receios supra-citados.

Outra desvantagem consiste na não identificação das causas que provocam os


congestionamentos. Apesar de ser possível detectar vias congestionadas, não é possível
determinar aquilo que está a provocar o congestionamento, o que constitui uma grave falta
de informação, principalmente no suporte à estimação de término de ocorrência. Diferentes
causas podem levar a diferentes tempos de resolução de congestionamentos. Ademais,
saber a causa de um congestionamento permite uma melhor análise do estado de situação e
do seu impacto na via, assim como uma consulta de situações semelhantes que tenham
ocorrido no passado e do tempo que estas demoraram a ser resolvidas.

17
Outra desvantagem deste método é específica ao transporte rodoviário de mercadorias. Em
diversos casos, mercadorias têm que ser transportadas para zonas inóspitas. Nestas
situações, nas quais existem poucos veículos a atravessar as vias, saber apenas as
localizações dos veículos pode não ser suficiente para a detecção de vias obstruídas, o que
pode ter um impacto inesperado na performance do transporte.

Perante esta breve incursão dentro das miríades do transporte rodoviário de mercadorias,
verifica-se que os congestionamentos são considerados como um grande problema para o
negócio, e que o combate à sua mitigação já começou há bastante tempo. Porém as
soluções actuais apresentam alguns problemas, como na limitação da sua implantação - no
caso de infra-estruturas de sensores - ou na determinação das causas dos
congestionamentos e na estimação das suas durações - no caso do FCD.

2.4 Sistemas de Informação Geográfica para o Transporte

Apesar de a arte da cartografia ser anterior ao tempo romano, apenas recentemente, algures
entre os anos 50 e 60, é que se viu aparecer o conceito de Sistemas de Informação
Geográfica. O seu primeiro fundamento seria o de tentar dar resposta a um conjunto de
problemas relacionados com a exploração e análise de dados e informação dentro de um
contexto espacial. A localização assumia a posição base para todo o processo, levando à
criação de um novo paradigma para a organização e estruturação de sistemas de
informação.

Os SIG evoluíram muito desde então. Apresentam-se na actualidade como ferramentas


fundamentais para a organização e gestão de informação espacial, abrangendo vastas e
distintas áreas, desde a urbanização, passando pela navegação, e chegando até à medicina.

O uso de SIG para o transporte começou a aparecer paralelamente aos primeiros


desenvolvimentos de ITS. Apresentaram-se como uma excelente ferramenta base para a
gestão e processamento de dados relacionados com o transporte, especialmente devido à
sua natureza inerentemente espacial, dinâmica e transiente. De modo geral, a gestão de um
SIG aplicado ao transporte rodoviário pode ser dividido dentro das seguintes camadas [17]:

ℵ Gestão da Rede Física: Contempla todos os processos inerentes à gestão da


representação de redes rodoviárias, sendo inclinada para actividades de registo,
tratamento e manutenção de dados. O objectivo desta camada consiste na

18
manutenção de uma representação actualizada sobre um conjunto de redes
rodoviárias. Esta actividade incorpora a criação, manutenção e integração de grafos
representativos da rede.

ℵ Gestão de Rotas: Contempla a identificação, modelação e manutenção de rotas


dentro da rede rodoviária. Cada rota representa um objecto complexo que agrega,
de forma linear e incremental, segmentos da rede rodoviária e as suas propriedades.
Auto-estradas, itinerários principais e secundários são bons exemplos de rotas. O
resultado da elaboração de uma rota consiste na criação de um objecto que
assembla propriedades como distância e comprimento, velocidade média,
impedância e outros diversos custos associados à navegação.

ℵ Gestão de Eventos: A gestão de eventos contempla toda a modulação automática


ou manual de acidentes, congestionamentos, ocorrências diversas, sinais de trânsito
e objectos móveis. O registo dos eventos é feito tanto sobre a camada de rede como
a de rotas. No caso da rede física, cada segmento pode ser utilizado como
identificador da localização de uma ocorrência. No caso das rotas, estas podem ser
utilizadas para a localização dinâmica de eventos e veículos, através do cálculo dos
seus pontos quilométricos ao longo das rotas, por exemplo.

ℵ Gestão de Operações: Esta camada é responsável por fornecer um conjunto de


serviços direccionados à gestão de operações de transporte, como pela escolha de
melhores rotas de entrega, alterações a rotas para evitar ocorrências, e estimação
de tempos de entrega e de consumos de combustível.

ℵ Gestão Logística: Encontra-se um nível acima das operações e responsabiliza-se


com a gestão logística ou táctica das operações, como pelo planeamento de
distribuições, gestão de clientes, janelas de entrega e optimização de mercadorias e
rotas, sendo estas organizadas de acordo com a sua natureza, dimensão, janela de
entrega e destino, de forma a melhor escolher que veículos é que devem carregar
que mercadorias, quais os destinos que devem cumprir e por que ordem, assim
como que rotas é que devem tomar entre destinos.

Estas são as principais camadas, ou núcleos de trabalho, associados a um SIG dentro do


contexto do transporte rodoviário de mercadorias. Como se verificará mais à frente, esta

19
dissertação tem o foco geral nas primeiras quatro camadas, mas incide especialmente na
camada de eventos.

Com isto em consideração, dar-se-á especial atenção à camada física e à de rotas, dado
que a camada de eventos assenta sobre estas últimas duas. A camada de operações será
posteriormente introduzida no caso de estudo, para demonstrar como os eventos podem ser
utilizados para uma melhor gestão das operações.

2.4.1 Modelação e Gestão de Redes Rodoviárias

A maioria dos ITS utilizam algum tipo de SIG como suporte para a manipulação e análise da
informação espacial que precisam de gerir. Esta informação contempla a rede viária da qual
o ITS é responsável, assim como toda a dinâmica sobrejacente. Para um ITS poder aferir
correctamente o estado de uma situação, assim como que operações deverão ser
efectuadas para a adereçar, necessita de possuir uma representação o mais fidedigna
possível da rede rodoviária. Como iremos ver a seguir, obter esta representação é mais
difícil do que pode parecer.

A maneira mais comum de modelar redes rodoviárias é com o uso de grafos. As ligações
entre nós são utilizadas para representar segmentos de via, e os nós para interligar esses
segmentos. Tanto as ligações como os nós podem possuir propriedades. Estas propriedades
servem para conferir uma melhor descrição da via que está a ser representada. Os arcos
podem conter diversos dados, como por exemplo o comprimento, o número de faixas, a
direccionalidade, a velocidade máxima e a inclinação, entre outros.

A localização geográfica e interconectividade das ligações servem para representar a


estrutura física da rede, e as propriedades o estado ou regras de navegação dessa
estrutura. Seguindo esta técnica é possível criar uma representação bastante fidedigna de
uma rede rodoviária. Porém existe um conjunto de problemas associados a esta
representação.

O primeiro problema é a actualidade da representação da rede. Não é como se as vias


rodoviárias estivessem em constante mudança, não obstante a rede muda com o tempo,
condições de navegação alteram-se, novas vias são adicionadas e antigas podem deixar de
existir. Tendo em conta que a navegação dos veículos de transporte é maioritariamente
através de auto-estradas, IPs e ICs, este problema tem pouco impacto. Porém uma
actualização periódica da rede é importante.

20
O segundo problema é o uso de datums diferentes dentro da representação de uma rede.
Datums representam pontos geográficos de referência, utilizados como âncoras para a
georefenciação de dados geográficos. Cada ligação está georeferenciada relativamente a
um datum, permitindo assim a identificação da sua localização geográfica. Contudo esta
localização não é totalmente precisa. De facto, quanto mais distante se encontrar a ligação
do datum ao qual está georeferenciada, mais imprecisa ou desviada tenderá a estar a sua
localização.

Por esta razão, certas redes de grande dimensão devem ser particionadas em secções
diferentes, sendo cada uma destas georeferenciada relativamente a um datum mais
adequado. Isto reduz a imprecisão das ligações dentro de cada conjunto, mas pode provocar
incongruências na rede quando os conjuntos são novamente reunidos. Devido a haver
desvios diferentes em cada um dos conjuntos, pode levar a uma quebra em ligações que
fazem a ponte entre dois conjuntos.

Este problema pode ser resolvido automaticamente se se souber de antemão a


conectividade da rede. Nesse caso, as ligações quebradas podem ser facilmente
identificadas e rectificadas. Mas isto nem sempre se verifica. Se se quiser juntar duas redes
provindas de entidades diferentes, pode-se encontrar fortes dificuldades em juntar
correctamente as redes, principalmente se estas estiveram georeferenciadas relativamente a
datums diferentes.

O terceiro problema é o mapeamento de uma localização na rede viária, identificada por


GPS, para a sua representação digital. A precisão da localização de um ponto identificado
por GPS pode variar dependendo do número de satélites acessíveis na altura. Quanto maior
o número, mais precisa se torna a triangulação. A imprecisão existente pode desviar o ponto
para fora da rede. Se este desvio for suficientemente grande, o sistema poderá não ser
capaz de determinar a correcta localização do ponto na rede.

Nestes casos costuma-se efectuar aquilo a que se chama de “snapping” do ponto à rede.
Consiste em repor o ponto em cima da rede, simplesmente pela sua deslocação para a
ligação que lhe estiver mais próxima. Isto pode funcionar para a maioria dos casos, mas em
alguns destes esta deslocação pode ser mal feita – basta o ponto ter-se desviado o
suficiente para estar mais próximo de outra ligação que não a qual a que realmente se
destinava, sendo o snapping feito para essa outra ligação em vez de para a correcta.

21
2.4.2 Modelação e Gestão de Sistemas de Referenciamento Linear

Um sistema de referenciamento linear consiste de um conjunto de rotas sobre uma rede


rodoviária. Como já foi referido no início deste subcapítulo, uma rota consiste de um objecto
complexo que agrega de forma linear e incremental segmentos da rede rodoviária e suas
propriedades. Ao contrário do que o nome sugere, rotas não são apenas a escolha de um
percurso específico dentro de uma gama de possibilidades, como a rota de um veículo de
transporte urbano.

Não se trata da escolha de um caminho através de uma rede, mas sim da composição de
um objecto agregador de um conjunto de segmentos da rede – ver fig. 6. Este objecto tem a
capacidade de determinar propriedades, acumuladas ou não, dentro da rota, determinando,
por exemplo, a distância de qualquer ponto na rota para com o início desta.

Segundo Harvey J. Miller and Shih-Lung Shaw [18], organismos públicos e privados,
relacionados com o transporte, desenvolvem sistemas de referenciamento linear para o
suporte à gestão de eventos dentro da rede de transporte, como acidentes, qualidade de
pavimento e fluxo de tráfego.

No caso específico de vias arteriais, como auto-estradas, itinerários principais e secundários,


as suas entidades responsáveis utilizam estes sistemas de referenciamento linear para
alavancar a monitorização e gestão de eventos dentro da vasta extensão destas vias.

A vantagem principal destes objectos de referenciamento consiste capacidade de conversão


de localização geográfica para localização quilométrica, e vice-versa. Isto é, utilizando estes
objectos pode-se automaticamente determinar a localização geográfica de qualquer ponto
quilométrico da via referenciada, assim como determinar o ponto quilométrico de qualquer
coordenada geográfica que se encontre na via.

Figura 6 – Exemplo de dados diversos que podem ser associados a um sistema de


referenciamento linear.

22
Existe contudo duas particularidades relativamente ao uso destes objectos que se podem
revelar como desvantajosas em certos casos. A primeira assenta sobre o uso de um sistema
de coordenadas cartográfico em contrapartida para com um sistema de coordenadas
elipsoidal.

Um sistema elipsoidal utiliza coordenadas de longitude e latitude para a localização de


objectos, enquanto um sistema cartográfico, consistido de uma projecção de um sistema
elipsoidal, utiliza coordenadas métricas para localizar objectos. O sistema elipsoidal é
inerentemente mais preciso do que o cartográfico, mas apresenta-se desadequado para o
cálculo de distâncias métricas ao longo de sistemas de referenciamento linear. Neste caso é
necessário utilizar sistemas cartográficos para o suporte à localização métrica, o que,
contribui para uma perda de precisão da localização geográfica.

A segunda particularidade está directamente relacionada com a gestão, manutenção e


comunicação de sistemas de referenciamento linear. Para uma rota ser elaborada, é
necessário definir um ponto de início, um percurso, e um ponto de fim. Cada um destes não
é necessariamente fixo, podendo ser alterado devido a diversos factores. Esta alteração não
demonstra problemas para a entidade que fez a alteração, mas todas as outras entidades
que também têm uma representação própria da rota em questão, têm que ser avisadas das
alterações feitas para continuarem com uma representação fidedigna.

Esta particularidade acaba por ser um problema de gestão, porque todas as entidades que
não são gestoras directas das rotas em questão, mas que estejam directamente
relacionadas com estas, têm que, de alguma forma, ou por iniciativa própria ou por acordo
formal, ser informadas das alterações que vão sendo feitas às mesmas.

A utilização de SIG para o transporte, também denominado por GIS-T (GIS for
Transportation), já remonta há algumas décadas. A gestão da rede física e de rotas de uma
rede rodoviária são tarefas fundamentais para a manutenção da representação digital da
rede. Sem estas, a representação da rede tende, com o passar do tempo, a divergir da
realidade. Esta dissertação enquadra-se principalmente sobre a gestão de eventos dentro de
uma rede rodoviária, especificamente nas auto-estradas, sendo que, por essa razão,
necessita de se alavancar sobre uma representação da rede que seja a mais fidedigna
possível.

23
2.5 Análise Gap e Abordagem

A qualidade de transporte é inerente ao desenvolvimento económico. A globalização dos


mercados, combinada com o crescimento quase exponencial das economias asiáticas está a
provocar um alinhamento dos corredores de transporte Europeus com a Ásia. O meio de
transporte mais favorável tende a ser o rodoviário, algo que na actualidade já se verifica,
com 45% da totalidade de bens transportados por este meio em 2006.

Procurando sobreviver dentro deste ambiente complexo, a indústria de transporte tem vindo
a transformar o seu modelo de negócio, de um baseado na gestão do armazenamento e
encaminhamento de mercadorias para um composto por complexas cadeias intermodais,
controladas por tecnologias de informação altamente especializadas no negócio.
Paralelamente, o desenvolvimento de ITS tem tido especial interesse e investimento. De
entre as várias vantagens proporcionadas pelos ITS, a mitigação dos congestionamentos é
considerada como a mais importante para o sector de transporte rodoviário de mercadorias.

O alicerce de qualquer ITS são os dados que este possui. Quanto mais fiáveis, actuais,
relevantes e completos forem, mais potencial terão de conferir uma capacidade de
visualização do estado actual das vias rodoviárias, permitindo assim uma melhor avaliação
das necessidades em curso, assim como as operações que deverão ser postas em prática
para adereçar essas necessidades. Foram desenvolvidas várias metodologias para a
recolha de dados de tráfego, sendo a FCD (Floating Car Data) a mais promissora e com
melhor relação custo-benefício, constituindo-se como o estado de arte de recolha de dados
de tráfego.

No entanto, esta metodologia apresenta certas desvantagens, por um lado pela potencial
propensão à intrusão na privacidade dos utentes, por outro pela falta de identificação das
causas que provocam os congestionamentos, dificultando assim uma correcta avaliação de
situação, assim como a estimação da sua eventual duração. Procura-se, por isso, uma
metodologia que se baseie no estado de arte identificado, mas que seja capaz de trazer
valor acrescentado pela mitigação dos problemas identificados.

O foco deste enquadramento permite reflectir sobre o impacto que os congestionamentos


têm sobre o transporte rodoviário de mercadorias, quais as metodologias actualmente
implementadas para a sua mitigação, e quais os principais problemas dessas metodologias.
Surge assim o interesse de procurar estudar uma metodologia que permita uma recolha de
dados sem recorrer a nenhuma infra-estrutura de sensores, capaz de descrever situações de

24
congestionamento e suas causas, de tal forma que permita uma avaliação de situação, do
impacto que esta irá provocar nas vias, e da duração que a mesma deverá ter.

Para escolher qual o caminho mais adequado a tomar, decidiu-se fazer uma comparação
entre as vantagens e desvantagens dos dois principais métodos existentes para a recolha de
dados de tráfego, respectivamente a utilização de sensores fixos nas vias rodoviárias, e a
nova emergente metodologia FCD.

Com base na fig. 7 pode-se determinar que existe uma complementação entre as duas
metodologias, na qual a primeira permite acesso a informação muito rica sobre o trânsito
rodoviário, mas circunscrita a extensões de via curtas – devido aos custos de instalação e
manutenção -, em contrapartida para com a segunda, que permite uma extensão de
monitorização praticamente total, apenas limitada por zonas que não tenham cobertura de
rede para telemóveis, mas que disponibiliza apenas a localização e translação de veículos,
sendo assim uma fonte de informação muito específica.

Esta comparação permite fazer uma pequena análise Gap entre as tecnologias existentes e
a tecnologia/metodologia que se procura. Em suma, procura-se uma metodologia de recolha
de dados que permita abranger uma vasta área geográfica sem comprometer a qualidade e
completude dos dados, isto é, uma fusão entre os sensores fixos e o método FCD.

VANTAGENS DESVANTAGENS

Custos elevados para instalar e manter os


Elevada qualidade e precisão de dados
sensores
Tecnologias maduras
Área de actuação limitada (normalmente
Sensores Fixos Cálculo preciso de fluxo e velocidade
a auto-estradas, IPs e Ics)
de tráfego
Qualidade de dados pode ser afectada
Não existe erro de localização
por condições meteorológicas adversas

Processamento sofisticado
Área de actuação muito abrangente
Tecnologia pouco madura e estudada
Custos de implementação baixos
Questões de privacidade
comparativamente com os sensores
FCD Incapacidade de detectar causas de
fixos
congestionamentos
Não afectado por condições
Informação pouco rica (contém apenas a
meteorológicas
localização e translação)

Figura 7 - Comparação das vantagens e desvantagens dos dois principais métodos


utilizados para a recolha de dados de tráfego rodoviário

25
É aqui que a abordagem escolhida surge e o foco da restante dissertação toma forma. De
acordo com a EUROSTAT em [1], o número de veículos de transporte rodoviário de
mercadorias nos estados membros, em 2006, rondava os 32.000 veículos. Isto corresponde,
em média, a 1200 veículos por país. Necessariamente alguns países terão mais veículos do
que outros, principalmente os mais desenvolvidos.

No caso de Portugal, só a Luís Simões possui mais de 1200 veículos de transporte. É


verdade que é uma das transportadoras de maior dimensão na Península Ibérica, não
obstante não é a única. Ora se há tantos veículos transportadores nas vias rodoviárias, e se
o sistema em estudo está direccionado para o sector do transporte rodoviário de
mercadorias, considerar os próprios condutores dos veículos das transportadoras como as
fontes de dados apresenta-se como uma abordagem interessante.

Semelhantemente para com o Floating Car Data (FCD), os veículos assumem o papel de
sensores móveis que vão reportando o estado de tráfego à medida que navegam através
das vias. A diferença principal para com o método FCD é que neste caso, em vez de haver
uma recolha constante da posição, velocidade e direcção de cada veículo, cada condutor é
responsável por preencher um pequeno relatório modelo sobre a ocorrência com que se
depara no local, recorrendo a uma pequena aplicação, instalável sobre um aparelho móvel,
como um smartphone, palmtop ou outro semelhante, desde que este tenha suporte GPS e
comunicação GPRS. Esta abordagem contém três vantagens principais:

(1) A primeira é que as grandes transportadoras não têm que se alavancar completamente
em dados fornecidos por terceiros, o que pode ser considerado como vantajoso
estrategicamente e economicamente;

(2) A segunda é que, tendo em conta que a maior parte dos bens transportados são entre
grandes pólos económicos, é razoável assumir que a maioria dos veículos deverão seguir
pelas mesmas rotas, comummente chamadas de corredores. Logo, basta um veículo
detectar uma condição anormal de tráfego para poder avisar todos os outros que se
encontrem na mesma rota. Em retrospectiva temos o melhor de dois mundos, não só torna
as transportadoras menos dependentes de dados de terceiros, mas também não restringe a
informação rodoviária a apenas trechos que estejam capacitados com sensores de tráfego;

(3) A terceira vantagem consiste na mitigação dos problemas identificados no método FCD.
Neste caso não existe a intrusão na privacidade de terceiros. Em vez de haver informação
sobre a posição, direcção e velocidade de veículos, existem relatórios pontuais, descritivos
do estado actual da situação, assim como das suas causas, se estas forem passíveis de

26
serem observadas pelo condutor. O facto de os condutores contribuírem com informação
sobre o estado de situação constitui uma mais-valia para uma melhor avaliação da situação.

Há uma restante multitude de outras fontes de dados possíveis, desde, de um lado do


espectro, as operadoras de vias concessionadas, tipicamente possuidoras de informação em
tempo real, até ao simples cidadão, que proactivamente decide reportar uma ocorrência de
tráfego. Pelo meio existem ainda as forças de segurança pública, autarquias locais, estações
de rádio, a internet, entre muitas outras.

De entre estas fontes todas, consideram-se duas metodologias de notificação de


ocorrências: a primeira, relacionada com sistemas informáticos preparados para o efeito,
consiste no envio periódico de todas as situações identificadas em determinado momento; a
segunda, relacionada com fontes humanas, consiste no envio pontual de uma notificação
sobre um evento específico, que o emissor está a observar, no momento.

Considerando primeiro as fontes de dados automatizadas, segundo um estudo feito por


Alan Raines e Philip Rowley sobre a evolução da comunicação de tráfego rodoviário na
Europa [19], apenas recentemente se tem verificado um esforço para a elaboração de
especificações que permitam uma partilha transparente de dados sobre condições de tráfego
rodoviário. Esta verificação sugere que a adopção de um formato comum ainda não foi
completamente alcançada, apesar de já se começar a notar uma tentativa de alinhamento.
Isto leva a considerar duas coisas:

(1) A primeira é que, tendo em conta que não existe um formato comum mas que existe uma
iniciativa para a sua adopção, o formato escolhido deve basear-se no formato que se
procura adoptar, mas convém ser uma versão simplificada, para facilitar a integração de um
maior número de fontes de dados que estão a tentar implementar esse dito formato comum
mas que ainda não o conseguiram na totalidade;

(2) A segunda é que se não existe uma integração transparente de dados, dados
comunicados de duas fontes diferentes não são passíveis de integrar facilmente – não existe
nenhum identificador comum que possa relacionar duas notificações, referentes a uma
mesma ocorrência, mas por fontes diferentes. O sistema terá que lidar com esta falta de
informação e possuir um mecanismo de fusão de dados provindos de múltiplas fontes.

Considerando as fontes de dados humanas, pode-se, neste caso, aplicar a mesma


metodologia utilizada para os condutores dos veículos das transportadoras. Se um utilizador
quiser contribuir com informação para o sistema, basta possuir o mesmo hardware portátil

27
que no casos dos condutores, e obter o aplicativo para comunicação de dados, podendo
este estar disponibilizado online, por exemplo.

Pelas razões identificadas, o foco desta dissertação assenta na definição de um modelo de


dados para a notificação de ocorrências de tráfego que seja uma versão simplificada de um
norma de referência internacional para o efeito, e na elaboração de uma metodologia para a
fusão e análise de dados de tráfego fornecidos por diversas fontes, com o objectivo de obter
uma integração de dados capaz de fornecer uma mais-valia informativa aos operadores do
sector do transporte rodoviário de mercadorias.

28
3 Trabalho Relacionado

Esta subsecção apresenta de forma sumária alguns trabalhos relacionados, escolhidos


como os mais relevantes e correlacionados com a investigação. O objectivo desta secção
consiste em fazer de ponte entre o enquadramento e abordagem escolhida com a solução
proposta, apresentada na secção seguinte. O trabalho relacionado é apresentado em duas
secções distintas, sendo a primeira dedicada a sistemas de informação de trânsito, e a
segunda dedicada a metodologias de previsão de duração de ocorrências de trânsito.

3.1 Sistemas de Informação de Trânsito

Nesta subsecção apresenta-se os sistemas de informação de trânsito escolhidos como mais


relevantes para esta investigação, na medida em que ilustram diferentes objectivos,
estratégias e abordagens para a monitorização e melhoramento da mobilidade nas vias
rodoviárias, e apresentam também diferentes soluções, para problemas que lhes são
comuns.

3.1.1 Sistema eMOTION

O primeiro trabalho relacionado, considerado aqui como o mais importante e de maior


dimensão e impacto no transporte Europeu, é o projecto eMOTION [20], que procura
investigar, especificar e desenvolver sistemas de informação de transporte intermodal ao
nível da União Europeia. O projecto deu início em 2006 e durou dois anos, tendo como
resultado duas provas de conceito, uma em Viena (Áustria) e outra em Génova (Itália), e um
conjunto de documentos elaborados para o suporte à investigação, que abrangem desde a
especificação dos requisitos do projecto, até à especificação técnica do resultante sistema.

29
3.1.2 Sistema de Avaliação de Trânsito e de Apoio à Decisão em
Tempo Real

Em [21] é introduzido um sistema de avaliação e de suporte à decisão em tempo real para a


gestão de ocorrências de tráfego. O sistema é capaz de detectar acidentes de tráfego, de
estimar o impacto desses acidentes, de formular e seleccionar cenários de resposta e de
monitorizar e avaliar a aplicação desses cenários. O sistema é composto por três módulos:

ℵ Pré-processamento: responsável pela filtragem de dados, fusão de dados, e


detecção de ocorrências.

ℵ Apoio à Decisão: Utiliza redes neuronais e processos de Data Mining para elaborar
cenários com base nos dados em tempo real. Os cenários são utilizados como
suporte para o apoio à decisão.

ℵ Monitorização de Tráfego: Responsável por implementar os cenários, correlacioná-


los com os dados de tráfego seguintes, e efectuar uma análise “causa-efeito” dos
cenários implementados.

A arquitectura do sistema é ilustrada na fig.8. Cada um dos módulos é composto por um


conjunto de componentes, que processam e comunicam dados de trânsito semelhantemente
a uma linha de montagem, deste a triagem, fusão e detecção de ocorrências de trânsito,
passando pela análise das ocorrências e correlação com dados históricos, até elaboração,
aplicação e monitorização de cenários de resposta aos acontecimentos.

A característica mais interessante desta arquitectura é a estruturação dos componentes de


forma a formar um ciclo de feedback. Para qualquer cenário de resposta que seja
implementado para um conjunto de notificações de ocorrência, é feita uma avaliação “antes
e depois”, que identifica os resultados obtidos pelo cenário escolhido, tendo em conta o
contexto da situação. O objectivo deste feedback centra-se no melhoramento do processo
de recolha de dados históricos e de data mining.

Esta arquitectura apresenta um não tão comum exemplo de um sistema que responde a
acontecimentos com base em um conhecimento histórico mutável, ao contrário da maioria
dos sistemas, que recorrem a uma base de conhecimento estanque para tomar as suas
decisões, sem nunca proceder a um melhoramento do conhecimento pela aprendizagem
adquirida da prática aplicada.

30
Figura 8 – Descrição da arquitectura do sistema de apoio à decisão. Fonte [21]

3.1.3 Publicação de Informação de Trânsito baseado em SIG-T

Em [22] é apresentado um sistema de publicação de informação de trânsito, em tempo real,


baseado em sistemas de informação geográfica para o transporte (SIG-T). O sistema utiliza
dados de trânsito transmitidos por dois tipos de fontes distintas: a primeira fonte consiste de
diversos sensores instalados nas vias rodoviárias, como laços de indução, sensores
piezoeléctricos e câmaras de vídeo, os quais enviam um fluxo de dados constante sobre
aquilo que estão programados para detectar, como número médio de veículos a passar no
momento, velocidade média de veículos, entre outros dados.

O segundo tipo de fontes de dados consiste de entidades de protecção civil, como a polícia
rodoviária, viaturas de emergência médica e viaturas de bombeiros. Estes utilizam algum
protocolo de transmissão de dados, não identificado no documento, para o suporte à
comunicação de informação de trânsito. A arquitectura do sistema é apresentada na fig. 9.

31
Figura 9 – Descrição da arquitectura do sistema SIG-T. Fonte [22]

O sistema recorre de seguida a um processo de segmentação dinâmica para localizar os


dados de tráfego e para, com base nos dados embutidos na segmentação dinâmica das
vias, como velocidade média de via, impedância, número de faixas, congestionamento
médio, entre outros, determinar a extensão dos congestionamentos identificados.

3.1.4 Desenho e Implementação de Sistema de Gestão de Emergências


de Acidentes de Trânsito

Em [23] é apresentado um sistema de gestão de emergências de acidentes de trânsito. O


objectivo deste sistema consiste em reduzir a duração e impacto de acidentes de trânsito,
assim como de aumentar a segurança de condutores, vítimas de acidentes, e condutores de
ambulâncias. Ademais, procura contribuir para a eficiência, segurança e mobilidade das vias
rodoviárias.

O sistema está dividido em quatro secções, possíveis de identificar na fig. 10. A primeira
consiste de uma plataforma de comunicação com diversos sensores instalados nas vias,

32
tendo como propósito comunicar com os sensores, e converter os dados transmitidos por
estes para uma linguagem comum ao sistema.

A segunda secção consiste de uma plataforma de gestão e análise de eventos, a qual


georeferencia e agrupa estes eventos, para assim determinar o impacto que estão a ter nas
vias, e a possível severidade das ocorrências. Com base nesta informação produzida, a
plataforma comunica com a terceira secção do sistema, que consiste de duas bases de
dados, uma com informação reguladora sobre planos e eventos, e outra que contém planos
de acção.

Esta terceira secção, que contém as duas bases de dados, serve de base de apoio para a
elaboração de planos de resposta às ocorrências em curso. A plataforma de gestão de
eventos utiliza a informação reguladora para determinar que possíveis planos devem ser
seleccionados tendo em conta os eventos em questão. Depois de os melhores planos serem
seleccionados, estes são comunicados à sala de controlo, a qual constitui a quarta secção
do sistema.

Figura 10 – Descrição da arquitectura do sistema de gestão de emergências. Fonte


[23]

Na sala de controlo encontram-se os operadores de trânsito, que, com base na informação


agrupada pelo sistema, e nos planos de acção apresentados, escolhem o plano que

33
consideram mais adequado para o problema em questão, coordenando de seguida o
desenrolar do plano.

O sistema incorpora ainda um mecanismo de feedback, que recebe como input as


performances de execução do plano, as quais serão posteriormente guardadas dentro da
base de dados reguladora, para alavancar um melhoramento progressivo da escolha dos
melhores planos para diferentes tipos de situações.

3.2 Metodologias de Previsão de Duração de Ocorrências

Nesta subsecção apresenta-se as principais metodologias utilizadas para a determinação da


duração de ocorrências em auto-estradas. Como heurística de selecção de trabalhos, foram
escolhidos os trabalhos datados como mais recentes e que apresentassem um número
acima da média de citações na comunidade científica. Contudo denota-se que o número de
artigos científicos relacionados com esta área de investigação é reduzido. Por reduzido
entenda-se como menos de 15 artigos científicos encontrados.

Sublinha-se porém, que o número de artigos encontrados está directamente relacionado


com os termos de pesquisa aplicados. Neste caso, as pesquisas efectuadas tiveram como
termos de pesquisa diversas combinações das palavras “highway”, “roadway”, “motorway”,
“congestion”, “impact”, “duration”, “estimation” e “prediction”.

3.2.1 Estimação Automática de Duração de Ocorrências nas Auto-


Estradas Holandesas

A metodologia apresentada em [24], implementada na Holanda por motivos prementes de


redução de congestionamentos rodoviários, procura determinar a duração de ocorrências
nas auto-estradas utilizando uma metodologia de catalogação de ocorrências e uma base de
dados históricos sobre ocorrências e suas durações. O sistema compara as ocorrências em
curso com as ocorrências guardadas no histórico, determina quais destas são mais
semelhantes, e com base nas suas durações registadas, estima a duração das ocorrências
em curso.

34
A base de dados históricos foi construída recorrendo a uma compilação fornecida pela
Rijkswaterstaat – agência nacional holandesa de transporte. Estes dados, utilizados
anteriormente apenas como consulta de ocorrências de trânsito, serviram de base de
conhecimento para o sistema desenvolvido, alavancando a possibilidade de efectuar
pesquisas e comparações com ocorrências em curso, para assim determinar a duração das
mesmas.

O estudo refere que a metodologia de pesquisa utilizada consiste na elaboração de árvores


de decisão com base nas características das ocorrências. A fig. 11 apresenta as categorias
dos nós das árvores de decisão, e a fig. 12 apresenta a construção de uma das árvores de
decisão utilizadas.

Aplicando uma árvore de decisão às ocorrências em curso, a estimação da duração é


imediata. Em vez de apresentarem uma estimativa de duração, foi escolhido apresentar um
intervalo de durações, que compreende as durações mínimas e máximas estimadas.
Ademais é apresentado um valor percentual de fiabilidade, o qual determina o número de
vezes que a estimativa apresentada se verificou como correcta, sobre o número total de
estimativas feitas para a categoria de ocorrência em questão.

Figura 11 – Listagem de parâmetros de categorização de ocorrências. Fonte [24]

35
Figura 12 – Exemplo de uma das árvores de decisão elaboradas. Fonte [24]

O sistema foi testado, na prática, durante um mês, sendo avaliados 1853 incidentes, e
comparadas as durações estimadas pelo sistema e as durações reais das ocorrências. O
sistema mostrou estar correcto em 65% dos casos.

O estudo finaliza com um resumo de um conjunto de entrevistas feitas a operadores de


trânsito, concluindo que estes achavam que se a base de dados históricos fosse de maior
dimensão, e se a categorização dos dados fosse mais refinada, a estimação da duração de
ocorrências seria mais fiável. Porém, o estudo observa que se formou uma discussão entre
os operadores, havendo alguns que achavam que a estimação humana, no local, da duração
das ocorrências, seria mais precisa e fiável que o sistema.

3.2.2 Desenvolvimento de um Modelo para a Previsão da Duração de


Acidentes nas Auto-Estradas Coreanas

O estudo apresentado em [25], introduz uma metodologia de previsão de duração de


ocorrências, que utiliza como referência uma base de dados históricos sobre durações de
ocorrências, compilada durante 2 anos pela observação das auto-estradas Coreanas. Com
base nos dados históricos, foi desenvolvida uma função que mapeia a severidade de
ocorrências com a sua duração - ver fig. 13. Denominada de distribuição “log-logística”, é
comummente utilizada em uma ramo da análise estatística apelidado de análise de
sobrevivência, o qual procura estudar a duração de diversos tipos de sistemas, desde os
biológicos, até aos mecânicos.

Esta função foi construída com base no mapeamento de um conjunto de características de


ocorrências, e os seus respectivos coeficientes de severidade, apresentado na fig. 14. Com

36
base na identificação das características de uma dada ocorrência, os respectivos
coeficientes são consultados na tabela, e passados como parâmetro à função logística, a
qual retorna a duração estimada para a ocorrência.

Figura 13 – Gráfico da função “log-logística” aplicada. Fonte [25]

Figura 14 - Tabela com o mapeamento entre características de ocorrência e seus


respectivos coeficientes de severidade. Fonte [25]

O estudo reporta uma percentagem de sucesso de 47%, explicando que apesar de parecer
reduzida, o valor é promissor dada a inevitável variabilidade dos tempos de execução das
forças responsáveis por responder a estes tipos de eventos – forças policiais, médicas,
bombeiros, entre outros -, os quais contribuem directamente para a duração das ocorrências.

37
3.2.3 Previsão de Duração de Ocorrências utilizando Redes Neuronais

Em [26] é apresentada uma metodologia sobre a utilização de redes neuronais para a


estimação de duração de ocorrências. São utilizadas duas redes neuronais distintas, uma
que é aplicada apenas para ocorrências que acabaram de acontecer, e outra que é
periodicamente aplicada às ocorrências à medida que estas evoluem no tempo, até à sua
eventual resolução – ver fig. 15.

Ambas as redes neuronais são treinadas relativamente a uma base de dados histórica. Cada
registo histórico compreende o tipo de incidente, o número de veículos envolvidos, a
velocidade média dos restantes veículos durante a ocorrência, detectada por sensores
instalados nas vias, as distâncias da ocorrência para os dois sensores mais próximos,
respectivamente para a frente e para trás da ocorrência, e a localização da ocorrência.

Figura 15 – Fluxograma geral do sistema para a estimação da duração de uma


ocorrência. Fonte [26]

38
O modelo foi testado em uma auto-estrada durante 6 meses, período onde decorreram 24
incidentes, sendo as suas durações cronometradas e o modelo aplicado. Este estudo
revelou que o modelo apresenta uma taxa de sucesso médio de 40%.

3.2.4 Modelação e Análise Empírica da Duração de Ocorrências em


Auto-Estradas

Em [27] é apresentada uma metodologia para a análise de duração de ocorrências em auto-


estradas, que utiliza um método empírico para a elaboração de árvores de decisão para a
previsão de duração de ocorrências. Na fig.16 é apresentada uma das árvores de decisão
elaboradas, específica para a previsão de ocorrências do tipo CPI (Collision – Personal
Injury: colisões que resultaram em feridos). O método apresentado utiliza inicialmente um
conjunto de árvores de classificação e regressão, construídas pelo método CART
(Classification and Regression Trees), para a criação de um modelo preliminar de
classificação de duração de ocorrências, o qual, depois de testado, dá suporte ao método de
construção empírico.

Figura 16 – Árvore de decisão resultante do estudo empírico. Fonte [27]

39
Segundo o estudo, as árvores preliminares demonstraram ser eficazes para ocorrências de
curta duração, não se verificando o mesmo com ocorrências de maior duração (acima de
uma hora). O estudo continua afirmando que a propriedade mais diferenciadora na duração
de uma ocorrência é a sua natureza. Por essa razão, na elaboração empírica dos modelos, a
natureza da ocorrência foi utilizada como primeiro factor diferenciador, e elemento de
escolha de qual árvore de decisão aplicar.

Seguindo o mesmo principio, a segunda propriedade diferenciadora foi a região (county)


onde a ocorrência se encontra e no terceiro o número de faixas obstruídas. Os restantes
níveis são referentes ao tipo e número de viaturas utilizadas.

As árvores de classificação preliminar foram elaboradas com base em dados recolhidos


entre 2003 e 2005, providenciados pela Administração de Auto-Estadas do Estado de
Maryland, sendo o modelo final, desenvolvido com base na análise empírica, aplicado em
2006. O estudo apresenta uma taxa de sucesso de 80%.

3.3 Discussão do Trabalho Relacionado

Têm vindo a ser desenvolvidas várias metodologias para determinar a duração de


ocorrências em auto-estradas. Destas, foi escolhido um conjunto reduzido de trabalhos,
representativo das principais abordagens ao problema de determinação de duração de
ocorrências em auto-estradas.

Uma análise transversal do trabalho relacionado permite identificar os seguintes principais


métodos utilizados: (1) Análise Estatística e Distribuições [25][28]; (2) Modelos
Probabilísticos [29]; (3) Redes Neuronais [26]; (4) Sequências Temporais [30]; (5) Árvores de
Decisão [24][27][31]. Apresenta-se de seguida uma revisão crítica aos métodos
apresentados que visa paralelamente relacioná-los com o trabalho de tese.

Todos os trabalhos estudados reportaram a utilização de algoritmos e heurísticas que


necessitam de algum tipo de treino prévio, tipicamente com base em compilações históricas
de ocorrências de trânsito. Em conjunto, estes trabalhos apontam que é sempre necessária
uma base de conhecimento o mais rica possível, para assim dar melhor suporte ao sistema
no seu processo de cálculo de duração de ocorrências.

40
Apesar de haver alguma divergência relativamente aos dados considerados como relevantes
para o processo de decisão, a maioria dos estudos considera o tipo de ocorrência, tipo de
veículos envolvidos e número de fatalidades, como os dados mais importantes a contemplar
no processo de estimação de duração de ocorrências. Nem todos porém consideraram a
localização espacial e localização temporal - dia da semana/sazonalidade - como
importantes para o processo de decisão. A fiabilidade das fontes de informação também foi
descartada pela maioria.

Mais importante ainda, nenhum estudo incorporou no seu processo de decisão a densidade
de trânsito aquando de uma ocorrência, as condições meteorológicas na altura, assim como
o desfasamento temporal que necessariamente existe, entre o momento em que uma
ocorrência acontece e o momento em que esta chega ao sistema.

O estudo apresentado em [27], onde é aplicada uma abordagem empírica na elaboração de


árvores de decisão para a determinação da duração de ocorrências, é argumentado que as
metodologias utilizadas para a previsão destas não são satisfatórias se não forem
adaptadas, neste caso manualmente, a cada local específico em que são utilizadas.

Os restantes trabalhos suportam este argumento de uma forma indirecta, dado que a
abordagem de ajuste manual é aquele que apresenta a taxa de sucesso mais elevada na
determinação de duração de ocorrências, com 80% de sucesso, 15% acima do estudo com
segunda maior taxa de sucesso, apresentado em [24]. Esta verificação reafirma a
necessidade de haver algum tipo de adaptação dos métodos ao contexto em que estão
inseridos.

Também é de relevo notar que ambos os estudos com maior sucesso utilizam árvores de
decisão para determinar a duração de ocorrências, enquanto os restantes, apresentam uma
taxa de sucesso média de 40%. Podemos assim argumentar que a metodologia que se
apresentou como mais adequada para o problema em questão foi a que utiliza árvores de
decisão, com um sucesso ainda maior quando enquadrada com informação de contexto.

Retomando o princípio seguido pela maioria dos estudos, que afirma que quanto mais rica
for a base de conhecimento, e mais completos forem as descrições sobre as ocorrências,
mais facilitada e provável se torna a determinação correcta da duração destas, o facto de as
metodologias apresentadas se focarem apenas na situação em sí (tipo de ocorrência,
número de veículos e número de pessoas acidentadas) é notável, dado que se acabam por
contrariar relativamente ao princípio seguido – a informação de contexto foi completamente
(ou quase) negligenciada.

41
A incorporação de informação que contextualiza a ocorrência – altura do dia (manhã, tarde,
noite, hora de ponta, etc.) dia da semana, sazonalidade, localização, congestionamento
actual, congestionamento esperado, condições meteorológicas, fontes de informação,
número de fontes e fiabilidade, assim como o desfasamento temporal de notificações
relativamente a ocorrências – é praticamente omissa em todos os trabalhos estudados.

Sem informação de contexto, ocorrências semelhantes em natureza, número de veículos


envolvidos e número de feridos, tornam-se assim virtualmente indistinguíveis, enquanto o
contexto em que estão inseridas pode variar drasticamente, levando a durações de
ocorrência diferentes. Informação de contexto apresenta-se então como fundamental para o
processo de decisão.

Nestes termos, o processo de definir um método de previsão de ocorrências segue os


seguintes passos:

ℵ Definir um modelo que descreve ocorrências de trânsito, contendo a informação


considerada como mais relevante para o processo de estimação. Este modelo não
se deve circunscrever às ocorrências em sí, mas deve também contemplar o
contexto em que estas se inserem.

ℵ Definir a estrutura conceptual da base de conhecimento. A base de conhecimento


deve permitir o registo de ocorrências mas deve também conter meta-informação
sobre estes registos, como, por exemplo, correlações entre dados, análise de
fiabilidade de fontes de dados, tendências sazonais, locais mais propensos a
ocorrências, entre muitos outros possíveis.

ℵ Definir que fontes é que irão fornecer informação para o sistema. As fontes
escolhidas podem influenciar directamente o processo de decisão. Se apenas forem
consideradas fontes com fiabilidade elevada, torna-se mais provável haver um
número reduzido de fontes, correndo-se assim o risco de não ter cobertura total das
auto-estradas em consideração. Em contrapartida, se se considerarem apenas
fontes de fiabilidade baixa, sendo o melhor exemplo os utentes das vias, promove-se
a possibilidade de haver informação incorrecta. A utilização de todo o espectro de
fontes de dados é considerada como a mais informativa devido à cobertura e
dimensão de dados que proporciona, mas requer um tratamento de dados evoluído,
com foque especial no correlacionamento entre fiabilidade, dados e fontes.

42
ℵ Definir a metodologia de alimentação da base de conhecimento: deve esta ser
construída previamente e ficar estanque durante a sua utilização, ou deve ser
progressivamente aumentada e melhorada. Todos os estudos analisados utilizam
uma base de conhecimento estanque, descartando a hipótese de nas sucessivas
consultas à base de conhecimento para determinar durações de ocorrências, ir
melhorando a mesma, pelo registo das performances entre os valores estimados e
as durações observados no campo.

ℵ Definir uma metodologia que permita a fusão de dados referentes a uma mesma
ocorrência. É fundamental saber relacionar dados provindos de diferentes fontes
mas que sejam referentes a uma mesma ocorrência. O relacionamento de dados de
diferentes fontes pode levar a informação mais completa e precisa relativamente ao
acontecimento descrito.

ℵ Definir uma metodologia de análise de duração de ocorrências. Esta deve utilizar a


base de conhecimento formada, deve promover a sua afinação por um processo de
feedback das previsões feitas para as notificações de ocorrências enviadas, e deve
contemplar toda a informação na notificação, inclusive informação de contexto,
fundamental para a distinção entre ocorrências de natureza e severidade
semelhantes.

3.4 Outras Referências e Locais de Consulta

Uma exímia referencia para a consulta de trabalho relacionado é o Centro de Conhecimento


e de Investigação de Transporte (Transport Research Knowledge Center). No website desta
organização é possível consultar as grandes frentes e principais grupos de investigação, ao
nível Europeu, sobre o tema do transporte. Disponível em “http://www.transport-
research.info”. Destes destaca-se:

ℵ Centro Europeu de Investigação de Transporte, com publicações sobre o tema


disponíveis em “http://ec.europa.eu/research/transport/more_info/publications_en.cfm”.

43
ℵ A Associação Europeia de Operadores Profissionais de Infra-Estruturas de Portagens
Rodoviárias (ASECAP), com diversas publicações relativas a questões de mobilidade e
transporte em auto-estradas disponíveis em “http://www.asecap.com/english”.

ℵ O Departamento de Transporte do Reino Unido, responsável pela investigação de


sistemas de transporte que se coadunem com a economia, o ambiente e a sociedade, e
com diversas publicações sobre o tema disponíveis para consulta em
“http://www.dft.gov.uk”.

ℵ O Instituto Holandês para a Análise de Políticas de Transporte (KiM), responsável pela


elaboração de estudos e análises de políticas de transporte a médio e longo prazo, com
diversas publicações disponíveis em “http://www.verkeerenwaterstaat.nl/english”.

44
4 Solução Proposta

Na secção de Enquadramento foi feita uma pequena viagem pelo mundo do transporte. Foi
atribuído especial foco ao transporte rodoviário de mercadorias, dado que este é o “target”
principal da dissertação. Verificou-se que os congestionamentos são um dos maiores
problemas do sector, contribuindo para, entre outras factores, tempos de entrega pouco
fiáveis, velocidades médias baixas, custos de transporte e de logística acrescidos, e uma
resultante insatisfação transversal a todo os intervenientes no negócio.

Este facto levou ao estudo dos principais métodos utilizados para a mitigação de
congestionamentos, dos quais, destacaram-se os ITS. Verificou-se que existem ITS
distintos, cada um específico para adereçar um conjunto de necessidades. Um
aprofundamento dos ITS permitiu determinar que a fundamental necessidade para estes
funcionarem é terem acesso a dados actualizados sobre condições de tráfego rodoviário.

Fez-se um estudo dos principais métodos utilizados para recolher dados de tráfego e
conclui-se que existem duas técnicas principais:

(1) A primeira, pela instalação de vários tipos de sensores ao longo das vias – a qual revelou
ser dispendiosa de manter e pouco abrangente, principalmente devido ao actual crescimento
acentuado das extensão das vias rodoviárias;

(2) A segunda denominada de Floating Car Data, que recorre a GPS ou a telemóveis para
determinar a localização, direcção e velocidade de veículos, podendo assim detectar
situações de congestionamentos caso se verifique um acumular desproporcional de veículos
ao longo de uma dada extensão de via – o qual também revelou algumas limitações,
principalmente na indeterminação das causas dos congestionamentos, reduzindo-se a
apenas uma detecção de congestionamentos em vez de uma análise das suas causas,
eliminando por completo qualquer correlação entre acontecimentos e suas consequências,
assim como a sua catalogação histórica.

Esta conclusão posiciona-se directamente sobre o foco desta dissertação. Tendo em conta
as limitações dos dois tipos de métodos identificados, propõe-se uma outra abordagem que
procura conjugar as virtudes de ambos, e combater as suas fraquezas individuais. Esta
abordagem incide sobre:

45
(1) O desenho de um modelo de dados para o registo de ocorrências de tráfego que seja
utilizável por um leque de tipos de utilizadores o mais abrangente possível;

(2) A elaboração de metodologias de fusão e análise de dados, que permitam, em conjunto,


retirar nova informação do conjunto de dados transmitidos pelas diversas fontes, com o
objectivo de fornecer uma mais-valia operacional ao sector de transporte rodoviário de
mercadorias.

Na secção do trabalho relacionado, foi feita uma análise crítica a um conjunto de estudos
criteriosamente escolhidos, a qual visou identificar as mais-valias e problemas das soluções
existentes, com o objectivo de suportar e fundamentar a abordagem escolhida, assim como
a solução proposta, aprofundada nas seguintes secções.

4.1 Arquitectura

Seguindo uma abordagem “top-down”, o primeiro objecto a definir é a arquitectura do


sistema. A fig. 17 apresenta uma vista geral da arquitectura. Nesta figura, contempla-se
quatro tipos de intervenientes no sistema. Primeiro, no centro, encontra-se a unidade de
processamento central, denominada de Sistema Central de Informação Rodoviária (SCIR),
responsável por transformar dados de tráfego em informação fiável e actualizada sobre
condições de tráfego rodoviário.

À esquerda encontram-se os Emissores de Dados, as entidades que irão transmitir dados de


tráfego para o sistema. À direita encontram-se os Receptores de Informação. Por cima do
sistema central encontra-se a Unidade de Gestão ou Situation Room. Esta unidade é
constituída por um conjunto de operadores responsáveis pela monitorização do estado de
tráfego e localização dos veículos.

Recorrendo aos serviços proporcionados pelo SCIR, a unidade de gestão está apta a
analisar o estado actual de situações de tráfego reportadas, a identificar veículos que
estejam em rota com congestionamentos correntes, a visualizar vários cenários que
contemplem rotas alternativas, e a comunicar com os condutores dos veículos das
transportadoras.

Uma vista mais concreta da arquitectura é apresentada na fig. 18. Aqui denota-se que o
SCIR serve de meio de organização entre os veículos transportadores e os controladores na

46
Sala de Controlo. O SCIR é responsável por agregar dados de tráfego enviados por diversas
fontes, e por fornecer um Dashboard aos controladores, incorporado com uma alarmística,
que mantém os operadores ao corrente das operações e de situações que possam
comprometer o correcto funcionamento do negócio, como congestionamentos, por exemplo.
Para além disto o sistema é responsável por fornecer um mecanismo de comunicação de
operações, adjudicadas pelos operadores, aos condutores dos veículos transportadores.

Figura 17 – Vista geral da arquitectura. O SCIR aparece como uma unidade de


processamento que transforma dados em informação. Paralelo ao SCIR encontra-
se uma unidade de gestão responsável pela gestão da frota à qual o sistema está
associado.

Perante uma situação em que um ou mais veículos estão em rota para com um
congestionamento previamente identificado, o controlador é avisado pelo SCIR, sendo-lhe
mostrada a localização do congestionamento, o tempo previsto para o seu término e os
veículos que estão em rota. Por sua vez, o controlador pode decidir correr cenários que
contemplam uma alteração às rotas de forma a contornar o congestionamento.

Quando o controlador ficar satisfeito com uma nova rota para um dado veículo, pode decidir
pô-la em prática, seleccionando-a e adjudicando-a ao devido veículo de transporte. O
condutor do veículo em causa recebe um aviso de alteração de rota que descreve o
congestionamento identificado e a nova rota que deve ser tomada.

O SCIR é o componente central desta arquitectura. Este é responsável por: (1) reunir dados
de tráfego e de localização transmitidos pelos condutores de veículos; de efectuar análises
periódicas para determinar situações anómalas ao negócio; (2) guardar um registo histórico
sobre congestionamentos registados e como é que estes evoluíram (se houver esses dados)
para poder melhorar as suas capacidades de análise e previsão de situação; (3) de manter

47
os controladores actualizados sobre congestionamentos, localização e rotas de veículos; (4)
de gerir a comunicação entre controladores e condutores.

Figura 18 – Vista geral da arquitectura com foco na transmissão de dados de


tráfego e de operações. O SCIR assume o papel de meio de comunicação entre
fontes de dados, operadores e condutores de veículos de transporte.

A fig. 19 apresenta uma vista arquitectural, por camadas, da arquitectura interna do sistema.
O SCIR é composto por seis componentes principais. O primeiro componente é a camada de
serviços web. Este componente fornece um conjunto de serviços acessíveis via web, tanto
para os condutores dos veículos, como para os controladores na Sala de Controlo. Os
serviços são de natureza diferente para cada um dos intervenientes, mas desta maneira
garante-se que o acesso é feito sempre da mesma forma, independentemente da
localização de qualquer um destes, e da tecnologia que os implementa.

Qualquer chamada ao SCIR é tríada pelos serviços web para uma funcionalidade de negócio
correspondente. As funcionalidades referentes à comunicação de dados encontram-se todas
dentro da camada de lógica de negócio.

Esta camada é responsável por executar todos os passos relativos ao registo e consulta de
dados. Estes poderão ser a actualização das posições dos veículos, o registo de ocorrências
de tráfego, a consulta do estado de situação pelo Dashboard dos controladores e o registo e
consulta de operações a serem tomadas, como pela escolha de uma nova rota, e a sua

48
devida comunicação ao condutor do respectivo veículo. Todos os dados ficam guardados
dentro da base de dados, sendo o acesso à base de dados feito através de um ORM
1
(Object-Relational Mapping). O componente SIG é utilizado para a geocodificação inversa
das coordenadas GPS dos veículos e para cálculos de rotas óptimas tendo em conta os
dados de tráfego correntes.

Figura 19 – Arquitectura interna do SCIR.

Os componentes de fusão e de análise são um pouco diferentes dos restantes. Enquanto os


anteriores são activados mediante pedido de execução externo, estes dois componentes são
por natureza autónomos dos restantes e responsáveis por executar, periodicamente, um
conjunto de tarefas de processamento de dados.

1
Esta é a tradução que se considerou mais adequada para o processo de Reverse Geocoding. Para
mais informações sobre o processo de reverse geocoding pode-se consultar
http://wiki.gis.com/wiki/index.php/Reverse_geocoding.

49
No caso do componente de fusão, este é responsável por agrupar registos referentes a uma
mesma ocorrência. Isto deve-se ao facto de poder haver situações em que mais do que uma
fonte de dados, seja esta um veículo de transporte ou uma outra fonte terceira, comunicarem
dados relativos a uma mesma situação. O sistema deve ser capaz de detectar esta
sobreposição de dados e utilizá-la em sua vantagem. A maneira concreta como esta
sobreposição é detectada será explanada em pormenor mais à frente.

No caso do componente de análise, este é responsável por estimar o impacto e duração dos
congestionamentos registados, assim como por criar um histórico de situações registadas,
para assim efectuar análises em séries temporais de modo a melhorar as suas técnicas de
estimação de impacto e duração de congestionamentos, na medida em que o conhecimento
adquirido é utilizado no suporte a uma melhor contextualização das situações.

Antes de se proceder à estipulação do funcionamento interno de cada um destes


componentes, convém fazer uma pequena introdução às normas que foram consideradas
adequadas para o projecto. De acordo com Andrew S. Tannenbaum - “The nice thing about
standards is that there are so many to choose from” -, o que é uma observação muito verdadeira e
comporta também algum tom de ironia, mas no caso deste projecto, devemos atender a este
tópico com seriedade e dar especial atenção à escolha de normas, com foco principal sobre
a comunicação de dados, devido à verificação anterior de que os ITS têm uma inclinação
cada vez maior para a cooperação, distribuição, integração e globalização de dados e
informação. Não seguir esta tendência seria promover um isolamento do sistema.

4.2 Enquadramento com Normas de Comunicação Vigentes

Esta secção é exclusivamente dedicada ao enquadramento de um conjunto de normas


relativas à comunicação de dados. A utilização de normas vigentes para a comunicação de
dados ganha especial importância depois de verificada a cada vez mais presente integração
e globalização de Sistemas Inteligentes de Transporte. Garantir que o sistema SCIR está
alinhado com normas actuais é uma mais-valia porque alavanca, de base, uma capacidade
de comunicação com outros sistemas.

50
4.2.1 Datex2

O Datex2 representa uma versão mais evoluída do Datex, seu antecessor. A motivação para
criar esta norma resultou de um amadurecimento que se foi desenvolvendo ao longo da
utilização e implementação de sistemas de informação de tráfego. Foi efectuada uma
extensão ao modelo para incluir a comunicação com sistemas de informação de tráfego e de
viagens. O Datex2 especifica a estrutura e formatação das mensagens e dos dados a serem
transmitidos entre centros de tráfego. Em um guia para o utilizador, elaborado pela
Comissão Europeia [32] é apresentado um modelo em XSD (XML Schema Definition) que
especifica que estruturas de dados devem ser utilizadas.

Segundo um estudo sobre a evolução do Datex2, apresentado em [33], o Datex2 engloba


vários conceitos relacionados com informação rodoviária, desde acidentes de tráfego,
manutenções de via, acções de operadores de controlo e fluxo de tráfego, até condições
ambientais e condições de via.

O estudo segue informando que esta norma já atingiu um nível de maturidade tal que já está
a ser utilizada por vários estados membros. O Reino Unido já tem serviços Datex2
operacionais, e países como a Suécia, França e Holanda estão a desenvolver infra-
estruturas nacionais para dar suporte ao Datex2. Portugal também já tem o Datex2 em
utilização pela Brisa, e em implementação pelas Estradas de Portugal.

Alinhado com os objectivos da iniciativa INSPIRE, esta norma é uma referência actual para a
estruturação e transmissão de mensagens entre sistemas de controlo de tráfego. Apresenta
um modelo de dados extenso constituído por aproximadamente onze mil linhas de
especificação em XSD, no entanto simples o suficiente para ser facilmente interpretado.

Este modelo servirá de base para a elaboração das estruturas de dados necessárias para o
suporte ao modelo de dados do SCIR.O modelo resultante será uma simplificação do Datex2
dirigida aos profissionais do sector mas em conformidade com a nomenclatura de nomes,
tipos de dados e funções dos atributos especificados no Datex2.

4.2.2 WMS

O serviço Web Map Service da OGC, especificado em [34], é um serviço web destinado para
a transmissão de mapas digitais. Estes mapas consistem de imagens digitais de diversos
formatos que apresentam uma vista estática sobre um conjunto de dados geográficos. A

51
informação disponibilizada por estes mapas é tipicamente utilizada para consulta meramente
visual, não sendo possível efectuar uma análise espacial mais detalhada sobre os mesmos.

O WMS é o standard de indústria para a comunicação de mapas digitais. Este serviço é


adequado para entidades que queiram apenas visualizar as condições de tráfego e
condições meteorológicas, sem interesse em efectuar um processamento subsequente aos
dados obtidos.

4.2.3 WFS

O serviço Web Feature Service, especificado em [35], providencia uma interface que permite
a requisição de features geográficas. Ao contrário de uma imagem, uma feature contém toda
a informação sobre um elemento geográfico. Esta informação é tipicamente formatada em
XML ou GML, apesar de outros formatos como shapefiles poderem ser utilizados para a sua
codificação.

WFS é o standard de indústria para a comunicação de features geográficas. Este tipo de


serviço é de grande interesse para o SCIR porque permite a comunicação detalhada de
informação geográfica. Este serviço é especialmente adequado a entidades que queiram
efectuar um processamento adicional sobre a informação transmitida. A mesma, após
recolha, pode ser directamente integrada noutra plataforma SIG, podendo servir para
posterior análise e ou correlação com outros dados geográficos.

4.3 Modelo de Dados e Registo de Ocorrências

Nesta secção apresenta-se o modelo de dados escolhido para o registo e transmissão de


ocorrências de tráfego. A fig. 20 mostra o diagrama relacional do modelo. Foi utilizado o
modelo Datex2 como base de estudo para a construção deste modelo, sendo este o
resultado de um processo iterativo de simplificação de um subconjunto do modelo, focado na
modelação de ocorrências nas vias rodoviárias (o modelo Datex2 abrange muito mais do
que ocorrências rodoviárias; a modelação destas, constitui apenas aproximadamente 25%
do modelo). Um dos requisitos principais na elaboração do modelo foi a facilitação da sua
utilização.

52
O objectivo consiste em criar um modelo que seja utilizável tanto por serviços empresariais
automatizados,
os, que periodicamente enviam dados sobre condições de tráfego,
ego, até ao agente
da GNR no local de uma ocorrência, que, recorrendo a um simples
simp smart phone e a uma
aplicação
cação para o efeito, consegue elaborar um relatório de ocorrência em concordância com
o modelo, sendo este de seguida enviado para o sistema central.

Figura 20 – Modelo de dados para o registo de ocorrências de tráfego. O modelo


apresentado resulta de uma simplificação
simplificação de um subconjunto do modelo Datex2.

53
Por esta razão, apresenta-se um modelo muito simples comparativamente para com o
Datex2. Cada registo deve conter a identificação do emissor, a descrição da ocorrência, e as
coordenadas geográficas da sua localização. Os restantes dados relativos à localização de
uma ocorrência não são obrigatórios no acto de registo. No caso do smart phone com uma
aplicação instalada para o efeito, um utilizador poderia simplesmente descrever a situação
que quer transmitir, sendo a sua identificação e localização anexadas transparentemente,
simplificando assim o registo.

Qualquer entidade que queira transmitir ocorrências e que esteja registada no sistema pode
recorrer ao modelo para a elaboração de notificações. Dada a sua simplicidade, e tendo em
conta que o modelo é resultante de uma simplificação do modelo Datex2, a adopção do
modelo é facilitada, tanto para as entidades que não seguem nenhum protocolo assim como
para aquelas que já seguem o Datex2.

4.4 Georeferenciação de Dados

O modelo de dados apresentado na secção anterior descreve os dados que devem ser
preenchidos por um condutor ou entidade terceira para transmitir dados para o sistema. A
parte do modelo que descreve a localização do registo não é preenchida pelo condutor. Os
únicos dados que são enviados sobre a localização do veículo são as suas coordenadas
GPS.

Desta maneira, o condutor não precisa de se preocupar em registar a sua localização,


reduzindo o tempo de preenchimento do formulário, e focando o utilizador na tarefa de
descrever a situação de tráfego com que se depara. Mas consequentemente, os dados
transmitidos não são suficientes para o componente de fusão ser capaz de fazer um
agrupamento correcto dos dados.

Adicionalmente, este precisa de saber em que via cada registo se encontra, para poder
distinguir entre registos próximos, mas que se encontrem em vias diferentes. E quando o
registo se encontra localizado sobre uma auto-estrada, ainda mais dados são precisos.
Neste caso, o ponto quilométrico da ocorrência é fundamental para determinar a localização
do evento ao longo da extensão da auto-estrada.

54
Para determinar a via (e ponto quilométrico caso se trate de uma auto-estrada) é preciso
utilizar uma ferramenta SIG de geoprocessamento capaz de efectuar a geocodificação
inversa de coordenadas geográficas. Enquanto a geocodificação consiste em determinar as
coordenadas geográficas através de uma morada, a geocodificação inversa consiste em
exactamente o oposto. Este processo implica a determinação da via mais próxima
relativamente a uma coordenada geográfica.

Isto funciona bem para ruas e avenidas, mas falha em precisão quando os registos se
encontram em auto-estradas. Nestas situações, a geocodificação inversa não é suficiente. É
necessário determinar o ponto quilométrico. Porém, determinar pontos quilométricos é tarefa
difícil. Para isto ser possível, é necessária a elaboração de objectos geométricos especiais,
que resultam de um outro processo chamado segmentação dinâmica.

Os objectos produzidos pela segmentação dinâmica permitem uma computação em run-time


de rotas e de propriedades inerentes às rotas - ver fig. 21. Cada computação constitui um
processo iterativo que percorre um conjunto de segmentos previamente identificados,
efectuando cálculos de propriedades por cada iteração. Estas propriedades costumam estar
associadas a regras de condução, como direccionalidade, impedância, viragem, limites de
velocidade, distância, entre outras [36][37].

No nosso caso, utilizamos o processo de segmentação dinâmica para criar uma ferramenta
de cálculo de distâncias sobre uma rota. O objecto resultante permite-nos determinar a
distância métrica de qualquer ponto que esteja contido dentro de uma rota pré-processada.
Uma das grandes vantagens da segmentação dinâmica é a abstracção que providencia dos
objectos geométricos que é composta. Alterações à rede subjacente podem ser feitas a
qualquer momento, sendo estas imediatamente reflectidas na forma e propriedades da rota.
Isto esconde-nos a complexidade das rotas e encapsula todas as alterações às rotas a um
único lugar.

Usando estas duas ferramentas, o componente SIG é capaz de determinar as vias


respeitantes aos registos transmitidos, assim como os seus pontos quilométricos quando
localizadas em auto-estradas, simplificando consideravelmente a vida ao componente de
fusão de dados.

55
Figura 21 - Exemplo de uma rota resultante do processo de segmentação dinâmica.
A tabela do lado esquerdo determina as extensões dos segmentos, e a do lado
direito os pontos quilométricos dos eventos.

4.5 Fusão de Dados

Cada registo transmitido por uma fonte de dados contém uma descrição sobre um pequeno
fragmento da realidade que está a acontecer nas rodovias. O componente de fusão é
responsável por pegar nestes fragmentos, e tentar agrupá-los, de forma a criar uma visão
mais completa das situações e ocorrências que estão a decorrer.

Nestes termos, o objectivo deste componente consiste em descobrir relações entre os


registos transmitidos, de forma a identificar padrões que permitam inferir nova informação
sobre o estado de situação que cada um destes tenta descrever. Tendo em conta que os
dados estão em constante mudança, à medida que novos registos entram no sistema, e

56
2
antigos são removidos , o componente de fusão tem que ser executado periodicamente,
para manter os resultados de fusão o mais actualizados possível.

Por esta razão, este componente comporta um ciclo de processamento repetitivo, dentro do
qual são aplicados um conjunto de passos de tratamento de dados, que os levam desde a
sua versão original quando entram no sistema, até à sua versão final, na qual em vez de
registos existem ocorrências de tráfego, com localização, dimensão, fiabilidade e impacto
estimados. Um ciclo de processamento pode ser dividido em três passos:

(1) O primeiro consiste em agrupar registos de acordo com a sua proximidade, utilizando
para esse efeito um algoritmo de clustering hierárquico aglomerativo;

(2) O segundo passo consiste em procurar relacionar os registos agrupados pelo passo 1,
aplicando uma análise ontológica. Aqui o objectivo é identificar quais registos são referentes
às causas da ocorrência, quais são referentes às suas consequências, e quais são
referentes a possíveis agravantes;

(3) O terceiro passo consiste em estimar a fiabilidade dos dados, assim como o impacto que
a ocorrência está a ter no trânsito, naquele momento. A estimação do impacto permite uma
melhor visualização do estado de situação para os operadores na sala de controlo, mas
também será útil para o componente de análise, como poderemos ver mais à frente. Cada
um destes três passos será detalhado de seguida.

4.5.1 Agrupamento de Dados

O primeiro passo consiste em separar os registos de acordo com as vias rodoviárias a que
se referem. Tendo em conta que os registos reportados devem ter apenas as coordenadas
geográficas como informação sobre a sua localização, é necessário proceder à
geocodificação inversa de todos os registos novos no sistema, ou alternativamente de todos
os registos que ainda não foram localizados cartograficamente. Depois de todos estes terem
sido identificados relativamente à via em que se encontram – caso não seja possível terão
que ser inevitavelmente descartados –, estes são agrupados por via a que se referem.

2
Para mais informações sobre como é que os registos são removidos do sistema, consulte a secção
de análise de dados.

57
O passo seguinte consiste em agrupar os registos de acordo com a sua proximidade
geográfica. Não nos esqueçamos que o âmbito desta dissertação é referente a ocorrências
dentro de auto-estradas, IPs e ICs. Para conseguirmos determinar a localização de um
registo dentro de vias desta dimensão, é necessário utilizar o processo de segmentação
dinâmica para encontrar o ponto quilométrico do registo, tal como foi dito na secção 4.4.

Depois de obtidos os pontos quilométricos de todos os registos, podem-se identificar as


distâncias quilométricas entre os registos, e assim determinar, quais registos estão próximos
uns dos outros e quais estão distantes. Para isso é aplicado um algoritmo de clustering
hierárquico aglomerativo a cada um dos conjuntos referentes a uma via distinta.

A estratégia deste algoritmo consiste em sucessivamente agrupar os registos mais próximos,


criando, como resultado do agrupamento, um “super-registo” representativo dos registos
agrupados. No início de execução do algoritmo, cada registo consiste de um cluster
separado. Em cada iteração, os dois clusters mais próximos são agrupados. A nova
localização de cada cluster é calculada através da média dos pontos quilométricos de todos
os registos que contém.

Desta maneira, sempre que dois clusters são agrupados, é recalculada a localização média
do novo cluster, podendo-se assim proceder a um novo agrupamento dos dois clusters
seguintes mais próximos. O algoritmo termina quando só existe um cluster restante e já não
é possível fazer um agrupamento. Formalmente, um conjunto C de registos agrupados, tem
uma posição média Pc definida por:

∑ 
  ,  

Equação 1 -  representa a posição média do cluster C, e  representa a posição


do elemento i dentro do cluster C.

Outra maneira de representar o agrupamento de clusters é através de dendogramas (ver fig.


22). Cada nó folha representa um registo individual não agrupado, enquanto os restantes
nós representam clusters agrupados, sendo o nó raiz o único cluster restante depois da
última iteração do algoritmo. Um dendograma é um resultado típico de um algoritmo de
clustering hierárquico aglomerativo.

58
Depois de o dendograma ter sido criado, o passo seguinte consiste em determinar como é
que este deve ser cortado em sub-árvores, para que cada sub-árvore tenha apenas nós
geograficamente próximos, para aferir a proximidade entre nós é utilizado o desvio padrão
dos pontos quilométricos dos registos de cada cluster.

Determinou-se que nós geograficamente próximos devem possuir um desvio padrão inferior
a um limite máximo. Desta maneira, cada nó do dendograma guarda o desvio padrão de
todos nós folha da sub-árvore da qual este é raiz:

1


     
1


Equação 2 -  é o desvio padrão de todos os registos  condidos dentro do


conjunto C.

O desvio padrão tende a crescer dos nós folha até à raiz do dendograma. Com uma
pesquisa em profundidade primeiro, ao chegar a um nó com um desvio padrão abaixo de um
limite predefinido, este é considerado como raiz de uma sub-árvore com nós
geograficamente próximos, sendo toda a sub-árvore cortada do dendograma (ver fig. 23), e
os seus nós folha guardados em um novo grupo.

Figura 22 - Em a) é apresentado um dendograma resultante do algoritmo de


clustering hierárquico aglomerativo. Em b) é representado o agrupamento dos
registos na via.

59
Figura 23 - Separação do dendograma em sub-árvores com base no desvio padrão
acumulado em cada nó. Os nós a laranja em a) representam os nós raiz das sub-
árvores. Em b) são apresentados os resultados do agrupamento.

4.5.2 Separação Ontológica de Dados

Depois de identificados e agrupados os registos geograficamente próximos, segue-se para o


passo seguinte, que consiste em efectuar uma análise ontológica aos registos, de forma a
determinar aqueles que representam causas de ocorrências, os que representam as suas
consequências, e os que representam possíveis agravantes para as causas e ou para as
consequências.

A fig. 24 descreve o modelo ontológico utilizado. Neste modelo, cada situação está
associada a um conjunto de causas, a um conjunto de consequências, e a um conjunto de
agravantes. Cada uma destas classes constitui um conjunto de tipos de registo. No caso das
causas, estas podem ser ou incidentes ou actividades. As agravantes podem ser más
condições de via ou mau tempo, e as consequências podem ser todo o tipo de
congestionamentos.

Por sua vez, as agravantes podem ser a razão das causas terem acontecido, podem
contribuir para consequências mais graves, ou podem ser as próprias causas em si. As
causas contribuem para as consequências (os congestionamentos), sendo estas verificadas
mais para trás na via - daí a relação de Backpropagates. Associado a cada registo existe
também a descrição do impacto que está a provocar. De igual forma, cada registo também

60
está associado a uma data/hora de entrada no sistema, a uma duração estimada, e a uma
localização.

O objectivo deste passo consiste em aplicar o modelo ontológico a cada grupo de registos
geograficamente próximos, para tentar descobrir que registos são mais prováveis de ser
referentes a uma mesma ocorrência. Primeiro insere-se cada registo dentro da categoria a
que pertence. Depois verifica-se quais dos registos estão, em conjunto, em concordância
com o modelo.

A única regra que é aplicada aqui e que está explicita no modelo é que os
congestionamentos devem aparecer antes das causas para poderem ser associados às
mesmas. Pode-se relaxar esta regra e dizer que registos de congestionamentos podem
aparecer no mesmo local que as causas, ou directamente a seguir. Mas se for acima de uma
distância máxima (“curta”) não devem ser considerados referentes a uma mesma ocorrência.

De notar que pode haver modelos correctos nos quais só existem causas, ou agravantes ou
congestionamentos, ou qualquer outra combinação entre estas três categorias. O importante
é as causas e os congestionamentos estarem em concordância. Sendo assim, cada conjunto
de registos agrupados dentro de uma categoria constitui um grupo de observações sobre um
certo tipo de situação.

Figura 24 - Modelo ontológico que descreve como é que os diversos tipos de


registos estão relacionados entre si.

61
4.5.3 Estimação de Impacto

O passo final consiste em proporcionar uma vista integrada das ocorrências agrupadas, que
seja ilustrativa da situação, e que permita uma aferição do impacto geral que estas estão a
ter sobre tráfego. Segundo o modelo, há seis tipos gerais de grupos de registos: grupos só
com causas, só com agravantes, ou só com consequências, grupos com causas e
consequências, grupos com causas e agravantes, e grupos com agravantes e
consequências.

Cada um destes grupos é tratado de uma forma ligeiramente diferente. As agravantes são
utilizadas para conferir um melhor enquadramento a uma dada situação, podendo, em certos
casos, contribuir também para o impacto geral que a situação está a provocar na via. Por
esta razão, as agravantes não são utilizadas logo de início para a estimação de impacto,
sendo posteriormente anexas ao resultado da estimação efectuado nos restantes registos.

Para conjuntos com registos de congestionamento apenas, o objectivo é determinar a


extensão do congestionamento descrito. Assumindo que os registos comunicados tendem a
ter uma frequência maior perto do centro da extensão do congestionamento, foi considerada
uma aproximação à distribuição normal. Ademais, tendo em conta que os conjuntos deverão
ter um número reduzido de registos, a distribuição T-Student apresenta-se como uma ainda
melhor aproximação.

Baseando-nos nesta assunção, utiliza-se diferentes intervalos de confiança para obter


extensões de congestionamento diferentes. Neste caso, os intervalos de confiança são
utilizados para responder à seguinte questão: assumindo um conjunto específico de registos,
calcula o intervalo quilométrico que determina, com uma confiança de X, onde outros
registos de congestionamento relacionados irão cair. Cada intervalo de confiança determina
os limites esquerdo e direito, os quais, neste caso, representam pontos quilométricos. Assim
tem-se:


 ,   !

Equação 3 - Cálculo dos intervalos de confiança, onde A corresponde ao valor


registado na tabela T_Student que é determinado pelo intervalo de confiança em
questão e o número de graus de liberdade.

Onde pares de limites traduzem-se para diferentes estimativas de extensão do


congestionamento. A fig. 25 exemplifica a aplicação de três intervalos de confiança para a

62
estimação de extensões de um congestionamento. As extensões resultantes estão
empilhadas de acordo com a confiança associada, conferindo uma perspectiva geral do
congestionamento: sendo o intervalo de mais elevada confiança aquele com a extensão
maior e representando o menor nível de congestionamento, em oposição para com o
intervalo de menor confiança, expressando a menor extensão mas a maior concentração do
congestionamento.

Para conjuntos com registos sobre causas apenas, o objectivo consiste em estimar uma
localização que seja representativa das localizações dos registos individuais. Apesar de as
causas poderem ser de natureza completamente diferente, como por exemplo “acidente” e
“defeito de infra-estrutura”, ambos devem estar a contribuir para o congestionamento em
questão. Por esta razão, decide-se agrupar as causas todas em um único ponto que
descreve todo o estado daquela situação, reduzindo assim o entulho informativo e futura
complexidade visual.

Figura 25 - Exemplifica a aplicação de três níveis de confiança para obter três


extensões de congestionamento diferentes. Estas extensões permitem conferir uma
vista geral do estado de um congestionamento.

Nestes termos, aplica-se o teorema de centro de massa para encontrar um ponto


representativo do conjunto de causas. Aqui a massa de cada ponto terá que ser
representada por algo que esteja associado à informação em causa. A descrição do impacto,
associada a cada registo, apresenta-se como um bom substituto (rever modelo de dados).

63
Existem cinco tipos de descrições de impacto, podendo cada uma ser associada a um peso
distinto: Highest→5, High→4, Medium→3, Low→2 e Lowest→1.

Deve-se também introduzir neste cálculo a fiabilidade atribuída a cada registo. A fiabilidade
dos condutores dos veículos é máxima, mas as de diferentes fontes pode variar. Como é
que a fiabilidade é determinada saí fora do âmbito, mas considerá-la como existente, não.
Logo, considera-se que a massa de um registo é calculada através da multiplicação do
impacto pela sua fiabilidade. Temos:

  # $

$ %1,2,3,4,5*

# +0,1-

∑  
. 
∑ 

Equação 4 - Cálculo do centro de massa de um conjunto de registos onde . é o


centro de massa,  é o ponto quilométrico do elemento i do conjunto, . é a
fiabilidade e / é o impacto associado.

O cálculo do centro de massa dos registos permite determinar um ponto quilométrico que
descreve o centro de acontecimentos relativamente à fiabilidade e impacto associados. A fig.
26 apresenta um exemplo do resultado do cálculo do centro de massa. O ponto resultante
deve conter um resumo das fiabilidades e impactos, assim como a lista de causas
agrupadas.

O último tipo de conjunto contém registos referentes às causas e registos referentes às


consequências. Neste caso, o processo aplicado é semelhante aos anteriores: primeiro
divide-se o conjunto em dois subconjuntos, um para registos de congestionamento e outro
para registo de ocorrência. Para os registos de congestionamento, calcula-se o intervalo de
confiança como descrito acima, e para os registos de ocorrência o centro de massa.

Por último, os pontos quilométricos dos limites fim dos intervalos de confiança são
reajustados para ficarem sobre o centro de massa calculado para a ocorrência. A fig. 27
exemplifica o reajustamento das extensões obtidas pelos intervalos de confiança.

64
Figura 26 - Apresentação de um resumo sobre um conjunto de causas que podem
estar a contribuir para um congestionamento.

Figura 27 – Exemplo de como as extensões obtidas pelos intervalos de confiança


são alteradas para terminarem sobre o centro de massa.

65
4.6 Análise de Dados

O objectivo principal do componente de análise de dados é estimar a duração de ocorrências


registadas. Segundo o modelo de dados, todos os registos transmitidos para o sistema
devem estar acompanhados por uma estimativa de duração e de impacto na via. Sabendo
que os dados transmitidos são completamente dependentes da fonte que os forneceu, tanto
estes, assim como as estimativas de duração e de impacto, podem estar desviados da
realidade, ou até errados.

Relativamente à descrição da ocorrência em si, a fusão de dados já trata de filtrar as


descrições que se apresentam incorrectas ou desenquadradas com as suas circundantes,
agrupando em contrapartida aquelas que estão em consonância. No entanto, a estimação de
término de ocorrência, até este ponto, ainda não foi tratada.

A maneira mais simples de providenciar uma estimativa de duração de uma ocorrência é


fazer uma média das observações de todos os registos agrupados, referentes a essa
situação. Pode-se utilizar as fiabilidades (ou pesos – calculados pelo componente de fusão)
associadas a cada registo para melhorar a estimação. Porém, o resultado pode não ser
satisfatório. É difícil estimar a duração de uma ocorrência, principalmente quando esta
acabou de acontecer, não sabendo qual a evolução esperada para o congestionamento,
assim como o tempo que irá demorar para o incidente ser resolvido ou a via ser
desobstruída.

Apenas depois de uma situação se ter verificado por completo, desde o seu início até ao seu
fim, é que se pode afirmar o impacto que teve no trânsito e o tempo que demorou a ser
resolvida. Porém podemos considerar que duas ocorrências distintas no tempo mas
semelhantes em tipo e magnitude, que se verifiquem em um mesmo local em uma altura
onde haja um fluxo de tráfego semelhante, deverão provocar um impacto semelhante no
trânsito.

Pode-se ademais levar em consideração o tempo de resposta das entidades associadas à


resolução deste tipo de incidentes, como ambulâncias, forças policiais e reboques, sabendo
que estes podem influenciar a duração da ocorrência, sendo esta influência variável,
dependendo de vários factores como a sazonalidade, por exemplo.

Deixa-se porém o estudo desta influência fora do âmbito da dissertação. Poder-se-ia


considerar a integração de informação sobre os veículos de resposta adjudicados a cada

66
uma ocorrência, para desta maneira tentar determinar quanto tempo é que dada ocorrência
demoraria a ser tratada. Mas isto também sai fora do âmbito.

A abordagem tomada circunscrever-se-á aos dados sobre as ocorrências em sí. Estes dados
são a base de conhecimento do sistema, e devem ser utilizados da melhor maneira possível
de forma a providenciar uma mais-valia informativa relativamente à estimação da sua
duração.

Antes de considerar como os dados devem ser utilizados, convém estudar a dinâmica de
envio de ocorrências durante a evolução de congestionamentos. A fig. 28 apresenta, de uma
forma muito genérica, a influência de incidentes de trânsito ou horas de ponta nos
congestionamentos. A causa está na insuficiência – condicionada ou inerente - do fluxo
máximo de uma via para dar suporte ao fluxo de tráfego existente no momento.

Esta insuficiência provoca um congestionamento, que tende a aumentar enquanto o fluxo


máximo for inferior ao fluxo de tráfego. Nota-se também que a evolução do
congestionamento é precedida de uma fase de crescimento, seguida depois de uma fase de
redução.

Assumindo que existe uma proporcionalidade entre o crescimento de um congestionamento


e a sua redução, considera-se que se souber como um dado congestionamento cresceu,
pode-se inferir aproximadamente quanto tempo durará a sua redução.

Figura 28 – Exemplo de dois tipos gerais de situações que podem provocar


congestionamentos.

67
Por questões de simplificação considera-se que, para todos os congestionamentos, a
3
duração do seu crescimento é igual à duração da sua redução . Nestes termos, pode-se
delinear que sequências de notificações existem, e como é que estas podem conferir
informação sobre o estado e evolução dos congestionamentos a que se referem.

A fig. 29 exemplifica um conjunto de sequências de notificações e de como estas podem ser


utilizadas para inferir as fases de crescimento e de redução. Neste caso, foram utilizados os
dados sobre os registos em si para a determinação das durações, em vez das estimativas de
duração e de impacto. A natureza e cronologia das ocorrências permite determinar se o
congestionamento está em fase de crescimento ou de redução.

Desta maneira pode-se calcular umas estimativas iniciais para a duração de uma ocorrência,
unicamente utilizando os dados e o seu encadeamento cronológico. O que esta figura
transmite é que em diversos casos, apenas recorrendo à natureza dos dados em si, é
possível inferir as dimensões temporais da fase de crescimento ou até de redução, podendo,
desta maneira, estimar a duração da ocorrência.

Este tipo de avaliação é principalmente vantajosa se houver uma proporcionalidade entre a


fase de crescimento e a de redução – basta determinar a fase de crescimento para ser
possível estimar a fase de redução, ou vice-versa, e consequentemente a duração da
ocorrência.

Na fig. 30 apresenta-se um exemplo de registos ordenados cronologicamente, neste caso


com o foco sobre as estimativas de impacto e de duração. Este exemplo mostra três registos
hipotéticos sobre uma dada ocorrência. Nota-se uma relação entre a duração e o impacto
4
estimado, assim como com o nível de congestionamento real da ocorrência .

3
Esta assumpção será utilizada como base para a restante análise de dados. Não obstante, a mesma
pode ser melhorada, no sentido de definir uma relação de proporcionalidade entre o crescimento de um
congestionamento e a sua subsequente redução, dependendo esta dos factores condicionantes desta
relação. O aperfeiçoamento desta relação não invalida os subsequentes pressupostos apresentados
na análise de dados.
4
É de notar que estes dados foram preparados para apresentarem alguma correlação, sendo sempre
possível argumentar que isto pode bem não se verificar na realidade. Mas como nesta dissertação não
foi possível aceder a dados reais, considerámos que, apesar de esta assumpção não ser possível de
ser verificada empiricamente, deve, contudo, não fugir assim tanto à realidade prática. Considera-se
mais provável que, caso haja várias notificações relativas a uma mesma ocorrência, estas exibam
estimativas correlacionadas com o estado actual de evolução da ocorrência reportada, e não o
contrário. Podemos então assumir que, apesar de o gráfico apresentado não ser sustentado por dados
concretos, representa uma situação possível de se verificar na realidade.

68
Figura 29 – Exemplo de como diferentes sequências de notificações podem ajudar
à determinação das fases de crescimento e redução de ocorrências.

Perante isto, põe-se agora a seguinte questão: se tivéssemos um registo histórico com
apenas estes três registos apresentados na figura, e se recebêssemos uma notificação de
ocorrência com duração estimada de meia hora e com impacto estimado como “médio”, igual
à primeira das três notificações do registo histórico, poderíamos afirmar que a ocorrência
reportada iria demorar 1 hora, tal como a do registo histórico tinha demorado?

Provavelmente não. Mas e se tivéssemos recebido duas notificações iguais às do histórico,


com um espaçamento temporal semelhante, poderíamos aí afirmar que a ocorrência iria
demorar aproximadamente 1 hora? Neste caso, a afirmação apresenta-se mais sustentada
pelos dados, sendo a sua concretização um pouco mais provável.

69
Figura 30 – Exemplo de relação entre a duração e impacto estimados com a
evolução de um congestionamento.

Esta verificação transmite que a elaboração de um registo histórico que associe as


notificações transmitidas às durações estimadas pelo sistema – utilizando a hipótese da
proporcionalidade entre crescimento e redução de congestionamentos, a cronologia e tipo de
dados, assim como as estimativas de impacto e de duração fornecidas – pode servir de base
para futuro suporte a melhores estimativas de duração, na medida em que os dados
fornecidos são comparados com o histórico de dados, sendo a sua duração e impacto
acessíveis para consulta e comparação.

Voltando novamente ao mesmo exemplo, se o sistema receber duas notificações de


natureza e cronologia semelhantes às da fig. 30, e se no histórico houver vários registos que
partilhem estas propriedades e que tenham uma duração e impacto estimado, pode-se
utilizar as estimativas no histórico para ajustar as estimativas iniciais.

Nestas condições, é necessário elaborar a estrutura do conhecimento histórico, assim como


as pesquisas que deve suportar para permitir a selecção de ocorrências semelhantes. Uma
abordagem utilizada para este tipo de casos, em que se quer fazer uma previsão de uma
situação tendo em conta uma história de situações, é recorrer a processos de Data Mining.
Optando por esta abordagem, em contrapartida para com utilizar a base de dados actual

70
para comparação de situações, torna-se necessário converter o modelo de dados
5
apresentado em um em estrela , modelo típico utilizado em processos de data mining.

A fig. 31 apresenta o modelo escolhido. No centro da estrela encontra-se a ocorrência,


sendo os dados de interesse a duração e o impacto. Existem seis tabelas que a circundam e
que definem as dimensões. É de notar que existem quatro tabelas relativas às fases de
crescimento e redução das situações.

Sabendo que não é possível guardar, dentro de um modelo em estrela, todos os registos
associados a uma dada situação, é necessário fazer algum tipo de compromisso, como pela
elaboração de um resumo que descreva um dado conjunto de situações. Por esta razão
escolhem-se estas tabelas, servindo de resumo, cada uma, para uma metade de uma das
fases, ou de crescimento ou de redução.

É de notar que cada uma destas tabelas tem os campos “Fiabilidade”, “Causa”, “Agravante”,
“Impacto” e “Duração”. Cada um destes campos consiste de um resumo dos dados contidos
dentro da fase à qual corresponde. Há aqui uma consideração a fazer relativamente ao tipo
de dados que devem ser guardados em modelos de data mining: na maioria dos casos,
convém traduzir dados numéricos para alfanuméricos, na medida em que é aplicado um
gradiente, que traduz, por exemplo um conjunto de números que variam entre 0 e 1, para um
conjunto de níveis, como “baixo”, “médio” e “alto”.

A razão desta conversão incide sobretudo em questões de facilitação de pesquisa. Com isto
em mente, todos os campos excepto a fiabilidade são calculados da seguinte maneira: cada
campo é escolhido com base em dois factores, o tipo do campo, e a fiabilidade associada a
esse tipo.

Nestes termos, para cada campo, o tipo escolhido como resumo é aquele cujo somatório de
fiabilidades associadas a esse tipo apresenta o valor mais alto. Dando a escolha do tipo de
causa como exemplo, se tivermos o seguinte conjunto de dados relativos ao tipo de causa:

{(Accident, 90%), (Obstruction, 10%), (Obstruction, 30%))}

A causa escolhida será “Accident”, porque apesar de haver dois registos a dizer
“Obstruction” a soma das suas fiabilidades é menor que a de “Accident”.

5
Os modelos em estrela consistem de uma tabela central que determina o “facto” que estamos a
procurar, e um conjunto de tabelas circundantes, as “dimensões”, que contêm dados relacionados com
a determinação desse facto. Uma introdução exaustiva aos conceitos de data mining pode ser contrada
em [Data Mining : Concepts and Techniques , Jiawei Han and Micheline Kamber , 2001, Morgan
Kaufman Publishers]

71
Figura 31 – Modelo em estrela para o registo histórico de ocorrências. A tabela
central representa o facto que se quer pesquisar, e todas as circundantes
representam as dimensões associadas a esse facto.

Por fim, a fiabilidade é calculada com base na média aritmética das fiabilidades associadas a
cada um dos campos escolhidos, sendo esta depois convertida para um valor alfanumérico,
sendo feita a seguinte correspondência:

[0, 0.2 [ → “Lowest”


[0.2, 0.4 [ → “Low”
[0.4, 0.6 [ → “Medium”
[0.6, 0.8 [ → “High”
[0.8, 1] → “Highest”

A dimensão de localização é preenchida com os dados de localização da ocorrência, sendo


o ponto quilométrico o único valor numérico dos dados. O mesmo se pode dizer para a

72
tabela tempo, que contém todos os dados temporais que podem ser traduzidos em algum
tipo de análise de sazonalidade.

Sabendo agora a estrutura do modelo em estrela e de como é que os dados são guardados
dentro deste, identifica-se os passos que o componente de análise efectua para a estimação
da duração de ocorrências. A fig. 32 apresenta o comportamento geral do componente de
análise de dados. Existem dois componentes internos, denominados de identificadores, que
são executados periodicamente.

No caso do “Identificador de Situações Terminadas”, este identifica todos os conjuntos de


registos agrupados dos quais já não existe nenhum registo activo, sendo estes considerados
como terminados e copiados para o modelo em estrela (após aplicadas as transformações
de dados supra apresentadas).

O outro identificador foca-se nas ocorrências em curso, recolhendo-as periodicamente, e


passando-as para o pipeline de análise de dados identificado na figura. Primeiro os dados
são ordenados cronologicamente, seguindo-se a identificação das fases de
congestionamento, da recolha de situações semelhantes, da estimação da duração e do
impacto, sendo, por fim, feito uma actualização de desvios.

Relativamente ao ajuste de desvios, esta fase final será explanada mais à frente, mas
adianta-se que tem a ver com a avaliação das estimativas feitas pelas fontes de dados,
tendo em conta a comparação entre as estimativas que estas fizeram e estimativas
calculadas pelo sistema. Esta metodologia de avaliação de desvios dará suporte a um outro
tipo de metodologia de previsão de duração e de impacto de ocorrências.

Antes disso, convém explicar melhor algumas das fases do pipeline que ainda não foram
apresentadas, especificamente a recolha de situações semelhantes e a estimação da
duração e do impacto.

Para se poder proceder à pesquisa, no histórico, de situações de cariz semelhante, é


necessário saber previamente que factores devem ser comparados para obter resultados
mais satisfatórios. Neste caso a técnica utilizada é a seguinte: para cada situação
identificada, transforma-se os dados dos registos associados a essa situação em dados com
estrutura igual à do histórico, ou seja, cria-se um resumo para cada uma das meias fases do
congestionamento. Depois, pesquisa-se por situações que tenham meias fases semelhantes
às do registo em questão.

73
Figura 32 – Fluxograma geral que descreve os passos que são feitos pelo
componente de análise aquando de uma iteração.

A maneira específica como as fases são pesquisadas, e ou os dados são adaptados para
obter um maior número de situações semelhantes, sai fora do âmbito devido à inerente falta
de dados experimentais. No entanto, deixa-se a nota de que a introdução de pequenos
desvios nos resumos, assim como a escolha acertada de quais fases procurar, deve ser a
chave para o afinamento das pesquisas.

Por fim, resta estimar a duração da ocorrência. Considerando que as situações obtidas são
situações semelhantes às actuais, basta fazer uma média aritmética das durações
calculadas pelo sistema para essas situações, e atribuí-la como estimativa para a situação
actual em análise. Ou seja, a estimativa da duração é calculada com base na identificação
de situações que se revelaram semelhantes.

Apresenta-se agora outra metodologia para estimar a duração de situações, que utiliza
também o histórico, mas em vez de comparar as situações em sí, utiliza o conceito de
análise de desvios das estimativas feitas por fontes de dados. Se se associar as fontes de
dados aos registos que transmitiram e às estimativas que forneceram, assim como às

74
durações que por fim foram calculadas pelo sistema para essas mesmas ocorrências, pode-
se identificar os desvios que essas fontes demonstram para com as estimativas do sistema.

Desta forma pode-se identificar fontes de dados que tenham tendência a exagerar ou a
minorar as suas estimativas perante certo tipo de situações. Este método de avaliação
distingue-se do anterior porque em vez de se basear em uma comparação histórica de
situações, alicerça-se sobre uma análise das tendências das fontes de dados para
estimarem acima do real, abaixo, ou acertarem em cheio.

A fig. 33 apresenta as três observações de desvios que seriam associadas a cada utilizador.
Neste caso trata-se de um utilizador específico que, depois de várias contribuições para o
6
sistema, revelou as tendências descritas na figura .

Estes desvios estão descritos na “Fase Inicial” da figura. Nota-se que estimativas de “mais o
que uma hora” tendem a ter desvios tanto para cima, como para baixo. À medida que a
estimação feita é de menor duração, o seu desvio (erro ou amplitude) tende a reduzir, o que
faz um certo sentido, dado que se o utilizador atribui uma duração curta a uma ocorrência,
então é porque realmente a ocorrência não deverá ser grave, tendo consequentemente uma
duração mais curta, por conseguinte mais fácil de ser estimada.

Figura 33 – Exemplificação dos desvios calculados para um utilizador em três fases


do decorrer de ocorrências.

6
Este exemplo, apesar de não se basear em dados reais, não foi feito ao acaso. Seguindo um
raciocínio anterior, notificações efectuadas pouco tempo depois de uma ocorrência se ter verificado
têm uma maior probabilidade de apresentarem estimativas desviadas.

75
Passando agora para as fases intermédia e final, pode-se observar que as estimativas de
duração tendem a ter um desvio mais para baixo, o que também faz sentido, dado que nos
estamos cada vez mais a aproximar do fim da ocorrência. Utilizando o exemplo da “Fase
Final”, se a fonte de dados associada a estes desvios fizesse uma observação relativamente
a uma ocorrência da qual o sistema já tinha recebido outras notificações e já tinha
determinado que estava na fase final da ocorrência, e se essa mesma fonte determinasse
que a ocorrência iria durar ainda 45 minutos, o sistema poderia alterar a observação
fornecida e dizer que a aquilo que a fonte realmente queria dizer (mas não sabia melhor) era
que a duração da ocorrência ia ser entre os 15 e os 40 minutos.

Por fim, tendo acesso a dados fornecidos por várias fontes, cada uma com a sua fiabilidade
e desvio associado, pode-se, semelhantemente ao caso do cálculo do centro de massa,
determinar qual a duração estimada para a ocorrência.

76
5 Caso de Estudo

O presente caso de estudo tem com objectivo a demonstração prática da teoria apresentada
na solução proposta. Tendo em conta que esta dissertação foi desenvolvida dentro de um
contexto académico, sem contacto directo com nenhuma entidade fornecedora de dados, foi
necessário simular notificações de ocorrências de tráfego rodoviário fictícias. Por esta razão
antecipa-se já a afirmação de que os resultados apresentados estão suportados apenas
sobre os dados simulados, e não dados reais. Constata-se porém, que houve um esforço
considerável na elaboração de um simulador de dados que procura assemelhar-se ao
comportamento esperado de diversas entidades a fornecerem dados ao sistema.

Relembra-se que esta dissertação foi desenvolvida nas instalações da ESRI-Portugal, com o
acompanhamento técnico de um dos seus colaboradores séniores. Por esta razão, o sistema
alavanca-se sobre as tecnologias ESRI, nomeadamente sobre o ArcGIS Desktop 9.3.1 e
ArcGIS Server 9.3.1, assim como sobre os serviços online de mapas e de rotas da ESRI Inc.

A fig. 34 apresenta a arquitectura da aplicação desenvolvida. De notar que o componente


“SCIR Core” segue a arquitectura identificada para o SCIR na solução proposta. À esquerda
deste encontra-se o componente responsável pela elaboração de cenários de tráfego, por
cima encontra-se o Dashboard dos operadores de tráfego, e no canto superior esquerdo o
servidor SIG ArcGIS Server. Vamos apresentar de seguida cada um destes componentes.

5.1 Geração de Cenários

A elaboração de cenários é uma tarefa central do caso de estudo. O objectivo consiste em


criar um gerador de notificações de trânsito que seja capaz de simular, com o máximo de
realismo possível, as notificações que seriam transmitidas para diversos tipos de
ocorrências. Mas para conseguir isto, é necessário introduzir o conceito de cenários.

No âmbito deste estudo, um cenário consiste na representação de uma ocorrência de


tráfego. Esta procura assemelhar-se a uma ocorrência real, na medida em que tem um início
de ocorrência, um impacto na via, um possível congestionamento associado, e uma

77
resolução de ocorrência. Entre o início de uma ocorrência e a sua respectiva resolução, se
houver trânsito suficiente, formar-se-á um congestionamento que irá evoluir ao longo do
tempo – com tendência para crescer enquanto a situação não é resolvida, e para diminuir,
até à sua extinção eventual, depois da resolução da ocorrência.

Podem existir diversos tipos de ocorrências de tráfego, cada uma com o seu impacto e
duração específica. Por sua vez, cada uma destas ocorrências de tráfego pode ser
observada por um conjunto de observadores, sendo aqueles que nos interessam, os
observadores que transmitem dados para o sistema.

Figura 34 – Arquitectura interna do protótipo desenvolvido.

78
O número de observadores pode variar, a localização dos mesmos também, assim como a
altura em que decidem reportar a ocorrência ao sistema central. Todos estes factores
influenciam os dados que são preenchidos no acto de registo. O simulador procura ter em
conta todas estas variáveis para atingir uma simulação que se aproxime com a realidade.

O simulador de cenários é composto por dois componentes internos. O primeiro componente


é responsável pela criação de cenários, enquanto o segundo é responsável pela sua
concretização, i.e., pelo envio para o sistema das notificações associadas a esse cenário.
Cada um dos componentes tem uma thread interna que é executada periodicamente. No
caso do gerador de cenários, a periodicidade da thread varia aleatoriamente, para atribuir
mais algum realismo à geração.

Um cenário consiste de uma ocorrência de tráfego específica, com uma data de início, uma
duração específica, um impacto na via, e um congestionamento que evolui ao longo da
duração do cenário. Ademais, tem um conjunto de observadores associados, distribuídos
aleatoriamente ao longo da duração do cenário e da sua extensão na via, cada qual com a
sua respectiva observação sobre a ocorrência, assim como uma notificação para ser enviada
para o sistema. Esta é a constituição de um cenário.

Cada um dos cenários criados é, por sua vez, guardado em uma lista para processamento
subsequente. O segundo componente é responsável por atravessar esta lista e verificar se
existem cenários com data marcada para o momento. Se for o caso, esse cenário passa ao
estado activo.

De seguida o componente verifica que notificações é que estão associadas a esse cenário e
quais as datas de envio que lhes foram atribuídas. Quando o componente encontra uma
notificação com data marcada, remove-a do cenário e envia-a para o sistema. Quando já
não existem notificações associadas a um cenário, o mesmo é removido da lista. Os
cenários envidados são, por sua vez, guardados dentro da secção Raw Traffic Data da base
de dados.

5.2 Núcleo SCIR

O componente SCIR Core segue as especificações da solução. Semelhantemente, contém


três componentes, o componente SIG, o de fusão de dados e o de análise. Tanto o
componente de fusão como o de análise contêm uma thread respectiva, sendo estas

79
executadas periodicamente. Tal como o ilustrado na imagem, o componente de fusão
recolhe os dados contidos dentro da secção de Raw Traffic Data e aplica-lhes as
metodologias estatísticas e ontológicas apresentadas na solução proposta, criando assim
novos registos que representam o agrupamento de registos considerados relativos a uma
mesma ocorrência, guardando-os de seguida na secção de Clustered Traffic Data da base
de dados.

O componente de análise é responsável por criar um registo histórico das situações que
foram identificadas, assim como a sua evolução ao longo do tempo. Este registo é utilizado
como uma base de conhecimento para o sistema, tal como o estipulado na solução
proposta. Esta base de conhecimento tem duas mais-valias:

(1) A primeira consiste da análise de quais as extensões de via, e dentro de que períodos
específicos, apresentam uma maior incidência de tráfego. Esta análise permite identificar as
extensões de via mais problemáticas, alavancando os operadores com um melhor
precavimento relativamente a situações de tráfego que possam ocorrer nessas zonas.

(2) A segunda está directamente associada com a estimação do término de ocorrências. Tal
como dito na solução proposta, o componente de análise associa as notificações de tráfego
com a evolução das ocorrências. Esta associação permite identificar os desvios que existem
entre as notificações e as ocorrências em si. Desta maneira, o sistema consegue estimar
que desvios são mais prováveis de estarem presentes nos dados transmitidos, podendo
estimar assim, com mais precisão, a verdadeira duração da ocorrência.

Como indicado na figura, o componente SIG contém dentro deste uma instância, em
memória, da aplicação ArcMap. A aplicação ArcMap é arrancada internamente, pelo SCIR,
no início da aplicação, sendo todos os processos de georeferenciação de pontos e de linhas
são feitos através do ArcMap. Aquando de um pedido de georeferenciação, o componente
SIG comunica com a instância do ArcMap através de objectos COM. O processo de
geoferenciação de pontos e de linhas utiliza como base a tecnologia de ArcObjects da ESRI.

5.3 Dashboard

O Dashboard desenvolvido consiste de uma aplicação web, desenvolvida sobre a tecnologia


Silverlight, que permite visualizar os eventos de tráfego que foram identificados pelo SCIR
assim como efectuar uma análise histórica e sazonal de situações de tráfego, podendo

80
também, adicionalmente, efectuar o cálculo de melhores rotas tendo em conta os eventos de
tráfego actuais.

A fig. 35 apresenta uma vista geral da interface, sendo destacados o menu principal, a
listagem de eventos de tráfego, os eventos de tráfego gereferenciados no mapa, e os
controlos de cálculo de rota. O menu principal permite saltar entre as interfaces de eventos
de tráfego, controlos de rota, e análise histórica de situações.

A listagem dos eventos de tráfego contempla todas as ocorrências de tráfego que foram
identificadas pelo SCIR após o processo de agrupamento de dados, sendo estes
apresentados de forma ordenada de acordo com o impacto estimado que estão a provocar
na via.

Figura 35 – Apresentação da interface para a monitorização de situações de tráfego


actuais. À direita são apresentadas as ocorrências agrupadas pelo componente de
fusão, ordenadas pelo seu impacto. À esquerda são apresentadas as ocorrências
na via.

81
Adicionalmente é possível visualizar de que tipo de eventos se trata, qual a sua duração,
localização na via, e extensão de congestionamento estimada que estão a provocar. Todos
os eventos que aparecem destacados na lista aparecem também georeferenciados no
mapa. Um simples clique em qualquer um dos eventos listados efectua um zoom-in no mapa
sobre o evento seleccionado. Cada tipo de evento está associado a uma simbologia
específica, permitindo uma mais fácil identificação da categoria e tipo de evento que se trata.

Na fig. 36 é apresentado um exemplo de cálculo de melhor rota entre Santarém e Coimbra,


contemplando as situações de tráfego identificadas pelo sistema. O sistema apresenta duas
rotas diferentes, uma que não considera os eventos de tráfego e que constitui o caminho
mais rápido entre esses dois pontos e outra que evita os eventos de tráfego. Ademais, são
apresentadas as distâncias quilométricas e durações de viagem de cada uma das rotas.
Para o cálculo de rotas foram utilizados os serviços online de routing da ESRI Inc.

Recorrendo a uma API de routing providenciada pela ESRI, é possível efectuar


transparentemente pedidos assíncronos de cálculo de melhor rota entre dois pontos. Este
serviço de routing permite a inclusão de barreiras na via rodoviária, obrigando o serviço a
retornar uma rota que necessariamente evita essas barreiras. Desta forma, as localizações
dos eventos de tráfego são traduzidas para barreiras e envidas em anexo ao pedido de
cálculo de melhor rota.

Por esta razão, é possível calcular a rota destacada a vermelho, que evita os eventos de
tráfego que estão a decorrer. Contudo é feito um cuidado adicional. Apenas os eventos de
tráfego que apresentem uma duração acima do tempo médio estimado para o alcance do
mesmo desde o ponto de começo de rota é que são incluídos como barreiras. Isto é, se o
veículo em questão irá demorar mais tempo a chegar a esse evento do que o tempo
estimado para a sua duração, então o evento não deve constituir uma barreira no cálculo da
rota.

A fig. 37 apresenta os três eventos em questão no cálculo da rota. Como é possível ver,
cada um dos eventos apresenta três níveis de congestionamento, a amarelo, laranja e
vermelho, de acordo com o estipulado na solução proposta. Tanto o evento de manutenção
de via, como o evento de congestionamento, apresentam os três níveis de
congestionamento sobrepostos, sendo o de menor congestionamento o com maior extensão,
e o de maior congestionamento com menor.

82
Figura 36 – Apresentação do cálculo de duas rotas diferentes entre dois pontos. Ao
contrário da rota vermelha, a rota azul não contempla os dados de tráfego actuais.

Figura 37 – Apresentação das extensões calculadas para as ocorrências de tráfego


que foram agrupadas pelo sistema.

No caso do acidente, as extensões de congestionamento são adaptadas para acabarem na


localização do evento, atribuindo um maior realismo à visualização da situação. No caso do
congestionamento é feito uma amostra da informação que é apresentada se o operador
decidir “picar” o ícone do congestionamento no mapa. Semelhantemente às rotas, aparece
um balão informativo que descreve as principais propriedades do evento.

83
Por fim tem-se a secção de visualização histórica de dados, apresentada na fig. 38. Esta
secção permite a visualização histórica do número de ocorrências verificadas por ano, mês,
e dia da semana, assim como a selecção específica de um período de dias, para a
efectuação de uma análise mais localizada e detalhada do que aconteceu dentro desse
período específico.

Figura 38 – Apresentação da secção de consulta histórica de ocorrências. É


possível ver as ocorrências por ano, mês e dia da semana, sendo também possível
fazer uma análise mais específica, pela selecção de um período específico, ao qual
é apresentado o número de ocorrência por tipo assim como por dia.

84
O resultado da selecção de um período específico faz actualizar o gráfico de barras e o
gráfico de pizza. No caso do de barras, é identificado por dia seleccionado, o tipo e número
de eventos ocorridos. No caso do gráfico de pizza é identificado o tipo e número de
ocorrências que se verificaram dentro do período seleccionado. Adicionalmente, o utilizador
pode activar o mapa de gradiente, e “picar” nas fatias do gráfico de pizza para visualizar,
geograficamente, as zonas de maior incidência. No exemplo fornecido, são escolhidos os
congestionamentos dentro do mês de Outubro, o que resulta no mapa de gradiente
apresentado à esquerda.

Tecnologias utilizadas:

ℵ Ambiente de Desenvolvimento: Visual Studio 2008

ℵ Linguagem de Desenvolvimento Principal: C# .NET

ℵ API SIG Utilizada: ESRI ArcObjects

ℵ Tecnologias Integrantes: ArcMap 9.3.1, ArcGIS Server 9.3.1

ℵ Base de dados: SQL Server 2005

ℵ Dashboard: Silverlight 3.0, ArcGIS API para Silverlight

85
6 Conclusões e Trabalho Futuro

O transporte de mercadorias está directamente ligado ao sucesso económico de nações,


sendo o transporte rodoviário o meio de transporte mais utilizado de entre os meios
disponíveis. Determinou-se que os congestionamentos são um dos maiores problemas do
sector, contribuindo para, entre outras factores, tempos de entrega pouco fiáveis,
velocidades médias baixas, custos de transporte e de logística acrescidos, e uma resultante
insatisfação transversal a todo os intervenientes no negócio.

Este facto levou-nos a estudar os principais métodos utilizados para a mitigação de


congestionamentos, dos quais, destacaram-se os Sistemas Inteligentes de Transporte, não
só porque se enquadram dentro do âmbito desta dissertação, mas também porque são
considerados como uma das grandes esperanças para o combate aos problemas do
transporte. Concluí-se que a primeiro requisito de qualidade de um ITS são os dados que
este possui. Determinou-se quais os métodos principais utilizados para a recolha de dados,
sendo avaliadas as suas vantagens e desvantagens.

Com isto em mente, propôs-se, nesta dissertação, um outro método de recolha e


processamento de dados de tráfego, constituído por um modelo resultante de uma
simplificação de uma norma de dados de tráfego internacional, e de um processo de fusão e
de análise de dados. Este método teve por base a simplificação dos processos de registo de
dados da parte dos emissores, para alavancar uma comunicação de dados mais abrangente
e transversal a todo o tipo e natureza de possíveis intervenientes na comunicação de
ocorrências de tráfego, desde sistemas de controlo de tráfego, até simples utentes na via.

Devido à inerente heterogeneidade das fontes de dados, foi introduzido um componente de


fusão de dados, que se foca na integração de dados provindos de diversas fontes, utilizando
a localização, conteúdo e fiabilidade dos registos como matriz para a identificação de
registos referentes a uma mesma ocorrência. Ou seja, as fontes de dados não seriam
responsáveis por identificar as ocorrências a que se referem e se estas já estavam
registadas no sistema; quem seria responsável por esta tarefa seria o sistema integrador
SCIR.

A única coisa com que as fontes de dados se tinham que preocupar era em descrever as
ocorrências em sí, utilizando para esse efeito o modelo de dados fornecido. O componente

86
de fusão seria, por sua vez, responsável por fundir os diversos dados transmitidos,
procurando integrar os dados em uma vista concreta de ocorrências, com localização,
natureza, extensão e impacto estimados.

Também foi dado especial foco à determinação da duração de ocorrências. Saber identificar
ocorrências não constitui informação suficiente para o suporte às operações de uma
transportadora. Estas têm que possuir informação sobre a duração das ocorrências
registadas, para assim poderem decidir se alteram a rota de determinado veículo que esteja
a caminho de uma ocorrência identificada.

Para este efeito, foram apresentadas duas metodologias distintas para a estimação de
duração de ocorrências, ambas baseadas na elaboração de uma data warehouse para o
registo histórico de ocorrências, e em processos de data mining para o suporte à estimação.
O primeiro método consistiu na identificação de processos de pesquisa de ocorrências
semelhantes registadas no histórico, para motivos de consulta e comparação de durações
estimadas, e o segundo consistiu no estudo dos desvios das estimativas feitas pelas fontes
de dados, para proceder ao ajuste directo de estimativas feitas por dada fonte.

Com as metodologias de fusão e de análise de dados apresentadas, permitiu-se alavancar


um sistema que estima a duração e impacto de ocorrências em auto-estradas. Esta
informação permite aos profissionais do sector de transporte rodoviário de mercadorias
tomar decisões, em tempo real e baseadas em informação fiável, sobre quais rotas manter e
quais a alterar.

Foi feito um estudo criterioso do estado de arte relacionado com sistemas de monitorização
de trânsito, e com metodologias de previsão de duração de ocorrências em auto-estradas. O
estudo revelou que as metodologias correntes não apresentavam coeficientes de sucesso na
previsão suficientemente elevados para serem considerados fiáveis e úteis para os
profissionais do sector de transporte rodoviário de mercadorias.

A razão considerada como causadora principal para esta reduzida precisão e fiabilidade, foi
a falta de informação de contexto sobre as ocorrências de trânsito. A maioria das
metodologias focava-se apenas nos acidentes como causadores de congestionamentos, na
sua natureza, número de veículos envolvidos, e número de pessoas feridas. Foram
negligenciados os congestionamentos que acontecem apenas devido a falta de capacidade
das vias para dar vazão ao número de veículos, assim como todo o contexto envolvente e
causador de congestionamentos.

87
Determinou-se que o contexto de um congestionamento era praticamente negligenciado,
como a incorporação de informação sobre a altura do dia (manhã, tarde, noite, hora de
ponta) dia da semana, sazonalidade, localização, congestionamento actual,
congestionamento esperado, condições meteorológicas, fontes de informação, número de
fontes e fiabilidade, assim como o desfasamento temporal de notificações relativamente a
ocorrências.

Verificou-se que sem informação de contexto, ocorrências semelhantes em natureza,


número de veículos envolvidos e número de feridos, tornam-se assim virtualmente
indistinguíveis, enquanto o contexto em que estão inseridas pode variar drasticamente,
levando a durações de ocorrência diferentes. A solução proposta procura integrar esta
informação toda, alavancando uma base de dados mais rica, com conhecimento de facto
sobre o acontecimento de congestionamentos, dando suporte assim a metodologias de
pesquisa mais rigorosas e cirúrgicas.

Os métodos de fusão e de análise não foram testados apenas em ambientes de teste, não
sendo possível aplicá-los no campo. Para colmatar esta falta, foi desenvolvido um protótipo
que simula diversas situações de tráfego, dando especial foco à evolução temporal de
ocorrências e à elaboração de registos que apresentem dados correlacionados com a sua
evolução. Foram implementadas as características principais dos componentes de fusão e
de análise, assim como do componente SIG, para dar suporte à georeferenciação de
registos em auto-estradas.

O resultante Dashboard apresentou ferramentas de consulta de ocorrências a decorrer,


assim como um histórico, utilizando as propriedades de localização como um dos meios de
análise e de pesquisa. Foram também introduzidos mecanismos de cálculo de melhor rota
que evitam ocorrências identificadas caso estas se encontrem no caminho da rota e caso
tenham duração suficiente para ainda estarem activas aquando do chegar do veículo em
questão.

A aplicação prática dos métodos apresentados é fundamental para a evolução dos mesmos.
A determinação de processos de fusão e de análise de dados só podem chegar até certo
ponto, se não forem testados na prática. Apenas com a experiência de utilização é que se
pode determinar quais as técnicas de fusão e de análise que resultam melhor. Não obstante,
as técnicas identificadas nesta dissertação constituem um passo nessa direcção.

Ainda totalmente dentro do campo teórico, apresentam uma metodologia concreta para o
estabelecimento de uma unidade de processamento central de dados de tráfego, com um

88
modelo de dados para o registo de ocorrências, e um conjunto de processos para o
tratamento e análise de dados, que se destacam fundamentadamente dos restantes
métodos constituintes do estado de arte. Como trabalho futuro para esta dissertação
identificam-se os seguintes tópicos:

ℵ Estudo de metodologias de manutenção e actualização de modelos de redes


rodoviárias e de rotas sobre essas redes. Para haver uma correcta determinação da
localização de ocorrências e de melhores rotas para as evitar, é necessário ter um
modelo da rede viária que esteja sincronizado tanto com a realidade física das vias,
assim como com as rotas das vias concessionadas. Por exemplo, basta, no caso da
brisa, estabelecer um desvio temporário de uma das auto-estradas, para haver um
desfasamento entre a base de conhecimento do sistema e a situação real, podendo
levar a dados e estimativas erradas. Para um sistema como o SCIR ser sustentado,
é fundamental haver um processo periódico de actualização do modelo de dados
das vias rodoviárias.

ℵ Desenvolvimento de uma aplicação passível de correr em smart phones para o


registo de ocorrências. Utilizando o modelo de dados elaborado, deve ser
desenvolvida uma aplicação que permita o registo de ocorrências por utilizadores
humanos. Deve ser dado especial atenção à usabilidade da aplicação para permitir
um registo rápido de ocorrências de tráfego.

ℵ Melhoramento das técnicas de fusão apresentadas, e estudo de novas técnicas.


Deve ser dada especial atenção à utilização da localização e natureza dos dados
para o suporte à sua integração. A identificação de registos referentes a ocorrências
semelhantes deve caber ao SCIR e não às fontes. Melhoramento da análise
ontológica apresentada, e aprofundamento do impacto que as agravantes têm sobre
dada situação. Este estudo deve ser baseado em dados reais.

ℵ Melhoramento das técnicas de análise apresentadas, e estudo de novas técnicas. O


método de estimação de duração apresentado alavanca-se sobre processos de data
mining para a pesquisa de situações de natureza semelhante, e a análise de desvios
nas estimativas feitas pelas fontes de dados. A maneira específica como o histórico
de registos é construído, assim como as pesquisas são feitas, está intimamente
relacionado com a dinâmica das ocorrências e do envio de dados pelas fontes. É
necessária uma afinação destas metodologias com base em dados reais. Também é
necessário formar uma base de conhecimento com o registo pormenorizado de

89
ocorrências reais, a sua duração e o seu impacto na via, para poder comparar com
os registos transmitidos pelas fontes de dados, e com os resultados obtidos pelo
SCIR. Esta comparação pode ser crucial para o ajuste do registo e pesquisa de
dados históricos.

90
Referências
[1] EUROSTAT: Panorama of Transport, pp.56-58 (2009)

[2] European Commission: Proposal for a Directive of the European Parliament and of the Council
laying down the framework for the deployment of Intelligent Transport Systems in the field of road
transport and for interfaces with other transport modes, Brussels (2008)

[3] Pinto, R., Sousa, J., Pestana, G.: A Methodology for Real-Time Data Fusion, Georeferentiation and
Analysis of Road Traffic Data reported by Multiple Sources. In: 12th World Conference on Transport
Research, Lisbon (2010)

[4] Federal Highway Administration - Office of Transportation Policy Studies: An Initial Assessment of
Freight Bottlenecks on Highways. Cambridge Systematics White Paper (2005)

[5] Golob, F., Regan, A..: Impacts of highway congestion on freight operations: perceptions of trucking
industry managers. In: Transportation Research Part A: Policy and Practice pp.577-599 (2001)

[6] Lautso, K. et al.: Outlook for world trade, economic growth, globalization, and the resulting freight
flows, especially between the European Union and Russia. In: ETC Proceedings (2005)

[7] Otsuka, S.: Central Asia’s Rail Network and the Eurasian Land Bridge. In: Japan Railway and
Transport Review - Vol. No: 28. pp: 42-49 (2001)

[8] CIA – The World Fact Book – FieldListing: Railways. Available at:
https://www.cia.gov/library/publications/the-world-factbook/fields/2121.htm - 05/09/10

[9] Rodrigues R.: Mudança de Bitola Imperativo Nacional (2001). Available at: http://socgeografia-
lisboa.planetaclix.pt/transportes/bitola2.pdf - 05/09/10

[10] Marco Polo Programme: Available at: http://ec.europa.eu/transport/marcopolo/home/home_en.htm


- 05/09/10

[11] INSPIRE Directive. Available at: http://inspire.jrc.ec.europa.eu - 05/09/10

[12] Texas Transportation Institute: Traffic Congestion and Reliability - Trends and Advanced Strategies
for Congestion Mitigation (2005)

[13] Tokuyama H.: Intelligent Transport Systems in Japan (1996) Available at:
http://www.tfhrc.gov/pubrds/fall96/p96au41.htm - 05/09/10

[14] Bertini, R., et Al.: Benefits of Intelligent Transportation Systems Technologies in Urban Areas: A
Literature Review - Final Report. Portland State University, Center for Transportation Studies (2005)

91
[15] Leduc G.: Road Traffic Data: Collection Methods and Applications. JRC Techcnical Notes, JRC
47967, European Commission (2008)

[16] European Union Federation: European Road Statistics Publication (2009)

[17] Curtin, K., Noronha, V., Goodchild, M., Grisé, S.: ArcGIS Transportation Data Model (UNETRANS).
Technical Report (2003)

[18] Miller H., Shaw S.: GIS-T Data Models. In: Geographic Information Systems for Transportation:
Principles and Applications, Oxford University Press, ISBN 0195123948 (2001)

[19] Raines, A., Rowley, P.: Coordinated traffic management through data exchange. In: Road
Transport Information and Control 2008 and ITS United Kingdom Members' Conference. Manchester
(2008)

[20] European Commission: eMOTION Project (2006) Available at: http://www.emotion-project.eu/ - 05-
09-10

[21] HU, M., HaoTANG, Lee, D., SHI, Q.: Development of the Real-time Evaluation and Decision
Support System for Incident Management. In: Intelligent Transportation Systems, Vol.1 pp: 426-431,
IEEE Press (2003)

[22] Jiang, G., Gu, M., Han, G., Yang, X.: Traffic Incident Information Management Systems Based on
GIS-T. In: 7th International Conference on Intelligent Transportation Systems, Proceedings, pp: 527 -
530, IEEE Press (2004)

[23] Zhang, B., Deng, W., Mao, L.: Traffic Congestion Information Promulgating System Based on GIS-
T. In: Power Electronics and Intelligent Transportation Systems, pp: 467 - 471, IEEE (2008)

[24] Knibbe, W., Alkim, T., Otten, J., Aidoo, M.: Automated Estimation of Incident Duration on Dutch
Highways. In: Intelligent Transportation Systems, pp: 870-874, IEEE (2006)

[25] Chung, Y.: Development of an accident duration prediction model on the Korean Freeway Systems.
In: Accident Analysis and Prevention, Vol. 42, Issue: 1, pp:282-289, Elsevier (2010)

[26] Wei, C., Lee, Y.: Sequential forecast of incident duration using Artificial Neural Network models. In:
Accident Analysis and Prevention, Vol. 39, Issue: 5, pp:944-954, Elsevier (2007)

[27] Kim, W., Natarajan, S., Chang, G.: Empirical Analysis and Modeling of Freeway Incident Duration.
In: 11th International Conference on Intelligent Transportation Systems, pp: 453-457, IEEE (2008)

[28] Golob, T., Recker, W., Leonard, J.: An Analysis of the Severity and Incident Duration of Truck-
Involved Freeway Accidents. In: Accident Analysis and Prevention, Vol. 19, No. 4, pp. 375-395, August
(1987)

92
[29] Nam, D., Mannering, F.: An Exploratory Hazard-Based Analysis of Highway Incident Duration. In:
Transportation Research Part-A, Vol. 34A, No. 2, pp. 85-102, (2000)

[30] Khattak, A., Schofer, J., Wang, M.: A Simple Time Sequential Procedure for Predicting Freeway
Incident Duration. In: IVHS Journal, Vol. 2, No. 2, pp. 113-138, (1995)

[31] Smith, K., Smith, B.: Forecasting the Clearance Time of Freeway Accidents. In: Research Report,
STL-2001-01, Center for Transportation Studies, University of Virginia, Charlottesville, VA, (2001)

[32] European Commission: Directorate General for Transport and Energy: Datex II (version 1.0). User
Guide (2006)

[33] Raines, A., Rowley, P.: Coordinated Traffic Management through Data Exchange. In: Road
Transport Information and Control 2008 and ITS United Kingdom Members’ Conference. Manchester
(2008)

[34] Beaujardiere, W.: Web Map Service Implementation Specification (version 1.3.0). OGC Document
06-042 (2006)

[35] Vretanos, P.: Web Feature Service Implementation Specification (version 1.1.0). OGC Document
04-094 (2005)

[36] Gan, A., Liu, K.: A Robust Dynamic Segmentation Tool for Highway Safety Analysis. In:
Applications of Advanced Technology in Transportation, pp.263.268. Proceedings of 9th International
Conference, Chicago (2006)

[37] ESRI White Paper: Linear Referencing and Dynamic Segmentation in ArcGIS 8.1. Technical Report
(2001)

93

Você também pode gostar