Você está na página 1de 15

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

Pesquisa de Transporte Parte B 46 (2012) 85–99

Listas de conteúdos disponíveis emSciVerse ScienceDirect

Pesquisa de Transporte Parte B

j nossa página inicial : www. el sevier. com/ l oca te / t rb

Estimativa recursiva do intervalo de tempo médio do veículo usando dados de


detector de loop indutivo único

Baibing Li
School of Business & Economics, Loughborough University, Loughborough LE11 3TU, Reino Unido

informações do artigo abstrato

Historia do artigo: O intervalo de tempo do veículo é um importante parâmetro de tráfego. Afeta a segurança
Recebido em 10 de dezembro de 2010 Recebido em rodoviária, capacidade e nível de serviço. Os detectores de loop indutivo único são amplamente
forma revisada em 2 de agosto de 2011 Aceito em 2 de
implantados em redes rodoviárias, fornecendo uma riqueza de informações sobre o status atual do
agosto de 2011
fluxo de tráfego. Neste artigo, realizamos uma análise Bayesiana para estimar online o tempo médio
de avanço do veículo usando os dados coletados de um único detector de loop indutivo.
Consideramos três cenários diferentes, ou seja, condições de tráfego leve, congestionado e
Palavras-chave:
perturbado, e desenvolvemos um conjunto de equações de estimativa recursiva unificada que pode
Análise Bayesiana
ser aplicada a todos os três cenários. A sobrecarga computacional de atualizar a estimativa é
Característica de fluxo microscópico
Estimativa recursiva reduzida ao mínimo. O método recursivo desenvolvido fornece uma forma eficiente para o
Detector de loop único monitoramento online da segurança viária e do nível de serviço.
Avanço do tempo do veículo - 2011 Elsevier Ltd. Todos os direitos reservados.

1. Introdução

Os detectores de loop indutivo único são amplamente implantados em redes rodoviárias e desempenham um papel fundamental em
sistemas de transporte inteligentes. As medições fornecidas por um detector de loop único incluem volume de tráfego e ocupação.Li (2009)
investigaram a estimativa da velocidade média do veículo usando os dados de um detector de loop único, onde a análise estatística da
velocidade do veículo foi baseada nas medições de ocupação e foi realizada condicionalmente às medições de volume de tráfego. Do ponto
de vista da extração de informações, as medições do volume de tráfego não são totalmente utilizadas. Este artigo é complementar ao
trabalho emLi (2009)e visa extrair as informações contidas nas contagens de tráfego medidas para estimar o tempo médio de avanço do
veículo.
O intervalo de tempo do veículo é uma das características microscópicas mais fundamentais do fluxo de tráfego; afeta a segurança, a capacidade e o
nível de serviço das estradas. Também é crucial para a compreensão do comportamento do motorista e desempenha um papel importante na teoria do
acompanhamento do carro e nos estudos de simulação microscópica.Brackstone et al., 2009; Kim e Zhang, 2011). Por exemplo, o estudo empírico em
Chang e Kao (1991)mostrou que o comportamento de mudança de faixa está intimamente relacionado ao avanço do tempo do veículo. Portanto, as
informações sobre o tempo de deslocamento dos veículos podem nos ajudar a compreender melhor o comportamento dos motoristas nas vias.

Devido à dificuldade na coleta de dados, a maioria dos estudos existentes sobre o tempo de avanço do veículo foca na análise estática.Piao e
McDonald (2003)eMarsden et ai. (2003)projetaram recentemente um novo dispositivo móvel para coleta de dados para que as diferenças no
comportamento de condução possam ser avaliadas em várias condições de tráfego. Nesses estudos, os dados de acompanhamento de carros foram
coletados usando um veículo instrumentado equipado com uma série de sensores que permitem a medição de intervalos de tempo entre o veículo
instrumentado e o veículo seguinte. No entanto, devido ao custo do dispositivo e da mão de obra, essa abordagem não pode ser amplamente utilizada
para coleta de dados de rotina em redes rodoviárias.

Endereço de email:b.li2@lboro.ac.uk

0191-2615/$ - veja a capa - 2011 Elsevier Ltd. Todos os direitos reservados.


doi:10.1016/j.trb.2011.08.001
86 B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99

Zhang et ai. (2007)considerado outra abordagem. Eles usaram os dados coletados de um detector de loop indutivo duplo para analisar o avanço do
tempo do veículo. Um detector de loop duplo pode fornecer informações sobre o fluxo de tráfego veículo a veículo, portanto, o avanço do tempo do
veículo pode ser estimado com alta precisão emZhang et ai. (2007). Além disso, como os dados são registrados automaticamente, o custo da mão de
obra é reduzido ao mínimo. No entanto, esta abordagem tem uma limitação: os dispositivos de recolha de dados, ou seja, detectores de circuito duplo,
não são móveis nem amplamente implantados nas redes rodoviárias, pelo que a informação sobre o tempo de avanço do veículo está disponível apenas
para os locais onde são implantados detectores de circuito duplo. Em contraste, os veículos instrumentados usados por Piao e McDonald (2003)e
Marsden et ai. (2003)pode ser levado a praticamente qualquer lugar para coletar dados para que as diferenças no comportamento dos motoristas
possam ser comparadas. Por exemplo,Marsden et ai. (2003)investigaram três tipos de estradas, ou seja, autoestradas urbanas, estradas arteriais
urbanas e ruas urbanas, em vários locais diferentes no Reino Unido, França e Alemanha.
Os estudos mencionados acima são análises estáticas onde a estimativa de headway não pode ser atualizada rapidamente à medida que uma nova observação é
coletada. Os resultados obtidos são úteis para planejamento de transporte de longo prazo ou estudos de simulação, mas não podem ser usados para
monitoramento de tráfego online em sistemas de transporte inteligentes.
Em comparação com os detectores de loop duplo, os detectores de loop indutivo único (ILDs) são mais baratos e muito mais amplamente
instalados. Nos últimos anos, ILDs únicos têm sido usados para analisar vários problemas de tráfego, incluindo a estimativa de velocidade
veicular.Dailey, 1999; Hazelton, 2004; Li, 2009), a detecção de acidentes (Cheu e Ritchie, 1995; Khan e Ritchie, 1998), e a estimativa do tempo
de viagem (Dailey, 1993; Petty et ai., 1998; Liu et al., 2007). Recentemente,Dailey e Wall (2005)sugeriram estimar o tempo médio de avanço do
veículo usando dados de loop único. Como os ILDs únicos são implantados na maioria dos trechos rodoviários de redes de rodovias
estratégicas para coleta de dados, essa abordagem torna amplamente viável a estimativa on-line do avanço e, portanto, o monitoramento on-
line da segurança rodoviária.
A abordagem incorporada neste artigo se desvia dos métodos convencionais para análise de headway. Segue a abordagem
Bayesiana desenvolvida emLi (2009)para estimar o headway médio. O objetivo deste artigo é aprimorar o estimador desenvolvido
porDailey e Wall (2005)abordando as seguintes questões. Primeiro, para acomodar a natureza dos dados de tráfego coletados
online, desenvolveremos uma abordagem recursiva. Ao contrário do estimador deDailey e Wall (2005) que depende apenas da única
observação coletada no intervalo de tempo atual, a estimativa do parâmetro headway médio neste artigo é atualizada
recursivamente através de uma abordagem bayesiana onde a estimativa atual é uma média ponderada da estimativa anterior e da
observação atual. Uma vez que muito mais informação é usada na estimativa, ela oferece potencial para melhoria na qualidade da
estimativa. Em segundo lugar, além de uma estimativa pontual do intervalo médio, também fornecemos uma medida de incerteza
calculando o intervalo de credibilidade Bayesiano associado e a variância posterior. Finalmente, examinamos o avanço do tempo do
veículo em várias condições de tráfego, incluindo tráfego leve e congestionado, bem como o tráfego perturbado por fatores como
sinais de trânsito, ultrapassagem de carros e mudanças de faixa.
Este artigo está estruturado da seguinte forma. Seção2é dedicado à formulação de problemas. Na seção3consideramos o cenário de tráfego leve e
investigamos a estimativa recursiva do tempo médio de avanço do veículo. Os resultados são então estendidos para tráfego congestionado e condições
de tráfego perturbadas na Seção4. Um algoritmo unificado é desenvolvido na Seção5. Em seguida, na Seção6análises numéricas são realizadas para
ilustrar o método. Por fim, as considerações finais são oferecidas na Seção7. Todas as demonstrações de teoremas são dadas no Apêndice.

2. Formulação do problema

2.1. Dados de um único ILD

O intervalo de tempo é o tempo decorrido entre a passagem da frente do veículo líder em um ponto da pista e a passagem da frente do
veículo seguinte no mesmo ponto. Devido às limitações de muitos sensores comumente usados em engenharia de tráfego, a maioria dos
estudos existentes se concentra no intervalo de tempo médio em intervalos de tempo com uma duração pré-especificada (ver, por exemplo,
Chang e Kao, 1991; Basu e Maitra, 2010). Em particular, os dados de tráfego medidos de um único ILD não estão no nível do veículo individual,
mas as informações relevantes são agregadas em cada intervalo de tempo de duração fixa (digamos, 20 ou 30 s). Portanto, neste artigo,
focaremos no parâmetro headway médio em cada intervalo de tempo durante o qual os dados de tráfego são agregados.
Agora considere um único ILD que mede o fluxo de tráfego durante um período de tempo que é dividido em vários intervalos de tempo
sucessivos, cada um com uma duração fixa deT.Durante cada intervalo de tempok,dados medidos pelo único ILD incluem (ver, por exemplo
Dailey, 1999; Hazelton, 2004; Li, 2009):

- volume de trafegomkdefinido como o número de veículos que entram na borda frontal do ILD no intervalo de tempok;
- ocupaçãoOkdefinido como a porcentagem de tempo que o ILD está ocupado no intervalo de tempok.

Portanto, é o par de dados {mk,Ok} que estão disponíveis no ILD em cada intervalo de tempok (k =1, 2, . . .).

2.2. Modelos estatísticos para volume de tráfego

Em vez de investigar o avanço do tempo do veículo usando dados de ocupaçãoOkComoDailey e Wall (2005)fizemos, focamos no volume de
tráfegomk. Como veremos mais adiante, muita atenção tem sido dada ao volume de tráfego e muitos modelos sofisticados foram
desenvolvidos para ele na engenharia de tráfego. Isso nos permite investigar o avanço do tempo sob várias condições de tráfego.
B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99 87

Quando o tráfego é leve e não há fatores perturbadores, como semáforos e mudanças de faixa, o modelo mais utilizado para
volume de tráfego são as distribuições de Poisson:

mkjk-PoissonðkTºcomk >0; ð2:1º

OndeTé a duração de cada intervalo de tempo durante o qual os dados são agregados pelo único ILD eké a taxa média de chegada.
PoissonðkTºdenota uma distribuição de Poisson com função de massa de probabilidadepðmk;kÞ ¼ ðkTºmkexpðkTÞ=mk!. A recíproca
da taxa média de chegadak,s¼1=k,é o intervalo de tempo médio no nível agregado, que é o parâmetro de interesse neste artigo.

Uma medida útil para caracterizar a condição do tráfego na engenharia de tráfego é a razão entre a variação e o volume médior.Quando o
tráfego é leve e pode ser modelado aproximadamente por uma distribuição de Poisson, a razão é igual a um,r1.
Na realidade, no entanto, a razão da variância para o volume médio pode se desviar muito da unidade, indicando que as distribuições de
Poisson não são mais um modelo adequado. Em particular, quando o tráfego se torna mais pesado, a liberdade de manobra é diminuída e,
assim, a variação do volume de tráfego é reduzida, resultando em uma razão entre a variação e a média.rque é substancialmente menor que
1. Em tal condição de tráfego, as distribuições binomiais são geralmente mais apropriadas do que as distribuições de Poisson para modelar o
volume de tráfego (Gerlough e Huber, 1975):

mkjðs;qº -Caixaðq;T=ðquadradoÞÞcom 0 <T=ðquadradoÞ <1; ð2:2º


--
n pºnmk.
OndeCaixa(n, p)denota uma distribuição binomial com função de massa de probabilidadepðmk;n; pÞ ¼ pmkð1
mk
O volume de tráfegomkna Eq.(2.2)tem uma média deT/scom parâmetro de intervalo médios. A variação do volume de tráfego mké igual a (
T/s){1T/(sq)}que é afetado pelo parâmetro de difusãoq.Em particular, a variância se aproxima de zero quando T/(quadrado)?1, refletindo o
fato de que para tráfego muito congestionado a chegada de veículos por intervalo de tempo é quase constante. Por outro lado, o modelo
estatístico(2.2)colapsa para uma distribuição de Poisson(2.1)ComoT/(quadrado)?0. Observamos também que a razão entre variância e volume
médior =1T/(quadrado)é sempre menor que a unidade para a distribuição binomial(2.2). Na engenharia de tráfego, sabe-se há muito tempo
que, para tráfego congestionado, as distribuições binomiais se ajustam muito melhor ao volume de tráfego do que as distribuições de
Poisson.
Em seguida, consideramos outro cenário importante em que o fluxo de tráfego é perturbado por fatores como sinais de trânsito,
ultrapassagem de carros e mudanças de faixa. Esses fatores de perturbação levam a uma maior variabilidade no volume de tráfego e a razão
entre variância e média torna-se substancialmente maior que 1. Distribuições binomiais negativas são comumente usadas nesta situação (
Gerlough e Huber, 1975):

mkjðs;qº -Caixa pretaðq;quadrado=Tº; ð2:3º

1,5 1,5
proporção suavizada

proporção suavizada

1 1

0,5 0,5
0 6 12 18 24 0 6 12 18 24
hora do dia hora do dia

1,5 1,5
proporção suavizada

proporção suavizada

1 1

0,5 0,5
0 6 12 18 24 0 6 12 18 24
hora do dia hora do dia

Figura 1.A razão suavizada da variação para o volume médio ao longo do tempo na faixa norte 2 (superior esquerda), faixa norte 3 (superior direita), faixa sul 2
(inferior esquerda) e faixa sul 3 (inferior direita).
88 B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99

OndeNeg bin(a, b)denota uma distribuição binomial negativa com função de massa de probabilidadepðmk;uma; bÞ ¼
- -
mkºuma 1 uma mk.
b 1
uma1 bº1 bº1

O volume de tráfegomkna Eq.(2.3)tem uma média deT/scom parâmetro de intervalo médios. A variação do volume de tráfego mké igual a (
T/s){1 +T/(sq)}que é afetado pelo parâmetro de difusãoq.Em particular, a variância é bastante inflada à medida que T/(quadrado)torna-se
grande. Por outro lado, o modelo estatístico(2.3)colapsa para uma distribuição de Poisson(2.1)ComoT/(quadrado)?0. Além disso, a razão da
variância para o volume médio é sempre maior que a unidade,r =1 +T/(quadrado) >1, para distribuições binomiais negativas(2.3).

Todos os três modelos estatísticos para volume de tráfego são frequentemente aplicados na literatura de engenharia de tráfego, embora
a distribuição de Poisson seja mais comumente usada (por exemplo,Hazelton, 2001; Li, 2005). Por exemplo,Basu e Maitra (2010)realizou uma
pesquisa em um dia de trabalho típico para coletar as contagens de tráfego principal de 5 minutos em diferentes cruzamentos.Lan (2001)
investigaram um preditor de fluxo de tráfego baseado em uma estrutura de modelo linear generalizado dinâmico. Ambos os artigos
utilizaram a razão variância-média para diferenciar as três distribuições estatísticas. Em outras aplicações,Nakayama e Takayama (2003), e
Kitamura e Nakayama (2007)incorporou distribuição binomial para caracterizar o volume de tráfego, enquantoTian e Wu (2006)assumiram
uma distribuição binomial negativa em sua análise.
Antes de concluir esta seção, consideramos um exemplo de tráfego real medido por um único ILD em um dia da semana (quinta-
feira). Os dados únicos de ILD foram baixados emhttp://www.its.washington.edu/tdad. Os dados baixados incluíram medições de
volume e ocupação durante cada intervalo de tempo de 20 s por 24 h. O ILD está localizado no norte de Seattle, na Interstate-5, com
três faixas nas direções norte e sul.
Figura 1exibe a razão variância-média suavizada ao longo da hora do dia na pista 2 e na pista 3 para ambas as direções. Pode ser visto de
Figura 1(superior esquerdo e inferior esquerdo) que, exceto no período da madrugada em que o tráfego era leve e a razãorestava próximo da
unidade, o tráfego ficou congestionado tanto na pista norte quanto na pista sul 2 ao longo do dia. Este foi caracterizado por uma baixa razão
de variância para volume médio, sugerindo assim que um modelo de distribuição binomial seja uma escolha melhor do que o de Poisson.

Por outro lado, as terceiras faixas são faixas de ultrapassagem. Para as direções norte e sul, o tráfego na pista 3 exibiu uma variabilidade
muito maior durante o dia (verFigura 1, superior direito e inferior direito), exceto no horário de pico da tarde. Presumivelmente, esta foi a
consequência de ultrapassagem de carro e mudança de faixa. As distribuições binomiais negativas, portanto, forneceriam um ajuste melhor
do que as distribuições de Poisson nessa situação.

3. Estimativa recursiva de headway médio para tráfego leve

Nesta seção, consideramos a inferência estatística para o parâmetro headway médio sob a condição de tráfego leve. Ao longo
desta seção assume-se que não há fator de perturbação para que o volume de tráfego siga uma distribuição de Poisson(2.1)com
função de massa de probabilidadepðmk;s1Þ ¼ ðT=sºmkexpðT=sÞ=mk!. Reuniremos a observação atual sobre o volume de tráfego e as
informações obtidas nos intervalos de tempo anteriores e realizaremos a análise Bayesiana para o parâmetro de headway médios.

3.1. Inferência Bayesiana

Começamos com o primeiro intervalo de tempo,k =1. Assume-se que durante este intervalo de tempo, não há conhecimento prévio sobre
o parâmetro de intervalo médios. Portanto, uma priorização não informativa é usada para que a inferência subsequente não seja afetada por
informações externas aos dados atuais. Ao longo deste artigo, as prioris não informativas são escolhidas usando o princípio de Jeffrey. Para a
distribuição de PoissonPMk;s1), o princípio de Jeffrey leva à seguinte priorização não informativa:

pðsÞ / jEUðsÞj1=2¼s3=2; ð3:1º

OndeEU(s) é a informação de Fisher paras.


Agora aplicando a regra de Bayes para combinar(3.1)com probabilidade(2.1)PMk;s1), obtemos a seguinte distribuição posterior de
sno primeiro intervalo de tempo:
pðsjm1º /pðsºpðm1;s1Þ / ðT=sºðm1º3=2ºexpfT=sg:
Assim, a distribuição posterior desé uma distribuição gama inversainvC(m1+ 1/2,T)com média posterior igual a
eu1=T/(m1 1/2) e uma variância posterior igual aeu2 1=ðm1 3=2º,OndeinvC(uma,b)denota uma distribuição gama inversa
tendo função de densidade de probabilidadeg(t) = {buma/C(uma)}t (uma+1)exp (b/t),eC(uma) é a função gama. Deixaruma2=m1+ 1/2. Então

a distribuição posterior desno intervalo de tempok =1 pode ser reescrito comoinvC(uma2, (uma2 1)eu1).
Agora voltando para o próximo intervalo de tempok (k =2, 3, . . .), especificamos o intervalo de tempo anteriorkcomo a posterior obtida no intervalo
de tempok1:

k-dentrovCðumak;ðumak 1ºeuk1º; ð3:2º

onde a média anterior é igual aeuk 1e a variância anterior é igual aeu2 =ðuma 2º.A média anterior representa uma estimativa
k1 k

do parâmetro de intervalo médiosobtidoa priori.O hiperparâmetroumakestá associado com a precisão do


B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99 89

informação sobres. Observe que essa distribuição anterior reflete o conhecimento prévio sobre o parâmetro de intervalo médio para o intervalo de
tempo 'local'ksó. Ao longo de todo o período de tempo de interesse (por exemplo, um dia), o intervalo de tempo geralmente evolui ao longo do tempo e
o anterior 'local' muda de acordo.
Agora aplicamos a regra de Bayes para combinar a probabilidade(2.1)PMk;s 1) com prévio(3.2). Pode ser mostrado por alguma álgebra que a
distribuição posterior desé
sjmk- dentrovCðumakºmk;ðumakºmk 1ºeukº; ð3:3º

Onde
euk¼xkeuk1þð1xkºT=mk; ð3:4º

é a média posterior com pesoxk= (umak 1)/(umak+mk 1), e a variância posterior é


varðsjmkÞ ¼eu2k=ðumakºmk 2Þ¼̂VP: ð3:5º

Usamos a média posterior como uma estimativa do parâmetro de headway médio. Observe que o intervalo de tempo médio
observado atualmentekéT/mkque geralmente é considerado como uma estimativa bruta des. Da Eq.(3.4), a estimativa atual de
sé uma média ponderada da estimativa anterioreuk1e a estimativa bruta atualT/mk.
Agora, para avaliar a incerteza da estimativa, construímos um intervalo confiável para o parâmetro headway. A partir da distribuição
posterior desdentro(3.3), um intervalo de 95% de credibilidade paraspode ser obtido:
ð2ðumakºmk 1ºeuk=v20:025ð2ðumakºmkÞÞ;2ðumakºmk 1ºeuk=v20:975ð2ðumakºmkÞÞÞ; ð3:6º

Ondev2 umaðdfºé o valor para a distribuição qui-quadrado comdfgraus de liberdade que fornecem uma probabilidade deumapara o
direito dov2 umaðdfºvalor.
Agora, passando para o próximo intervalo de tempo, tratamos a distribuição posterior(3.3)obtido no intervalo de tempokcomo a distribuição anterior
no intervalo de tempok +1:

s-dentrovCðumakº1;ðumakº1 1ºeukº; ð3:7º


onde o parâmetro de difusão é atualizado comoumak+1=umak+mk. Assim, quando uma nova observaçãomk+1está disponível no intervalo de tempo k +1,
a estimativa despode ser atualizado conforme descrito acima.

3.2. Estimativa recursiva

Para tráfego real, o parâmetro de intervalo médiosevolui lentamente ao longo do tempo. Para levar isso em consideração, seguimosLi (2009) e
defina um fator de esquecimento para que as observações coletadas em momentos diferentes sejam ponderadas de forma diferente, com as últimas
observações recebendo os maiores pesos. Especificamente, em vez de(3.7), a distribuição anterior agora é especificada como

s-dentrovCðdumakº1;ðdumakº1 1ºeukº;

Ondedé um fator de esquecimento situado no intervalo (0, 1). Este fator não afeta a média anterior desmas sua variação anterior é
inflada, refletindo o fato de quea prioritemos menos certeza sobre o valor atual desdevido a sua evolução. Isso resulta no seguinte
algoritmo para a estimativa recursiva des:

Algoritmo 1.A estimativa do avanço médio do veículo.

Dado: duração do intervalo de tempoT;fator de esquecimentod;parâmetros anteriores iniciais:uma1= 1/2 eeu0= 0. Para
k=1:K
Etapa 1. Colete a medição atual do volume de tráfegomk; Etapa 2.
Calcular o pesoxk= (umak 1)/(umak+mk 1);
Etapa 3. Estime o parâmetro de intervalo médiosporeuk=xkeuk1+ (1xk)T/mk;
Etapa 4. Calcular a variância posteriorVP¼eu2 k=ðumakºmk 2º;
Etapa 5. Atualize o parâmetro de difusão:umak+1=d(umak+mk);
Fim.

Se não houver nenhum veículo passando pelo ILD em um intervalo de tempok,então, de acordo com a teoria Bayesiana, a distribuição posterior
permanece a mesma que a distribuição anterior. Por isso definimoseuk=euk1eumak+1= máximo (uma1,dumak).
É claro que quando o fator de esquecimentodtorna-se maior (menor), a estimativa do intervalo médio torna-se mais suave (mais áspera).
Em particular, quandodé tomado como 0, todas as informações coletadas anteriormente são descartadas e a estimativa atual é baseada
apenas na observação atualT/mk. Consulte a seção5,5para uma discussão mais aprofundada sobre a escolha do fator de esquecimento.

4. Outras extensões

Nesta seção, estendemos os resultados obtidos na análise anterior para tráfego leve para outros dois cenários, tráfego congestionado e
tráfego perturbado.
90 B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99

4.1. Tráfego congestionado

Conforme ilustrado emFigura 1, quando o tráfego se torna mais pesado, o volume de tráfego por intervalo de tempo é mais uniforme com
menor variabilidade. Para acomodar essa natureza, o modelo de Poisson será substituído por distribuições binomiais(2.2). Por simplicidade,
nesta subseção vamos focar na análise apenas para o parâmetro de interesse, ou seja, o parâmetro headway médios. O parâmetro de difusão
qsupõe-se que seja conhecido a partir de dados históricos. A estimativa deqserá investigado na Seção5.
Como antes, supomos que não temos conhecimento prévio sobresno intervalo de tempok =1 e especificamos a priori não
informativa de Jeffrey na análise a seguir.

Lema 1.Para a distribuição binomial(2.2), a priori não informativa de Jeffrey é


pðsÞ / ðqs=Tº3=2f1 1=ðqs=TÞg1=2: ð4:1º

Aplicando a regra de Bayes para combinar(4.1)com probabilidade(2.2)leva à seguinte distribuição posterior desno intervalo de
tempok =1:
pðsjm1Þ / ðqs=Tºðm1º3=2ºf1 1=ðqs=TÞgqm11=2:
Em geral, supomos que a posterior obtida no intervalo de tempok 1 (k=2, 3, . . .) tem a seguinte forma:
pðsÞ / ðqs=Tºðumakº1ºf1 1=ðqs=TÞgbkumak:

A posterior obtida no intervalo de tempok 1 agora é especificado como o anterior no intervalo de tempokque pode ser reescrita como

pðsÞ / ðs=euk1ºðumakº1ºfbk ðumak 1Þ=ðs=euk1Þgbkumak; ð4:2º

com média anterior deeuk1=bkT/{q(umak 1)}.


Agora aplicamos a regra de Bayes para combinar a distribuição prévia(4.2)com a observação atual sobre o volume de tráfego na Eq.(2.2)para derivar
a distribuição posterior no intervalo de tempok.O principal resultado está resumido abaixo:

Teorema 1.Suponha que condicional ems, volume de trafegomksegue uma distribuição binomial(2.2)com um parâmetro de difusão
conhecidoq.Então, para a distribuição prévia desespecificado por(4.2), a distribuição posterior decB(quadrado/T distribuição
1) temcom
umF
graus de liberdadeBk=2(bk+q umam k k+1) eUMAk=2(umak+mk) respectivamente, ondecB= (umak+mk)/
(bk+qak mk+1) é constante. A média posterior desÉ dado por
euk¼xkeuk1þð1xkºT=mk; ð4:3º

com pesoxk= (umak 1)/(umak+mk 1), e a variância posterior desÉ dado por

varðsjmkÞ ¼VPðbkºqak mkº1Þðbkºq1Þðbkºqº2; ð4:4º


OndeVPé definido na Eq.(3.5). Além disso, um intervalo de 95% de credibilidade parasé

ð~cBeukðF0:975ðBk;UMAkÞþ1º; ~cBeukðF0:025ðBk;UMAkÞþ1ÞÞ;

onde ~cB¼c1 Bðumakºmk 1Þðbkºqº1.Fuma(a, b)é o valor paraFdistribuição com graus de liberdadeumaebque pro-
apresenta uma probabilidade deumaà direita doFuma(a, b)valor.
Passando agora para o próximo intervalo de tempo, a distribuição a posteriori obtida no Teorema 1 é tratada como a distribuição a priori no
intervalo de tempok +1. Pode ser reescrito como

pðsÞ / ðs=eukºðumakº1º1ºfbkº1 ðumakº1 1Þ=ðs=eukÞgbkº1umakº1; ð4:5º


com os parâmetros atualizadosumak+1=umak+mkebk+1=bk+q.A distribuição prévia em(4.5)tem a mesma forma funcional da Eq.(4.2). Assim,
quando uma nova observaçãomk+1torna-se disponível, o Teorema 1 pode ser aplicado novamente para obter a distribuição a posteriori no
intervalo de tempok +1 e a estimativa despode ser atualizado usando a Eq.(4.3). Além disso, notamos que quandok é grande,bk+1=bk+qnão é
pequeno. Neste caso, a Eq.(4.4)pode ser simplificado:

varðsjmkº VPf1ðumakºmk 1Þ=ðbkºqÞg: ð4:6º

4.2. Trânsito perturbado

Como mostrado emFigura 1, quando o fluxo de tráfego é perturbado por fatores como ultrapassagem de carros e mudança de faixa, o volume de
tráfego pode ter maior variabilidade. Nesta situação, as distribuições binomiais negativas fornecem um melhor ajuste. Como antes, assumimos que o
parâmetro de difusãoqna Eq.(2.3)é conhecido. Discutiremos brevemente a análise Bayesiana para o parâmetro de intervalo médios
abaixo de.

Primeiro, a priorização não informativa de Jeffrey é especificada para intervalo de tempok =1.

Lema 2.Para a distribuição binomial negativa(2.3), a priori não informativa de Jeffrey é

pðsÞ / ðqs=Tº1ð1ºqs=Tº1=2: ð4:7º


B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99 91

A distribuição dada no Lema 2 é um conjugado natural anterior da distribuição binomial negativa. Como demonstrado mais tarde no
Teorema 2, ela está ligada a uma transformaçãoFdistribuição.

Em geral, motivados pelo Lema 2, supomos que a posterior obtida no intervalo de tempok Formato: 1 tem o seguinte

pðsÞ / ðqs=Tºbk1ð1ºqs=Tºðumakºbkº;
que pode ser reescrita como

pðsÞ / ðs=euk 1ºðbk1ºfð umak 1Þþbkðs=euk1Þgðumakºbkº; ð4:8º

com uma média deeuk 1=bkT/{q( umak 1)}. A distribuição em(4.8)é especificado como o anterior no intervalo de tempok.Agora podemos obter
o posterior no intervalo de tempokpela regra de Bayes.

Teorema 2.Suponha que condicional ems, volume de trafegomksegue uma distribuição binomial negativa(2.3)com um parâmetro de
difusão conhecidoq.Então, para a distribuição prévia desespecificado por(4.8), a distribuição posterior decNBqs/Ttem umF
distribuição com graus de liberdadeBk=2(bk+q)eUMAk=2(umak+mk) respectivamente, ondecNB= (umak+mk)/(bk+q)é constante. A
média posterior desÉ dado por

euk¼xkeuk1þð1xkºT=mk; ð4:9º

com pesoxk= (umak 1)/(umak+mk 1), e uma variação posterior desÉ dado por
varðsjmkÞ ¼VPf1þðumakºmk 1Þ=ðbkºqÞg: ð4:10º

Um intervalo de 95% de credibilidade parasé

ð~cNBeukF0:975ðBk;UMAkº; ~cNBeukF0:025ðBk;UMAkÞÞ; ð4:11º

com ~cNB¼ ðumakºmk 1Þ=ðumakºmkº.


Agora atualizamos os parâmetrosumak+1=umak+mkebk+1=bk+qde modo que a distribuição a posteriori obtida no Teorema 2 pode ser
reescrita como

pðsÞ / ðqs=Tºbkº11ð1ºqs=Tºðumakº1ºbkº1º:
Este posterior é tratado como a distribuição a priori no intervalo de tempok +1. Portanto, inferência estatística parasno intervalo de tempo k +1 pode
ser desenhado de maneira semelhante.

5. Um algoritmo unificado

Nesta seção, primeiro investigaremos como estimar o parâmetro de difusãoqe então desenvolver um algoritmo unificado que
possa acomodar todas as três condições de tráfego discutidas nas seções anteriores.

5.1. Estimativa do parâmetro de difusão pelo método dos momentos

Na prática, antes que o método recursivo anterior seja aplicado, o parâmetro de difusãoqprecisa ser estimado a partir de dados
históricos. Nesta subseção nos concentramos no método dos momentos. Suponha que coletamos alguns volumes de tráfego do
ILD,mk(k =1, . . . ,n),na mesma condição de tráfego. A média amostral Ê e a variância V̂ podem assim ser calculadas.
Primeiro vamos considerar a distribuição binomial(2.2). DeixarEeVdenotar a média teórica e a variância da distribuição binomial
(2.2)respectivamente. É fácil mostrar que

q¼E2=ðVEº: ð5:1º

Por issoqpode ser estimado substituindoEeVcom suas contrapartes de amostra Ê e V̂ .


A estimativa do parâmetro de difusãoqna distribuição binomial negativa(2.3)pode ser obtido da mesma forma. DeixarEeV ser a
média teórica e a variância da distribuição(2.3)respectivamente. Então podemos obter

q¼E2=ðVEº: ð5:2º

Novamente, o método dos momentos pode ser usado para estimarqsubstituindoEeVcom suas contrapartes da amostra, Ê e V̂ .
Claramente, quando a variância amostral V̂ é suficientemente próxima da média amostral Ê, o parâmetro de difusão estimadoq
se tornará muito grande em ambas as Eqs.(5.1) e (5.2). Neste caso, uma distribuição de Poisson é uma alternativa adequada. Na
verdade, comoqtorna-se grande, a distribuição binomial(2.2)e distribuição binomial negativa(2.3)se aproximará da distribuição de
Poisson(2.1)sob certas condições.
Na prática, podemos dividir todo o período de interesse (por exemplo, um dia) em vários subperíodos relativamente pequenos durante os
quais o fluxo de tráfego é aproximadamente estacionário. Em seguida, estimamos o valor deqpara cada subperíodo. Consequentemente, ao
longo do dia podemos obter uma função por partes deqpara a estimativa online do parâmetro de intervalo médio.
92 B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99

Na próxima subseção, investigaremos uma abordagem mais sofisticada para a estimação do parâmetro de difusão.

5.2. Uma abordagem Bayesiana para estimar o parâmetro de difusão

Em seguida, levamos em conta a não estacionaridade do fluxo de tráfego e desenvolvemos uma abordagem bayesiana para estimar o parâmetro de
difusãoq.Considere o fluxo de tráfego não estacionário onde o headway médio evolui ao longo do tempo e é modelado por meio de um passeio
aleatório:

sk¼sk1ºek comek- Nð0; 1=Wº;


Ondew = r2é o parâmetro de precisão. Deixarp(sk|sk1,W)denotar a distribuição condicional deskep(s1) denotam a distribuição do
parâmetro headway inicials1. Suponha que sabemos pouco sobres1a prioriep(s1) é tomado como uma distribuição uniforme ao
longo de um intervalo (0,C).
Agora considere uma amostra dencontagem de tráfego,mk(k =1, . . . ,n),coletado sobrenintervalos de tempo sucessivos. Deixarf(mk|sk,q)
denotar a distribuição binomial(2.2)ou distribuição binomial negativa(2.3). Para completar a especificação do modelo na análise Bayesiana,
precisamos especificar os priors paraWeq.Usamos a priori não informativa paraWeqna análise: o anteriorg(W)doW
é escolhido como uma distribuição gamaGama (um1,b1) e o anteriorg(q)doqé escolhido como uma distribuição gamaGama (um2,b2), onde os
hiperparâmetrosumaeuebeu(eu =1, 2) são pequenos.
Aplicando a regra de Bayes, a distribuição a posteriori é dada por

Sn Sn
fðs1; . . . ;sn;W;qÞ ¼ fðmkjsk;qº pðskjsk1;Wºpðs1ºgðWºgðqº:
k¼1 k¼2

O posterior acima pode ser simulado usando uma abordagem numérica e o parâmetroqpode ser estimado como sua média
posterior. Para isso, seguimosHazelton (2004)e use o seguinte algoritmo MCMC para simular sorteios do acima
distribuição posterior ondesðtº k,q(t)eW(t)denotar os valores desk,qeWnotª iteração (t =1, 2, . . .) respectivamente:

Algoritmo 2.A estimativa do parâmetro de difusão.

Dado: duração do intervalo de tempoT;volume de trafegomk(k=1, . . . ,n)comm1– 0.


Etapa 1. Inicialização.t =1. Definirskðtºigual à estimativa brutaT/mkE semk–0; por outro ladosðtº¼sðtºk.Definir
k1
W(t)=1 eq(t)
igual a(5.1)ou(5.2), dependendo da distribuição subjacente especificada. Etapa 2.
Parak=1:n
(a) Gere um valor candidato de intervalo de tempo médiok,sðpº, da distribuição
k
da propostaq(s), Onde
q(s) É dado porNðsðtº2; 1=WðtººE sek=1;q(s) É dado porNððsðtº k 1
ºsðtºkº1
Þ=2; 1=ð2WðtºÞÞse 1<k<n;eq(s) É dado por
Nðsðtº
n1;1=WðtººE sek=n.

(b) Defina a probabilidade de aceitação como

!
k;qðtºº
fðmkjsðpº
r1¼min 1; :
k;qðtºº
fðmkjsðtº

Aceitarsðpº
k
com probabilidader1. Se o candidato for aceito, deixesðtº1º k ¼sðpº
k
; por outro ladoskðtº1º ¼sðtº
k.
Etapa 3. GerarW(t+1)da distribuição gama

!
Xn sðtº sðt Þ 2
Gama a1þðn1Þ=2;b1º0:5 k k 1 :
k¼2

Etapa 4. Gere um valor candidato deq, q(p), da distribuição da propostaN(q(t),t2), Ondeté um parâmetro de ajuste
que pode ser ajustado durante a simulação. Defina a probabilidade de aceitação como

0 1
Q
n
fðmkjskþ Þ ;qðpººgðqðpººC
ðt 1
B
B 1;k¼1 C
r2¼min B Q C:
@ n ðtºº
fðmkjsðtº1º
k ;qðtººgðq UMA
k¼1

Aceitarq(p)com probabilidader2. Se o candidato for aceito, deixeq(t+1)=q(p); por outro ladoq(t+1)=q(t). Etapa 5.
Atualizartport+1 e vá para o Passo 2 atétatinge um determinado tamanho.
B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99 93

No geral, o algoritmo MCMC acima é uma mistura de amostrador de Gibbs e algoritmo de Metropolis-Hastings. Em cada iteraçãot,
W(t+1)pode ser gerado diretamente. No entanto, os outros parâmetros são desenhados usando o algoritmo Metropolis-Hastings.

5.3. Robustez da estimativa de headway médio

Agora estendemos o Algoritmo 1 na Seção3.2aos cenários de trânsito congestionado e trânsito perturbado.


Primeiro, consideramos as médias posteriores. Comparando as Eqs.(3.4), (4.3) e (4.9)obtidos em diferentes condições de tráfego, podemos
ver que as três médias posteriores compartilham uma forma comum de fórmula:

euk¼xkeuk1þð1xkºT=mk:
Portanto, a fórmula recursiva usada para a estimativa permanece inalterada, independentemente da condição de tráfego e de qual
modelo estatístico é usado na análise.
No entanto, deve-se notar que, diferentemente da média móvel comum com peso constante, o método desenvolvido usa um peso
dependente do tráfego para agrupar informações coletadas em diferentes intervalos de tempo, uma vez que o pesoxk= (umak 1)/
(umak+mk 1) depende do volume de tráfegopor si.Para tráfego mais pesado (ou mais leve) com valores maiores (ou menores) de volume de tráfego
umemk, O pesoxkpara a estimativa anterioreuk1é inferior (ou superior).
Em seguida, nos voltamos para as variâncias posteriores. Semelhante a Seção3.2, introduzimos o fator de esquecimentode deixar
bk+1=d(bk+q) com um valor inicial deb0= 0. É simples obterbk+q = q{(1dk+1)/(1e)}.Substituindo nas Eqs.(4.4) e (4.10), e observando as
Eqs.(5.1) e (5.2), as fórmulas para as variâncias posteriores do headway médio sob condições de tráfego congestionado e perturbado
podem ser escritas de forma unificada:

varðsjmkÞ ¼VPf1þ½ðVEÞ=E2ðumakºmk1Þð1dÞ=ð1dkº1Þg: ð5:3º

Observe que a Eq.(5.3)também inclui o cenário de tráfego leve como seu caso especial: quando o tráfego é leve e não há fator perturbador,
em teoria temosE = V,e assim a Eq.(5.3)colapsa para a Eq.(3.5), ou seja, var(s|mk) =VP. Além disso, quandoké grande, temosdk+1? 0.
Normalmente este comportamento limitante é alcançado rapidamente. Assim, a variância posterior(5.3)pode ser ainda simplificado para ser:

varðsjmkº VPf1þ½ðVEÞ=E2ðumakºmk 1Þð1dÞg: ð5:4º

Pode ser visto de(5.4)que, embora as variâncias posteriores derivadas em diferentes condições de tráfego compartilhem a
mesma forma de fórmula(5.4)para fins de cálculo, a característica de incerteza associada à estimativa difere para diferentes
cenários. Em particular, dependendo do sinal deVE (ou seja, positivo, negativo ou zero), a variabilidade da estimativa posterior é
maior, menor ou igual ao valor de referênciaVP. Assim, em comparação com o tráfego leve, a variabilidade da estimativa posterior é
menor para o tráfego congestionado. Isso ocorre principalmente porque sob a condição de tráfego congestionado, a liberdade de
manobra é diminuída e, assim, o intervalo entre cada veículo líder e o veículo seguinte torna-se mais uniforme. A diminuição da
variabilidade do volume de tráfego leva a uma menor variação posterior do parâmetro headway médio. Da mesma forma, sob a
condição de que o tráfego seja perturbado, o intervalo entre um veículo líder e o veículo seguinte varia substancialmente,
resultando em uma variação posterior maior do parâmetro de intervalo médio.
Com base na discussão anterior, o Algoritmo 1 pode ser estendido para a estimativa do parâmetro de intervalo médio sob todas
as três condições de tráfego modificando o Passo 4:

Algoritmo Modificado 1 (A estimativa do headway médio do veículo).Etapa 4. Estime a variância posterior por VPf1þ½ðV̂
ÊÞ=Ê2ðumakºmk 1Þð1dÞg.

5.4. Previsão e validação do modelo

É importante verificar um modelo construído antes de aplicá-lo. Na prática, no entanto, é difícil comparar diretamente os valores
verdadeiros dos parâmetros com os valores estimados correspondentes, uma vez que os valores verdadeiros dos parâmetros de interesse
são normalmente desconhecidos. Para contornar este problema, os modelos construídos são geralmente validados comparando as medidas
das variáveis observáveis com os correspondentes valores previstos produzidos pelo modelo. Do ponto de vista do preditivismo, é a
precisão das previsões que é o teste final do modelo construído.Imprensa, 2003).
Nesta subseção investigamos as questões de previsão e validação do modelo. Para o problema de estimativa de intervalo médio, sejap(s|
mk) denotam a distribuição posterior do headway médiosno intervalo de tempok.De acordo com a análise anterior,p(s|mk) é dado pela Eq.
(3.3)ou pelo Teorema 1 ou 2, dependendo das condições de tráfego. Deixarf(mk+1|s) denotam a função de massa de probabilidade do volume
de tráfego no intervalo de tempok +1 que é dado pela Eq.(2.1), (2.2), (2.3).
A distribuição preditiva posterior do volume de tráfego no intervalo de tempok +1 é definido como (Imprensa, 2003):
Z
gðmkº1jmkÞ ¼ fðmkº1jsºpðsjmkºds:
94 B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99

Então a previsão um passo à frente tomada como a média da distribuição preditiva posterior é dada por
R
mkº1¼xgðxjmkºdx.O teorema a seguir fornece a previsão um passo à frente do volume de tráfego.

Teorema 3.Suponha que o volume de tráfegomksegue uma distribuição de Poisson(2.1)ou uma distribuição binomial(2.2)ou uma distribuição
binomial negativa(2.3). Se a priorização inicial for especificada como não informativa por meio do princípio de Jeffrey, a previsão de um passo
à frente do volume de tráfegomk+1pode ser calculado usando uma fórmula unificada abaixo:

mkº1¼ckðT=eukº; ð5:5º

Ondeck= (umak+mk)(bk+q)/[(umak+mk 1)(bk+q +1)] e por convenção escolhemosq = +1para distribuições de Poisson para que
ckdesmorona para (umak+mk)/(umak+mk 1) neste caso.
O Teorema 3 indica que a previsão um passo à frente do volume de tráfego m̂kº1obtido no intervalo de tempo atualké igual à
duração do intervalo de tempoTdividido pela estimativa atual do intervalo médioeuke ajustado por um fator de
ck.
Na prática, para validar o método desenvolvido neste artigo, calculamos a previsão um passo à frente m̂kº1em cada intervalo de tempok.
Em seguida, comparamos m̂kº1ao volume de tráfego realmk+1observado no intervalo de tempok +1 (k =1, . . . ,n).O desempenho geral do
método desenvolvido é avaliado através da raiz quadrada do erro quadrático médio (RMSE):
( ) 1=2
Xn
RMSE¼ ðm̂k mkÞ 2=ðn 1º : ð5:6º
k¼2

Isso é ilustrado na análise empírica na Seção6.2.

5.5. Escolha do fator de esquecimento

Na prática, o fator de esquecimento geralmente é tratado como um parâmetro de sintonia para que seja determinado
experimentalmente. Neste artigo, o fator de esquecimento é escolhido de forma que o erro geral de previsão medido pelo RMSE seja mantido
no nível mínimo.
Especificamente, suponha que coletamos um conjunto de observaçõesmk(k =1, . . . ,n)sobre o volume de tráfego durante o período de um dia de
interesse da pesquisa. Considere uma grade de pontos dedminparadmáximopor um passo de ~ d (0 <dmin<dmáximo< 1), por exemplo, um
grade de pontos entre 0,05 e 0,95 por um passo de 0,05. Para cada ponto tomado pord,aplicamos o Algoritmo 1 modificado para estimar o
headway médio e para calcular a previsão de um passo à frente do volume de tráfego usando o Teorema 3. Os volumes de tráfego previsto e
observado são então comparados. O fator de esquecimento é escolhido de forma que leve ao RMSE mínimo na Eq.(5.6).

6. Estudos numéricos

Nesta seção, primeiro realizamos um estudo de simulação e, em seguida, realizamos uma análise empírica para examinar o desempenho
do método desenvolvido.

6.1. Um estudo de simulação

Uma grande vantagem de realizar um estudo de simulação é que os valores 'verdadeiros' do parâmetro de intervalo médio são
conhecidosa prioripara que seja simples avaliar o desempenho de diferentes métodos de estimativa em termos de precisão.

6.1.1. Geração de dados


Considere um ILD que mede o volume de tráfego durante vários intervalos de tempo sucessivos, cada um com duração de T =20
s. O fluxo de tráfego foi simulado em 720 intervalos de tempo. Para acomodar a natureza de que o avanço do veículo evolui
lentamente ao longo do tempo, o valor 'verdadeiro' do intervalo médioskno intervalo de tempok (k =1, . . . , 720) foi simulado usando
um modelo de passeio aleatório com um valor inicial de 2,5 s. O ruído aleatório do passeio aleatório seguiu uma distribuição normal
com média zero e desvio padrão de 0,01 s. O headway médio mínimo simulado foi fixado em 0,6 s na geração dos dados. As
contagensmkde veículos que passam pelo ILD foram simulados usando uma distribuição binomial negativa com média deT/
ske um parâmetro de difusão deq.O último parâmetro foi definido em diferentes níveis nos experimentos.Figura 2exibe os valores
simulados de intervalo médio em uma execução dos experimentos.

6.1.2. Experimentos repetidos


Nos experimentos a seguir, o parâmetro de difusãoqfoi definido igual a 5, 10, 20 e 50, respectivamente. Em cada experimento, os
720 intervalos de tempo foram divididos em dois subperíodos, um incluindo os primeiros 180 intervalos de tempo e o outro os 540
intervalos restantes. As contagens de tráfego simuladas no primeiro subperíodo foram tratadas como os dados de modelagem
sobre os quais o parâmetro de difusãoqfoi estimado e o valor do fator de esquecimentodfoi determinado usando o método na
Seção5. O desempenho do método de estimação desenvolvido foi avaliado utilizando os dados do segundo subperíodo, onde o
RMSE entre os valores verdadeirosske os valores estimados de headway médioŝk(k =1, . . . , 540) foi calculado:
B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99 95

avanço simulado
3

2
0 100 200 300 400 500 600 700
Tempo

Figura 2.O intervalo médio simulado em uma execução dos experimentos de simulação comq =10.

tabela 1
RMSEs médios acima de 100 são executados entre os intervalos médios 'verdadeiros' e estimados.

q =5 q =10 q =20 q =50


O método desenvolvido 0,40 0,37 0,35 0,35
A estimativa bruta 3,41 2,89 2.22 1,94

( ) 1=2
X540
RMSE¼ ðŝk skº2=540 :
k¼1

No total, foram realizadas 100 corridas para cada experimento. O método desenvolvido foi comparado com a estimativa brutaT/mkem
termos de RMSE médio nas 100 execuções, conforme exibido emtabela 1.
A partir detabela 1, pode-se observar que o método desenvolvido tem um desempenho melhor do que o método de estimação bruto. Isso
não é surpreendente: estatisticamente, o método desenvolvido reúne as informações coletadas nos intervalos de tempo atuais e anteriores
pela regra de Bayes para estimar o intervalo médio, enquanto o método de estimativa bruto usa apenas a observação atual.

6.2. Um exemplo prático

Nesta subseção voltamos aos dados reais de tráfego discutidos na Seção2e apresentar uma análise empírica dos dados. Como mencionado
anteriormente, os dados coletados incluem as contagens de veículos que passam por um único ILD selecionado perto de Seattle dentro de cada intervalo
de tempo de 20 s durante um dia normal de trabalho (quinta-feira).
Na análise a seguir, todo o dia de interesse foi dividido em quatro períodos de tempo, ou seja, meia-noite às 6h (período I), 6h às 12h
(período II), meio-dia às 18h (período III) e 18h à meia-noite. (período IV). Para fins de ilustração, consideramos o tráfego apenas na pista 3 no
sentido norte. Como mostrado emFigura 1(canto superior direito), isso inclui dois cenários importantes, tráfego perturbado e tráfego pesado.
Os dados coletados na quinta-feira são denominados dados de teste daqui em diante. Para fins de modelagem, também baixamos os dados
de tráfego 1 dia antes (ou seja, na quarta-feira), denominados dados de modelagem a seguir. O parâmetro de difusão e o fator de
esquecimento foram determinados usando os dados de modelagem.

6.2.1. Estimativa recursiva do intervalo médio


Para cada período de tempo, usamos primeiro o método na Seção5para determinar o fator de esquecimento com base nos
dados de modelagem. O Algoritmo 1 modificado foi então aplicado aos dados de teste para estimar o headway médio. O parâmetro
de intervalo médio estimado ao longo do tempo é exibido emFig. 3. Pode-se observar que durante o período da madrugada, o
headway médio estimado ficou entre 10 s e 15 s. No período de transição entre 5h e 7h, reduziu rapidamente para cerca de 2 s. Esse
nível se manteve até por volta das 21h. Quando o trânsito ficou leve no final da noite, voltou a um nível mais alto. Esses resultados
estão de acordo com os deZhang et ai. (2007)obtido usando dados do detector de loop duplo.
Para avaliar o desempenho do método desenvolvido, calculamos os RMSEs entre as previsões de um passo à frente do volume de
tráfego m̂ke os valores observadosmkusando a Eq.(5.6). A precisão foi então comparada com a estimativa bruta
96 B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99

20 6

15
4

progresso

progresso
10

2
5

0 0
1 2 3 4 5 6 7 8 9 10 11 12
hora do dia hora do dia

3 10

8
progresso

progresso
6
2
4

1 0
13 14 15 16 17 18 19 20 21 22 23 24
hora do dia hora do dia

Fig. 3.O intervalo médio estimado nos períodos de meia-noite às 6h (superior esquerdo), 6h ao meio-dia (superior direito), meio-dia às 18h (inferior esquerdo) e 18h à meia-noite
(inferior direito).

mesa 2
RMSEs entre os volumes de tráfego observados e as previsões de um passo à frente correspondentes.

Período I Período II Período III Período IV


(meia-noite às 6h) (6h00 às 12h00) (12h00 às 18h00) (18h00 à meia-noite)

O método desenvolvido 1,55 3,35 2,90 2,66


A estimativa bruta 1,84 4,38 3,91 3,60

método em que o volume de tráfego previsto foi tomado como a duração do intervalo de tempoTdividido pela estimativa bruta de headway
em cada intervalo de tempo.
Pode ser visto demesa 2que o método desenvolvido superou o método de estimativa bruta: exceto para o período da manhã, o
erro médio de previsão do método proposto é cerca de um veículo menor que o da estimativa bruta em cada intervalo de tempo de
20 s.

6.2.2. Inferência Bayesiana para o parâmetro de difusão


Em seguida, focamos no período I e consideramos a medida de incerteza. Primeiro investigamos o parâmetro de difusãoqusando os dados de
modelagem no período I.Figura 1(canto superior direito) sugere que um modelo de distribuição binomial negativa seja adequado para este período.

Realizamos uma análise Bayesiana descrita na Seção5.2para estimar o parâmetro de difusãoq.Para os antecedentes deWeq,
Gama (um1,b1) eGama (um2,b2), nós seguimosHazelton (2004)e defina os hiperparâmetrosumaeuebeu(eu =1, 2) igual a 0,001. O limite
superiorCdop(s1) foi igual a 40 s.
A distribuição posterior foi obtida usando o método MCMC descrito na Seção5.2. No total foram realizadas 5000 iterações, onde
as primeiras 2000 iterações foram tratadas como período burn-in e assim os resultados correspondentes foram descartados; os
restantes 3000 sorteios foram retidos para a análise subsequente. A distribuição posterior obtida deq
é exibido emFig. 4. A estimativa dequsando a média posterior é de 15,42 com um desvio padrão posterior de 6,02.
Em seguida, passamos a investigar a incerteza da estimativa de intervalo médio. Usando o valor estimado deqa partir dos dados de modelagem, o
intervalo de credibilidade para os dados de teste foi construído, conforme exibido emFig. 5. Pode-se observar que, embora o headway médio estimado
tenha sido principalmente em torno de 12 s antes das 5 da manhã, o envelope do intervalo de 95% de credibilidade foi
B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99 97

800

600

frequência
400

200

5 15 25 35
parâmetro de difusão

Fig. 4.O histograma de 3000 extrai da distribuição posterior do parâmetroqusando os dados de modelagem no período da manhã da meia-noite às 6h

30

25
avanço estimado

20

15

10

0
1 da manhã 2 da manhã 3 horas da manhã 4 da manhã 5 da manhã 06:00
hora do dia

Fig. 5.O headway médio estimado no início da manhã (linha real) e o envelope associado de um intervalo nominal de credibilidade de 95% (linhas pontilhadas).

muito mais amplo. O limite superior pode ser tão alto quanto 25 s ou ocasionalmente até mais de 30 s. Isso se deve principalmente à grande
variabilidade do tráfego nesta faixa de ultrapassagem e neste período da madrugada.

7. Observações finais

Os detectores de loop indutivo único fornecem medições no volume de tráfego e na ocupação. A pesquisa emLi (2009)na
estimativa de velocidade veicular utilizou-se dados de ocupação e a análise estatística foi realizada condicionalmente ao volume de
tráfego. Este artigo é complementar ao trabalho emLi (2009)e visa extrair as informações contidas nas medições de volume de
tráfego.
Sob três condições de tráfego importantes, ou seja, tráfego leve, tráfego pesado e tráfego perturbado, este artigo investigou a
estimativa do headway médio usando os dados medidos a partir de um único ILD. Uma abordagem unificada foi desenvolvida para a
estimativa recursiva do intervalo médio. Mostra que as estimativas obtidas nas três condições de tráfego compartilham um conjunto
comum de equações recursivas. Assim, o método de estimação é robusto no sentido de que não depende nem da mudança nas
condições de tráfego nem da escolha por modelos estatísticos. A sobrecarga computacional de atualizar a estimativa também é
reduzida ao mínimo.
Como ILDs únicos são implantados em vias arteriais estratégicas, esse método recursivo é aplicável em uma ampla área
geográfica para monitoramento on-line da segurança viária e do nível de serviço.

Reconhecimento

O autor gostaria de agradecer aos dois revisores por seus comentários úteis nas versões anteriores deste artigo.
98 B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99

Apêndice A. Provas dos teoremas

As provas do Lema 1 e do Teorema 1 são dadas abaixo. O Lema 2 e o Teorema 2 podem ser mostrados de maneira semelhante.

Prova do Lema 1.Deixar '(s;mk) denotam a função de massa de probabilidade da distribuição na Eq.(2.2). Então

registro 'ðs;mkÞ ¼const mkregistrosþðqmkºregistrof1T=ðquadradoÞg:

É fácil verificar que

@2registro 'ðs;mkÞ =@s2¼mk=s2 TðqmkÞð2sT=qÞ=fqðs2 Ts=qº2g:

Então as informações do Fisher parasé igual a

EUðsÞ ¼Ef@2registro 'ðs;mkÞ =@s2g ¼Ts3ð1T=ðquadradoº1;

e a priorização não informativa de Jeffrey é proporcional a {EU(s)}1/2/ (qs/T)3/2{1 1/(qs/T)}1/2. Isso completa a prova.h

Prova do Teorema 1.Aplicando a regra de Bayes para combinar(4.2)com probabilidade(2.2)produz a seguinte distribuição posterior:

pðsjmkº /pðsºpðmkjsÞ ¼ ðqs=Tºðumakºmkº1ºf1 1=ðqs=TÞgbkºqakmk:


Deixarn =cB(quadrado/T1) com constantecB= (umak+mk)/(bk+q umam k k+1). É fácil verificar que a variável aleatóriansegue umFmk+1) e
distribuição com graus de liberdadeBk=2(bk+qak UMAk=2(umak+mk) respectivamente. A média posterior, pós-
variância ior e intervalo de credibilidade Bayesiano podem ser obtidos diretamente a partir doFdistribuição. Isso completa a prova.h

Prova do Teorema 3.Primeiro, notamos que a previsão um passo à frente pode ser calculada usando a identidade bem conhecida: m
kº1¼Eðmkº1jmkÞ ¼EfEðmkº1jmk;sÞjmkg.É simples obterE(mk+1|mk,s) =T/sda Eq.(2.1), (2.2), (2.3), dependendo do pressuposto sobre a

distribuição subjacente do volume de tráfego. Portanto, temos mkº1¼TEfs1jmkg.Se o volume de tráfego segue a distribuição de
Poisson(2.1), posterior desÉ dado por(2.3). Neste caso é fácil verificar que
Es1jmk¼eu1 kðumakºmkÞ=ðumakºmk 1º.A seguir mostramos que o Teorema 3 é válido quando o volume de tráfego segue uma distribuição binomial.
ção(2.2). Do Teorema 1, a distribuição posterior den =cB(quadrado/T1) tem umFdistribuição com graus de liberdade Bk=2(bk+qak
mk+1) eUMAk=2(umak+mk). Nós notamos

mkº1¼TEfs1jmkg ¼EfcBq=ðcBºnÞjmkg:
Por alguma álgebra a esperança matemática acima pode ser mostrada igual ark(T/euk). A prova para o caso da distribuição binomial
negativa é semelhante.h

Referências

Basu, D., Maitra, B., 2010. Avaliação de informações de tráfego baseadas em VMS usando modelo de atribuição de tráfego dinâmico multiclasse: Experiência em Kolkata. Diário de
Planejamento e Desenvolvimento Urbano 136 (1), 104–113.
Brackstone, M., Waterson, B., McDonald, M., 2009. Determinantes de seguir headway em tráfego congestionado. Pesquisa de Transporte Parte F 12 (2), 131–142. Chang, G., Kao, Y.,
1991. Uma investigação empírica de características macroscópicas de mudança de faixa em autoestradas de múltiplas faixas não congestionadas. Transporte
Pesquisa Parte A 25 (6), 375–389.
Cheu, RL, Ritchie, SG, 1995. Detecção automatizada de incidentes de bloqueio de pista em rodovias usando redes neurais artificiais. Pesquisa de Transporte Parte C 3 (6),
371-388.
Dailey, DJ, 1993. Estimativa do tempo de viagem usando técnicas de correlação cruzada. Pesquisa de Transporte Parte B 27 (2), 97–107.
Dailey, DJ, 1999. Um algoritmo estatístico para estimar a velocidade a partir de volume de loop único e medições de ocupação. Pesquisa de Transporte Parte B 33 (5),
313-322.
Dailey, DJ, Wall, ZR, 2005. Um modelo geral de simulação para uso com dados reais de rodovias para realizar a previsão de congestionamento – Fase 3. Estado de Washington
Centro de Transportes – TRAC/WSDOT, Relatório Final de Pesquisa WA-RD 635.1.
Gerlough, DL, Huber, MJ, 1975. Teoria do Fluxo de Tráfego: Uma Monografia. Conselho de Pesquisa de Transporte, Washington, DC
Hazelton, LM, 2001. Inferência para matrizes origem-destino: estimação, previsão e reconstrução. Pesquisa de Transporte Parte B 35 (7), 667-676. Hazelton, M., 2004.
Estimativa da velocidade do veículo a partir da contagem de tráfego e dados de ocupação. Journal of Data Science 2 (3), 231–244.
Kim, T., Zhang, HM, 2011. As inter-relações do tempo de reação, sensibilidade do motorista e tempo de avanço no trânsito congestionado. A 90ª Reunião Anual da
Conselho de Pesquisa em Transporte, Washington, DC, 23 a 27 de janeiro.
Khan, SI, Ritchie, SG, 1998. Classificadores estatísticos e neurais para detectar problemas operacionais de tráfego em vias arteriais urbanas. Pesquisa de Transporte Parte C 6 (5),
291-314.
Kitamura, R., Nakayama, S., 2007. As informações de tempo de viagem podem realmente influenciar o fluxo da rede? Implicações do jogo da minoria. Pesquisa de Transporte
Registro: Journal of the Transportation Research Board 2010, 12–18.
Lan, C.-J., 2001. Um preditor de fluxo de tráfego recursivo baseado na estrutura de modelo linear generalizado dinâmico. Conferência de Sistemas Inteligentes de Transporte IEEE
Anais – Oakland, EUA. Agosto de 2001, 25-29.
Li, B., 2005. Inferência Bayesiana para matrizes origem-destino de redes de transporte utilizando o algoritmo EM. Technometrics 47 (4), 399-408.
Li, B., 2009. Sobre a estimativa recursiva da velocidade veicular usando dados de um detector de loop de indutância simples: uma abordagem Bayesiana. Pesquisa de Transporte
Parte B 43 (4), 391–402.
B. Li / Pesquisa de Transporte Parte B 46 (2012) 85–99 99

Liu, HX, He, X., Recker, W., 2007. Estimativa da dependência temporal dos valores do tempo de viagem e sua confiabilidade a partir de dados do detector de loop. Transporte
Pesquisa Parte B 41 (4), 448–461.
Marsden, GR, McDonald, M., Brackstone, M., 2003. Uma avaliação comparativa dos comportamentos de condução em três locais. Jornal Europeu dos Transportes e
Pesquisa 3 (1), 5–20.
Nakayama, S., Takayama, J., 2003. Modelo de equilíbrio da rede de tráfego para demandas incertas. A 82ª Reunião Anual da Pesquisa em Transportes
Board, Washington, DC, 12 a 16 de janeiro.
Petty, KF, Bickel, P., Ostland, M., Rice, J., Schoenberg, F., Jiang, J., Ritov, Y., 1998. Estimativa precisa de tempos de viagem de detectores de loop único.
Pesquisa de Transporte Parte A 32 (1), 1–17.
Piao, J., McDonald, M., 2003. 2003. Carro de baixa velocidade seguindo o comportamento de dados de veículos flutuantes. Proc. Simpósio de Veículos Inteligentes IEEE, Columbus,
Ohio, EUA, junho.
Press, SJ, 2003. Estatística Bayesiana Subjetiva e Objetiva: Princípios, Modelos e Aplicações. Wiley, Nova York.
Tian, ZZ, Wu, N., 2006. Modelo probabilístico para capacidade de interseção semafórica com faixa de conversão curta à direita. Jornal de Engenharia de Transporte 132 (3),
205-212.
Zhang, G., Wang, Y., Wei, H., Chen, Y., 2007. Examinando modelos de distribuição de headway com dados de eventos de loops de rodovias urbanas. Registro de Pesquisa de Transporte
1999, 141-149.

Você também pode gostar