Escolar Documentos
Profissional Documentos
Cultura Documentos
DISSERTAÇÃO DE MESTRADO
THAÍS SILVA
Thaís Silva
Ao professor Carlos Alberto Faria, primeiramente por ter aceitado a tarefa de me orientar,
segundo por ter fornecido os dados da pesquisa O/D, sem os quais não seria possível a
realização deste trabalho. Agradeço ainda por todas as orientações de grande valor e pela
enorme paciência com as minhas dificuldades.
À Sueli, pela paciência e ajuda com todas as questões burocráticas, desde a matrícula até as
viagens dos congressos. Muitíssimo obrigada!
Aos meus pais, pelo apoio financeiro e emocional concedido neste período tão importante
da minha vida... Pelo amor incondicional e por todas as possibilidades que vocês me
proporcionaram até hoje... Amo vocês!
Aos meus irmãos, sobrinhos e amigos que de alguma forma estiveram presentes nesta
etapa da minha vida... Com os quais dividi todas as alegrias desses dias... e também
algumas frustrações...
RESUMO
Esta pesquisa trata da calibração do modelo logit binomial para a etapa de divisão modal
do modelo clássico de planejamento de tranportes. O objetivo é determinar as
probabilidades de escolha dos usuários diante das alternativas de transportes disponíveis na
área de estudo. A abordagem realizada neste estudo considerou o conceito de utilidade,
uma das componentes básicas da teoria do comportamento do consumidor que constituem
o fundamento teórico da microeconomia e da teoria de escolha aleatória. O processo de
decisão do consumidor na escolha do modo de transporte baseia-se em escolhas discretas e
leva em consideração as características dos sistemas de transportes, das viagens e do nível
socioeconômico do consumidor. Logo, os usuários de transportes, diante da necessidade de
deslocar-se no espaço e no tempo, realizam suas escolhas procurando maximizar a
utilidade dos modos de transportes, ou seja, escolhem o modo de transporte cujos atributos
lhe proporcionem o maior nível de satisfação. Os dados utilizados nesse estudo foram
obtidos na pesquisa origem-destino (Pesquisa O/D), realizada na cidade de Uberlândia
(MG) em 2002. Os modelos logit binomiais foram calibrados com o software Stastistical
Package for Social Sciences (SPSS). Os dados obtidos da pesquisa O/D constituem a base
dos modelos de escolha discreta e refletem o “juízo de valor” do consumidor sobre as
alternativas e atributos dos modos de transportes.
ABSTRACT
This research is about the calibration of binomial Logit Model to the modal split phase
from the classic model of transportation planning. The goal is to determine what the users
might choose towards the transport alternatives available in the studied area. The
approached used in this study considered the concept of utility, one of the basic
components of the theory of consumer behavior that constitute the theoretical foundation
of microeconomics and the random choice theory. The decision process of the consumer's
choice of transport mode is based on discrete choices and considers the characteristics of
transportation systems, travel and the consumer’s socio economic level. Therefore,
transport users, given the need to travel in space and time, try to make their choices to
increase the utility of transport modes that is to choose the transportation mode which
attributes will provide the highest level of satisfaction. The data used in this study were
obtained in the origin-destination survey (Survey O/D) held in the city of Uberlandia (MG)
in 2002. Binomial logit models were standardized with the software Stastistical Package
for Social Sciences (SPSS). The data obtained from the O/D survey form the basis of
discrete choice models and reflect "value judgments" of the consumer about the
alternatives and attributes of transport modes.
Keywords: Urban Planning - Urban Transport - Logit Model - Modal Split - Demand
Behavior
LISTA DE FIGURAS
FIGURA 1 - MATRIZ DE DISTRIBUIÇÃO DE VIAGENS. ........................................................................................ 8
FIGURA 2 - PROCESSO DE TOMADA DE DECISÃO. ........................................................................................... 18
FIGURA 3 - CLASSIFICAÇÃO DOS MODELOS DE REGRESSÃO. .......................................................................... 19
FIGURA 4 - ESTRUTURA DE UM MODELO LOGIT MULTINOMIAL. ..................................................................... 22
FIGURA 5 - ESTRUTURA DO MODELO LOGIT HIERÁRQUICO. ........................................................................... 23
FIGURA 6 - ESTRUTURA MODELO LOGIT BINOMIAL. ....................................................................................... 23
FIGURA 7 - FUNÇÃO LOGÍSTICA. .................................................................................................................... 24
FIGURA 8 - ETRUTURA DO MODELO CALIBRADO. ........................................................................................... 35
FIGURA 9 - ZONAS DE TRÁFEGO DA CIDADE DE UBERLÂNDIA (MG). ............................................................. 42
FIGURA 10 - DISTRIBUIÇÃO DAS VIAGENS POR MODO DE TRANSPORTE. ......................................................... 44
FIGURA 11 - PORCENTAGEM DAS VIAGENS PELOS MODOS AGREGADOS. ........................................................ 46
FIGURA 12 - DISTRIBUIÇÃO DAS VIAGENS POR MOTIVO. ................................................................................ 47
FIGURA 13 - TEMPO DE VIAGEM..................................................................................................................... 48
FIGURA 14 - NÚMERO DE VIAGENS REALIZADAS PELOS INDIVÍDUOS/DIA. ...................................................... 49
FIGURA 15 - PORCENTAGEM DOS INDIVÍDUOS POR SEXO. .............................................................................. 50
FIGURA 16 - FAIXA ETÁRIA DOS INDIVÍDUOS. ................................................................................................ 51
FIGURA 17 - NÍVEL DE INSTRUÇÃO DOS INDIVÍDUOS. ..................................................................................... 52
FIGURA 18 - SITUAÇÃO FAMILIAR. ................................................................................................................. 53
FIGURA 19 - PROPRIEDADE DE AUTO. ............................................................................................................ 54
FIGURA 20 - CLASSE DE ATIVIDADE. .............................................................................................................. 55
FIGURA 21 - RENDA MENSAL. ........................................................................................................................ 56
FIGURA 22 - PORCENTAGEM DAS CLASSES SOCIOECONÔMICAS. .................................................................... 57
FIGURA 23 - CLASSES SOCIOECONÔMICAS NO BRASIL. .................................................................................. 58
LISTA DE TABELAS
TABELA 1 - CORTES DO CRITÉRIO BRASIL ....................................................................................................... 33
TABELA 2 - CODIFICAÇÃO DA VARIÁVEL DEPENDENTE NOS TRÊS MODELOS .................................................. 36
TABELA 3 - VALOR DAS VARIÁVEIS EXPLICATIVAS ......................................................................................... 39
TABELA 4 - POPULAÇÃO E AMOSTRA DAS 65 ZONAS DE TRÁFEGO .................................................................. 43
TABELA 5 - MODOS DE TRANSPORTES ............................................................................................................. 44
TABELA 6 - MODOS DE TRANSPORTES AGREGADOS ........................................................................................ 45
TABELA 7 - DISTRIBUIÇÃO DAS VIAGENS POR MOTIVO ................................................................................... 46
TABELA 8 - DISTRIBUIÇÃO DAS VIAGENS POR TEMPO GASTO NO DESLOCAMENTO ......................................... 47
TABELA 9 - DISTRIBUIÇÃO DAS VIAGENS POR NÚMERO DE VIAGENS REALIZADAS ......................................... 48
TABELA 10 - DIVISÃO DA AMOSTRA POR SEXO ................................................................................................ 49
TABELA 11 - FAIXA ETÁRIA DOS INDIVÍDUOS .................................................................................................. 50
TABELA 12 - NÍVEL DE INSTRUÇÃO .................................................................................................................. 51
TABELA 13 - SITUAÇÃO FAMILIAR ................................................................................................................... 52
TABELA 14 - PROPRIEDADE DE AUTO............................................................................................................... 53
TABELA 15 - CLASSE DE ATIVIDADE ................................................................................................................ 54
TABELA 16 - RENDA MENSAL .......................................................................................................................... 55
TABELA 17 - PERFIL SOCIOECONÔMICO DA AMOSTRA ..................................................................................... 56
TABELA 18 - MODELO LOGIT BINOMIAL .......................................................................................................... 59
TABELA 19 - CLASSIFICAÇÃO DOS CASOS PROCESSADOS ................................................................................ 60
TABELA 20 - VALORES DO PSEUDO R2 ............................................................................................................. 61
TABELA 21 - CLASSIFICAÇÃO DOS CASOS EM CADA PASSO ............................................................................. 61
TABELA 22 - PARÂMETROS DA FUNÇÃO UTILIDADE PARA O MODO AUTO ...................................................... 63
TABELA 23 - CLASSIFICAÇÃO DOS CASOS PROCESSADOS ................................................................................ 64
TABELA 24 - VALORES DO PSEUDO R2 ............................................................................................................. 65
TABELA 25 - CLASSIFICAÇÃO DOS CASOS EM CADA PASSO ............................................................................. 65
TABELA 26 - PARÂMETROS DA FUNÇÃO UTILIDADE PARA O MODO CAMINHAMENTO ..................................... 66
TABELA 27 - CLASSIFICAÇÃO DOS CASOS PROCESSADOS ................................................................................ 67
TABELA 28 - VALORES DO PSEUDO R2 ............................................................................................................. 67
TABELA 29 - CLASSIFICAÇÃO DOS CASOS EM CADA PASSO ............................................................................. 68
TABELA 30 - PARÂMETROS DA FUNÇÃO UTILIDADE PARA O MODO ÔNIBUS ................................................... 68
TABELA 31 - UTILIDADE DOS MODOS DE TRANSPORTES .................................................................................. 71
TABELA 32 - PROBABILIDADE DE ESCOLHA DO MODO AUTO .......................................................................... 71
TABELA 33 - PROBABILIDADE DE ESCOLHA DO MODO CAMINHAMENTO ......................................................... 72
TABELA 34 - PROBABILIDADE DE ESCOLHA DO MODO ÔNIBUS ....................................................................... 73
TABELA 35 - PROBABILIDADE DE ESCOLHA DOS MODOS ................................................................................. 74
SUMÁRIO
CAPÍTULO 1 ....................................................................................................................... 1
INTRODUÇÃO ..................................................................................................................... 1
CAPÍTULO 2 ....................................................................................................................... 5
CAPÍTULO 3 ..................................................................................................................... 11
CAPÍTULO 5 ..................................................................................................................... 32
CAPÍTULO 6 ..................................................................................................................... 41
CAPÍTULO 1
INTRODUÇÃO
O crescimento da demanda por transportes urbanos levou ao desenvolvimento de modelos
que pudessem ser aplicados ao planejamento de transportes. O modelo clássico ou de
quatro etapas tornou-se, então, instrumento estratégico empregado por pesquisadores da
área de transportes na tomada de decisão. Esse modelo considera o planejamento como um
processo sequencial em que interagem diferentes submodelos: geração-atração de viagens,
distribuição, divisão modal e alocação do tráfego à rede (Ortúzar e Román, 2003).
Esta pesquisa trata da etapa de divisão modal, que é considerada como a terceira etapa do
modelo clássico de planejamento de transportes. O objetivo é determinar a probabilidade
de escolha dos usuários diante das alternativas de transportes disponíveis na área em
estudo. A abordagem dessa etapa será tratada com base no conceito de utilidade da teoria
do comportamento do consumidor.
1.1 OBJETIVOS
O objetivo principal deste trabalho é calibrar modelos de divisão modal baseados na teoria
econômica do comportamento do consumidor e na teoria da utilidade, utilizando o
software SPSS (Statistical Package for Social Sciences) e os dados da pesquisa O/D
realizada em 2002 na cidade de Uberlândia (MG).
- Mensurar, através da utilidade, a influência das variáveis sobre o padrão de escolha dos
usuários e assim, definir o perfil do usuário de transporte em cidades de porte médio por
cada modo considerado.
1.2 JUSTIFICATIVA
O processo de urbanização e crescimento das cidades tem exigido dos órgãos gestores e de
planejamento urbano esforços para equilibrar a demanda e a oferta dos serviços de
Capítulo 1 Introdução 3
Ferronatto (2002) observou que, o uso do solo não somente tem um impacto direto sobre a
demanda, mas ele próprio é afetado por mudanças na oferta de transportes. Dessa forma, a
modelagem constitue-se em importante ferramenta para a análise da repartição modal,
permitindo a espacialização das novas necessidades e auxiliando de forma mais correta à
tomada de decisão no processo de planejamento.
Considerando a aplicação dos modelos com base em dados desagregados, a pesquisa O/D
representa a base de dados primária para a calibração dos modelos no enfoque clássico do
planejamento de transportes. Apesar da pesquisa O/D ser complexa na fase de
implementação e processamento dos dados e demandar recursos para sua aplicação é,
ainda, a melhor fonte de informações do padrão de viagens do cotidiano (Faria et al, 2004).
Nesse sentido, modelar a etapa de divisão modal com base em dados da pesquisa O/D
significa buscar a aproximação dos modelos de escolha discreta com a real escolha dos
usuários de transportes.
- é viável, uma vez que, o banco de dados da pesquisa O/D disponibiliza informações
considerando as zonas de tráfego que compõem o zoneamento da cidade;
Portanto, as informações obtidas com o uso de modelos para previsão da escolha modal
podem ser usadas para tomar decisões de quando e onde investimentos seriam feitos nos
sistemas de transportes, de forma a satisfazer demandas de viagens e promover padrões
desejáveis de desenvolvimento da área em estudo. Assim, a possibilidade de previsão de
cenários para o transporte urbano com base nas escolhas dos usuários dos modos de
transportes pode significar: economia de tempo, de recursos financeiros, menos transtornos
e ações mais efetivas no planejamento de transportes urbanos.
Este trabalho está estruturado em seis capítulos, organizados da seguinte forma: o primeiro
capítulo mostra a interrelação entre o crescimento da demanda por transportes urbanos em
cidades de porte médio e a necessidade da utilização dos modelos de escolha para modelar
essa demanda na fase de divisão modal, cita os principais objetivos desta pesquisa e mostra
os argumentos que justificam este trabalho; o segundo capítulo apresenta um panorama do
planejamento em transportes urbanos e o modelo de quatro etapas; o terceiro faz referência
aos principais modelos para análise da demanda empregados em transportes e a teoria
microeconômica para as escolhas discretas; o quarto capítulo trata da formulação do
modelo logit binomial, os parâmetros e testes estatísticos para a validação deste; o quinto
apresenta os recursos que foram usados para desenvolver este trabalho; o sexto descreve o
estudo de caso, o banco de dados, análise descritiva dos dados, resultados e considerações.
Capítulo 2 Planejamento de Transporte Urbano 5
CAPÍTULO 2
PLANEJAMENTO DE TRANSPORTE URBANO
Devido à intensificação do processo de urbanização e crescimento das cidades brasileiras
na década de 1970, buscou-se nos modelos técnico-econômicos o apoio para o
planejamento de transportes urbanos. O crescimento dos centros urbanos aumentou
significativamente a demanda por transportes, diversificando os motivos de viagens e
aumentando as distancias a serem percorridas, dificultando assim, os deslocamentos dos
usuários de transportes urbanos.
De uma forma geral a distribuição é feita com base na potencialidade de cada zona de gerar
viagens, na atratividade das zonas de destino e na distância, tempo ou custo de transporte
entre cada par de zonas de origem e destino. Dessa forma, os modelos de distribuição de
viagens podem ser definidos pela seguinte expressão:
Nesta etapa ocorre a divisão das viagens pelos diversos modos de transportes. Esses modos
são normalmente agrupados em várias categorias, dentre as quais pode-se citar o transporte
particular e transporte público, ou mesmo transporte motorizado e não motorizado.
Podendo-se ainda dividir esses grupos em subgrupos de acordo com diferentes modos de
transportes (assim, para o modo público, pode-se considerar ônibus, metrô e embarcações
e, para modo particular, automóveis, motocicletas e bicicletas) (Banks, 1998 apud Brito,
2007).
As características dos viajantes, que influenciam suas decisões quanto à escolha do modo
de transporte são aquelas que determinam a disponibilidade de automóveis aos viajantes e,
consequentemente, o “status” cativo ou com escolha (Hutchinson, 1979). Assim, a escolha
modal é influenciada pela distância, pelo custo da viagem e pela disponibilidade ou não de
determinado modo de transporte e pode ser avaliada de acordo com as condições sócio-
econômicas e a acessibilidade dos habitantes a esses modos de transportes.
um critério de seleção de rota, (2) uma técnica que selecione rotas para veículos através de
uma rede viária, (3) um método de alocação de intercâmbios de viagens de veículos entre
essas rotas (Hutchinson, 1979).
O problema vem sendo resolvido pelo “método das quatro etapas” (Ortúzar e Willumsen,
1990). Assim, neste trabalho será tratado o processo de escolha modal, em que a
modelagem da estrutura de decisão dos usuários é normalmente feita tendo por base
modelos de escolha discreta. Dessa forma, o próximo capítulo trata dos fundamentos
teóricos dos modelos de escolha discreta.
Capítulo 3 Modelos para Análise de Demanda 11
CAPÍTULO 3
MODELOS PARA ANÁLISE DE DEMANDA
A análise da demanda em transportes tem adotado tradicionalmente dois tipos de modelos:
os modelos agregados ou de primeira geração e os modelos desagregados ou de segunda
geração. Os primeiros foram amplamente utilizados nos estudos de transportes até a década
de 1970, mas devido a sua pouca flexibilidade, precisão limitada, elevado custo e sua fraca
orientação na tomada de decisões políticas (Ortúzar e Willumsen, 1990), esses modelos
perderam força no processo de planejamento.
Então, a partir do final da década de 1970, em função das limitações nas abordagens dos
modelos agregados, os pesquisadores passaram a empregar os modelos de segunda geração
ou desagregados. Esses, por sua vez, utilizam observações individuais, o que permite uma
melhor compreensão dos comportamentos de viagem, posto que baseiam-se em escolhas
individuais (Espino, 2003). Os modelos de segunda geração fundamentaram-se nos
princípios teóricos da economia clássica, no enfoque comportamental e em técnicas de
marketing.
Ortúzar e Willumsen (1990) ressaltam que, as vantagens que estes modelos apresentam em
relação aos de primeira geração são muitas. Em primeiro lugar, a possibilidade de utilizar
dados individuais faz com que seja mais eficiente o uso das informações do que nos
modelos agregados. Em segundo lugar, pode-se utilizar toda a variabilidade de que se
dispõem com dados individuais. Em terceiro lugar, os resultados dos modelos em nível
individual podem ser usados para qualquer nível de agregação. Em quarto lugar, a
Capítulo 3 Modelos para Análise de Demanda 12
estimativa dos parâmetros para cada uma das variáveis explicativas consideradas no
modelo é explicita, o que proporciona certa flexibilidade para representar as variáveis
relacionadas a políticas de planejamento; ademais, os parâmetros estimados têm uma
interpretação direta em termos da importância de cada variável explicativa considerada na
escolha. E finalmente, trata-se de modelos mais estáveis no tempo e no espaço.
Logo, os modelos desagregados que representam as escolhas discretas permitem que sejam
estimadas as probabilidades de escolha a partir da abordagem comportamental. A seguir
apresentam-se os conceitos sobre a teoria do comportamento do consumidor e da utilidade
que são os fundamentos dos modelos de escolha discreta, e dos métodos de obtenção dos
dados por Preferência Revelada (PR) e/ou Preferência Declarada (PD) que são a base
desses modelos.
Os dados de preferências reveladas relacionam-se com as escolhas reais das pessoas e são
assim chamados por que revelam os gostos e preferências das pessoas (Train, 2002). As
técnicas de Preferências Reveladas baseiam-se, portanto, na obtenção de dados que
caracterizam decisões reais tomadas por usuários do serviço a ser analisado. A técnica
busca identificar as decisões tomadas pelos usuários a partir de entrevistas que investigam
sobre os serviços recentemente utilizados. Esta técnica apresenta algumas limitações no
que concerne à identificação das decisões de usuários frente à situações inéditas.
Entretanto, Ortúzar e Román (2003) assinalam que, o emprego destes dados não está isento
de problemas e suas principais limitações se devem a:
• Pouca variabilidade entre os valores dos atributos da amostra. Isso leva a aparição
de problemas na fase de estimação.
• Existência de erros de medida nas variáveis. Quando define-se categorias para os
dados de preferência revelada é inevitável a aparição de erros devido basicamente
a necessidade de agregar valores, interferindo no nível de precisão.
• Dificuldade de avaliar o impacto de variáveis qualitativas, tais como,
comodidade, confiabilidade, segurança, etc.
Apesar dessas restrições de caráter técnico os dados de preferência revelada têm sido
empregados para predizer o comportamento dos indivíduos e modelar a demanda em
transportes. Já para situações em que se deseja avaliar o comportamento da demanda frente
a um novo serviço, produto ou modo de transporte a ser implantado, utiliza-se a técnica de
preferência declarada.
Essas técnicas começaram a ser aplicadas no princípio dos anos 1970 em problemas
relacionados com a investigação de mercado, e as primeiras aplicações no campo dos
transportes deve-se a Louviere et al. (1973) apud Ortúzar e Roman (2003). Em transportes
as técnicas de preferências declaradas são, assim como as preferências reveladas,
empregadas na realização das pesquisas de origem e destino, as quais fornecem
informações sobre o comportamento do consumidor.
preferências. Os dados coletados são processados por modelos estatísticos que ajustam os
parâmetros de forma a definir a função utilidade.
A técnica de preferência declarada pode ser vista como uma interação entre um método de
pesquisa e uma teoria comportamental (Novaes, 1986). Os paradigmas usados para a
modelagem do comportamento das pessoas não estão preocupados com a teoria
comportamental por si só, mas com métodos que possam ser usados para testar aspectos
desta teoria.
Segundo Kotler (1976), o comportamento pode ser entendido como um mecanismo que o
indivíduo utiliza para dar resposta a um determinado evento na busca de satisfazer seus
desejos e necessidades.
Essa necessidade de deslocamento está orientada por um motivo, que pode ser trabalho,
escola, lazer, residência, etc, e está condicionada segundo Ortúzar (1994) apud Ortúzar e
Róman (2003) pelas características: socioeconômicas do usuário (como a renda,
propriedade ou não de auto, grau de escolaridade, faixa etária e outros), dos modos de
transportes (como conforto, confiabilidade, custo, tempo de viagem) e da viagem (motivo
de viagem).
Capítulo 3 Modelos para Análise de Demanda 17
A próxima seção trata dos modelos de escolha discreta que empregam os dados obtidos por
técnicas de preferências reveladas e declaradas para modelar, a partir das utilidades, as
intenções comportamentais do consumidor dos serviços de transportes.
A partir dos dados obtidos com as técnicas de preferência revelada e preferência declarada,
a modelagem pode ser feita por um tipo de modelo de escolha discreta. Alguns dos
modelos de escolhas discretas mais utilizados para a análise de demanda em transportes
são obtidos por métodos de regressão.
A análise por regressão tem como interesse realizar previsões sobre os valores da variável
dependente (resposta) a partir dos valores das variáveis independentes (preditoras) e tem
por objetivo construir um modelo estatísticamente significante. A Figura 3 mostra a
classificação dos modelos de regressão.
Análise de Regressão
Exponencial Logística
Hutchinson (1979) ressalta que três tipos de modelos matemáticos têm sido usados para
construir funções de repartição modal para o comportamento individual, sendo estes:
análise discriminante, análise probit e análise logit.
Capítulo 3 Modelos para Análise de Demanda 20
A análise discriminante é útil para construir modelos preditivos em que se deseje predizer
o grupo de pertinência de um caso a partir das características observadas. O procedimento
gera uma função discriminante baseada na combinação linear das variáveis preditoras que
proporcione a melhor discriminação possível entre os grupos (Manual SPSS, 2003). O
objetivo é encontrar uma combinação linear de variáveis explicativas, a fim de que as
distribuições dessas variáveis possuam pouca superposição (Hutchinson, 1979).
A técnica procura então extrair dos dados uma combinação linear das características dos
sujeitos (variáveis independentes) que melhor discriminem os grupos (Castro Júnior,
2003). Assim, o objetivo do modelo discriminante é encontrar uma combinação linear de
variáveis explicativas.
A técnica usada nos modelos discriminantes consiste em atribuir pesos que separarão tanto
quanto possível as médias dos valores para cada grupo e ao mesmo tempo tentará
minimizar a distância estatística e a média do próprio grupo (Castro Júnior, 2003). A
análise discriminante permite estimar os coeficientes da função discriminante linear que
assume a seguinte forma:
1
Onde:
Outra análise empregada nos modelos de escolha discreta é conhecida como análise probit.
Nesta classe de modelos, a regressão é não-linear, e a variável dependente (Y), assim como
Capítulo 3 Modelos para Análise de Demanda 21
no logit binomial, só pode assumir dois valores. Assim, a função probit assume a forma de
S (sigmóide) e é uma relação funcional usada para representar a probabilidade de escolha
no intervalo [0,1]. Segundo Hill (2003) a estimativa do modelo probit é numericamente
complicada porque se baseia na distribuição normal.
1 Φ !" # $ 2
Onde:
Com base em (2), pode-se estimar, via máxima verossimilhança, os parâmetros do modelo.
Arango (2001) argumenta que a regressão logística é uma ferramenta da estatística para
situações nas quais se deseja predizer a presença ou ausência de uma determinada
característica ou resultado, baseado em valores de um conjunto de variáveis independentes.
O modelo logístico pode estimar a probabilidade máxima depois de transformar a variável
dependente em variável de base logarítmica, calculando a probabilidade de um evento.
Dentre os modelos mais aplicáveis para análise de demanda em transportes pode-se citar:
Análise logit multinomial, o logit hierárquico e logit binomial.
Auto_condutor Auto_passageiro
Ônibus Outros
O modelo logístico tem sua importância na medida em que serve para descrever as
probabilidades, que no estudo corresponde à escolha individual do modo de transporte.
transporte Assim,
o capítulo seguinte trata do modelo de regressão logística binomial que será empregado para
modelagem dos dados.
Capítulo 4 Modelo de Regressão Logística Binomial 25
CAPÍTULO 4
MODELO DE REGRESSÃO LOGISTICA
BINOMIAL
O princípio do modelo é a calibração da função utilidade, ou seja, é o valor que o indivíduo
atribui a um produto ou serviço pela combinação de fatores, de forma que esse valor
corresponda ao máximo no conjunto de opções que estão à sua disposição (Ben-Akiva e
Lerman, 1985). O modelo permite captar a significância das variáveis explicativas e a
relação destas com a variável explicada.
Para representar essa atratividade de uma alternativa em comparação com outras, utiliza-se
o conceito de utilidade. A utilidade representa então o benefício que um indivíduo percebe
quando consome seus recursos em diferentes bens ou serviços (ver Ben-Akiva e Lerman,
1985).
Assim, a partir da definição da função que relaciona os atributos de um produto com a sua
utilidade resultante pode-se estimar o comportamento do consumidor diante das
alternativas disponíveis. A configuração comumente utilizada para a função utilidade
segue um modelo linear aditivo (Ben Akiva e Lerman, 1985) cuja forma matemática é
dada por:
Onde:
βo é a constante do modelo;
β1, β2, ..., βk, são os parâmetros do modelo, onde k é a quantidade de atributos das
alternativas;
Como pode-se ver em Ben-Akiva e Lerman (1985), os coeficientes da função podem ser
usados para objetivos distintos, tais como:
Este tipo de função é compensatória, à medida que pode-se manter o mesmo nível de
utilidade alternando-se dois atributos. A função utilidade assim definida baseia-se em
algumas premissas básicas, a saber:
A partir das utilidades das alternativas chega-se a probabilidade de escolha para o modelo
logit binomial, dado pela expressão:
Onde:
β é o parâmetro;
Os testes estatísticos para avaliar a significância dos parâmetros dos modelos calibrados no
SPSS foram: o pseudo R2 (Cox & Snell e de, Nagelkerke), a estatística de Wald (W), o
teste de Hosmer e Lemeshow e a razão de chances (odds ratio). Segue uma descrição dos
testes empregados para interpretação e validação dos modelos calibrados.
4.1.2 Pseudo R2
Os modelos logits não têm uma medida com significado intuitivo como o R2 na regressão
linear. Assim, várias estatísticas pseudo R2 tem sido sugeridas e o programa SPSS 11.0
calcula duas estatísticas: pseudo R2 de Cox & Snell (Equação 5) e o pseudo R2 de
Nagelkerke (Equação 6) cujos valores são menores ou iguais a um. Esses valores
correspondem a uma fração da variância que é compartilhada entre as variáveis (Doria
Filho, 1999) e são calculados com base na função de verossimilhança (Hosmer e
Lemeshow, 1989).
Capítulo 4 Modelo de Regressão Logística Binomial 29
2244566
1 1 2 3 7 5
2244
Pseudo R2 de Nagelkerke
:
9:;;<=>> <
3 7
9:;;?
1 : 6
@@<=>> <
O teste de Wald é usado para examinar restrições impostas aos coeficientes da regressão e
calcula uma estatística que mede a eficiência das estimativas dos coeficientes da regressão
original em satisfazer as restrições da hipótese nula. Assim, o teste de Wald é utilizado
para testar a significância estatística de cada coeficiente (β1) no modelo (Figueira, 2006).
"C
B 7
F "C
DE
Onde:
("C
) é o parâmetro da estimativa de máxima verossimilhança;
Capítulo 4 Modelo de Regressão Logística Binomial 30
F "
) é o erro padrão da estimativa de máxima verossimilhança.
DE
I1
K1 2 I1L
M1 8
I0
K1 2 I0L
) O PQ
1 )O PQ
1
O PQ ) O PQ
M1 1 ) ) O PQ O ) Q 9
) O ) O
1 )O
1
1 )O
Capítulo 4 Modelo de Regressão Logística Binomial 31
O próximo capítulo trata dos procedimentos para calibração do modelo, utilizada para
alcançar os resultados.
Capítulo 5 Calibração do Modelo 32
CAPÍTULO 5
CALIBRAÇÃO DO MODELO
A metodologia empregada neste trabalho consta de duas etapas principais. A primeira
etapa trata da revisão dos aspectos teóricos sobre o modelo clássico empregado em
planejamento de transportes e dos fundamentos teóricos sobre os quais se assentam os
modelos de escolha discreta utilizados para modelar o comportamento de escolha na etapa
de divisão modal.
A segunda etapa trata dos aspectos práticos do trabalho, em que a partir dos conceitos
estudados e de uma amostra do banco de dados da pesquisa O/D da cidade de Uberlândia
(MG), realizou-se a calibração de três modelos de regressão logística binomial para a
análise da etapa de divisão modal.
A calibração dos modelos de regressão logística para a etapa de divisão modal foi realizada
utilizando-se o software Stastistical Package for Social Sciences (SPSS), que através de
métodos estatísticos fornece os coeficientes para a função utilidade, tornando possível
estimar as probabilidades de escolhas dos usuários de transportes. Dessa forma, na próxima
sessão são apresentados aspectos relativos ao banco de dados empregado na modelagem.
Após determinar o tamanho da amostra o passo seguinte foi definir as variáveis que fariam
parte do banco de dados, uma vez que os dados da pesquisa O/D possui variáveis
explicativas sobre as características das viagens e dos indivíduos pesquisados.
A1 42 - 46 0,9
A2 35 - 41 4,1
B1 29 - 34 8,9
B2 23 - 28 15,7
C1 18 - 22 20,7
C2 14 - 17 21,8
D 8 - 13 25,4
E 0-7 2,6
Fonte: ABEP - Associação Brasileira de Empresas de Pesquisa, 2008.
A partir da obtenção do banco de dados faz-se necessário algumas considerações sobre os dados de
entrada na calibração do modelo.
Neste trabalho optou-se por calibrar três modelos logits binomiais. A estrutura do modelo
apresenta, portanto três níveis hierárquicos que são os três modos de transporte
selecionados para análise, conforme mostra a Figura 8.
No primeiro nível hierárquico a variável dependente possui valor “1” para a escolha do
“modo auto” e valor “0” para a escolha de “outro modo”. Neste caso o termo “outro”
responde pelos modos (caminhamento, ônibus, bicicleta e outros) sendo incluídas na
análise 1045 observações.
O segundo nível apresenta valor “1” para o “modo caminhamento” e valor “0” para “outro
modo”. No segundo nível 809 observações foram incluídas na calibração do modelo.
Por fim, o terceiro nível refere-se à escolha do “modo ônibus” assumindo-se valor “1” para
essa escolha e valor “0” para a escolha de “outro modo”. Neste nível o número de
observações incluídas na análise foi de 503.
AUTO OUTROS
(236) (809)
CAMINHAMENTO OUTROS
(306) (503)
ÔNIBUS OUTROS
(441) (62)
É importante ressaltar que a cada modelo calibrado o valor “1” foi atribuído ao modo em
análise no modelo. Além disso, em alguns casos os níveis das variáveis foram agregados
uma vez que o modelo não responde bem quando se usa muitos níveis para as variáveis
explicativas podendo levar a erros nos valores dos parâmetros. Dessa forma, segue-se uma
descrição das variáveis explicativas que fazem parte do banco de dados.
Motivo de viagem
A variável, motivo de viagem, refere-se ao motivo que levou o indivíduo a realizar o seu
deslocamento. Os principais motivos relacionados na pesquisa foram: trabalho, escola,
residência e outros.
As viagens por motivo de trabalho e escola são aquelas em que o indivíduo saiu da sua
residência e dirigiu-se ao seu local de trabalho ou à instituições de ensino. No caso das
viagens que tiveram como motivo a residência, estas dizem respeito aquelas viagens em
que o indivíduo saiu do seu local de origem e o seu destino final foi a sua residência.
Tempo de viagem
Número de viagens
Esta variável diz respeito ao número de viagens realizadas pelo indivíduo no dia, e reflete
características do comportamento de escolha, pois evidencia o quanto os usuários
deslocaram-se em suas viagens diárias.
Propriedade de auto
A variável propriedade de auto refere-se aqueles indivíduos que têm ou não auto. A
propriedade ou não de auto reflete a característica de usuários “cativos” ou com “escolha”.
Indivíduos com propriedade de auto pode escolher o modo que melhor corresponda as suas
necessidades, enquanto que, indivíduos que não tem propriedade de auto tornam-se cativos
de outros modos de transportes.
Tipo de domicílio
A condição de moradia mostra se o domicílio é próprio ou não próprio (neste caso pode ser
alugado ou outra condição).
Classe de atividade
Renda mensal
A variável, nível de instrução, diz respeito aos aspectos da escolaridade dos indivíduos
amostrados. Já a variável idade refere-se à faixa etária em que se encontra o indivíduo.
Classificação ABA/ABIPEME
Na Tabela 3 são apresentadas as variáveis que foram utilizadas na calibração dos modelos
e o valor atribuído a cada item de escolha.
Capítulo 5 Calibração do Modelo 39
Por fim, selecionada a amostra, as variáveis e o conjunto de escolha que foi dado pelos
modos de transportes (automóvel, caminhamento, ônibus e outros) o próximo passo foi
calibrar os modelos utilizando o software SPSS.
Sendo assim, com base nos conceitos apresentados sobre o comportamento do consumidor
no processo de escolha dos modos de transportes, dos fundamentos dos modelos de escolha
discreta empregados na análise de demanda e na metodologia proposta para o
desenvolvimento do trabalho, o capítulo seguinte trata da aplicação prática dos conceitos
estudados. Será apresentado o estudo de caso realizado na cidade de Uberlândia e os
resultados alcançados.
Capítulo 6 Estudo de Caso e Resultados 41
CAPÍTULO 6
ESTUDO DE CASO E RESULTADOS
A área de estudo compreende a cidade Uberlândia que é uma cidade de médio porte, e está
localizada no Triângulo Mineiro (MG). A cidade conheceu a partir do final da década de
1960 um crescente processo de urbanização, que se intensificou nas décadas seguintes.
Hoje com uma população que segundo dados do Instituto Brasileiro de Geografia e
Estatística (IBGE/2009) ultrapassam os 600.000 habitantes e uma frota de
aproximadamente 263.876 veículos (Departamento Nacional de Trânsito/2009), assiste-se
ao crescimento dos problemas relacionados aos sistemas de transportes urbanos.
Os cinco setores da cidade foram divididos em 65 zonas de tráfego conforme dados sócio-
econômicos e das viagens realizadas entre os pontos de origem e destino. Os principais
Capítulo 6 Estudo de Caso e Resultados 42
O banco de dados que será utilizado na calibração dos modelos é uma parte dos dados da
pesquisa O/D e consta de uma amostra por zona de tráfego com margem de erro 3% e nível
de confiança de 95%, num total de 1045 observações. Na Tabela 4 consta a amostra
selecionada para as 65 zonas de tráfego. Observa-se que em alguns casos um único bairro
foi dividido em mais de uma zona de tráfego.
Capítulo 6 Estudo de Caso e Resultados 43
A amostra selecionada para esta pesquisa contém 1045 observações. A Tabela 5 e a Figura
10 apresentam a distribuição das viagens de acordo com o modo de transporte utilizado.
Verifica-se que 73,5% das viagens são realizadas pelos modos não motorizados
(caminhamento, bicicleta) e transporte coletivo, considerados importantes para a
sustentabilidade do tráfego nas cidades. Apesar de a cidade possuir a segunda frota de
veículos do estado, as viagens pelo modo automóvel somam 21% das viagens. Já o modo
bicicleta foi utilizado em uma pequena parcela das viagens, apenas 7%, o que pode ser
resultado da falta de espaços adequados (ciclovias e bicicletários) para esse modo de
transporte já que a topografia da cidade é plana favorecendo os deslocamentos por esse
modo.
• O modo ônibus inclui o transporte coletivo, transporte escolar e van. Neste caso o
modo “Van” refere-se ao serviço oferecido pelo projeto Passe Livre, que
funcionava como um complemento ao sistema de transporte coletivo da cidade em
2002;
• O modo auto, considera o automóvel (tanto usuários que são motoristas como
aqueles que são passageiros);
• O caminhamento refere-se às viagens realizadas pelo modo à pé;
• E outros, que inclui as viagens realizadas pelos modos bicicleta, moto e outros.
Para
ara a caracterização do padrão de escolha das viagens as variáveis selecionadas no banco
de dados da pesquisa O/D foram:
foram: o motivo de viagem, o tempo total de viagem e o número
de viagens realizadas pelos indivíduos. A Tabela 7 apresenta o total das viagens
distribuidas pelos motivos de viagem.
Quanto ao número de viagens feitas por dia pelo indivíduo, 88% dos usuários realizaram
até duas viagens por dia, 11% de três à quatro viagens e apenas 1% realizaram mais de
cinco viagens por dia conforme mostra a Tabela 9 e a Figura 14.
de 3 a 4 viagens 115 11
11,0
mais de 5 viagens 10 1
1,0
Conforme mostra a Tabela 11 e a Figura 16, desses indivíduos 26 % estão na faixa etária
até dezoito anos, o que pode ser considerado como um fator de limitação ao uso do auto
como condutor, uma vez que pela legislação brasileira apenas maiores de dezoito anos
podem habilitar-se
se para conduzir veículos. Observa-se
Observa se ainda que indivíduos na faixa etária
de dezoito à trinta anos e de trinta à quarenta
quarenta anos somam 40% da amostra e 34% dos
indivíduos possuem mais de quarenta anos.
18 à 30 anos 219 21
30 à 40 anos 199 19
A Tabela 12 e a Figura 17 mostram que, quanto ao nível de instrução 18% dos indivíduos
não são alfabetizados ou possuem apenas o primário incompleto, 32% possue primário
completo ou ginásio incompleto, 15% ginásio completo ou colegial
colegial incompleto,
in 23%
colegial completo ou superior incompleto e apenas 12% possuem curso superior completo.
Quanto à situação familiar a Tabela 13 e a Figura 18 mostram que 40% dos entrevistados
no domicílio declararam-se
se como filhos, 31% ocupam a posição de chefe de família, 18%
são cônjuges, 8% sãoo parentes, 2% empregados e 1% outros.
Parente 84 8,0
Empregado 20 2,0
Outros 11 1,0
Possui 606 58
58,0
≥ 20,1 SM 10 1,0
A2 5 0,5
B1 63 6,0
,0
B2 282 27,0
,0
C1 230 22,0
,0
C2 251 24,0
,0
D 199 19,0
,0
E 16 1,5
Total 1.045 100,0
,0
Capítulo 6 Estudo de Caso e Resultados 57
Comparando-se
se os índices nacionais apresentados pela ABEP (2008) na Figura 23, aos
índices apresentados pela amostra da cidade de Uberlândia na Figura 22, mostram que os
indivíduos pertencentes
encentes às classes C1 (pontuação entre 18 - 22), C2 (pontuação entre 14 -
17) e D (pontuação entre 8 - 13) formam o extrato da população considerada como classe
média-baixa e é onde se concentra a maior parcela da população,
população, respondendo por 65%.
65%
Já os indivíduos
ivíduos pertencentes à classe B1 (com pontuação entre 29 - 34) e B2 (com
pontuação entre 23 - 28) podem ser considerados como população de classe média e
respondem na cidade de Uberlândia por 33% da amostra.
amostra. Esse índice é superior ao
nacional que responde por 24,6% da população.
A melhor forma de trabalhar estes dados é a partir de um modelo ajustado que permitirá
estimar a probabilidade de ocorrência para cada uma das respostas.
respostas. A abordagem
matemática utilizada para se chegar
chegar a este modelo é denominada regressão
r logística
binomial. Assim, na Tabela 18 para dois modos de transporte (A e B) tem-se
tem que:
Tem-se que:
Assim: Resolvendo:
Mas:
6.3 RESULTADOS
Ressalta-se que, foram gerados modelos incluindo várias combinações diferentes das
variáveis explicativas e também diferentes agrupamentos dos modos de transportes e,
portanto, os resultados apresentados incluem os modelos e as variáveis que apresentaram
maior significância.
Para calibrar os modelos utilizou-se o método foward stepwise Wald e estimativa dos
parâmetros por máxima verossimilhança para avaliar a qualidade dos modelos calibrados.
O primeiro modelo calibrado refere-se à escolha do auto. Neste caso a escolha do auto
como modo de transporte recebeu valor “1” e a escolha de outro modo valor “0”. No
Anexo 1 são apresentadas e comentadas, as tabelas geradas no SPSS para o modelo.
Assim, nesse primeiro modelo foram incluídas na análise 1045 observações.
O procedimento executado pelo software SPSS mostra na Tabela 19, de classificação dos
casos, que sem a inclusão das variáveis explicativas já se alcança um nível de acerto
aproximado de 77% na classificação dos casos.
As iterações do modelo foram feitas em quatro passos pelo método foward stepwise Wald
sendo a constante incluída no modelo. O valor inicial de máxima verossimilhança do
modelo (-2Log Likelihood ) foi de 1116,473 e o valor final de 871,01. Este valor final para
o log de verossimilhança mostra que após as iterações e a exclusão das variáveis não
significantes, ocorreu uma redução no valor -2Log Likelihood.
Os valores obtidos no modelo final para o pseudo R2 de Cox e Snell acima de 20%, e
Nagelkerke acima de 31% são apresentados na Tabela 20.
O modelo apresentou, portanto, uma porcentagem de acerto acima de 80% que pode ser
considerado bom. O valor de porcentagem geral é obtido somando-se o total de acertos do
modelo e dividindo-se pelo total de observações 1045. Assim, no último passo, por
exemplo, a porcentagem geral de acerto foi de 81,4%, esse valor foi obtido somando-se o
total de acertos (774+77 = 851 acertos) e dividindo-se esse valor pelo total das observações
(851/1045 = 0,8143x100 = 81,4%)
Assim, a cada passo as variáveis explicativas vão sendo incluídas no modelo com base na
estatística de Wald e nas suas respectivas significância (nível adotado ≤ 0,050) e vão sendo
excluídas aquelas que não são significantes.
A partir dos parâmetros obtidos chega-se então a equação (10) para a utilidade do modo
auto.
Capítulo 6 Estudo de Caso e Resultados 63
B = estimativas dos parâmetros das equações; SE = erro padrão; Wald = Estatística de Wald; df = graus de liberdade;
Sig = significância da estatística de Wald; Exp (B) = odds; 95% CI= intervalo de confiança de 95% para odds.
Segue-se a função linearizada que será utilizada para a obtenção da probabilidade do modo
auto.
Onde:
TV é o Tempo de Viagem;
PA é a Propriedade Auto;
NI é o Nível de Instrução;
R é a Renda
Como onível de significância das variáveis tempo de viagem, posse de auto, nível de
instrução e renda, estão abaixo de 0,050 verifica-se que, essas variáveis possuem relação
com a escolha do modo auto.
Capítulo 6 Estudo de Caso e Resultados 64
Analisando o odds (exp(B)) apresentados na Tabela 22, tem-se que a propriedade de auto
aumenta em 4,447 vezes mais a chance de escolha do modo auto. Quanto ao nível de
instrução a cada unidade de acréscimo no nível de instrução espera-se em média 24% de
acréscimo na probabilidade de escolha do auto. Para a variável renda, a cada unidade de
acréscimo espera-se em média 44% de acréscimo na probabilidade de escolha do auto.
Com relação ao tempo de viagem supõe-se que, para tempos de viagens pequenos, a
probabilidade de uso do modo auto sofra redução. Os intervalos de confiança revelam a
amplitude do odds com confiança de 95%.
Portanto para a escolha do auto como modo de transporte as variáveis que apresentaram
significância para o modelo final foram: o tempo de viagem, a posse de auto, o nível de
instrução e a renda.
O segundo modelo calibrado refere-se à escolha do modo caminhamento. O valor “1” será
atribuído ao modo caminhamento e “0” para outro modo de transporte, no Anexo 2
encontram-se tabelas referentes aos testes estatísticos do modelo. Nesse segundo modelo
foram incluídas na análise 809 observações.
As iterações pelo método foward stepwise Wald ocorreram em dois passos com a inclusão
da constante no modelo. Os valores pseudo R2 obtidos para o modelo final mostram que, o
Capítulo 6 Estudo de Caso e Resultados 65
pseudo R2 de Cox e Snell apresentou valor de 26% e Nagelkerke 36%, conforme a Tabela
24.
O modelo apresentou, portanto, uma porcentagem de acerto acima de 60% que pode ser
considerado razoável.
B = estimativas dos parâmetros das equações; SE = erro padrão; Wald = Estatística de Wald; df = graus de liberdade;
Sig = significância da estatística de Wald; Exp (B) = odds; 95% CI= intervalo de confiança de 95% para odds.
A partir dos parâmetros obtidos, chega-se a seguinte função linearizada para a utilidade do
modo caminhamento:
Onde:
TV é o Tempo de Viagem;
R é a Renda.
A significância das variáveis tempo de viagem e renda, estão abaixo de 0,050 indicando
que essas variáveis possuem relação com a escolha do modo caminhamento. Os valores de
odds (exp(B)) apresentados na Tabela 26, mostram que a renda e o tempo de viagem
reduzem a probabilidade das chances de escolha do modo caminhamento (odds < 1).
As iterações pelo método foward stepwise Wald foram feitas em quatro passos sendo a
constante incluída no modelo. A Tabela 28 mostra os valores obtidos para o pseudo R2 de
Cox e Snell foi de 19,4%, e Nagelkerke 27,2%.
O modelo apresenta no último passo uma porcentagem de acerto acima de 80%, conforme
mostra a Tabela 29. Na diagonal estão os casos corretamente classificados.
Os resultados dos parâmetros para a função utilidade do modo ônibus são apresentados na
Tabela 30.
B = estimativas dos parâmetros das equações; SE = erro padrão; Wald = Estatística de Wald; df = graus de liberdade;
Sig = significância da estatística de Wald; Exp (B) = odds; 95% CI= intervalo de confiança de 95% para odds.
Capítulo 6 Estudo de Caso e Resultados 69
Assim, as variáveis relevantes para esse modelo foram: o tempo de viagem, a situação
familiar, a idade e a proproiedade de auto, com nível de significância abaixo de 0,050. A
partir dos parâmetros obtidos a função linearizada para a utilidade do modo ônibus é a
seguinte:
Onde:
TV é o Tempo de Viagem;
SF é a Situação Familiar;
I é a Idade;
PA é a Propriedade de Auto.
Os valores do odds (exp(B)) apresentados na Tabela 30, mostra que as variáveis: situação
familiar e a posse de auto reduzem a probabilidade de escolha do modo ônibus. Assim, a
condição de ser chefe de família e proriedade de auto, diminue a chance do indivíduo usar
o modo ônibus.
como possibilidade de escolha, e outro da mesma classe que utilizou outro modo (viajantes
“cativos”).
)$c_T5UV
_T5UV 13
)$c_T5UV )$c_V5UdV`
)$c_[T\'T\]UV
_[T\'T\]UV 14
)$c_[T\'T\]UV )$c_V5UdV`
)$c_ô_5`
_ô_5` 15
)$c_ô_5` )$c_V5UdV`
Capítulo 6 Estudo de Caso e Resultados 71
A probabilidade de escolha do modo auto foi superior a 50% para usuários da classe A2 e
B1, conforme mostra a Tabela 32.
Capítulo 6 Estudo de Caso e Resultados 72
Já no caso da escolha do modo ônibus a probabilidade foi superior a 50% para pelo menos
um dos indivíduos das classes socioeconômicas B1, B2, C1, C2, D e E, conforme
resultados da Tabela 34.
• Auto;
• Caminhamento;
• Ônibus;
• e Outros.
Capítulo 6 Estudo de Caso e Resultados 74
A partir dos modelos calibrados nos três níveis hierárquicos os resultados apresentados na
Tabela 31 mostram as utilidades para os modos de transportes, e nas Tabelas 32, 33 e 34
são apresentadas as probabilidades para os modos em cada nível. Assim, tem-se que as
utilidades para o auto foram positivas para os dois indivíduos da classe A2, para o
indivíduo “4” da classe B1 e o indivíduo “6” da classe B2. Na classe B2 o indivíduo “6”
apresentou utilidade positiva tanto para o auto (0,553) quanto para o ônibus, porém, a
utilidade do modo ônibus foi superior e mostrou-se mais positiva (0,784).
O indivíduo “4” da classe B1 também possui utilidade positiva para o modo auto e
apresenta as seguintes características: tempo de viagem de vinte minutos, possui auto e
utilizou esse modo para realizar sua viagem. O nível de instrução desse indivíduo é
colegial completo à superior incompleto, renda entre 8,1 à 10,0 salários mínimos, a sua
situação familiar é de chefe de família com mais de quarenta anos de idade e apresentou
67,68% de probabilidade de escolha para o auto.
O indivíduo “8” da classe C1 também apresentou probabilidade para o modo auto (44%
para esse modo). Esse indivíduo tem posse de auto, realizou sua viagem em vinte e dois
minutos e utilizou este modo de transporte para realizar seu deslocamento. Quanto as suas
características socioeconômicas, possui nível de instrução de primário completo a ginásio
incompleto, renda de 6,1 a 8,0 salários mínimos, é chefe de família e encontra-se na faixa
etária acima de quarenta anos.
No caso do ônibus com excessão da classe A2, as utilidades foram positivas em pelo
menos um dos casos nas classes B1, B2, C1, C2, D e E. Assim, para o indivíduo “3” B1
que apresenta tempo de viagem de quarenta minutos, possui auto, mas utilizou outro modo
de transporte, escolaridade entre colegial completo a superior incompleto, renda de 6,1 a
8,0 salários mínimos, idade entre 18 a 30 anos, a probabilidade de escolha do ônibus foi de
72,01%.
Para os dois indivíduos da classe B2 as utilidades foram positivas também para o modo
ônibus. Para o primeiro indivíduo o tempo de viagem foi trinta e cinco minutos, tem posse
de auto, porém, utilizou o ônibus para realizar o seu deslocamento. A escolaridade desse
indivíduo está entre ginásio completo a colegial incompleto, renda entre 4,1 a 6,0 salários
mínimos, situação familiar de não chefe de família, idade entre 30 à 40 anos e
probabilidade de 79,14% para a escolha do ônibus.
A classe C2 também apresentou utilidade positiva para o ônibus nas duas observações
selecionadas. Esses indivíduos apresentaram as seguintes características: não possui auto,
nível de instrução do primário completo a ginásio incompleto, renda entre 2,1 a 4,0 salários
mínimos, chefe de família, com mais de quarenta anos. Estes diferiram quanto ao tempo de
viagem e pelo modo utilizado no deslocamento. Assim, para o indivíduo que apresentou
tempo de viagem de quarenta e um minutos a probabilidade para o ônibus foi de 90,73% e
Capítulo 6 Estudo de Caso e Resultados 77
esse realmente utilizou o ônibus no seu deslocamento, enquanto que para o indivíduo com
tempo de viagem de vinte e três minutos a probabilidade para esse modo foi de 60,78% e
apesar de não possuir auto, o modo utilizado para realizar a viagem foi o auto. Observa-se
que mesmo para indivíduos com caracteísticas socioeconômicas e de viagem parecidas, a
probabilidade para a escolha do transporte coletivo diminui diante da possibilidade de
escolha do auto.
Já para o indivíduo “12” da classe D a probabilidade para o ônibus foi de 99,37%, com
tempo de viagem de setenta minutos, esse indivíduo não tem posse de auto, no entanto, o
modo utilizado na viagem foi o auto. Com relação a escolaridade está entre analfabeto a
primário incompleto, renda de 0,0 a 2,0 salários mínimos e é chefe de família com mais de
quarenta anos.
A partir das descrições dos indivíduos selecionados nota-se que, no caso do auto a
utilidade é mais positiva, quanto maior a renda, o nível de instrução e se o indivíduo possui
auto. A posse de auto aumentou a probabilidade de escolha desse modo, e refletiu a
característica dos modelos de demanda, que são os usuários com “escolha” e os usuários
“cativos” do transporte. Assim, os indivíduos com posse de auto têm a possibilidade de
escolher o modo que melhor atende suas necessidades, e apresentaram probabilidades para
esse modo acima de 60%.
No caso dos indivíduos da classe A2, nota-se que: para o indivíduo com maior tempo de
viagem (41 minutos), chefe de família, com mais de quarenta anos e com posse de auto, a
utilidade e a probabilidade foram um pouco menor (62%), e neste caso a sua real escolha
Capítulo 6 Estudo de Caso e Resultados 78
foi pelo modo ônibus. No caso do indivíduo mais jovem (idade de 18 a 30 anos), que não é
chefe de família, com tempo de viagem menor (15 minutos) e que tem posse de auto, a
utilidade foi mais positiva e a probabilidade encontrada de 77% para escolha do auto, e a
sua real escolha foi pelo modo auto. Portanto, o fato de possuirem auto é determinante na
utilidade e probabilidade de escolha desse modo de transporte, ressaltando, portanto, as
caractrísticas do viajante com escolha.
No caso do modo ônibus dos oito indivíduos que apresentaram utilidade positiva para esse
modo, cinco não possuem auto. O fato de não possuírem auto, aliado as características de
escolaridade (de analfabeto a superior incompleto), renda (abaixo de 10,0 salários
mínimos) tornaram a utilidade desse modo mais positiva para esses indivíduos. Observa-se
também que quanto menor a renda e o nível de escolaridade maior a probabilidade de uso
do ônibus.
A posse de auto permite, então, aos indivíduos escolher o modo de transporte a ser
utilizado nas viagens, que pode ser pelo próprio auto, pelo caminhamento, pelo ônibus ou
outro modo de transporte. No entato, a posse de auto aumenta a probabilidade de uso desse
modo, e mesmo nos casos em que os indivíduos possuem as mesmas características
socioeconômicas e não tem posse de auto mais tem a possibilidade de utilizá-lo, ocorre
redução na probabilidade de escolha dos outros modos.
Diante dos problemas relacionados ao transporte urbano em cidades de médio porte, este
trabalho teve por objetivo calibrar modelos de escolha discreta para a etapa de divisão
modal e assim, estimar as probabilidades de escolha dos usuários dos modos de transportes
considerando como principais opções disponíveis ao usuário o auto, o caminhamento, o
ônibus e outros.
Diante dos resultados alcançados neste estudo, algumas sugestões podem ser feitas no
sentido de que trabalhos futuros abordem o comportamento da demanda em transportes
com o uso de modelos de escolha discreta. Assim:
Por fim, com base nos resultados alcançados espera-se que este trabalho possa servir, em
algum momento futuro, de referência para outros trabalhos não só no âmbito acadêmico
mais também em aplicações práticas para análise de demanda no planejamento de
transportes, de forma a contribuir para a melhoria do uso dos modos mais sustentáveis de
transportes.
Referências Bibliográficas 81
REFERÊNCIAS BIBLIOGRÁFICAS
ARANGO, H. G. Bioestatística Teórica e Computacional. Rio de Janeiro: Guanabara
Koogan S.A., 2001, 235 p.
DORIA FILHO, U. Introdução à Bioestatística: para simples mortais. 4. ed. São Paulo:
Negócio Editora, 1999, 158 p.
KOTLER, P. Marketing Management. ed. 8. Prentice Hall Ed., 1976. Cap. 7: Analyzing
Consumer Markets and Buyer Behavior.
MANUAL Stastistical Package for Social Sciences (SPSS). Modelos de Regresión. Versão
12.0 Copyright © de SPSS Inc. 2003, 71 p.
MANSKI, C.. The Structure of Random Utility Models. Theory and Decision, v. 8, n° 3, p.
229-254, 1977. Disponível em: <htpp://www.sciencedirect.com>. Acesso em: 21 de março
2009
Anexo 1
No primeiro modelo, que diz respeito ao modo auto, foram incluídas na análise 1045
observações conforme o Tabela 01.
A Tabela 02 apresenta a codificação da variável dependente com valor “1” para o auto e
“0” para outro modo de transporte.
Iteration Historya,b,c
-2 Log Coefficients
Iteration likelihood Constant
Step 1 1119,900 -1,097
0 2 1116,476 -1,227
3 1116,473 -1,232
a. Constant is included in the model.
b. Initial -2 Log Likelihood: 1116,473
c. Estimation terminated at iteration number 3 because
log-likelihood decreased by less than ,010 percent.
Score df Sig.
Step Variables TTV 49,248 1 ,000
0 AUTO 109,895 1 ,000
NIVLINST 73,696 1 ,000
SITFAM 12,310 1 ,000
IDADE1 9,652 1 ,002
RENDA 126,084 1 ,000
CLASABA 85,768 1 ,000
Overall Statistics 229,613 7 ,000
-2 Log Coefficients
Iteration likelihood Constant RENDA AUTO TTV NIVLINST
Step 1 1018,123 -1,884 ,424
1 2 1006,694 -2,273 ,514
3 1006,610 -2,311 ,523
Step 1 959,855 -2,241 ,347 ,860
2 2 927,253 -3,038 ,414 1,452
3 924,972 -3,309 ,426 1,695
4
924,948 -3,340 ,427 1,724
Os valores obtidos na Tabela 06 para pseudo R2 de Cox e Snell foi de 20%, e Nagelkerke
31%. O valor do -2Log likelihood decresce do primeiro passo para o último.
Tabela 06 – Pseudo R2
B = estimativas dos parâmetros das equações; SE = erro padrão; Wald = Estatística de Wald; df = graus de liberdade;
Sig = significância da estatística de Wald; Exp (B) = ODDS; 95% CI= intervalo de confiança de 95% para ODDS.
Anexo 2 – Regressão Logística para o Modo Caminhamento 93
Anexo 2
Nesse segundo modelo foram incluídas na análise 809 observações conforme mostra o
Tabela 11.
Iteration Historya,b,c
-2 Log Coefficients
Iteration likelihood Constant
Step 1 1147,276 -,628
0 2 1147,179 -,650
a. Constant is included in the model.
b. Initial -2 Log Likelihood: 1147,179
c. Estimation terminated at iteration number 2 because
log-likelihood decreased by less than ,010 percent.
Score df Sig.
Step Variables TTV 169,761 1 ,000
0 SITFAM 12,204 1 ,000
IDADE1 16,671 1 ,000
RENDA 11,528 1 ,001
Overall Statistics 182,739 4 ,000
A Tabela 14 mostra que neste caso as iterações do modelo pelo método foward stepwise
Wald foi realizada em dois passos e cinco iterações, até chegar ao modelo final.
Anexo 2 – Regressão Logística para o Modo Caminhamento 96
-2 Log Coefficients
Iteration likelihood Constant TTV RENDA
Step 1 951,659 ,435 -,030
1 2 892,099 1,028 -,054
3 884,948 1,261 -,066
4 884,800 1,296 -,067
5 884,800 1,297 -,067
Step 1 940,640 ,757 -,030 -,204
2 2 879,550 1,450 -,054 -,269
3 872,074 1,721 -,066 -,289
4 871,911 1,764 -,068 -,292
5 871,911 1,765 -,068 -,292
a. Method: Forward Stepwise (Wald)
b. Constant is included in the model.
c. Initial -2 Log Likelihood: 1147,179
d. Estimation terminated at iteration number 5 because
parameter estimates changed by less than ,001.
e. Estimation terminated at iteration number 5 because
log-likelihood decreased by less than ,010 percent.
Os valores obtidos na Tabela 16 para o modelo final de R2 de Cox e Snell foi de 26%, e
Nagelkerke 36%.
Anexo 2 – Regressão Logística para o Modo Caminhamento 97
Tabela 16 – Pseudo R2
Verifica-se no Tabela 17 o teste qui-quadrado Hosmer and Lemeshow’s goodness of fit test
e a significância para o nível adotado α.
B = estimativas dos parâmetros das equações; SE = erro padrão; Wald = Estatística de Wald; df = graus de liberdade;
Sig = significância da estatística de Wald; Exp (B) = ODDS; 95% CI= intervalo de confiança de 95% para ODDS.
Anexo 3 – Regressão Logística para o Modo Ônibus 99
Anexo 3
No terceiro modelo a calibração foi realizada com 503 observações incluídas na análise
conforme Tabela 21.
Tabela 21 – Casos Processados
Iteration Historya,b,c
-2 Log Coefficients
Iteration likelihood Constant
Step 1 793,621 ,756
0 2 793,406 ,795
3 793,406 ,796
a. Constant is included in the model.
b. Initial -2 Log Likelihood: 793,406
c. Estimation terminated at iteration number 3 because
parameter estimates changed by less than ,001.
A Tabela 23 mostra que sem a inclusão das variáveis independentes, alcança-se um nível
de acerto aproximado de 87% na classificação dos casos.
Anexo 3 – Regressão Logística para o Modo Ônibus 101
Score df Sig.
Step Variables TTV 71,399 1 ,000
0 SITFAM 8,157 1 ,004
IDADE1 5,391 1 ,020
AUTO 8,059 1 ,005
CLASABA 6,211 1 ,013
Overall Statistics 101,655 5 ,000
-2 Log Coefficients
Iteration likelihood Constant TTV SITFAM IDADE1 AUTO
Step 1 713,688 -,136 ,020
1 2 688,995 -,677 ,037
3 687,491 -,818 ,042
4 687,483 -,828 ,042
Step 1 703,379 ,014 ,020 -,500
2 2 677,395 -,481 ,037 -,643
3 675,733 -,619 ,043 -,673
4 675,723 -,630 ,043 -,676
Step 1 692,776 -,466 ,019 -,805 ,245
3 2 665,198 -1,101 ,036 -1,082 ,328
3 663,343 -1,286 ,041 -1,153 ,352
4 663,330 -1,301 ,042 -1,159 ,354
Step 1 684,263 -,198 ,019 -,880 ,248 -,453
4 2 657,521 -,762 ,035 -1,186 ,338 -,533
3 655,748 -,939 ,040 -1,261 ,362 -,538
4 655,737 -,954 ,041 -1,267 ,364 -,538
a. Method: Forward Stepwise (Wald)
b. Constant is included in the model.
c. Initial -2 Log Likelihood: 793,406
d. Estimation terminated at iteration number 4 because log-likelihood decreased by less
than ,010 percent.
Tabela 26 – Pseud R2
Na Tabela 27 verifica-se o teste Hosmer and Lemeshow’s goodness of fit test. A estatística
do teste é maior que o nível de significância α adotado.
B = estimativas dos parâmetros das equações; SE = erro padrão; Wald = Estatística de Wald; df = graus de liberdade;
Sig = significância da estatística de Wald; Exp (B) = ODDS; 95% CI= intervalo de confiança de 95% para ODDS.
Anexo 4 – Tabela de Características dos Indivíduos 106
Anexo 4
Anexo 5
1. Características do usuário:
2. Características do usuário:
3. Características do usuário:
4. Características do usuário:
5. Características do usuário:
6. Características do usuário:
7. Características do usuário:
8. Características do usuário:
9. Características do usuário: