Escolar Documentos
Profissional Documentos
Cultura Documentos
Curitiba
Julho/2009
ANDR PINZ BORGES
Curitiba
Julho/2009
Borges, Andr Pinz
Descoberta de Regras de Conduo de Trens de Carga. Curitiba. 10-07-2009
Banca examinadora
Julgamento: Assinatura:
Julgamento: Assinatura:
Julgamento: Assinatura:
Dedicatria
Aos meus pais, incentivadores
e motivos pela busca ao meu
crescimento.
i
Agradecimentos
Deus, por ter me fornecido capacidade para desenvolver este trabalho e fazer
escolhas corretas at o presente momento.
Aos meus pais, por terem sempre me apoiado nas minhas decises.
Aos professores Dr. Edson Emlio Scalabrin e Dr. Fabrcio Enembreck pelas ho-
ras dedicadas realizao deste projeto. Em especial ao professor Edson, que me repas-
sou seus conhecimentos e me incentivou ao longo desta pesquisa, sendo um orientador
exemplar.
E a todos que me ajudaram direta ou indiretamente para que esse trabalho fosse
realizado.
ii
Sumrio
AGRADECIMENTOS................................................................................................................................ II
SUMRIO ............................................................................................................................................. III
LISTA DE FIGURAS ................................................................................................................................. V
LISTA DE TABELAS ............................................................................................................................... VII
LISTA DE SMBOLOS............................................................................................................................ VIII
LISTA DE TERMOS ................................................................................................................................. IX
RESUMO ................................................................................................................................................ X
ABSTRACT ............................................................................................................................................ XI
CAPTULO 1 - INTRODUO................................................................................................................... 1
1.1 MOTIVAO ...................................................................................................................................... 3
1.2 OBJETIVOS......................................................................................................................................... 4
1.3 HIPTESE .......................................................................................................................................... 4
1.4 CONTRIBUIES.................................................................................................................................. 5
1.5 ESTRUTURA DO DOCUMENTO................................................................................................................ 5
CAPTULO 2 - CONDUO DE TRENS ..................................................................................................... 6
2.1 MOVIMENTAO DO TREM ................................................................................................................... 8
2.2 FREIOS DE UMA LOCOMOTIVA ............................................................................................................. 10
2.3 TRECHOS ONDULADOS ....................................................................................................................... 11
2.4 TRECHOS EM CRISTAS ........................................................................................................................ 12
2.5 PARTIDA E PARADA DO TREM .............................................................................................................. 13
2.6 EQUAES DE DAVIS ......................................................................................................................... 18
2.6.1 Resistncias Normais e Acidentais ..................................................................................... 18
2.6.2 Esforo Trator e Fora de Acelerao ................................................................................. 20
2.6.3 Deslocamento ..................................................................................................................... 21
2.6.4 Consumo ............................................................................................................................. 23
2.6.5 Equaes de Davis Modificadas ......................................................................................... 24
2.6.6 Exemplo de aplicao ......................................................................................................... 26
2.7 CONSIDERAES FINAIS ...................................................................................................................... 28
CAPTULO 3 - DESCOBERTA AUTOMATIZADA DO CONHECIMENTO ..................................................... 30
3.1 O PROCESSO DE DESCOBERTA DO CONHECIMENTO ................................................................................... 30
3.2 PR-PROCESSAMENTO ....................................................................................................................... 31
3.2.1 Transformao dos dados .................................................................................................. 31
3.2.1.1 Remoo de rudos ........................................................................................................ 32
3.2.1.2 Seleo de atributos ...................................................................................................... 32
3.3 MINERAO DE DADOS...................................................................................................................... 33
3.3.1 Software WEKA .................................................................................................................. 34
3.4 APRENDIZAGEM DE MQUINA............................................................................................................. 34
3.4.1 Aprendizagem Simblica de Mquina ................................................................................ 35
3.4.2 Aprendizagem Indutiva ...................................................................................................... 35
3.5 MTODOS DE CLASSIFICAO .............................................................................................................. 36
3.5.1 Algoritmo C4.5 .................................................................................................................... 37
3.5.1.1 Algoritmo JRIP................................................................................................................ 45
3.5.2 Mtodo BAGGING com o algoritmo C4.5 ........................................................................... 46
3.5.3 Mtodo BOOSTING com o algoritmo C4.5.......................................................................... 50
3.6 VALIDAO CRUZADA ........................................................................................................................ 55
3.7 TESTE ESTATSTICO ............................................................................................................................ 57
3.8 TRABALHOS RELACIONADOS ................................................................................................................ 58
3.9 CONSIDERAES FINAIS ..................................................................................................................... 59
iii
CAPTULO 4 - METODOLOGIA .............................................................................................................. 61
4.1 MODELAGEM DOS DADOS .................................................................................................................. 61
4.2 ORIGEM E FORMATO DOS DADOS ......................................................................................................... 62
4.2.1 Remoo de Rudos ............................................................................................................ 64
4.2.2 Incluso de Novos Atributos ............................................................................................... 65
4.2.3 Seleo de Atributos ........................................................................................................... 72
4.2.4 Transformao de Atributos ............................................................................................... 72
4.3 APLICAO DOS ALGORITMOS DE MINERAO ....................................................................................... 73
4.4 CONSIDERAES FINAIS ..................................................................................................................... 75
CAPTULO 5 - SIMULADOR ................................................................................................................... 76
5.1 DESCRIO GERAL DO SIMULADOR ...................................................................................................... 76
5.2 EXEMPLOS DE CLCULOS .................................................................................................................... 78
5.3 USO DOS CLASSIFICADORES ................................................................................................................. 81
5.4 PROCEDIMENTOS DE REFINAMENTOS .................................................................................................... 83
5.4.1 Controle de Patinao ........................................................................................................ 83
5.4.2 Falta de Potncia ................................................................................................................ 85
5.4.3 Marcha Excessiva ............................................................................................................... 86
5.5 EXECUO DE UMA VIAGEM ............................................................................................................... 87
5.6 CONSIDERAES FINAIS ...................................................................................................................... 93
CAPTULO 6 - RESULTADOS .................................................................................................................. 95
6.1 FASE DE APRENDIZAGEM .................................................................................................................... 97
6.2 FASE DE APLICAO DE CLASSIFICADORES ............................................................................................ 101
6.2.1 Aplicao do Conhecimento Descoberto .......................................................................... 103
6.2.1.1 Viagem A ..................................................................................................................... 105
6.2.1.2 Viagem B...................................................................................................................... 107
6.2.2 Anlise da Similaridade da Conduo .............................................................................. 109
6.3 CONSIDERAES FINAIS ................................................................................................................... 114
CAPTULO 7 - CONCLUSES ............................................................................................................... 116
7.1 LIMITAES ................................................................................................................................... 117
7.2 TRABALHOS FUTUROS ...................................................................................................................... 118
REFERNCIAS BIBLIOGRFICAS .......................................................................................................... 119
iv
Lista de Figuras
v
FIGURA 32 TRECHO REAL DA VIA FRREA: DE LONDRINA (PR) AT PAIANDU (PR) ................................ 101
FIGURA 33 USO DOS PONTOS DE ACELERAO PELA MAQUINISTA SER HUMANO. ................................... 102
FIGURA 34 - RESULTADO DA SIMULAO PARA A CONFIGURAO A USANDO AS REGRAS DESCOBERTAS POR
MEIO DO MTODO JRIP+BOOSTING....................................................................................... 104
FIGURA 37 - USO DOS PONTOS DE ACELERAO NAS VIAGENS 1, 3 E 6 PARA AS CONFIGURAES A, B E C ... 105
FIGURA 38 DADOS DA VIAGEM A USANDO UM CLASSIFICADOR JRIP. ................................................... 106
FIGURA 39 - REGRAS FREQENTEMENTE UTILIZADAS PELO CLASSIFICADOR .............................................. 106
FIGURA 40 EXEMPLO DE VIAGEM ANTES (A) E APS (B) A REMOO DAS PARADAS. ............................... 107
FIGURA 41 DADOS DA VIAGEM B USANDO UM CLASSIFICADOR JRIP. ................................................... 108
FIGURA 42 - REGRA UTILIZADA PELO CLASSIFICADOR JRIP SEM DADOS DE PARADAS. ................................. 108
FIGURA 43 DIFERENAS ENTRE PONTOS DE ACELERAO SUGERIDOS PELO CLASSIFICADOR E APLICADOS PELO
MAQUINISTA CONJUNTO DE TREINAMENTO CN E MTODO JRIP. ................................................ 110
FIGURA 44 - DIFERENAS ENTRE PONTOS DE ACELERAO SUGERIDOS PELO CLASSIFICADOR E APLICADOS PELO
MAQUINISTA CONJUNTO DE TREINAMENTO CN E MTODO JRIP+BAGGING................................ 110
FIGURA 45 - DIFERENAS ENTRE PONTOS DE ACELERAO SUGERIDOS PELO CLASSIFICADOR E APLICADOS PELO
MAQUINISTA CONJUNTO DE TREINAMENTO CN E MTODO JRIP+BOOSTING. ............................. 111
FIGURA 46 - DIFERENAS ENTRE PONTOS DE ACELERAO SUGERIDOS PELO CLASSIFICADOR E APLICADOS PELO
MAQUINISTA CONJUNTO DE TREINAMENTO CN E MTODO TODOS. ........................................... 112
vi
Lista de Tabelas
vii
Lista de Smbolos
HP Horse Power
PSI libras por polegada quadrada (pound force per square inch)
viii
Lista de Termos
ix
Resumo
Este trabalho visa descobrir padres para ajudar o maquinista na conduo de um trem.
A consecuo deste objetivo passa pela aplicao de tcnicas de aprendizagem de m-
quina e descoberta de conhecimento a partir de conjuntos de dados de viagens de trens
de cargas. O principal resultado a definio de uma metodologia para a obteno de
padres de conduo segura (e.g. velocidade mxima permitida) e econmica (tempo
mximo para uma viagem, consumo mnimo de combustvel). O problema de escalabi-
lidade em minerao de dados foi tratado por meio do uso de mtodos robustos, tais
como, BAGGING e BOOSTING. Os padres descobertos foram testados de forma ob-
jetiva. O processo consistiu, de um lado, aplicar tais padres para selecionar aes, por
meio de um simulador, a serem aplicadas medida que o trem movia-se, e de outro la-
do, quantificar a similaridade entre a conduo executada pelo simulador e a conduo
executada pelo maquinista ser humano. Foi observada uma similaridade em torno de
85% entre a conduo simulada e a real.
x
Abstract
This work aims to find patterns to help the machinist when driving a train.
Achieving this objective through by implementation machine learning techniques and
knowledge discovery from data sets of travel train loads. The main result is the defini-
tion of a methodology to obtain patterns of safe driving (e.g. maximum speed permitted)
and economical (maximum time for a trip, less fuel consumption). The problem of sca-
lability in data mining has been addressed through the use of robust methods such as
BAGGING and BOOSTING. The patterns discovered were tested in an objective way.
The process consisted, of a part, in apply these patterns to select actions, using a simula-
tor, to be applied as the train moved up, and also to quantify the similarity between the
conduct performed by driving simulator and implemented the human driver. There was
a similarity around 85% between the simulated and real driving.
xi
1
Captulo 1
Introduo
1
Convnio 3560/06.
2
gerou classificadores com pequenas taxas de erro, da ordem de 19.5%. Esta ltima ser-
viu como parmetro de filtragem de regras aplicveis conduo dos trens.
A validao dos padres descobertos foi realizada por meio da aplicao da va-
lidao cruzada, do clculo do cosseno e do Teste de Friedman. Outra forma de avalia-
o consiste em testar as regras obtidas em um simulador de viagens de trens; para tal
foi definido um simulador de conduo, que tenta reproduzir o comportamento do ma-
quinista, por meio da aplicao das regras de conduo descobertas. No interior do si-
mulador, as aes sugeridas por tais regras so sempre testadas antes de serem aplica-
das; caso o teste indique que a ao selecionada produzir uma situao potencialmente
indesejada (e.g. patinagem das rodas), um processo iterativo colocado em prtica para
corrigir-la. A eficincia do simulador foi medida por meio do clculo do cosseno, com-
parando os pontos de acelerao resultantes da classificao com os pontos de acelera-
o aplicados de pelo maquinista. O clculo do cosseno foi usado para medir o quo
prxima foi a conduo realizada pelo simulador e pelo maquinista ser humano. Por
fim, a aplicao do Teste de Friedman visou verificar as diferenas entre os classifica-
dores, co-validando a medida de similaridade.
1.1 Motivao
1.2 Objetivos
1.3 Hiptese
1.4 Contribuies
Captulo 2
CONDUO DE TRENS
os freios no estejam mais sendo aplicados. A forma de aplicao de freios e seus tipos
sero discutidos ao longo deste captulo.
Uma locomotiva possui trs tipos diferentes de freios, cuja presso medida em
psi (pound force per square inch, em portugus, libra por polegada quadrada) indi-
cada ao maquinista por meio de um dispositivo telemtrico. So eles:
Independente: a ao do freio ocorre somente nas locomotivas, no sendo re-
plicado aos vages. recomendvel sua utilizao de forma isolada para a redu-
o de velocidade. Deve-se observar para tanto que a velocidade esteja abaixo
de vinte km/h. O seu uso inadequado pode ocasionar acidentes, bem como rodas
deformadas e trincadas. A resposta deste tipo de freio praticamente instant-
nea, diferente dos freios presentes nos vages que possuem um tempo de respos-
ta maior (cerca de um segundo para cada vago do trem). A restrio de veloci-
dade imposta para evitar que se busque melhorar o consumo de combustvel
em detrimento do equipamento. Normalmente, a primeira locomotiva respon-
svel por sessenta e cinco por cento do emprego do ar para o freio, a segunda lo-
comotiva com vinte por cento e a terceira com quinze por cento; valores defini-
dos pelo fabricante e no configurveis.
Dinmico: pode ser comparado com o freio motor de um veculo de passeio.
Tem sua utilizao recomendada quando a velocidade do trem est entre vinte e
trinta km/h. Sua aplicao requer uma espera de dez segundos para a aplicao
do freio dinmico. Se a velocidade do trem for acima de dez km/h no deve ser
utilizado juntamente com o freio independente. Deve-se aplic-lo, em situao
de parada em descida e com velocidade abaixo de dez km/h, juntamente com o
freio independente para compensar a perda de eficcia do freio dinmico. A ace-
lerao durante a frenagem dinmica tem por objetivo fazer com que o motor
trabalhe mais, gerando ar para refrigerar os motores de trao. Da mesma forma
que o ampermetro mostra a potncia gerada para mover uma locomotiva, duran-
11
com rampas maiores que um por cento, as foras aplicadas nos engates tendem a serem
maiores; a experincia do maquinista faz-se aqui fundamental para movimentar o trem.
A velocidade do trem em trecho ondulado deve ser controlada acelerando ou de-
sacelerando o trem, fazendo uma reduo mnima quando a locomotiva comear a des-
cer o primeiro declive. Quando a cauda do trem passar por uma bacia e comear a subir,
a folga do trem tender a distender-se, ocasionando aumento nas foras internas do
trem. Em geral, para evitar danos, a velocidade do trem deve ser mantida constante em
trechos ondulados, observando a aplicao dos freios e em pontos de acelerao mais
baixos possveis. Caso necessite desacelerar o trem, ento se deve utilizar o freio din-
mico quando disponvel, ou pelo acelerador juntamente com o freio automtico.
Quando o trem estiver na parte ascendente da rampa devem-se utilizar pontos de
acelerao mais baixos, caracterizando o efeito atrasados dos aclives. Caso o freio au-
tomtico tenha sido aplicado, ento se deve reduzir a velocidade quando o trem comear
a descer o primeiro declive, reduzindo ainda de dois a trs psi se necessrio. No re-
comendvel utilizar o freio dinmico ao desacelerar um trem em rampas onduladas.
recomendvel iniciar o trecho ondulado em uma velocidade mais baixa do que a veloci-
dade requerida do trecho.
Um trem de oitenta vages parado com uma reduo de vinte psi no encanamen-
to geral e com retentores na posio super-restrita (onde h uma forte presso no enca-
namento de freios), aps posicionar o manipulador do freio automtico para a posio
de alvio dever aguardar no mnimo cento e cinqenta segundos para arrancar o trem.
empregada pode ser inferido por meio de um componente da locomotiva, chamado am-
permetro.
Os procedimentos tomados para a parada dos trens so resumidos na Tabela 2.
Em um trecho em nvel, um trem pode ser parado empregando o mtodo das folgas esti-
cadas ou encolhidas. Para tal, devem ser consideradas as seguintes informaes: forma-
o do trem, velocidade do trem, condies do equipamento de freios e folgas.
parada;
2. Reduza no mnimo de 5 a 8 psi no encanamento geral independente das
locomotivas;
3. Reduza 2 a 3 psi se necessrio;
4. Antes da parada faa uma reduo final necessria para a parada impe-
dindo que as folgas do trem se estiquem;
5. Aplique o freio independente.
Os procedimentos abaixo devem ser tomados sempre cuidando para que no
ocorram deslizamentos.
1. Aplique o freio dinmico para controlar a velocidade;
2. Quando alcanar uma distncia suficiente para parar reduza de 5 a 8 psi,
mantendo o freio independente da locomotiva totalmente aliviado;
Fortes rampas
3. Reduza 2 a 3 psi se necessrio;
descendentes
4. Mantenha o freio dinmico totalmente aplicado;
5. Mantenha o freio independente aliviado;
6. Quando o freio dinmico perder a eficincia
a. Se a velocidade for baixa, aplique gradualmente o freio man-
tendo o trem encolhido.
Tal condio depende da folga e da localizao do trem em relao depres-
so.
Ao aproximar-se de uma depresso desacelere o trem, mantendo as folgas esti-
Depresso
cadas por meio da utilizao do freio automtico e do acelerador.
Se a aproximao ocorrer j em rampa descendente com freio dinmico ativa-
do, uma desacelerao com folga encolhida pode ser feita por meio do freio
automtico.
Se a folga do trem estiver esticada:
1. Mantenha as folgas esticadas controlando a trao do trem;
2. Aplique o freio automtico;
3. Reduza o ponto de acelerao gradualmente para controlar a velocidade e
as foras internas do trem;
Trechos ondulados Se a folga do trem estiver encolhida:
1. Aplique o freio dinmico;
2. Aplique freio automtico at que a velocidade do trem possa atingir um
valor onde o freio dinmico no seja mais eficiente;
3. Aplique ento o freio independente para manter a cabeceira do trem en-
colhida.
Acelerao do trem:
1. Mantenha a velocidade constante enquanto o trem estiver percorrendo
trechos ondulados.
1. Deve-se primeiro verificar o sentido da fora resultante aps o alivio do
freio automtico;
2. Alivie gradualmente o freio independente das locomotivas, permitindo o
Cristas
movimento lento para frente;
3. Aumente gradativamente o acelerador;
4. Quando a cauda comear a movimentar-se, acelere gradativamente o trem.
( ) (
RTotal = nl .Pl Rnl' + Rcl' + R' + Ri' + nv .Pv Rnv' + Rcv' + R' + Ri' ) (1)
nv o numero de vages;
Pv o peso do vago (em toneladas);
Pl o peso locomotiva (em toneladas);
R nl' a resistncia normal da locomotiva (em Kgf);
R'
nv a resistncia normal do vago (em Kgf);
R'
cl a resistncia de curva da locomotiva (em Kgf);
R cv' a resistncia de curva do vago (em Kgf);
R'
a resistncia de inrcia (em Kgf);
R'
i a resistncia de rampa (em Kgf);
29 0,0024 A V (2)
Rnl = 1,3 + + 0,03 V +
w w n
Onde:
w o peso por eixo da locomotiva (em short-ton),
V a velocidade (em milhas/hora),
A a rea frontal da locomotiva (em square-feet) e
n o nmero de eixos da locomotiva.
29 0,0024 A V (3)
Rnv = 1.3 + + 0,045 V +
w w n
Onde:
w o peso por eixo do vago em toneladas (short-ton),
V a velocidade (em milhas/hora),
A a rea frontal do vago (square-feet) e
20
500 b (5)
Rcv =
R
Onde:
R corresponde ao valor do raio da curva (em metros),
p ao valor da base rgida e
b o tamanho da bitola (em metros).
R i = 10 i (7)
Onde:
i corresponde ao percentual de inclinao de certo ponto da via.
O esforo trator a fora total que um veculo tem disponvel para aplicar na sua
movimentao, conforme Equao 8. O resultado uma fora em kgf.
21
Para que ocorra o deslocamento do trem sem patinagem uma fora tratora m-
xima aplicada em um determinado instante deve ser estabelecida. Esta fora tratora m-
xima determinada pela Equao 9.
P f (9)
Ftm =
1 + (0,01 V )
Onde:
P o peso (em toneladas);
V velocidade mdia (em Km/h); e
f coeficiente de aderncia;
2.6.3 Deslocamento
P (VF VI ) (11)
= 4
Fac
Onde:
P o peso do trem (em toneladas);
VF a velocidade final (em Km/h);
VI velocidade inicial (em Km/h); e
Fac a fora aceleradora (em Kgf).
(12)
t = 7,2
VF +VI
Onde:
a variao do deslocamento (em quilmetros);
VF a velocidade final (em Km/h); e
VI velocidade inicial (em Km/h).
A velocidade mdia do trem pela razo entre duas grandezas: distncia percorri-
da expressa em quilmetros e tempo gasto expresso em horas (Equao 13). Multipli-
cando o valor obtido por 3.6 tem-se a velocidade em quilmetros por hora.
(13)
Vm =
t
Onde:
a variao do deslocamento (em metros);
t a variao do tempo (em segundos);
parciais gastos (Equao 15). A acelerao pode ser calculada com base na Equa-
o 16.
n (14)
final = k
k =1
n (15)
t final = tk
k =1
= Fac
g (16)
P
Onde:
lk a variao de deslocamento de sub-trecho k (em metros);
tk a variao do tempo de deslocamento de sub-trecho k (em minutos);
Fac a fora de acelerao (em Kgf);
P o peso do trem (em toneladas);
g a acelerao da gravidade (em metros/segundo2).
2.6.4 Consumo
CA (17)
LTKB = 1000
DA
P
1000
2
A sigla LTKB significa: litros por tonelada bruta transportada.
24
Onde:
CA o consumo acumulado da viagem (em litros);
P o peso do trem (em toneladas); e
DA a distncia percorrida da viagem (em quilmetros).
t (18)
C= cp
60
Onde:
cp o consumo nominal de um determinado ponto de acelerao (em litros);
t a variao do tempo (em minutos);
Onde:
W o peso por eixo de uma locomotiva (em short-ton);
V a velocidade (em milhas/hora);
25
Onde:
L o comprimento de um veculo de passageiros (em ps).
26
LTKB =
(0.020526 + 0.041241 ) 1000 = 0.333138
0.309019
600
1000
Captulo 3
DESCOBERTA AUTOMATIZADA DO
CONHECIMENTO
3.2 Pr-processamento
A seleo de atributos pode ser vista como uma etapa de filtragem de dados ou
como um mtodo para aprimorar o modelo gerado pelo algoritmo utilizado. importan-
te notar que o objetivo encontrar o melhor subconjunto, mas isto requer escolher quais
atributos sero utilizados durante a etapa de classificao, e dentre estes, quais so os
melhores segundo um determinado critrio. Uma vez feita esta distino, algumas ca-
ractersticas (atributos) podem ser removidas da base de dados ou desconsideradas du-
rante o processo de aprendizagem, o que deve aumentar o desempenho do classificador
e possibilitar tambm uma menor taxa de erro (HUAN, et al., 1998) (LIU, et al., 2005).
A busca pelos subconjuntos gerados pode ser completa, ou exaustiva (Exhausti-
ve Search), garantindo que o melhor resultado seja encontrado, desde que um resultado
completo seja encontrado. Um resultado considerado completo quando a busca abran-
ge todas as combinaes de atributos possveis. Isto pode ser realizado de forma se-
qencial inserindo ou removendo atributos, bem como de forma aleatria gerando um
conjunto inicial aleatrio e, a partir dele, edificando conjuntos de modo seqencial ou
aleatrio (LIU, 1998).
O primeiro passo no processo de seleo de atributos gerar, a partir de um con-
junto de dados, um subconjunto por meio da adio (forward) ou remoo (backward)
atributos e tambm medir a sua qualidade. Caso o subconjunto gerado seja satisfatrio,
atendendo o critrio de parada, ele considerado como o resultado da gerao, caso
33
crio simblica para cada classe. Para cada descrio formulada, uma regra de classifi-
cao pode ser usada para predizer a classe de um determinado evento, cuja classe
desconhecida ou no informada. A estratgica de aprendizagem no supervisionada
regida pela aprendizagem por meio de observaes no classificadas. A busca da des-
crio de cada classe cega medida que se tem que reconhecer padres por si s, e-
xaminando os exemplos. O resultado da execuo de tal processo de busca um conjun-
to de descries de classe, uma para cada classe descoberta.
A aprendizagem indutiva consiste na extrao de padres a partir de um univer-
so de exemplos. Um mtodo de aprendizagem indutiva pode produzir um modelo cuja
qualidade tal que o mesmo poderia ser usado para predizer o resultado de situaes
futuras. A induo uma forma de inferncia lgica que permite a utilizao de premis-
sas para obter concluses genricas a partir de exemplos particulares. A induo pode
ser caracterizada como uma forma de raciocnio que parte de um conceito especfico e o
generaliza (MALOOF, et al., 2000).
Um sistema de aprendizagem simblica pode construir vrios modelos a partir
dos dados de um ambiente, onde alguns destes modelos so mais simples que outros.
Neste caso, opta-se normalmente pelos mais simples. Tal deciso adere teoria de Oc-
kham (OCKHAM, 1999), segundo a qual a pluralidade no deve ser posta sem necessi-
dade ou se existem inmeras explicaes igualmente vlidas para um fato, ento se deve
escolher a explicao mais simples. Trata-se de uma diretriz lgica reducionista em ci-
ncia. Porm, ela nos ajuda a escolher entre vrias hipteses a serem verificadas, aquela
que contm o menor nmero de afirmaes no demonstradas.
Primeiramente, deve-se observar que a classificao uma das tarefas mais po-
pulares da aprendizagem de mquina e ela visa encontrar uma funo que mapeie um
conjunto de registros em um conjunto de rtulos pr-definidos. Estes rtulos so deno-
minados de classes. Uma vez obtida esta funo, ela pode ser aplicada a novos registros
para prever a classe em que estes se enquadrariam ou que se enquadram (QUINLAN,
1996). Em outras palavras, um mtodo de classificao equivale obteno de regras
baseado em observaes de estados ambientais e transies. Por outro lado, um sistema
de aprendizagem simblica de mquina corresponde automatizao de um processo de
37
m (25)
Entropia(S) = p i log 2 (p i ) bits
j =1
39
| Ta v | (26)
info(T, a) = v dom(a) Entropia (Ta v )
T
Pode-se, desta forma, calcular o ganho para cada atributo da base de dados, es-
colhendo assim o atributo que melhor separa por si s as informaes. O exemplo a se-
guir mostra o ganho calculado em detalhes para o atributo Tempo e tambm os valores
do ganho de informao dos atributos Velocidade, Presso dos Freios e Depresso.
5 3 3 2 2
info(T , tempo) = log 2 log 2
14 5 5 5 5
4 4 2
+ log 2
14 4 4
5 3 3 2 2
+ log 2 log 2
14 5 5 5 5
= 0.694
info (T , velocidade ) = 0 .890
info (T , pressaodos freios ) = 0 .788
info (T , depresso ) = 0 .892
O atributo X que possuir o valor mais alto de ganho(X) ento escolhido como
sendo a raiz da rvore, neste caso o atributo Tempo. O critrio de ganho possui um bias
que favorece atributos com muitos valores possveis, sendo um grande defeito do algo-
ritmo. Quando h diferentes funes que possuem valores em comum para um determi-
nado exemplo, deve haver a seleo de uma funo que se encaixe para ambos os pon-
tos a priori, tal seleo do valor a priori chamada bias. Sem o valor do bias, um a-
prendizado til se torna impossvel (NILSSON, 1996). Tal fato ocorre quando h um
41
atributo como cdigo, que possui valor nico para cada instncia do conjunto de dados,
ocorrendo uma diviso que gera inmeros subconjuntos com apenas um valor possvel
para cada um deles, onde o valor de info(S) igual a zero, portanto, mnimo. A correo
para este problema consiste em ajustar os resultados possveis, sendo que a potencial
diviso da informao computa a subtrao do conjunto de treinamento T e de cada sub-
conjunto n, conforme Equao 28. A diviso da informao resulta em informaes
teis na classificao, eliminando assim atributos que podem por si s classificar amos-
tras (i.e. o cdigo de um paciente, que nico e possu ganho de informao mximo.
Apesar disto, no recomendvel sua utilizao por no tornar genrica a rvore de
deciso).
n
| Ti | |T |
info_div( a i ) = log 2 i (28)
i =1 |T | |T |
ganho(a i ) (29)
ganho_medio(a i ) =
Info_div(ai )
Uma verso simplificada da rvore tambm gerada. Observe que o atributo Ve-
locidade no testado neste caso, sendo apenas necessrio o teste dos atributos Tempo,
Presso de freios e Depresso para classificar um exemplo.
A mesma rvore pode ser vista no formato de regras (cf. Figura 6), sendo que ao
lado da classificao da regra mostrada a preciso da regra em porcentagem. Por e-
xemplo, a Regra 4, pode ser lida da seguinte forma: SE o tempo estiver chovendo e esti-
ver em depresso ENTO tem-se a indicao que no aumentar o ponto de acelerao
com uma taxa de acerto de 50%. Caso nenhuma regra consiga classificar um determina-
do exemplo, o mesmo associado classe padro Aumenta.
Se atribudos valores contnuos a um atributo, conforme Tabela 5, ento o ponto
que melhor separa os exemplos de treinamento ser dado por meio do limiar t. Se, para
um determinado conjunto de exemplos existem N valores distintos para certo atributo A,
ento h N 1 limiares possveis que podem ser utilizados para testar o valor do atribu-
to, sendo que cada limiar possvel possui um determinado subconjunto de exemplos, e o
valor que separa as amostras calculado com base no limiar (QUINLAN, 1996).
Regra 1:
SE Tempo = Ensolarado E Presso dos freios = Alta
ENTO classe No Aumenta [63.0%]
Regra 2:
SE Tempo = chovendo E Depresso = Sim
ENTO classe No Aumenta [50.0%]
Regra 3:
SE Tempo = Nublado
ENTO classe Aumenta [70.7%]
Regra 4:
SE Tempo = Chovendo E Depresso = Sim
ENTO classe No Aumenta [50.0%]
Regra 5:
SE Presso dos freios = normal
ENTO classe Aumenta [66.0%]
Default classe:
Aumenta
Figura 6 - rvore de deciso no formato de regras.
A rvore de deciso da Figura 7 foi gerada pelo C4.5 a partir dos dados da Tabe-
la 5, tomando como base o limiar cujo valor igual a 25 para o atributo presso dos
freios.
43
Regra 1:
SE Presso dos freios > 15 E Presso dos freios <=70
ENTO classe Aumenta [73.1%]
Regra 2:
SE Presso dos freios > 70
ENTO classe No Aumenta [50%]
Classe Default:
No Aumenta
Figura 7 - Classificador 1. C4.5 com atributos contnuos.
O maior ganho de informao foi para o atributo Presso dos Freios, sendo este
o escolhido como raiz da rvore. Caso o valor do atributo Presso dos Freios seja maior
que 15 e menor ou igual a 70 a classe associada Aumenta, O valor do atributo Presso
dos Freios foi calculado em funo do limiar t, visto que se trata de um atributo cont-
nuo. Os valores de t1 e t2 so calculados da seguinte forma: ordenados os valores do
atributo em ordem crescente, o prximo passo consiste em identificar pontos em que a
classe associada ao atributo tem seu valor alterado. So identificados a quantidade de
limiares e somados os valores antes e aps a mudana da classe (10 + 15, 15 + 20 e 70 +
44
70) para serem divididos por 2. Aps a diviso obtm o valor do limiar. So calculados
ento o ganho de informao para o atributo com cada valor do limiar, sendo o melhor
escolhido, conforme mostra a Figura 9.
Deste modo, o algoritmo atribuiu o menor valor mais prximo de 12.5, calcula-
do com base no ganho de informao do atributo presso dos freios.
Em certas situaes o valor de um determinado atributo pode estar faltando, ou
ser um valor desconhecido. Nestes casos, a medida de ganho alterada. O ganho pode
ser medido segundo a Equao 30, onde pA representa a probabilidade do atributo A
possuir o valor conhecido, n(T) o ganho de informao calculado pela funo info(X) e
pnA a probabilidade do atributo A no possuir valor conhecido.
a b classified as
8 1 | a = aumenta
1 4 | b = no aumenta
cador, visto que durante o processo so geradas amostras aleatrias com reposio. Para
o conjunto de testes e aprendizagem L1 a seguinte rvore foi gerada:
TEMPO = Ensolarado
| PRESSO DOS FREIOS = Normal: Aumenta (2.0)
| PRESSO DOS FREIOS = Alta: No_ Aumenta (3.0)
TEMPO = Nublado: Aumenta (4.0)
TEMPO = Chovendo
| DEPRESSO = Sim: No_ Aumenta (2.0)
| DEPRESSO = No: Aumenta (3.0)
Figura 11 - Classificador 2. BAGGING L1 e T1.
A taxa de erro para o Classificador 2 foi de zero por cento, sendo todos os e-
xemplos classificados corretamente pela rvore em questo.
Para o conjunto de testes T2 e conjunto de aprendizagem L2 foi gerada a seguinte
rvore:
PRESSO DOS FREIOS = Normal: Aumenta(8.0)
PRESSO DOS FREIOS = Alta: No_Aumenta(6.0/2.0)
Figura 12 - Classificador 3. BAGGING L2 e T2.
A Figura 12 mostra o Classificador 3 que por sua vez possui uma taxa de classi-
ficao incorreta de 28,57% e uma taxa de classificao correta de 71,43%. Trs exem-
plos rotulados com a classe Aumenta foram classificados como sendo da classe No
Aumenta e um exemplo da classe No Aumenta foi tambm mal classificado, conforme
mostra a matriz de confuso a seguir. Novamente, neste caso, o conjunto de treinamento
e testes foi o mesmo, porm as amostras foram sorteadas com reposio.
erro t = D (i)
i:ht ( xi ) yi
t (31)
1 (32)
h fin ( x) = arg max
yY
t:ht ( x ) = y
log
Bt
Como o valor do erro foi menor que 0.5, ento calculado a importncia do
classificador, dada pela razo: Bt = 10.0142
.142
= 0.165 e a distribuio atualizada. I.e., como
a taxa de erro no foi superior a 0.5, so recalculados os pesos das instncias j da nova
amostra. A normalizao do peso faz com que a soma de todos os pesos seja igual a 1,
onde escolhido aleatoriamente um valor dentro da variao entre 0 a 1. Supondo que
uma determinada instncia tenha como peso 0.5. Esta instncia tem uma probabilidade
maior de ser escolhida na gerao da nova amostragem do que uma instncia com o
peso 0.1.
54
Aps recalcular o peso das instncias, uma nova amostra gerada (Tabela 12) e
para ela um classificador gerado (Figura 15).
TEMPO = Ensolarado
| PRESSO DOS FREIOS = Normal: Aumenta(2.0)
| PRESSO DOS FREIOS = Alta: No_Aumenta(4.0)
TEMPO = Nublado: Aumenta(3.0)
TEMPO = Chovendo
| DEPRESSO = Sim: No_Aumenta(2.0)
| DEPRESSO = No: Aumenta(3.0)
Figura 15 - Classificador 6. BOOSTING L-2 e T-2.
55
svel que instncias pertencentes a uma determinada classe estejam presentes com muita
freqncia em uma amostra gerada pelo processo de validao, o que resultaria em uma
tendncia do algoritmo em ser especfico a tal classe.
Com a aplicao de algoritmo de aprendizagem obtida uma taxa de erro cada
vez que o mesmo executado, independente do algoritmo utilizado. Neste trabalho,
para sugerir determinada ao ao maquinista, como por exemplo, aumentar a velocidade
atual na mudana de ponto de acelerao, o sistema deve ter a certeza do que est
sugerindo. Erros como um aumento na velocidade em lugar proibido pode acarretar
srios problemas, ocasionando perdas financeiras e at de vidas.
12 k (k + 1) (34)
F2 = R j
2
k (k + 1) j 4
58
permitida e cdigos que indicavam a perda de sinal do GPS. Frente estas caractersticas
o C4.5 tende a apresentar resultados bastante satisfatrios, principalmente quando com-
binado com mtodos BAGGING e BOOSTING.
Foi possvel observar que durante experimentos realizados por Breiman (1996) o
mtodo de BAGGING reduziu a taxa de erro do classificador C4.5 quando aplicado em
bases de dados com caractersticas diferentes. Em Lopes (2007) BAGGING obteve re-
sultados satisfatrios quando selecionada uma quantidade pequena de dados.
Tanto o mtodo de BAGGING quanto o mtodo de BOOSTING foram utiliza-
dos por Lopes (2007) para a obteno de conhecimento em bases de dados da rea da
sade, onde a quantidade de atributos era significativamente grande. BOOSTING tam-
bm obteve bons resultados quando filtrados os dados da base original, no havendo
perda na taxa de acerto aps o processo de filtragem ou quando aumentado o nmero de
classificadores gerados.
A validao cruzada complementa o nosso ferramental. Ela particularmente in-
teressante por proporcionar aos classificadores conjuntos de dados com a mesma pro-
poro do conjunto de dados original, eliminando o problema da proporo de exem-
plos. Tal mtodo proporciona uma confiana quanto aos modelos gerados por ser um
mtodo confivel na avaliao de classificadores.
Concluindo, trabalhos j desenvolvidos e citados neste captulo contribuem para
a elaborao deste trabalho, servindo como base para a compreenso da complexidade
da conduo de veculos autnomos. Observamos que os resultados apresentados por
estes trabalhos so relacionados a veculos com caractersticas diferentes do proposto
neste trabalho, considerando, por exemplo, o tamanho, capacidade de transporte, fun-
cionalidade e peso.
No prximo captulo sero descritos os procedimentos que sero realizados du-
rante o trabalho para a obteno das regras de conduo.
61
Captulo 4
Metodologia
O trabalho proposto visa descobrir padres, a partir de dados coletados por meio de
diferentes sensores instalados em um trem de carga, para ajudar no planejamento e exe-
cuo de uma boa poltica de conduo. A consecuo deste objetivo inclui diferentes
tarefas no triviais, a saber: (i) um estudo detalhado sobre os dados coletados a partir de
dados por meio de diferentes sensores instalados em um trem; (ii) a execuo de inme-
ros experimentos visando extrair conhecimentos teis para o processo de conduo; e
(iii) uma anlise criteriosa para validar as regras, a qual ser feita por meio da compara-
o das taxas de acerto dos classificadores, similaridade da conduo e Teste de Fried-
man.
Os conhecimentos descobertos devem ajudar realizar uma boa conduo de um
trem de carga. Relembrando, segundo a ALL (2008), uma boa conduo caracteriza-se
por: (i) economia de combustvel, (ii) minimizao de esforos internos entre veculos e
destes sobre a via, (iii) reduo dos danos ao equipamento e (iv) eliminao de danos
carga. importante salientar que o foco principal neste trabalho gerar regras de con-
duo que auxiliem na rpida deciso de qual ponto de acelerao utilizar, sem perder
de vista os demais princpios de boa conduo.
FONTE II: data e local da viagem: FONTE IV: identificao e nmero de locomotivas
SEQ,DATA,HORARIO,LOCAL,TYPE SEQ, LOCOMOTIVE_CODE
1,18/10/2006,09:38:05,LMG- ,1 1,7678
2,18/10/2006,14:26:00,LAP- ,2 2,7683
3,7686
FONTE III: consumo da viagem: 4,7687
SEQ,TONS,DISTANCE,TKB,TRAIN_CODE,OPERATOR_CODE
1,6278,64.206000,6.190000,M58,910009970
Como dito anteriormente, os dados das viagens so obtidos por meio de sensores
instalados nas locomotivas. Estes sensores, s vezes, fornecem valores inconsistentes,
por exemplo, devido perda de comunicao entre satlite e GPS, responsvel por gerar
os dados de quilmetro e velocidade. Esta perda de comunicao ocorre principalmente
em trechos de tneis, onde o sinal no pode ser enviado devido ao fato do trem no estar
sendo visto pelo satlite.
A remoo de dados ruidosos visa obter um conjunto de dados consistente, de
modo a facilitar a extrao de padres vlidos no processo de aprendizagem. possvel
citar como exemplo de valor claramente inconsistente o deslocamento calculado entre a
posio A e a posio B, quando ele gera um valor muito elevado (e.g., centenas de qui-
lmetros). Outra informao ruidosa presente no conjunto de dados refere-se veloci-
dade, onde certos trechos da viagem apresentavam velocidade de 255 km/h. A remoo
desta informao foi realizada para tornar os clculos de tempo do deslocamento, con-
sumo e velocidade mdia consistentes para todo o conjunto de dados. A remoo de tais
rudos tornou o conjunto de dados consistente e resultou na melhoria da qualidade das
regras de conduo geradas. Antes da remoo, as regras geradas utilizavam os dados
ruidosos, principalmente os da quilometragem, durante a classificao de uma nova
instncia. Apesar de presente nas regras, esta informao no resultava numa boa classi-
ficao da instncia, motivo pelo qual foi removida.
65
C_DESLO_ACUM
deslocamen to
n =1
C_CONS_ACUM
Con sumo
n =1
O elevado nmero de dados de descrio fsica de cada trecho de via frrea (ex:
Figura 18) e a alta dimensionalidade da base de dados fez surgir necessidade do de-
senvolvimento de um software que realizasse todos os clculos anteriormente mencio-
nados e inserisse automaticamente os seus resultados na base de dados. Este mdulo de
software foi um importante componente para expandir a aplicao da metodologia a
outros trechos de vias frreas de forma facilitada. Outros dados importantes na tomada
de deciso do maquinista durante a conduo de trem dizem respeito ao reconhecimento
e antecipao de cristas e depresses. Tais situaes esto diretamente relacionadas ao
perfil da via, comprimento e peso do trem, devido ao esforo trator existente nos enga-
tes ou choques no trem.
A Figura 19 (a) mostra uma situao tpica de crista no ponto C, caracterizado
quando a locomotiva lder ultrapasse o ponto C e em funo do comprimento e do peso
do trem obrigue manter o ponto de acelerao alto. Nesta situao, o esforo no engate
do vago que est no ponto de inflexo a soma do esforo trator das locomotivas mais
o esforo do peso do trem que j passou pela rampa. O valor de h, neste caso, no influ-
encia na identificao de cristas segundo a opinio do especialista em conduo ferrovi-
ria. A situao da Figura 19 (b) pode ser ou no caracterizada como uma crista. Caso o
comprimento do trem seja maior que o trecho i ento existe crista, caso contrrio, o in-
tervalo entre os pontos C e D deve ser considerado como um trecho em nvel. O trecho
em nvel aquele em que as rampas tenham valor entre -1% e 1%, percentuais atribu-
dos empiricamente.
69
trem. Cada ponto identificado ento subdividido em outros trs pontos. A distncia de
cada ponto pode ser de 70m dependendo do tamanho do trem; valor atribudo devido ao
fato de um vago ter em mdia 20m, sendo assim a ponta do prximo/anterior vago
alcanado com 70m a partir do meio do vago atual (cf. Figura 22). A escolha de uma
faixa maior que 70m mostrou-se mais eficaz ao longo dos testes.
Tabela 15 - Valores calculados a partir da segmentao de um trem em onze pontos para a identificao
de cristas e depresses.
C_KM_PONTO Fila que armazena o quilmetro de 11 pontos ao longo do trem
C_CABECEIRA Fila que armazena o status da cabeceira de cada um dos 11 pon-
tos
C_MEIO Fila que armazena o status do meio de cada um dos 11 pontos
C_CAUDA Fila que armazena o status da cauda de cada um dos 11 pontos
C_PERCENT_ENT_INCLINACAO Fila que armazena o percentual de rampa da cabeceira de cada
_INSCRICAO um dos 11 pontos
C_PERCENT_SAI_INCLINACAO_ Fila que armazena o percentual de rampa da cauda de cada um
INSCRICAO dos 11 pontos
C_PERCENT_CURVA_VENCIDA Fila que armazena o percentual de curva de cada um dos 11 pon-
tos j percorrida
C_ONDULACAO Indica se houve ou no uma ondulao. Caso ocorram 3 ou mais
situaes de crista e/ou depresso ao longo dos 11 pontos o valor
sim, caso contrrio no.
C_ RAIO_CURVA Fila que armazena cada raio de curva de cada um dos 11 pontos.
71
3
Este algoritmo uma implementao existente no pacote de software WEKA.
74
Captulo 5
Simulador
Options: -S 10
JRIP rules:
===========
(C_ACAO_MAQUINISTA_PONTO
MAQUINISTA_PONTO = diminuiu) and (C_PERCENTUAL_CURVA_VENCIDA_7 <=
4.087943) and (C_MEIO_3 = subindo) => C_PONTO_ACEL=4.0 (13.0/3.0)
A concepo inicial foi utilizar apenas um classificador e no final avaliar seu de-
sempenho, medindo a quantidade de acertos e erros na escolha do ponto de acelerao.
Porm, ao longo de experimentos notou-se que uma regra era aplicada com mais fre-
82
A patinagem de um trem uma das situaes que deve ser evitada ao longo da
viagem. Quando ela ocorre, ela ocasiona srios danos s rodas das locomotivas e a via
(ALL, 2008). A escolha do ponto de acelerao implica na determinao de um esforo
trator efetivo ee para cada locomotiva do trem. Cada locomotiva possui tambm um
esforo trator aderente ea, que depende do peso e da velocidade do trem. A soma de
todos os esforos tratores efetivos no pode ser maior que a soma dos esforos tratores
aderentes multiplicados pelo nmero de locomotivas nl, caso contrrio ocorre patina-
gem (PIRES, et al., 2005).
Quando ocorre patinagem, o primeiro procedimento tomado reduzir o ponto de
acelerao pa sugerido, o que gera um esforo trator efetivo menor que a soma dos es-
foros aderentes. Em algumas situaes ocorre do ponto de acelerao ser totalmente
reduzido, chegando a zero, resultando na aplicao de um segundo procedimento: redu-
zir a velocidade desejada. Esta reduo pode fazer com que a fora de acelerao seja
positiva, porm a velocidade desejada seja menor que a velocidade atual, ou seja, dese-
84
ja-se reduzir a velocidade sem que haja uma acelerao negativa. Neste caso a ao
desconsiderada, fixando o deslocamento previsto dp em 50m e buscando a velocidade
final vf de acordo com a Equao 36, onde vi a velocidade atual, fa a fora de acelera-
o e pe o peso do trem.
fa dp
vf = vi 2 + (36)
4 pe
Algoritmo cPatinagem()
Entrada: EI, , ; var p, pa, vi, vf, ea, ee, dp, fa, nl;
1. enquanto( ee > ( ea * nl ) )
2. se( pa > 0 )
3. Pa--;
4. p := atualiza(EI, , , p, pa );
5. seno
6. se( fa > 0 e vf < Vi )
fa dp
7. vf = vi 2 +
4 pe
8. se( vf > 0 )
9. vi := vf;
10. vf := vf + 2;
11. p := atualiza( EI, , , p, pa );
12. seno
13. vi := 0; vf := 2;
14. p := atualiza( EI, , , p, pa );
15. fim-se
16. seno
17. vf := vf - 0.5;
18. vi := vi - 0.5;
19. p := atualiza(EI, , , p, pa );
20. fim-se
21. fim-se
22. fim-enquanto
O procedimento para gerir a falta de potncia tem por objetivo aumentar o ponto
de acelerao sugerido pelo classificador a fim de evitar com que o trem pare de se mo-
vimentar ao longo da viagem. Caso o ponto de acelerao sugerido seja menor que oito
(maior ponto de acelerao das locomotivas), ento o ponto incrementado. Esta mu-
dana no ponto de acelerao faz com que ocorra a reverificao de falta de potncia;
caso o ponto de acelerao seja mximo, ento a velocidade final reduzida em 0.5
km/h. De forma anloga, o exemplo modificado passa por uma nova verificao de falta
de potncia. As iteraes param quando uma ao vlida encontrada.
Este procedimento tambm evita que deslocamentos previstos maiores que
500 metros sejam considerados durante a viagem. Durante a fase de experimentos foi
possvel notar que deslocamentos maiores que 500 metros resultavam num tempo de
deslocamento muito alto, fora dos padres das viagens reais, implicando em alto valor
de consumo medida que o mesmo calculado com base no deslocamento e no tempo
necessrio para deslocar o trem. Caso o deslocamento da ao supere o limite, assume-
86
Algoritmo vFaltaPotencia()
Entrada: EI, , ; var p, pa, vi, vf, dp, fa;
1. enquanto( fa <= 0 ou dp > 500 )
2. se( pa < 8 )
3. pa := pa + 1;
4. p := atualiza(EI, , , p, pa );
5. seno
6. vf := vi 0.5;
7. vi := vf 2.0;
8. se( vi < 1.0 ) ento pra fim-se
8. p := atualiza(EI, , , p, pa );
10. fim-se
11. fim-enquanto
Algoritmo vMarchaExcessiva()
Entrada: EI, , , var p, pa, dp, fa;
1. enquanto( pa > 1 E pa <= 8 )
2. pa := pa 1;
3. p := atualiza(EI, , , p, pa );
4. enquanto( fa <= 0 E dp > 500 )
5. pa := pa + 1;
6. p := atualiza(, , , p, pa );
7. fim-enquanto
8. fim-enquanto
uma latitude; e
uma longitude.
Estes pontos foram obtidos a partir plantas das vias frreas. importante salien-
tar que nem todas as informaes constantes em cada ponto de medida foram usadas,
como por exemplo, latitude e longitude.
pt ( nl pl ) (37)
pv =
nv
Onde:
nv o nmero de vages;
nl o nmero de locomotivas;
pt o peso total do trem (em toneladas); e
pl o peso de cada locomotiva (em toneladas).
Operao Descrio
X:=cCamada( c ) Cria uma camada e instanci-a com um classificador c, on-
de c o nome do arquivo que contm um determinado con-
junto de regras.
pt:=pTrem( ) Retorna o peso total de um trem .
nl:=nLocomotivas( ) Retorna o nmero de locomotivas de um trem .
p:=percebe() Realiza a funo de percepo.
v:=converte( p ) Converte uma percepo p em um vetor v de informaes.
pa:=classifica(A, v) Submete v ao classificador A. Este ltimo retorna um ponto
de acelerao.
u:=calcula(v, pa) Realiza os clculos de esforo trator, deslocamento previs-
to, etc.
va:=vAtual( p ) Retorna a velocidade atual contida na percepo p.
vd:=vDesejada( p ) Retorna a prxima velocidade desejada. O valor padro 2
km/h maior que a velocidade atual, exceto para os casos
que so necessrios valores menores para evitar patinagem.
ea:=eAderente( p ) Retorna o esforo trator aderente do trem.
ee:=eEfetivo( p ) Retorna o esforo trator efetivo total do trem.
dp:=dPrevisto( p ) Retorna o deslocamento previsto da ao, em metros; ele
no pode ser superior a 500m.
fa:=fAcelerao( p ) Retorna a fora de acelerao total to trem
atua( EI, direo, dp ) O Atuador executa tal funo, reposicionando o trem na
via. A nova posio dada em funo do quilmetro atual
EI, da direo da movimentao do trem na via e o deslo-
camento previsto dp,
ca:=cAcumulado( p ) Retorna o consumo acumulado de uma viagem a cada nova
percepo p.
da:=dAcumulado( p ) Retorna o deslocamento acumulado de uma viagem a cada
nova percepo p.
ltkb:=cFinal( ca, da, pt ) Retorna o consumo final de uma viagem, em LTKB.
aLOG( v ) Atualiza um arquivo de LOG com o vetor v, incluindo os
dados da ao aplicada. Este arquivo de LOG poder ser
usado em processo de reaprendizagem, o qual no foi exa-
minado no contexto deste trabalho.
Algoritmo ExecutaViagem()
Entrada: A := {regra1,regra2,...,regrax}
B := {regra1,regra2,...,regray}
:= {locomotiva1,...,locomotivam} U {vago1,...,vagon}
:= {pontoMedida1,pontoMedida2,...,pontoMedidak}
E0 := Quilmetro Inicial
EI := Quilmetro Atual
EN := Quilmetro Final
Inicio
R := cCamada( A )
S := cCamada( B )
pt := pTrem( )
nl := nLocomotivas( )
pa := 0
se(EN < E0) ento direo := -1 seno direo := 1 fim-se
EI := E0
enquanto EI EN faa
{PERCEPO}
p := percebe(EI, , )
{CLASSIFICAO}
v := converte( p )
pa := classifica( A, v )
davis := calcula( p, pa )
p := atualiza(EI, , , p, pa)
ltkbC := classifica( B, p )
p := atualiza(EI, , , p, ltkbC)
{CLULOS}
vi := vAtual( p )
vf := vDesejada( p )
ea := eAderente( p )
ee := eEfetivo( p )
dp := dPrevisto( p )
fa := fAcelerao( p )
{GERAO DE LOG}
aLOG( v )
{ATUAO}
atua(EI, direo, dp) {movimenta o trem}
end-enquanto
{RELATRIO}
ca := cAcumulado( p )
da := dAcumulado( p )
cf := cConsumoFinal( ca, da, pt )
fim-algoritmo
93
Captulo 6
Resultados
3268 3133
5994
-1 0 1 2 3 4 5 6 7 8 -1 3 7 8
Ponto de Acelerao Ponto de Acelerao
Tabela 17 Taxas de acerto dos classificadores obtidos por meio do mtodo JRIP.
Tabela 18 - Taxas de acerto dos classificadores obtidos por meio do mtodo JRIP+BAGGING.
Tabela 19 - Taxas de acerto dos classificadores obtidos por meio do mtodo JRIP+BOOSTING.
Para um valor de p-valor < 0.05 possvel concluir que h diferena significati-
va entre as diferentes configuraes, ou seja, rejeitada a hiptese nula, apesar de trs
testes obtiveram resultados inferiores e muito prximos de 0.05 em trs testes. Isto se
verificou, em particular, para os casos onde foi usado o mtodo de validao cruzada.
101
100
90
80
70
60
Velocidade
50
40
30
20
10
0
336 330 327 320 315 310 305 300 295 290 283 276 270
Quilmetro
Velocidade Velocidade Mxima Presso dos Freios
Os motivos das paradas podem ser: (i) a presena de outro trem vindo em senti-
do contrrio, o que obriga o trem a entrar num desvio e parar at que o outro trem passe;
(ii) a falta de licena para percorrer o trecho. Como tais paradas so em nmeros peque-
nos optou-se por gerar classificadores com e sem os dados referentes a tais paradas, no
intuito de analisar se as mesmas representavam rudos significativos na aprendizagem.
(iii) a freqente variao da velocidade do trem. Esta variao observada quando a
velocidade chega muito prxima a velocidade mxima permitida e em seguida retorna a
velocidade mdia do trajeto (conforme trechos entre os quilmetros 323 e 320). O con-
trrio, redues bruscas e retomadas velocidade mdia, observado somente quando o
trem pra. Poucos foram os trajetos onde a velocidade se manteve constante ou muito
prxima da velocidade mdia, a exemplo do que acontece prximo ao quilmetro 315 e
entre aos quilmetros 305 e 300. As velocidades de 255 km/h, presentes no quilmetro
332, foram removidas durante o pr-processamento dos dados. Elas indicam ausncia de
medida exata.
A Figura 33 mostra o nmero de aplicaes de cada ponto de acelerao ao lon-
go de uma determinada viagem. Pode-se observar que h uma grande quantidade de
aplicaes do ponto 7. Tal ponto de acelerao gera a potncia necessria para percorrer
trechos de via com alta e baixa resistncia. Este ponto mais utilizado em situaes de
cruzeiro.
180
160
140
Quantidade
120
100
80
60
40
20
0
-1 0 1 2 3 4 5 6 7 8
Ponto de Acelerao
tomadas de aes sugeridas pelo simulador, por meio de seu classificador. Em outras
palavras, esta abstrao quantificada. E ela representa de certa forma, o grau de imi-
tao que simulador realiza, usando os conhecimentos que lhe foi fornecido na forma
de um classificador, com relao ao maquinista.
A1
A2
A3
160
140
120
Quantidade
100
80
60
40
20
0
-1 0 1 2 3 4 5 6 7 8
Ponto de Acelerao
Viagem 01 Viagem 03 Viagem 06
6.2.1.1 Viagem A
Esta viagem foi realizada aplicando todos os classificadores obtidos pelos mto-
dos JRIP, JRIP+BAGGING e JRIP+BOOSTING, a partir do conjunto de treinamento
CN. O trecho de ferrovia tinha aproximadamente 68 quilmetros de extenso. O trem
era composto por duas locomotivas e trinta e um vages. O consumo final desta viagem
foi de 5,92 LTKB. Este valor prximo do consumo real no valor de 6.17 LTKB. As
duraes de 161 minutos e 176 minutos foram observadas, respectivamente, para a con-
duo realizada pelo simulador e pelo maquinista.
A Figura 38 mostra os resultados da execuo da viagem usando um classifica-
dor gerado pelo JRIP. A velocidade praticada permaneceu na maioria do percurso abai-
xo da velocidade mxima permitida. Em alguns pontos, tal velocidade foi maior que a
mxima, porm no ultrapassou 2 km/h, limite considerado aceitvel e seguro. A resis-
tncia inversamente proporcional a velocidade praticada. Quando a resistncia aumen-
ta, a velocidade tende a cair devido falta de fora do trem para percorrer o trajeto. Tre-
106
chos com resistncia alta indicam aclives e nestas situaes a velocidade tende a ser
reduzida.
Regra I:
(C_PERCENTUAL_RAIO_CURVA_6 >= 600.650024) and
(C_PERCENT_ENT_INCLINACAO_INSCRICAO_6 <= 0.501071) and
(C_PERCENTUAL_RAIO_CURVA_10 <= 499)
=> C_PONTO_ACEL=1 (41.0/4.0)
Regra II:
(C_PERCENTUAL_RAIO_CURVA_2 <= 402.850006) and
(C_PERCENT_ENT_INCLINACAO_INSCRICAO_5 <= 0.125223) and
(C_PERCENTUAL_CURVA_VENCIDA_1 <= 90.359055) and
(C_CABECEIRA_4 = nivel)
=> C_PONTO_ACEL=7 (35.0/6.0)
classificador foi utilizado para a mesma viagem. Este segundo classificador foi gerado
usando o mtodo BOOSTING. A regra padro foi novamente a mais utilizada, porm
em apenas 31% da viagem. Esta taxa foi inferior ao JRIP (63%), JRIP+BAGGING
(36.5%).
Finalmente, executou-se uma abordagem combinatria. Em outras palavras, ca-
da percepo foi submetida a trs classificadores diferentes, obtidos, respectivamente,
pelo JRIP, JRIP+BAGGING e JRIP+BOOSTING, resultando em trs diferentes regras
sugeridas. A regra com maior suporte foi selecionada para ser aplicada. A execuo
desta abordagem visou utilizar o conhecimento abstrado pelos trs classificadores du-
rante uma conduo. Esta abordagem foi nomeada de TODOS.
6.2.1.2 Viagem B
Esta viagem foi realizada aplicando todos os classificadores obtidos pelos mto-
dos JRIP, JRIP+BAGGING e JRIP+BOOSTING, a partir do conjunto de treinamento
SN. A particularidade reside na remoo dos registros relacionados s paradas interme-
dirias do trem. A questo era saber se tais registros interferem na montagem de uma
poltica de conduo. Os grficos (a) e (b) da Figura 40 mostram as velocidades execu-
tas e mximas da viagem antes da remoo e depois da remoo de tais registros. Visu-
almente, a diferena entre os grficos reside na ausncia de velocidades igual a zero, no
grfico (b).
(a) (b)
Figura 40 Exemplo de viagem antes (a) e aps (b) a remoo das paradas.
(C_PERCENT_SAI_INCLINACA
C_PERCENT_SAI_INCLINACAO_INSCRICAO_4 <= -0.0175) and
(C_PERCENT_ENT_INCLINACAO_INSCRICAO_5
C_PERCENT_ENT_INCLINACAO_INSCRICAO_5 <= 0.183347) and
0.183347)
(C_PERCENT_ENT_INCLINACAO_INSCRICAO_0
C_PERCENT_ENT_INCLINACAO_INSCRICAO_0 <= 0.283798) and
0.283798)
(C_PERCENT_ENT_INC
C_PERCENT_ENT_INCLINACAO_INSCRICAO_1 <= 0.811892)
=> C_PONTO_ACEL=1
Figura 42 - Regra utilizada pelo classificador JRIP sem dados de
paradas.
109
uv
cos = cos( u , v ) = (38)
u 2
n v 2
n
Finalmente, executou-se
se uma abordagem combinatria. Em outras palavras, ca-
c
da percepo foi submetida a trs classificadores (obtidos por meio da aplicao respec-
resp
tivamente dos mtodos JRIP, JRIP+BAGGING e JRIP+BOOSTING ao conjunto de
treinamento CN), retornando trs diferentes regras. A regra com maior suporte sele-
sel
cionada para ser aplicada. A conduo usando tal abordagem (Figura 46),
), no mostrou
ser melhor que a obtida por apenas um classificador na predio do ponto de acelerao
a ser empregado. A similaridade foi de 85.6% contra 87.8% do classificador
JRIP+BOOSTING.
112
pelo mtodo JRIP. Comparando tais resultados com os valores da Tabela 22, nota-se
que houve uma queda na similaridade na conduo. A nica linha de ambas as tabelas
que no sofreram alterao foi primeira.
JRIP+BAGGING 1 30 0,804
JRIP+BAGGING 2 30 0,829
JRIP 3 30 0,813
JRIP 5 10 0,831
TODOS 6 10 0,815
JRIP 7 30 0,809
JRIP 8 10 0,840
JRIP+BOOSTING 9 20 0,817
JRIP 1 20 0,825
JRIP+BOOSTING 2 10 0,849
JRIP 3 20 0,841
JRIP+BAGGING 5 20 0,846
JRIP 6 20 0,876
JRIP 7 20 0,863
JRIP 8 20 0,864
JRIP+BAGGING 9 20 0,818
TODOS 1 30 0,811
JRIP+BAGGING 2 10 0,820
JRIP+BOOSTING 3 30 0,825
JRIP+BOOSTING 5 30 0,842
JRIP 6 30 0,843
JRIP+BOOSTING 7 20 0,835
JRIP+BOOSTING 8 30 0,847
JRIP+BOOSTING 9 30 0,817
Captulo 7
Concluses
7.1 Limitaes
Uma das possveis extenses utilizar uma quantidade de dados maior na gera-
o dos classificadores. Tais dados podero ser obtidos a partir de viagens reais ou via-
gens simuladas em laboratrio. A simulao de viagem em laboratrio poderia ser reali-
zada pelo prprio simulador.
Outras extenses podem ser executadas no que se referem s alteraes quanto
forma de escolher o ponto de acelerao. At o presente momento, a nica abordagem
testada foi selecionar as regras com maior suporte. As outras abordagens poderiam es-
colher, por exemplo, o ponto: (i) que resultasse em maior deslocamento, (ii) que resul-
tasse em menor consumo e (iii) o mais votado dentre trs ou mais classificadores.
A utilizao de outros algoritmos de minerao de dados tambm pode ser ex-
plorada como possvel extenso do trabalho no intuito de suprir as deficincias dos al-
goritmos usados. Uma alternativa seria a mudana no mdulo interpretador de regras
para que este operasse com regras geradas pelo software Clementine, disponvel no
laboratrio de pesquisa. Este software gera um conjunto de regras utilizando o algorit-
mo See54, uma verso aprimorada do algoritmo C45. Acredita-se poder, desta forma,
melhorar a taxa de acerto dos classificadores e conseqentemente a taxa de similaridade
de conduo.
4
Maiores informaes em http://www.rulequest.com/
119
Referncias Bibliogrficas
ALL. 2007. ALL Anuncia Resultados de 2007. [Online] 2007. [Citado em: 24 de 04 de
2008.] Disponvel em:
http://www.mzweb.com.br/all/web/arquivos/ALL_Resultados_4T07_port.pdf.
. 2008. Procedimentos na conduo de trens. Curitiba : AMRICA LATINA
LOGSTICA DO BRASIL S.A., 2008.
ANTT, AGNCIA NACIONAL DE TRANSPORTES TERRESTRES. 2008.
Relatrio Anual de Acompanhamento das Concesses Ferrovirias. [Online] 2008.
[Citado em: 24 de 04 de 2008.]
http://www.antt.gov.br/relatorios/ferroviario/concessionarias2006/index.asp.
AVALLONE, E. A. e BAUMEISTER, T. 1996. Marks' Standard Handbook for
Mechanical Engineers. s.l. : McGraw-Hill Professional, 1996. p. 1792.
BAUER, ERIC e KOHAVI, RON. 1999. An Empirical Comparison of Voting
Classification Algorithms: Bagging, Boosting, and Variants. Machine Learning,
36(1/2). 1999, pp. 105-139.
BENENSON, R., et al. 2008. Towards urban driverless vehicles. International Journal
of Vehicle Autonomous Systems. 2008, Vol. 6, pp. 4-23.
BERTOLAZZI, E., et al. 2008. Development of a reduced size unmanned car.
Advanced Motion Control AMC 10th IEEE International Workshop on AMC. 2008,
Vols. 26-28, pp. 763-770.
BRAGA, A.C. 2000. Curvas ROC: Aspectos Funcionais e Aplicaes. s.l. :
Universidade do Minho, 2000. Tese (Doutorado em Engenharia de Produo e
Sistemas).
BREIMAN, L. 1996. Bagging predictors. Machine learning, 24(2). 1996, pp. 123-140.
BREIMAN, L., et al. 1984. Classification and Regression Trees. 1 Edio. s.l. :
Chapman & Hall/CRC, 1984. p. 368. 0412048418.
BRINA, HELVCIO LAPERTOSA. 1982. Estradas de ferro. Rio de Janeiro : LTC,
1982. Vol. 2.
CALLEGARI, J. e SIDIA, M. 2003. Bioestatstica: Princpios e Aplicaes. Porto
Alegre : Artmed, 2003.
CHEN, L., WRIGHT, P. e NEJDL, W. 2009. Improving music genre classification
using collaborative tagging data. Proceedings of the Second ACM International
Conference on Web Search and Data Mining. 2009, pp. 84-93.
CIOS, K. J., et al. 2007. Data Mining: A Knowledge Discovery Approach. s.l. :
Springer, 2007. p. 606. ISBN: 978-0-387-33333-5.
COHEN, W. W. 1995. Fast Effective Rule Induction. Twelfth International Conference
on Machine Learning. 1995, 12, pp. 115-123.
DEMSAR, J. 2006. Statistical Comparisons of Classifiers over Multiple Data Sets.
Journal of Machine Learning Research. 7, 2006, 7, pp. 1-30.
120
INMON, W. H. 2002. Building the Data Warehouse. 3 ed. Toronto : Willey Computer
Publishing, 2002.
ISAAC, ANDREW e SAMMUT, CLAUDE. 2003. Goal-directed Learning to Fly.
Proceedings of the 20th International Conference on Machine Learning. 2003, pp. 258-
265.
KALOS, A. e REY, T. 2005. Data mining in the chemical industry. Proceedings of the
eleventh ACM SIGKDD international conference on Knowledge discovery in data
mining. 2005, pp. 763-769.
KOHAVI, R. e JOHN, G. 1996. Wrappers for Feature Subset Selection. AIK special
issue on relevance. 1996.
KOLLER, D. e SAHAMI, M. 1996. Toward optimal feature selection. Proc. of the
13th Int. Conf. on Machine Learning. 1996, pp. 284-292.
KOLSKI, S., et al. 2006. Autonomous driving in structured and unstructured
environments. IEEE Intelligent Vehicles Symposium. 2006, pp. 558-563.
LEE, H. D., MONARD, M. C. e BARANAUSKAS, J. A. 1999. Empirical
comparison of wrapper and filter approaches for feature subset selection. So Carlos :
ICMC-USP, 1999. Disponvel em:
ftp://ftp.icmc.usp.br/pub/BIBLIOTECA/rel_tec/RT_094.pdf.
LIU, HUAN e YU, LEI. 2005. Toward Integration Feature Selection Algorithms for
Classification and Clustering. IEEE Transactions on Knowledge and Data Engineering.
2005, pp. 491-502.
LOPES, LUCELENE. 2007. Aprendizagem de mquina baseada na combinao de
classificadores em bases de dados da rea de sade. Curitiba : s.n., 2007. Dissertao
Mestrado Tecnologia em Sade Pontifcia Universidade Catlica do Paran
Centro de Cincias Biolgicas e da Sade.
MACHADO, FERNANDO e ABREU, MAURICIO. 2004. Projeto de Banco de
Dados: Uma viso prtica. 11 ed. So Paulo : rica, 2004.
MALLOF, A. MARCUS e MICHALSKI, S. RYSZARD. 2000. Selecting Examples
for Partial Memory Learning. Machine Learning Journal. 2000, Vol. 41, pp. 27-52.
MALOOF, MARCUS A. e MICHALSKI, RYSZARD S. 2000. Selecting Examples
for Partial Memory Learning. s.l. : Machine Learning Journal, 2000. pp. 27-52. Vol. 41,
citeseer.ist.psu.edu/maloof00selecting.html.
MITCHELL, T. 1997. Machine Learning. New York : McGraw-Hill, 1997.
MRS, MRS LOGSTICA. 2007. Relatrio da Administrao. [Online] 2007. [Citado
em: 24 de 04 de 2008.] http://www.mrs.com.br/download/Relatorio_Anual_2007.pdf.
NIEVOLA, J. C. 2008. Classificao. [Online] 2008. [Citado em: 09 de 01 de 2008.]
http://www.ppgia.pucpr.br/~nievola/Treinamento/MD/MD-04-Classificacao.pdf.
NILSSON, N.J. 1996. Introduction to machine learning. Stanford : Stanford university,
1996.
OCKHAM, W. 1999. Prlogo da Exposio dos Oitos Livros da Fsica. So Paulo :
Nova Cultural, 1999.
122