Você está na página 1de 213

RODRIGO SUZUKI OKADA

TECNOLOGIA ADAPTATIVA APLICADA A


SISTEMAS HBRIDOS DE APOIO DECISO
Dissertao apresentada Escola Po-
litcnica da Universidade de So Paulo
para obteno do Ttulo de Mestre em
Engenharia Eltrica.
So Paulo
2013
RODRIGO SUZUKI OKADA
TECNOLOGIA ADAPTATIVA APLICADA A
SISTEMAS HBRIDOS DE APOIO DECISO
Dissertao apresentada Escola Po-
litcnica da Universidade de So Paulo
para obteno do Ttulo de Mestre em
Engenharia Eltrica.
rea de Concentrao:
Sistemas Digitais
Orientador:
Prof. Dr. Joo Jos Neto
So Paulo
2013
Este exemplar foi revisado e alterado em relao verso original, sob
responsabilidade nica do autor e com a anuncia de seu orientador.
So Paulo, 1 de abril de 2013.
Assinatura do autor
Assinatura do orientador
FICHA CATALOGRFICA
Okada, Rodrigo Suzuki
Tecnologia adaptativa aplicada a sistemas hbridos de apoio
deciso/ R. S. Okada. ed. rev. So Paulo, 2013.
210 p.
Dissertao (Mestrado) Escola Politcnica da Universidade
de So Paulo. Departamento de Engenharia de Computao e Sis-
temas Digitais.
1. Tcnicas adaptativas 2. Aprendizado computacional 3. To-
mada de deciso I. Universidade de So Paulo. Escola Politcnica.
Departamento de Engenharia de Computao e Sistemas Digitais
II. t.
Aos meus pais.
Seres trabalhadores, zelosos e sbios.
Honestos, amigos, e educadores.
Pessoas que admiro.
AGRADECIMENTOS
Aos meus pais, pelo apoio, dedicao e amor incondicional, responsveis
diretos pela minha formao, seja ela acadmica ou como pessoa.
Ao professor Wilson V. Ruggiero, por conceder-me minha primeira oportu-
nidade de pesquisa, pelos seus conselhos, ideias inovadoras e criticas cons-
trutivas.
Ao orientador Joo Jos Neto, no s pela sua orientao ao longo desta
pesquisa, pelos seus conselhos e sugestes, mas tambm pelo constante
estmulo e ateno, primordiais para execuo deste trabalho.
Ao corpo docente e funcionrio da Escola Politcnica da Universidade de
So Paulo, que, de forma direta ou indireta, colaboraram com a realizao
desta pesquisa.
RESUMO
Este trabalho apresenta a formulao de umsistema hbrido de apoio de-
ciso que, atravs de tcnicas adaptativas, permite que mltiplos dispositivos
sejam utilizados de forma colaborativa para encontrar uma soluo para um
problema de tomada de deciso. proposta uma estratgia particular para o
trabalho colaborativo que restringe o acesso aos dispositivos mais lentos com
base na diculdade encontrada pelos dispositivos mais rpidos para solucio-
nar um problema especco. As solues encontradas por cada dispositivo
so propagadas aos demais, permitindo que cada um deles agregue estas
novas solues com o auxlio de tcnicas adaptativas. feito um estudo so-
bre aprendizagem de mquina mediante incertezas para vericar e minimizar
os impactos negativos que uma nova soluo, possivelmente errnea, possa
ter. O sistema hbrido proposto apresentado numa aplicao particular, uti-
lizando testes padronizados para compar-lo com os dispositivos individuais
que o compem e com sistemas hbridos de mesma nalidade. Atravs des-
tes testes, mostrado que dispositivos consolidados, mesmo que de nature-
zas distintas, podem ser utilizados de maneira colaborativa, permitindo no s
calibrar um compromisso entre o tempo de resposta e a taxa de acerto, mas
tambm evoluir de acordo com o histrico de problemas processados.
Palavras Chave: Adaptatividade. Tabela de deciso adaptativa. Tomada
de deciso. Mtodos multicritrio. Raciocnio baseado em casos. Sistemas h-
bridos. Aprendizagem de mquina. Classicador da Bayes. k-Nearest Neigh-
bor. Compromisso entre tempo de resposta e taxa de acerto.
ABSTRACT
This work presents a formulation of a hybrid decision-making system that
employs adaptive techniques as a way to coordinate multiple devices in order
to make a collaborative decision. The strategy proposed here is to restrict the
use of slower devices, based on how difcult the specic problem is - easier
problems may be solved on faster devices. Each device is able to learn th-
rough solutions given by the others, aggregating new knowledge with the aid
of adaptive techniques. In order to evaluate and minimize the negative impact
those new solutions may have, a study concerning machine learning under un-
certainty is carried out. A particular application of this system has been tested
and compared, not only to each individual device that is part of the system
itself, but to similar hybrid systems as well. It is shown that even devices of
distinct natures may be reused in a collaborative manner, making it possible
to calibrate the trade-off between hit rate and response time, and to evolve
according to the input stimuli received as well.
Keywords: Adaptivity. Adaptive decision table. Decision-making. Multi-
criteria methods. Case-Based Reasoning. Hybrid systems. Machine learning.
Naive Bayes. k-Nearest Neighbor. Speed-Accuracy Trade-off.
SUMRIO
Lista de Ilustraes
Lista de Tabelas
Lista de Abreviaturas e Siglas
Lista de Smbolos
1 Introduo 19
1.1 Justicativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3 Organizao da Dissertao . . . . . . . . . . . . . . . . . . . . 28
2 Reviso Bibliogrca 30
2.1 Tcnicas Adaptativas . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.1 Viso Geral . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.2 Tabela de Deciso . . . . . . . . . . . . . . . . . . . . . . 39
2.1.3 Tabela de Deciso Adaptativa . . . . . . . . . . . . . . . . 42
2.1.3.1 Denio . . . . . . . . . . . . . . . . . . . . . . 42
2.1.3.2 Exemplo Ilustrativo . . . . . . . . . . . . . . . . 45
2.1.4 Tabela de Deciso Adaptativa Estendida . . . . . . . . . 49
2.1.5 Estado Atual . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.2 Tomada de Deciso . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.1 Descrio . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.2 Aspectos Psicolgicos da Tomada de Deciso . . . . . . 59
2.2.3 Nvel de Conana . . . . . . . . . . . . . . . . . . . . . . 62
2.3 Raciocnio Baseado em Casos . . . . . . . . . . . . . . . . . . . 65
2.4 Aprendizagem de Mquina . . . . . . . . . . . . . . . . . . . . . 68
2.4.1 Aprendizado Online . . . . . . . . . . . . . . . . . . . . . 70
2.4.2 Lazy Learning e Eager Learning . . . . . . . . . . . . . . 72
2.4.3 Consideraes . . . . . . . . . . . . . . . . . . . . . . . . 74
2.5 Mtodos de Tomada de Deciso . . . . . . . . . . . . . . . . . . 75
2.5.1 k-Nearest Neighbor . . . . . . . . . . . . . . . . . . . . . 75
2.5.1.1 Denio . . . . . . . . . . . . . . . . . . . . . . 76
2.5.1.2 Custo Computacional . . . . . . . . . . . . . . . 79
2.5.1.3 Consideraes . . . . . . . . . . . . . . . . . . . 80
2.5.2 Classicador de Bayes . . . . . . . . . . . . . . . . . . . 82
2.5.2.1 Denio . . . . . . . . . . . . . . . . . . . . . . 83
2.5.2.2 Extenses . . . . . . . . . . . . . . . . . . . . . 85
2.5.2.3 Comparao com Outros Algoritmos . . . . . . 86
3 Proposta 88
3.1 Viso Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.2 Dispositivo Adaptativo Hierrquico . . . . . . . . . . . . . . . . . 94
3.2.1 Generalizao da TDAE . . . . . . . . . . . . . . . . . . . 94
3.2.2 Critrio de Aceitao . . . . . . . . . . . . . . . . . . . . . 100
3.2.3 Algoritmo de Tomada de Deciso . . . . . . . . . . . . . . 101
3.3 Gerenciamento de Conhecimento . . . . . . . . . . . . . . . . . 106
3.3.1 Realimentao . . . . . . . . . . . . . . . . . . . . . . . . 106
3.3.2 Clculo do Valor-Verdade e do Intervalo de Conana . . 108
3.3.3 Base de Conhecimento . . . . . . . . . . . . . . . . . . . 112
3.4 Aprendizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.4.1 Aprendizado Incremental . . . . . . . . . . . . . . . . . . 114
3.4.2 Treinamento . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.5 Exemplos de Dispositivos Adaptativos . . . . . . . . . . . . . . . 117
3.5.1 TDAE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.5.2 Classicador de Bayes . . . . . . . . . . . . . . . . . . . 119
3.5.3 k-Nearest Neighbor . . . . . . . . . . . . . . . . . . . . . 123
4 Resultados 126
4.1 Sistema Experimental . . . . . . . . . . . . . . . . . . . . . . . . 126
4.2 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.3 Anlises Preliminares . . . . . . . . . . . . . . . . . . . . . . . . 130
4.3.1 Comparativo de Desempenho entre o Classicador de
Bayes e o k-NN . . . . . . . . . . . . . . . . . . . . . . . 130
4.3.2 Efeitos da Discretizao . . . . . . . . . . . . . . . . . . . 135
4.3.3 Taxa de Acerto da TDAE . . . . . . . . . . . . . . . . . . 138
4.4 Compromisso entre Taxa de Acerto e Tempo de Resposta . . . . 142
4.4.1 Sistema Experimental . . . . . . . . . . . . . . . . . . . . 143
4.4.2 Sistema Experimental com 100 Intervalos Discretos . . . 152
4.4.3 Sistema Experimental com TDAE . . . . . . . . . . . . . 158
4.5 Comparao com um Sistema com Distribuio de Carga No
Informada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
4.6 Aprendizado Incremental . . . . . . . . . . . . . . . . . . . . . . 172
4.6.1 Vis de Repetio . . . . . . . . . . . . . . . . . . . . . . 173
4.6.2 Realimentaes Externas . . . . . . . . . . . . . . . . . . 178
5 Concluso 185
5.1 Contribuies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
5.2 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
Referncias 191
Apndice A -- Percentil da Distribuio Normal 200
Apndice B -- Teste de Hiptese Sobre a Mdia de uma Amostra 204
LISTA DE ILUSTRAES
1 Evoluo dos sistemas de apoio deciso, conforme sugerido
por Arnott (ARNOTT; PERVAN, 2005). Itens em pontilhado deno-
tam ramos no previstos no diagrama original de Arnott, en-
quanto a regio em destaque (cinza) denota as tcnicas utiliza-
das por este trabalho e o sistema resultante. . . . . . . . . . . . 21
2 Diagrama conceitual de um dispositivo adaptativo de tomada de
deciso (TCHEMRA, 2009). . . . . . . . . . . . . . . . . . . . . . . 24
3 Curva SAT que relaciona o compromisso entre velocidade e
taxa de acertos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4 Estrutura tpica de um dispositivo adaptativo, formado por um
dispositivo subjacente, envolto por uma camada adaptativa. . . . 33
5 Exemplo de um autmato adaptativo e sua tabela de deciso
correspondente. . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
6 Evoluo de autmato da Figura 5 aps consumir a subcadeia
0. Em destaque, a regra r1 recm-excluda e as trs novas regras. 50
7 Diagrama conceitual de uma TDAE, ilustrando o uso das fun-
es auxiliares e o mtodo multicritrio auxiliar . . . . . . . . . . 51
8 Exemplicao da diferena entre a discretizao via Equal
Width Discretization e clusterizao, com 5 categorias. . . . . . 58
9 Ciclo de vida 4R (Retrieve, Reuse, Revise e Retain) do CBR. . . 67
10 Relao entre aprendizado supervisionado e a tomada de deci-
so. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
11 Exemplo de classicao k-NN, onde o objeto central (pent-
gono) o objeto a ser classicado. . . . . . . . . . . . . . . . . . 77
12 Representao grca de uma R*-Tree. A aplicao do k-NN
pode ser feita visitando apenas parte dos pontos conhecidos -
representados espacialmente por um vetor x. . . . . . . . . . . . 81
13 Comparao entre o k-NN clssico (linha contnua) e o k-NN
baseado em densidade (linha tracejada). . . . . . . . . . . . . . 83
14 Fluxo do sistema de tomada de deciso proposto - baseado nas
etapas 4R do raciocnio baseado em casos. . . . . . . . . . . . . 89
15 Viso geral do sistema de tomada de deciso proposto. O itens
destacados em negrito so o foco deste trabalho. . . . . . . . . . 90
16 Princpio de funcionamento dos dispositivos em hierarquia. . . . 95
17 Funes auxiliares dos dispositivos adaptativos hierrquicos. . . 99
18 Composio de um dispositivo adaptativo hierrquico. . . . . . . 100
19 Fluxo resumido do processo hierrquico de tomada de deciso. 105
20 Grco comparativo da estimativa da mdia convencional (linha
contnua) com a mdia de Agresti-Coull (linha marcada com )
de uma amostra que segue uma distribuio de Bernoulli com
p = 80% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
21 Um possvel modelo para a base de conhecimento utilizando
uma R*-Tree. Cada folha possui a representao x de um vetor
e os contadores V e W de cada alternativa. . . . . . . . . . . . . 113
22 Mdia da taxa de acerto de cada dispositivo nos datasets utili-
zados para testes. . . . . . . . . . . . . . . . . . . . . . . . . . . 134
23 Mdia da taxa de acerto do classicador de Bayes de acordo
com a discretizao utilizada. . . . . . . . . . . . . . . . . . . . . 137
24 Exemplo bidimensional de discretizao, com duas alternativas:
crculo e tringulo. Para 3 intervalos discretos, a instncia mar-
cada com estrela pode ser facilmente classicada, enquanto
para 6 intervalos, impossvel solucion-la, pois no h ne-
nhuma instncia em nenhum dos dois eixos. Outros espaos
vazios esto pintados de preto. . . . . . . . . . . . . . . . . . . . 138
25 Mdia da taxa de acerto do k-NN de acordo com a discretizao
utilizada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
26 Razo entre o tempo de resposta dos dispositivos com 100 in-
tervalos e o tempo do mesmo dispositivo, mas com 10 intervalos. 140
27 esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema experimental em fun-
o do limiar. direita, a curva de desempenho (taxa de acerto
em funo do tempo de resposta). . . . . . . . . . . . . . . . . . 145
28 esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema (discretizado em 100
intervalos) em funo do limiar. direita, a curva de desempe-
nho do sistema com EWD com 10 intervalos (linha contnua) e
100 intervalos (linha tracejada). . . . . . . . . . . . . . . . . . . . 153
29 Clculo da taxa de acerto crtica a partir dos parmetros de
desempenho dos classicador de Bayes e do mtodo k-NN. . . . 160
30 Comparativo entre as taxas de acerto apresentada pela TDAE
em cada dataset e seus respectivos valores crticos. . . . . . . . 161
31 esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema com TDAE em funo
do limiar. direita, a curva de desempenho do sistema experi-
mental original (linha contnua) e com o TDAE (linha tracejada). 162
32 Comparao de desempenho do sistema experimental (linha
contnua) com o sistema de escolha aleatria (linha tracejada). . 170
33 Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme os dispositivos recebem realimentaes
originadas no vis de repetio. . . . . . . . . . . . . . . . . . . . 176
34 Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme o sistema aprende com as realimenta-
es recebidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
35 Curva da funo densidade de probabilidade da distribuio
normal padro. Para p = 0, 975, o valor do percentil corres-
pondente z
p
1, 96, i.e., 97, 5% das observaes cam abaixo
de 1, 96. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
36 Curva da inversa da funo distribuio acumulada da distribui-
o normal padro. . . . . . . . . . . . . . . . . . . . . . . . . . . 202
37 Curva da funo densidade de probabilidade da distribuio
normal padro. Para = 5%, tem-se um percentil z
1/2
1, 96,
i.e., 95% da rea est no intervalo [1, 96, +1, 96]. . . . . . . . . 203
38 Funo densidade de probabilidade da distribuio t de Stu-
dent, de acordo com os graus de liberdade. No limite df ,
aproxima-se da distribuio normal padro. . . . . . . . . . . . . 206
39 Regio crtica de uma distribuio t de Student utilizando ape-
nas a cauda direita, com 9 graus de liberdade, com = 5% e
= 1%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
LISTA DE TABELAS
1 Estrutura tpica de uma tabela de deciso. . . . . . . . . . . . . . 40
2 Exemplo de tabela de deciso. . . . . . . . . . . . . . . . . . . . 40
3 Exemplo de tabela de deciso com entradas estendidas. . . . . 41
4 Estrutura tpica de uma tabela de deciso adaptativa (TDA), que
dene as funes adaptativas em novas colunas, e sendo cha-
madas atravs de um novo quadrante. . . . . . . . . . . . . . . . 43
5 Estrutura tpica de uma tabela de deciso adaptativa estendida
(TDAE), que dene novas linhas para funes auxiliares. . . . . 52
6 Descrio do dilema dos prisioneiros. . . . . . . . . . . . . . . . 60
7 Descrio dos datasets testados. . . . . . . . . . . . . . . . . . . 132
8 Mdias da taxa de acerto e tempo de resposta de cada disposi-
tivo nos datasets testados. . . . . . . . . . . . . . . . . . . . . . 133
9 Resultados do teste de hiptese da diferena entre as taxas de
acerto do classicador Bayes e do k-NN ser maior que zero. . . 135
10 Resultados do teste de hiptese da diferena entre as taxas de
acerto do classicador Bayes e do k-NN ser menor que zero. . . 135
11 Exemplo de tabela de deciso com valores discretos. Entre pa-
rnteses, o intervalo real que cada valor discreto representa. . . 140
12 Taxa de acerto e tempo de resposta da TDAE nos datasets uti-
lizados para testes, sem a ajuda de um mtodo auxiliar. . . . . . 141
13 Hipteses para anlise da mdia de uma mostra com relao a
uma referncia M. . . . . . . . . . . . . . . . . . . . . . . . . . . 205
LISTA DE ABREVIATURAS E SIGLAS
AHP Analytic Hierarchy Process
ATDA Ambiente de Tomada de Deciso Adaptativa
CBR Case-Based Reasoning
DSS Decision Support System
ILE Interactive Learning Environment
k-NN k-Nearest Neighbor
SAT Speed-Accuracy Trade-off
TDA Tabela de Deciso Adaptativa
TDAE Tabela de Deciso Adaptativa Estendida
LISTA DE SMBOLOS
a Uma possvel alternativa a ser utilizada como soluo de um
problema
c
1/2
Intervalo de conana do valor-verdade v, com
(100 (1 /2)) % de certeza
cr Credibilidade de uma fonte de realimentaes
cr
0
Credibilidade inicial das informaes recebidas via treinamento
d (a, b) Funo de distncia (e.g., Euclidiana) entre instncias a e b
d
j
(a, b) Funo de distncia entre os valores das instncias a e b no
j-simo critrio
I (a) Funo indicadora - retorna 1 se a for verdadeiro, seno, re-
torna 0
m Nmero de critrios utilizados pelo tomador de deciso
p Nmero de alternativas utilizadas pelo tomador de deciso
P (a[b
1
, b
2
, . . .) Probabilidade de a ser verdade quando b
1
, b
2
, . . . tambm so
verdadeiros
v Valor-verdade quando calculado via mdia aritmtica da verda-
des das realimentaes
v Valor-verdade quando calculado via mdia aritmtica desviada
de Agresti-Coull
V Contador de realimentaes positivas recebidas para um caso
particular
w(a, b) No k-NN, representa a funo de ponderao pela distncia
entre a e b
W Contador de todas as realimentaes recebidas para um caso
particular
x Vetor de caractersticas de m dimenses
x
[i]
Valor do vetor x associado ao i-simo critrio
y (x) Funo que calcula o vetor (cada dispositivo implementa esta
funo a sua maneira)
z
1/2
(100 (1 /2))-simo percentil de uma distribuio normal

+
Valor de reforo relativo de realimentaes positivas

Valor de reforo relativo de realimentaes negativas


(a, b) Mtrica de overlap - se a = b, retorna 0, seno, retorna 1
Vetor que informa a expectativa de certeza de cada uma das p
alternativas para uma instncia x

1
(p) Funo quantil de uma distribuio qualquer
19
1 INTRODUO
Sistema de apoio deciso (DSS - Decision Support System) um arte-
fato computacional utilizado para apoiar um tomador de deciso em sua tarefa
de encontrar solues para os problemas de sua rea de atuao (SOL; TAK-
KENBERG; ROBB, 1985), sendo originalmente proposto de forma terica para
solucionar problemas organizacionais (KEEN, 1978). Sua principal funo a
de coletar informaes teis a partir de uma massa de dados pura, e inferir
quais decises aparentam ser as mais vantajosas com base neste conheci-
mento, disponibilizando-as de forma compreensvel ao tomador de deciso.
Apesar de no haver consenso sobre um modelo nico e denitivo, sistemas
de apoio deciso so comumente compostos por uma base de conheci-
mento, um modelo de tomada de deciso e uma interface de usurio (SPRA-
GUE; CARLSON, 1982).
O conceito de sistema de apoio deciso, contudo, no completamente
homogneo. Desde sua introduo no nal da dcada de 1960, seu signi-
cado associado tem sido alterado de acordo com os novos avanos em mlti-
plos ramos de pesquisa (ARNOTT; PERVAN, 2005), permitindo uma maior ade-
rncia dos sistemas a diferentes nalidades. Sistemas de apoio a negcios
e sistemas de informao executiva so exemplos de derivados do sistema
original, cada um utilizando teorias oriundas de diferentes especialidades, tais
como estudos sociais e gerenciamento de banco de dados.
20
A partir dos avanos obtidos na rea de aprendizagem de mquina,
espera-se que um prximo passo do desenvolvimento dos sistemas de to-
mada de deciso seja um sistema evolutivo, capaz de assimilar novas infor-
maes de forma incremental, eliminando a necessidade de ser reconstrudo
toda vez que for preciso atualizar sua base de conhecimento (ARNOTT, 2004).
O processo de aprendizado deste tipo de sistema deve funcionar de forma
autnoma, livre de interferncia do usurio, dependendo unicamente dos es-
tmulos que recebe, provenientes do ambiente em que se encontra.
A Figura 1 apresenta uma linha do tempo com a evoluo dos sistemas
de apoio deciso, bem como os ramos de pesquisas utilizados para sua fun-
damentao, conforme sugerido em (ARNOTT; PERVAN, 2005). De acordo com
esta linha do tempo, os primeiros sistemas de apoio deciso surgiram no
incio da dcada de 1970, tendo sido utilizados como ferramentas de auxlio
para tomadas de decises organizacionais de forma individual pelos diversos
tomadores de deciso - note que este conceito est de acordo com as deni-
es previamente citadas.
Este sistema foi utilizado como base fundamental para que outros siste-
mas, mais especializados, pudessem ser formalizados. Por exemplo, o ad-
vento de tcnicas de minerao de dados permitiu especializar o sistema ori-
ginal para analisar o relacionamento entre informaes armazenadas em uma
base de dados - processo conhecido por data warehousing.
De forma semelhante, trabalhos relacionados inteligncia articial per-
mitiram a incluso de agentes inteligentes nos sistemas de apoio deciso,
aumentando seu potencial para solucionar problemas mais complexos, que
dicilmente seriam solucionados atravs de tcnicas clssicas. Pesquisas re-
lacionadas ao gerenciamento de conhecimento, enm, permitiram que o co-
nhecimento especco de um ramo de atividade - e.g., medicina e nanas -
21
Sistema de Apoio
Deciso Pessoal
Sistema Inteligente
de Apoio Deciso
Sistema Baseado
em Conhecimento
Data Warehousing
Sistema de Informao
Executiva
Sistema de Apoio
Deciso em Grupo
Sistema de Apoio a
Negcios
Sistemas Computacionais de
Informao
Sistemas Transacionais e de
Relatrios
Estudos no Ramo Gerencial
Modelos de Simulao
Teoria Comportamental
de Deciso
Inteligncia Articial
Sistemas
Especialistas
Teoria de
Banco de Dados
OLAP
Gerenciamento
de Conhecimento
Modelamento
de Dimenses
Estudos Sociais
Comportamento
em Grupo
Teoria de
Negcios
1970
1980
1990
2000
2010
Tcnicas Adaptativas
Sistema Evolutivo
de Apoio Deciso
TDAE
Aprendizagem
de Mquina
Aprendizado
Online
Figura 1: Evoluo dos sistemas de apoio deciso, conforme sugerido por
Arnott (ARNOTT; PERVAN, 2005). Itens em pontilhado denotam ramos no pre-
vistos no diagrama original de Arnott, enquanto a regio em destaque (cinza)
denota as tcnicas utilizadas por este trabalho e o sistema resultante.
pudesse ser transferido para um sistema de apoio deciso, especializando-o
para uma tarefa especca.
O sistema evolutivo proposto neste trabalho, ento, uma extenso dos
sistemas de apoio deciso baseados em conhecimento, incorporando tcni-
cas adaptativas para que, durante sua execuo, novas informaes possam
ser agregadas ao conhecimento j acumulado at ento. Para esta nalidade,
foram utilizadas as seguintes tcnicas:
22
Aprendizagem de Mquina um ramo da inteligncia articial que es-
tuda a aquisio de conhecimento feita por sistemas computacionais.
Uma reviso bibliogrca deste conceito feita na seo 2.4.
Aprendizado Online um paradigma de aprendizagem que estuda a
aquisio de conhecimento de forma incremental, ao contrrio das tc-
nicas clssicas, que utilizam um batch. Uma breve introduo a este
assunto feita na seo 2.4.1.
Adaptatividade o termo usado para caracterizar sistemas capazes
de tomar a deciso de se auto-modicar, em resposta a um estmulo
externo. Sistemas desta natureza permitem que o sistema evolua de
acordo com o ambiente em que se encontram. Uma reviso deste con-
ceito est apresentada na seo 2.1.
TDAE a abreviao da Tabela de Deciso Adaptativa Estendida, que
designa um sistema hbrido de tomada de deciso via adaptatividade -
processo explorado neste estudo. Sua viso geral pode ser encontrada
na seo 2.1.4.
Este trabalho representa um esforo inicial no desenvolvimento de um sis-
tema desse tipo, generalizando a tcnica hbrida proposta pela TDAE para
outros dispositivos adaptativos, e utilizando teorias de aprendizagem para
controlar e direcionar a adaptatividade, para que as mudanas sejam cons-
trutivas. Tal tipo de sistema possibilita obter ganhos na taxa de acertos ao
longo do tempo, ou ento, evitar que a mesma se deteriore para problemas de
natureza dinmica, em que as informaes so passveis de obsolescncia.
23
1.1 Justicativa
Desde sua publicao por Neto em 2001 (NETO, 2001), dispositivos adap-
tativos tm sido alvo de estudo em variados campos de pesquisa alm da
construo de compiladores - rea que impulsionou o desenvolvimento inicial
da adaptatividade. reas como processamento de linguagens naturais se be-
neciam do uso deste tipo de tcnica explorando a capacidade de expresso
das mesmas (MENEZES; NETO, 2002). De maneira mais prtica, tcnicas adap-
tativas esto sendo empregadas para solucionar problemas de navegao ro-
btica (HIRAKAWA; SARAIVA; CUGNASCA, 2007), bem como reconhecimento de
padres, envolvendo reas de viso computacional (COSTA; HIRAKAWA; NETO,
2002). Ainda, ferramentais como o AdapTools tm sido desenvolvidos no
s para auxiliar a construo de dispositivos adaptativos, mas tambm como
material pedaggico (PISTORI, 2003; JESUS et al., 2007).
Mesmo antes da formalizao do dispositivo adaptativo geral em 2001, ca-
sos particulares de adaptatividade j haviam sidos utilizados para solucionar
problemas especcos. Como exemplo, redes de Markov adaptativas foram
empregadas para a construo de um software autnomo de composio mu-
sical (BASSETO; NETO, 1999). Autmatos de pilha estruturados adaptativos, a
partir dos quais foi formalizado o dispositivo adaptativo geral, foram alvo de
estudo em trabalhos anteriores, nos quais provado que seu poder de repre-
sentao equivalente ao de uma Mquina de Turing (ROCHA; NETO, 2000).
O emprego de tcnicas adaptativas voltadas para a tomada de deciso
tem sido feito em dispositivos mais especcos. Ao formalizar o dispositivo
adaptativo geral em 2001, conforme ilustra a Figura 2, uma tabela de deci-
so adaptativa (TDA) tambm apresentada como exemplo de uso deste tipo
de tcnica (NETO, 2001). Esta mesma tabela foi alvo de aprofundamento por
24
Dispositivo
Adaptativo de
Tomada de
Deciso
Tecnologia
Adaptativa
T
o
m
a
d
a

d
e

D
e
c
i
s

o
R
e
c
u
r
s
o
s

C
o
m
p
u
t
a
c
i
o
n
a
i
s
Figura 2: Diagrama conceitual de um dispositivo adaptativo de tomada de
deciso (TCHEMRA, 2009).
Tchemra, que, em 2009, apresentou uma extenso TDA, em que um se-
gundo mtodo de deciso (no caso, o AHP - Analytic Hierarchy Process) uti-
lizado para solucionar problemas que a tabela clssica de deciso no prev
em seu conjunto corrente de regras (TCHEMRA, 2009). A soluo dada pelo
mtodo auxiliar, ento, incorporada pela tabela de deciso na forma de uma
nova regra, caracterizando uma forma de aprendizado incremental. A esta
tabela, foi dado o nome de TDAE (Tabela de Deciso Adaptativa Estendida).
A TDAE constitui um exemplo do uso de tcnicas adaptativas em sistemas
hbridos de apoio deciso, e mostra ser possvel realizar um trabalho colabo-
rativo, ainda que restrito a dois dispositivos particulares. No entanto, o escopo
das tabelas de deciso restrito para problemas j previstos em seu conjunto
de regras, e, em particular, elas no operam sobre problemas numricos.
Outra restrio implcita da TDAE o critrio para decidir se o mtodo
auxiliar deve ser utilizado: em uma tabela de deciso, quaisquer problemas
25
no previstos em seu conjunto de regras devem ser repassados ao mtodo
auxiliar. Contudo, este critrio limitado para dispositivos guiados por regra,
e no poderia ser utilizado, por exemplo, em dispositivos baseados em proba-
bilidades, como o caso do classicador de Bayes.
Estas limitaes apresentadas pela TDAE incentivaram e motivaram o es-
tudo e aplicao da tecnologia adaptativa como meio para coordenar uma
tomada de deciso colaborativa entre dispositivos de naturezas distintas.
1.2 Objetivos
O principal objetivo deste trabalho propor um sistema hbrido de apoio
deciso que, atravs de tcnicas adaptativas, permite que mltiplos dispositi-
vos de diferentes naturezas sejam utilizados de forma colaborativa para soluci-
onar um problema de tomada de deciso. Este uso de mltiplos dispositivos
uma generalizao do modelo introduzido pela TDAE, em que cada dispositivo
agrega conhecimento atravs das solues apresentadas pelos demais. Em
especial, permite que dispositivos mais lentos, mas que possuem melhores
taxas de acertos, propaguem suas solues para dispositivos mais rpidos.
Experimentos foram realizados atravs de benchmarks padronizados na rea
de aprendizagem de mquina - muitos deles oriundos de dados reais - para
que o resultado possa ser comparado ao de sistemas congneres.
O segundo objetivo deste estudo sugerir formas de tratar incertezas so-
bre a veracidade de um conhecimento adquirido durante o aprendizado in-
cremental. Enquanto os conhecimentos originados atravs de dados de trei-
namento, obtidos com a ajuda de humanos, podem ser tratados como ver-
dadeiros com conana, conhecimentos obtidos incrementalmente atravs de
outros dispositivos so propensos a conter erros, e, consequentemente, me-
26
nos conveis. Porm, mtodos clssicos de aprendizagem de mquina no
distinguem as informaes pela sua conabilidade, tratando todas da mesma
forma, o que pode fazer com que o aprendizado venha a comprometer a qua-
lidade do conhecimento anteriormente acumulado. Embora no exista um
modelo computacional consolidado que modele a inuncia de informaes
incertas sobre a conana, possvel vericar, de forma isolada, a inuncia
que certos fatores cognitivos podem exercer sobre a tomada de deciso. Tais
fatores foram utilizados para estipular um modelo de conana a ser utilizado
pelo sistema adaptativo.
A partir deste sistema, tambm vericada a relao de compromisso
entre a taxa de acertos e o tempo de resposta de uma tomada de deciso, co-
mumente chamada de Speed-Accuracy Trade-off (SAT). Tipicamente, quanto
mais tempo gasto para encontrar uma soluo, mais precisa ela se torna
- tal relao ilustrada pela Figura 3. Seres humanos procuram encontrar
um ponto de equilbrio entre o tempo gasto e a taxa de acertos para maxi-
mizar seus ganhos - e.g., durante uma prova escolar, procura-se o obter o
melhor resultado dentro de um dado intervalo de tempo (tempo o fator limi-
tante), enquanto a escolha de um novo imvel deve ser feita minimizando os
erros, mesmo que seja necessrio sacricar mais tempo (preciso o fator
limitante). Mesmo animais so capazes de efetuar tal escolha, sacricando
preciso para obter solues mais rpidas em problemas em que o custo do
erro baixo (CHITTKA; SKORUPSKI; RAINE, 2009).
Porm, grande parte dos mtodos clssicos de tomada de deciso apre-
sentam algoritmos de comportamento linear, e no permitem regular o tempo
a ser gasto, nem a taxa de acertos desejada. Encontrar uma forma de calibrar
esta relao de compromisso o terceiro grande objetivo deste trabalho. Fa-
zendo uso da natureza hbrida do sistema proposto, so vericadas formas de
27
Tempo de Resposta
T
a
x
a

d
e

A
c
e
r
t
o
Baixo Alto
B
a
i
x
a
A
l
t
a
G
a
n
h
o

d
e

a
c
u
r

c
i
a
P
e
r
d
a

d
e

a
c
u
r

c
i
a
Perda de velocidade
Ganho de velocidade
Problema
"fcil"
Figura 3: Curva SAT que relaciona o compromisso entre velocidade e taxa de
acertos.
controlar a quantidade de problemas a serem solucionados em cada disposi-
tivo: preferencialmente, problemas perceptualmente fceis devem ser soluci-
onados pelos dispositivos mais rpidos, enquanto problemas mais complexos
devem ser solucionados pelos dispositivos mais precisos e, potencialmente
mais lentos. O entendimento do conceito de diculdade de um problema
discutido ao longo desta dissertao.
Segue abaixo um resumo dos resultados conceituais obtidos como produ-
tos deste trabalho:
Uma forma diferenciada de tomada de deciso, que, atravs de tcnicas
adaptativas, permite criar um sistema hbrido que integra dispositivos de
diferentes naturezas.
Generalizao da extenso do TDAE para dispositivos que utilizem, no
lugar da aplicao de regras, tcnicas probabilsticas para obter solu-
es.
28
Denio de um modelo que pondera as informaes conhecidas pelo
sistema atravs de sua conana e permite distinguir um conhecimento
consolidado de um conhecimento obtido via aprendizado incremental,
potencialmente menos convel.
Abaixo, seguem os principais resultados prticos obtidos:
Criao de um framework extensvel para desenvolvimento de sistemas
hbridos de tomada de deciso, que permite que novos dispositivos se-
jam incorporados. Foi desenvolvido na linguagem de programao Java.
Implementao de vrios dispositivos de tomada de deciso,
preparando-os para a utilizao do modelo de conana proposto.
Validao da relao de compromisso entre taxa de acertos e velocidade
com o auxlio de benchmarks padronizados.
1.3 Organizao da Dissertao
Esta dissertao est organizada em quatro captulos principais:
(cap. 2) Reviso Bibliogrca - Introduz os conceitos utilizados por
este trabalho para a formulao e denio do sistema hbrido de to-
mada de deciso, oferecendo uma reviso da literatura nas reas de
tomada de deciso, tcnicas adaptativas, aprendizagem de mquina e
questes relacionadas conana de uma deciso.
(cap. 3) Proposta - Captulo dedicado ao detalhamento da proposta
de projeto deste estudo, apresentando o funcionamento do sistema de
tomada de deciso, e descrevendo de que forma o modelo de conana
utilizado para realizar um processo incremental de aprendizagem.
29
(cap. 4) Resultados - Apresenta o banco de testes utilizado para veri-
car o funcionamento de um sistema-exemplo, composto por uma srie
de dispositivos denidos no captulo anterior. Os testes se dividem em
dois principais grupos: 1. vericar a evoluo de um sistema medida
que os dispositivos passam a propagar suas solues para os demais;
e 2. vericar como a taxa de acertos e o tempo de resposta se com-
portam ao controlar a quantidade de problemas a serem solucionados
em cada dispositivo - tal controle realizado atravs de um limiar, cujo
funcionamento detalhado na proposta.
(cap. 5) Concluso - Captulo de encerramento, destacando as conclu-
ses, contribuies e sugestes para trabalhos futuros.
30
2 REVISO BIBLIOGRFICA
Neste captulo, sero abordados os principais tpicos relacionados a este
trabalho, introduzindo uma viso geral, histrico e perspectivas para futuras
pesquisas de cada conceito utilizado como base para o desenvolvimento deste
estudo.
2.1 Tcnicas Adaptativas
2.1.1 Viso Geral
O termo adaptatividade corresponde capacidade de um sistema tomar
a deciso de automodicar-se, alterando seu prprio comportamento como
resposta a um estmulo de entrada sem a interferncia de agentes externos
(NETO, 2007). Tal caracterstica permite que o sistema evolua de acordo com
o histrico de entradas processadas, adaptando-se ao ambiente em que se
encontra.
Apesar de ter sido formalizado em 2001 (NETO, 2001), estudos anteriores
de estruturas de topologias variveis podem ser encontrados na literatura em
diferentes nveis de abstraes e generalizaes. Um dos primeiros exemplos
foi uma nota publicada por Agasandjan em 1967, idealizando um autmato de
estrutura varivel (AGASANDJAN, 1967). Na mesma poca, Salomaa tambm
apresentava um trabalho terico sobre autmatos nitos variveis no tempo
31
(SALOMAA, 1968). De maneira complementar, Christiansen tambm viria a tra-
balhar com teorias adaptativas, contudo, voltada para a compreenso das de-
pendncias de contextos em gramticas (CHRISTIANSEN, 1985; CHRISTIANSEN,
1990).
A trajetria da formalizao do dispositivo adaptativo, contudo, teve ori-
gem no autmato de pilha estruturado apresentado por Neto e Magalhes em
1981 (NETO; MAGALHES, 1981). Com base neste trabalho, Neto, em 1988,
apresentava o funcionamento de um reconhecedor sinttico com comporta-
mento adaptativo (NETO, 1988). Este formalismo seria, em 1993, consolidado
na forma de um autmato adaptativo (NETO, 1993), cujo poder de represen-
tao equivalente a uma Mquina de Turing, conforme provado em (ROCHA;
NETO, 2000). A generalizao do dispositivo adaptativo veio em um trabalho
publicado por Neto em 2001, que descreve o comportamento dos dispositi-
vos guiados por regras, e como torn-los adaptativos, permitindo o reuso de
dispositivos j conhecidos (NETO, 2001).
Dentro deste contexto, o termo dispositivo utilizado para referenciar uma
abstrao lgica formal, capaz de solucionar um problema de entrada. Em
particular, dispositivos guiados por regras so aqueles dirigidos por um con-
junto nito de regras que descrevem a congurao em que o dispositivo
se encontra, bem como seu comportamento ao receber estmulos externos
(NETO, 2001). Exemplos de dispositivos incluem autmatos nitos, rvores de
deciso, tabelas, redes de Markov, gramticas e ans - e tipicamente, so imu-
tveis durante a execuo, no apresentando um comportamento adaptativo.
De acordo com Neto (NETO, 2001), um dispositivo guiado a regras ND
descrito por ND = (C, NR, S, c
0
, A, NA), onde:
C denota o conjunto nito de possveis conguraes que ND pode as-
32
sumir, enquanto c
0
sua congurao inicial.
S o conjunto de todos os estmulos de entrada aceitos por ND. O valor
nulo membro deste conjunto.
A C o subconjunto de conguraes de aceitao.
NA o conjunto nito de todos os smbolos de sada de ND. Estes so
escritos como resposta aplicao das regras presentes em NR. Do
ponto de vista de um observador externo, um smbolo de sada z NA
pode ser interpretado como uma operao a ser executada.
NR CS CNA o conjunto nito de regras que dene o compor-
tamento do dispositivo ND. A aplicao de uma regra r NR, denotada
por r = (c
i
, s, c
j
, z), altera a congurao atual de c
i
para c
j
ao consumir
o smbolo de entrada s S, escrevendo z NA na sada.
Em contrapartida, um dispositivo adaptativo capaz de alterar, de forma
autnoma, seu prprio conjunto de regras como resposta a um estmulo de
entrada. Este dispositivo pode ser separado em duas componentes: um dis-
positivo subjacente e uma camada adaptativa, responsvel pelo controle das
mudanas a serem realizadas (NETO, 2001). Esta congurao permite reu-
tilizar formalismos j consolidados e torn-los adaptativos, ao custo de um
pequeno acrscimo de complexidade (PISTORI, 2003). A disposio do dispo-
sitivo adaptativo est ilustrada na Figura 4.
O controle das alteraes do conjunto de regras feito atravs de aes
adaptativas - sequncia de operaes elementares de consulta, insero e
remoo de regras - que so associadas a um subconjunto particular das re-
gras existentes, denominadas adaptativas. O disparo de uma regra adaptativa
faz com que sua ao associada seja executada, resultando na alterao do
conjunto atual de regras.
33
Camada
Adaptativa
Ncleo
Dispositivo
Subjacente
Dispositivo
Adaptativo
Figura 4: Estrutura tpica de um dispositivo adaptativo, formado por um dispo-
sitivo subjacente, envolto por uma camada adaptativa.
Formalmente, um dispositivo adaptativo AD descrito por AD
k
=
(ND
k
, AM), tal que:
k 0 um contador que incrementado quando uma ao adaptativa
executada.
ND
k
o dispositivo subjacente aps k utilizaes do dispositivo. ND
0
o dispositivo subjacente inicial, enquanto ND
k+1
a evoluo de ND
k
aps uma ao adaptativa de inserir uma nova informao. Este novo
dispositivo ter um novo conjunto de regras NR
k+1
, uma verso editada
do conjunto anterior NR
k
.
AM o mecanismo adaptativo responsvel pela execuo das aes
adaptativas.
Expandindo a denio de ND em AD, temos que AD
k
=
(C
k
, AR
k
, S, c
k
, A, NA, BA, AA), tal que:
C
k
o conjunto nito de estados aps a execuo de k aes adaptati-
vas, enquanto c
k
a congurao inicial do dispositivo AD
k
.
34
Os conjuntos S, A C
k
e NA permanecem com suas denies origi-
nais. Assim, os estmulos de entrada vlidos, o conjunto de estados de
aceitao e os smbolos de sada devem estar todos previstos no dispo-
sitivo inicial.
BA e AA so conjuntos de aes adaptativas que podem ser executadas
antes e depois da aplicao de uma regra, respectivamente. Ambos
os conjuntos devem conter a ao nula, que no efetua alteraes no
conjunto de regras.
O conjunto de regras de um dispositivo adaptativo renomeado de NR
para AR
k
BAC
k
SC
k
NAAA. Regras adaptativas so escritas
na forma ar
k
= (ba, c
i
, s, c
j
, z, aa), onde ba BA a ao adaptativa
a ser executada antes de aplicar a regra. Aps execut-la, a poro
no-adaptativa da regra (c
i
, s, c
j
, z) aplicada, para que, em seguida, a
ao adaptativa aa AA seja executada. Caso a regra a ser aplicada
seja removida devido ao ba, sua aplicao abortada, forando o
dispositivo a encontrar outra regra para consumir o estmulo de entrada
s. Se ba = aa = , ento a regra ser, essencialmente, no-adaptativa.
O Algoritmo 1 ilustra o funcionamento de um dispositivo adaptativo AD.
O funcionamento bsico deste algoritmo est baseado em um loop, que itera
a cadeia de entrada w = s
1
, . . . s
n
tal que s
i
S 0 < i n, extraindo um
smbolo s
atual
por vez e utilizando-o para selecionar o conjunto CR
T
de regras
aplicveis a ser utilizado. Regras aplicveis so aquelas cujos valores c
i
e s
so respectivamente compatveis com a congurao AD.c
atual
e o smbolo
s
atual
que estiver correntemente sendo processado.
De maneira mais formal, CR
T
= ar AR
T
[ ar = (ba, c
i
, s, c
j
, z, aa) , c
i
=
c
atual
, s s
atual
, ; c
i
, c
j
C
T
; ba BA; aa AA; z NA. A obteno
35
Algoritmo 1 executaAR(AD, w, out)
Entrada
AD: Dispositivo adaptativo a ser executado
w: Cadeia de smbolos de entrada s S
Sada
out: Cadeia de sada, com smbolos z NA
1: AD.c
atual
c
0
2: for all s
atual
w do
3: consumido false
4: while not consumido do
5: CR
T
buscaRegra (AD, s
atual
)
6: if CR
T
= then
7: Rejeita w
8: else if |CR
T
| = 1 then
9: ar CR
T
[0]
10: consumido executaD(AD, ar, out)
11: else
12: consumido executaND(AD, ar, out)
13: end if
14: end while
15: end for
16: if AD.c
atual
AD.A then
17: Aceita w
18: else
19: Rejeita w
20: end if
deste conjunto est representada pela funo buscaRegra na linha 5, e des-
crita pelo Algoritmo 2. Note que, para ser aceita, a regra deve ter c
i
igual ao
estado do dispositivo, enquanto seu smbolo s deve ser igual ao smbolo de
entrada s
atual
, ou ento, nulo.
Note-se que esta notao presume que o smbolo seja unidimensional, isto
, um valor escalar. Se o smbolo for uma composio de mltiplos valores,
isto , s = (s
1
, . . . , s
m
), a condio para a regra ser aceita passa a ser s [ s
i

s : s
i
s
atual i
, , ilustrado pelo Algoritmo 3. Para o caso unidimensional,
esta formulao idntica condio original.
A cardinalidade de CR
T
dene a maneira com que o Algoritmo 1 deve
36
Algoritmo 2 buscaRegra (AD, s)
Entrada
AD: Dispositivo adaptativo a ser executado
s: Smbolo lido da cadeia de entrada = s
atual
Sada
Conjunto CR
T
de regras aplicveis
1: CR
T

2: for all ar = (ba, c
i
, s, c
j
, z, aa) AD.AR
T
do
3: if ar.c
i
= AD.c
atual
subsimbolo (s, ar.s) then
4: Insere ar no CR
T
5: end if
6: end for
7: return CR
T
Algoritmo 3 subsimbolo (s, rs)
Entrada
s: Smbolo lido da cadeia de entrada
rs: Smbolo da regra
Sada
true se smbolo deve ser aceito, false caso contrrio
1: for all rs
i
inrs do
2: if rs
i
/ s
i
, then
3: return false
4: end if
5: end for
6: return true
proceder:
Caso nenhuma regra seja encontrada, o algoritmo encerra sua execu-
o, rejeitando a cadeia de entrada (linha 7).
No caso de haver apenas uma nica regra aplicvel - i.e., |CR
T
| =
1 - sua aplicao pode ser feita de maneira determinstica, explicitada
pela linha 10 e descrita pelo Algoritmo 4. Neste caso, a regra ar =
(ba, c
i
, s, c
j
, z, aa) encontrada aplicada, o que resulta na execuo da
ao adaptativa ba. O prosseguimento depende do resultado de ba:
Caso a ao de ba resulte na remoo de ar do conjunto de regras
37
AR, o Algoritmo 4 encerra sua execuo, retornando false semapli-
car ar. Neste caso, o smbolo de entrada s
atual
no consumido, e
o dispositivo forado a encontrar outra regra na nova instncia do
conjunto AR (Algoritmo 1, linha 4).
Caso contrrio, o smbolo s
atual
de entrada consumido, alterando a
congurao corrente de AD de c
i
para c
j
, e escrevendo o smbolo
z na sada. Finalmente a ao aa executada.
Caso mais de um regra possa ser aplicada, todas so executadas ao
mesmo tempo, de forma no-determinstica (linha 12). Devido na-
tureza determinstica dos sistemas existentes, uma ao deste tipo
simulada atravs de backtracking. Apesar de casos particulares terem
sido estudados (PISTORI; NETO; PEREIRA, 2006; CASTRO JR.; NETO; PIS-
TORI, 2007), o ideal evitar este tipo de situao devido o alto custo
computacional envolvido na simulao desse tipo de ocorrncia. Neste
trabalho, casos no-determinsticos no sero avaliados - logo, a funo
executaND no ser desenvolvida neste trabalho.
As linhas 2 e 10 do Algoritmo 4 ilustram a chamada das aes ba e aa,
respectivamente, atravs do procedimento adapta, que deve ser implementado
de acordo com o tipo de dispositivo. Cada ao adaptativa denida atravs
de uma funo adaptativa, que denem a sequncia de operaes a serem
executadas por tal ao. Tais funes devem possuir os seguintes itens (NETO,
2001):
Um nome simblico, utilizado para referenciar a funo. As regras utili-
zam este nome para identicar quais as funes a serem chamadas.
Um conjunto de parmetros que deve ser passado como argumento
durante a chamada da funo. Cada parmetro representado por um
38
Algoritmo 4 executaD(AD, ar, out)
Entrada
AD: Dispositivo adaptativo a ser executado
ar: Regra adaptativa a ser executada
Sada
out: Cadeia de sada, com smbolos z NA
1: if ar.ba ,= then
2: adapta (AD, ar.ba)
3: end if
4: if ar / AD.AR then
5: return false
6: end if
7: AD.c
atual
ar.c
j
8: Insere ar.z out
9: if ar.aa ,= then
10: adapta (AD, ar.aa)
11: end if
12: return true
nome simblico, utilizado para constituir a lgica da funo. Durante a
execuo, os valores destes argumentos no podem ser alterados pela
funo.
Um conjunto de variveis locais, cujo valor resolvido durante a exe-
cuo da funo adaptativa atravs de operaes de consulta. Assim
como os parmetros, seus valores no podem ser modicados aps se-
rem preenchidos.
Um conjunto de geradores, que geram novos valores cada vez que so
utilizados. So representados por um nome simblico, que pode ser
referenciado durante a execuo da funo adaptativa.
Finalmente, necessrio especicar o corpo da funo adaptativa, que
especica as operaes elementares a serem executadas para alterar o
conjunto de regras. As trs operaes adaptativas elementares so:
Consulta (?) Operao que busca um regra de acordo com um critrio
39
de pesquisa, retornando um dos valores presentes na regra (con-
gurao inicial / nal ou o smbolo de entrada). Este valor deve ser
atribudo a uma varivel.
Incluso (+) Operao que insere uma nova regra no conjunto de re-
gras. Seu valor baseado nos valores presentes nos parmetros,
nas variveis e nos geradores denidos previamente.
Excluso () Operao que exclui uma determinada regra.
Aps o consumo de todos os smbolos, a cadeia de entrada aceita se a
congurao nal do dispositivo pertence ao conjunto A.
2.1.2 Tabela de Deciso
Tabela de deciso uma forma compacta para descrever, de forma ilustra-
tiva, a lgica de uma tomada de deciso, associando uma srie de condies
a uma ao a ser tomada. A associao entre as condies e as aes feita
dividindo a tabela em quatro quadrantes conforme ilustra a Tabela 1: os qua-
drantes esquerda listam, na forma de linhas, as condies a serem testadas
e as possveis aes a serem tomadas, enquanto os quadrantes direita con-
tm a associao dos valores das condies para cada regra (coluna) e as
aes a serem executadas como resposta aplicao de uma regra. Uma
clula vazia nos valores das condies indica que a condio desta linha no
precisa ser testada nesta regra (coluna). A Tabela 2 mostra um exemplo de
uma simples tabela de deciso que decide a aprovao de um aluno com base
em sua mdia nal e frequncia nas aulas.
De maneira geral, as tabelas de deciso so estruturas de fcil formulao,
compreenso e manuteno, sendo frequentemente empregadas por pros-
sionais de reas no tcnicas - e.g., gerentes e executivos - para formular
40
Regras
r
1
... r
j
... r
n
E
C
o
n
d
i

e
s
c
1
...
c
i
Valores das condies
...
c
m
A

e
s
a
1
...
a
k
Aes a serem tomadas
...
a
p
Tabela 1: Estrutura tpica de uma tabela de deciso.
r
1
r
2
r
3
r
4
Mdia 7 S N N
7 > Mdia 5 S N
Mdia < 5 S
Freq. 70% S S N
Aprovado S
Recuperao S
Reprovado S S
Tabela 2: Exemplo de tabela de deciso.
modelos de tomada de deciso (HUGHES; SHANK; STEIN, 1968). A transmisso
de conhecimento atravs de tabelas mostra-se mais expressiva do que ou-
tras estruturas, tais como formas narrativas, formas escritas ou uxogramas
(TCHEMRA, 2009).
Em sua forma mais simples, uma tabela de deciso apresenta valores bi-
nrios para suas condies, tipicamente Sim (S) e No (N). Certas condies,
porm, so mais facilmente representadas quando assumemvalores discretos
quaisquer. Como exemplo, a Tabela 2 apresenta trs condies para mdia,
ao passo que apenas uma linha seria necessria case a tabela utilizasse en-
tradas discretas, conforme ilustra a Tabela 3. A este tipo de tabela, se d o
41
nome de Tabela de Deciso de Entradas Estendidas (RAJARAMAN, 2004).
r
1
r
2
r
3
r
4
Mdia 7 [5 7[ < 5
Freq. 70% S S N
Aprovado S
Recuperao S
Reprovado S S
Tabela 3: Exemplo de tabela de deciso com entradas estendidas.
Cada regra individual da tabela pode ser interpretada como uma srie de
sentenas if X then Y , onde X o conjunto de condies a serem analisa-
das, enquanto Y a ao a ser executada. As condies so normalmente
compostas por uma srie de operaes do tipo and, apesar de que outros
operadores lgicos tambm possam ser utilizados (TCHEMRA, 2009). Como
exemplo, a regra r2 da Tabela 2 aplicada quando trs condies so verda-
deiras:
Mdia no maior ou igual a 7;
Mdia maior ou igual a 5;
Frequncia maior ou igual a 70%
Caso as trs condies sejam verdadeiras, a ao escolhida ser consi-
derar que o aluno ser reavaliado em um exame de recuperao. Note que a
condio de a mdia ser inferior a 5 no testada nesta regra - at porque,
logicamente, a mdia s poderia assumir valores maior que 5 e menor que 7,
denido pelas duas primeiras regras.
42
2.1.3 Tabela de Deciso Adaptativa
A aplicao da adaptatividade sobre a tabela de deciso foi introduzida
em 2001 por Neto como exemplo da formalizao do dispositivo adaptativo.
Denominada Tabela de Deciso Adaptativa (TDA), ela permite que seu con-
junto de regras seja modicado ao longo de sua utilizao, o que inclui inserir
novas regras, bem como excluir regras dentre as existentes (NETO, 2001). Tal
comportamento dinmico permite que a tabela consiga aprender de forma in-
cremental, ajustando o conjunto de regras conforme novas informaes so
disponibilizadas (STANGE; NETO, 2011).
Esta seo apresenta as modicaes feitas sobre a tabela de deciso
convencional, alm de um exemplo de uso deste dispositivo.
2.1.3.1 Denio
Utilizando a Tabela 1 como referncia, a TDA incorpora novas colunas e
linhas que representam a declarao das funes adaptativas, bem como as
chamadas das mesmas por parte das regras. Seu modelo ilustrado pela
Tabela 4, que apresenta m condies, p aes e nf funes adaptativas.
Note que a tabela de deciso subjacente se encontra nos dois quadrantes
superiores direita, e no sofre alteraes com relao tabela original - cada
coluna ainda representa uma regra, enquanto as linhas denem os valores
individuais associados a cada regra, alm das aes a serem executadas.
Uma adio tabela original a linha de rtulo (tag), utilizada para identicar o
signicado associado a cada coluna. Como exemplo, regras so identicadas
pelo rtulo R, enquanto os rtulos S e E so utilizados para delimitar o incio
e m das colunas de regras.
A denio da TDA tambm insere um novo conjunto de linhas abaixo
43
Operaes Adapt. Regras
... AD
z
... r
1
r
2
... r
n
Rtulos ... H + ... S R R ... R E
C
o
n
d
i

e
s
c
1
...
c
i
Valores das condies
...
c
m
A

e
s
a
1
...
a
k
Aes a serem tomadas
...
a
p
F
u
n

e
s
A
d
a
p
t
a
t
i
v
a
sFAD
1
FAD
2
funes adaptativas
... a serem chamadas
...
...
FAD
z
Referncias a FAD
z
...
FAD
nf
Tabela 4: Estrutura tpica de uma tabela de deciso adaptativa (TDA), que
dene as funes adaptativas em novas colunas, e sendo chamadas atravs
de um novo quadrante.
das aes, denindo as funes adaptativas a serem executadas devido
aplicao de uma regra:
Uma nova linha utilizada para cada funo adaptativa existente, sendo
identicada por um nome. Clulas marcadas nesta linha indicam que
suas respectivas regras devem chamar esta funo adaptativa.
Uma nova linha deve ser associada para cada gerador, varivel ou par-
metro de entrada utilizados pelas funes adaptativas. Caso uma regra
chame uma funo adaptativa qualquer, as linhas dos parmetros utiliza-
dos pela funo tambm devem ser preenchidos com os valores destes
parmetros. Os geradores e variveis no so preenchidos nestas colu-
nas.
44
As denies das funes adaptativas se fazem em uma srie de colunas
esquerda da tabela subjacente. Cada coluna dene as operaes a serem
executadas por cada funo adaptativa, enquanto as linhas apresentam os
parmetros, variveis e geradores utilizados por cada operao:
De forma anloga tabela subjacente, a primeira linha apresenta os
rtulos de cada coluna:
O rtulo H utilizado para assinalar o cabealho de uma funo
adaptativa. Nesta coluna, a clula que corresponde ao nome da
funo deve estar marcada com b ou a, assinalando que a funo
deve ser executada antes ou depois da aplicao da regra que a
referencia. Caso a funo faa uso de parmetros, variveis ou
geradores, suas respectivas clulas devem estar marcadas com os
indicadores P, V e G.
As colunas que se seguem aps a coluna de cabealho denem
as operaes elementares a serem executadas pela funo, sendo
rotuladas de acordo com o tipo de operao: + (incluso), (ex-
cluso), ? (consulta).
Nas linhas das condies, cada operao assinala quais devem ser os
valores a serem trabalhados - i.e., em uma operao de incluso, diz
quais devem ser as condies da regra a ser criada, enquanto em uma
operao de excluso diz quais so as condies da regra a ser excluda.
As linhas de aes assinalam quais delas devem ser executadas pela
regra a ser includa, excluda ou consultada.
Linhas com os nomes das funes adaptativas devem vir marcadas se a
regra a ser includa/excluda chama esta funo.
45
Assim como na tabela subjacente, se uma funo adaptativa foi mar-
cada, ela deve ser referenciada pela nova regra (ou, no caso de exclu-
so, indica que a regra a ser removida faz referncia a esta funo).
2.1.3.2 Exemplo Ilustrativo
Um exemplo de uso da TDA a simulao de um autmato adaptativo
(NETO, 2001). Este autmato representa uma aplicao especca do forma-
lismo adaptativo que utiliza autmatos de estados nitos como dispositivo sub-
jacente (NETO, 1993), conferindo-lhe um aumento de poder de representao
(ROCHA; NETO, 2000). A adaptatividade se manifesta na forma de funes
adaptativas, que podem ser chamadas ao efetuar uma transio de estados.
A Figura 5 ilustra um exemplo de autmato de 4 estados e 10 transies,
bem como a tabela de deciso utilizada para represent-lo. O alfabeto deste
autmato composto pelos smbolos 0, 1, , onde representa o m da
cadeia. Comparando esta tabela com a TDA ilustrada pela Tabela 4, observa-
se que:
Cada transio do autmato representada por uma regra na tabela. A
regra de rtulo S associada transio que dene o estado inicial do
autmato, enquanto as demais so marcadas com R. A regra rotulada
com E no associada a uma transio, apenas delimitando a tabela.
As condies da tabela de deciso representam as condies necess-
rias para as transies do autmato serem executadas, i.e., o estado
corrente e o smbolo lido da cadeia. Por exemplo, a transio (B, 0) C
associada regra 4.
As aes da tabela representam as aes a serem tomadas devido a
execuo de uma transio do autmato. No caso, informam o prximo
46
A B C
[r1] 0 [r4] 0
X(A, B) !
Y() !
[r2] 1
[r6] 1
D
[r7] !
Regras 0 1 2 3 4 5 6 7 8 9 10
Tags H + + + - H - S R R R R R R R R R E
Condies
Estado p1 g1 g1 p1 C A A A B B C C C D
Smbolo 0 0 1 0 1 0 1 0 1 !
Prx. Est. g1 p2 p1 p2 B A B B C B
Aes Get ! ! ! ! !
Aceita X X X !
Aes
Adaptativas
X b ! ! !
Y a ! !
Parmetros
p1 P g1 p1 A
p2 P p2 p2 B
Geradores g1 G
[r0]
[r3] Rejeita
[r5] Rejeita [r8] Rejeita
[r9] Aceita
Corpo de X
Cabealho
de X
Figura 5: Exemplo de um autmato adaptativo e sua tabela de deciso corres-
pondente.
estado do autmato ao executar tal transio. Tambm informam se o
smbolo deve ser consumido, e se o autmato deve aceitar () ou rejeitar
a cadeia ().
Este exemplo possui duas funes adaptativas:
A primeira funo recebe o nome X, e faz uso de dois parmetros
p1 e p2, e de um gerador g1. Esta funo composta por quatro
operaes elementares: trs delas de incluso (marcadas com o
rtulo +) e uma de excluso (). Quando chamada, esta funo
deve ser executada antes de executar as aes informadas pela
regra (esta ordem de execuo denida pelo valor b, presente em
seu cabealho).
47
A outra funo, referenciada por Y , no faz uso de nenhum parme-
tro, gerador ou varivel, e contm uma nica operao de excluso.
Quando chamada, esta funo deve ser executada aps executar
as aes informadas pela regra (esta ordem de execuo denida
pelo valor a, presente em seu cabealho).
A partir desta tabela, a simulao do autmato adaptativo feita atravs
dos seguintes passos:
1. A regra inicial, marcada com o rtulo S, deve ser aplicada, simulando o
incio de operao do autmato, alterando seu estado corrente c
corrente
para o estado inicial informado pela ao da regra.
2. Para cada smbolo s da cadeia de entrada:
(a) Busca-se uma regra aplicvel para os parmetros (c
corrente
, s). No
autmato, isso equivale a vericar se, no estado corrente, existe
uma transio que consuma o smbolo s.
(b) Se a regra no existir, a simulao deve ser interrompida, pois no
h transies vlidas no autmato nestas condies.
(c) Seno, vericar se a regra possui a ao de rejeitar a cadeia. Em
caso positivo, a simulao encerrada, com o autmato rejeitando
a cadeia.
(d) Se a ao no de rejeio:
i. Verica se a regra possui uma funo adaptativa a ser execu-
tada antes de executar as aes informadas pela regra. Caso
exista, ela executada.
ii. Se a execuo da funo adaptativa fez com que a regra esco-
lhida tenha sido removida, volta para o passo 2a.
48
iii. Executa as aes informadas pela regra - em especial, atualiza
o valor do estado corrente do autmato.
iv. Verica se a regra possui uma funo adaptativa a ser exe-
cutada aps executar as aes informadas pela regra. Caso
exista, ela executada.
v. Se o smbolo lido o indicador de m de cadeia :
A. Verica qual a ao de aceitao da regra. Este passo
simula os estados de aceitao do autmato.
B. Se a ao estiver marcada com , cadeia aceita;
C. Seno, se a ao estiver marcada com , cadeia rejei-
tada;
vi. Verica se smbolo deve ser consumido. Caso negativo, retorna
ao passo 2a.
Utilizando o automato da Figura 5 como exemplo, para uma cadeia de
entrada cujo primeiro smbolo 0, as seguintes aes so realizadas:
1. Executa as aes informadas pela regra inicial r0, mudando o estado
corrente para A.
2. Pela tabela de deciso, a condio atual (A, 0) satisfeita pela regra
r1. Tambm observado que esta regra possui uma referncia para X
que deve ser executada com os parmetros p1 = A e p2 = B antes de
aplicar a regra. Assim, de acordo com suas operaes elementares, as
seguintes aes adaptativas so executadas:
(a) Cria uma nova regra r11, cuja condio (p1, 0), e que mude o
estado do autmato para um novo estado, referente ao gerador g1.
Resolvendo os valores de p1 e g1, a nova regra representa uma
transio (A, 0) #1, onde #1 o valor gerado por g1.
49
(b) Cria uma nova regra r12 que representa a transio (#1, 0) B.
Esta regra adaptativa, e chama a funo X comp1 = #1 e p2 = B.
(c) Cria uma nova regra r13 que representa a transio (#1, 1) A.
(d) Remove a regra cuja condio (A, 0) e ao atualizar o estado
atual para B. Consultando a tabela, esta regra existe (r1), logo,
removida.
3. Aps a ao da funo adaptativa X, o autmato passa a ter uma nova
congurao, ilustrada pela Figura 6.
4. Como a regra r1, que seria aplicada, foi excluda pela ao da funo
adaptativa, deve-se voltar ao passo 2a e procurar outra regra aplicvel,
agora, no dispositivo aps as mudanas. Pela nova congurao, h ou-
tra regra aplicvel, r11, que transita de A para #1, consumindo o smbolo
0.
Iterando este processo at consumir toda a cadeia, a tabela deve chegar
a uma ao de aceitao ou rejeio. Por exemplo, a cadeia 0110 aceita,
disparando as regras r11, r13, r2. r4 e r7, enquanto a cadeia 11 rejeitada.
2.1.4 Tabela de Deciso Adaptativa Estendida
Em sua denio original, um dispositivo adaptativo capaz de alterar
seu conjunto de regras como resposta a um estmulo externo, utilizando, para
tanto, funes adaptativas (NETO, 2001). Contudo, o poder de expresso des-
tas funes limitado a trs operaes adaptativas elementares, e diculta a
implementao de aes mais complexas (TCHEMRA, 2009).
Ainda, um dispositivo adaptativo tpico interrompe sua execuo quando
confrontado com uma situao em que no h regras aplicveis ao pro-
blema. No exemplo de um autmato nito, a cadeia de entrada rejeitada
50
1
R
A
0
B
!
!
A
B
A B C
[r11] 0
[r4] 0
X(#1, B) !
Y() !
[r2] 1
[r6] 1
D
[r7] !
Regras 0 2 3 4 5 6 7 8 9 10
Tags H + + + - H - S R R R R R R R R E
Condies
Estado p1 g1 g1 p1 C A A B B C C C D
Smbolo 0 0 1 0 1 1 0 1 !
Prx. Est. g1 p2 p1 p2 B A B C B
Aes Get ! ! ! !
Aceita X X X !
Aes
Adaptativas
X b ! !
Y a ! !
Parmetros
p1 P g1 p1
p2 P p2 p2
Geradores g1 G
[r0]
[r3] Rejeita
[r5] Rejeita [r8] Rejeita
[r9] Aceita
#1
[r12] 0
[r13] 1
11 12 13
R R R
A #1 #1
0 0 1
#1 B A
! ! !
!
#1
B
Figura 6: Evoluo de autmato da Figura 5 aps consumir a subcadeia 0. Em
destaque, a regra r1 recm-excluda e as trs novas regras.
(NETO, 2001), enquanto em dispositivos de operao contnua (i.e., sem con-
guraes de aceitao e rejeio), esta situao indica que o problema no
era previsto pelo dispositivo. Tal comportamento impede que o dispositivo se
adapte a novos problemas, visto que nenhuma regra aplicada e, portanto,
nenhuma funo adaptativa executada.
A Tabela de Deciso Adaptativa Estendida (TDAE) uma variante da TDA
formalizada por Tchemra em 2009 em que a adaptatividade no se manifesta
unicamente durante a aplicao de uma regra, mas tambm na ausncia de
regras aplicveis: funes auxiliares so utilizadas para consultar um dispo-
sitivo auxiliar M. A soluo obtida por este dispositivo, ento, incorporada
tabela na forma de uma nova regra, permitindo que, subsequentemente, o
mesmo problema possa ser solucionado sem precisar utilizar o dispositivo se-
cundrio (TCHEMRA, 2009). O mtodo estudado por Tchemra, no caso, foi o
51
AHP (Analytic Hierarchy Process), desenvolvido por Saaty na dcada de 1970
(SAATY; VARGAS, 2000).
Tabela de Deciso
Problema
Soluo
Camada Adaptativa
Funes Auxiliares
Funes
Adaptativas
Executa regra
adaptativa
Mtodo
Multicritrio
Regra aplicvel no
encontrada
M
o
d
i

c
a

c
o
n
j
u
n
t
o

d
e

r
e
g
r
a
s
Figura 7: Diagrama conceitual de uma TDAE, ilustrando o uso das funes
auxiliares e o mtodo multicritrio auxiliar
As funes auxiliares agem como um intermedirio entre a tabela de de-
ciso subjacente e sua camada adaptativa, permitindo que operaes mais
complexas possam ser executadas - em particular, permitem o acesso a um
segundo dispositivo M - exibilizando a descrio das operaes a serem
executadas pela camada adaptativa. O elemento M, no caso, especicado
de forma genrica, podendo assumir um mtodo multicritrio qualquer. As-
sim, a TDAE poderia ser descrita como TDAE = (TDA, FM, M), onde FM
representa o conjunto de funes auxiliares.
Nota: apesar de sua concepo estar voltada para casos emque nenhuma
regra aplicvel, funes auxiliares podem, em teoria, ser chamadas por re-
gras convencionais para executar as mesmas operaes realizadas por fun-
52
es adaptativas convencionais, mas de maneira mais simples. Ainda que o
poder computacional no seja aumentado, a expressividade dos dispositivos
(i.e., facilidade de utilizao por aderncia ao problema) aumenta considera-
velmente.
Aes Adaptativas Regras
... AD
z
... r
1
... r
j
... r
n
E
C
o
n
d
i

e
s
c
1
...
c
i
Valores das condies
...
c
m
A

e
s
a
1
...
a
k
Aes a serem tomadas
...
a
p
F
.
A
u
x
i
l
i
a
r
e
sFM
1
...
FM
h
Funes auxiliares a serem chamadas
...
FM
q
F
u
n

e
s
A
d
a
p
t
a
t
i
v
a
sFAD
1
FAD
2
... Aes adaptativas a serem tomadas
...
...
FAD
z
Referncias a FAD
z
...
FAD
nf
Tabela 5: Estrutura tpica de uma tabela de deciso adaptativa estendida
(TDAE), que dene novas linhas para funes auxiliares.
A TDAE foi uma das primeiras aplicaes da adaptatividade voltada para
sistemas hbridos, em que mltiplos dispositivos, de naturezas distintas, so
integrados para realizar a tomada de deciso de forma colaborativa. Sua es-
trutura permite que umdispositivo aprenda incrementalmente comas solues
obtidas atravs dos demais, evoluindo no s atravs de computaes realiza-
das internamente - i.e., funes adaptativas pr-programadas - mas tambm
atravs de eventos externos (note que, no lugar do AHP, poderia haver um
53
operador humano, que cumpriria o papel de Orculo).
Estas contribuies so exploradas neste estudo como forma de criar
um modelo para a construo de sistemas hbridos, em que um dispositivo,
quando incapaz de solucionar um problema de forma convel, consulta ou-
tro para obter uma soluo, que ento, incorporada na forma de um novo
conhecimento.
2.1.5 Estado Atual
Atualmente, a maior parte dos trabalhos relacionados adaptatividade se
concentra na sua aplicao em diversos ramos de pesquisa, utilizando as te-
orias j consolidadas como fundamentao - note que a teoria que abrange
a adaptatividade, apesar de formalizada no caso geral em 2001, j havia sido
estudada em casos particulares desde a dcada de 1980. Linguagens natu-
rais, autmatos adaptativos, redes de Markov, aprendizagem de mquina e
tomada de deciso so exemplos de bases tericas que, hoje, so aplicadas
para uso prtico.
No campo de automao robtica, o uso da adaptatividade permite que
robs consigamnavegar emumambiente de forma autnoma atravs de aut-
matos concisos e de baixa complexidade computacional (HIRAKAWA; SARAIVA;
CUGNASCA, 2007). O estudo de processamento de linguagens naturais tam-
bm possibilita a construo de robs capazes de gerenciar dilogos homem-
mquina, demonstrando um comportamento supostamente criativo (ALFENAS;
PEREIRA-BARRETTO, 2012).
Ramos de minerao de dados tambm tem utilizado a adaptatividade
como forma de simplicar o problema de tratar um volume elevado de infor-
maes, como exemplo, na identicao de indivduos atravs de suas carac-
54
tersticas (CEREDA; NETO, 2012). Tambm se torna possvel identicar padres
atravs de operaes de convoluo, onde a escolha do ncleo da operao
feita baseada em solues anteriores (CAMARGO; RAUNHEITTE, 2011). Foi
tambm idealizado um sistema capaz de recomendar novos locais para um
indivduo visitar, baseado no contexto em que encontra (e.g., locais diferen-
tes podem ser recomendados, dependendo se o indivduo est trabalhando,
ou ento, de frias) (CRIVELARO; ROCHA, 2012). Tambm possvel extrair
um comportamento preditivo, baseado em informaes passadas, conforme
mostra o sistema adaptativo de previso de tempo descrito em (VALLE; ROCHA,
2011).
Finalmente, com o contnuo amadurecimento da adaptatividade, torna-se
possvel criar ambientes para o desenvolvimento de sistemas dotados de tc-
nicas adaptativas. Um dos primeiros exemplos conhecidos o AdapTools,
que permite criar, inspecionar e executar autmatos adaptativos de forma vi-
sual (JESUS et al., 2007). Outro exemplo, mais recente, foi o desenvolvimento
do MMAdapt (ALFENAS et al., 2012), uma plataforma de desenvolvimento de
sistemas baseados em redes de Markov adaptativas - trabalho inspirado no
sistema gerador de msicas em tempo real desenvolvido por Basseto, que
tambm faz uso de redes de Markov, mas para um uso particular (BASSETO;
NETO, 1999). Tambm se destaca a especicao de uma linguagem de pro-
gramao de alto nvel, capaz de expressar algoritmos adaptativos de forma
nativa (SABALIAUSKAS; ROCHA, 2011; SILVA, 2011). Por m, plataformas para
ns didticos tambm tem sido desenvolvidas, como forma de facilitar a intro-
duo deste tipo de tcnica em meios acadmicos (SANTIBAEZ; NETO, 2011).
55
2.2 Tomada de Deciso
Tomada de deciso um processo cognitivo em que uma ao deve ser
tomada como resposta a um estmulo externo, normalmente caracterizado por
um conjunto nito de m condies - comumente descritos como critrios ou
atributos (CROZIER; RANYARD, 1997). Normalmente, a melhor ao deve ser
escolhida dentre um conjunto nito de p alternativas, determinando aquelas
que melhor satisfazem o objetivo a ser alcanado.
Apesar de ser frequentemente mencionada em reas de pesquisa de sis-
temas especialistas - casos como medicina e sistemas gerenciais - a tomada
de deciso pode ser encontrada em situaes do prprio dia-a-dia. Como
exemplo, um problema de escolher o que vestir depende de inmeros fatores:
desde o local para onde estamos indo - vesturio para um casamento e para
ir praia so bem diferentes - at as condies climticas.
Esta seo apresenta os conceitos acerca de tomada de deciso, bem
como os aspectos psicolgicos que inuenciam a maneira com que as deci-
ses so tomadas e que, frequentemente, so difceis de serem representa-
dos em um modelo computacional.
2.2.1 Descrio
Formalmente, um problema de tomada de deciso pode ser descrito por
um vetor m-dimensional x =
_
x
[1]
, . . . , x
[m]
_
, onde x
[i]
o valor associado ao
i-simo critrio. A soluo do problema - a ao a ser tomada - dada por
uma funo y (x), particular de cada mtodo de tomada de deciso.
Tipicamente, os critrios podem ser divididos em dois tipos bsicos: nomi-
nais (tambm ditos categricos ou discretos) e contnuos (i.e. numricos):
56
Critrios nominais so aqueles que atribuem um rtulo (do ingls label )
para denir seu valor. O nmero de rtulos que podem ser atribudos
deve ser nito, e denido a priori de acordo com o atributo medido. Como
exemplo, o critrio tempo poderia assumir valores tais como ensolarado,
nublado, chuvoso, etc.
Em comparao, critrios contnuos so associados a valores numri-
cos reais. Os limites superior e inferior so normalmente impostos pela
grandeza que se est medindo. Como exemplo, o critrio temperatura
poderia assumir qualquer valor real, desde que acima de 0 K - teorica-
mente, o menor valor possvel para a temperatura.
Deve-se notar que nem todos os mtodos de classicao, tomada de de-
ciso e de aprendizagem so capazes de tratar ambos os tipos de critrios.
Como exemplo, rvores de deciso geradas pelo uso do algoritmo ID3 (QUIN-
LAN, 1986) solucionam problemas que contenham apenas atributos nominais,
ao passo que aquelas construdas atravs do algoritmo C4.5 - uma evoluo
do ID3 - lidamcomambos os tipos (QUINLAN, 1996). Emcomparao, mtodos
como SVM (Support-Vector Machines) tratam apenas problemas estritamente
numricos (CORTES; VAPNIK, 1995).
Tipicamente, os mtodos de tomada de deciso automaticamente rejeitam
problemas cujos critrios utilizam tipos no suportados. Uma forma de evitar
este problema convertendo os critrios de tipos no suportados para outros,
tratveis pelo mtodo:
Valores numricos podem ser categorizados para um conjunto nito de
valores nominais, no qual cada nome representa um intervalo do espao
numrico. Este processo conhecido como discretizao. Uma tcnica
bsica de discretizao o EWD (Equal Width Discretization) (YANG;
57
WEBB, 2002), que divide o espao de valores numricos em n bandas
de igual largura. Outros mtodos incluem o RMEP (Recursive Mini-
mal Entropy Partitioning) e mtodos de gerao de clusters (DOUGHERTY;
KOHAVI; SAHAMI, 1995).
A Figura 8 ilustra um exemplo de um espao numrico discretizado
em5 bandas, cada uma representando uma categoria do novo crit-
rio nominal. Note que a largura de cada banda do EWD se mantm
constante, enquanto no cluster, a largura depende da concentrao
de pontos.
Idealmente, prefervel utilizar mtodos capazes de determinar um
nmero timo de intervalos, bem como seus respectivos tamanhos
e posies (KOTSIANTIS; KANELLOPOULOS, 2006). De maneira geral,
tais mtodos fazem uso de informaes adicionais alm da disposi-
o espacial dos valores a serem discretizados, tal como a classe a
que cada valor pertence, tornando-os supervisionados.
O processo contrrio, em transformar um critrio nominal em numrico,
pode ser feito substituindo-o por um conjunto de critrios numricos com
valores binrios mutuamente exclusivos, cada um representando uma
de suas categorias (WITTEN; FRANK, 2005). Como exemplo, um critrio
nominal formado pelas categorias Alice, Bob e Carol d origem a 3 cri-
trios numricos binrios. Se o valor do original era Alice, o valor do
critrio numrico que representa Alice tem valor 1, enquanto os demais
recebem 0.
Mesmo mtodos que tratem ambos nativamente podem se beneciar de
uma converso: um caso estudado foi o classicador de Bayes, que produz re-
sultados melhores quando seus atributos numricos so discretizados (YANG;
58
EWD
Cluster
Label 1 Label 2 Label 3 Label 4 Label 5
Label 1 Label 2 Label 3 Label 4 Label 5
Figura 8: Exemplicao da diferena entre a discretizao via Equal Width
Discretization e clusterizao, com 5 categorias.
WEBB, 2002) - note que o classicador de Bayes precisa conhecer a distribui-
o dos valores de cada critrio numrico para operar com preciso, enquanto
esta informao torna-se menos relevante emcritrios nominais, estabilizando
a tomada de deciso.
Pode-se salientar que o problema da tomada de deciso semelhante ao
problema da classicao, uma vez que ambos descrevem a entrada como
um vetor x de m dimenses, devendo retornar um nome y (x) como resposta
- a tomada de deciso interpreta este nome como uma ao (alternativa) a,
enquanto a classicao entende que a classe c. Como exemplo, tabelas
de deciso podem ser utilizadas em problemas de classicao, enquanto
o k-Nearest Neighbor, um algoritmo tipicamente de classicao, pode ser
utilizado para tomada de deciso. Contudo, deve-se vericar que se o retorno
no um nome, mas sim, um valor numrico, o problema passa a ser de
regresso.
Por m, vale observar que a notao da funo y (x) implica que ape-
nas uma alternativa deve ser adotada como soluo, no fornecendo infor-
maes a respeito da possibilidade de as demais alternativas tambm serem
possveis solues. Uma forma de contornar este problema retornar, ao
invs de uma nica soluo com 100% de certeza, um vetor p-dimensional
= (
1
,
2
, . . . ,
p
), onde cada valor individual
i
representa a expectativa de
59
certeza da i-sima alternativa. No caso particular de haver uma nica soluo,
a alternativa adotada arg max (
1
,
2
, . . . ,
p
).
Para que as expectativas possam ser comparadas entre si de forma pa-
dronizada, o vetor deve ser normalizado - i.e., a soma de todos os elementos
deve ser 1. Logo:
p

i=1

i
= 1 (2.1)
2.2.2 Aspectos Psicolgicos da Tomada de Deciso
Ainda que considerado um processo puramente racional, a tomada de de-
ciso um processo cognitivo (BELL; RAIFFA; TVERSKY, 1988), inuencivel por
inmeros fatores mentais, tais como experincias passadas e valores pes-
soais (KOLODNER, 1991). Mesmo emoes demonstram grande inuncia,
sendo fundamentais para tomar boas decises mediante riscos ou incerte-
zas (BECHARA, 2003). Entre os fatores emocionais que podem inuenciar a
tomada de deciso, pode-se citar memria seletiva (as pessoas comumente
ignoram solues que so contrrias a seus valores (PLOUS, 1993)), inrcia
(diculdade de mudar de opinio), otimismo (CHUA et al., 2004) e preconceito.
Um exemplo pode ser encontrado no jogo do ultimato, cujas regras so
simples: um jogador, referenciado como lder, recebe um prmio da banca do
jogo. Ele deve reparti-lo com um segundo jogador, o receptor, oferecendo-lhe
uma proposta de diviso do prmio. Se o receptor aceit-la, ambos repartem
o prmio conforme combinado. Caso contrrio, se o receptor no aceitar,
ambos cam sem o prmio. Um raciocnio frio indica que, para o receptor,
mais vantajoso sempre aceitar a proposta, pois, por menor que seja a oferta,
melhor que recusar e car sem o prmio. Contudo, experimentos mostram
que ofertas consideradas injustas, em que o lder ca com a maior parte do
60
prmio, so frequentemente rejeitadas (SANFEY et al., 2003).
H tambm situaes em que o resultado no depende unicamente da
deciso do indivduo, mas das decises tomadas por terceiros. Assim, a to-
mada de deciso deve ser estratgica, de forma a confrontar estes oponentes
e visando maximizar seu ganho prprio. A esta forma de tomada de deciso,
d-se o nome de teoria dos jogos (MYERSON, 1991). Situaes modeladas
pela teoria dos jogos demonstram que a deciso considerada mais racional
nem sempre a melhor.
Um exemplo conhecido da teoria dos jogos o dilema dos prisioneiros
(POUNDSTONE, 1992). Neste dilema, imagina-se uma situao em que dois
suspeitos, A e B, so presos pela polcia e so mantidos em crceres isola-
dos, sem ter como realizar contato um com o outro. Como a polcia no tem
provas sucientes para conden-los, oferece a ambos duas opes: testemu-
nhar contra o outro prisioneiro ou manter-se em silncio. Caso um prisioneiro
testemunhe e o outro que em silncio, aquele que testemunhou libertado,
enquanto o outro preso por 1 ano. Caso ambos testemunhem, os dois so
presos por 3 meses, e por m, se ambos manterem-se em silncio, permane-
cem presos por 1 ms.
Prisioneiro B
Silncio Testemunhar
Prisioneiro A
Silncio
A: 1 ms de priso A: 1 ano de priso
B: 1 ms de priso B: sai livre
Testemunhar
A: sai livre A: 3 meses de priso
B: 1 ano de priso B: 3 meses de priso
Tabela 6: Descrio do dilema dos prisioneiros.
Como o prisioneiro deseja minimizar seu prejuzo, independentemente da
deciso do outro, a opo de testemunhar parece mais sensata, uma vez
61
que seu prejuzo, no mximo seria 3 meses de priso, enquanto no melhor
caso, caria at livre. Se ambos raciocinarem desta maneira, ambos caro
3 meses presos, enquanto, paradoxalmente, a deciso que minimiza a perda
global quando ambos se mantm em silncio, e neste caso, apenas 1 ms
de priso dada. Mesmo que os prisioneiros pudessem negociar entre si para
manter-se em silncio, nada garante que cumpririam o acordo - neste caso,
trair este acordo poderia ser muito vantajoso para sair livre (MULLEN, 1990).
Outro aspecto psicolgico capaz de afetar a tomada de deciso a aver-
so ao risco. Em geral, as pessoas preferem tomar decises que sejam mais
estveis do que arriscar uma deciso em que existe a possibilidade de ha-
ver uma perda ou reduo de ganhos (KAHNEMAN; TVERSK, 1979). Um caso
simples uma aposta com uma moeda, em que um jogador tem duas possi-
bilidades: ganhar $100 imediatamente ou ento, apostar em um jogo de cara
ou coroa em que, caso ganhe, levar $300, mas se perder, nada receber.
Teorias normativas levariam a escolher a aposta, j que, na mdia, o lucro
seria de $150, mas na prtica, os jogadores preferem no arriscar e levam os
$100 (MULLEN, 1990).
Por m, um ponto de importncia relevar a idade de uma informao
durante a tomada de deciso. Assim como a inercia diculta a mudana de
opinio quando uma informao consolidada no conhecimento (i.e., eventos
mais antigos tm maior importncia em relao a informaes mais novas), h
casos em que as pessoas, por intuio, acabam dando mais valor para even-
tos mais recentes, ignorando ou at mesmo se esquecendo de eventos mais
antigos (PLOUS, 1993). Este comportamento permite que a tomada de deciso
se adeque a situaes em que os conceitos se alterem ao longo do tempo -
a esta propriedade d-se o nome de desvio de conceito (concept drift ). Caso
estas mudanas no sejam levadas em considerao, a taxa de acerto de um
62
sistema de tomada de deciso acaba se deteriorando ao longo do tempo. No
entanto, detectar tais mudanas no trivial, uma vez que elas podem ocorrer
pontualmente, gradativamente ou abruptamente. Podem at mesmo ser con-
fundidas com rudo ou caso raro (KUNCHEVA, 2009). Levar em conta o desvio
de conceito implica no s a necessidade de aprendizagem, mas tambm de
um meio de se esquecer um conhecimento obsoleto - processo ainda pouco
explorado.
Na rea computacional, um dos desaos a serem superados o desen-
volvimento de um modelo de tomada de deciso semelhante ao do homem,
capaz de considerar estes aspectos durante as fases de aprendizado e exe-
cuo. Devido sua complexidade, estudos passados exploram aspectos
individuais para obter novos modelos de deciso. Em particular, um aspecto
considerado na presente dissertao o nvel de conana dado a uma infor-
mao conhecida, e como utiliz-lo para tomar decises melhores, evitando
utilizar informaes pouco conveis.
2.2.3 Nvel de Conana
Tipicamente, processos computacionais de tomada de deciso partem do
pressuposto de que o conhecimento analisado correto, dispensando assim
sua validao. Apesar de operar bem para informaes obtidas via treina-
mento, esta premissa torna-se menos atraente para informaes obtidas atra-
vs de outros meios em que a veracidade da informao no possa ser ve-
ricada por completo. Humanos, naturalmente, tm uma crena de que a in-
formao correta, e a utilizam para avaliar se a informao pode ou no ser
utilizada de forma segura. Segundo Parsloe (PARSLOE; WRAY, 2000), dentre os
fatores que afetam esta conana, destacam-se:
63
Repetio: uma armao repetida mltiplas vezes torna-se mais facil-
mente aceita como verdadeira;
Realimentao: opinies (favorveis ou contrrias) de agentes externos
podem interferir na forma como cada um v o problema;
Opinio prpria: cada indivduo pode possuir uma opinio formada so-
bre a soluo de um problema, seja ela por convico prpria, por des-
conhecimento de outra alternativas, ou por observaes empricas.
De maneira geral, quanto mais repetimos uma ao em relao a um de-
terminado problema, mais acreditamos que tal ao seja a mais adequada. A
este comportamento, d-se o nome de vis de repetio (repetition-bias). Opi-
nies contrrias, por outro lado, nos ajudam a evitar que a aplicao de uma
ao inadequada seja repetida no futuro (PARSLOE; WRAY, 2000). O inverso
tambm verdade: reforar uma opinio um incentivo para continuar com a
crena de que tal opinio seja a correta.
Estudos passados sugerem que o nvel de conana possa ser modelado
em funo das realimentaes (feedbacks) positivas e negativas recebidas.
Einhorn sugere que a conana C de uma informao uma funo base-
ada na soma F das realimentaes recebidas para tal informao (EINHORN;
HOGARTH, 1978):
_

_
C = f (F)
F =
+
N
+
+

+
+

= 1.0 (
+
,

1.0)
(2.2)
Neste modelo, os valores de N
+
e N

so acumuladores de realimenta-
es positivas e negativas, respectivamente. J
+
e

so valores relativos
64
de reforo, que ponderam a inuncia de cada tipo de realimentao. A fun-
o f (F) no foi denida originalmente, mas espera-se que seja uma funo
que retorne uma conana baixa quando F 0, e devendo saturar em 1.0
quando [F[ . Caso F > 0, a conana ser de que a informao esteja
correta, enquanto F < 0 indica que a conana de que a informao esteja
incorreta. Note que F representa um estimador das experincias obtidas atra-
vs das realimentaes originadas a partir do uso da informao em questo
(EINHORN; HOGARTH, 1978).
Alm da quantidade de realimentaes recebidas, outros dois fatores com
forte inuncia no nvel de conana so a credibilidade da fonte da realimen-
tao e a intensidade com que a realimentao realizada - quanto maiores
os efeitos causados por um evento, mais forte ser a evidncia a ser reali-
mentada (GRIFFIN; TVERSKY, 1992). Em geral, eventos de alta intensidade e
baixa credibilidade causam excesso de conana, e ento, um indivduo su-
perestima a possibilidade de estar certo. Do contrrio, evidncias de baixa
intensidade e alta credibilidade fazem com que a possibilidade de estar certo
que subestimada.
Posteriormente, um experimento realizado por Westbrook, Gosling e Co-
lera demonstra a diculdade de relacionar o nvel de conana com a possibili-
dade de se estar correto, uma vez que nada impede que o tomador de deciso
cone nas evidncias que o levem a uma resposta incorreta, mesmo que ele
prprio seja especialista no assunto - no caso, mdicos, clnicos e enfermeiros
(WESTBROOK; GOSLING; COIERA, 2005). Neste mesmo trabalho foi observado o
efeito do excesso de conana, em que mdicos - quando comparados com
enfermeiros - subestimavam a possibilidade de estarem errados.
O uso de realimentaes para moldar a conana de um resultado pode
ser encontrado em determinadas aplicaes que fazem uso de aprendizagem
65
de mquina. Um exemplo o CBIR (content-based image retrieval ), um sis-
tema de busca de imagens que faz uso de feedbacks dos usurios para renar
sua pesquisa, retornando os resultados que sejam mais relevantes e elimi-
nando possveis erros (DING; LI; YANG, 2004). Contudo, deve-se ressaltar que
no existe um modelo formal e consolidado de como modelar a conana atra-
vs de recursos computacionais, ainda que modelos individuais tenham sido
formalizados.
2.3 Raciocnio Baseado em Casos
Case-Based Reasoning (raciocnio baseado em casos, ou CBR) um pa-
radigma de resoluo de problemas emque, diferentemente das tcnicas cls-
sicas de inteligncia articial - estas fazem uso de um conhecimento voltado
ao domnio do problema - utilizam-se informaes obtidas atravs de expe-
rincias passadas (AAMODT; PLAZA, 1994). Novos problemas so soluciona-
dos buscando casos passados similares, e reutilizando suas solues (SMYTH;
CUNNINGHAM, 1992), partindo do princpio que problemas semelhantes devem,
de alguma forma, apresentar solues tambm semelhantes.
Estudos realizados indicam que o uso de experincias passadas tem
grande importncia na tomada de deciso humana, especialmente no incio de
um novo aprendizado, quando ainda no se tem uma compreenso adequada
do problema (ANDERSON, 1983). Mesmo processos como inferncia por analo-
gia aparentam fazer uso de casos passados para solucionar novos problemas
(GENTNER, 1983). Evidncias empricas tambm indicam que, na ausncia
de informaes concretas, o uso de casos conhecidos uma das aes mais
frequentes para tomar uma deciso (BALAKRISHNAN; RATCLIFF, 1996). Por m,
problemas tipicamente pessoais, como os encontrados no cotidiano, de senso
comum e de julgamento esttico, tambm so solucionveis aplicando-se a
66
tcnica de raciocnio baseado em casos (KOLODNER, 1991).
Outra importante caracterstica desta forma de raciocnio a possibilidade
de se realizar um processo de aprendizado incremental, no qual experincias
so agregadas uma de cada vez, tornando-as disponveis para novos proble-
mas (AAMODT; PLAZA, 1994). Schank j idealizava uma memria dinmica que
permitia agregar conhecimento de forma incremental (SCHANK, 1982). Gker
inclusive verica que a aquisio incremental permite que o mtodo se adapte
a problemas dinmicos, para os quais solues previamente aceitas podem
car obsoletas aps um intervalo sucientemente grande de tempo (GKER;
ROTH-BERGHOFER, 1999).
Em termos de metodologia, o raciocnio baseado em casos pode ser di-
vidido em quatro etapas (AAMODT; PLAZA, 1994), conforme ilustra a Figura 9.
Estas etapas so referenciadas como 4R em funo das iniciais de seus res-
pectivos nomes:
1. Retrieve - Busca de casos semelhantes ao problema a ser solucionado.
Um caso tipicamente formado pelo problema previamente encontrado
e a soluo adotada;
2. Reuse - Reuso e adaptao dos casos passados para que sejam com-
patveis com o novo problema. No caso mais simples, pode-se simples-
mente reutilizar as solues encontradas diretamente, sem adapt-las;
3. Revise - Aplicar a soluo adotada e, se possvel, revis-la, eliminando
possveis efeitos indesejveis encontrados na soluo;
4. Retain - Se a soluo adotada avaliada como til, ela pode ser in-
tegrada ao conhecimento j adquirido, tonando-se uma nova referncia
para a resoluo de problemas futuros.
67
Apren-
dizado
Novo
Problema
Casos
Conhe-
cidos
Novo
Problema
Caso
Similar
1. Retrieve
2. Reuse
3. Revise
4. Retain
Soluo
Soluo
Revisada
Problema
Soluo
Sugerida
Soluo
Conrmada
Busca por casos
semelhantes
Reutilizar e
adaptar os casos
Avaliar a soluo
sugerida
Armazenar nova
soluo
Figura 9: Ciclo de vida 4R (Retrieve, Reuse, Revise e Retain) do CBR.
Note que as duas ltimas etapas, ainda que desejveis, no so indispen-
sveis para seu funcionamento, apesar de que sua ausncia poderia ocasio-
nar uma perda da capacidade evolutiva. Outras denies, como a apresen-
tada por Leake, Kinley e Wilson (LEAKE; KINLEY; WILSON, 1995), utilizam ape-
nas as duas primeiras etapas, sob os nomes de Memory Search e Adaptation,
respectivamente.
Para que a busca seja feita, contudo, torna-se necessrio criar uma m-
trica que estime a similaridade entre dois casos, o que pode ser dependente
do domnio do problema a ser solucionado. De forma parecida, adaptar os
casos encontrados requer algum conhecimento do problema, apesar de que,
no caso mais simples, seja possvel utilizar a soluo diretamente, sem adap-
68
taes.
Revisar uma soluo adotada tambm apresenta certas imposies: nem
sempre possvel certicar-se de que a soluo proposta foi realmente ade-
quada, uma vez que pode haver uma latncia at que eventuais efeitos co-
laterais causados pela soluo se manifestem (BAKKEN, 1993). Tambm
preciso levar em considerao a forma como a avaliao deve ser feita, j que
ela pode ser realizada por diversos agentes, desde inteligncia articial at
operadores humanos (ou experts), cada qual com diferentes graus de credi-
bilidade e disponibilidade. Assim, antes de a aquisio de novos casos ser
feita, o mtodo de raciocnio baseado em casos deve ser alimentado com in-
formaes sobre o quo convel e correta a nova soluo , a m de evitar
um aprendizado errneo. Este aspecto abordado na seo 2.2.3.
2.4 Aprendizagem de Mquina
Aprendizagem de mquina um ramo da inteligncia articial orientado
para o desenvolvimento de algoritmos que permitam que sistemas computa-
cionais consigam evoluir atravs da aquisio de novas informaes ao longo
do tempo. Evoluir, neste caso, signica que seu desempenho deve melhorar
medida que novas informaes so incorporadas ao conhecimento. Uma
denio frequentemente utilizada a que foi proposta por Mitchell:
A computer program is said to learn from experience E with respect
to some class of tasks T and performance measure P, if its perfor-
mance at tasks in T, as measured by P, improves with experience
E (MITCHELL, 1997).
Tipicamente, aprendizagem de mquina se traduz na tarefa de compilar
dados obtidos empiricamente, organizando e extraindo informaes teis e
69
gerando uma abstrao que represente, de forma compacta, a informao
contida na massa de dados original (e.g., rvore de deciso). Este processo
comumente referenciado como inferncia, e pode ser identicado em duas
vertentes clssicas:
O aprendizado pode ocorrer atravs de um treinamento supervisio-
nado, em que um conjunto de instncias rotuladas utilizado como en-
trada - conforme ilustrado pela Figura 10. Cada instncia formado por:
Um vetor de caractersticas (feature vector ) x =
_
x
[1]
, , x
[m]
_
, em
que x
[i]
o valor associado ao i-simo critrio;
Uma alternativa (sada ou rtulo) esperada a. Instncias com alter-
nativas conhecidas so chamadas de rotuladas.
A partir deste conjunto de treinamento (tambm chamado de batch),
deve-se inferir a relao entrada-sada, resultando na criao de uma
abstrao representada pela funo y (x) que retorna a alternativa cor-
respondente para o vetor x.
De forma contrria, aprendizado no supervisionado no especica um
rtulo para cada instncia. O objetivo da inferncia, neste caso, no
encontrar uma abstrao que represente a relao entrada-sada - at
porque os dados no so rotulados. A meta encontrar padres e/ou
estruturas escondidas dentro das instncias, que possam conter algum
signicado antes desconhecido. Gerao de clusters um exemplo cls-
sico deste tipo de aprendizagem.
Na maior parte dos sistemas de apoio deciso, a inferncia da abstra-
o inicial feita a partir de um treinamento supervisionado, fazendo uso de
instncias obtidas de medidas reais, ou ento, fornecidas por um especialista.
70
Inferncia
Compilao Abstrao
Tomada de Deciso
Nova Instncia
Instncia + Soluo
Aprendizado Incremental
Base de
Dados
Caso
Treinamento
Batch
Figura 10: Relao entre aprendizado supervisionado e a tomada de deciso.
A avaliao do sucesso de um treinamento pode ser feita testando a abstra-
o recm-criada com um conjunto de instncias rotuladas. Um acerto ocorre
quando a soluo estimada por y (x) coincide com a soluo verdadeira a. A
taxa de acerto obtida nesta avaliao fornece uma medida objetiva da quali-
dade do aprendizado realizado (WITTEN; FRANK, 2005).
Em contrapartida, o aprendizado no supervisionado pode ser utilizado
para encontrar lacunas deixadas pela abstrao inicial, buscando relaes
entre as instncias cuja soluo no pode ser obtida. Um padro encontrado
nesta etapa pode signicar uma nova alternativa, antes no conhecida ou no
especicada pelo treinamento inicial.
2.4.1 Aprendizado Online
Classicamente, sistemas de classicao, regresso e de tomada de deci-
so so treinados utilizando-se um batch - conjunto de instncias j rotuladas
com sua alternativa esperada. A inferncia da abstrao feita buscando-se
71
um padro que possa representar, de forma simplicada, o conjunto original
de instncias, com um erro mnimo nas respostas.
Porm, apesar de ser simples e direto, esse mtodo no permite que a
abstrao seja atualizada durante sua execuo, impedindo-a de tratar proble-
mas dinmicos, cujos conceitos so variveis ao longo do tempo (KUNCHEVA,
2009). A nica maneira de mant-la atualizada refazendo todo o processo
de treinamento, desta vez utilizando um conjunto de instncias mais recente.
Devido ao alto custo computacional envolvido neste tipo de operao, no
vivel executar esta tarefa com o sistema em atividade, fazendo-se necess-
rio construir um novo sistema para substituir o anterior. Por ocorrer fora do
ciclo normal de execuo do sistema, este aprendizado categorizado como
ofine.
Em contrapartida, aprendizado online um paradigma de aprendizagem
em que, ao invs de utilizar um batch para treinamento, permite que as instn-
cias rotuladas sejam fornecidas uma de cada vez. Apesar de serem conceitu-
almente mais complexos e desaadores, sistemas treinados atravs deste pa-
radigma podem receber atualizaes de forma incremental medida que no-
vas instncias foremsendo disponibilizadas (BABENKO; YANG; BELONGIE, 2009).
O aprendizado online especialmente atraente para sistemas com uxo con-
tnuo de dados, em que a resposta do sistema no instante seguinte depende
fortemente das respostas nos instantes anteriores, fazendo-se necessrio que
o sistema se mantenha sempre atualizado (e.g., rastreamento visual de obje-
tos).
O estudo de algoritmos com capacidade de aprendizado incremental re-
lativamente recente, concentrando-se na adaptao de algoritmos clssicos
para que realizem um aprendizado online. Um exemplo conhecido o ITI
(Incremental Tree Inducer ), que, ao contrrio de tcnicas como ID3 e C4.5,
72
permite construir rvores de deciso atualizveis, apresentando operaes de
inserir e remover instncias (UTGOFF; BERKMAN; CLOUSE, 1997). Outro exem-
plo a verso online do popular Random Forest, que permite inserir novos ns
durante sua execuo (SAFFARI et al., 2009). Todavia, apresenta uma limitao
de trabalhar apenas com valores numricos, ao contrrio do mtodo original,
que tambm permite o uso de critrios nominais.
Outros exemplos incluem verses online do SVM (Support Vector Ma-
chine), AdaBoost e MIL (Multiple Instance Boosting) (SAFFARI et al., 2009).
Note que o termo online costumeiramente utilizado em mtodos que, em
sua verso original, no apresentam comportamento incremental. Assim, no
comum utilizar este termo para algoritmos como classicador de Bayes ou
k-Nearest Neighbor, que so incrementais por natureza.
2.4.2 Lazy Learning e Eager Learning
O processo de aprendizagem tambm pode ser categorizado pela forma
com que os dados de treinamento so utilizados para criar a inferncia:
O termo eager learning utilizado para caracterizar os mtodos de
aprendizado que buscam ativamente inferir sua abstrao do conheci-
mento a partir das instncias rotuladas de treinamento, disponibilizando-
a antes do incio da execuo do sistema. Em geral, abstraes deste
tipo so globais, i.e., atende a todas as instncias de entrada da mesma
forma, sem se adequar a cada uma delas.
Em contrapartida, mtodos do tipo lazy learning postergam a inferncia
at que ela seja necessria durante a execuo do sistema (HENDRICKX;
BOSCH, 2005). Esta caracterstica permite que a inferncia seja local,
moldada para o problema a ser solucionado, mas requer manter todas as
73
instncias armazenadas em uma base de conhecimento, demandando
um espao maior para armazen-las em relao ao espao tpico ocu-
pado por uma abstrao.
Por no manter uma abstrao global, mtodos do tipo lazy learning po-
dem ser adaptados com certa facilidade para apresentar aprendizado incre-
mental, visto que as abstraes so reconstrudas para cada problema a ser
solucionado. Assim, para disponibilizar uma nova informao para os prxi-
mos problemas, basta inseri-la na base de conhecimento. Emparticular, mto-
dos baseados em instncias (IBL - Instance-Based Learning) sequer mantm
uma abstrao formal, limitando-se a consultar sua base de conhecimento
para obter solues de problemas passados que se assemelhem ao problema
a ser solucionado. Exemplos de mtodos IBL incluem o k-Nearest Neighbor
(AHA; KIBLER, 1991) e K* (CLEARY; TRIGG, 1995).
No entanto, adicionar capacidade incremental em mtodos de aprendi-
zado do tipo eager learning mostra-se uma tarefa mais complexa, j que se
torna necessrio dar manuteno a uma abstrao global de forma dinmica.
No existe uma regra simples para que esta manuteno seja feita, visto que
ela depende da estrutura da abstrao, e deve ser desenvolvida especica-
mente para cada mtodo em particular. Devido a esta diculdade, a maior
parte dos mtodos online costuma ser uma variante de um mtodo do tipo
eager que, originalmente, s trabalhava com treinamento via batch (note que
grande parte dos mtodos lazy incremental por padro e no so categori-
zados como online por no existir uma verso ofine).
74
2.4.3 Consideraes
Um aspecto pouco explorado nas publicaes disponveis o processo
de esquecer informaes j armazenadas. Apesar de ser visto como um ele-
mento indesejvel, seu bom uso facilita a tarefa de dar manuteno a um
sistema, eliminando informaes irrelevantes ou incorretas que possam redu-
zir seu desempenho (MARKOVITCH; SCOTT, 1988; SMYTH; KEANE, 1995). Este
aspecto torna-se vital em sistemas que devem lidar com incertezas, nos quais
a possibilidade de absorver informaes errneas no desprezvel.
Experimentos empricos tambm demonstram que o valor de uma informa-
o varia de acordo com o conhecimento j adquirido: sua inuncia pode ser
tanto positiva quanto negativa, em funo do conhecimento previamente acu-
mulado. So trs as principais estratgias para tratar informaes negativas:
ignorar o problema, evitar que estas informaes negativas sejam inseridas,
ou remove-las do sistema assim que identicadas como negativas (MARKO-
VITCH; SCOTT, 1988). Porm, o valor de uma informao dicilmente pode ser
medida no momento em que ela adquirida, o que torna mais conveniente
remover uma informao assim que sua no validade seja conrmada.
No entanto, so poucos os algoritmos que permitem a remoo de in-
formaes j armazenadas - a maioria opta por ignorar o problema comple-
tamente. Nem mesmo os mtodos de aprendizado online apresentam, ne-
cessariamente, este tipo de funcionalidade (e.g., o Online Random Forest de
Saffari permite apenas operaes de expanso nas suas rvores (SAFFARI et
al., 2009)).
Alm disso, vale notar que nem sempre trivial vericar a validade de
uma informao, o que diculta a distino entre aquelas que so favorveis
ou contrrias, conforme citado na seo 2.3. Logo, torna-se difcil impedir que
75
informaes no vlidas acabem sendo incorporadas, o que refora a neces-
sidade de um mtodo de excluso de informaes previamente memorizadas.
2.5 Mtodos de Tomada de Deciso
Aps a introduo dos principais conceitos aqui utilizados, segue abaixo
a descrio dos algoritmos de tomada de deciso diretamente empregados
adiante.
2.5.1 k-Nearest Neighbor
O k-Nearest Neighbor (k-NN) um mtodo de classicao de objetos
baseado em uma mtrica de distncia que avalia a proximidade entre o objeto
a ser classicado e os objetos conhecidos (i.e., com classicao conhecida).
Partindo do pressuposto que objetos semelhantes devempossuir classicao
semelhante, o classicador k-NN busca os k vizinhos mais prximos do novo
objeto, e conta o nmero de ocorrncias com que cada classicao aparece
neles - aquela com maior frequncia ser atribuda ao novo objeto. Para o
caso particular k = 1, o novo objeto classicado da mesma forma que o
objeto mais prximo.
O funcionamento deste algoritmo depende de trs elementos fundamen-
tais (WU et al., 2007):
Um conjunto de instncias rotuladas a ser utilizado para comparao;
Uma mtrica para computar a distncia entre dois objetos;
O valor de k, ou seja, o nmero de vizinhos mais prximos a serem
considerados pelo algoritmo.
76
A denio e o uso destes elementos pelo k-NN e suas variantes so
descritos nas sees seguintes.
2.5.1.1 Denio
Em sua forma original (LIU; CHAWLA, 2011), a classicao de um novo
objeto x expresso por:
y (x) = arg max
cc
1
,...,c
p
k

i=1
I (a
i
= c) (2.3)
em que I (a
i
= c) a funo indicadora, que retorna 1 se a classicao a
i
da instncia x
i
c, caso contrrio, retorna 0. Assim, a classicao da nova
instncia aquela que ocorre com maior frequncia entre os k vizinhos mais
prximos.
A Figura 11 ilustra um exemplo de classicao via k-NN, onde o pent-
gono o objeto a ser classicado. Note que, com k = 3, o novo objeto ser
classicado como (so dois crculos para apenas uma estrela), enquanto
com k = 5, a classicao muda para (3 estrelas para 2 crculos). Este
problema evidencia a importncia da escolha do valor de k: valores pequenos
so sensveis a rudos, enquanto valores elevados dicultam a distino das
fronteiras entre as classes. Embora, informalmente, utiliza-se k =

n, onde n
o nmero de instncias rotuladas, mtodos como validao cruzada (cross-
validation) so preferveis para a determinar um valor timo para k (KOHAVI,
1995; OUYANG; LI; LI, 2006).
A denio original do k-NN, contudo, no considera o grau de seme-
lhana entre dois objetos: supostamente, quanto menor a distncia entre dois
objetos, maior ser a probabilidade de apresentarem a mesma classicao.
Porm, pela denio, os k vizinhos so tratados de forma idntica, no im-
porta sua distncia at o novo objeto. Uma extenso popular do k-NN inserir
77
?
k=3
k=5
Figura 11: Exemplo de classicao k-NN, onde o objeto central (pentgono)
o objeto a ser classicado.
uma funo de ponderao:
y (x) = arg max
cc
1
,...,c
p
k

i=1
I (a
i
= c) w(x, x
i
) (2.4)
tal que w(x, x
i
) uma funo que pondera a inuncia de x
i
pela sua distncia
at o objeto x a ser classicado (o peso deve aumentar conforme a distncia
diminui). Dentre as funes de ponderao conhecidas, destacam-se o m-
todo de Shepard (SHEPARD, 1968) e a funo de similaridade (LIU; CHAWLA,
2011), ilustrados pelas equaes (2.5) e (2.6), respectivamente:
w(x, x
i
) =
1
d (x, x
i
)
P
(2.5)
w(x, x
i
) = 1
d (x, x
i
)
d
max
(2.6)
Nota: ao utilizar a ponderao, nem sempre a classicao mais nume-
rosa a escolhida. Como exemplo, caso o problema da Figura 11 fosse so-
lucionado com k = 5 utilizando ponderao, a classicao do novo objeto
78
poderia passar de para , pois os dois crculos esto muito mais prximos
do novo objeto que as trs estrelas.
Nestas equaes, d (x, x
i
) uma funo que calcula a distncia entre dois
conjuntos de valores x e x
i
, enquanto d
max
um fator de normalizao para
que a distncia esteja no intervalo [0 . . . 1]. Classicamente, utiliza-se a distn-
cia Euclidiana para esta nalidade. Para um espao com m critrios, ela
representada por:
d (a, b) =

_
m

j=1

a
[j]
b
[j]

2
(2.7)
A distncia euclidiana, contudo, exige que o espao tambm seja Euclidi-
ano - apenas valores numricos podem ser atribudos em cada critrio. Alm
disso, como estes valores podem assumir ordens de grandeza diferentes, a
inuncia de cada critrio sobre o valor da distncia acaba sendo desigual.
Uma forma de mitigar este problema efetuar uma normalizao da distn-
cia, uniformizando a contribuio de cada critrio j:
d (a, b) =

_
m

j=1
d
j
(a, b)
2
m
(2.8)
d
j
(a, b) =

a
[j]
b
[j]

d
j max
(2.9)
onde d
j
(a, b) representa a distncia normalizada entre os vetores a e b no j-
simo critrio, enquanto d
j max
a mxima distncia observada neste critrio.
A denio da equao (2.9) ainda exige que os valores de cada critrio
sejam numricos para que sua diferena seja calculada. Para valores nomi-
nais, uma possibilidade utilizar a Overlap Metric (LI; LI, 2010), representada
por (a
j
, b
j
). Como o nome sugere, esta funo calcula a sobreposio de
dois valores nominais. Esta distncia deve ser zero para valores idnticos, e 1
79
para valores distintos:
d
j
(a, b) =
_
a
[j]
, b
[j]
_
=
_

_
0 se a
[j]
= b
[j]
1 se a
[j]
,= b
[j]
(2.10)
Esta mtrica, contudo, no faz uso de informaes adicionais sobre os
valores - como exemplo, no relaciona como cada classicao inuenciada
pelos valores de cada critrio. Este tipo de informao permitiria estimar uma
distncia de forma mais precisa do que meramente vericando a sobreposio
de valores. Um exemplo mais sosticado a Value Difference Metric (LI; LI,
2010):
d
j
(a, b) =
p

c=1

P
_
c[a
[j]
_
P
_
c[b
[j]
_

(2.11)
onde P
_
c[a
[j]
_
a probabilidade da classicao de a ser c, dado que seu
valor para o j-simo critrio a
[j]
. Este valor pode ser obtido conhecendo-
se a frequncia com que cada classicao aparece quando uma instncia
aparece com o valor a
[j]
.
2.5.1.2 Custo Computacional
Por ser um mtodo baseado em instncias, a complexidade computacional
temporal do algoritmo k-NN depende fortemente do desempenho da busca
utilizada para localizar os vizinhos mais prximos. Em uma busca linear, seria
necessrio calcular a distncia entre todas as instncias rotuladas e a nova
instncia, tornando-a computacionalmente custosa medida que o nmero de
instncias armazenadas aumenta. Por outro lado, por no manter abstraes
compactas do conhecimento, o problema de manter a base de conhecimento
atualizada se reduz a um problema de insero e remoo de instncias na
base de conhecimento.
80
Uma tcnica muito empregada para reduzir o custo temporal da busca
o particionamento espacial, onde estruturas computacionais (e.g., rvores
e clusters) so utilizadas para dividir o espao em um conjunto nito de es-
paos (normalmente, disjuntos), permitindo que a busca pelos vizinhos mais
prximos seja feito localmente, dentro do sub-espao em que se encontra
ou em sub-espaos prximos, removendo a necessidade de avaliar todo o
espao. Apesar das tcnicas de particionamento estarem mais bem consoli-
dadas em problemas puramente numricos (e.g., k-d tree (BENTLEY, 1975) e
R*-Tree (BECKMANN et al., 1990)), novas tcnicas tem sido desenvolvidas para
tratar critrios nominais (BOULL, 2004; KIBRIYA; FRANK, 2007). Vale ressal-
tar que, atravs da discretizao, problemas numricos tambm podem ser
particionados atravs deste tipo de tcnica.
A Figura 12 ilustra uma R*-Tree, em que os pontos conhecidos so estru-
turados em uma rvore, tal que as folhas representam os pontos, e os ns,
o menor sub-espao (bounding box) que contm todos os pontos presentes
em sua sub-rvore. A busca nesta rvore se resume a percorrer a rvore,
visitando apenas os ramos prximos (i.e., com pequeno valor de distncia)
ao ponto utilizado como critrio de busca e evitando ramos afastados. Este
processo mais eciente do que efetuar uma busca linear. Neste exemplo, a
busca com k = 3 s percorre os ramos r13 e r31.
2.5.1.3 Consideraes
A popularidade do algoritmo k-NN fez com que seus resultados (e.g., taxa
de acerto e tempo de resposta) sejam frequentemente utilizados como refe-
rncia para novos algoritmos, e, de forma geral, apresenta boa taxa de acerto,
apesar de que mtodos mais modernos, como random forests e boosted trees
(CARUANA; NICULESCU-MIZIL, 2006), apresentam melhores taxas de acerto e
81
?
r1
r2
r3
r11
r12
r13
r21
r22
r23
r32
r31
Raiz
r1 r2 r3
r11 r12 r13 r21 r22 r23 r31 r32
...
Vetor x
(x
1
, x
2
, ... x
m
)
Alternativa: 1
Dados
armazenados em
cada folha
Folhas
Figura 12: Representao grca de uma R*-Tree. A aplicao do k-NN pode
ser feita visitando apenas parte dos pontos conhecidos - representados espa-
cialmente por um vetor x.
82
custos computacionais menores, ainda que no estejam na mesmo nvel de
consolidao e maturidade.
As variantes deste algoritmo reetem as pesquisas realizadas nas pocas
em que cada uma delas foi concebida. Como exemplo, destaca-se o uso de
lgica fuzzy para tratar dados cuja expectativa de certeza de uma classe pode
assumir valores reais - de 0 a 1 (KELLER; GRAY; GIVENS JR., 1985). Reduo do
espao de instncias rotuladas (i.e., condensar um conjunto de instncias em
um conjunto menor, mas que represente aproximadamente a mesma informa-
o) outra rea de estudo deste algoritmo (WU et al., 2007). O estudo do
tratamento de incertezas tambm impulsionou o desenvolvimento de varian-
tes que lidam com informaes cuja veracidade no completa ou vericvel
(ZHANG et al., 2010). O estudo de algoritmos de clusters baseados em densi-
dade - e.g., DBSCAN (ESTER et al., 1996) e OPTICS (ANKERST et al., 1999) -
tambm teve inuncia na criao de variantes que utilizem a densidade das
instncias como forma de calcular a distncia entre instncias, conrme ex-
plicado em (VOULGARIS; MAGOULAS, 2008). A Figura 13 ilustra um exemplo
de busca baseada em densidade, em que a estrutura espacial dos objetos
levada em considerao.
2.5.2 Classicador de Bayes
O classicador de Bayes um mtodo de classicao que estima qual
deve ser a classe de um determinado vetor x de caractersticas baseando-se
em tcnicas probabilsticas. Caso seja conhecida a probabilidade P
_
x
[i]
[c
_
de
um valor x
[i]
qualquer (associado ao i-simo critrio) ocorrer em instncias de
classe c, possvel estimar qual a classe mais provvel do vetor de entrada
(AKAHO, 2001). Porm, P
_
x
[i]
[c
_
raramente conhecido, sendo comumente
estimado atravs das instncias de treinamento, calculando a frequncia rela-
83
?
Figura 13: Comparao entre o k-NN clssico (linha contnua) e o k-NN base-
ado em densidade (linha tracejada).
tiva com que cada valor x
[i]
aparece nas instncias que possuem classicao
c.
Apesar de ser uma das formas mais antigas de classicao, sua sim-
plicidade muito atraente para uso em vrios campos, como, por exemplo,
classicao de textos e ltros de spam (WU et al., 2007). Sua construo no
depende de iteraes ou estimativa de parmetros, o que simplica o processo
de treinamento. Sua execuo igualmente simples e de fcil interpretao,
e ainda assim, mantm-se robusto para grande parte dos problemas.
2.5.2.1 Denio
Pela teoria de Bayes, a probabilidade de a alternativa c ser soluo de uma
instncia com valores x dada pela equao (2.12):
P (c[x) =
1
Z (x)
P (c)
m

i=1
P
_
x
[i]
[c
_
(2.12)
84
tal que P (c) a probabilidade a priori de c ser soluo de qualquer vetor de
caractersticas (este valor pode ser estimado vericando a porcentagem das
instncias que tm c como soluo). J P
_
x
[i]
[c
_
a probabilidade de o valor
x
[i]
aparecer no i-simo critrio quando uma instncia qualquer tem c como
soluo, e difere de acordo com o tipo do critrio. Para critrios nominais, sua
estimativa feita calculando a porcentagem dos problemas que contm x
[i]
,
dentre aqueles que tm a alternativa c como soluo.
No caso de o critrio ser numrico, o clculo depender do tipo da distri-
buio que caracteriza o critrio. Como exemplo, para a distribuio normal,
utiliza-se:
P
_
x
[i]
[c
_
=
1
_
2
2
ic
e

(
x
[i]

ic)
2
2
2
ic
(2.13)
onde
ic
a mdia e
ic
o desvio padro do valor do i-simo critrio, consi-
derando apenas instncias cuja soluo c. Na prtica, porm, mais comum
discretizar critrios numricos para evitar o uso de funes dependentes da
distribuio, conforme descrito na seo 2.2.1.
A funo Z (x) um fator de normalizao, comumente conhecido como
evidncia, que garante que a soma das probabilidades P (c
j
[x) de cada solu-
o c
j
seja igual a 1. Assim:
Z (x) =
s

j=1
_
P (c
j
)
m

i=1
P
_
x
[i]
[c
j
_
_
(2.14)
A partir destes dados, o classicador de Bayes retorna a soluo de maior
probabilidade:
y (x) = arg max
cc
1
,...,c
p
1
Z (x)
P (c)
m

i=1
P
_
x
[i]
[c
_
(2.15)
Na maior parte dos casos, no necessrio calcular a evidncia direta-
mente, uma vez que, por ser um fator de escala positivo, no altera a escolha
85
feita pelo operador arg max. Logo:
P (c[x) P (c)
m

i=1
P
_
x
[i]
[c
_
(2.16)
y (x) = arg max
cc
1
,...,c
p
P (c)
m

i=1
P
_
x
[i]
[c
_
(2.17)
2.5.2.2 Extenses
A popularidade e simplicidade do classicador de Bayes o torna muito re-
ceptivo incorporao de extenses e modicaes que possam melhorar
seu desempenho em determinadas situaes (WU et al., 2007). Em especial,
grande parte destas extenses busca tratar a questo da independncia dos
critrios, ignorada pelo classicador original.
O AODE (Averaged One-Dependence Estimators) um exemplo popular
do classicador de Bayes, que busca tratar a dependncia entre critrios ava-
liando as probabilidades com que cada valor aparece em conjunto com outros
valores de outros critrios (WEBB; BOUGHTON; WANG, 2005). Formalmente:
P (c[x) =
_

_
m

i=1
P
_
c, x
[i]
_
m

j=1
P
_
x
[j]
[c, x
[i]
_
p

k=1
m

i=1
P
_
c
k
, x
[i]
_
m

j=1
P
_
x
[j]
[c
k
, x
[i]
_
i [1, 2, . . . , m] , F (x
i
) mEst
1
Z(x)
P (c)
m

i=1
P
_
x
[i]
[c
_
caso contrrio
(2.18)
onde P
_
x
[j]
[c
k
, x
[i]
_
a probabilidade do valor x
[j]
no j-simo critrio aparecer
um conjunto com o valor x
[i]
do i-simo critrio quando a soluo c, enquanto
P
_
c, x
[i]
_
a probabilidade de uma alternativa ter c como soluo e apresen-
tar o valor x
[i]
. J F
_
x
[i]
_
um contador de frequncia com que cada valor
aparecer. O AODE s ser utilizado se todos os valores da instncia x tm
frequncia maior que um limiar mEst. Caso contrrio, utiliza-se o classicador
86
de Bayes convencional.
Apesar do acrscimo computacional e de memria (ser necessrio um
novo contador de frequncia para cada tripla
_
x
[i]
, c, x
[j]
_
), o AODE mais
estvel que a verso original, possuindo uma varincia de erros menor, bem
como um pequeno ganho na taxa de acerto, aliviando a exigncia da inde-
pendncia de critrios. Este classicador, a exemplo do original, tambm
capaz de aprender de forma incremental (WEBB; BOUGHTON; WANG, 2005) -
caracterstica desejada para os classicadores dinmicos.
2.5.2.3 Comparao com Outros Algoritmos
Quando comparado com os demais mtodos, o classicador de Bayes se
destaca pela sua rapidez, tanto durante a execuo como durante a fase de
aprendizado. Porm, sua taxa de acerto costuma ser muito inferior da mai-
oria dos mtodos de tomada de deciso, sejam eles mais modernos (e.g.,
boosted trees) ou algoritmos clssicos (e.g., k-NN e rvores de decises) (CA-
RUANA; NICULESCU-MIZIL, 2006). Mesmo suas variantes no costumam obter
taxas de acerto signicativas que justiquem seu uso, ainda que sejam mais
estveis (WEBB; BOUGHTON; WANG, 2005).
Vale ressaltar que o classicador de Bayes assume que os critrios so
independentes entre si - i.e., cada critrio contribui com a probabilidade de
uma classe ser resposta, independentemente dos valores dos demais crit-
rios. Apesar de ser uma simplicao imprecisa, ela se mostra vantajosa em
problemas que apresentem um elevado nmero de dimenses (i.e., o nmero
de critrios). Tipicamente, espaos desta natureza apresentam problemas
que no ocorrem em dimensionalidades menores, e.g., o volume de um ob-
jeto aumenta exponencialmente com o aumento do nmero de dimenses,
e h uma tendncia dos pontos se tornarem equidistantes (EVANGELISTA; EM-
87
BRECHTS; SZYMANSKI, 2006). A este fenmeno, d-se o nome de maldio
da dimensionalidade (curse of dimensionality), e representa um dos princi-
pais obstculos enfrentados nas pesquisas relacionadas com aprendizagem
de mquina. Apesar disso, o classicador de Bayes, ao assumir critrios in-
dependentes, torna-se menos sensvel ao aumento do nmero de dimenses
(AKAHO, 2001).
88
3 PROPOSTA
Este captulo apresenta o sistema hbrido de tomada de deciso proposto
neste trabalho, em que mltiplos dispositivos so utilizados colaborativamente
para tomar uma deciso em conjunto. O emprego de tcnicas adaptativas
possibilita regular a relao de compromisso entre taxa de acerto e tempo
de resposta de acordo com as exigncias do problema. Adicionalmente, a
adaptatividade permite que cada dispositivo aprenda, de forma incremental,
atravs das solues obtidas pelos demais, ou ento, atravs de agentes ex-
ternos, tratando informaes cuja veracidade pode no ser necessariamente
conrmada.
3.1 Viso Geral
Utilizando o mesmo conceito das etapas 4R do raciocnio baseado em
casos apresentado previamente na seo 2.3, prope-se um sistema de to-
mada de deciso que seja capaz de no s solucionar problemas, mas
tambm agregar as solues obtidas na forma de um novo conhecimento,
disponibilizando-as como novas referncias para solucionar problemas poste-
riores.
A Figura 14 ilustra o uxo a ser seguido pelo sistema proposto, enquanto a
Figura 15 ilustra sua composio, destacando os itens a serem desenvolvidos
neste trabalho. A partir delas, verica-se que antes de serem solucionados,
89
Preparao
Anlise
Realimentao
1. Discretizar x. Problema x
Base de
Conhecimento
Alternativa a
2. Solucionar
problema
utilizando os
dispositivos
colaborativos.
Usurio
Auto-Anlise
VIs de Repetio
3. Analisar a soluo dada,
atravs de informaes
provenientes do usurio, ou
de alguma heurstica do
prprio sistema.
5. Propagar as
mudanas de
valor-verdade aos
dispositivos
4. Se a soluo no era
conhecida, agregar a nova
informao ao sistema com
uma valor-verdade inicial.
Se ela j era conhecida,
alterar seu valor-verdade.
Figura 14: Fluxo do sistema de tomada de deciso proposto - baseado nas
etapas 4R do raciocnio baseado em casos.
os problemas de tomada de deciso, descritos por um vetor de caractersticas
x, devem ter seus valores numricos discretizados em uma etapa preliminar.
Este processo exibiliza a escolha dos dispositivos, permitindo que sejam utili-
zados aqueles que tratem exclusivamente de critrios nominais. Exemplos de
mtodos de discretizao foram previamente apresentados na seo 2.2.1.
Aps serem discretizados, os vetores de caractersticas so repassados a
um conjunto de dispositivos adaptativos que, de forma colaborativa, trabalham
em conjunto para encontrar uma soluo comum, retornada na forma de uma
alternativa a. Este trabalho colaborativo deve ser gerenciado atravs de algum
processo que dena quais dispositivos devem ser utilizados, e como compor
a soluo nal a partir das solues encontradas por cada um deles. A seo
90
Dispositivo 1
Dispositivo 2
Dispositivo n
Discretizador
Problema x
Base de
Conhecimento
Alternativa a
Realimentador
Auto-Avaliador
Usurio
Anlise
Temporal
Reviso de
Casos No
Solucionados
Motor de
Clculo de
Confiana
Tomador de Deciso
Manuteno
Operador
Humano
Sada
Realimentao
Entrada
Novas Solues
C
a
s
o
s

c
o
m

q
u
e
d
a

d
e

t
a
x
a

d
e

a
c
e
r
t
o
s
Reviso dos Casos / Novos Casos
Reviso dos Casos
Consulta
Casos
Casos sem
soluo conhecida
Alteraes de
Valor-Verdade
Casos
sem
Soluo
Sem
soluo
Vis de Repetio
Treinamento
C
a
r
g
a

I
n
i
c
i
a
l
Propagao de mudanas
Figura 15: Viso geral do sistema de tomada de deciso proposto. O itens
destacados em negrito so o foco deste trabalho.
91
3.2 detalha como este processo realizado.
Para auxiliar os dispositivos em sua tarefa de encontrar solues, o sis-
tema proposto faz uso de uma base de conhecimento, responsvel por ar-
mazenar as informaes relevantes para a tomada de deciso. Este conhe-
cimento representado atravs de casos. Um caso formado por um par
(x, a), representando um vetor de caractersticas x e uma possvel alternativa
a. Apesar de ser estruturalmente similar ao conceito de instncia, umcaso no
representa uma verdade, mas sim, uma possvel soluo de um problema.
Para cada caso (x, a), h um valor-verdade v associado, que empirica-
mente estima a probabilidade da alternativa a ser uma possvel soluo para
x, com base na frequncia com que esta alternativa solucionou corretamente
este mesmo problema em momentos passados: alternativas aceitas com
maior frequncia tm maior valor-verdade. Esta frequncia de acerto recebe
o nome de contador, e utilizada para calcular no apenas o valor-verdade
associado, mas tambm uma estimativa de conana deste valor.
Logo, o que a base de conhecimento efetivamente armazena so conta-
dores para cada caso (x, a), permitindo que o valor-verdade associado seja
calculado e disponibilizado aos dispositivos. Este recurso possibilita o uso
de algoritmos de tomada de deciso que trabalhem com dados cuja verdade
no absoluta (e.g., o k-NN fuzzy citado na seo 2.5.1.3). Os processos de
atualizar os contadores e calcular o valor-verdade esto descritos na seo
3.3.2.
Internamente, aps os dispositivos encontrarem uma soluo comum a
para x, o par (x, a) propagado de volta aos dispositivos, para que cada um
deles aprenda com as solues encontradas pelos demais. Mais especi-
camente, as solues so enviadas base de conhecimento, que, por sua
vez, atualiza os contadores do caso (x, a) analisado e propaga as mudanas
92
ocorridas aos dispositivos, para que agreguem esta nova informao. Esta
propagao recebe o nome de realimentao
Em sua forma mais bsica, a soluo encontrada diretamente incorpo-
rada base de conhecimento, reforando que o caso (x, a) vlido. Este
conceito est de acordo com o comportamento causado pelo vis de repeti-
o, onde uma soluo dada como verdadeira enquanto no receber uma
opinio contrria.
No entanto, em uma forma mais elaborada, esta realimentao tambm
pode ter origem em um bloco de auto-avaliao que, com o auxilio de alguma
inteligncia (e.g., heursticas, teste direto da soluo), verica se a soluo a
encontrada realmente vlida. Apesar de ser potencialmente mais convel
que o vis de repetio, este auto-avaliador depende fortemente da natureza
dos problemas a serem solucionados, devendo ser implementado especica-
mente para cada sistema em particular. Outra fonte de realimentao, supos-
tamente mais convel, o prprio usurio, que pode dar sua prpria opinio,
permitindo conrmar que a soluo encontrada foi mesmo adequada.
Deve ser ressaltado que as realimentaes podem ser de natureza tanto
positivas como negativas: as positivas reforam a validade de uma soluo,
enquanto as negativas apoiam a ideia de que a soluo no vlida. Desta
denio, nota-se que as realimentaes oriundas do vis de repetio so
sempre positivas, diferentemente daquelas oriundas das demais fontes, que
dependem da anlise feita em cima da soluo.
O uso de diferentes fontes cria a necessidade de ponderar as realimenta-
es, para que informaes provindas de fontes de maior credibilidade tenham
peso maior em relao s demais. Os processos de ponderar as realimenta-
es, atualizar os contadores e calcular o valor-verdade esto detalhados na
seo 3.3.
93
Deve ser ressaltado que estas realimentaes apresentadas fazem parte
do ciclo de vida da soluo de um nico problema, ocorrendo aps a obten-
o de suas solues. Entretanto, elas tambm podem ser geradas fora deste
ciclo, para possibilitar o tratamento de casos quaisquer em instantes de tempo
arbitrrios, e assim, dar manuteno ao sistema, procurando eventuais falhas
e as corrigindo conforme necessrio. A Figura 15 ilustra trs possveis mdu-
los de manuteno:
Um bloco para analisar o efeito do tempo sobre os casos conhecidos,
com o objetivo de tratar o desvio de conceito, citado na seo 2.2.2.
Um bloco para tratar problemas no solucionados, i.e., problemas que
no puderam ser solucionados de forma convel por nenhum dos dis-
positivos, e que, portanto, apresentam baixo valor-verdade em todas as
alternativas. Neste caso, algoritmos de aprendizado no supervisionado,
e.g., clustering, poderiamser utilizados para encontrar possveis padres
nestes problemas, e tentar inferir se elas representam uma nova alterna-
tiva no conhecida, ou ento, encontrar suas alternativas verdadeiras.
Um operador humano tambm poderia realizar uma manuteno por
conta prpria, avaliando os casos conhecidos e no solucionados, e cor-
rigindo eventuais erros. Um treinamento online tambm poderia ser feito
para esta nalidade.
Estes blocos de manuteno no sero tratados diretamente neste tra-
balho. A seo 5.2 discute como eles poderiam ser desenvolvidos, citando
exemplos de tcnicas que poderiam ser utilizadas para esta nalidade, bem
como as possveis diculdades a serem encontradas.
As sees seguintes detalham cada uma destas etapas do processo de
94
tomada de deciso, descrevendo as estratgias empregadas em cada uma
delas e justicando sua escolha.
3.2 Dispositivo Adaptativo Hierrquico
Esta seo apresenta a composio de um dispositivo adaptativo de to-
mada de deciso, descrevendo como cada um deles opera individualmente,
bem como sugerindo estratgias para que trabalhem de forma colaborativa
para encontrar uma soluo comum, de acordo com o que fora apresentado
previamente.
3.2.1 Generalizao da TDAE
A partir do modelo hbrido de tomada de deciso utilizado pela TDAE,
em que uma tabela de deciso ganha o auxlio de um segundo dispositivo
para problemas que no capaz de solucionar por conta prpria, pode-se
generaliz-lo para um nmero arbitrrio de dispositivos, dispondo-os em uma
la. Seu funcionamento segue a mesma ideia utilizada pela TDAE: ao receber
um problema (i.e., um vetor de caractersticas x), o primeiro dispositivo da la
se encarrega de solucion-lo. Em seguida, deve ser vericado se sua soluo
convel, de acordo com algum critrio de aceitao. Caso ela seja aceita,
retornada como soluo do sistema, caso contrrio, o vetor repassado
ao dispositivo seguinte da la. Este procedimento se repete at que um dos
dispositivos consiga solucionar x, ou ento, at esgotar os dispositivos da la.
Aps serem obtidas, as solues so realimentadas aos dispositivos, para
que cada um deles aprenda com as solues dos demais. Este processo
ilustrado pela Figura 16.
Neste modelo, a ordem de execuo dos dispositivos deve ser escolhida
95
Dispositivo 1
Problema
Soluo
Camada Adaptativa
Dispositivo 2
Camada Adaptativa
Dispositivo n
1. Problema enviado ao
primeiro dispositivo
2. Problema repassado ao prximo
dispositivo caso o dispositivo atual no
tenha sido capaz de solucion-lo
3. Processo se repete at um dos
dispositivos solucionar o problema
ou at esgotar os dispositivos
4a. Assim que um dos dispositivos
obtm uma soluo, os processos 2 e 3
so interrompidos
5. Soluo propagada de volta aos dispositivos,
para que cada um aprenda com as solues dos outros
4b. Caso nenhum dispositivo
solucione o problema, uma estratgia
deve ser adotada para obter uma
soluo (ex: utilizar a soluo do
ltimo dispositivo)
Estratgia para estouro
Figura 16: Princpio de funcionamento dos dispositivos em hierarquia.
de forma a minimizar o uso dos dispositivos mais lentos, utilizando-os ape-
nas quando os demais no so capazes de obter uma soluo aceita. Logo,
sugere-se orden-los em ordem crescente de tempo de resposta, mantendo
os dispositivos mais rpidos no comeo da la. A velocidade de um dispositivo
qualquer pode ser estimada de forma emprica, treinando-o com um conjunto
de instncias, executando-o e medindo seu tempo de resposta mdio com um
segundo conjunto de instncias.
Entretanto, deve ser ressaltado que outras estratgias de colaborao en-
96
tre dispositivos poderiam ser empregadas - idealmente, um agente inteligente
escolheria qual o dispositivo mais apropriado para cada vetor de caractersti-
cas, evitando o uso daqueles cuja probabilidade de obter uma soluo aceita
baixa. Entretanto, este trabalho d nfase estratgia proposta acima, que,
apesar de no apresentar um comportamento adaptativo, apresenta a possi-
bilidade de regular a relao de compromisso entre taxa de acerto e tempo
de resposta atravs do critrio de aceitao, que controla a frequncia de uso
dos dispositivos mais lentos.
Supondo que seja utilizada esta estratgia de ordenao por tempo de res-
posta, a realimentao proposta permite que dispositivos mais velozes - e, em
geral, menos precisos - aprendam atravs das solues obtidas por dispositi-
vos mais robustos. Potencialmente, medida que estes dispositivos recebem
novas informaes, suas solues passam a ser aceitas com maior frequn-
cia, resultando em uma queda no tempo de resposta. Em contrapartida, de
forma anloga curva SAT (apresentada na seo 1.2), este ganho de veloci-
dade pode estar acompanhado de uma perda na taxa de acerto, causada pela
menor frequncia de acesso aos dispositivos mais robustos. Todavia, espera-
se que esta perda seja minimizada pelo fato de o aprendizado ser feito com
base em informaes provindas de dispositivos mais robustos. A seo 4.6.1
apresenta resultados obtidos experimentalmente com relao a esta forma de
aprendizado.
Diferentemente da TDAE, esta propagao de solues no a nica
fonte de informaes de um dispositivo. Agentes externos podem tambm
interferir na aprendizagem dos dispositivos da la, fornecendo-lhes novas in-
formaes, ou ento, atualizando o conhecimento j existente. O uso destes
agentes exibiliza o processo de aprendizagem, permitindo que outros dis-
positivos inteligentes fora desta la possam analisar as solues e contribuir
97
incorporando novas informaes. Em particular, permite que um operador hu-
mano tambm consiga contribuir com novas informaes.
Tambm deve ser destacado que este critrio de aceitao bastante sub-
jetivo, dependendo fortemente do entendimento que se possui do que pode
ser considerado uma soluo convel. Enquanto a deciso de utilizar o m-
todo auxiliar na TDAE tomada quando nenhuma regra aplicvel encon-
trada, no caso geral, no clara a fronteira que dene quais solues so
vlidas. A seo 3.2.2 detalha como esta conabilidade estimada e avali-
ada.
Com base neste princpio de funcionamento e na notao original da
TDAE apresentada na seo 2.1.4, um dispositivo adaptativo hierrquico,
neste trabalho, denido como DAH
k
= (AD
k
, FM, LM, j), onde:
AD
k
um dispositivo adaptativo subjacente aps a execuo de k aes
adaptativas. Porm, diferentemente dos dispositivos guiados por regra
(denidos na seo 2.1.1), este dispositivo responsvel por estimar o
vetor de expectativa de certezas para um determinado vetor de carac-
tersticas x (atribui-se o nome y (x) para a funo que estima ).
LM uma referncia la de dispositivos, enquanto j a posio do
dispositivo nesta la.
FM representa um conjunto de funes auxiliares que estabelece a
comunicao entre o dispositivo subjacente e sua camada adaptativa.
Assim como na TDAE, estas funes so denidas externamente, no
sendo diretamente explicitadas na denio do dispositivo AD
k
.
Considerando as exigncias da hierarquia de tomada de deciso, so trs
as funes auxiliares:
98
Uma funo FM
aceitacao
deve ser utilizada aps a execuo de um dis-
positivo para determinar se a soluo obtida vlida de acordo com o
critrio de aceitao. Em caso positivo, a soluo retornada, caso con-
trrio, o prximo dispositivo da la LM deve ser chamado para solucionar
o prolema.
Uma segunda funo FM
aprendizado
responsvel por receber informa-
es de agentes externos - e.g, os demais dispositivos ou um operador
humano - e agreg-las ao conhecimento do dispositivo.
Por m, FM
estouro
dene a estratgia a ser seguida quando nenhum dis-
positivo da la for capaz de solucionar um problema em particular.
Esta denio possui trs diferenas conceituais com relao TDAE. Pri-
meiramente, enquanto as funes auxiliares da TDAE so executadas antes
da aplicao de uma regra, FM
aceitacao
utilizada aps a execuo do dispo-
sitivo, para que avalie sua soluo com base no critrio de aceitao. Este
passo desnecessrio na TDAE, cujo critrio para pedir auxlio de M sim-
plesmente a deteco da ausncia de uma regra aplicvel.
Em segundo lugar, destaca-se que o processo de aprendizado ocorre atra-
vs de FM
aprendizado
, separadamente da funo responsvel por acionar os
dispositivos seguintes. Esta diviso ocorre para permitir que agentes exter-
nos tambm possam fornecer informaes aos dispositivos sem passar pelo
critrio de aceitao, utilizado para controlar a colaborao entre dispositivos.
Outra diferena a presena da funo FM
estouro
, inexistente na denio
original da TDAE. Esta diferena decorrente da possibilidade de nenhum
dispositivo obter um soluo aceita - possibilidade esta que no considerada
na TDAE, uma vez que as solues encontradas atravs do mtodo auxiliar
M so sempre aceitas.
99
A Figura 17 ilustra como as funes auxiliares de FM so utilizadas pelos
dispositivos, bem como a la de dispositivos do ponto de vista da adaptativi-
dade. Em comparao, a Figura 18 ilustra a composio do dispositivo adap-
tativo sob a tica do processo de tomada de deciso, ilustrando as entrada e
sadas do dispositivo.
Camada
Adaptativa
Ncleo
Dispositivo
Subjacente
j-simo Dispositivo
Adaptativo
Hierrquico
FM aceitao
j 0 k-1
Fila de
dispositivos (LM)
F
M

a
p
r
e
n
d
iz
a
d
o
FM estouro
Soluo
Manuteno /
Treinamento
Auto-Avaliao /
Vis de Repetio
Novas
informaes
Problema
Entrada
Sada
Realimentao
Figura 17: Funes auxiliares dos dispositivos adaptativos hierrquicos.
Nota: dispositivos adaptativos guiados por regra permitem que a aplica-
o de uma regra resulte na chamada de uma funo adaptativa, responsvel
por alterar o conjunto de regras. Neste projeto, a adaptatividade no ser uti-
lizada desta maneira, restringindo-se ao comportamento adaptativo denido
pela TDAE.
100
Dispositivo k-1
Dispositivo Subjacente
Problema x
Alternativa a
Dispositivo k
Soluo aceita:
sai da fila
Casos
Conhecidos
Critrio de
Aceitao
Problema x
Dispositivo k+1
Soluo no considerado
"boa": repassa o problema
Consulta
Casos
Receber problema do
dispositivo anterior
Camada
Adaptativa
Realimentao
Expectativa !
Figura 18: Composio de um dispositivo adaptativo hierrquico.
3.2.2 Critrio de Aceitao
Com base na expectativa de certeza calculada pelos dispositivos, deve-
se decidir se o resultado obtido deve ser considerado vlido (o que signica
sair da la), ou se o vetor x deve ser repassado ao dispositivo seguinte. Para
problemas em que apenas uma alternativa vlida esperada, uma forma de
decidir a aceitao vericar se a expectativa de certeza de maior valor est
acima de um limiar, aceitando a alternativa correspondente em caso positivo.
Logo:
aceita = (max (
1
,
2
, . . . ,
p
) > thresh) , 0 thresh 1 (3.1)
101
onde thresh o valor do limiar de aceitao. Entretanto, caso existam duas
ou mais alternativas com expectativas acima do limiar e com valores muito
prximos, esta condio torna-se pouco eciente, pois nesse caso no ca
clara a fronteira que dene qual das alternativas a soluo mais adequada,
tornando-as possivelmente ambguas. Uma forma de contornar este problema
seria utilizar um segundo critrio, que verica a razo entre as duas expecta-
tivas de maior valor - com a maior delas no denominador. Esta razo deve
estar abaixo de um segundo limiar para que a soluo seja considerada livre
de ambiguidades. Assim:
ambig =
_
max
2
(
1
,
2
, . . . ,
p
)
max (
1
,
2
, . . . ,
p
)
> thresh
ambig
_
, 0 thresh
ambig
1 (3.2)
aceita = (max (
1
,
2
, . . . ,
p
) > thresh) ambig (3.3)
onde thresh
ambig
o limiar de ambiguidade, enquanto max
2
a funo que
retorna o segundo maior valor dentre as expectativas. A aceitao, assim,
passaria a depender de duas condies, conforme descrito em (3.3).
3.2.3 Algoritmo de Tomada de Deciso
A partir das denies feitas para o dispositivo adaptativo, o Algoritmo 5
esboa o processo de tomada de deciso hierrquica. Os dispositivos de-
vem estar organizados como uma estrutura de lista D, e devem dispor de um
mtodo expectativa (x) que calcule a expectativa de certeza de cada alterna-
tiva. Cada dispositivo deve incorporar sua prpria lgica para este mtodo,
adequando-a de acordo com suas caractersticas. Note que o algoritmo re-
cursivo, incrementando o valor do ndice k em cada recurso - o que signica
utilizar o k-simo dispositivo para solucionar o problema corrente. A recurso
interrompida assim que uma soluo aceita pelo critrio de aceitao, ou
102
ento ao esgotar a la de dispositivos.
Algoritmo 5 decisaoHierarquica (D, k, x, a, P)
Entrada
D: Lista de dispositivos
k: ndice do dispositivo a ser utilizado
x: Vetor de caractersticas
Sada
a: Alternativa escolhida
P: Lista com as expectativas de certeza calculadas para cada dispositivo
1: D[k] .expectativa (x)
2: P [k]
3: if aceitaDecisao () then
4: a arg max (
1
, . . . ,
p
)
5: else if k + 1 < D.length then
6: decisaoHierarquica (D, k + 1, x, a, P)
7: else
8: decisaoFinal (D, x, a, P)
9: end if
Nota: se o vetor apresentar dois ou mais valores mximos idnticos,
deve-se utilizar algum critrio de desempate para a funo arg max apresen-
tada na linha 4. Neste trabalho, no caso de empate, este operador retorna a
alternativa de menor ndice.
A funo aceitaDecisao () determina a condio de aceitao de uma de-
ciso, devendo ser implementada de acordo com o critrio adotado. Como
exemplo, o Algoritmo 6 ilustra como seria este mtodo utilizando a condio
descrita pela equao (3.1), representando a funo auxiliar FM
aceitacao
de-
nida previamente.
Algoritmo 6 aceitaDecisao ()
Entrada
: vetor com as expectativas de certezas a serem testadas
Sada
true ou false
1: return max (
1
, . . . ,
p
) > thresh
103
Em contrapartida, a linha 8 do Algoritmo 5 representa a funo auxiliar
FM
estouro
, i.e., a estratgia utilizada quando nenhum dispositivo foi capaz de
obter uma soluo aceita pela condio imposta por aceitaDecisao (). A es-
colha desta estratgia deve ser feita de acordo com as exigncias do pro-
blema. A estratgia mais simples seria retornar uma soluo nula, deixando
claro que o sistema no foi capaz de solucionar o problema. Caso seja exi-
gida uma soluo no-nula, outras estratgias poderiam ser empregadas, tais
como utilizar um sistema de votao com os valores de obtidos em cada dis-
positivo, ou ento, utilizar a soluo do ltimo dispositivo da la - esta ltima
estratgia descrita pelo Algoritmo 7.
Algoritmo 7 decisaoFinal (D, x, a, P)
Entrada
D: Lista de dispositivos
x: Vetor de caractersticas
Sada
a: Alternativa escolhida
P: Lista com as expectativas de certezas calculadas para cada dispositivo
1: D[D.lastElement] .expectativa (x)
2: i index of (max ())
3: a a
i
Finalmente, o Algoritmo 8 ilustra o ponto de entrada do sistema, e a ma-
neira como o processo de deciso hierrquica se relaciona com o processo
de realimentao, responsvel pelo aprendizado incremental (descrito nas se-
es seguintes). Deve ser notado que, aps consultar os dispositivos, a so-
luo obtida realimentada, dando margem a cada um dos dispositivos para
aprender atravs das solues dos demais - em especial, permite que dispo-
sitivos mais rpidos aprendam com as solues obtidas atravs daqueles com
maiores taxas de acerto, potencialmente aumentando a frequncia com que
suas solues so aceitas pelo critrio de aceitao, e consequentemente,
diminuindo o tempo mdio de resposta do sistema.
104
Estas realimentaes podem ser causadas por um bloco de auto-anlise,
ou ento, por um vis de repetio. Os valores cr
repetition
e cr
analise
represen-
tam a credibilidade destas realimentaes, e so denidas na seo 3.3.1, en-
quanto a funo realimenta (BD, D, x, a, cr), responsvel pelo aprendizado in-
cremental, descrita na seo 3.4.1. Em contrapartida, a funo analise (x, a)
deve ser responsvel por realizar a auto-anlise e, caso no valide a soluo
original, retorna uma outra soluo, a ser realimentada.
Nota: apesar de especicado, este bloco de anlise no ser empregado
neste trabalho, conforme citado na seo 3.1. Assim, apenas o vis de re-
petio ser analisado como forma de auto-realimentao - realimentaes
originadas por uma lgico do prprio sistema.
Algoritmo 8 decisao (x, a)
Entrada
x: Vetor de caractersticas
Sada
a: Alternativa encontrada
1: P
2: Discretiza x
3: decisaoHierarquica (D, 0, x, a, P)
4: if a ,= then
5: if Existe em mdulo de anlise? then
6: a
analise
analise (x, a)
7: cr
analise
credibilidadeAnalise ()
8: realimenta (BD, D, x, a
analise
, cr
analise
)
9: else if cr
repetition
> 0 then
10: realimenta (BD, D, x, a, cr
repetition
)
11: end if
12: end if
13: return a
A Figura 19 resume o processo hierrquico de tomada de deciso.
105
Discretiza Valores
Numricos
Vetor x
Entrada
Executa k-simo dispositivo
decisaoHierarquica(D, k, x, a, P )
Executa primeiro
dispositivo (k = 0)
Calcula Expectativa de
Certeza
!D[k].probabilidades(x)
Testa condio
aceita()
Determina
alternativa
y ! argmax()
o ltimo
dispositivo?
Executa dispositivo k+1
decisaoHierarquica(D, k+1, x, a, P )
Determina alternativa
decisaoFinal(D, x, a, P )
Vetor x
Alternativa a
a nulo?
Tem bloco de
auto-avaliao?
Alternativa a
Vis de Repetio
realimenta(BD, D, x, a, cr repetition)
Auto-Avaliao
y analise !analise(x,a)
cr analise ! credibilidadeAnalise()
Repetition-bias
realimenta(BD, D, x, y analise, cr analise)
Chamada
recursiva S
N N
S
S
N
S
N
decisaoHierarquica(D, k, x, a, P )
Figura 19: Fluxo resumido do processo hierrquico de tomada de deciso.
106
3.3 Gerenciamento de Conhecimento
Esta seo descreve a forma com que o sistema trata o armazenamento
de casos conhecidos - processo iniciado a partir de informaes recebidas de
realimentaes, e que resulta em um modelo de base de conhecimento capaz
de estimar o valor-verdade de um caso j visto, bem como sua conabilidade.
3.3.1 Realimentao
Conforme descrito anteriormente, realimentao uma relao que avalia
um caso (x, a) atravs de um valor-verdade v, informando se a alternativa
a ou no uma soluo adequada para o vetor de caractersticas x. Uma
instncia de realimentao representada por (x, a, v, , cr), tal que:
x: vetor de caractersticas analisado.
a: alternativa analisada.
v: valor-verdade que indica se a uma soluo vlida para x. Reali-
mentaes positivas tm v = 1, enquanto realimentaes negativas tm
v = 0.
: valor relativo de reforo, para ponderar a inuncia das realimenta-
es positivas e negativas. Semelhante ao peso proposto por Einhorn,
descrito pela equao (2.2).
cr: credibilidade do gerador desta realimentao. Deve ser um valor
positivo maior que zero.
A escolha do valor de cr feito de forma a ponderar a inuncia de cada
fonte de realimentao em relao s demais. Valores maiores so atribudos
para fontes consideradas mais conveis:
107
Partindo do pressuposto de que seres humanos so menos propensos a
erros do que as mquinas, realimentaes vindas diretamente do usu-
rio devemexibir umvalor de cr relativamente maior do que os das demais
fontes. O mesmo vale para informaes vindas de um operador humano.
Por outro lado, informaes recebidas por avaliaes de mquina devem
exibir credibilidades menores, pois esto mais sujeitas a erros. Mdulos
como a auto-avaliao, anlise temporal e anlise de casos sem soluo
se enquadram nesta categoria.
Na ausncia de realimentaes para uma soluo, pode ser utilizado
um bloco genrico de vis de repetio. Este bloco refora a alternativa
escolhida com v = 1, baseando-se na crena de que se estiver errado,
algum lhe corrigir. Por no ser uma fonte de informaes convel,
utiliza-se um valor pequeno para cr - no caso, uma constante cr
repetition
pr-denida.
Conceitualmente, apesar de no ser uma realimentao, o treinamento do
sistema tambm representado por (x, a, v, , cr), exceto que sua credibili-
dade cr apresenta valores muito maiores, pois assume que o treinamento
isento de erros. Portanto neste projeto, ainda que seja conceitualmente dife-
rente, o treinamento tambm utilizar esta notao.
O peso w da realimentao obtido a partir dos valores de reforo e
credibilidade cr:
w = cr (3.4)
A partir de um conjunto de realimentaes recebidas, deve-se estabelecer
uma forma de estimar a conana de uma soluo, conforme sugerido por
Einhorn (EINHORN; HOGARTH, 1978). No caso, utiliza-se uma soma ponderada
por w, descrito a seguir.
108
3.3.2 Clculo do Valor-Verdade e do Intervalo de Conana
Como citado na seo 3.1, o valor-verdade uma estimativa emprica da
probabilidade de uma alternativa a ser soluo de um vetor x. Baseando-se
na frequncia com que a alternativa foi considerada vlida, este valor calcu-
lado a partir de uma mdia ponderada do valor-verdade das n realimentaes
recebidas para o caso (x, a):
v =
V
W
,
_
V =
n

k=1
v
k
w
k
, W =
n

k=1
w
k
_
(3.5)
onde V pode ser interpretado como nmero de vezes que a alternativa foi
considerada correta dentre as W vezes em que o caso foi avaliado - estes so
os contadores citados na seo 3.1. Assim, para cada caso (x, a), se faz ne-
cessrio armazenar estes dois somatrios para que a estimativa da verdade
v da alternativa a com relao ao vetor x possa ser calculada - supostamente,
a alternativa de melhor verdade a mais adequada. Note que estes soma-
trios podem ser facilmente atualizados conforme novas realimentaes so
recebidas.
Em conjunto, pode-se estimar o intervalo de conana deste valor-
verdade, permitindo determinar, de forma objetiva, a conabilidade do valor
calculado - quanto menor o intervalo, mais preciso deve ser o valor-verdade.
Tipicamente, a estimativa do intervalo realizada determinando dois limites,
v
low
e v
upp
, tal que a probabilidade da mdia verdadeira (i.e., o verdadeiro
valor-verdade) estar entre estes dois valores seja 1 . Assim:
P (v
low
v
high
) = 1 (3.6)
onde representa o nvel de signicncia do intervalo de conana. Valores
tpicos de incluem 10%, 5%, 1%, 0, 5% e 0, 1%.
A estimativa do intervalo de conana de qualquer parmetro de uma po-
109
pulao depende fortemente da maneira com que os valores das instncias
variam entre si - i.e., depende da distribuio caracterstica do parmetro me-
dido. Como as verdades das realimentaes assumem valores binrios - ver-
dadeiro (1) ou falso (0) - tem-se uma distribuio de Bernoulli, cujo intervalo
de conana em torno da mdia v, quando aproximado por uma distribuio
normal, :
v z
1/2
_
v (1 v)
W
(3.7)
onde z
1/2
o (100 (1 /2))-simo percentil de uma distribuio normal,
enquanto a porcentagem esperada da amostra que devem car fora do
intervalo calculado. O clculo do percentil bastante conhecido, e se encontra
descrito no Anexo A.
Todavia, estudos estatsticos demonstram que este intervalo de con-
ana pode no representar a real situao da mdia calculada, especialmente
quando o nmero de exemplos amostrais baixo, ou ento, se a mdia verda-
deira muito prxima de 0 ou 1 (BROWN; CAI; DASGUPTA, 2001). Como exemplo,
ao lanar uma moeda no-viciada trs vezes, a probabilidade de sair trs ve-
zes caras bastante signicativa - no caso, 12,5%. No entanto, para esta
amostra, a estimativa da massa de probabilidade de um lanamento dar cara
seria 1 0, muito distante do valor real.
A literatura prope alguns testes para vericar se o intervalo de conana
pode ser utilizado (BROWN; CAI; DASGUPTA, 2001). Abaixo, alguns exemplos
destes testes (dado que p a mdia calculada, e n, o nmero de exemplos
amostrais):
np 5 e n(1 p) 5
np(1 p) 5
n 50, a no ser que p seja prximo de zero
110
No entanto, foi demonstrado que a signicncia estatstica destes testes
muito baixa, mesmo quando n (BROWN; CAI; DASGUPTA, 2001). Para
contornar este problema, utiliza-se alternativas para estimar a mdia e seu
respectivo intervalo de conana. Uma destas alternativas o mtodo de
Agresti-Coull, que articialmente insere uma quantidade igual de elementos
de valor 0 e 1. Tal ao move a mdia estimada para um valor mais prximo de
0, 5 e alarga o intervalo de conana, especialmente quando a amostra possui
poucos elementos. Os efeitos desta amostra articial se dispersam conforme
a amostra aumenta, fazendo com que a mdia de Agresti-Coull convirja para
a mdia convencional.
Utilizando este mtodo, a nova estimativa do valor-verdade v e seu inter-
valo de conana c
1/2
so dados atravs das seguintes funes:

W = W +
_
z
1/2
_
2
(3.8)
v =

W
=
V +
_
z
1/2
_
2
2

W
(3.9)
v c
1/2
= v z
1/2

v (1 v)

W
(3.10)
A equao (3.8) mostra que o nmero de elementos articiais
_
z
1/2
_
2
,
enquanto a equao (3.9) mostra que metade delas so verdadeiras, en-
quanto as demais so falsas. Por m, a equao (3.10) idntica equao
original (3.7), mas utiliza os novos valores v e

W.
A Figura 20 ilustra um exemplo em que estimada a mdia de uma vari-
vel que segue uma distribuio de Bernoulli com p = 80% e = 5%, conforme
o tamanho da amostra aumenta. Note que a mdia real esteve dentro do inter-
valo de Agresti-Coull a todo o momento - algo que no ocorre com o intervalo
111
convencional quando a amostra s continha 8 elementos (todas elas tinham
valor 1, logo, mdia estimada foi 1 com intervalo zero, no abrangendo a m-
dia verdadeira). Vale tambm ressaltar que ambas as mdias convergem para
a mdia real conforme a amostra aumenta.
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 10 20 30 40 50 60 70 80 90 100
Tamanho da Amostra
Mdia e Intervalo de Confiana de Agresti-Coull
Mdia Mdia-AG Intervalo (-) Intervalo (+) Mdia Real
Figura 20: Grco comparativo da estimativa da mdia convencional (linha
contnua) com a mdia de Agresti-Coull (linha marcada com ) de uma amos-
tra que segue uma distribuio de Bernoulli com p = 80%
Nota: o mtodo de Agresti-Coull funcional mesmo para W = 0. No caso,
v = c
1/2
= 0, 5, englobando todo o intervalo de valores vlidos. Portanto,
estes so os valores retornados para casos que nunca foram realimentados.
Para cada realimentao recebida, os somatrios V e W do respectivo
caso devem ser atualizados, bem como os valores-verdade e intervalos de
conana. Estas mudanas devem ser noticadas aos dispositivos, para que
se adaptem ao novo conhecimento - processo descrito na seo 3.4.1.
112
3.3.3 Base de Conhecimento
Conforme descrito na seo 3.1, a base de conhecimento respons-
vel pelo armazenamento dos casos conhecidos, para que as informaes de
valor-verdade e conana sejam disponibilizadas aos dispositivos - mais espe-
cicamente, armazena os contadores V e W de cada caso (x, a) , necessrios
para o clculo do valor-verdade associado.
Obrigatoriamente, esta base de conhecimento deve ser capaz de receber
inseres, modicaes e excluses de informaes, para que seja possvel
agregar novos conhecimentos e eliminar informaes parasitrias, e, ideal-
mente, deve estar organizada para permitir buscas espaciais de forma otimi-
zada, sem a necessidade de consultar toda a base para encontrar os vizinhos
mais prximos de um vetor x, conforme descrito na seo 2.5.1.2. A Figura
21 ilustra um exemplo de base de conhecimento utilizando uma estrutura de
rvore R*-Tree.
A otimizao da busca, entretanto, depende fortemente dos critrios en-
volvidos, e.g., R*-Tree trata apenas problemas numricos (BECKMANN et al.,
1990). Para simplicao, ser utilizada uma busca linear neste trabalho, para
que o clculo de distncia seja independente dos critrios, em detrimento do
tempo de resposta.
Uma considerao, contudo, deve ser feita: enquanto critrios nominais
possuem uma quantidade nita de valores vlidos, critrios numricos podem
assumir, teoricamente, valores reais innitos. Para problemas que contenham,
ao menos, um critrio numrico, torna-se invivel armazenar todos os casos
conhecidos, pois a base cresceria indenidamente. Para limitar o tamanho
da base a um valor nito, discretiza-se os valores numricos, transformando-
os em valores inteiros nitos. Assim, do ponto de vista da base, cada vetor
113
Vetor x
(x
1
, x
2
, ... x
m
)
Alternativa 1
W = 4 | V = 3
Alternativa 2
W = 6 | V =2
Alternativa n
W = 7 | V = 3
...
Alternativa: 1
Raz
R*-Tree
Dados
armazenados
em cada folha
Folhas
Ns
Figura 21: Um possvel modelo para a base de conhecimento utilizando uma
R*-Tree. Cada folha possui a representao x de um vetor e os contadores
V e W de cada alternativa.
x formada por valores nominais ou discretizados. A seo 2.2.1 descreve
algumas tcnicas de discretizao comumente utilizadas.
Logo, quando for necessrio consultar o valor-verdade e o intervalo de um
caso (x, a) qualquer, ou ento, ao atualizar os contadores W e V deste caso -
atravs da funo BD.realimenta presente no Algoritmo 10 - sero utilizados
os valores discretizados de x para realizar a consulta.
3.4 Aprendizado
Tradicionalmente, todo sistema de tomada de deciso possui uma fase
de treinamento para adequ-lo a um problema em particular, e, em muitos
casos, a nica forma de transmitir conhecimento ao sistema. Sistemas ditos
como evolutivos permitem que novas informaes sejam incrementalmente
incorporadas durante suas execues.
114
Esta seo apresenta estes dois processos de aprendizado, e como eles
so utilizados neste trabalho.
3.4.1 Aprendizado Incremental
Conforme citado na seo 3.2.1, cada dispositivo obtm novas informa-
es atravs de sua camada adaptativa. Isso feito informando-o sobre as
mudanas ocorridas no valor-verdade de um caso e no intervalo de conana
associado, permitindo que sua abstrao seja atualizada. O Algoritmo 9 ilus-
tra como as realimentaes so geradas a partir de uma soluo - no caso,
uma realimentao para cada alternativa, com v = 1 e =
+
para a soluo
adotada a, e v = 0 e =

para as demais. J o Algoritmo 10 mostra como


a propagao de uma realimentao realizada.
Algoritmo 9 realimenta (BD, D, x, a, c)
Entrada
BD: Base de conhecimento com os contadores de cada caso
D: Lista de dispositivos
x: Vetor de caractersticas
a: Alternativa escolhida pela fonte realimentadora
c: Credibilidade da fonte
1: for all a
i
A do
{Verdade da realimentao e valor de reforo relativo}
{Ver seo 3.3.1}
2: v 0
3:

4: if a
i
= a then
{Alternativa a
i
era a escolhida: valor-verdade e positivos}
5: v 1
6:
+
7: end if
8: propaga (BD, D, x, a
i
, v, , c)
9: end for
Nestes algoritmos, a funo BD.verdade (x, a) retorna o valor-verdade de
uma alternativa a com relao ao vetor de caractersticas x utilizando a equa-
115
Algoritmo 10 propaga (BD, D, x, a, v, , c)
Entrada
BD: Base de conhecimento com os contadores de cada caso
D: Lista de dispositivos
x: Vetor de caractersticas
a: Alternativa a ser realimentada
v: Valor-verdade da alternativa, segundo a fonte realimentadora
: Valor relativo de reforo
c: Credibilidade da fonte
{Calcula valor-verdade v e intervalo de conana ic de a em x}
1: v BD.verdade (x, a)
2: ic BD.intervalo (x, a)
3: BD.realimenta (x, a, v, , c)
{Calcula diferena no valor-verdade e intervalo de conana}
4: dif
v
BD.verdade (x, a) v
5: dif
ic
BD.intervalo (x, a) ic
6: for all d D do
{Propaga diferenas aos dispositivos}
7: d.aprende (x, a, dif
v
, dif
ic
)
8: end for
o (3.9), enquanto BD.intervalo (x, a), de forma anloga, calcula o intervalo
de conana atravs da equao (3.10). A realimentao em si feita atravs
do mtodo BD.realimenta (x, a, v, , c), que faz uso das equaes (3.4) e (3.5)
para atualizar os contadores, e, portanto, o valor-verdade.
Aps as realimentaes, as alteraes no valor-verdade e no inter-
valo de conana so propagadas aos dispositivos atravs da funo
d.aprende (x, a, dif
v
, dif
ic
), referente funo auxiliar FM
aprendizado
denida
previamente. Esta chamada permite que cada dispositivo atualize sua abs-
trao de acordo com as alteraes sofridas. A lgica desta funo deve ser
implementada para cada dispositivo em particular, de acordo com a estratgia
utilizada para atualizar sua abstrao.
Note que a escolha da credibilidade afeta a velocidade com que uma in-
formao se torna convel. Valores elevados fazem com que novas informa-
es sejam rapidamente consolidadas como verdadeiras na base de conheci-
116
mento, potencialmente amplicando os efeitos de informaes ruidosas. Por
exemplo, com v = 1, c = 4 e = 1/2, um novo caso passa de v = W = 0 para
V = W = 10 em apenas 5 realimentaes. Com base nestes contadores, o
valor-verdade salta de 0, 5 para v 0, 86 com intervalo de c
1/2
0, 18 - um
valor bastante elevado para poucas realimentaes (e, portanto, propensa a
erros), considerando que uma verdade absoluta tem valor-verdade igual a 1.
3.4.2 Treinamento
O treinamento do sistema de tomada de deciso feito de forma super-
visionada, i.e., atravs de instncias rotuladas com a alternativa esperada. A
partir deste treinamento, duas aes devem ser realizadas pelo sistema:
A base de conhecimento, inicialmente vazia, deve ser carregada com
os valores das instncias rotuladas, criando os contadores iniciais para
cada caso (x, a).
A partir destes dados recm-carregados, os dispositivos devem inferir
suas prprias abstraes para tomada de deciso.
Devido semelhana entre o treinamento e o processo de realimentao
(conforme citado na seo 3.3.1), pode-se reutilizar o Algoritmo 9 para esta
nalidade: para cada instncia de treinamento, aciona-se este mtodo com o
vetor x e a alternativa correspondente a. O valor cr
0
representa a credibilidade
do treinamento, devendo assumir um valor muito maior do que de outras re-
alimentaes (supondo que as instncias iniciais so corretas). Note que se
cr
0
= , o valor-verdade, calculado atravs da equao (3.9), torna-se 1 para
a alternativa correta e 0 para as demais, e impede que este valor seja alterado
por realimentaes futuras.
117
3.5 Exemplos de Dispositivos Adaptativos
Neste trabalho, foram desenvolvidos trs dispositivos adaptativos basea-
dos em mtodos desenvolvidos em trabalhos anteriores, e que, por natureza,
mostravam-se potencialmente adequadas para a incorporao de recursos de
adaptatividade: TDAE, classicador de Bayes e k-Nearest Neighbor. Cada um
deles est descrito a seguir.
3.5.1 TDAE
A Tabela de Deciso Adaptativa Estendida, utilizada como uma das bases
conceituais deste trabalho, tambm um dos dispositivos utilizados para vali-
dar o sistema de tomada de deciso proposto. No entanto, a tabela utilizada
neste trabalho apresenta duas diferenas com relao denio original:
Ao invs de utilizar valores binrios, as entradas da tabela so esten-
didas (i.e., entradas podem assumir valores discretos arbitrrios) para
que critrios nominais possam ser utilizados mais facilmente. A exem-
plo da base de conhecimento, a tabela tambm requer que os valores
numricos sejam discretizados.
No sero permitidas regras reduzidas (i.e., regras que contenham va-
lores nulos associados a um critrio), nem regras conitantes, portanto,
uma regra tem apenas um nico caso equivalente. Apesar de esta limi-
tao impedir que mltiplas regras sejam condensadas em um conjunto
menor, a equivalncia entre regra e caso simplica o processo de atuali-
zao das regras.
Utilizando a notao da seo 2.1.1, o vetor x representado por um sm-
bolo m-dimensional s na tabela, enquanto a alternativa escolhida represen-
118
tada pelo smbolo de sada z da regra. Vale tambm ressaltar que a aplicao
de um regra da TDAE no altera diretamente sua congurao atual c
atual
.
Caso o conjunto de regras venha a ser alterada, as mudanas sero resul-
tado do recebimento de realimentaes, que deve chamar a funo aprende
correspondente TDAE (Algoritmo 12, denido mais adiante).
Dentro do sistema de tomada de deciso proposto,
i
= b/n para a i-
sima alternativa, tal que n a quantidade de regras encontradas, enquanto b
a frequncia com que a alternativa a
i
aparece nas regras encontradas. Este
clculo ilustrado pelo Algoritmo 11, e utilizado pelo Algoritmo 5 apresentado
previamente. Vale ressaltar que esta denio permite que as solues ob-
tidas atravs de dispositivos guiados por regra sejam reescritas na forma de
probabilidades.
Se nenhuma regra for encontrada, = (0, . . . , 0). Ainda que este vetor
no seja normalizado, ele no deve ser aceito pelo critrio de aceitao de
solues, forando, assim, que o prximo dispositivo da la seja utilizado.
Nota: neste trabalho, por no ser permitido o uso de regras reduzidas nem
de regras de mesma condio, o nmero de regras encontradas nunca ser
maior que 1, o que faz com que a alternativa prevista pela regra tenha
i
= 1.
Contudo, a formulao acima mais exvel e extensvel a outros dispositivos
guiados a regra que poderiam apresentar mais de uma regra aplicvel.
Quanto ao aprendizado, as regras das tabelas devem ser atualizadas
medida que novas realimentaes so recebidas, alterando o valor-verdade
dos casos. Caso a alternativa de maior valor-verdade seja alterada, o valor z
da regra correspondente deve ser atualizada com esta nova alternativa. Novos
casos tambm devem ser memorizados na forma de novas regras, retornando
o alternativa de maior valor-verdade. O Algoritmo 12 ilustra este processo de
aprendizado. A funo BD.melhorAlternativa (x) deve retornar a alternativa
119
Algoritmo 11 TDAE.expectativa (x)
Entrada
x: Vetor de caractersticas
Sada
Vetor com as expectativas de certezas
1: (0, 0, . . . , 0)
2: CR
T
buscaRegras (TDAE, x)
3: n [CR
T
[
4: for all r CR
T
do
5: a r.z
6: i index of (a)
7:
i

i
+ 1/n
8: end for
a
i
de maior valor
i
para um determinado vetor x. Note que, neste dispositivo,
a nica informao necessria a alternativa de maior valor-verdade, o que
faz com que os argumentos a, dif
v
e dif
ic
no sejam utilizados neste caso.
3.5.2 Classicador de Bayes
Neste trabalho, o classicador de Bayes, descrito previamente na seo
2.5.2, constitui um dispositivo de menor preciso, mas que pode ser executado
rapidamente, sendo assim, utilizado em casos em que o custo do erro baixo.
Por ser um mtodo probabilstico, seu funcionamento pode ser adaptado ao
sistema de tomada de deciso proposto atribuindo o valor da probabilidade
P (a
i
[x) para a expectativa
i
da alternativa a
i
correspondente.
Dada a formulao original, expressa na equao (2.12), necessrio de-
nir a forma com que os valores P (c) e P
_
x
[i]
[c
_
sero calculados em funo
do valor-verdade. Para o valor de P (c), o clculo realizado somando os
valores-verdade de todas os casos que contm c como alternativa, e dividindo
pela soma de valores-verdade de todos os casos. Supondo que h n vetores
120
Algoritmo 12 TDAE.aprende (x, a, dif
v
, dif
ic
)
Entrada
x: Vetor de caractersticas
a: Alternativa avaliada
dif
v
: Diferena no valor-verdade da alternativa a com relao x
dif
ic
: Diferena no intervalo de conana da alternativa a com relao x
1: a BD.melhorAlternativa (x)
2: CR
T
buscaRegras (TDAE, x)
3: if [CR
T
[ = 0 then
{No existia uma regra para x: criar uma}
{Notao abaixo segue o padro descrito na seo 2.1.1}
4: r (, c
atual
, x, c
atual
, a, )
5: Insere r no conjunto de regras AR
6: else if [CR
T
[ = 1 then
{Atualizar regra existente}
7: r CR
T
[0]
8: if r.z ,= a then
9: r.z a
10: end if
11: Reinsere r no conjunto de regras AR
12: else
13: Situao de erro
14: end if
de caractersticas e p alternativas salvas na base de conhecimento, temos:
P (c) =
S
v
(c)
S
total
, S
v
(c) =
n

i=1
v (x
i
, c) , S
total
=
p

j=1
n

i=1
v (x
i
, c
j
) (3.11)
onde v (x, c) a funo que calcula o valor-verdade da alternativa c para x,
utilizando a equao (3.9). De forma similar, cada elemento P
_
x
[i]
[c
_
pode ser
consultado somando o nmero de vezes que o valor x
[i]
aparece quando um
vetor de caractersticas tem a alternativa c como soluo. Assim:
P
_
x
[i]
[c
_
=
S
u
_
x
[i]
, c
_
S
v
(c)
, S
u
_
x
[i]
, c
_
=
n

j=1
v (x
j
, c) I
_
x
j [i]
= x
[i]
_
(3.12)
onde x
j
o j-simo vetor da base de conhecimento, enquanto x
j [i]
seu valor
associado ao i-simo critrio.
Na prtica, os trs somatrios denidos nas equaes (3.11) e (3.12) so
121
armazenados em memria, para que os clculos destas probabilidades pos-
sam ser realizados com apenas uma nica diviso. O valor de cada somatrio
deve ser atualizado sempre que houver uma mudana em algum de seus ele-
mentos - i.e., sempre que algum valor-verdade for alterado. A atualizao de
qualquer somatrio pode ser feita utilizando a seguinte propriedade:
S
t+1
= S
t
+ dif
i
= S
t
+
_
s
i|t+1
s
i|t
_
(3.13)
onde S
t
um somatrio qualquer em um instante t, enquanto s
i|t
o valor
do i-simo elemento do somatrio em um instante t. Se este valor, em um
instante t + 1, tiver sido alterado, a contribuio antiga s
i|t
deve ser removida,
substituindo-a pelo novo valor s
i|t+1
.
Como o sistema fornece as diferenas no valor-verdade aos dispositivos,
pode-se simplesmente somar o efeito desta diferena em cada um dos trs
somatrios. Logo, se o valor-verdade de um caso (x
b
, c
b
) for alterado, temos:
S
v
(c
b
)
t+1
= S
v
(c
b
)
t
+ dif
v
_
x
b [i]
, c
b
_
(3.14)
S
u
_
x
[i]
, c
b
_
t+1
= S
u
_
x
[i]
, c
b
_
t
+ dif
v
(x
b
, c
b
) I
_
x
b [i]
= x
[i]
_
(3.15)
S
total t+1
= S
total t
+ dif
v
(x
b
, c
b
) (3.16)
onde dif
v
(x
b
, c
b
) diferena do valor-verdade vericado no caso citado. Note
que esta a diferena estimada pelo Algoritmo 6, e pode, inclusive, ser nega-
tiva, caso o valor-verdade tenha diminudo.
Os Algoritmos 13 e 14 ilustram como os somatrios so utilizados para
o clculo das expectativas de certeza, e como so atualizados a partir das
alteraes causadas por realimentaes.
122
Algoritmo 13 Bayes.expectativa (x)
Entrada
x: Vetor de caractersticas
Sada
Vetor com as expectativas de certeza
1: (0, 0, . . . , 0)
2: for j = 1 p do
{Calcular P (a
j
)}
3: P S
v
(a
j
) /S
total
{Calcular
m

i=1
P
_
x
[i]
[a
j
_
}
4: prod 1
5: for i = 1 m do
6: prod prod S
u
_
x
[i]
, a
j
_
/S
v
(a
j
)
7: end for
8:
i
P prod
9: end for
{Calcular evidncia Z (x)}
10: Z = 0
11: for j = 1 p do
12: Z Z +
i
13: end for
{Normalizar pela evidncia}
14: for j = 1 p do
15:
i

i
/Z
16: end for
Algoritmo 14 Bayes.aprende (x, a, dif
v
, dif
ic
)
Entrada
x: Vetor de caractersticas
a: Alternativa avaliada
dif
v
: Diferena no valor-verdade da alternativa a com relao x
dif
ic
: Diferena no intervalo de conana da alternativa a com relao x
1: S
total
S
total
+ dif
v
2: S
v
(a) S
v
(a) + dif
v
3: for i = 1 m do
4: S
u
_
x
[i]
, a
_
S
u
_
x
[i]
, a
_
+ dif
v
5: end for
123
3.5.3 k-Nearest Neighbor
Por m, o mtodo k-NN proporciona, neste trabalho, um dispositivo com
tempo de resposta muito maior que os demais, porm, de maneira geral, mais
preciso. Apesar de que algoritmos mais rpidos e precisos existam - e.g.,
random forests (CARUANA; NICULESCU-MIZIL, 2006) - a difuso e popularidade
do k-NN o torna atraente como parmetro de comparao.
Utilizando o k-NN ponderado da equao (2.4) como base, a probabilidade
no-normalizada de um vetor x ter c como soluo, baseado nos k vizinhos
mais prximos, descrita conforme a equao (3.17).
P (c[x) =
k

i=1
I (x, c) w(x, x
i
) (3.17)
Todavia, diferentemente desta denio, que faz uso da funo indicadora,
a disponibilidade do valor-verdade faz com que um vetor x no tenha uma
nica soluo, mas sim, graus de pertinncia em cada soluo. Alm disso,
o intervalo de conana possibilita realizar uma ponderao dos casos, fa-
vorecendo aqueles com intervalos menores. Assim, substituindo-se a funo
indicadora por v (x, c) e considerando a contribuio do intervalo de conana
c (x, c) (calculado atravs da equao (3.10)), tem-se:
P (c[x) =
k

i=1
v (x
i
, c) w(x, x
i
) b (x
i
, c) (3.18)
b (x, a) = 1 2c (x, a) (3.19)
onde 0 b (x, a) 1 uma funo peso que faz uso do intervalo de conana
c (x, a), calculado conforme mostra a equao (3.10). O valor deste intervalo
varia entre 1/2 e 0.
Aps o clculo de P (c[x) de cada alternativa, a expectativa de certeza
124
pode ser extrada normalizando-se estas probabilidades:

i
=
P (a
i
[x)
p

j=1
P (a
j
[x)
(3.20)
O Algoritmo 15 ilustra como o dispositivo k-NN est internamente estru-
turado. O mtodo BD.nn(x, k) retorna os k vizinhos mais prximos de x, de
acordo com alguma funo de distncia. A escolha do valor k deve ser feita
atravs de algum critrio que melhor se adeque ao problema a ser solucio-
nado, conforme mostrado na seo 2.5.1.1.
De forma similar, a escolha da funo de distncia deve ser feita respei-
tando os requisitos de desempenho do sistema, escolhendo aquele com me-
lhor custo-benefcio - uma avaliao de cada funo de distncia deve ser
realizada para determinar qual delas a mais adequada para o problema a
ser solucionado. Neste trabalho, utiliza-se a distncia Euclidiana previamente
denida pela equao (2.7), fazendo uso do Value Difference Metric para o
clculo de distncia entre valores nominais, conforme denido na equao
(2.11).
Igualmente semelhante, a escolha da funo de ponderao w(a, b) tam-
bm deve ser feita por sistema. A funo utilizada neste trabalho foi o mtodo
de Shepard descrita em (2.5), com P = 2.
Note que a base de conhecimento consultada para a busca dos vizinhos
mais prximos, armazena apenas valores discretizados para os valores num-
ricos. Como o clculo de distncia depende dos valores numricos verdadei-
ros, alguma aproximao deve ser feita para transformar o valor discretizado
de volta em um valor numrico na escala verdadeira. Para o EWD (apresen-
tado na seo 2.2.1), uma possibilidade utilizar o valor central do intervalo
que o valor discretizado representa. Assim, para um determinado valor dis-
125
creto i, seu valor aproximado na escala verdadeira pode ser calculado atravs
da equao (3.21):
ap (i) =
lim
+
[i] + lim

[i]
2
(3.21)
onde lim
+
[i] e lim

[i] so os limites superiores e inferiores do intervalo que


o valor discreto i representa. Como exemplo, para um valor discreto que re-
presenta o intervalo [5 25], seu valor aproximado na escala verdadeira ser
5 + 25/30 = 15. A seo 4.3.2 analisa os efeitos desta aproximao sobre o
desempenho do sistema.
Enm, deve-se notar que o k-NN no mantm abstraes prprias, de-
pendendo exclusivamente das informaes provenientes da base de conheci-
mento. Esta caracterstica faz com que a funo aprende (x, a, dif
v
, dif
ic
) para
o k-NN seja nula.
Algoritmo 15 kNN.expectativa (x)
Entrada
x: Vetor de caractersticas
Sada
Vetor com as expectativas de certeza
1: P (0, 0, . . . , 0)
2: (0, 0, . . . , 0)
3: V izinhos BD.nn(x, k)
4: total 0
5: for j = 1 p do
6: for i = 1 k do
7: x
i
V izinhos [i]
8: v v (x
i
, a
j
)
9: b 1 2 c (x
i
, a
j
)
10: w = peso (x, x
i
)
11: P
j
P
j
+ v w b
12: end for
13: total total + P
j
14: end for
15: for j = 1 p do
16:
j
P
j
/total
17: end for
126
4 RESULTADOS
Este captulo apresenta os experimentos realizados para validar a pro-
posta apresentada neste trabalho, analisa seus resultados e os compara com
os obtidos aplicando-se outras tcnicas de tomada de deciso.
4.1 Sistema Experimental
O sistema experimental utilizado para validar a proposta composto por
dois dos dispositivos descritos anteriormente, na seguinte ordem:
1. O ponto de entrada da la de dispositivos o classicador de Bayes.
Para critrios numricos, ao invs de utilizar funes especcas por dis-
tribuio (e.g., funo (2.13) para valores que seguem uma distribuio
normal), seus valores so discretizados e utilizados como categorias de
um critrio nominal, conforme descrito na seo 2.2.1.
2. Caso a soluo do classicador Bayes no satisfaa a condio de sada
da la, o mtodo k-NN utilizado em seu lugar para buscar uma soluo.
Para simplicao, utiliza-se um valor xo k = 10 para o nmero de
vizinhos a ser considerado.
3. A mtrica para critrios nominais o Value Difference Metric, enquanto a
funo de ponderao escolhida o mtodo de Shepard, conforme est
descrito na seo 3.5.3.
127
Nota: ainda que seja prefervel utilizar mtodos mais robustos para a es-
colha de um valor timo para k em cada dataset a ser utilizado para validao
(KOHAVI, 1995; OUYANG; LI; LI, 2006), um valor xo permite analisar o problema
sem inserir variveis adicionais que possam interferir nos resultados.
Este sistema tambm apresenta a seguinte congurao inicial:
O valor de reforo relativo entre realimentaes positivas e negativas
o mesmo, i.e.,
+
=

= 1/2.
O mtodo de discretizao utilizado o Equal Width Discretization
(EWD), dividindo o espao de valores numricos em 10 intervalos de
mesma largura.
A condio de sada da la dada pela funo de limiar denida em
(3.1). O valor do limiar, contudo, denido por experimento.
Caso nenhum dispositivo consiga uma soluo que satisfaa a condio
de sada da la, a soluo obtida com o uso do ltimo dispositivo ser
utilizada, conforme descrito no Algoritmo 7.
Partindo do pressuposto que as instncias rotuladas destes datasets so
isentas de erros, a credibilidade do treinamento inicial cr
0
= .
Caso algum teste faa uso de valores diferentes destes citados acima, tais
diferenas sero explicitamente descritas no texto, juntamente com a apre-
sentao do experimento. Outras propriedades - tais como a quantidade de
instncias rotuladas utilizadas para treinamento, o valor do limiar de sada da
la e o uso das realimentaes - so denidas particularmente para cada ex-
perimento.
Os testes foram realizados utilizando datasets fornecidos pelo reposit-
rio de aprendizado de mquina da UCI (FRANK; ASUNCION, 2011), frequente-
128
mente utilizado como base de comparaes entre algoritmos de classicao,
regresso e aprendizado de mquina.
4.2 Metodologia
Para a realizao de cada experimento, foi adotado um mtodo de Monte-
Carlo (CHEN, 1995) para obter os parmetros de desempenho do sistema,
conforme descrito abaixo:
1. Determinar os parmetros de sada a serem medidos - neste caso, taxa
de acerto e tempo de resposta;
2. Determinar a congurao inicial do sistema;
3. Determinar a quantidade de instncias a ser utilizada para treinamento;
4. Para cada dataset a ser testado:
(a) Treinar o sistema um subconjunto das instncias rotuladas (con-
junto de treinamento), escolhidas de forma aleatria;
(b) Validar o sistema com o restante das instncias (conjunto de tes-
tes):
i. Para cada instncia rotulada (x, a
instancia
) do conjunto de testes:
A. Executar o sistema com x;
B. Vericar se a alternativa retornada a
retorno
igual alterna-
tiva esperada a
instancia
;
ii. Totalizar o nmero de acerto;
iii. Totalizar o tempo de execuo;
(c) Iterar item 4b m vezes para o mesmo dataset ;
129
(d) Extrair a mdia da taxa de acerto. Para isso, dividir o total de acerto
pelo total de instncias testadas;
(e) Extrair a mdia do tempo de resposta. De forma anloga, dividir o
tempo total gasto pelo total de instncias testadas;
(f) Analisar os resultados obtidos neste dataset ;
5. Analisar os resultados globais do experimento.
O treinamento para um dataset em particular feito alimentando o sistema
com um subconjunto das instncias sorteadas aleatoriamente, compondo seu
conhecimento inicial. Para isso, utiliza-se o algoritmo 9, acionando-o mltiplas
vezes - uma vez para cada instncia (x, a
instancia
) sorteada - com valor de cre-
dibilidade cr
0
. A porcentagem de instncias utilizadas para treinamento deve
ser denida previamente. Um valor habitualmente utilizado nos estudos en-
volvendo aprendizado de mquina 70% (esta partio tambm conhecida
como 70/30).
Os 30% restantes das instncias devem ser utilizados para medir a taxa de
acerto e o tempo de resposta do sistema. Para cada instncia, seu conjunto x
enviado ao algoritmo 8, na esperana que sua sada seja igual alternativa
correta a
instancia
. A quantidade de acertos dividida pelo total destas instncias
resulta na taxa de acerto, enquanto o tempo de resposta a mdia do tempo
gasto por instncia. Tal medio permite analisar como o desempenho do
sistema afetado em funo dos parmetros de entrada - ou ainda, vericar
como estes parmetros de sada se relacionam, levantando uma curva de
desempenho, que mostra a taxa de acerto em funo do tempo de resposta -
similar curva SAT citada na seo 1.2.
O nmero de iteraes m deve ser escolhido de forma a minimizar o erro
padro das estimativas da mdia da taxa de acerto e do tempo de resposta.
130
Este erro padro dado por =

m
, onde o desvio padro da mdia do
parmetro estimado (HOLTON, 2004). Logo, para reduzir o erro padro para
uma frao f do desvio padro, deve-se escolher m = (1/f)
2
. Como exemplo,
adotando um valor arbitrrio f = 5%, deve-se utilizar m = 400 - este o valor
adotado neste trabalho.
Note que o sorteio destas instncias refeito em cada iterao do data-
set, para que a medio do desempenho seja feita com base em subconjuntos
de treinamento distintos, tornando seu resultado estatisticamente mais signi-
cante - uma propriedade importante do mtodo de Monte-Carlo.
4.3 Anlises Preliminares
Esta seo apresenta uma srie de experimentos realizados sobre cada
dispositivo de forma individual, permitindo obter resultados a serem utilizados
como base de comparao para o sistema proposto neste trabalho. Em parti-
cular, realizada uma comparao entre os desempenhos do classicador de
Bayes e do k-NN, alm de uma anlise individual do desempenho da TDAE.
4.3.1 Comparativo de Desempenho entre o Classicador de
Bayes e o k-NN
Como base de comparao, o k-NN e o classicador de Bayes foram tes-
tados individualmente com uma srie de datasets a m de obter suas respec-
tivas taxas de acerto e tempos de resposta. Esta anlise preliminar permite
vericar se verdadeira a premissa de que o dispositivo mais lento (k-NN)
possui, na maior parte dos casos, melhor taxa de acerto. Para este m, dois
sistemas experimentais foram construdos conforme as especicaes apre-
sentadas na seo 4.1. Em cada um deles, contudo, utilizado apenas um
131
dispositivo (k-NN em um caso, classicador de Bayes no outro), para que seja
possvel analisar seu comportamento individual.
Em cada dataset, o conjunto de treinamento composto por 70% das
instncias rotuladas (sorteadas de forma aleatria), enquanto os demais 30%
so utilizados para validao, permitindo estimar a taxa de acerto e o tempo
de resposta. Este processo iterado 400 vezes, conforme descrito na seo
4.2.
Como o sistema composto por apenas um dispositivo, no denido um
valor para o limiar para a condio de sada da la (i.e., o critrio de acei-
tao). Alm disso, para evitar que o aprendizado incremental interra nos
resultados deste experimento, nenhum bloco de auto-anlise ser utilizado
(ver Algoritmo 8). De maneira complementar, utilizado cr
repetition
= 0 para
remover a inuncia do vis de repetio sobre o aprendizado.
A Tabela 7 mostra as caractersticas de cada dataset, informando a quan-
tidade de instncias presentes em cada um deles, alm da quantidade de
critrios (tanto nominais como numricos) e de alternativas.
Em comparao, a Tabela 8 mostra as medidas obtidas pelos dispositivos
em cada um dos datasets, enquanto o grco da Figura 22 compara as taxas
de acerto entre os dispositivos.
Percebe-se que, na maior parte dos datasets, a premissa mostra-se ver-
dadeira: apesar de mais lento, o k-NN obteve taxas de acerto superiores em
17 dos 20 datasets analisados. Tambm pode ser notado que datasets que
fazem uso de critrios nominais so proporcionalmente muito mais lentos no
k-NN. Este comportamento j era esperado, pois o clculo de distncia para
critrios nominais atravs do Value Difference Metric possui complexidade su-
perior quando comparada com o clculo de distncia para critrios numricos.
132
Instncias
Critrios
Alternativas
Numricos Nominais
Blood Transfusion 748 4 0 2
Car Evaluation 1728 0 6 4
Cardiotocography Class 2126 21 0 10
Cardiotocography NSP 2126 21 0 3
Contraceptive Method 1473 2 7 3
Credit Aproval 690 6 9 2
Ecoli 336 7 0 8
Glass Identication 214 9 0 7
Hayes-Roth 132 4 0 3
ILPD 583 9 1 2
Iris 150 4 0 3
Nursery 12960 0 8 5
Page Blocks 5473 10 0 5
Pima Indians Diabetes 768 8 0 2
Shuttle 58000 9 0 7
Statlog (German Credit) 1000 7 13 2
Teaching Assistant 151 1 4 3
Tic-Tac-Toe 958 0 9 2
Vertebral Column 310 6 0 3
Yeast 958 8 0 10
Tabela 7: Descrio dos datasets testados.
Para vericar a signicncia deste resultado, realizado um teste de hip-
tese que verica se a taxa de acerto do k-NN , de fato, maior nestes datasets.
Para isso, armazenada, em cada uma das 400 iteraes, a diferena entre
as taxas de acerto do k-NN e do classicador de Bayes. Em seguida, so
estipuladas as seguintes hipteses:
H
0
(hiptese nula): Mdia das diferenas menor ou igual a zero
H
1
(hiptese alternativa): Mdia das diferenas maior que zero
A partir desta amostra com as 400 diferenas, so calculados a mdia e o
erro padro correspondentes. Em seguida, o valor-p calculado e comparado
ao nvel de signicncia escolhido (neste caso, = 5%). Se o valor-p
menor, H
1
aceita, caso contrrio, a hiptese H
0
no pode ser rejeitada. O
Anexo B mostra como este clculo realizado.
133
Bayes k-NN
Acertos Tempo (ms) Acertos Tempo (ms)
Blood Transfusion 74,9684% 0,0066 75,7893% 0,0526
Car Evaluation 83,5116% 0,0201 95,3998% 1,2393
Cardiotocography Class 66,3127% 0,1068 76,2955% 3,8177
Cardiotocography NSP 80,8871% 0,0677 91,0925% 3,8033
Contraceptive Method 49,8931% 0,0313 50,7534% 3,8033
Credit Aproval 83,9087% 0,0140 84,6702% 0,8141
Ecoli 79,9317% 0,0274 85,7436% 0,1571
Glass Identication 54,0123% 0,0205 66,8369% 0,1156
Hayes-Roth 77,8050% 0,0063 71,9313% 0,0340
ILPD 63,9063% 0,0162 67,4274% 0,3248
Iris 92,2522% 0,0069 95,6152% 0,0430
Nursery 90,4538% 0,0106 98,9265% 15,6695
Page Blocks 91,0566% 0,0182 92,1772% 0,3705
Pima Indians Diabetes 75,1316% 0,0235 73,2476% 0,3766
Shuttle 87,8446% 0,0209 97,5672% 0,1183
Statlog (German Credit) 74,8601% 0,0213 71,0631% 1,9723
Teaching Assistant 51,8679% 0,0058 53,0337% 0,0597
Tic-Tac-Toe 70,2066% 0,0117 90,0660% 0,8602
Vertebral Column 70,7170% 0,0125 75,4085% 0,1184
Yeast 57,0370% 0,0534 57,0426% 0,5928
Tabela 8: Mdias da taxa de acerto e tempo de resposta de cada dispositivo
nos datasets testados.
A Tabela 9 apresenta os resultados do teste de hiptese para cada dataset.
Percebe-se que a maioria dos testes favorece amplamente a ideia de que a
diferena entre as taxas de acerto maior que zero, pois o valor-p inferior
ao escolhido. Nos datasets Hayes-Roth, Pima Indians Diabetes e Statlog,
por outra lado, a diferena negativa, o que faz com que no seja possvel
rejeitar a hiptese nula. Por m, apesar de a diferena ser positiva no Yeast,
ela mnima, e tambm no permite concluir que a mdia maior que zero.
Nos quatro datasets em que no possvel concluir que a diferena
maior que zero, realiza-se um segundo teste que verica se a diferena
menor que zero. Logo:
H
0
(hiptese nula): Mdia das diferenas maior ou igual a zero
134
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
Blood Transfusion
Car Evaluation
Cardiotocography Class
Cardiotocography NSP
Contraceptive Method
Credit Aproval
Ecoli
Glass Identification
Hayes-Roth
ILPD
Iris Nursery
Page Blocks
Pima Indians Diabetes
Shuttle
Statlog (German Credit)
Teaching Assistant
Tic-Tac-Toe
Vertebral Column
Yeast
Taxa de Acerto por Dataset
Bayes k-NN
Figura 22: Mdia da taxa de acerto de cada dispositivo nos datasets utilizados
para testes.
H
1
(hiptese alternativa): Mdia das diferenas menor que zero
A Tabela 10 mostra que os trs datasets com diferena negativa, de fato,
favorecem a hiptese de que a diferena menor que zero. Por outro lado,
tambm mostra que Yeast o nico dataset em que no possvel armar se
a diferena era maior ou menor que zero - note que este resultado no implica
necessariamente que a mdia zero.
A partir destes resultados, pode-se armar, com alta signicncia, que o
mtodo k-NN mais preciso do que o classicador de Bayes na maior parte
dos datasets testados - mais especicamente, 16 dentre os 20. Tal resultado
valida a premissa inicial necessria para realizar os experimentos a seguir.
135
Mdia E. Padro valor-p Rejeita H
0
Blood Transfusion 0,0082 0,00388 1,85 10
-02
Sim
Car Evaluation 0,1198 0,00233 1,76 10
-73
Sim
Cardiotocography Class 0,0998 0,00252 8,27 10
-63
Sim
Cardiotocography NSP 0,1021 0,00218 9,96 10
-70
Sim
Contraceptive Method 0,0086 0,00296 2,25 10
-03
Sim
Credit Aproval 0,0076 0,00310 7,89 10
-03
Sim
Ecoli 0,0581 0,00471 4,79 10
-22
Sim
Glass Identication 0,1282 0,00770 9,22 10
-31
Sim
KHayes-Roth -0,0587 0,01018 1 No
ILPD 0,0352 0,00457 5,31 10
-12
Sim
Iris 0,0336 0,00461 3,51 10
-11
Sim
Nursery 0,0819 0,00050 8,94 10
-123
Sim
Page Blocks 0,0112 0,00118 6,00 10
-16
Sim
Pima Indians Diabetes -0,0188 0,00353 1 No
Shuttle 0,0972 0,00303 2,08 10
-54
Sim
Statlog (German Credit) -0,0380 0,00310 1 No
Teaching Assistant 0,0117 0,00292 3,56 10
-05
Sim
Tic-Tac-Toe 0,1986 0,00324 6,95 10
-81
Sim
Vertebral Column 0,0469 0,00591 1,58 10
-12
Sim
Yeast 5,6 10
-5
0,00249 4,91 10
-01
No
Tabela 9: Resultados do teste de hiptese da diferena entre as taxas de
acerto do classicador Bayes e do k-NN ser maior que zero.
Mdia E. Padro valor-p Rejeita H
0
Hayes-Roth -0,0587 0,01018 4,55 10
-08
Sim
Pima Indians Diabetes -0,0188 0,00353 2,93 10
-07
Sim
Statlog (German Credit) -0,0380 0,00310 6,95 10
-22
Sim
Yeast 5,6 10
-5
0,00249 5,09 10
-01
No
Tabela 10: Resultados do teste de hiptese da diferena entre as taxas de
acerto do classicador Bayes e do k-NN ser menor que zero.
4.3.2 Efeitos da Discretizao
Dentre as caractersticas apresentadas na seo 4.1, o mtodo de discre-
tizao aquela que tem maior inuncia sobre todos os dispositivos utiliza-
dos. Enquanto algumas caractersticas so inerentes apenas ao sistema em
si (e.g., a escolha do limiar), ou ento, so particulares de um dispositivo in-
dividual (e.g., a escolha do valor k para o k-NN), a discretizao afeta tanto o
classicador de Bayes como o k-NN, alterando seus desempenhos individuais,
136
e, consequentemente, o desempenho global do sistema.
Para vericar a extenso desta inuncia, foi realizado um experimento
idntico ao apresentado na seo 4.3.1, contudo, utilizando 100 intervalos
para o EWD no lugar de 10. Em seguida, as taxas de acerto e os tempos de
resposta em cada dispositivo so comparados com os resultados anteriores.
No caso particular do k-NN, tambm foi feito um teste sem discretizao, no
qual as instncias numricas so armazenadas na base com seu valor real.
A Figura 23 mostra como a taxa de acerto do classicador de Bayes
afetada pela escolha do nmero de intervalos. Na maior parte dos datasets,
um acrscimo no nmero de intervalos acarretou uma perda na taxa de acerto
(e.g., perda de 36,27% no Ecoli ), uma vez que isso leva a um aumento no
nmero de possveis combinaes de valores discretos. Como muitas destas
combinaes acabam no recebendo instncias de treinamento, o poder de
deciso nestes espaos vazios acaba sendo prejudicado. A Figura 24 ilustra
um exemplo de como estes espaos vazios acabam surgindo.
Uma exceo, contudo, a taxa de acerto do Shuttle, em que houve um
ganho de 7,46%. Note que este o dataset com maior nmero de instncias,
fazendo com que o nmero maior de intervalos seja favorvel para melhor
discernir valores numricos.
J a taxa de acerto do mtodo k-NN mostra-se muito menos sensvel ao
nmero de intervalos: ela se mantm estvel, muito prximo da taxa obtida
pelo k-NN original (i.e., sem discretizao), conforme mostra a Figura 25.
Comparando a taxa entre do k-NN com discretizao em 10 intervalos em
relao ao original, a diferena superior a 2% em apenas 4 datasets: Blood
Transfusion (-2,66%), Page Blocks (3,64%), Shuttle (2,33%) e Teaching Assis-
tant (4,24%).
137
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
Blood Transfusion
Car Evaluation
Cardiotocography Class
Cardiotocography NSP
Contraceptive Method
Credit Aproval
Ecoli
Glass Identification
Hayes-Roth
ILPD
Iris Nursery
Page Blocks
Pima Indians Diabetes
Shuttle
Statlog (German Credit)
Teaching Assistant
Tic-Tac-Toe
Vertebral Column
Yeast
Taxa de Acerto do Bayes por Dataset
EWD com 100 intervalos EWD com 10 intervalos
Figura 23: Mdia da taxa de acerto do classicador de Bayes de acordo com
a discretizao utilizada.
Esta estabilidade, contudo, se inverte quando o tempo de resposta uti-
lizado como parmetro de comparao: um aumento no nmero de interva-
los faz com que a quantidade-limite de casos armazenados pela base de co-
nhecimento aumente, potencialmente aumentando a quantidade de casos ar-
mazenados para um mesmo conjunto de treinamento, e, consequentemente,
tornando o k-NN mais lento. No exemplo da Figura 24, a primeira discreti-
zao gera, no mximo, 9 combinaes, enquanto a segunda discretizao
pode gerar at 36 para o mesmo conjunto de treinamento - note que apenas
25 combinaes realmente esto presentes na base de conhecimento, mas
ainda assim, deve apresentar maior lentido com relao ao exemplo com 9
combinaes.
A Figura 26 mostra a razo entre o tempo de resposta obtido pelos dis-
positivos com 100 intervalos e o tempo de resposta obtido pelos mesmos dis-
positivos, mas com 10 intervalos. Note que, no classicador de Bayes, esta
138
3x3 6x6
Figura 24: Exemplo bidimensional de discretizao, com duas alternativas:
crculo e tringulo. Para 3 intervalos discretos, a instncia marcada com es-
trela pode ser facilmente classicada, enquanto para 6 intervalos, impossvel
solucion-la, pois no h nenhuma instncia em nenhum dos dois eixos. Ou-
tros espaos vazios esto pintados de preto.
razo se mantm prxima de 1, enquanto no k-NN, esta razo sempre foi
maior que 1, i.e., o k-NN com 100 intervalos nunca foi mais rpido que o k-NN
com 10 intervalos. Esta diferena mais evidente nos datasets numricos
com uma quantidade maior de instncias: Page Blocks (razo de 15,887) e
Shuttle (razo de 271,967).
Estes resultados evidenciam a importncia da escolha de um nmero ade-
quado de intervalos para a discretizao, uma vez que tanto o tempo de res-
posta como a taxa de acerto podem ser signicativamente prejudicados por
uma escolha inadequada.
4.3.3 Taxa de Acerto da TDAE
Diferentemente do classicador de Bayes e do k-NN, uma tabela de de-
ciso capaz de solucionar apenas casos j previstos em seu conjunto de
regras, limitando seus acertos s instncias previamente treinadas. Como
os conjuntos de treinamento e de testes gerados pelo processo denido na
139
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
Blood Transfusion
Car Evaluation
Cardiotocography Class
Cardiotocography NSP
Contraceptive Method
Credit Aproval
Ecoli
Glass Identification
Hayes-Roth
ILPD
Iris Nursery
Page Blocks
Pima Indians Diabetes
Shuttle
Statlog (German Credit)
Teaching Assistant
Tic-Tac-Toe
Vertebral Column
Yeast
Taxa de Acerto do k-NN por Dataset
EWD com 100 intervalos EWD com 10 intervalos Sem Discretizar
Figura 25: Mdia da taxa de acerto do k-NN de acordo com a discretizao
utilizada.
seo 4.2 so disjuntos (i.e., sem elementos em comum, partindo do pres-
suposto de que os datasets no contm instncias repetidas), a medio da
taxa de acerto da TDAE (sem a ajuda de um mtodo auxiliar) no aparenta
ser justicvel - de fato, para um dataset puramente nominal, a taxa de acerto
zero.
Contudo, para problemas que utilizem critrios numricos, os valores ar-
mazenados nas regras no representam categorias, mas sim, valores discre-
tizados que, por sua vez, representam intervalos de valores reais. Logo, uma
regra, mesmo que completa (i.e., com todos os seus valores preenchidos),
pode abranger uma quantidade teoricamente innita de instncias - lembrar
que existem innitos nmeros reais dentro de qualquer intervalo real comcom-
primento maior que zero. Como exemplo, a Tabela 11 representa a discretiza-
o da Tabela 2 apresentada anteriormente. Nela, as instncias x
1
= (5, 80%)
e x
2
= (6, 100%) so discretizadas para um mesmo valor, resultando em (1, 1)
140
0.1
1
10
100
1000
B
l
o
o
d

T
r
a
n
s
f
u
s
i
o
n

C
a
r

E
v
a
l
u
a
t
i
o
n

C
a
r
d
i
o
t
o
c
o
g
r
a
p
h
y

C
l
a
s
s

C
a
r
d
i
o
t
o
c
o
g
r
a
p
h
y

N
S
P

C
o
n
t
r
a
c
e
p
t
i
v
e

M
e
t
h
o
d

C
r
e
d
i
t

A
p
r
o
v
a
l

E
c
o
l
i

G
l
a
s
s

I
d
e
n
t
i
f
i
c
a
t
i
o
n

H
a
y
e
s
-
R
o
t
h

I
L
P
D

I
r
i
s

N
u
r
s
e
r
y

P
a
g
e

B
l
o
c
k
s

P
i
m
a

I
n
d
i
a
n
s

D
i
a
b
e
t
e
s

S
h
u
t
t
l
e

S
t
a
t
l
o
g

(
G
e
r
m
a
n

C
r
e
d
i
t
)

T
e
a
c
h
i
n
g

A
s
s
i
s
t
a
n
t

T
i
c
-
T
a
c
-
T
o
e

V
e
r
t
e
b
r
a
l

C
o
l
u
m
n

Y
e
a
s
t

Razo do Tempo de Resposta com relao ao EWD com 10 Intervalos
Bayes com 100 intervalos k-NN com 100 intervalos k-NN Real
Figura 26: Razo entre o tempo de resposta dos dispositivos com 100 inter-
valos e o tempo do mesmo dispositivo, mas com 10 intervalos.
e caem em uma mesma regra r
2
, ainda que seus valores numricos originais
sejam distintos.
r
1
r
2
r
3
r
4
Mdia 2 ( 7) 1 ([5 7[) 0 (< 5)
Frequncia 1 ( 70%) 1 ( 70%) 0 (< 70%)
Aprovado S
Recuperao S
Reprovado S S
Tabela 11: Exemplo de tabela de deciso com valores discretos. Entre parn-
teses, o intervalo real que cada valor discreto representa.
Dessa forma, para problemas com critrios numricos, possvel obter
uma taxa de acerto maior que zero, dependendo da distncia entre as ins-
tncias treinadas e do mtodo de discretizao utilizado. A Tabela 12 mostra
a taxa de acerto e tempo de resposta da TDAE para os mesmos datasets
141
testados anteriormente, utilizando o EWD com 10 intervalos conforme expli-
cado na seo 4.1. De forma geral, aqueles que possuem critrios numricos
conseguiram uma taxa de acerto maior que zero (destaque para o Shuttle,
cuja taxa de acerto de quase 95%, impulsionada pela grande quantidade
de instncias que preenchem todo o espao de valores possveis), enquanto
problemas estritamente nominais tiveram taxa de acerto zero, conforme espe-
rado. J o tempo de resposta varia de acordo com a quantidade de instncias,
mantendo-se abaixo do tempo obtido pelo k-NN, contudo, acima do classica-
dor de Bayes.
TDAE Critrios
Acertos Tempo (ms) Numricos Nominais
Blood Transfusion 68,1813% 0,0118 4 0
Car Evaluation 0,0000% 0,2497 0 6
Cardiotocography Class 6,6873% 0,7710 21 0
Cardiotocography NSP 7,1207% 0,7672 21 0
Contraceptive Method 12,7223% 0,1517 2 7
Credit Aproval 2,4952% 0,0905 6 9
Ecoli 10,8059% 0,0559 7 0
Glass Identication 9,5300% 0,0273 9 0
Hayes-Roth 50,2625% 0,0109 4 0
ILPD 17,4354% 0,0736 9 1
Iris 36,9761% 0,0135 4 0
Nursery 0,0000% 5,0152 0 8
Page Blocks 82,5776% 0,0263 10 0
Pima Indians Diabetes 2,7281% 0,1064 8 0
Shuttle 94,1146% 0,0256 9 0
Statlog (German Credit) 0,2814% 0,2793 7 13
Teaching Assistant 35,7821% 0,0122 1 4
Tic-Tac-Toe 0,0000% 0,1792 0 9
Vertebral Column 14,0638% 0,0352 6 0
Yeast 21,4955% 0,1818 8 0
Tabela 12: Taxa de acerto e tempo de resposta da TDAE nos datasets utiliza-
dos para testes, sem a ajuda de um mtodo auxiliar.
Nota: o dataset Teaching Assistant possui instncias repetidas, o que
causa um aumento na taxa de acerto, pois caso uma destas instncias seja
utilizada para treinamento, a outra instncia, de testes, deve ser corretamente
142
solucionada, a menos que outras instncias de treinamento caiam no mesmo
valor discreto e alterem a alternativa da regra.
4.4 Compromisso entre Taxa de Acerto e Tempo
de Resposta
O primeiro experimento efetivamente realizado neste trabalho foi vericar
a possibilidade de controlar a relao de compromisso entre taxa de acerto
e tempo de resposta do sistema proposto, e, em caso positivo, vericar como
estes parmetros de sada se relacionam.
O tempo de resposta do sistema est diretamente relacionado frequn-
cia com que os dispositivos mais lentos so acessados: quanto mais frequen-
temente forem utilizados, maior deve ser o tempo mdio de resposta. Logo,
a estriticidade imposta pela condio de sada da la de dispositivos deve re-
ger quanto tempo, em mdia, deve ser gasto em cada instncia de entrada. O
termo estriticidade, neste contexto, indica o quo provvel uma soluo rejei-
tada - quanto maior o nmero de solues rejeitadas, maior ser a frequncia
de uso dos outros dispositivos.
De maneira similar, a taxa de acerto tambm depende da frequncia com
que cada dispositivo acessado: o nmero de acertos deve aumentar ao
repassar uma quantidade maior de problemas aos dispositivos mais precisos.
Caso seja verdadeira a armao de que dispositivos mais lentos so mais
precisos, condies de sada mais restritivas fazem com que tanto a taxa de
acerto como o tempo de resposta aumentem em decorrncia do uso mais
frequente destes dispositivos.
Partindo da funo de aceitao 3.1, a estriticidade da condio de sada
da la est diretamente ligada ao valor do limiar escolhido: valores maiores
143
diminuem a probabilidade de uma soluo qualquer ser aceita, aumentando a
frequncia de acesso aos dispositivos mais lentos. Dessa forma, o que este
experimento efetivamente avalia o efeito da escolha deste limiar sobre a taxa
de acerto e o tempo de resposta, utilizando os datasets citados previamente.
De maneira similar ao experimento preliminar, no utilizada nenhuma
forma de realimentao durante a tomada de deciso, para evitar que ela in-
terra nos resultados.
4.4.1 Sistema Experimental
Em um primeiro teste, verica-se a relao entre taxa de acerto e tempo
de resposta do sistema experimental proposto, composto pelo classicador
de Bayes e pelo k-NN. Pela anlise preliminar da seo 4.3.1, percebe-se
que o k-NN no s o dispositivo mais lento, mas tambm aquele de maior
taxa de acerto na maior parte dos datasets avaliados, satisfazendo, assim, as
premissas necessrias para a execuo deste experimento.
Para cada dataset, o processo denido na seo 4.2 repetido com dife-
rentes valores para o limiar - entre 0, 00 e 1, 00, em passos de 0, 02. Em cada
limiar, o sistema experimental testado 400 vezes, sorteando aleatoriamente
70% das instncias para treinamento e utilizando os 30% remanescentes para
medir a taxa de acerto e o tempo de resposta neste limiar. A partir destes re-
sultados, so gerados dois grcos por dataset :
Primeiramente, a taxa de acerto e o tempo de resposta so postos em
funo do limiar. Uma anlise deste grco permite escolher o limiar que
melhor se adeque s necessidades do problema - e.g., maximizar a taxa
de acerto, utilizando, em mdia, 1 ms por instncia.
Tambm possvel criar um grco da taxa de acerto em funo do
144
tempo de resposta. Esta curva ilustra o desempenho do sistema expe-
rimental, possibilitando compar-lo com o desempenho de outros siste-
mas, independentemente das tcnicas que utilizem.
A Figura 27 apresenta as curvas de desempenho obtidas em cada um
dos datasets testados previamente. No limiar zero, percebe-se que a taxa de
acerto e o tempo de resposta so iguais aos apresentados pelo classicador
de Bayes - um comportamento j esperado, visto que, neste limiar, a condio
imposta pela funo (3.1) sempre ser satisfeita, logo, apenas o classicador
de Bayes efetivamente utilizado.
Analogamente, com o limiar em seu valor mximo (1, 00), o tempo de res-
posta apresentado pelo sistema igual soma dos tempos de resposta apre-
sentados pelo classicador de Bayes e k-NN, pois a condio de sada da la
nunca ser satisfeita, levando o sistema a utilizar todos os dispositivos para
toda instncia de entrada. Por no conseguir satisfazer esta condio, o sis-
tema sempre opta pela soluo apresentada pelo Algoritmo 6, que, por sua
vez, opta pela soluo do ltimo dispositivo, neste caso, do k-NN. Logo, neste
limiar, a taxa de acerto aproximadamente igual quela apresentada pelo
k-NN.
Tambm se observa que nos limiares prximos de zero, no h variaes
signicativas nas taxas de acerto e nos tempos de resposta. Estas variaes
s ocorrem em limiares superiores a 1/p, onde p o nmero de alternativas.
Pela equao (2.1), nota-se que este o menor valor que pode ser assumido
pela expectativa de certeza mxima (a menos que todos os elementos do ve-
tor tenham valor zero), logo, para limiares menores que 1/p, as solues do
classicador de Bayes sempre sero aceitas, i.e., o k-NN nunca ser consul-
tado nestes limiares.
145
0.00
0.02
0.04
0.06
74%
75%
76%
77%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Blood Transfusion
74%
75%
76%
77%
0.00 0.02 0.04 0.06
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Blood Transfusion
0.00
0.50
1.00
1.50
80%
85%
90%
95%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Car Evaluation
80%
85%
90%
95%
100%
0.00 0.50 1.00 1.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Car Evaluation
0.00
1.50
3.00
4.50
65%
70%
75%
80%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Cardiotocography (Class)
65%
70%
75%
80%
0.00 1.00 2.00 3.00 4.00 5.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (Class)
0.00
1.50
3.00
4.50
83%
86%
89%
92%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Cardiotocography (NSP)
83%
86%
89%
92%
0.00 1.00 2.00 3.00 4.00 5.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (NSP)
Figura 27: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema experimental em funo do limiar.
direita, a curva de desempenho (taxa de acerto em funo do tempo de
resposta). (cont.)
146
0.00
0.50
1.00
1.50
2.00
49%
50%
51%
52%
53%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Contraceptive Method
49%
50%
51%
52%
53%
0.00 0.50 1.00 1.50 2.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Contraceptive Method
0.00
0.30
0.60
0.90
82%
83%
84%
85%
86%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Credit Aproval
82%
83%
84%
85%
86%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Credit Aproval
0.00
0.05
0.10
0.15
0.20
75%
80%
85%
90%
95%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Ecoli
75%
80%
85%
90%
95%
0.00 0.05 0.10 0.15 0.20
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Ecoli
0.00
0.05
0.10
0.15
45%
55%
65%
75%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Glass Identification
45%
55%
65%
75%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Glass Identification
Figura 27: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema experimental em funo do limiar.
direita, a curva de desempenho (taxa de acerto em funo do tempo de
resposta). (cont.)
147
0.00
0.01
0.02
0.03
0.04
0.05
72%
74%
76%
78%
80%
82%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Hayes-Roth
72%
74%
76%
78%
80%
82%
0.00 0.01 0.02 0.03 0.04 0.05
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Hayes-Roth
0.00
0.10
0.20
0.30
0.40
63%
65%
67%
69%
71%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
ILPD
63%
65%
67%
69%
71%
0.00 0.10 0.20 0.30 0.40
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
ILPD
0.00
0.02
0.04
0.06
0.08
0.10
90%
92%
94%
96%
98%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Iris
90%
92%
94%
96%
98%
100%
0.00 0.02 0.04 0.06
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Iris
0.00
4.00
8.00
12.00
16.00
20.00
90%
92%
94%
96%
98%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Nursery
90%
92%
94%
96%
98%
100%
0.00 5.00 10.00 15.00 20.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Nursery
Figura 27: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema experimental em funo do limiar.
direita, a curva de desempenho (taxa de acerto em funo do tempo de
resposta). (cont.)
148
0.00
0.10
0.20
0.30
0.40
0.50
90%
91%
92%
93%
94%
95%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Page Blocks
90%
91%
92%
93%
94%
95%
0.00 0.10 0.20 0.30 0.40 0.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Page Blocks
0.00
0.10
0.20
0.30
0.40
0.50
70%
72%
74%
76%
78%
80%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Pima Indians Diabetes
70%
72%
74%
76%
78%
80%
0.00 0.10 0.20 0.30 0.40 0.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Pima Indians Diabetes
0.00
0.05
0.10
0.15
85%
90%
95%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Shuttle
85%
90%
95%
100%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Shuttle
0.00
1.00
2.00
3.00
70%
72%
74%
76%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Statlog
70%
72%
74%
76%
0.00 0.50 1.00 1.50 2.00 2.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Statlog
Figura 27: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema experimental em funo do limiar.
direita, a curva de desempenho (taxa de acerto em funo do tempo de
resposta). (cont.)
149
0.00
0.02
0.04
0.06
0.08
0.10
50%
52%
54%
56%
58%
60%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Teaching Assistant
50%
52%
54%
56%
58%
60%
0.00 0.02 0.04 0.06 0.08
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Teaching Assistant
0.00
0.20
0.40
0.60
0.80
1.00
70%
75%
80%
85%
90%
95%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Tic-Tac-Toe
70%
75%
80%
85%
90%
95%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Tic-Tac-Toe
0.00
0.05
0.10
0.15
70%
72%
74%
76%
78%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Vertebral Column
70%
72%
74%
76%
78%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Vertebral Column
0.00
0.20
0.40
0.60
0.80
55%
56%
57%
58%
59%
60%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Yeast
55%
56%
57%
58%
59%
60%
0.00 0.20 0.40 0.60 0.80
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Yeast
Figura 27: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema experimental em funo do limiar.
direita, a curva de desempenho (taxa de acerto em funo do tempo de
resposta).
150
Quanto ao desempenho, verica-se que a curva de desempenho mostra-
se cncava voltada para baixo para a maior parte dos datasets, mesmo na-
queles em que a taxa de acerto do k-NN menor do que aquela apresentada
pelo classicador de Bayes. Nos datasets que cumprem a premissa, a taxa de
acerto apresenta um crescimento inicial mais acentuado, mas eventualmente
satura aps um determinado valor. Como exemplo, no Car Evaluation, a sa-
turao ocorre em 0, 50ms, que corresponde ao limiar de 0, 6 (aprox.). Neste
limiar crtico, possvel obter uma taxa de acerto equivalente ao do k-NN, mas
utilizando apenas uma frao de seu tempo de resposta, representando um
ganho de desempenho em relao ao dispositivo individual.
Em parte dos datasets, a taxa de acerto mxima ocorre em limiares in-
termedirios, afastado dos valores extremos 0 e 1. Por exemplo, no Teaching
Assistant, a taxa mxima de acerto de 55,5% ocorre no limiar 0, 8, e su-
perior quelas obtidas por cada dispositivo isoladamente. Blood Transfusion,
Cardiotocography Class, Contraceptive Method, Credit Aproval, Page Blocks
e Vertebral Column tambm apresentam tal comportamento, e at mesmo o
Statlog, que no atende as premissas iniciais, apresenta sua taxa mxima de
acerto no limiar 0, 6.
Alm disso, alguns datasets apresentam uma mudana mais acentuada
na taxa de acerto e no tempo de resposta perto do limiar 1/p. Neles, grande
parte das instncias utilizadas para validar o sistema recebem expectativas
de certeza muito prximas deste valor em todas as alternativas. Isso faz com
que a frequncia de uso do k-NN se mostre muito sensvel a pequenas vari-
aes no limiar, indicando que a quantidade de instncias utilizadas para trei-
namento foi insuciente para criar um modelo robusto para o classicador de
Bayes, considerando o nmero de critrios e alternativas analisadas. Ocorre
principalmente em datasets com critrios predominantemente numricos.
151
Como exemplo, o Glass Identication, que possui apenas 214 instncias
para 9 critrios e 7 alternativas, apresenta uma variao mais acentuada
quando o limiar atinge 1/7.
Em comparao, datasets com uma proporo maior de nmeros de ins-
tncias por critrio e por alternativa apresentam variaes mais suaves
- e.g., Car Evaluation, com 1728 instncias para 6 critrios e 4 alternati-
vas.
De forma similar, certos datasets tambm apresentam variaes mais
acentuadas conforme o limiar se aproxima de 1 - especialmente no tempo de
resposta. Neste caso, uma grande proporo de instncias recebem expecta-
tivas de certeza muito elevadas em determinadas alternativas, e que somente
sero rejeitadas com limiares muito elevados. Tambm ocorrem em datasets
predominantemente numricos - e.g., Blood Transfusion.
A partir destes resultados, pode-se concluir que possvel realizar um
controle sobre a relao de compromisso entre taxa de acerto e tempo de
resposta atravs da condio descrita pela funo dada em (3.1), utilizando
limiares entre 1/p e 1. O levantamento da curva de desempenho do sistema
permite escolher o valor do limiar que melhor se ajuste s necessidades do
usurio. Como exemplo, caso um dos requisitos seja obter a mxima taxa
de acerto no Tic-Tac-Toe gastando, em mdia, 0, 6 ms por instncia, o limiar
0, 8 um excelente candidato a ser utilizado. Entretanto, um cuidado deve
ser tomado ao escolher limiares prximos de 1/p ou 1, j que tanto a taxa de
acerto como o tempo de resposta so mais instveis nestes pontos crticos.
Tambm pode ser ressaltado que, em alguns casos, a distribuio de
carga informada no s permite controlar esta relao de compromisso, mas
tambm permite obter uma taxa mxima de acerto superior quelas obtidas
152
pelos dispositivos individuais, mediante a escolha de um limiar timo que se
encontra, em geral, afastado dos valores extremos.
4.4.2 Sistema Experimental com 100 Intervalos Discretos
O experimento apresentado na seo 4.4.1 foi repetido uma segunda vez,
mas utilizando uma discretizao em 100 intervalos (a seo 4.3.2 apresenta
os resultados individuais obtidos para cada dispositivo nestas condies). Tal
experimento permite vericar se o mtodo de discretizao utilizado afeta
a relao de compromisso entre a taxa de acerto e o tempo de resposta,
comparando-o com os resultados obtidos com 10 intervalos.
Os grcos da Figura 28 mostram os resultados obtidos atravs desta
congurao. Comparando-os com os resultados do experimento anterior,
percebe-se que a taxa de acerto e o tempo de resposta nos datasets pu-
ramente nominais (e.g., Car Evaluation) no sofrem alteraes. Este com-
portamento j era esperado, pois a discretizao afeta somente aqueles que
possuem critrios numricos.
Tambm ca evidenciado que as novas curvas levantadas, em geral, pos-
suem descontinuidades mais fortes quando comparadas com aquelas apre-
sentadas pelo mesmo sistema com 10 intervalos discretos. Tal caracterstica
diculta o uso do limiar como controle de desempenho do sistema, visto que
no possvel realizar ajustes nos nestas regies: pequenas alteraes no
limiar causam grandes variaes de desempenho.
A partir destes resultados, tambm se observa que a curva de desempe-
nho fortemente inuenciada pelo desempenho individual de cada dispositivo.
Na grande maioria dos datasets, o desempenho dos dispositivos foi pior com
100 intervalos de discretizao, o que leva a uma curva de desempenho me-
153
0.00
0.05
0.10
0.15
0.20
70%
71%
72%
73%
74%
75%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Blood Transfusion
70%
72%
74%
76%
78%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Blood Transfusion
0.00
0.50
1.00
1.50
80%
85%
90%
95%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Car Evaluation
80%
85%
90%
95%
100%
0.00 0.50 1.00 1.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Car Evaluation
0.00
1.50
3.00
4.50
50%
60%
70%
80%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Cardiotocography (Class)
50%
60%
70%
80%
0.00 1.00 2.00 3.00 4.00 5.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (Class)
-1.50
0.00
1.50
3.00
4.50
80%
83%
86%
89%
92%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Cardiotocography (NSP)
80%
83%
86%
89%
92%
0.00 1.00 2.00 3.00 4.00 5.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (NSP)
Figura 28: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema (discretizado em 100 intervalos) em
funo do limiar. direita, a curva de desempenho do sistema com EWD com
10 intervalos (linha contnua) e 100 intervalos (linha tracejada). (cont.)
154
0.00
0.50
1.00
1.50
2.00
49%
50%
51%
52%
53%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Contraceptive Method
50%
51%
52%
53%
54%
0.00 0.50 1.00 1.50 2.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Contraceptive Method
0.00
0.30
0.60
0.90
78%
80%
82%
84%
86%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Credit Aproval
78%
80%
82%
84%
86%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Credit Aproval
0.00
0.10
0.20
0.30
30%
50%
70%
90%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Ecoli
30%
50%
70%
90%
0.00 0.05 0.10 0.15 0.20
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Ecoli
0.00
0.05
0.10
0.15
0.20
0.25
20%
30%
40%
50%
60%
70%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Glass Identification
20%
30%
40%
50%
60%
70%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Glass Identification
Figura 28: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema (discretizado em 100 intervalos) em
funo do limiar. direita, a curva de desempenho do sistema com EWD com
10 intervalos (linha contnua) e 100 intervalos (linha tracejada). (cont.)
155
0.00
0.01
0.02
0.03
0.04
0.05
72%
74%
76%
78%
80%
82%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Hayes-Roth
72%
74%
76%
78%
80%
82%
0.00 0.01 0.02 0.03 0.04 0.05
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Hayes-Roth
0.00
0.20
0.40
0.60
0.80
50%
55%
60%
65%
70%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
ILPD
50%
55%
60%
65%
70%
0.00 0.10 0.20 0.30 0.40
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
ILPD
0.00
0.02
0.04
0.06
70%
80%
90%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Iris
70%
80%
90%
100%
0.00 0.02 0.04 0.06
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Iris
0.00
4.00
8.00
12.00
16.00
20.00
90%
92%
94%
96%
98%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Nursery
90%
92%
94%
96%
98%
100%
0.00 5.00 10.00 15.00 20.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Nursery
Figura 28: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema (discretizado em 100 intervalos) em
funo do limiar. direita, a curva de desempenho do sistema com EWD com
10 intervalos (linha contnua) e 100 intervalos (linha tracejada). (cont.)
156
0.00
2.00
4.00
6.00
8.00
10.00
90%
92%
94%
96%
98%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Page Blocks
90%
92%
94%
96%
98%
100%
0.00 2.00 4.00 6.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Page Blocks
0.00
0.10
0.20
0.30
0.40
67%
69%
71%
73%
75%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Pima Indians Diabetes
65%
70%
75%
80%
0.00 0.10 0.20 0.30 0.40 0.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Pima Indians Diabetes
0.00
0.50
1.00
1.50
2.00
96%
97%
98%
99%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Shuttle
80%
85%
90%
95%
100%
0.00 0.50 1.00 1.50 2.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Shuttle
0.00
0.50
1.00
1.50
2.00
2.50
70%
71%
72%
73%
74%
75%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Statlog
70%
71%
72%
73%
74%
75%
76%
0.00 0.50 1.00 1.50 2.00 2.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Statlog
Figura 28: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema (discretizado em 100 intervalos) em
funo do limiar. direita, a curva de desempenho do sistema com EWD com
10 intervalos (linha contnua) e 100 intervalos (linha tracejada). (cont.)
157
0.00
0.02
0.04
0.06
0.08
0.10
54%
56%
58%
60%
62%
64%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Teaching Assistant
50%
52%
54%
56%
58%
60%
62%
0.00 0.02 0.04 0.06 0.08
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Teaching Assistant
0.00
0.20
0.40
0.60
0.80
1.00
70%
75%
80%
85%
90%
95%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Tic-Tac-Toe
65%
75%
85%
95%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Tic-Tac-Toe
0.00
0.05
0.10
0.15
45%
55%
65%
75%
85%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Vertebral Column
45%
55%
65%
75%
85%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Vertebral Column
0.00
0.20
0.40
0.60
0.80
1.00
45%
50%
55%
60%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Yeast
45%
50%
55%
60%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Yeast
Figura 28: esquerda, o grco de taxa de acerto (linha contnua) e tempo
de resposta (linha tracejada) do sistema (discretizado em 100 intervalos) em
funo do limiar. direita, a curva de desempenho do sistema com EWD com
10 intervalos (linha contnua) e 100 intervalos (linha tracejada).
158
nos favorvel. Em comparao, o desempenho nos datasets Page Blocks e
Shuttle superior quando 100 intervalos so utilizados. Note que estes so os
datasets com o maior nmero de instncias, apesar de o tempo de resposta
mximo observado ser muito superior ao mximo observado no experimento
com 10 intervalos.
Este experimento explicita a necessidade de uma escolha adequada para
o mtodo de discretizao e seus parmetros, uma vez que uma escolha equi-
vocada no s piora o desempenho individual de cada dispositivo, mas tam-
bm prejudica o ajuste da relao de compromisso entre taxa de acerto e
tempo de resposta de todo o sistema. Exemplos de mtodos de discretiza-
o incluem o Recursive Minimal Entropy Partitioning e gerao de clusters
(DOUGHERTY; KOHAVI; SAHAMI, 1995), conforme apresentado previamente na
seo 2.2.1.
4.4.3 Sistema Experimental com TDAE
O experimento da seo 4.4.1 foi novamente realizado, desta vez, inse-
rindo uma TDAE de entrada estendida como dispositivo inicial da la. A pre-
sena desta tabela permite que instncias numricas sejam potencialmente
solucionadas sem a necessidade de utilizar os demais dispositivos, conforme
mostrado na seo 4.3.3.
Deve ser ressaltado que, por natureza, uma tabela de deciso um dispo-
sitivo cujo foco solucionar problemas previstos em seu conjunto de regras,
criado a partir de um treinamento. No entanto, o mtodo de Monte-Carlo, em-
pregado para validao da taxa de acerto, simula situaes em que o disposi-
tivo recebe problemas no previstos no conjunto de treinamento (vale lembrar
que os subconjuntos de treinamento e de validao no possuem elementos
em comum, a menos que o dataset apresente instncias repetidas). Logo,
159
neste caso especco, a tabela de deciso no aparenta ser um dispositivo
adequado. Os resultados obtidos pela anlise preliminar sustentam esta hip-
tese:
Quando comparado com o classicador de Bayes, o desempenho da
TDAE , na maior parte dos casos, inferior, tanto na taxa de acerto como
no tempo de resposta;
Apesar de apresentar tempo de resposta menor do que o k-NN, a taxa
de acerto da TDAE bastante inferior.
Uma forma de visualizar e comparar o desempenho de cada umdos dispo-
sitivos em um determinado dataset atravs de um grco que plote a taxa de
acerto em funo do tempo de resposta. O desempenho de cada dispositivo
representado na forma de um ponto (t, h), referente ao tempo de resposta
t e taxa de acerto h apresentados. Atravs deste grco, possvel avaliar
o desempenho da TDAE vericando se o ponto (t
observado
, h
observado
), referente
aos parmetros de desempenho da TDAE, est acima da reta que liga os pon-
tos (t
bayes
, h
bayes
) e (t
knn
, h
knn
), refentes aos parmetros de desempenho dos
outros dois dispositivos. A Figura 29 ilustra um exemplo deste comparativo.
Para vericar se o ponto (t
observado
, h
observado
) est acima da referida reta,
calcula-se a posio de umponto de referncia que apresente o mesmo tempo
de resposta, mas que esteja sobre a reta. Sua taxa de acerto h
critico
, denomi-
nada valor crtico, calculada atravs de:
r = (t
observado
t
bayes
) / (t
knn
t
bayes
) (4.1)
h
critico
= min ((h
knn
h
bayes
) r + h
bayes
, 100%) (4.2)
160
Tempo de Resposta
T
a
x
a

d
e

A
c
e
r
t
o
Dispositivos com
desempenho superior
( t
knn
, h
knn
)
( t
bayes
, h
bayes
)
Dispositivos com
desempenho inferior
( t
observado
, h
observado
)
( t
observado
, h
critico
)
t
h
Figura 29: Clculo da taxa de acerto crtica a partir dos parmetros de desem-
penho dos classicador de Bayes e do mtodo k-NN.
Para um determinado dataset, o uso da TDAE pode ser considerado ina-
dequado se h
observado
< h
critico
, j que a tabela estaria aqum do desempenho
dos demais dispositivos. Por outro lado, se h
observado
h
critico
, o desempenho
da TDAE estaria de acordo com o que apresentado pelos demais dispositi-
vos, tornando-o potencialmente adequado. A Figura 30 compara as taxas de
acerto apresentadas pela TDAE em cada dataset com seus respectivos valo-
res crticos. Dela, vericado que a taxa de acerto observada superior ao
valor crtico apenas no Shuttle, o que potencialmente justica o uso da tabela
de deciso neste dataset em particular. Nos demais, a tabela no aparenta
ser adequada.
A Figura 31 apresenta a taxa de acerto e o tempo de resposta de cada
dataset em funo do limiar, e compara seu desempenho com aquele obtido
atravs do sistema experimental original. Naqueles que apresentam baixa
taxa de acerto para a TDAE (e.g., Cardiotocography Class, cuja taxa de acerto
individual 6,6873%, conforme mostra a Tabela 12), a curva de desempenho
161
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
Blood Transfusion
Car Evaluation
Cardiotocography Class
Cardiotocography NSP
Contraceptive Method
Credit Aproval
Ecoli
Glass Identification
Hayes-Roth
ILPD
Iris Nursery
Page Blocks
Pima Indians Diabetes
Shuttle
Statlog (German Credit)
Teaching Assistant
Tic-Tac-Toe
Vertebral Column
Yeast
Taxa de Acerto Crtica da TDAE
Taxa de Acerto Observada Valor Crtico
Figura 30: Comparativo entre as taxas de acerto apresentada pela TDAE em
cada dataset e seus respectivos valores crticos.
sofre uma translao no eixo horizontal, sem sofrer grandes alteraes em
sua forma. Este comportamento mostra que, nestes casos, a utilizao da
TDAE fez apenas aumentar o tempo de resposta, sem alterar signicativa-
mente a taxa de acerto. Em especial, datasets estritamente nominais (e.g.,
Car Evaluation) possuem taxa de acerto nula na TDAE, e, por consequncia,
tambm apresentam a curva de desempenho transladada.
Contudo, em alguns datasets, o ganho observado positivo em determi-
nadas situaes. Como exemplo, a curva de desempenho apresentada no
Shuttle favorece o uso da TDAE para tempos de resposta menores - note
que, neste dataset, o desempenho individual da TDAE foi superior ao valor
crtico previamente estimado, justicando seu uso. Tambm observa-se um
ganho no Teaching Assistant, que, por apresentar instncias repetidas, possi-
bilita que os conjuntos de validao e de treinamento tenham elementos em
comum - situao favorvel ao uso de tabelas de deciso. Vale ressaltar que
162
0.00
0.02
0.04
0.06
70%
72%
74%
76%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Blood Transfusion
72%
73%
74%
75%
76%
77%
0.00 0.02 0.04 0.06
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Blood Transfusion
0.00
0.50
1.00
1.50
2.00
80%
85%
90%
95%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Car Evaluation
80%
85%
90%
95%
100%
0.00 0.50 1.00 1.50 2.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Car Evaluation
0.00
1.50
3.00
4.50
6.00
60%
65%
70%
75%
80%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Cardiotocography (Class)
60%
65%
70%
75%
80%
0.00 2.00 4.00 6.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (Class)
0.00
1.50
3.00
4.50
6.00
80%
83%
86%
89%
92%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Cardiotocography (NSP)
80%
83%
86%
89%
92%
0.00 2.00 4.00 6.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (NSP)
Figura 31: esquerda, o grco de taxa de acerto (linha contnua) e tempo de
resposta (linha tracejada) do sistema comTDAE emfuno do limiar. direita,
a curva de desempenho do sistema experimental original (linha contnua) e
com o TDAE (linha tracejada). (cont.)
163
0.00
0.50
1.00
1.50
2.00
49%
50%
51%
52%
53%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Contraceptive Method
49%
50%
51%
52%
53%
0.00 0.50 1.00 1.50 2.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Contraceptive Method
0.00
0.30
0.60
0.90
1.20
82%
83%
84%
85%
86%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Credit Aproval
82%
83%
84%
85%
86%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Credit Aproval
0.00
0.05
0.10
0.15
0.20
0.25
70%
75%
80%
85%
90%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Ecoli
70%
75%
80%
85%
90%
0.00 0.05 0.10 0.15 0.20 0.25
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Ecoli
0.00
0.05
0.10
0.15
0.20
30%
40%
50%
60%
70%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Glass Identification
50%
55%
60%
65%
70%
0.00 0.05 0.10 0.15 0.20
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Glass Identification
Figura 31: esquerda, o grco de taxa de acerto (linha contnua) e tempo de
resposta (linha tracejada) do sistema comTDAE emfuno do limiar. direita,
a curva de desempenho do sistema experimental original (linha contnua) e
com o TDAE (linha tracejada). (cont.)
164
0.00
0.02
0.04
0.06
70%
75%
80%
85%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Hayes-Roth
70%
75%
80%
85%
0.00 0.01 0.02 0.03 0.04 0.05
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Hayes-Roth
0.00
0.20
0.40
0.60
0.80
55%
60%
65%
70%
75%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
ILPD
63%
65%
67%
69%
71%
0.00 0.10 0.20 0.30 0.40 0.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
ILPD
0.00
0.02
0.04
0.06
0.08
0.10
90%
92%
94%
96%
98%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Iris
90%
92%
94%
96%
98%
100%
0.00 0.02 0.04 0.06
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Iris
0.00
4.00
8.00
12.00
16.00
20.00
90%
92%
94%
96%
98%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Nursery
90%
92%
94%
96%
98%
100%
0.00 5.00 10.00 15.00 20.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Nursery
Figura 31: esquerda, o grco de taxa de acerto (linha contnua) e tempo de
resposta (linha tracejada) do sistema comTDAE emfuno do limiar. direita,
a curva de desempenho do sistema experimental original (linha contnua) e
com o TDAE (linha tracejada). (cont.)
165
0.00
0.10
0.20
0.30
0.40
0.50
85%
90%
95%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Page Blocks
85%
90%
95%
100%
0.00 0.10 0.20 0.30 0.40 0.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Page Blocks
0.00
0.20
0.40
0.60
70%
72%
74%
76%
78%
80%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Pima Indians Diabetes
65%
70%
75%
80%
0.00 0.20 0.40 0.60
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Pima Indians Diabetes
0.00
0.05
0.10
0.15
0.20
80%
85%
90%
95%
100%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Shuttle
80%
85%
90%
95%
100%
0.00 0.05 0.10 0.15 0.20
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Shuttle
0.00
1.00
2.00
3.00
70%
72%
74%
76%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o
o

Limiar de Aceitao
Statlog
71%
72%
73%
74%
75%
76%
0.00 1.00 2.00 3.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Statlog
Figura 31: esquerda, o grco de taxa de acerto (linha contnua) e tempo de
resposta (linha tracejada) do sistema comTDAE emfuno do limiar. direita,
a curva de desempenho do sistema experimental original (linha contnua) e
com o TDAE (linha tracejada). (cont.)
166
0.00
0.02
0.04
0.06
0.08
0.10
49%
54%
59%
64%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Teaching Assistant
52%
53%
54%
55%
56%
0.00 0.02 0.04 0.06 0.08
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Teaching Assistant
0.00
0.30
0.60
0.90
1.20
1.50
70%
75%
80%
85%
90%
95%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Tic-Tac-Toe
65%
75%
85%
95%
0.00 0.50 1.00 1.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Tic-Tac-Toe
0.00
0.05
0.10
0.15
0.20
70%
72%
74%
76%
78%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Vertebral Column
45%
55%
65%
75%
85%
0.00 0.05 0.10 0.15 0.20
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Vertebral Column
0.00
0.20
0.40
0.60
0.80
1.00
53%
54%
55%
56%
57%
58%
0 0.2 0.4 0.6 0.8 1
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Limiar de Aceitao
Yeast
45%
50%
55%
60%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Yeast
Figura 31: esquerda, o grco de taxa de acerto (linha contnua) e tempo de
resposta (linha tracejada) do sistema comTDAE emfuno do limiar. direita,
a curva de desempenho do sistema experimental original (linha contnua) e
com o TDAE (linha tracejada).
167
este o nico dataset que apresenta instncias repetidas.
De forma anloga aos experimentos anteriores, tambm pode ser obser-
vado que o tempo mximo de resposta vericado no limiar 1 igual so-
matria dos tempos de respostas de cada dispositivo utilizado, no caso, do
classicador de Bayes, do k-NN e da TDAE.
Estes resultados demonstram a importncia da escolha dos dispositivos
que devem compor o sistema de tomada de deciso: mesmo utilizando a
adaptatividade para controlar a la de dispositivos e o aprendizado, o grau de
sucesso do sistema tambm depende do desempenho individual dos dispo-
sitivos em cada problema especco. Neste experimento, como os conjuntos
de instncias utilizadas para treinamento e validao eram disjuntos, o uso da
TDAE foi prejudicial na maior parte dos datasets, mas mostrou-se adequado
naqueles que apresentavam caractersticas favorveis ao uso de uma tabela
de deciso.
4.5 Comparao com um Sistema com Distribui-
o de Carga No Informada
A m de criar uma base de comparao para o sistema proposto, foi le-
vantada a curva de desempenho de um sistema que realiza uma distribuio
de carga no informada, que escolhe, aleatoriamente, um dispositivo para so-
lucionar cada uma das instncias. Diferentemente do sistema experimental,
tal distribuio de carga no utiliza informaes a respeito de cada instncia
para decidir qual dispositivo utilizar, logo, espera-se que seu desempenho seja
inferior.
Considerando os dispositivos testados previamente, este experimento se-
para o conjunto de testes a ser utilizado em dois subconjuntos: o primeiro
168
deles, com (100 r) % das instncias de testes, validado com o classica-
dor de Bayes, enquanto o segundo, com r%, validado com k-NN.
Por conseguinte, para levantar a curva de desempenho com esta distribui-
o de carga, a taxa de acerto e o tempo de resposta so medidos para cada
valor de r, partindo de 0% at 100% em passos de 2%. Estas medidas so
extradas a partir da mdia obtida em 100 testes realizados de forma indepen-
dentes. Em cada teste, so utilizados 70% das instncias para treinamento,
utilizando os demais 30% para o conjunto de testes. Deste ltimo conjunto,
cria-se um subconjunto de instncias que sero solucionadas com k-NN e um
outro para o classicador de Bayes, de acordo com o valor de r.
Considerando-se que a escolha aleatria, espera-se que, em cada valor
de r, sejam obtidas as seguintes estimativas para a taxa de acerto e tempo de
resposta:
h(r) = (1 r) h
bayes
+ (r) h
kNN
= r (h
kNN
h
bayes
) + h
bayes
(4.3)
t (r) = (1 r) t
bayes
+ (r) t
kNN
= r (t
kNN
t
bayes
) + t
bayes
(4.4)
onde h
bayes
e h
kNN
so constantes representando as taxas de acerto indivi-
duais de cada dispositivo em um determinado dataset, enquanto t
bayes
e t
kNN
representam os seus respectivos tempos de resposta. Manipulando as fun-
es acima para denir a taxa de acerto em funo do tempo de resposta,
chega-se na seguinte funo de grau 1:
h(t) =
t t
bayes
t
kNN
t
bayes
(h
kNN
h
bayes
) + h
bayes
(4.5)
Logo, espera-se que a curva de desempenho seja, aproximadamente, um
segmento de reta que liga os pontos (t
bayes
, h
bayes
) e (t
kNN
, h
kNN
).
169
O resultado deste experimento est ilustrado na Figura 32, comparando o
desempenho deste sistema como sistema proposto na seo 4.1 nos datasets
testados previamente. Conforme esperado, as curvas so aproximadamente
segmentos de retas que, no geral, apresentam custo-benefcio pior do que
aquele apresentado pelo sistema experimental proposto. Apenas o Statlog
apresenta um desempenho favorvel escolha aleatria na maior parte do
tempo.
Deve-se notar que, em cada dataset, as duas curvas de desempenho co-
meam em um mesmo ponto (t
bayes
, h
bayes
), mas acabam em pontos nais dis-
tintos, apesar de possurem a mesma taxa de acerto h
kNN
. Isso ocorre pois
o sistema experimental, no pior caso, faz uso dos dois dispositivos (quando
o limiar igual a 1), consumindo t
bayes
+ t
kNN
para ser executado, enquanto
a seleo aleatria, no pior caso, consome apenas t
kNN
. Isso faz com que o
desempenho da seleo aleatria seja favorvel nestas regies em determi-
nados datasets (e.g., Ecoli e Glass Identication). Todavia, observa-se que
utilizar o sistema hbrido neste ponto de operao faz pouco sentido, visto
que no limiar 1 apenas o ltimo dispositivo efetivamente utilizado, ainda que
sejam executados todos os demais. Entretanto, este comportamento poderia
ser alterado se, ao invs do Algoritmo 7, uma outra tcnica de deciso fosse
utilizada para solucionar instncias cujas decises obtidas pelos dispositivos
no satisfazem a condio de sada da la (e.g., um sistema de votao entre
os dispositivos) - um possvel tema para trabalho futuro.
Estes resultados consolidam a ideia de que a distribuio de carga atra-
vs do limiar se mostra mais eciente do que uma simples escolha aleatria,
obtendo, na maior parte dos casos, taxas de acerto maiores para um mesmo
tempo de resposta. Consequentemente, tais resultados respaldam o uso das
funo auxiliares introduzidas pela TDAE como forma colaborativa de tomada
170
74%
75%
76%
77%
0.00 0.02 0.04 0.06
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Blood Transfusion
80%
85%
90%
95%
100%
0.00 0.50 1.00 1.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Car Evaluation
60%
65%
70%
75%
80%
0.00 1.00 2.00 3.00 4.00 5.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (Class)
80%
83%
86%
89%
92%
0.00 1.00 2.00 3.00 4.00 5.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Cardiotocography (NSP)
49%
50%
51%
52%
53%
0.00 0.50 1.00 1.50 2.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Contraceptive Method
82%
83%
84%
85%
86%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Credit Aproval
75%
80%
85%
90%
0.00 0.05 0.10 0.15 0.20
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Ecoli
50%
55%
60%
65%
70%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Glass Identification
Figura 32: Comparao de desempenho do sistema experimental (linha con-
tnua) com o sistema de escolha aleatria (linha tracejada). (cont.)
171
70%
72%
74%
76%
78%
80%
82%
0.00 0.01 0.02 0.03 0.04 0.05
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Hayes-Roth
63%
65%
67%
69%
71%
0.00 0.10 0.20 0.30 0.40
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
ILPD
90%
92%
94%
96%
98%
100%
0.00 0.02 0.04 0.06
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Iris
90%
92%
94%
96%
98%
100%
0.00 5.00 10.00 15.00 20.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Nursery
90%
91%
92%
93%
94%
95%
0.00 0.10 0.20 0.30 0.40 0.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Page Blocks
65%
70%
75%
80%
0.00 0.10 0.20 0.30 0.40 0.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Pima Indians Diabetes
80%
85%
90%
95%
100%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Shuttle
71%
72%
73%
74%
75%
76%
0.00 0.50 1.00 1.50 2.00 2.50
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Statlog
Figura 32: Comparao de desempenho do sistema experimental (linha con-
tnua) com o sistema de escolha aleatria (linha tracejada). (cont.)
172
52%
53%
54%
55%
56%
0.00 0.02 0.04 0.06 0.08
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Teaching Assistant
65%
75%
85%
95%
0.00 0.20 0.40 0.60 0.80 1.00
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Tic-Tac-Toe
70%
72%
74%
76%
78%
0.00 0.05 0.10 0.15
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Vertebral Column
55%
56%
57%
58%
59%
60%
0.00 0.20 0.40 0.60 0.80
T
a
x
a

d
e

A
c
e
r
t
o

Tempo de Resposta (ms)
Yeast
Figura 32: Comparao de desempenho do sistema experimental (linha con-
tnua) com o sistema de escolha aleatria (linha tracejada).
de deciso, permitindo que mltiplos dispositivos possam operar em conjunto,
obtendo umdesempenho que no seria possvel emuma distribuio de carga
no informada.
4.6 Aprendizado Incremental
Finalmente, foi realizado um experimento visando medir a evoluo da
taxa de acerto e do tempo de resposta medida que o sistema recebe reali-
mentaes durante sua execuo. Para esta nalidade, denido um sistema
experimental baseado na congurao dada na seo 4.1, mas com as se-
guintes particularidades:
O valor do limiar de sada da la xado em 0, 7.
O valor utilizado para a credibilidade do vis de repetio cr
repetition
=
173
0, 01, ao contrrio do valor nulo utilizado nos experimentos sobre o com-
promisso entre taxa de acerto e tempo de resposta. Contudo, este ex-
perimento tambm no conta com um bloco de auto-anlise.
Esta congurao utilizada em duas anlises:
1. Primeiramente, vericado como o vis de repetio inuencia a evolu-
o do desempenho do sistema.
2. Em um segundo caso, analisado como realimentaes recebidas por
fontes externas inuenciam a evoluo de desempenho do sistema.
As sees seguintes mostram como estas duas anlises foram realizadas,
e os resultados obtidos em cada uma.
4.6.1 Vis de Repetio
Conforme descrito previamente na seo 3.1, o vis de repetio uma
forma de realimentao que refora a credibilidade das solues obtidas pelos
prprios dispositivos, permitindo que cada um deles aprenda com as solues
obtidas com o auxlio dos demais - em particular, dispositivos mais rpidos
podem aprender com os dispositivos mais precisos. Por isso, espera-se que
a frequncia com que suas solues so aceitas aumente progressivamente
com o uso, reduzindo a utilizao dos dispositivos mais lentos, e, consequen-
temente, reduzindo o tempo mdio de resposta do sistema.
Este experimento visa vericar esta inuncia do vis de desempenho so-
bre a evoluo do sistema. Para isso, o seguinte procedimento adotado:
1. Treinar o sistema com 70% das amostras, selecionadas de forma arbi-
trria.
174
2. Iterar processo abaixo 2000 vezes:
(a) Embaralhar conjunto de testes, alterando a ordem de suas instn-
cias;
(b) Para cada instncia (x, a
instancia
) desta lista embaralhada:
i. Executar o sistema com o conjunto x (Algoritmo 8);
ii. Vericar se a alternativa retornada a
retorno
igual alternativa
a
instancia
esperada pela instncia;
(c) Medir a taxa de acerto e tempo de resposta.
Note que no h um novo treinamento entre as iteraes, diferentemente
do procedimento adotado nos experimentos anteriores: o sistema mantm-
se o mesmo entre as iteraes, mas retm as novas informaes recebidas
pelas realimentaes feitas atravs do vis de repetio, conforme descrito
pelo Algoritmo 8. Dessa maneira, espera-se que o dispositivo mais rpido
(o classicador de Bayes) consiga aprender medida que o k-NN soluciona
problemas, passando a solucionar estes problemas futuramente. Portanto,
espera-se que o tempo de resposta seja reduzido medida que o nmero de
iteraes aumenta.
Como a evoluo do sistema depende do conjunto de treinamento inicial,
o processo acima repetido 10 vezes por dataset, para extrair a mdia da
taxa de acerto e do tempo de resposta em cada iterao.
A evoluo da taxa de acerto e do tempo de resposta em cada dataset es-
to ilustrados na Figura 33. A partir destes grcos observa-se que na maior
parte destes datasets, o tempo de resposta cai medida que as iteraes
so feitas. Este resultado indica que as solues obtidas atravs do classi-
cador de Bayes esto sendo aceitas com maior frequncia medida que as
175
realimentaes oriundas do vis de repetio so geradas. Entretanto, a pro-
porcionalidade da queda do tempo de resposta no a mesma em cada um
deles: como exemplo, a queda observada no Cardiotocography (Class) foi de
aproximadamente 50%, enquanto no Iris, esta diferena mnima.
Tambmse observa que a taxa de acerto, apesar de mostrar uma pequena
tendncia de queda, mantm-se estvel na maioria dos datasets, quando
comparado aos ganhos obtidos no tempo de resposta. Esta queda mais
acentuada no Cardiotocography (NSP) (3% de queda no perodo observado),
apesar de ser proporcionalmente pequena em comparao com a queda de
mais de 50% no tempo de resposta. Todavia, para casos em que a taxa de
acerto crtica, pode ser mais vantajoso evitar o uso do vis de repetio.
Em uma anlise mais pontual, nota-se que no Nursery, a queda mais
acentuada do tempo de resposta ocorre em um perodo em que a taxa de
acerto se matinha estvel. Porm, a partir da 500
a
iterao, o uso do vis
de repetio causa uma deteriorao mais acentuada na taxa de acerto, in-
desejvel em sistemas em que o custo do erro alto. Neste caso, pode ser
vantajoso desabilitar o vis de repetio ao chegar neste ponto crtico.
Deve ser ressaltado que o classicador de Bayes, neste exemplo, rea-
liza seu aprendizado incremental exclusivamente atravs das solues obtidas
pelo k-NN, sejam elas corretas ou no. Assim, existe o risco de deteriorao
da taxa de acerto do classicador de Bayes medida que novas realimen-
taes so geradas, j que este dispositivo tende a ganhar mais conana
em informaes ruidosas, aumentando a expectativa de certeza de suas so-
lues, e consequentemente, a frequncia com que elas so aceitas.
Estes resultados reforam a ideia de que dispositivos mais rpidos po-
dem aprender com as solues obtidas por dispositivos mais lentos, sem
que a taxa de acerto se degrade signicativamente, e, portanto, tambm res-
176
0.000
0.005
0.010
0.015
0.020
72%
74%
76%
78%
80%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Blood Transfusion
0.000
1.000
2.000
3.000
94%
96%
98%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Car Evaluation
0.000
2.000
4.000
6.000
70%
72%
74%
76%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Cardiotocography (Class)
0.000
0.500
1.000
1.500
80%
83%
86%
89%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Cardiotocography (NSP)
0.000
0.500
1.000
1.500
2.000
50%
52%
54%
56%
58%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Contraceptive
0.000
0.100
0.200
0.300
0.400
80%
82%
84%
86%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Credit Aproval
0.000
0.100
0.200
0.300
80%
82%
84%
86%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Ecoli
0.000
0.050
0.100
0.150
0.200
0.250
60%
62%
64%
66%
68%
70%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Glass Evaluation
Figura 33: Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme os dispositivos recebem realimentaes originadas no
vis de repetio (cont.)
177
0.000
0.050
0.100
0.150
70%
72%
74%
76%
78%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Hayes-Roth
0.000
0.100
0.200
0.300
0.400
62%
64%
66%
68%
70%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
ILPD
0.000
0.010
0.020
0.030
0.040
0.050
90%
92%
94%
96%
98%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Iris
0.100
10.100
20.100
30.100
94%
96%
98%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Nursery
0.000
0.100
0.200
0.300
0.400
90%
92%
94%
96%
98%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Page Blocks
0.000
0.100
0.200
0.300
70%
72%
74%
76%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Pima Indians Diabetes
0.000
0.050
0.100
0.150
90%
92%
94%
96%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Shuttle
0.000
0.500
1.000
1.500
65%
70%
75%
80%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Statlog
Figura 33: Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme os dispositivos recebem realimentaes originadas no
vis de repetio (cont.)
178
0.000
0.020
0.040
0.060
0.080
0.100
50%
52%
54%
56%
58%
60%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Teaching Assistant
0.000
0.500
1.000
1.500
2.000
80%
82%
84%
86%
88%
90%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Tic-Tac-Toe
0.000
0.100
0.200
0.300
0.400
67%
69%
71%
73%
75%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Vertebral Column
0.000
0.200
0.400
0.600
0.800
1.000
50%
52%
54%
56%
58%
60%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Yeast
Figura 33: Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme os dispositivos recebem realimentaes originadas no
vis de repetio.
paldam o modelo adaptativo inicialmente proposto por Tchemra (TCHEMRA,
2009), estendendo-o para alm da tabela de deciso adaptativa. Entretanto, o
uso do vis de repetio por um perodo prolongado se mostra potencialmente
prejudicial taxa de acerto, podendo ser necessrio deslig-lo antes que esta
queda exceda um limite aceitvel, ou at mesmo evitar seu uso, caso o custo
do erro seja elevado.
4.6.2 Realimentaes Externas
Por m, para complementar a anlise de realimentaes, faz-se a veri-
cao de como realimentaes originadas atravs de fontes externas inu-
enciam a evoluo da taxa de acerto e do tempo de resposta. Este tipo de
realimentao ocorre quando a soluo retornada pelo sistema no aquela
esperada pela instncia rotulada do dataset. Deste experimento, espera-se
179
que a taxa de acerto cresa medida que novas informaes so recebi-
das, eventualmente saturando para umvalor-limite imposto pelas limitaes de
cada dispositivo. Enquanto isso, pressupondo que um volume maior de instn-
cias passe a ser solucionado atravs de dispositivos mais rpidos, espera-se
que o tempo de resposta eventualmente passe a cair, ou que, ao menos, se
mantenha estvel.
Para esta nalidade, os seguintes passos so utilizados:
1. Construir o sistema experimental com a base de conhecimento inicial-
mente vazia, i.e., conjunto de treinamento vazio.
2. Iterar processo abaixo 2000 vezes:
(a) Embaralhar conjunto de testes, alterando a ordem das instncias
do dataset ;
(b) Para cada instncia (x, a
instancia
) desta lista embaralhada:
i. Executar o sistema com o conjunto x;
ii. Vericar se a alternativa retornada a
retorno
igual alternativa
a
instancia
esperada pela instncia;
iii. Se as alternativas forem diferentes:
A. Gerar um nmero real aleatrio rnd entre 0 e 1;
B. Se rnd < 0, 01, a banca de testes envia duas realimenta-
es:
Uma negativa, com (x, a
retorno
, v = 0,

, cr = 1), e;
Uma positiva, com (x, a
instancia
, v = 1,
+
, cr = 1).
(c) Mede a taxa de acerto e tempo de resposta.
Assim como no experimento da seo 4.6.1, no h um novo treinamento
em cada iterao. Contudo, aps o processamento da instncia, compara-se
180
a alternativa retornada com a da instncia rotulada. Caso no sejam idnticas,
existe 1% de probabilidade de a banca de testes informar este erro ao sistema
atravs de uma realimentao negativa (ou seja, informa que a alternativa
retornada no era correta) e uma positiva (informa qual devia ser a alternativa
esperada). A credibilidade desta realimentao cr = 1, ordens de grandeza
maior que a credibilidade cr
repetition
do vis de repetio.
Tambm deve ser ressaltado que o conjunto de treinamento deste sistema
vazio. Assim, sua taxa de acerto e tempo de resposta sero dependentes ex-
clusivamente das informaes recebidas atravs das realimentaes. Como
a evoluo do sistema depende das instncias que, aleatoriamente, so se-
lecionadas para serem realimentadas, o processo acima repetido 10 vezes
por dataset, para extrair a mdia da taxa de acerto e do tempo de resposta
em cada iterao.
A Figura 34 mostra as taxas de acerto e tempo de respostas de cada
dataset em cada iterao. Conforme esperado, a taxa de acerto cresce ra-
pidamente nas primeiras iteraes, em que as realimentaes fornecem um
conjunto inicial de informaes para um sistema que, no princpio, no tinha
conhecimento algum sobre como solucionar problemas, e, portanto, era alta-
mente propenso a erros.
Este crescimento em algum momento satura, e, em determinados casos,
se deteriora medida que novas realimentaes so recebidas. Esta queda
ocorre devido ao aumento da frequncia com que as solues do classicador
de Bayes (na maior parte dos datasets, mais sujeito a erros) so aceitas. O
Cardiotocography (NSP) representa o caso mais crtico desta queda, com uma
perda de 13% entre a 300
a
e a 2000
a
iterao.
Entretanto, o aumento da frequncia com que as solues do classicador
de Bayes so aceitas tambm impulsiona uma queda no tempo de resposta,
181
0.000
0.020
0.040
0.060
0.080
68%
71%
74%
77%
80%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Blood Transfusion
0.000
0.500
1.000
1.500
2.000
70%
80%
90%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Car Evaluation
0.000
2.000
4.000
6.000
8.000
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Cardiotocography (Class)
0.000
2.000
4.000
6.000
70%
80%
90%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Cardiotocography (NSP)
0.000
0.500
1.000
1.500
2.000
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Contraceptive
0.000
0.500
1.000
1.500
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Credit Aproval
0.000
0.100
0.200
0.300
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Ecoli
0.000
0.050
0.100
0.150
0.200
0.250
0%
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Glass Evaluation
Figura 34: Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme o sistema aprende com as realimentaes recebidas.
(cont.)
182
0.000
0.020
0.040
0.060
0.080
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Hayes-Roth
0.000
0.100
0.200
0.300
0.400
0.500
50%
60%
70%
80%
90%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
ILPD
0.000
0.020
0.040
0.060
0.080
20%
40%
60%
80%
100%
120%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Iris
0.000
10.000
20.000
30.000
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Nursery
0.000
0.100
0.200
0.300
0.400
0.500
85%
87%
89%
91%
93%
95%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Page Blocks
0.000
0.200
0.400
0.600
60%
70%
80%
90%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Pima Indians Diabetes
0.000
0.040
0.080
0.120
0.160
0.200
90%
92%
94%
96%
98%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Shuttle
0.000
1.000
2.000
3.000
4.000
60%
70%
80%
90%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Statlog
Figura 34: Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme o sistema aprende com as realimentaes recebidas.
(cont.)
183
0.000
0.050
0.100
0.150
0%
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Teaching Assistant
0.000
0.500
1.000
1.500
2.000
60%
70%
80%
90%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Tic-Tac-Toe
0.000
0.050
0.100
0.150
0.200
0.250
0%
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Vertebral Column
0.000
0.200
0.400
0.600
0.800
1.000
0%
20%
40%
60%
80%
100%
0 500 1000 1500 2000
T
e
m
p
o

d
e

R
e
s
p
o
s
t
a

(
m
s
)

T
a
x
a

d
e

A
c
e
r
t
o

Iterao
Yeast
Figura 34: Evoluo da taxa de acerto (linha preta) e do tempo de resposta
(linha cinza) conforme o sistema aprende com as realimentaes recebidas.
uma vez que tal dispositivo mostra-se mais rpido que o k-NN em todos os
testes realizados. O local em que esta queda observada varia em cada
um dos datasets, podendo ocorrer logo nas primeiras iteraes (e.g., Blood
Transfusion) ou tardiamente (e.g., Ecoli ). Em determinados casos, sequer h
uma queda no perodo observado (e.g., Yeast ), apesar de apresentarem um
ganho na taxa de acerto.
Estes resultados indicam que pode mostrar-se oportuno estender o mo-
delo adaptativo hbrido proposto inicialmente por Tchemra de modo que possa
comportar dispositivos de naturezas diferentes, permitindo no s um aprendi-
zado entre dispositivos (atravs do vis de repetio), mas tambm atravs de
agentes externos - no caso, simulado pela banca de testes. Entretanto, assim
como no experimento da seo 4.6.1, um perodo prolongado de aprendizado
pode ser prejudicial taxa de acerto do sistema, ainda que seja vantajoso do
184
ponto de vista do tempo de resposta. Um compromisso deve ser estabelecido
para determinar um limite ao aprendizado e evitar que este cenrio ocorra.
185
5 CONCLUSO
Neste trabalho est apresentada a formulao de um modelo-base para o
desenvolvimento de sistemas multi-dispositivos de apoio deciso. A aplica-
o de tcnicas adaptativas permite que mltiplos dispositivos possam operar
emconjunto, realizando uma distribuio de carga combase na diculdade en-
contrada pelos dispositivos em solucionar, individualmente, um determinado
problema. Tal diculdade estimada atravs da expectativa de certeza que
cada dispositivo atribui s possveis alternativas a serem adotadas como so-
luo.
O uso das tcnicas adaptativas tambm permite que cada dispositivo
aprenda, de forma incremental, com as solues obtidas atravs dos demais
dispositivos - em particular, permite que dispositivos mais rpidos aprendam
com as solues obtidas atravs daqueles de maior taxa de acerto (e, em ge-
ral, mais lentos), aumentando a frequncia com que suas solues so acei-
tas, e, consequentemente, diminuindo o tempo mdio de resposta medida
que novos problemas so solucionados.
Atravs deste mtodo de aprendizado, tambm possvel realimentar os
sistemas de apoio deciso a partir de fontes externas, possibilitando sua
manuteno por parte de operadores humanos, ou ento, com a ajuda de
algum agente inteligente, que seja capaz de avaliar a qualidade das solues
encontradas.
186
A base conceitual deste trabalho foi originada pela combinao do mo-
delo hbrido da tabela de deciso adaptativa proposta por Tchemra (TCHEMRA,
2009) e de conceitos de aprendizagem de mquina mediante incertezas. O
tratamento de incertezas utilizado para que o processo de aprendizagem de
cada dispositivo pondere a credibilidade das novas informaes recebidas de
acordo com a fonte de origem - e.g., outros dispositivos, agentes inteligentes
e operadores humanos.
Este trabalho apresenta tanto contribuies tericas no campo de tcnicas
adaptativas, como aplicaes prticas para a construo de sistemas hbridos
de tomada de deciso, conforme apresentado a seguir.
5.1 Contribuies
Para a rea de tecnologia adaptativa, este trabalho mostra que o modelo
hbrido de tomada de deciso proposto por Tchemra (TCHEMRA, 2009) pode
ser estendido para alm das tabelas de deciso, englobando outros tipos de
dispositivos adaptativos - no necessariamente restritos queles guiados por
regras. Esta caracterstica viabiliza a transferncia de conhecimento entre dis-
positivos quaisquer, permitindo que cada um deles aprenda com as solues
determinadas pelos demais. O uso desta forma de aprendizado, contudo, re-
quer que os dispositivos tenham capacidade de agregar informaes de forma
incremental ao longo de sua execuo.
De forma complementar, o uso de um modelo de conana com valores-
verdade numricos ao invs de verdades absolutas (booleanas) permite que
o aprendizado possa ocorrer de forma suave, ponderando as informaes no
s pelo nvel de verdade que cada uma possui, mas tambm pelo quo con-
veis elas so. Logo, novas informaes tm inuncia menor do que aquelas
187
j utilizadas e validadas h mais tempo, mas se tornam mais conveis me-
dida que vo sendo mais utilizadas. Como este modelo de conana no est
associado a um dispositivo em particular, qualquer mtodo de tomada de de-
ciso capaz de lidar com verdades no absolutas (e.g., lgica difusa ou fuzzy)
tambm pode se aproveitar deste formalismo.
Outra contribuio o uso de umcritrio para regular a relao de compro-
misso entre taxa de acerto e tempo de resposta dos sistemas, sob a premissa
de que os dispositivos mais lentos devem apresentar taxas de acerto maiores.
Experimentos com dados de testes reais mostram que, na maior parte dos ca-
sos, as taxas de acerto destes sistemas para um mesmo tempo de resposta
so maiores daquelas obtidas por uma simples distribuio de carga no in-
formada. Este um resultado importante, pois viabiliza uma distribuio mais
eciente dos problemas, restringindo o uso dos dispositivos mais lentos para
aqueles mais difceis.
No mbito prtico, o formalismo proposto neste trabalho permite que novos
sistemas de apoio deciso sejam construdos atravs do reuso de concei-
tos previamente estudados, incorporando tcnicas aprendizagem de mquina
para tratar informaes mediante incertezas - um aspecto que no havia sido
tratado na TDAE original. Assim, novos dispositivos podem ser implementa-
dos e integrados ao modelo-base, adequando-os para calcular a expectativa
de certeza de cada alternativa ao invs de retornar uma nica soluo.
Outra contribuio prtica consiste na disponibilizao de um banco de
testes para levantar as curvas de taxa de acerto e de tempo de resposta em
funo de um limiar, que controle a distribuio de carga. Estas medidas
permitem no s escolher um valor timo para este limiar, que maximize a
taxa de acerto mediante uma limitao do tempo de resposta, mas tambm
comparar os desempenhos obtidos por estes sistemas com os obtidos em
188
outras tcnicas de tomada de deciso.
5.2 Trabalho Futuro
A partir dos resultados alcanados neste trabalho, outros aspectos rele-
vantes ao processo de tomada de deciso podem ser investigados para ve-
ricar como inuenciam a taxa de acerto e o tempo de resposta, bem como
propor formas de minimizar seus efeitos negativos.
Um aspecto no explorado nesta dissertao a deteco e o tratamento
dos desvios de conceito. Ainda que o modelo de conana proposto no utilize
verdades absolutas, o tratamento de conceitos variveis no tempo requer no
apenas um aprendizado incremental, mas tambm a capacidade de detectar
informaes obsoletas, que deterioram a qualidade das solues, e remov-
las do sistema. Esta forma de aprendizado dito decremental, e exige que
os dispositivos consigam remover informaes uma-a-uma - aspecto que, em-
bora ainda pouco explorado no campo de aprendizado de mquina, conside-
rado no mbito dos mtodos adaptativos, que operam essencialmente atravs
de incrementos, tanto na incorporao como na remoo de informaes es-
senciais s decises por eles tomadas.
De maneira complementar, outra sugesto de continuidade deste trabalho
o desenvolvimento de um mdulo capaz de analisar situaes em que o con-
junto corrente de possveis solues no atende s necessidades do problema
por conter muitos casos no solucionados. Como estes casos no possuem
umgabarito para vericar qual seriamsuas solues, mtodos de aprendizado
no supervisionados podem ser utilizados para encontrar padres nestes ca-
sos (e.g., clustering), e inferir se h a necessidade de uma nova alternativa.
Tanto a anlise de desvio de conceito como a anlise de casos sem soluo
189
podem ser vistos como blocos realimentadores, conforme proposto na seo
3.1.
Tambm pode ser destacado um estudo de novas estratgias de colabo-
rao entre dispositivos, comparando-as com a la de dispositivos ordenada
por tempo resposta, utilizada neste trabalho. Ainda que esta la permita con-
trolar a relao de compromisso entre taxa de acerto e tempo de resposta, ela
no adaptvel, muito menos congurvel. Algum tipo de inteligncia poderia
ser injetada neste processo, usando para isso a adaptatividade para efetuar
uma seleo dinmica do dispositivo mais apropriado para cada problema a
ser solucionado, sem precisar executar os dispositivos de forma cega. Como
exemplo, a base de conhecimento poderia memorizar no s as decises to-
madas, mas tambm qual a frequncia com que cada dispositivo teve sua
soluo aceita. Esta informao poderia ser utilizada para denir um meca-
nismo adaptativo que escolhe o dispositivo com melhor ndice de aceitao
para cada problema a ser solucionado.
Dentre os aspectos com potencial de aprofundamento, destaca-se uma in-
vestigao dos efeitos que um treinamento inicial pode ter sobre a evoluo
da taxa de acerto e do tempo de resposta. Variveis tais como a quantidade
de instncias de treinamento e a credibilidade das realimentaes recebidas
(carga inicial, vis de repetio e do usurio) podem ser estudadas individu-
almente para vericar como elas se relacionam e inuem na forma como um
dispositivo aprende medida que recebe novas realimentaes.
Outra possibilidade explorar outros critrios de aceitao de uma solu-
o. Neste trabalho, foi utilizada uma funo limiar, que simplesmente verica
se a expectativa de certeza de uma soluo superior a um valor de refern-
cia. Todavia, outras informaes poderiam ser levadas em considerao para
denir tal critrio, como exemplo, uma comparao entre os elementos do ve-
190
tor da expectativa de certeza. Tambm deve ser notado que o critrio adotado
neste trabalho opera apenas na expectativa de certeza do dispositivo corrente
- uma possvel alternativa seria agregar todos os resultados dos dispositivos
previamente utilizados, e vericar se eles tm alguma alternativa em comum.
De forma similar, outro ponto a ser explorado a ao a ser tomada
quando nenhum dispositivo obtm uma soluo aceita pelo critrio adotado.
Ao invs de retornar a soluo obtida pelo ltimo dispositivo, outras aes po-
deriam ser tomadas, como exemplo, utilizar um sistema de votao entre os
dispositivos.
Finalmente, sugere-se a adequao de outros tipos de dispositivos e veri-
car como cada um deles inuencia a taxa de acerto e o tempo de resposta
dos sistemas de tomada de deciso. Algoritmos que apresentem capacidade
de inserir e remover informaes de forma incremental, e.g., ITI (Incremental
Tree Inducer ) (UTGOFF; BERKMAN; CLOUSE, 1997), tm potencial para estudo
futuro, uma vez que estariam de acordo no s com as especicaes neces-
srias para o atual modelo de desenvolvimento proposto, mas tambm para
um suposto formalismo que trate desvios de conceito.
191
REFERNCIAS
AAMODT, A.; PLAZA, E. Case-based reasoning: foundational issues,
methodological variations, and system approaches. AI Communications, IOS
Press, v. 7, p. 3959, March 1994. ISSN 0921-7126.
ACKLAM, P. J. An algorithm for computing the inverse normal cumulative
distribution function. 2003. Acesso em: 1 de abril de 2013. Disponvel em:
<http://home.online.no/pjacklam/notes/invnorm/>.
AGASANDJAN, G. A. Automata with a variable structure. In: Doklady
Akademii Nauk SSSR. [S.l.: s.n.], 1967. v. 174, p. 529530.
AHA, D. W.; KIBLER, D. Instance-based learning algorithms. In: Machine
Learning. [S.l.: s.n.], 1991. p. 3766.
AKAHO, S. Conditionally independent component extraction for naive bayes
inference. In: Proceedings of the International Conference on Articial Neural
Networks. [S.l.]: Springer-Verlag, 2001. (ICANN 01), p. 535540. ISBN
3-540-42486-5.
ALFENAS, D. A.; PEREIRA-BARRETTO, M. R. Adaptatividade em robs
sociveis: uma proposta de um gerenciador de dilogos. In: 6
o
Workshop de
Tecnologia Adaptativa. [S.l.: s.n.], 2012.
ALFENAS, D. A. et al. Sistemas de markov adaptativos: Formulao e
plataforma de desenvolvimento. In: 6
o
Workshop de Tecnologia Adaptativa.
[S.l.: s.n.], 2012.
ANDERSON, J. R. The architecture of cognition. Cambridge, MA, USA:
Harvard University Press, 1983.
ANKERST, M. et al. Optics: ordering points to identify the clustering structure.
ACM SIGMOD international conference on Management of data, ACM, New
York, NY, USA, v. 28, p. 4960, June 1999. ISSN 0163-5808.
ARNOTT, D. Decision support systems evolution: framework, case study and
research agenda. European Journal of Information Systems, v. 13, n. 4, p.
247259, December 2004.
ARNOTT, D.; PERVAN, G. A critical analysis of decision support systems
research. Journal of Information Technology, v. 20, n. 2, p. 6787, June 2005.
BABENKO, B.; YANG, M.-H.; BELONGIE, S. A family of online boosting
algorithms. In: Online Learning for Computer Vision Workshop. [S.l.: s.n.],
2009. p. 13461353.
192
BAKKEN, B. E. Learning and Transfer of Understanding in Dynamic Decision
Environments. Tese (Doutorado) Massachusetts Institute of Technology,
1993.
BALAKRISHNAN, J. D.; RATCLIFF, R. Testing models of decision making
using condence ratings in classication. J Exp Psychol Hum Percept Perform,
v. 22, n. 3, p. 615633, June 1996. ISSN 0096-1523.
BASSETO, B. A.; NETO, J. J. A stochastic musical composer based on
adaptative algorithms. In: Proceedings of the 6th Brazilian Symposium on
Computer Music - SBC&M99. Rio de Janeiro: [s.n.], 1999. p. 105113.
BECHARA, A. The role of emotion in decision-making: Evidence from
neurological patients with orbitofrontal damage. Brain and Cognition, v. 55,
n. 1, p. 3040, 2003.
BECKMANN, N. et al. The r*-tree: an efcient and robust access method
for points and rectangles. In: Proceedings of the 1990 ACM SIGMOD
international conference on Management of data. New York, NY, USA: ACM,
1990. (SIGMOD 90), p. 322331. ISBN 0-89791-365-5.
BELL, D. E.; RAIFFA, H.; TVERSKY, A. Descriptive, normative, and
prescriptive interactions in decision making. In: Decision making: descriptive,
normative, and prescriptive interactions. [S.l.]: Cambridge University Press,
1988. p. 930.
BENTLEY, J. L. Multidimensional binary search trees used for associative
searching. Communications of the ACM, ACM, New York, NY, USA, v. 18, p.
509517, September 1975. ISSN 0001-0782.
BOULL, M. A robust method for partitioning the values of categorical
attributes. In: Extraction et Gestion des Connaissances. [S.l.]: Cpadus-
ditions, 2004. (Revue des Nouvelles Technologies de lInformation), p.
173184. ISBN 2-85428-633-2.
BROWN, L. D.; CAI, T. T.; DASGUPTA, A. Interval estimation for a binomial
proportion. Statistical Science, v. 16, p. 101133, 2001.
CAMARGO, R.; RAUNHEITTE, L. Convoluo adaptativa. In: 5
o
Workshop de
Tecnologia Adaptativa. [S.l.: s.n.], 2011. p. 611.
CARUANA, R.; NICULESCU-MIZIL, A. An empirical comparison of supervised
learning algorithms. In: Proceedings of the 23rd international conference
on Machine learning. New York, NY, USA: ACM, 2006. p. 161168. ISBN
1-59593-383-2.
CASTRO JR., A. A.; NETO, J. J.; PISTORI, H. Determinismo em autmatos
de estados nitos adaptativos. Revista IEEE Amrica Latina, v. 5, p. 515521,
Novembro 2007. ISSN 1548-0992.
193
CEREDA, P. R. M.; NETO, J. J. Minerao adaptativa de dados: Aplicao
identicao de indivduos. In: 6
o
Workshop de Tecnologia Adaptativa. [S.l.:
s.n.], 2012.
CHEN, Y. A monte carlo study on impacts of the size of subsample catch
on estimation of sh stock parameters. Fisheries Research, v. 26, n. 3, p.
207223, 1995.
CHITTKA, L.; SKORUPSKI, P.; RAINE, N. E. Speed-accuracy tradeoffs in
animal decision making. Trends in Ecology & Evolution, v. 24, n. 7, p. 400407,
July 2009.
CHRISTIANSEN, H. Recognition of generative languages. In: on Programs
as data objects. New York, NY, USA: Springer-Verlag New York, Inc., 1985. p.
6381. ISBN 0-387-16446-4.
. A survey of adaptable grammars. SIGPLAN Not., ACM, New York, NY,
USA, v. 25, n. 11, p. 3544, November 1990. ISSN 0362-1340.
CHUA, E. A. et al. Dissociating condence and accuracy: Functional magnetic
resonance imaging shows origins of the subjective memory experience.
Journal of Cognitive Neuroscience, Massachusetts Institute of Technology
Press, v. 16, n. 7, p. 11311142, 2004.
CLEARY, J. G.; TRIGG, L. E. K*: An instance-based learner using an entropic
distance measure. In: In Proceedings of the 12th International Conference on
Machine Learning. [S.l.]: Morgan Kaufmann, 1995. p. 108114.
CORTES, C.; VAPNIK, V. Support-vector networks. In: Machine Learning.
[S.l.: s.n.], 1995. v. 20, n. 3, p. 273297.
COSTA, E. R.; HIRAKAWA, A. R.; NETO, J. J. An adaptive alternative
for syntactic pattern recognition. In: In Proceeding of 3rd International
Symposium on Robotics and Automation, ISRA. Toluca, Mexico: [s.n.], 2002.
p. 409413.
CRIVELARO, F. J. B. C. V.; ROCHA, R. L. de Azevedo da. Proposta de
modelo adaptativo para gerao de contextos na recomendao de locais. In:
6
o
Workshop de Tecnologia Adaptativa. [S.l.: s.n.], 2012.
CROZIER, R.; RANYARD, R. Cognitive process models and explanations of
decision making. In: Decision Making: Cognitive Models and Explanations.
Saffron Walden, UK: Routledge, 1997. p. 520.
DING, D.; LI, Q.; YANG, J. Multimedia data integration and navigation through
mediaview: Implementation, evolution and utilization. In: LEE, Y. et al.
(Ed.). Database Systems for Advanced Applications. [S.l.]: Springer Berlin /
Heidelberg, 2004, (Lecture Notes in Computer Science, v. 2973). p. 263271.
194
DOUGHERTY, J.; KOHAVI, R.; SAHAMI, M. Supervised and unsupervised
discretization of continuous features. In: Machine Learning: Proceedings
of the Twelfth International Conference. [S.l.]: Morgan Kaufmann, 1995. p.
194202.
EINHORN, H. J.; HOGARTH, R. M. Condence in judgment: Persistence
of the illusion of validity. Psychological Review, v. 85, n. 5, p. 395416,
September 1978.
ESTER, M. et al. A density-based algorithm for discovering clusters in large
spatial databases with noise. In: Proceedings of 2nd International Conference
on Knowledge Discovery and Data Mining. [S.l.: s.n.], 1996. p. 226231.
EVANGELISTA, P. F.; EMBRECHTS, M. J.; SZYMANSKI, B. K. Taming the
curse of dimensionality in kernels and novelty detection. In: Applied Soft
Computing Technologies: The Challenge of Complexity. [S.l.]: Springer
Verlag, 2006. p. 431444.
FRANK, A.; ASUNCION, A. UCI Machine Learning Repository. 2011. Acesso
em: 1 de abril de 2013. Disponvel em: <http://archive.ics.uci.edu/ml>.
FRANK, H.; ALTHOEN, S. C. Statistics: Concepts and Applications Workbook.
[S.l.]: Cambridge University Press, 1994. ISBN 978-0521445542.
GENTNER, D. Structure mapping - a theoretical framework for analogy.
Cognitive Science, v. 7, p. 155170, 1983.
GKER, M. H.; ROTH-BERGHOFER, T. Development and utilization of
a case-based help-desk support system in a corporate environment. In:
Case-Based Reasoning and Development. [S.l.: s.n.], 1999. p. 132146.
GRIFFIN, D.; TVERSKY, A. The weighing of evidence and the determinants of
condence. Cognitive Psychology, v. 24, n. 3, p. 411435, July 1992.
HENDRICKX, I.; BOSCH, A. van den. Hybrid algorithms with instant-based
classication. In: Machine learning - ECML 2005. [S.l.]: Springer, 2005. p.
158169.
HIRAKAWA, A. R.; SARAIVA, A. M.; CUGNASCA, C. E. Autmatos
adaptativos aplicados em automao e robtica. Revista IEEE Amrica
Latina, v. 5, n. 7, p. 539543, November 2007. ISSN 1548-0992.
HOLTON, G. A. Monte Carlo Method. 2004. Acesso em: 1 de abril de 2013.
Disponvel em: <http://www.riskglossary.com/link/monte carlo method.htm>.
HUGHES, M. L.; SHANK, R. M.; STEIN, E. S. Decision Tables. Wayne,
Pennsylvania: MDI Publications, 1968.
JESUS, L. de et al. Adaptools 2.0: Aspectos de implementao e utilizao.
Revista IEEE Amrica Latina, v. 5, n. 7, p. 527532, November 2007. ISSN
1548-0992.
195
KAHNEMAN, D.; TVERSK, A. Prospect theory: An analysis of decision under
risk. Econometrica, v. 47, n. 2, p. 263292, March 1979.
KEEN, P. G. W. Decision Support Systems: An Organizational Perspective.
[S.l.]: Addison-Wesley, 1978. ISBN 0201036673.
KELLER, J. M.; GRAY, M. R.; GIVENS JR., J. A. A fuzzy k-nearest neighbor
algorithm. IEEE Transactions on Systems, Man, and Cybernetics, v. 15, p.
580585, 1985.
KIBRIYA, A. M.; FRANK, E. An empirical comparison of exact nearest
neighbour algorithms. In: Proceedings of the 11th European conference
on Principles and Practice of Knowledge Discovery in Databases. Berlin,
Heidelberg: Springer-Verlag, 2007. (PKDD 2007), p. 140151. ISBN
978-3-540-74975-2.
KOHAVI, R. A study of cross-validation and bootstrap for accuracy estimation
and model selection. In: Proceedings of the 14th international joint conference
on Articial intelligence. [S.l.]: Morgan Kaufmann Publishers Inc., 1995.
(IJCAI95, v. 2), p. 11371143. ISBN 1-55860-363-8.
KOLODNER, J. L. Improving human decision making through case-based
decision aiding. AI Mag., American Association for Articial Intelligence, Menlo
Park, CA, USA, v. 12, p. 5268, April 1991. ISSN 0738-4602.
KOTSIANTIS, S.; KANELLOPOULOS, D. Discretization techniques: A
recent survey. GESTS International Transactions on Computer Science and
Engineering, v. 32, n. 1, p. 4758, 2006.
KUNCHEVA, L. I. Using Control Charts for Detecting Concept Change in
Streaming Data. [S.l.], 2009.
LANE, D. M. Percentiles. 2010. Acesso em: 1 de abril de 2013. Disponvel
em: <http://cnx.org/content/m10805/latest/>.
LEAKE, D. B.; KINLEY, A.; WILSON, D. Learning to improve case adaptation
by introspective reasoning and cbr. In: Proceedings of the First International
Conference on Case-Based Reasoning. [S.l.]: Springer-Verlag, 1995. p.
229240.
LI, C.; LI, H. A survey of distance metrics for nominal attributes. Journal of
Software, v. 5, n. 11, 2010.
LIU, W.; CHAWLA, S. Class condence weighted knn algorithms for
imbalanced data sets. In: Proceedings of the 15th Pacic-Asia conference
on Advances in knowledge discovery and data mining. Berlin, Heidelberg:
Springer-Verlag, 2011. (PAKDD11, v. 2), p. 345356. ISBN 978-3-642-20846-
1.
MARKOVITCH, S.; SCOTT, P. The role of forgetting in learning. In:
Proceedings of The Fifth International Conference on Machine Learning. [S.l.:
s.n.], 1988. p. 459465.
196
MENEZES, C. E. D. de; NETO, J. J. Um mtodo hbrido para a construo
de etiquetadores morfolgicos, aplicado lngua portuguesa, baseado
em autmatos adaptativos. In: Anais da Conferencia Iberoamericana en
Sistemas, Ciberntica e Informtica. Orlando, Florida: [s.n.], 2002. p. 1921.
MITCHELL, T. M. Machine Learning. [S.l.]: McGraw Hill, 1997. ISBN
0-07-042807-7.
MULLEN, J. D. Decision Making: Its Logic and Practice. [S.l.]: Rowman &
Littleeld Publishers, 1990. ISSN 08476-76196.
MYERSON, R. B. Game Theory: Analysis of Conic. [S.l.]: Harvard University
Press, 1991. ISBN 0674341163.
NETO, J. J. Uma soluo adaptativa para reconhecedores sintticos. In: Anais
EPUSP - Engenharia de Eletricidade. [S.l.: s.n.], 1988. (B, v. 1), p. 645657.
NETO, J. J. Contribuies metodologia de construo de compiladores.
Tese (Doutorado) Escola Politcnica, Universidade de So Paulo, 1993.
. Adaptive rule-driven devices - general formulation and case study.
In: CIAA 01: Revised Papers from the 6th International Conference on
Implementation and Application of Automata. [S.l.: s.n.], 2001. (Springer-
Verlag), p. 234250.
. Um levantamento da evoluo da adaptatividade e da tecnologia
adaptativa. Revista IEEE Amrica Latina, v. 5, n. 7, p. 496505, November
2007. ISSN 1548-0992.
NETO, J. J.; MAGALHES, M. E. S. Reconhecedores sintticos - uma
alternativa didtica para uso em cursos de engenharia. In: XIV Congresso
Nacional de Informtica. [S.l.: s.n.], 1981. p. 171181.
OUYANG, D.; LI, D.; LI, Q. Cross-validation and non-parametric k nearest-
neighbour estimation. Econometrics Journal, v. 9, n. 3, p. 448471,
2006.
PARSLOE, E.; WRAY, M. J. Coaching and Mentoring: Practical Methods to
Improve Learning. [S.l.]: Kogan Page Publishers, 2000. ISBN 0749431180.
PISTORI, H. Tecnologia Adaptativa em Engenharia de Computao: Estado
da Arte e Aplicaes. Tese (Doutorado) Escola Politcnica, Universidade
de So Paulo, So Paulo, 2003.
PISTORI, H.; NETO, J. J.; PEREIRA, M. C. Adaptive non-deterministic
decision trees: General formulation and case study. INFOCOMP Journal of
Computer Science, 2006.
PLOUS, S. The Psychology of Judgment and Decision Making. 1st. ed. [S.l.]:
McGraw-Hill, 1993. ISBN 978-0070504776.
197
POUNDSTONE, W. Prisoners Dilemma: John Von Neumann, Game Theory
and the Puzzle of the Bomb. 1st. ed. New York, NY, USA: Doubleday, 1992.
ISBN 0385415672.
QUINLAN, J. R. Induction of decision trees. Machine Learning, v. 1, p. 81106,
March 1986.
. Improved use of continuous attributes in c4.5. Journal of Articial
Intelligence Research, v. 4, p. 7790, March 1996.
RAJARAMAN, V. Analysis and Design of Information Systems. 2nd. ed. [S.l.]:
PHI Learning Pvt. Ltd, 2004.
ROCHA, R. L. de Azevedo da; NETO, J. J. Autmato adaptativo, limites e
complexidade em comparao com mquina de turing. In: Proceedings of the
second Congress of Logic Applied to Technology - LAPTEC 2000. So Paulo:
Faculdade SENAC de Cincias Exatas e Tecnologia: [s.n.], 2000. p. 3348.
SAATY, T. L.; VARGAS, L. G. Models, Methods, Concepts & Applications of
the Analytic Hierarchy Process. [S.l.]: Springer, 2000.
SABALIAUSKAS, J. A.; ROCHA, R. L. de Azevedo da. Projeto e
implementao de uma linguagem de programao para a execuo de
algoritmos adaptativos. In: 5
o
Workshop de Tecnologia Adaptativa. [S.l.: s.n.],
2011. p. 9196.
SAFFARI, A. et al. On-line random forests. In: 3rd IEEE ICCV Workshop on
On-line Computer Vision. [S.l.: s.n.], 2009. p. 13931400.
SALOMAA, A. On nite automata with a time-variant structure. Information
and Control, v. 13, p. 8598, 1968.
SANFEY, A. G. et al. The neural basis of economic decision-making in the
ultimatum game. Science, IOS Press, v. 300, p. 17551758, June 2003.
SANTIBAEZ, M. R. F.; NETO, J. J. Um sistema para ensino da tecnologia
adaptativa. In: 5
o
Workshop de Tecnologia Adaptativa. [S.l.: s.n.], 2011. p.
1624.
SCHANK, R. C. Dynamic memory; a theory of reminding and learning in
computers and people. [S.l.]: Cambridge University Press, 1982.
SCHOONJANS, F.; BACQUER, D. D.; SCHMID, P. Estimation of population
percentiles. Epidemiology, v. 22, n. 5, p. 750751, 2011. ISSN 1044-3983.
SCHULTZKIE, L. Percentiles and More Quartiles. 1998. Acesso em: 1 de abril
de 2013. Disponvel em: <http://regentsprep.org/REgents/math/ALGEBRA-
/AD6/quartiles.htm>.
SHAW, W. T. Sampling student?s t distribution ? use of the inverse cumulative
distribution function. Journal of Computational Finance, v. 9, n. 4, p. 3773,
2006.
198
SHEPARD, D. A two-dimensional interpolation function for irregularly-spaced
data. In: Proceedings of the 1968 23rd ACM national conference. New York,
NY, USA: ACM, 1968. (ACM 68), p. 517524.
SILVA, S. R. B. da. Software adaptativo: mtodo de projeto, representao
grca e implementao de linguagem de programao. Dissertao
(Mestrado) Escola Politcnica, Universidade de So Paulo, So Paulo,
2011.
SMYTH, B.; CUNNINGHAM, P. Dj vu: A hierarchical case-based reasoning
system for software design. In: European Conference on Articial Intelligence.
[S.l.: s.n.], 1992. p. 587589.
SMYTH, B.; KEANE, M. T. Remembering to forget: A competence-preserving
case deletion policy for case-based reasoning systems. In: Proceedings of
the 14th International Joint Conference on Articial Intelligence. Montreal,
Quebec: [s.n.], 1995. p. 377382.
SOL, H. G.; TAKKENBERG, C. A. T.; ROBB, P. F. de V. Expert systems and
articial intelligence in decision support systems. In: In Proceedings of the
Second Mini Euroconference. [S.l.]: Springer, 1985. p. 1720.
SPRAGUE, R. H.; CARLSON, E. D. Building Effective Decision Support
Systems. [S.l.]: Prentice Hall Professional Technical Reference, 1982. ISBN
0130862150.
STANGE, R. L.; NETO, J. J. Aprendizagem incremental usando tabelas
deciso adaptativas. In: 5
o
Workshop de Tecnologia Adaptativa. [S.l.: s.n.],
2011. p. 3542.
TCHEMRA, A. H. Tabela de Deciso Adaptativa na Tomada de Deciso
Multicritrio. Tese (Doutorado) Escola Politcnica, Universidade de So
Paulo, So Paulo, 2009.
UTGOFF, P. E.; BERKMAN, N. C.; CLOUSE, J. A. Decision tree induction
based on efcient tree restructuring. Machine Learning, Kluwer Academic
Publishers, Hingham, MA, USA, v. 29, p. 544, October 1997. ISSN
0885-6125.
VALLE, L. E. C. D.; ROCHA, R. L. de Azevedo da. Adaptatividade em imagens
de satlite para previso do tempo. In: 5
o
Workshop de Tecnologia Adaptativa.
[S.l.: s.n.], 2011. p. 7278.
VOULGARIS, Z.; MAGOULAS, G. D. Extensions of the k nearest neighbour
methods for classication problems. In: Proceedings of the 26th IASTED
International Conference on Articial Intelligence and Applications. Anaheim,
CA, USA: ACTA Press, 2008. (AIA 08), p. 2328. ISBN 978-0-88986-710-9.
WEBB, G. I.; BOUGHTON, J. R.; WANG, Z. Not so naive bayes: Aggregating
one-dependence estimators. In: Machine Learning. [S.l.: s.n.], 2005. p. 524.
199
WESTBROOK, J. I.; GOSLING, A. S.; COIERA, E. W. The impact of an online
evidence system on condence in decision making in a controlled setting.
Medical Decision Making, v. 25, n. 2, p. 178185, 2005.
WITTEN, I. H.; FRANK, E. Data mining: practical machine learning tools
and techniques. San Francisco, CA, USA: Morgan Kaufmann, 2005. ISBN
0120884070.
WU, X. et al. Top 10 algorithms in data mining. Knowledge and Information
Systems, Springer-Verlag New York, Inc., New York, NY, USA, v. 14, n. 1, p.
137, dez. 2007. ISSN 0219-1377.
YANG, Y.; WEBB, G. I. A comparative study of discretization methods for
naive-bayes classiers. In: In Proceedings of PKAW 2002: The 2002 Pacic
Rim Knowledge Acquisition Workshop. [S.l.: s.n.], 2002. p. 159173.
ZHANG, Y. et al. Efcient rank based knn query processing over uncertain
data. In: Data Engineering (ICDE). [S.l.]: IEEE, 2010. p. 2839. ISBN
978-1-4244-5444-0.
200
APNDICE A -- PERCENTIL DA
DISTRIBUIO NORMAL
Em estatstica, percentil uma medida que estima a frequncia com
que as observaes de uma varivel ca abaixo de um valor de referncia
(SCHULTZKIE, 1998). O percentil frequentemente utilizado em diversos ramos
de pesquisa como forma de avaliar a posio de uma observao em relao
s demais. Como exemplo, avaliaes acadmicas utilizam o percentil para
ranquear cada indivduo de acordo com sua nota.
Formalmente, no h uma denio universalmente aceita para o signi-
cado de percentil (LANE, 2010; SCHOONJANS; BACQUER; SCHMID, 2011). Abaixo,
seguem duas interpretaes comumente utilizadas:
O k-simo percentil de uma amostra o menor valor z que maior do
que k por cento das observaes em uma determinada varivel.
O k-simo percentil de uma amostra o menor valor z que maior ou
igual do que k por cento das observaes em uma determinada varivel.
Apesar de sutis, estas diferenas podem levar a resultados discrepantes,
especialmente para amostras pequenas. No entanto, estes resultados devem
convergir medida que o nmero de observaes aumenta (SCHOONJANS;
BACQUER; SCHMID, 2011). Para padronizao, as frmulas a serem apresenta-
das adiante utilizam a primeira interpretao como referncia.
201
Para o caso especco de uma distribuio normal padro (i.e., distribuio
normal que apresenta mdia 0 e desvio padro 1), o valor do (100 p)-simo
percentil z
p
calculado pela funo quantil (i.e., inversa da funo distribui-
o acumulada - FDA) da distribuio normal, representada por
1
(p). Esta
funo denida como:

1
(p) =

2 erf
1
(2p 1) (A.1)
onde erf (x) a funo erro:
erf (x) =
2

_
p
0
e
t
2
dt (A.2)
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
-4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00
p = 97,5%
!-1 (p) = 1,96
Figura 35: Curva da funo densidade de probabilidade da distribuio normal
padro. Para p = 0, 975, o valor do percentil correspondente z
p
1, 96, i.e.,
97, 5% das observaes cam abaixo de 1, 96.
A inversa da funo erro utilizada por
1
(p) dada por:
erf
1
(z) =

k=0
c
k
2k + 1
_

2
z
_
2k+1
(A.3)
tal que c
0
= 1, e:
c
k
=
k1

m=0
c
m
c
k1m
(m + 1) (2m + 1)
(A.4)
Observando estas funes, nota-se que no h uma forma fechada para a
inversa da FDA da distribuio normal padro. Na prtica, utilizam-se aproxi-
202
maes (ACKLAM, 2003), ou ento, uma tabela para consultar os valores mais
comuns. O grco da Figura 36 ilustra o valor da funo em todo o seu dom-
nio. Note que a funo tende ao innito conforme p tende a 0 ou 1.
-4
-3
-2
-1
0
1
2
3
4
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
!
(
p
)

p
Inversa da FDA da Distribuio Normal
Figura 36: Curva da inversa da funo distribuio acumulada da distribuio
normal padro.
Vale ressaltar que variveis que seguem uma distribuio normal so con-
tnuas, fazendo com que a probabilidade de um valor x qualquer assumir um
valor especco z
i
seja zero, i.e., P (x = z
i
) = 0 (FRANK; ALTHOEN, 1994). Logo:
P (x z
i
) = P (x < z
i
) (A.5)
Esta propriedade das distribuies contnuas faz com que a denio do
percentil para uma distribuio normal padro seja independente da interpre-
tao do percentil para o caso geral.
O clculo do percentil de uma distribuio normal padro especialmente
til para determinar um intervalo [z, z] que apresente uma certa porcenta-
gem das observaes. A probabilidade de uma observao car fora deste
203
intervalo representada por . Portanto:
P (x < z) + P (x > z) = (A.6)
onde P (s) probabilidade da proposio s ser verdadeira. Como a distri-
buio normal padro simtrica em torno de zero (FRANK; ALTHOEN, 1994),
P (x < z) = P (x > z). Logo:
P (x < z) = P (x > z) = /2 (A.7)
Utilizando o complemento destas probabilidades:
P (x z) = 1 P (x > z) = 1 /2 (A.8)
Assim, para descobrir valor de z do intervalo [z, z] em funo de , basta
calcular o valor do 100(1 /2)-simo percentil da distribuio normal padro.
A Figura 37 ilustra um exemplo para = 5%.
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
-4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00
1-!
!/2
!/2
! = 5%
Figura 37: Curva da funo densidade de probabilidade da distribuio normal
padro. Para = 5%, tem-se um percentil z
1/2
1, 96, i.e., 95% da rea est
no intervalo [1, 96, +1, 96].
204
APNDICE B -- TESTE DE HIPTESE
SOBRE A MDIA DE UMA
AMOSTRA
A partir de uma mdia obtida experimentalmente atravs de uma amostra,
uma anlise comumente realizada a comparao dela com algum valor de
referncia a m de descobrir se a mdia verdadeira , estatisticamente, maior
ou menor do que esta referncia, com algum grau de certeza. Tal anlise
permite vericar se um resultado experimental est dentro de uma faixa de
valores esperada. Para esta nalidade, utiliza-se um teste de hiptese, ca-
paz de rejeitar uma hiptese caso sejam encontradas evidncias contrrias
sucientes.
Todo teste de hiptese pode ser decomposto nos seguintes passos:
1.Denir uma hiptese nula H
0
e uma hiptese alternativa H
1
;
2.Escolher o teste de estatstica apropriado para buscar evidncias que
rejeitem a hiptese nula;
3.Derivar a distribuio do teste de estatstica assumindo que H
0
seja ver-
dadeira;
4.Calcular o valor t a partir do teste de estatstica;
5.Escolher um nvel de signicncia apropriado;
205
6.A partir deste ponto, dois caminhos equivalentes podem ser seguidos:
(a)Vericar se t est na regio crtica da distribuio: a hiptese nula
rejeitada se t estiver nesta regio;
(b)Calcular o p-valor com base em t e comparar com : a hiptese
nula rejeitada se p < .
A escolha das hipteses feita de acordo com o que se deseja provar.
Em geral, a hiptese alternativa H
1
aquela que se deseja provar, enquanto
a hiptese nula H
0
a negao e/ou complemento de H
1
.
A Tabela 13 ilustra trs possveis testes de hipteses que podem ser re-
alizados acerca de uma mdia x, buscando vericar se a mdia verdadeira
deve ser diferente, menor ou maior que um valor de referncia M. O nmero
de caudas indica a posio da regio crtica.
Teste Hiptese Nula H
0
Hiptese Alternativa H
1
Nmero de caudas
1 = M ,= M 2
2 M < M 1 (esquerda)
3 M > M 1 (direita)
Tabela 13: Hipteses para anlise da mdia de uma mostra com relao a
uma referncia M.
A escolha e a derivao do teste de estatstica so feitas baseadas no que
se deseja provar. Para a anlise de mdia, uma possibilidade fazer uso do
Teste t de Student, que calcula uma estatstica de teste t com base na mdia
e no erro padro observados. Mais especicamente:
t =
x M
SE
x
(B.1)
onde:
x a mdia da amostra;
206
M o valor de referncia;
SE
x
o erro padro da amostra.
O erro padro estimado a partir de uma amostra calculado atravs da
seguinte frmula:
SE
x
=
s

n
(B.2)
onde n representa o desvio padro da amostra, enquanto s o desvio padro
medido experimentalmente.
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
-4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00
!"#$ !"#& !"#' ()*+,- .,!*/)
Figura 38: Funo densidade de probabilidade da distribuio t de Student,
de acordo com os graus de liberdade. No limite df , aproxima-se da
distribuio normal padro.
Em cada tipo de teste, importante saber qual distribuio a estatstica
de teste segue para que seja possvel analis-la. Neste caso, o valor t se-
gue uma distribuio t de Student, com df = n 1 graus de liberdade. Grau
de liberdade o nmero de valores independentes que podem variar em um
teste estatstico, e igual ao nmero de amostras menos o nmero de par-
metros avaliados - no caso, apenas um. A Figura 38 ilustra como os graus de
liberdade afetam a forma da distribuio.
207
Em seguida, um nvel de signicncia apropriado deve ser escolhido
(valores tpicos incluem 5% e 1%). Este valor dene a regio crtica da distri-
buio em que a probabilidade de se encontrar um valor t amostrado aleatori-
amente , assumindo que a hiptese nula era verdadeira. Classicamente, a
determinao da regio crtica para um valor ocorre atravs de tabelas com
valores pr-denidos para cada distribuio - no caso geral, os valores exatos
no so computveis, devendo ser estimados atravs de aproximaes.
Para uma distribuio t de Student, a regio crtica compreende as regies
extremas, tambm chamadas de cauda. A escolha das caudas a serem con-
sideradas depende do teste de hiptese, conforme mostrado na Tabela 13.
A Figura 39 ilustra a regio crtica de uma distribuio t de Student com 9
graus de liberdade para = 5% e = 1% quando apenas a cauda direita
considerada.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
-4.00 -3.50 -3.00 -2.50 -2.00 -1.50 -1.00 -0.50 0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00
! = 5%
! = 1%
Figura 39: Regio crtica de uma distribuio t de Student utilizando apenas a
cauda direita, com 9 graus de liberdade, com = 5% e = 1%.
Uma vez conhecida a regio crtica e o valor t (calculado atravs da fr-
mula B.1), uma das seguintes concluses pode ser tirada:
Se o valor t estiver contido na regio crtica, rejeita-se a hiptese nula
H
0
, pois existe uma probabilidade muito alta (1 ) de que a hiptese
no era verdadeira. Logo, H
1
deve ser verdadeira.
208
Caso contrrio, no podemos rejeitar a hiptese nula, pois no h evi-
dncias sucientes para derrub-la.
Nota: independentemente da concluso obtida, H
0
no pode ser provada
neste tipo de teste. Mesmo que ela no seja rejeitada, s possvel armar
que no foram encontradas evidncias sucientes que permitam concluir que
H
0
era falsa, o que no comprova que a armao contrria seja verdadeira.
Como exemplo, para um experimento com n = 10 amostras, mdia x = 101
e desvio padro s = 1, deseja-se vericar a hiptese de que > 100 com
signicncia = 5%. Assim, so denidas duas hipteses:
H
0
: 100
H
1
: > 100
Atravs desses dados, calcula-se SE
x
= 1/

10 = 0, 316, df = 10 1 = 9
e t = (101 100) /9 = 3, 162. Neste exemplo, a regio crtica compreende
apenas a cauda direita (conforme mostrado na Tabela 13). Consultando uma
tabela, a regio crtica para = 5% e df = 9 inicia-se em 1, 833. Como t est
dentro da regio crtica (i.e., t > 1, 833), rejeita-se a hiptese nula. A Figura
39 ilustra a regio crtica deste exemplo - note que t continua dentro da regio
crtica mesmo para = 1%.
Com o advento de mtodos computacionais ecientes, tornou-se possvel
realizar o caminho inverso: ao invs de vericar se o valor t est na regio cr-
tica determinado por , pode-se determinar qual a regio crtica delimitada
por t, e consequentemente, a probabilidade p (tambm chamada de p-valor )
de uma estatstica de teste cair nela, assumindo que hiptese nula era verda-
deira. A partir desta probabilidade p, uma das seguintes concluses podem
ser obtidas:
209
Se o valor-p inferior a , a hiptese nula H
0
rejeitada, pois pouco
provvel que a estatstica de teste possa ser obtida a partir de amostra
de uma populao em que a hiptese verdadeira.
Caso contrrio, no possvel rejeitar a hiptese nula.
Teoricamente, o valor-p pode ser calculando atravs da inversa da funo
densidade de probabilidade da distribuio utilizada, recebendo o valor t como
entrada. Contudo, muitas destas funes no possuem formas fechadas, e
requerem aproximaes para serem calculadas - e.g., para a distribuio t
de Student, Shaw dene funes exatas para certos valores de df, mas, no
caso geral, depende de funes aproximadas (SHAW, 2006). A maior parte
dos softwares estatsticos contm implementaes prprias para estas apro-
ximaes - e.g., T.DIST(x, df, cumulativo) do Microsoft Excel, utilizado neste
trabalho.
Para a distribuio t de Student, a funo de clculo do valor-p iden-
ticado por P (x t, df) e P (x t, df), que calculam a probabilidade de um
valor x obtido experimentalmente ser maior ou menor que um valor t para o
nmero de graus de liberdade df dado. Vale ressaltar que, como t de Student
uma distribuio simtrica, P (x t, df) = P (x t, df).
Utilizando o exemplo anterior, o valor-p igual a P (x 3, 162, df = 9) =
0, 00575, inferior ao valor estipulado - logo, rejeita-se a hiptese nula.
Em comparao, para um teste com duas caudas, as hipteses seriam:
H
0
: = 100
H
1
: ,= 100
Neste teste, o valor-p igual a P (x 3, 162, df = 9) +
P (x 3, 162, df = 9) = 2P (x 3, 162, df = 9), resultando em 0, 01151.
210
Para = 5%, a hiptese nula seria rejeitada, enquanto, para = 1%, no
seria possvel rejeitar a hiptese nula, uma vez que 0, 01151 > 0, 01.