Arquitectura Hierárquica de Planeamento e Controlo de Robôs Móveis Baseada Na Modulação de Parâmetros Emocionais

15-07-2008 IEEE 1
Arquitectura Hierárquica de Planeamento e

Controlo de Robôs Móveis Baseada na
Modulação de Parâmetros Emocionais
Membro Sénior, IEEE
robot a aptidão para de adaptar a certas situações com as
Resumo - Os robôs autónomos são, actualmente, incapazes quais se confronta enquanto executa a sua missão.
de igualar as capacidades adaptativas de até o mais simples É colocada a hipótese de robots dotados de emoções
dos animais. Processos afectivos tais como as emoções artificiais superarem robots sem emoções em situações para
potenciam o comportamento adaptativo em humanos e as quais nenhum código de comportamento fora previamente
animais. Embora seja discutível se as emoções concederão introduzido. Os objectivos desta pesquisa são o
aos robôs tal potencial, não haverá muitas dúvidas de que as desenvolvimento e planeamento de uma arquitectura de
emoções “artificiais” em particular, podem afectar controlo para um robot móvel autónomo que incorpora
positivamente os comportamentos de robôs ao modelar emoções artificiais, e comparar o seu desempenho com uma
acções, estabelecer objectivos prioritários, e reforçar a arquitectura equivalente mas não dotada de emoções
capacidade de aprendizagem. Para testar esta hipótese foi artificiais, testando deste modo a hipótese atrás referida.
desenvolvida uma arquitectura hierárquica que incorpora
emoções reaccionais e deliberadas.
Emoções reaccionais procedem de previsões de
acontecimentos gerados pelas emoções, de dados imediatos
de sensores, e de representações internas. As emoções II.TRABALHO RELACIONADO
deliberadas são modeladas como associação entre estados e
As emoções representam dois papéis importantes para os
por acontecimentos anteriores que tiveram como origem
robots [4]:
emoções. Emoções interagem com múltiplos níveis
Interacção Social – Emoções simuladas podem
hierárquicos ao modularem os parâmetros que controlam o
proporcionar aos robots comportamentos socialmente mais
grau de preferência do robot face a várias decisões como a
apropriados quando interagindo com humanos.
procura de objectivos, segurança e exploração.
Adaptação – Emoções artificiais são uma fonte de
O modelo foi implementado num robot móvel simulado
comportamentos adaptativos que podem potencialmente
para navegação.
melhorar o desempenho geral de um robot.
A comunidade robótica focou-se largamente nos aspectos
sociais das emoções (por exemplo [1], [5], [6], [7], [8], [9],
[10]). Neste domínio, as emoções de um robot são
I. INTRODUÇÃ0
claramente observáveis na forma de expressões faciais,
Historicamente, emoções e conhecimentos eram olhadas linguagem corporal e/ou tom de voz. A pesquisa tende a
como entidades independentes, competindo pelo controlo do focar-se na aparência das emoções robotizadas [6], nas
cérebro humano. As emoções residem nas secções primitivas avaliações subjectivas de humanos que interagem com robots
do cérebro, afastadas seguramente dos nossos sistemas de [7], [9], e nas influências das emoções humanas na
planeamento e raciocínio de alto-nível. Esta linha de aprendizagem dos robots [10].
pensamento tem vindo a ser desafiada nos últimos anos. As O segundo domínio mereceu consideravelmente menos
emoções são agora reconhecidas como fazendo parte de atenção, devido possivelmente ás maiores dificuldades
muitas funções cerebrais outrora consideradas puramente encontradas. As respostas emocionais são, neste domínio,
cognitivas, tais como aprendizagem, memorização, altamente dependentes do contexto. Enquanto que o
percepção e resolução de problemas [1]. Alguns desempenho global de um robot pode ser medido em termos
investigadores defendem que as emoções são um requisito quantitativos tais como velocidade e número de colisões, o
essencial para a inteligência [2], [3]. mesmo não acontece com as emoções, torna-se difícil medir
Dado que as emoções têm um papel preponderante no a sua contribuição para o desempenho do robot. É também
comportamento dos organismos biológicos, a ideia de aplicar difícil provar que melhorias de desempenho devidas às
emoções artificiais a robots deve ser encarada com algumas emoções não seriam possíveis de alcançar por um sistema
reservas. Tal como as definimos, emoções artificiais não são equivalente não emocional.
simples respostas exteriores superficiais que imitem as Muitos robots que supostamente utilizam emoções
emoções humanas. Antes, são mecanismos de software artificiais como fonte geral de comportamentos adaptativos
inspirados por teorias de emoções biológicas, que criam no são contudo utilizados num contexto social, interagindo
 como humanos [10], [11] ou outros robots [13], [16], [17]. A
15-07-2008 IEEE 2
função emocional mais comum prende-se com a selecção de emoções em todos os níveis da sua arquitectura de controlo,
acção/comportamento [11], [13], [14], [16], [17]. Na maioria mas não é guiado somente por emoções. Mesmo na ausência
dos exemplos a base da arquitectura de controlo é puramente de influências emocionais, ele é em geral capaz de atingir os
reactiva e/ou baseada no comportamento [11], [14], [15], seus objectivos. Ao invés o nosso modelo implementa
[16], deste modo as interacções entre emoções e planeamento emoções como adaptações de segunda ordem a certas
deliberado têm merecido pouca atenção. situações e ambientes. Esta abordagem está mais próxima da
Contrastando com estas abordagens, utilizamos emoções fisiologia humana e animal do que os métodos puramente
para melhorar as capacidades adaptativas de um robot guiados por emoções. Também elimina a necessidade de
singular num contexto não social. Representamos emoções construir uma arquitectura sem emoções separada para
não como estados lógicos discretos, mas como modulações efeitos comparativos, simplificando assim a análise.
contínuas dos parâmetros do robot. O nosso modelo é As capacidades de percepção, aprendizagem, planeamento
introduzido numa arquitectura hierárquica que incorpora e controlo são fornecidas pela arquitectura híbrida reactiva-
controlo reactivo, planeamento deliberado e capacidades deliberada do robô. Esta arquitectura não representa guias
exploratórias. competitivas como comportamentos discretos. Antes,
múltiplos guias são integradas em cada nível de controlo,
possibilitando ao robô favorecer uma resposta sem ignorar
completamente uma outra.
III. DESCRIÇÃO DO MODELO Inspirado por Dörner [21 e Fellous [22], nós modulamos as
A. Estímulo emoções como modulações dos parâmetros de planeamento e
As emoções biológicas contêm componentes inatas e controlo. Estes parâmetros mudam suavemente o grau de
aprendidas [18], que interagem com processos cognitivos a influência relativamente a algumas guias sem implicitamente
diversos níveis arquitectónicos [19]. De modo a aproximar-se controlarem os comportamentos dos robôs. A guia associada
a algumas das ricas e variadas interacções de emoções reais, a cada emoção é uma reacção ao evento que estimulou a
o nosso modelo incorpora associações aprendidas e emoção:
previamente introduzidas, e recebe entradas de camadas Medo – Evitar o perigo, reduzindo a importância do
arquitectónicas reaccionais e deliberadas. objectivo actual do robô.
São modeladas cinco emoções básicas: medo, raiva, Raiva – Atingir o objectivo presente, mesmo à custa de
surpresa, felicidade e tristeza. Não se pretende que estas considerações secundárias.
emoções sejam representações exactas das emoções humanas Surpresa – Explorar o ambiente.
com os mesmos nomes, mas sim que sirvam de rótulo para Felicidade – Reforça positivamente comportamentos que
certas categorias de padrões estímulo/resposta. De certo que conduzem ao sucesso.
nesta categorização simples outras emoções humanas podem Tristeza – Reforça negativamente comportamento que
ser tidas em conta (por exemplo frustração = raiva, conduzem ao fracasso.
curiosidade = surpresa).
Cada emoção básica está ligada a uma diferente categoria
de acontecimentos que estimulam as emoções:
Medo – o robô danifica-se. IV. IMPLEMENTAÇÃO DO MODELO
Raiva – o caminho para o objectivo é obstruído. O modelo é implementado numa versão simulada do
Surpresa – percepção real difere da previamente instalada. MARVIN (Robô Móvel Autónomo para Navegação
Felicidade – o robot atinge o objectivo. Interior), um robô construído à medida destinado a
Tristeza – o robot é incapaz de atingir o objectivo. aplicações se segurança e relações públicas [23]. O robô está
Emoções reaccionais utilizam medições obtidas através de equipado com um sistema de transmissão de duas rodas
dados sensoriais imediatos (por exemplo proximidade de suportado por roletes tanto na parte posterior como na
obstáculos), para estimar as probabilidades de ocorrência de anterior. A percepção externa é conseguida a través de um
um acontecimento que estimule emoções. anel de sensores de distância com tecnologia infra-vermelho
Emoções deliberadas utilizam associações aprendidas e ultra sónica. A simulação do ambiente e arquitectura do
entre estados ambientais (por exemplo localizações robô são implementadas utilizando uma combinação de
geográficas) e acontecimento que estimulem emoções MATLAB e programação em linguagem C.
ocorridos no passado. A tarefa do robô é navegar até pontos especificados pelo
utilizador com um ambiente interno dinâmico, inicialmente
B. Resposta desconhecido. Neste contexto, o objectivo primário do robô é
Emoções e conhecimento estão intimamente ligados e navegar de um ponto para o outro. Para atingir tal objectivo,
mutuamente dependentes, mas poucos investigadores ele deve ter em conta um número de sub tarefas aprendidas,
argumentariam que todas as funções do conhecimento são relacionadas com sobrevivência, incluindo desvio de
influenciadas por emoções [20]. Também, embora muitas obstáculos e exploração do seu ambiente. No modelo
funções possam beneficiar das vantagens adaptativas que emocional implementado para esta tarefa, raiva e medo
advêm das emoções, não necessitam efectivamente de interagem com processos reactivos e deliberados, enquanto
emoções para funcionarem em níveis mais básicos. que a surpresa e felicidade estão apenas activas ao nível da
Consequentemente, o nosso robô móvel incorpora deliberação. Por uma questão de simplificação a tristeza é
15-07-2008 IEEE 3
modelada como um estado negativo de felicidade.

  T 
A. Emoções Reactivas  
 
∑ v (t ) 
 T
O controlador reactivo utiliza uma aproximação evitando
obstáculos livremente, baseada no vector algoritmo do  K 2  1−
eA =  
t= 0
T + β2 se ∑ v (t )  0
histograma de campo [24]. É escolhida uma direcção para o
  ∑ v (t )  t= 0
alvo que minimize o desvio da trajectória pretendida e 
maximize a distância aos obstáculos. O robô é basicamente
circular, por isso é representado simplesmente por um ponto,
  t= 0 
1 c a s oc o n t r á r i o
e cada obstáculo é magnificado por um raio r0. Assim a
deslocação evitando obstáculos aumenta com a diminuição

de r0. (2)
Seguindo a selecção da direcção do objectivo, o
controlador reactivo selecciona a velocidade (v,w) que move A resposta primária à raiva reactiva é modular o raio do
o robô na direcção pretendida a uma velocidade apropriada. obstáculo r0, reduzindo r0 à medida que eA aumenta. Durante
Baseada na aproximação da janela dinâmica [25], a a operação normal o robô comparte-se de uma maneira que
selecção de velocidade é conseguida dentro de um espaço poderíamos descrever como “medrosa”, dando muito espaço
discreto rectangular limitado pelas velocidades lineares e aos obstáculos. No entanto se o progresso do robô é
angulares máximas e mínimas atingíveis dadas as obstruído, ele torna-se “agressivo”, reduzindo
velocidades actuais do robô, acelerações e limitações globais. temporariamente a sua aversão aos obstáculos de modo a
A nossa implementação reactiva do medo limita a transpor a obstrução.
velocidade do robô em ambientes muito populosos. O valor
reactivo do medo eF aumenta quando há uma grande
probabilidade de colisão com um obstáculo. B. Emoções Deliberadas
Computacionalmente, é uma função da magnitude actual da
velocidade linear v e da distancia medida aos obstáculos d(θ) Planeamento e exploração são facilitados por uma grelha
para ângulos θ : mapeada de ocupação dinamicamente actualizada [26]. A
probabilidade de ocupação de cada alvéolo p0 é actualizada
em tempo real baseado na sua proximidade medida aos
1 c a cs oo n t r á r i o obstáculos e aos vectores de cobertura dos sensores. Rotas
 π para o objectivo são planeadas utilizando um algoritmo A*
  θ   d(θ ) 
modificado [27]. A nossa implementação difere de
∑
  1 − π   1− d 
eF =  θ = − π    m  á x + β 1 s en ã c o o l(1)i d i r
algoritmos de planeamento de rota convencionais no facto do
custo c associado ao atravessamento de um alvéolo ser
probabilístico e sujeito a modulações emocionais:
 k1 ⋅ v π   c = p 0 + (W1 ⋅ E F + W 2 (1 − E S ) − W 3 ⋅ E H )(1 − E A )
θ

∑
(3)
 1−  O medo deliberado EF aumenta o custo dos alvéolos na
 θ =−π  π  proximidade de uma colisão, reduzindo a probabilidade de
   que o robô trace uma rota através deles. Surpresa ES reduz o
referido custo, compelindo o robô a explorar áreas que não se
K1 e β1 são constantes de normalização. encontram nos seus dados internos de mapeamento. Valores
O limite global da velocidade linear vL é modulado pela positivos de felicidade EH também reduzem custo, aumentado
resposta ao medo do robô, diminuindo linearmente á medida a probabilidade de o robô planear uma rota com a qual
de eF aumenta. outrora obteve sucesso, enquanto que valores negativos
Isto resulta em comportamentos lentos, mais cautelosos (representando tristeza) têm o efeito contrário. Tendências
quando o robô atravessa ambientes mais atravancados onde emocionais são suprimidas pela raiva deliberada EA
as colisões são mais prováveis. permitindo ao robô escapar de estados de obstrução
A raiva reactiva controlo a aversão do robô aos obstáculos. resultantes destas modulações. O pesos de planeamento W1,
O valor da raiva reactiva eA aumenta quando o progresso do W2 e W3 controlam o grau de influência que cada emoção tem
robô é obstruído (por exemplo por mínima local). A detecção sobre o planeamento da trajectória.
de um estado de obstrução envolve o somatório dos vectores O medo deliberado controla a aversão do robô a
de velocidade linear v(t) em relação ao tempo t : localizações “perigosas”. Se um sensor de colisão é activado,
a intensidade do medo deliberado EF nos alvéolos junto ao
ponto de colisão aumenta numa taxa dependente do factor de
crescimento G e da sua distância dc ao ponto de colisão, caso
contrário decresce ao uma taxa D:
15-07-2008 IEEE 4
desempenho. Em cada experiência, capacidades não

 G
 E F + 2 ( 1 − E F ) c a s c oo l i d a
directamente relevantes para as funções da emoção a ser
testada são desactivadas.
EF ←  dc + 1 (4) A. Raiva Reactiva
 ( 1 − D) ⋅ E c a sc oo n t r á r i o
Para demonstrar a utilidade da raiva reactiva, foi
concebido um ambiente simulado no qual a resposta raivosa
 F do robô é encorajada (Figuras 1 e 2). O robot começa a
experiência completamente cercado por obstáculos cuja
A raiva deliberada fecha a malha de realimentação,
posição inicial é representada pelas áreas cinzento claro no
modulando outras emoções de modo a prevenir estados de
mapa. De modo a atingir o seu objectivo, ele tem que
obstrução. Se uma trajectória planeada atravessa um alvéolo
empurrar os obstáculos para fora do caminho, e depois
cujo custo c excede um limiar TA, a intensidade da raiva
navegar por uma série de corredores. O planeamento de rotas
deliberada EA aumenta ao longo de todo o mapa. Quando
deliberativo foi desactivado para esta experiência, logo o
outra emoção deliberada E0 aumenta, o valor de EA
robô tem de confiar inteiramente no seu controlador reactivo.
correspondente decresce a uma taxa dependente de E0:
 E A + G( 1− E A ) s ce > TA
Não foram implementados quaisquer códigos
comportamentais específicos para lidar com obstáculos
móveis. Em vez disso, o robô deve suprimir a sua resposta à
EA ←  (5)
aversão aos obstáculos reduzindo r0. Os obstáculos móveis
 (1− D ⋅ E0 )E A s ∆eE0 > 0

são considerados “seguros”, por isso só as colisões ocorridas
após o robô ter escapado dos obstáculos contíguos são
registadas.
A surpresa controla o equilíbrio entre a exploração e
proeza, ou prémio futuro e recompensa imediata. A
intensidade da surpresa ES está ligada ao nível de insatisfação
∆p0 entre os dados sensoriais do robô e o seu mapa interno.
Computacionalmente, se ∆p0 de um alvéolo excede o limiar
TS , ES irá aumentar, caso contrário irá diminuir:
 G( ∆ p 0 − T S )
 ES + ( 1 − ES ) c a s∆ op0 > TS
 1 − T S
ES ←  Figura 1 – Trajectória seguida pelo robô com raiva
  1 − D(1 − ∆ p0 )  ⋅ E
reactiva desactivada.
c a s oc o n t r á r i o
 T  S
 S 
(6)
Felicidade e tristeza são análogas a recompensar positivas
e negativas no reforço da aprendizagem. Após ter
completado (ou ter acabado o tempo) de uma instrução de
navegação, a intensidade de felicidade EH de alvéolos perto
daqueles atravessados pelo robô crescem ou diminuem
conforme instruções do grau de sucesso s:
 EH + G( s − EH ) s se > EH
Figura 2 – Trajectória seguida pelo robô com raiva
reactiva activada.
EH ←  (7) Quando a r0 é atribuído um valor constante,
 EH + D(s − EH ) c a sc o n t r á r i o
suficientemente pequeno para permitir ao robô escapar aos
obstáculos móveis, é frequente a obstrução do robô por
entradas, esquinas e consequentemente falha os objectivos
(Figura 1). Quando r0 é correctamente modulado pela raiva
reactiva (Figura 2), o robô evita inicialmente o contacto com
V. RESULTADOS os obstáculos, mas os movimentos repetitivos são
As emoções reactivas e deliberadas descritas na secção IV rapidamente reconhecidos como um estado de obstrução. Isto
foram testadas independentemente em ambientes simulados leva a que eA aumente rapidamente até ao ponto de saturação,
concebidos para revelar as suas contribuições para o então r0 reduz-se ao seu valor mínimo, permitindo que o robô
15-07-2008 IEEE 5
afaste os obstáculos do caminho. Uma vez livre de

obstáculos, o valor de eA decresce rapidamente, aumentando
a aversão aos obstáculos para um nível seguro, permitindo A. Medo e Raiva Deliberados
assim que ao robô navegar através das entradas.
O medo deliberado é demonstrado num ambiente contendo
obstáculos estáticos mapeados bem como obstáculos
dinâmicos não mapeados que se movem demasiadamente
depressa para que o robô os consiga evitar (Figuras 5 e 6). Os
obstáculos movem-se dentro das áreas cinzento claro do
mapa. Caso o robô passe numa destas zonas a colisão é
inevitável, mas ao robô é dado conhecimento prévio das
mesmas. O robô é instruído para viajar do canto superior
esquerdo para o canto superior direito do mapa, e depois
regressar á sua posição inicial.
Figura 3 – Gráfico do número médio de colisões para cada

valor de r0.
Figura 5 – Caminho seguido pelo robô com medo

deliberado desactivado.
Figura 6 – Caminho seguido pelo robô com medo

deliberado activado.
Figura 4 - Gráfico do tempo médio de percurso para cada Com o medo deliberado desactivado (Figura 5), o robô
valor de r0. viaja ao longo do que aparenta ser o percurso mais curto até
colidir com o primeiro obstáculo dinâmico. Devido à
Os resultados para uma selecção de valores constantes / velocidade do obstáculo, a ocupação alveolar não é singular
mínimos de r0 são apresentados nas Figuras 3 e 4. Quando a em cada instante. Isto significa que o algoritmo de
raiva reactiva está habilitada, r0 é modulado entre os valores mapeamento dinâmico é muito lento a aumentar a
mostrados (r0(min)) e um máximo fixo de r0(max)=0.4m, com o probabilidade de ocupação dos alvéolos dentro da área
valor actual de r0 e para qualquer tempo dependente de eA. cinzenta, mesmo sabendo que estão entre as zonas mais
Em ambas as condições (com e sem raiva habilitada) o valor perigosas do mapa.
médio de colisões é reduzido até que r0(min) se aproxima do Eventualmente as probabilidades de ocupação aumentam
raio do robô (0.35m). No entanto o número de colisões com até ao ponto em que o robô planeia outra trajectória, mas
raiva reactiva habilitada é consistentemente mais baixo do entretanto ocorreu já um número significativo de colisões. O
que com a raiva não habilitada. Os tempos de percurso são mesmo padrão comportamental ocorre quando o robô entra
inicialmente elevados como resultado da obstrução do robô nas outras duas “zonas perigosas”. Assim, o robot completa
pelas entradas seguidos por um estreitamento com vista a um eventualmente a sua tarefa, mas só após um número
valor óptimo de r0, e depois aumenta rapidamente à medida inaceitável de colisões. Quando o medo deliberado é
que robô sente mais dificuldades em escapar aos obstáculos. activado (Figura 6), EF aumenta nos alvéolos que circundam
O estreitamento é mais pronunciado quando a raiva está o ponto de colisão. Isto resulta numa influência negativa para
habilitada, conseguindo tempos de percurso o seu custo, obrigando rapidamente o robô a efectuar o
consideravelmente reduzidos até níveis óptimos de 0.22-0.26 planeamento de um trajecto alternativo. Assim o robô só
m. Correctamente afinada, a raiva reactiva melhorou sofre um pequeno número de colisões quando encontra um
significativamente as prestações do robô durante esta obstáculo dinâmico. A tarefa é, deste modo, completada mais
experiência, mas o número de colisões e tempos de percurso rapidamente e de forma mais segura.
são, ainda assim, bastante elevados. Isto deve-se largamente No exemplo apresentado o medo deliberado é sem dúvida
ás solicitações extremas que a experiência impôs ao robô. benéfico para o desempenho. No entanto existem situações
15-07-2008 IEEE 6
em que o robô pode ficar “encurralado” pelo medo. Por efeito, e daqui para a frente o seu desempenho sofre
exemplo se o robô colide com uma passagem que é a única crescentemente. Em W1>0.9 o robô fica permanentemente
saída de uma certa área, ele vai subsequentemente evitar essa obstruído, incapaz de completar a sua tarefa antes que o
saída como evitaria uma parede. Este problema é resolvido tempo termine. Quando a raiva deliberada se encontra
utilizando raiva deliberada de modo a suprimir emoções activada não existe grande interferência no desempenho até
como medo quando estas obstruem o progresso do robô para que W1 exceda o limiar de activação TA=0.6. Daqui para a
o seu objectivo. Para demonstrar a utilidade da raiva frente o desempenho melhora, aproximando-se do nível
deliberada, modificamos o ambiente da experiência anterior conseguido na ausência de armadilha de medo. Estes
de modo a simular uma colisão adicional assim que o robô resultados demonstram que o medo deliberativo pode
entra na passagem mais baixa (Figuras 7 e 8). Com a melhorar significativamente o desempenho do robô em certas
activação adequada do medo deliberativo (Figura 7), isto situações, e que a raiva deliberada pode compensar alguns
efectivamente encurrala o robô na secção este do mapa até dos seus efeitos adversos.
que o valor EF dos alvéolos na passagem diminui até ao
ponto em que permite a saída do robô. Este processo é
demorado e resulta muitas vezes em colisões adicionais à
medida que o robô tenta passar por outras áreas que são mais
perigosas do que a passagem. No entanto quando a raiva
deliberada é habilitada (Figura 8), o robô detecta um estado
de obstrução assim que tenta planear uma rota através de um
alvéolo com um alto custo (indicando que a melhor rota
disponível é inadequada). Isto leva a que o robô suprima as
suas outras emoções, confiando nas probabilidades de
ocupação parciais para a sua próxima rota planeada.
Figura 9 – Gráfico do número médio de colisões para cada

valor de W1
Figura 7 – Caminho seguido pelo robô com raiva

deliberada desactivada.
Figura 8 – Caminho seguido pelo robô com raiva Figura 10 – Gráfico do tempo médio de percurso para cada
deliberada activada. valor de W1
O desempenho global do robô durante estas experiências é

resumido nas Figuras 9 e 10. O peso W1 controla a VI. CONCLUSÃO
intensidade das respostas do medo deliberado, portanto o
Os resultados apresentados corroboram a hipótese
tempo total do percurso (Figura 9) e o número de colisões
levantada inicialmente, de que as emoções artificiais podem
(Figura 10) são guardados para um leque de valores de W1.
melhorar o desempenho adaptativo dos robôs. Estas
Se W1=0, o medo (e logo a raiva) estão completamente
experiências foram efectuadas em ambientes forçados
desactivados.
desenhados para encorajar comportamentos específicos,
Sob condições normais (sem armadilhas de medo), a
facilitando a análise quantitativa da contribuição individual
frequência de colisões e tempo de percurso melhoram
de cada emoção para o desempenho. Estudos futuros irão
consistentemente até que W1=0.8. No ambiente com
investigar sinergias emocionais e comportamento emergentes
armadilhas de medo, com a raiva deliberada desactivada, o
que surgem da combinação de emoções em ambientes menos
comportamento do robô segue a mesma tendência até
forçados.
W1=0.4, ponto em que a armadilha de medo começa a surtir
O nosso modelo beneficia da fiabilidade provada de uma
15-07-2008 IEEE 7
arquitectura hierárquica reactiva/deliberada, bem como das facial

vantagens adaptativas associadas às emoções. Ao expressions facilitate robot learning,” LNAI Spec. Vol. on
modelarmos emoções como parâmetros, demonstramos um AI for
mecanismo de adaptação efectiva para o planeamento e Human Computing, pp. 113-132, Springer, 2007.
controlo de robôs [11] J.D. Velásquez and P. Maes, “Cathexis: A
computational model of
emotions,” Proc. 1st Int. Conf. Autonomous Agents, pp.
518-519,
REFERÊNCIAS
Marina del Rey, CA, 1997.
[1] C. Breazeal, “Function meets style: Insights from [12] F. Michaud, J. Audet, D. Letourneau, L. Lussier, C.
emotion theory Theberge-Turmel
applied to HRI,” IEEE Trans. Systems, Man & and S. Caron, “Experiences with an autonomous robot
Cybernetics, vol. 34, attending the
no. 2, pp. 187-194, 2004. AAAI conference,” IEEE Intell. Sys., vol. 16, no. 5, pp.
[2] A. Damasio, The Feeling of What Happens: Body and 23-29, 2001.
Emotion in the [13] R.R. Murphy, C.L. Lisetti, R. Tardif, L. Irish, A.
Making of Consciousness. NY: Harcourt Brace, 1999. Gage, “Emotionbased
[3] M. Minsky, The Society of Mind. NY: Simon and control of cooperating heterogeneous mobile robots,”
Schuster, 1986. IEEE
[4] R.C. Arkin, “Moving up the food chain: motivation and Trans. Robotics and Automation, vol. 18, no. 5, pp. 744-
emotion in 757, 2002.
behavior-based robots,” in Who Needs Emotions: The [14] S.C. Gadanho and J. Hallam, “Robot learning driven
Brain Meets by emotions,”
the Robot, J. Fellous and M. Arbib, Eds. NY: Oxford Adaptive Behavior, vol. 9, no. 1, pp. 42-64, 2001.
University [15] M.J. Neal and J. Timmis, “Timidity: A useful
Press, 2005, pp. 425-270. mechanism for robot
[5] R.A. Peters II, K. Kawamura, D.M. Wilkes, K.A. control?” Informatica, vol. 4, no. 27, pp. 197-204, 2003.
Hambuchen, T.E. [16] O. Avila-García and L. Cañamero, “Hormonal
Rogers, and A. Alford, “ISAC humanoid: An architecture modulation of
for learning perception in motivation-based action selection
and emotion,” Proc. IEEE-RAS Int. Conf. Humanoid architectures,” Proc.
Robots, pp. 459- AISB’05 Convention, vol. 2, pp. 9-16, Hertfordshire, UK,
459, Tokyo, Japan, 2001. 2005.
[6] M. Kanoh, S. Kato and H. Itoh, “Facial expressions [17] C. Tingley and W.N. Browne, “Developing an
using emotional Emotion-Based
space in sensitivity communication robot "Ifbot",” Proc. Architecture for Autonomous Agents,” Proc. 3rd Int.
IEEE/RSJ Conf. Auton.
Int. Conf. Intelligent Robots & Systems, vol. 2, pp. 1586- Robots & Agents, pp. 225-230, Palmerston North, NZ,
1591, 2004. 2006.
[7] L. Moshkina and R.C. Arkin, “Human perspective on [18] A. Öhman and S. Mineka, “The malicious serpent:
affective Snakes as a
robotic behavior: A longitudinal study,” Proc. IEEE Int. prototypical stimulus for an evolved module of fear,”
Conf. Intell. Current
Robots & Systems, pp. 1444-1451, Edmonton, Canada, Directions in Psychological Science, vol. 12, no. 1, pp. 5-
2005. 9, 2003.
[8] M.A. Salichs, M. Malfaz, “Using emotions on [19] J.E. LeDoux, “Emotion circuits in the brain,” Annual
autonomous agents. Review of
The role of happiness, sadness and fear,” Proc. AISB’06 Neuroscience, vol. 23, no. 1, pp. 155-184, 2000.
Convention, [20] A. Sloman, R. Chrisley and M. Scheutz, “The
vol. 1, pp. 157-164, Bristol, England, 2006. architectural basis of
[9] G.A. Hollinger, Y. Georgiev, A. Manfredi, B.A. affective states and processes,” in Who Needs Emotions:
Maxwell, Z.A. The Brain
Pezzementi and B. Mitchell, “Design of a social mobile Meets the Robot, J. Fellous and M. Arbib, Eds. NY:
robot using Oxford
emotion-based decision mechanisms,” Proc. IEEE/RSJ University Press, 2005, pp. 203-244.
Int. Conf. [21] D. Dörner and K. Hille, “Artificial souls: Motivated
Intell. Robots & Systems, pp. 3093-3098, Beijing, China, emotional
2006. robots,” Proc. Int. Conf. Systems, Man and Cybernetics,
[10] J. Broekens, “Emotion and reinforcement: Affective pp. 3828-
15-07-2008 IEEE 8
3832, Vancouver, BC, Canada, 1995.

[22] J.M. Fellous, “From human emotions to robot
emotions,” Proc. 2004
AAAI Spring Symposium: Architectures for Modeling
Emotions:
Cross-Disciplinary Foundations, pp. 37–47, Palo Alto, CA,
2004.
[23] D.A. Carnegie, A. Prakash, C. Chitty and B. Guy, “A
human-like
semi autonomous mobile security robot,” Proc. 2nd Int.
Conf. Auton.
Robots & Agents, pp. 64-69, Palmerston North, NZ,
2004.
[24] J. Borenstein and Y. Koren, “The vector field
histogram - fast
obstacle avoidance for mobile robots,” IEEE J. Robotics &
Automation, vol. 7, no. 3, pp. 278-288, 1991.
[25] D. Fox, W. Burgard and S. Thrun, “The dynamic
window approach to
collision avoidance,” IEEE Robotics & Automation
Magazine, vol. 4,
no. 1, pp. 23-33, 1997.
[26] S. Thrun, “Robotic mapping: A survey,” in Exploring
Artificial
Intelligence in the New Millennium. G. Lakemeyer and B.
Nebel, Eds.
San Francisco, CA: Morgan Kaufmann, 2003, pp. 1-35.
[27] P. Judea, Heuristics: Intelligent Search Strategies for
Computer
Problem Solving, Reading, MA: Addison-Wesley, 1984.

Arquitectura Hierárquica de Planeamento e Controlo de Robôs Móveis Baseada Na Modulação de Parâmetros Emocionais

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Arquitectura Hierárquica de Planeamento e Controlo de Robôs Móveis Baseada Na Modulação de Parâmetros Emocionais

Enviado por

Direitos autorais:

Formatos disponíveis

15-07-2008 IEEE 1

Arquitectura Hierárquica de Planeamento e

modelada como um estado negativo de felicidade.

desempenho. Em cada experiência, capacidades não

EF ←  dc + 1 (4) A. Raiva Reactiva

 (1− D ⋅ E0 )E A s ∆eE0 > 0

EH ←  (7) Quando a r0 é atribuído um valor constante,

afaste os obstáculos do caminho. Uma vez livre de

Figura 3 – Gráfico do número médio de colisões para cada

Figura 5 – Caminho seguido pelo robô com medo

Figura 6 – Caminho seguido pelo robô com medo

Figura 9 – Gráfico do número médio de colisões para cada

Figura 7 – Caminho seguido pelo robô com raiva

O desempenho global do robô durante estas experiências é

arquitectura hierárquica reactiva/deliberada, bem como das facial

3832, Vancouver, BC, Canada, 1995.

Você também pode gostar