Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstrato - A Fala Humano-Computador está ganhando força como trabalhos selecionados são comparados com aqueles usados em Chatbots do Prêmio
técnica de interação com o computador. Houve um aumento recente nos Loebner. Os resultados são discutidos e as conclusões são tiradas no final.
mecanismos de busca e assistentes baseados na fala, como Siri, Google
Chrome e Cortana. Técnicas de processamento de linguagem natural
(NLP), como NLTK para Python, podem ser aplicadas para analisar a fala, II. B ACKGROUND
e respostas inteligentes podem ser encontradas projetando-se um
mecanismo para fornecer respostas humanas apropriadas. Este tipo de A. Interação de fala humano-computador
programa é denominado Chatbot, que é o foco deste estudo. Este artigo O reconhecimento de voz é uma das técnicas mais naturais e procuradas na
apresenta um levantamento das técnicas utilizadas para desenhar interação entre computadores e dispositivos em rede, apenas recentemente
Chatbots e é feita uma comparação entre diferentes técnicas de desenho (últimas duas décadas) com o advento da computação rápida.
de nove artigos cuidadosamente selecionados de acordo com os
principais métodos adotados. Esses documentos são representativos das
melhorias significativas em Chatbots na última década. A fala é um sinal sofisticado e ocorre em diferentes níveis: “semântico,
linguístico, articulatório e acústico” [3]. A fala é considerada o mais natural entre
os aspectos da comunicação humana, devido à grande quantidade de
informações existir implicitamente além do significado das palavras faladas. Uma
das etapas de extração de informações de fala é a conversão de voz em texto
Palavras-chave - AIML; Chatbot; Prêmio Loebner; PNL; NLTK; SQL; Teste de Turing por meio do Reconhecimento Automático de Fala (ASR) e mineração de
informações de fala [4]; então, o texto resultante pode ser tratado para extrair o
significado das palavras.
EU. Eu NTRODUÇÃO
72 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
as palavras são então processadas para extrair o significado e produzir uma resposta
como fala ou ação, conforme necessário. Diferentes regras gramaticais são usadas para
categorizar as palavras marcadas no texto em grupos ou frases relacionadas a seus
vizinhos e posições. Esse tipo de agrupamento é chamado de divisão em frases, como
sintagmas nominais e sintagmas verbais.
C. Estratégias de chatbot
nível básico de realismo. Existe uma plataforma de desenvolvimento complicada por Chatbots e é bastante comum em sistemas de perguntas e respostas, dependendo dos
trás de qualquer Chatbot que será tão bom quanto sua base de conhecimento, que tipos de correspondência, como pesquisas em linguagem natural, declarações simples
mapeia as palavras do usuário para a resposta mais apropriada. O desenvolvedor do ou significado semântico das pesquisas [12].
bot geralmente também constrói a base de conhecimento. No entanto, existem
algumas plataformas que fornecem um ambiente de aprendizagem. Escrever um 3) AIML: é uma das principais técnicas usadas no design comum do
Chatbot perfeito é muito difícil porque ele precisa de um banco de dados muito grande
Chatbot. Mais detalhes sobre esta técnica e a linguagem usada são explicados
e deve fornecer respostas razoáveis para todas as interações. Há uma série de
na seção 2.5 abaixo.
abordagens para criar uma base de conhecimento para um Chatbot e incluir escrever à
4) Script de bate-papo: é a técnica que ajuda quando nenhuma correspondência
mão e aprender com um corpus. Aprender aqui significa salvar novas frases e usá-las
ocorre no AIML. Ele se concentra na melhor sintaxe para construir uma resposta padrão
mais tarde para dar respostas apropriadas para frases semelhantes [10].
sensata. Ele fornece um conjunto de funcionalidades, como conceitos de variáveis, fatos e
lógica e / ou.
5) SQL e banco de dados relacional: é uma técnica usada recentemente
no design do Chatbot para fazer o Chatbot lembrar de conversas anteriores.
Projetar um pacote de software Chatbot requer a identificação das partes
Mais detalhes e explicações são fornecidos na seção 2.6 abaixo.
constituintes. Um Chatbot pode ser dividido em três partes: Respondente,
Classificador e Graphmaster (conforme mostrado na Figura. 1) [11], que são
descritos a seguir: 6) Cadeia de Markov: é usado em Chatbots para construir respostas que são mais
aplicáveis probabilisticamente e, conseqüentemente, mais corretas. A ideia das
Cadeias de Markov é que existe uma probabilidade fixa de ocorrências para cada letra
1) Respondente: é a parte que desempenha o papel de interface
ou palavra no mesmo conjunto de dados textuais [13].
entre as principais rotinas do bot e o usuário. As tarefas do respondente são:
transferir os dados do usuário para o Classificador e controlar a entrada e a
7) Truques de linguagem: são sentenças, frases ou mesmo parágrafos
saída.
disponíveis no Chatbots para adicionar variedade à base de conhecimento e
2) Classificador: é a parte entre o Respondente e o
torná-la mais convincente. Os tipos de truques de linguagem são:
Graphmaster. As funções desta camada são: filtrar e normalizar a entrada,
segmentar a entrada inserida pelo usuário em componentes lógicos, transferir
• Respostas enlatadas.
a frase normalizada para o Graphmaster, processar a saída do Graphmaster e
lidar com as instruções da sintaxe do banco de dados (por exemplo, AIML). • Erros de digitação e simulação de pressionamentos de tecla.
3) Graphmaster: é a parte para correspondência de padrões que • Non Sequitur (não é uma conclusão lógica)
executa as seguintes tarefas: organizar o conteúdo do cérebro, armazenar e manter os Cada um desses truques de linguagem é usado para satisfazer um propósito específico
algoritmos de correspondência de padrões. e para fornecer respostas alternativas às questões [13].
73 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
8) Ontologias: eles também são chamados de redes semânticas e são um o Chatbot nesta faixa [16]. De acordo com esse julgamento, o Chatbot mais
conjunto de conceitos que estão interconectados relacional e hierarquicamente. humano é o vencedor.
O objetivo de usar ontologias em um Chatbot é calcular a relação entre esses Nenhum Chatbot jamais alcançou a medalha de ouro e passou no teste
conceitos, como sinônimos, hipônimos e outras relações que são nomes de para ganhar o Prêmio Loebner. No entanto, alguns Chatbots pontuaram tão
conceitos de linguagem natural. A interconexão entre esses conceitos pode ser alto quanto 3 dos 12 juízes acreditando que eles eram humanos. Há um bot
representada em um gráfico que permite ao computador pesquisar usando vencedor todos os anos e há uma lista de Chatbots chamada Loebner Prized
regras particulares de raciocínio [13]. Chatbots. Esta lista começa em 1991 até a data atual.
em relação aos outros competidores, por mais que seja absolutamente bom modelo. A tarefa da tag de categoria é definir a unidade de conhecimento da
[15]. É a primeira competição conhecida que representa uma instanciação conversa. A tag pattern identifica a entrada do usuário e a tarefa da tag
formal de teste de Turing [13]. A competição foi realizada anualmente desde template é responder à entrada específica do usuário [20]; esses são os tags
1991, com pequenas alterações feitas nas condições originais ao longo dos mais frequentes e as bases para projetar Chatbots AIML com uma resposta
anos. O importante nesta competição é criar um Chatbot que tenha a inteligente para conversas em linguagem natural. A estrutura de categoria,
capacidade de conduzir uma conversa. Durante a sessão de bate-papo, o padrão e objeto de modelo é mostrada abaixo:
74 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
TABELA I. eu OEBNER P RIZED C HATBOTS ‟D ESIGN T ECHNIQUES AND UMA PPROACHES [ 13]
1994 DICAS Thomas Whalen Um banco de dados de modelo de história pessoal como o sistema com correspondência de padrões.
Cadeias de Markov, correspondência de padrões simples, gramática livre de contexto (CFG) e analisador.
2003 Jabberwock Juergen Pirner
George
2005 Rollo Carpenter
(Jabberwacky) Sem scripts ou correspondência de padrões, um enorme banco de dados de respostas de pessoas, e eles são
Joan baseados no Chatbot Jabberwacky.
2006 Rollo Carpenter
(Jabberwacky)
2007 UltraHAL Robert Medeksza Scripts de correspondência de padrões e combinação de código VB.
2009 Faça muito mais David Levy Propriedade Comercial de Brinquedos Inteligentes.
2012 Chip Vivant Mohan Embar Respostas usando script de chat não formatado e IA, e ontologia.
Ele contém um mecanismo de linguagem natural abrangente para reconhecer o significado da frase de
2014 Rosa Bruce Wilcox entrada com precisão. O script Achat também está incluído no design [18].
A correspondência de palavras ou padrões de frase para Chatbots com A linguagem RDB mais familiar é o SQL ( Linguagem de consulta estruturada ),
palavras-chave deve ser o mais precisa possível. A correspondência de padrões para que pode ser usado para esse fim.
'consulta' de linguagem para AIML é mais simples do que por exemplo SQL. No entanto,
SQL ou MYSQL ganhou um alto reconhecimento em RDB porque é a linguagem de
isso não significa que o AIML seja um banco de dados simples de perguntas e respostas.
alto nível para dados não procedimentais. O aninhamento de blocos de consulta em
Depende de mais de uma categoria correspondente porque usa uma tag recursiva como
profundidades arbitrárias é um dos recursos mais interessantes dele, e a consulta SQL
<srai> [19]. É importante fornecer uma variedade de respostas da base de conhecimento
pode ser dividida em cinco tipos básicos de aninhamento. Algoritmos são desenvolvidos
para obter o maior número possível de correspondências.
para alterar as consultas que incluem esses tipos básicos de aninhamento em "consultas
semanticamente equivalentes". Séries semanticamente equivalentes são ajustáveis para
obter processamento eficaz por meio de subsistemas de processamento de consulta
G. SQL existentes. SQL como linguagem de dados é implementado no ZETA; também como uma
Uma Base de Dados Relacional (RDB) é uma das técnicas usadas linguagem baseada em cálculo e estruturada em blocos, é implementada no System R,
recentemente para construir bases de conhecimento do Chatbot. A técnica foi usada ORACLE, bem como no SEQUEL [21]. Alguns pesquisadores, como visto nas próximas
para construir um banco de dados para um Chatbot, ou seja, para permitir que o seções, recentemente usaram SQL para gerar um
75 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
banco de dados que salva o histórico da conversa para facilitar a busca por ou qualquer outra resposta de texto ou fala. A Fig. 4 mostra um breve diagrama do
qualquer palavra ou frase. Esta técnica dá continuidade e precisão ao diálogo terceiro estágio.
porque permite que o sistema de diálogo recupere algumas informações do
histórico anterior. Conversação Chatbot Resposta (fala ou
Palavras-chave açao)
III. S PEECH UMA NÁLISE E R ESPONSE Fig. 4. O estágio de resposta e tomada de ação
A análise de fala pode ser dividida em três estágios: (i) reconhecimento de voz a) Parâmetros principais
e conversão em texto, (ii) processamento de texto e (iii) resposta e execução de
As técnicas de conversação entre um ser humano e um computador podem ser
ações. Essas etapas são explicadas a seguir:
conversando digitando texto ou diálogo de fala usando a voz. O processamento das
informações em ambas as técnicas é o mesmo após a conversão da fala em texto,
Em primeiro lugar, a fala independente do locutor passa por um microfone para no caso do diálogo por fala. Um diagrama que mostra as principais etapas de
um pacote de processamento de sinal digital embutido no computador para análise e processamento necessários para realizar a conversa humano-computador
convertê-lo em um fluxo de pulsos que contém informações de fala. Instruções é mostrado na Fig. 5.
específicas podem ser usadas para ler a fala de entrada e depois convertê-la em
texto. Este estágio fornece texto de fala para processamento no próximo estágio. O
Os principais parâmetros que afetam a qualidade da interação
diagrama que ilustra esta etapa é mostrado na Fig. 2.
humano-computador no design de sistemas de conversação são: (i) as técnicas
usadas para analisar o texto usando diferentes conjuntos de gramática para produzir
palavras-chave, (ii) técnicas de correspondência de padrões usadas dentro do Chatbot
Microfone
e dependem de uma variedade de dados técnicas de acesso à base e (iii) o tipo de
resposta de acordo com a aplicação específica. O foco desta pesquisa está
Digital principalmente nas técnicas de design do Chatbot e uma comparação é feita entre elas
Discurso Discurso
Sinal em termos do software usado, a contribuição para o campo de pesquisa em novas
Entrada
para texto
Em processamento técnicas e a amplitude e profundidade da base de conhecimento usada.
(palavras-chave)
técnica
76 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
IV. AR EVIEWON R ECENT C HATBOT D ESIGN W ORK Javascript + XML (AJAX). Novamente o malaio é usado. A extensão
do ViDi projetada em [23] torna-o disponível para usuários na internet
Um considerável corpo de trabalho está associado aos Chatbots e recentemente
através de um navegador web.
eles se tornaram uma técnica promissora para a interação humano-computador. Os
sistemas de diálogo foram desenvolvidos para atender a uma variedade de aplicações
e podem ser aplicados em diversos campos. Uma série de estudos selecionados entre • As técnicas de correspondência de padrões também podem ser aplicadas no
2003 e 2013 são analisados e explicados abaixo. mundo do design do Chatbot e podem levar a uma maior precisão de
recuperação. Os autores em [25] propuseram uma nova técnica para
correspondência de palavras-chave usando ViDi, ([23] e atualizado em [24])
• Embora a criação de um novo tipo de Chatbot seja uma contribuição
como um ambiente de teste. A técnica proposta é chamada de One Match ou
para o campo, há um número limitado de opções disponíveis para o
All Match Categories (OMAMC). OMAMC é usado para testar a geração de
designer de software. Os autores em [10] criaram bases de
possíveis palavras-chave associadas a uma frase de amostra. Em seguida, os
conhecimento para Chatbots combinando os atributos de dois outros
resultados são comparados com outras palavras-chave geradas por outro
Chatbots. Os autores processaram as bases de conhecimento usando
Chatbot anterior em torno da mesma frase de amostra. Verificou-se que o
três filtros para eliminar a sobreposição, identificar perguntas pessoais
OMAMC melhora a correspondência de palavras-chave em comparação com
e rejeitar palavras ou tópicos indesejados. O corpus é construído a
as técnicas anteriores. Esta nova abordagem provavelmente será encontrada
partir de uma combinação de um Chatbot tipo fundação ALICE, que é
em futuras instanciações de Chatbots.
um Formulário de QA, e outro, como CLEVERBOT ou JABBERWACKY,
que são bons para lidar com conversas conversacionais. Os autores
processaram o Chatbot para qualquer diálogo ou
• Os sistemas educacionais são outra aplicação do Chatbots. O
objetivo é responder às perguntas dos alunos ou fazer um teste para
Par QA formato de acordo com a ordem de interação coletada. Então, de fazer perguntas e avaliar as respostas. Em [26] os autores se
acordo com a interação processada, eles produziram um corpus de Chat concentram em um aprimoramento do Chatbot CHARLIE (CHAtteR
com cerca de 7.800 pares de interações no total. O objetivo de seu Learning Interface Entity). A plataforma é um Sistema Educacional
estudo era melhorar as técnicas de design do Chatbot. Inteligente (INES) com um AIML Chatbot incorporado. O desempenho
e a contribuição de CHARLIE estão documentados em seu artigo e
CHARLIE é capaz de estabelecer uma conversa geral com os alunos;
• Os chatbots tendem a evoluir de uma contribuição para a próxima
pode mostrar o material dos cursos que estudam e está preparado
com extensões adicionadas por pesquisadores subsequentes,
para fazer perguntas associadas ao material aprendido. As aplicações
adicionando novos recursos ao software. O autor em [22] olhou como
educacionais dos sistemas de diálogo são particularmente úteis e
estender tipos sérios de jogos, adicionando diálogo usando chatbots
altamente interativas. Eles podem ser melhorados e atualizados
simples. Na verdade, é um passo sério e positivo na inserção da
facilmente, pois são usados em um ambiente acadêmico.
conversa no mundo dos games. O existente jogo sério EMERGO foi
usado como um estudo de caso da obra. O autor descreve o
Chatbot-EMERGO, que é projetado para treinar alunos ou estagiários
em um ambiente de tratamento médico [22]. O objetivo do estudo é
melhorar a interação da fala entre o programa de treinamento e os
trainees ou alunos. • A aplicação de Chatbots para atendimento de deficientes requer o desenho
de pacotes e sistemas para capacitar pessoas com deficiência com novas
tecnologias. Os autores em [5] sugeriu sistema educacional de perguntas e
respostas para pessoas com deficiência, considerando a fala em
• Um novo Chatbot pode ser projetado para resolver problemas de saúde
linguagem natural e conversação de palavras isoladas. O sistema foi
ou qualquer outra aplicação em uma ampla variedade de campos. Em
projetado usando uma base de conhecimento AIML com vocabulário
[23] os autores apresentaram o Chatbot ViDi (Virtual Dietician) que
limitado, incluindo reconhecimento de voz ou “grupos de fonemas e
interage com pacientes diabéticos como conselheiro virtual. Os autores
palavras”. O sistema de perguntas e respostas AIML é implementado para
propuseram um design especial para o Chatbot ViDi para fazê-lo
dar respostas às perguntas e, em seguida, dados de treinamento de 2.000
lembrar os caminhos de conversação percorridos durante a sessão de
palavras são usados para testá-lo. 200 palavras dos dados foram
perguntas e respostas. O caminho se divide em três níveis de 9
utilizadas no teste e 156 delas foram reconhecidas; portanto, a precisão do
questões cada e pode ser obtido analisando o parâmetro Vpath que
sistema foi de 78%. O objetivo do estudo foi inseri-lo em um software
determina o caminho percorrido pelo paciente. O idioma natural usado
tutorial de língua inglesa de fácil acesso por pessoas com deficiência.
para fazer interface com o usuário é o idioma local da Malásia.
Pessoas com cegueira e paralisia das mãos podem se beneficiar com a
adição desse tipo de recurso aos sistemas de e-learning.
• Uma extensão foi feita para o chat bot ViDi quando os autores em [24]
propuseram o redesenho completo do ViDi Chatbot, empregando as
vantagens de um banco de dados relacional. Eles também adicionaram
• A introdução de novos modelos de correspondência representa uma
uma extensão e um algoritmo de pré-requisito para atualizar o ViDi em
verdadeira inovação no Chatbots. Em [27] o autor propôs um novo
um Chatbot baseado na web. Os autores usaram linguagens de
modelo que produz uma nova frase a partir de duas frases existentes. O
programação web, como PHP, HTML e XHR para implementar a
estudo propõe o emprego de um Algoritmo Genético (AG) para construir
codificação do Chatbot além do Assíncrono
um novo
77 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
frase dependendo das frases que são recuperadas de um banco de melhorar a diversidade da resposta do Chatbot. As duas principais
dados disponível. A proposta é apresentada com o objetivo de adaptar o contribuições do estudo são i) converter duas frases em uma e ii)
AG a uma estrutura de linguagem natural. Aplicar técnicas de recuperação de informação a Chatbots.
• A proposta em [27] foi implementada quando os autores em [9] Como visto na revisão acima, as técnicas de conversação podem ser aplicadas
apresentaram sua nova abordagem para o design do Chatbot. A a uma variedade de aplicativos diferentes que envolvem a interação entre pessoas e
abordagem combina métodos de indexação e correspondência de computadores. Os esforços para inserir conversação nesses sistemas diferentes se
consulta com correspondência de padrões e aplica técnicas de mostraram úteis, com todos os estudos concluindo que adicionar um Chatbot a um
Recuperação de Informações (IR) para produzir uma nova frase a partir sistema ou software melhora a interação com o sistema.
das existentes. Em seu estudo, as sentenças existentes se tornaram a
população inicial do GA, então os operadores de troca e crossover foram
aplicados para produzir a nova sentença como uma nova geração do GA. V. S ELEITO F ATORES Eu NFLUENCING C HATBOT D ESIGN
Avaliação experimental para o Chatbot antes e depois de aplicar a Comunalidades e diferenças nos designs do Chatbot foram destacadas
abordagem de combinação de frases foi apresentada. O objetivo da com os fatores influentes incluídos na pesquisa. Um resumo desses fatores
abordagem era pode ser visto na tabela 2.
Usando
Creatina disponível Uso de SQL Corpus
Estude Voz Texto AIML
g novo le (Relacional Técnica de combinação (conhecimento Inscrição
uso
Chatbot Chatbo Base de dados) base)
ts
Correspondência de Edger Chatbot
técnica (combinação de
Edgar
Pereira et al sim Algoritmos TfIdf com Design do chatbot.
[10] sim sim NÃO sim NÃO Chatbot
linguagem natural
normalização)
Rosmalen [22] NÃO sim NÃO sim sim sim Formulário de correspondência de QA AIML Educação médica
Lokman et al NÃO sim sim NÃO sim sim Formulário de correspondência de QA VP bot Assistência à saúde
[23]
Pré-requisito ViDi
Lokman et al NÃO sim NÃO sim NÃO sim Assistência à saúde
[24] Coincidindo Chatbot
Manual
Genético
Vrajitoru NÃO sim sim NÃO NÃO NÃO padrão e Qualquer
[27] Algoritmos (GA)
dados escolhidos
Manual
Genético
Ratkiewicz NÃO sim sim NÃO NÃO NÃO padrão e Qualquer
[9] Algoritmos (GA)
dados escolhidos
78 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
Embora as etapas de processamento sejam as mesmas para voz e texto após a evidência da sua utilização em Loebner Prized Chatbots) adicionou uma nova
conversão de voz em texto, existem diferenças distintas no uso em sistemas de técnica às bases de conhecimento, nomeadamente a Base de Dados Relacional,
conversação, particularmente em termos de suas aplicações. O texto é usado na que permite ao Chatbot recordar conversas anteriores através do acesso ao
maioria dos estudos, exceto [5], devido à simplicidade, enquanto a voz é usada em histórico armazenado na base de dados desenhada em SQL. No entanto, uma base
[5] e [10] para aplicações com necessidades especiais, por exemplo, para pessoas de conhecimento AIML ainda é eficaz para projetos de Chatbot; por exemplo,
com deficiência. A resposta no caso de solicitações de deficiência deve ser uma Mitsuku Chatbot ganhou o Prêmio Loebner em 2013 e foi baseado no AIML.
resposta de voz. Os aplicativos móveis comerciais (Chatbots) que surgiram
recentemente, por exemplo, Cortana e Siri, aceitam a fala como uma entrada e
fornecem uma resposta de voz além do texto.
A fim de projetar novos Chatbots ou estender os anteriores, cada estudo
usou um corpus que é diferente do outro, conforme ilustrado na tabela 2. O
corpus que é usado para construir um Chatbot afeta o design porque afeta a
Novos Chatbots foram criados em [5], [9], [23] e [27], que adicionam novas base de conhecimento do O chatbot e a precisão da resposta, já que a
técnicas ou usam designs anteriores aprimorados. Também novas técnicas, resposta é um reflexo da base de conhecimento.
algoritmos ou extensões foram adicionados aos Chatbots existentes em [10],
[22], [24], [25] e [26] a fim de melhorar sua função ou estender o software
A coluna do aplicativo na tabela 2 mostra que cada chatbot foi projetado para
disponível adicionando interação de chat. Por exemplo, o Loebner Prized
atender a certas necessidades de conversação, mantendo um chat com um grupo
Chatbot ALICE (que ganhou três vezes) foi aprimorado várias vezes em
específico de pessoas em uma organização específica. O trabalho no futuro
iterações posteriores, e Joan (Jabberwacky) foi a forma atualizada de George
precisa de mais foco em sistemas de conversação de propósito geral, projetando
(Jabberwacky).
Chatbots com bases de conhecimento mais abrangentes para cobrir tópicos
gerais usando as técnicas mais recentes.
As bases de conhecimento são construídas usando diferentes técnicas.
Por exemplo, AIML, que é a primeira técnica usada com o ALICE Chatbot, é
A Tabela 3, que cobre a contribuição apresentada por cada um dos
usada para construir os Chatbots em [5], [10] e [26], enquanto SQL (ou RDB) é
estudos selecionados, mostra como cada um fez uma melhoria no design do
usado em [24] e [ 25]. Ambos AIML e SQL são usados em [22] e [23]. Nem
Chatbot, apesar de usar diferentes técnicas, algoritmos ou programas.
AIML ou SQL são usados em [9] e [27]. O uso de SQL (sem clareza
TABELA III. UMA S RESUMO DE C ONTRIBUIÇÕES PARA C HATBOT D ENTRAR UMA NALYSED S ESTUDOS
Estude
Melhorias Significativas
Produzir um novo corpus (base de conhecimento) que evita sobreposições, identifica perguntas pessoais e rejeita palavras ou tópicos indesejados
Pereira et al
combinando formatos de controle de qualidade e diálogo disponíveis.
[10]
Estendendo um jogo sério existente, adicionando um simples Chatbot para dar a oportunidade aos trainees de estarem cientes do trabalho e das
Rosmalen [22] atividades no primeiro dia de emprego.
Projetar um novo Chatbot (ViDi) que tenha a capacidade de lembrar conversas anteriores para funcionar como um conselheiro virtual para pacientes
Lokman et al
diabéticos.
[23]
Redesenhar e estender o Chatbot ViDi adicionando as técnicas de correspondência de pré-requisitos para obter uma forma de conversação em vez de um
Lokman et al
formulário de QA e torná-lo disponível para usuários na Internet por meio de um navegador da web.
[24]
Propondo uma nova técnica de correspondência OMAMC para produzir resultados aprimorados, reduzindo o tempo de correspondência e aumentando a flexibilidade do
Lokman et al
contexto.
[25]
Atualização do Chatbot CHARLIE para incorporá-lo na plataforma INtelligent Educational System (INES) com o objetivo de melhorar a
Mikic et al [26] conversação entre alunos e sistemas educacionais.
Projetar um novo Chatbot baseado em AIML de fala em linguagem natural e entrada e saída de palavras limitadas para usá-lo em sistemas de e-learning para permitir que
Bhargava et al
pessoas com deficiência aprendam por meio da fala.
[5]
Propondo uma nova abordagem inovadora de correspondência de padrões em um Chatbot. Os autores ajustaram Algoritmos Genéticos com linguagem natural para
Vrajitoru
gerar uma nova frase a partir das existentes, a fim de melhorar a diversidade de respostas.
[27]
i) Implementar o modelo proposto em [27], ou seja, empregar o GA no casamento de padrões para produzir uma nova sentença a partir de sentenças
Ratkiewicz recuperadas de um banco de dados existente para aumentar a diversidade de respostas. ii). Aplicando técnicas de recuperação de informações ao Chatbot.
[9]
79 Página
www.ijacsa.thesai.org
(IJACSA) International Journal of Advanced Computer Science and Applications,
Vol. 6, No. 7, 2015
VIII. C ONCLUSÕES [8] AM Galvão, FA Barros, AM Neves e GL Ramalho, "Personaaiml: Uma arquitetura
desenvolvendo chatterbots com personalidade." pp. 1266-1267, 2004.
Neste artigo, a revisão da literatura cobriu uma série de artigos selecionados
que se concentraram especificamente nas técnicas de design do Chatbot na [9] J. Ratkiewicz, "Combinação de sentenças evolucionárias para Chatterbots Dana Vrajitoru
última década. Uma pesquisa de nove estudos selecionados que afetam o design Computação e Ciências da Informação Indiana University South Bend, 1700 Mishawaka
do Chatbot foi apresentada, e a contribuição de cada estudo foi identificada. Além Ave," 2004.
disso, foi feita uma comparação entre as técnicas de design do Chatbot nos [10] MJ Pereira e L. Coheur, “Just. Chat - uma plataforma de processamento de informações para
uso em chatbots ”, 2013.
estudos selecionados e, em seguida, com as técnicas do Chatbot vencedoras do
Prêmio Loebner. A partir da pesquisa acima, pode-se dizer que o [11] DJ Stoner, L. Ford e M. Ricci, "Simulating Military Radio Communications Using
Speech Recognition and Chat-Bot Technology",
desenvolvimento e a melhoria do design do Chatbot não crescem a uma taxa
2003
previsível devido à variedade de métodos e abordagens usados para projetar
[12] K. Meffert, "Supporting design patterns with annotations." pp. 8 pp.-
um Chatbot. As técnicas de design do Chatbot ainda são um assunto para debate 445, 2006.
e nenhuma abordagem comum ainda foi identificada. Os pesquisadores até [13] D. Mladenić e L. Bradeško, "A survey of chabot system through a Loebner award
agora trabalharam em ambientes isolados com relutância em divulgar quaisquer Competition", 2012.
técnicas aprimoradas que encontraram, consequentemente, retardando as [14] AM Turing, "Computing machines and intelligence," Mind, pp. 433-
melhorias para Chatbots. Além disso, os Chatbots projetados para sistemas de 460, 1950.
diálogo nos estudos selecionados são, em geral, limitados a aplicações [15] B. Kirkpatrick e B. Klingner, “Jogo de Imitação de Turing: uma discussão com o benefício da visão
particulares. Os chatbots de uso geral precisam de melhorias projetando bases posterior,” curso de Ciência da Computação de Berkeley. Consulte http: // www. cs. berkeley. edu / ~
christos / classics / ttest. pdf Acessado, vol.
de conhecimento mais abrangentes.
1, pp. 13, 2009.
[16] P. Hingston, "A turing test for computer game bots," Computational Intelligence and AI
in Games, IEEE Transactions on, vol. 1, não. 3, pp. 169-186, 2009.
Embora alguns produtos comerciais tenham surgido recentemente no mercado [17] R. Higashinaka, K. Imamura, T. Meguro, C. Miyazaki, N. Kobayashi, H. Sugiyama, T. Hirano,
T. Makino e Y. Matsuo, "Rumo a um sistema de conversação de domínio aberto totalmente
(por exemplo, Microsoft Cortana) como chatbots de diálogo, melhorias precisam de
baseado no processamento de linguagem natural ", 2014.
pesquisa contínua e carecem de
solução comum. [18] B. Wilcox, "Ganhando a Loebner's, "
http://www.gamasutra.com/blogs/BruceWilcox/20141020/228091/Winn
Cada pesquisador precisa documentar de maneira robusta quaisquer melhorias ing_the_Loebners.php, 2014.
bem-sucedidas para permitir que a interação da fala humana no computador chegue a um acordo [19] R. Wallace, “The elements of AIML style,” Alice AI Foundation, 2003.
sobre uma abordagem comum. Isso sempre estará em desacordo com as considerações [20] M. d. GB Marietto, RV de Aguiar, G. d. O. Barbosa, WT Botelho,
comerciais. E. Pimentel, R. d. S. França, e VL da Silva, “Artificial Intelligence MArkup
Language: A Brief Tutorial,” arXiv preprint arXiv: 1307.3091,
R EFERÊNCIAS
2013.
[1] CI Nass e S. Brave, Wired for speech: How voice ativa and advance the
[21] W. Kim, "Na otimização de uma consulta aninhada semelhante ao SQL", ACM Transactions on Database
human-computer relationship: MIT Press Cambridge,
Systems (TODS), vol. 7, não. 3, pp. 443-469, 1982.
2005.
[22] P. Van Rosmalen, J. Eikelboom, E. Bloemers, K. Van Winzum e P. Spronck,
[2] Y.-P. Yang, “An Innovative Distributed Speech Recognition Platform for Portable,
"Towards a Game-Chatbot: Extending the Interaction in Serious Games", 2012.
Personalized and Humanized Wireless Devices,” Computational Linguistics and
Chinese Language Processing, vol. 9, não.
2, pp. 77-94, 2004.
[23] AS Lokman e JM Zain, "Um projeto arquitetônico de Dietista Virtual (ViDi) para
pacientes diabéticos." pp. 408-411, 2009.
[3] JP Campbell Jr, “reconhecimento de orador: um tutorial,” Proceedings of the IEEE, vol. 85, nº
9, pp. 1437-1462, 1997.
[24] AS Lokman e JM Zain, “Extension and prerequisite: An algorithm to enable Relations
between responses in Chatbot technology,” Journal of Computer Science, vol. 6,
[4] CH. Lee, "Do conhecimento ignorante à modelagem rica em conhecimento: um novo paradigma de
não. 10, pp. 1212, 2010.
pesquisa da fala para o reconhecimento automático de fala da próxima geração", 2004.
[25] AS Lokman e JM Zain, “One-Match e All-Match Categories for Keywords Matching
in Chatbot,” American Journal of Applied Sciences, vol. 7, não. 10, pp. 1406, 2010.
[5] V. Bhargava e N. Maheshwari, "An Intelligent Speech Recognition System for
Education System", 2009.
[26] FA Mikic, JC Burguillo, M. Llamas, DA Rodríguez e E. Rodríguez, "CHARLIE: Um
[6] E. Loper e S. Bird, "NLTK: The natural language toolkit." pp. 63-70,
Chatterbot baseado em AIML que funciona como uma interface entre INES e
2002
humanos." pp. 1-6, 2009.
[7] S. Bird, "NLTK: the natural language toolkit." pp. 69-72, 2006.
[27] D. Vrajitoru, "Construção de sentenças evolucionárias para chatterbots." pp. 315-
321, 2003.
80 Página
www.ijacsa.thesai.org