Você está na página 1de 12

LUIZ WAGNER DA ROSA

INTELIGÊNCIA ARTIFICIAL: Assistentes pessoais e problemas causados pela


interpretação de comandos

Cascavel

Jun./2023

Resumo

O uso de Inteligência Artificial sempre foi tema de curiosidade e estudos de vários cientistas
e entusiastas. Atualmente estamos envoltos por ela e nem nos damos conta. Com o avanço
dos recursos tecnológicos, buscamos automatizar tarefas consideradas repetitivas e
monótonas, criando vários dispositivos e robôs que nos auxiliam. Mais com o uso de
dispositivos denominados como pessoais acabamos nos deparando com problemas, os
quais em alguns casos superam os benefícios proporcionados, problemas esses gerados
por interpretações errôneas da linguagem natural utilizada para a comunicação através da
interface presente no dispositivo, a qual interpretou um comando ou uma simples conversa
entre duas pessoas incorretamente, causando assim algum prejuízo financeiro ou
executando ações não autorizadas, como a exclusão de um contato da sua agenda, ou a
compra indevida de um bem ou serviço. Para tentar minimizar tais erros, esses assistentes
pessoais deveriam recorrer a atualizações constantes de sua base de dados, utilizando-se
de dados estatísticos para se referenciar em quais obtiveram a maior quantidade de acertos
e quais a maior quantidade dos erros.
Palavra-Chave: inteligência artificial, dispositivos pessoais, base de dados.

1. INTRODUÇÃO

Atualmente estamos envoltos pela inteligência artificial e nem nos damos conta
desse fato, pois quando usamos um assistente pessoal, ou nos é apresentado
sugestões de conteúdos na internet, estamos tendo um contato direto com ela.
Apesar de seu desenvolvimento ter sido alavancado nos últimos anos, ainda há
muito o que ser explorado e aprimorado. Possui como função principal nos auxiliar
em tarefas corriqueiras em nosso dia a dia, podendo também ser utilizada para a
tomada de decisão em processos industriais através da coleta de dados em vários
dispositivos. Como assistentes pessoais, nos auxiliam através da utilização de uma
agenda com a adição de lembretes, realizam chamadas telefônicas, nos informam
2

sobre o clima e o trânsito, dentre muitas outras funcionalidades presentes


(OLIVEIRA, 2018).
Quando falamos em inteligência artificial, podemos trabalhar com problemas
envolvendo classificação, previsão ou otimização. Na resolução de tais problemas,
podem ser utilizadas técnicas que englobam áreas como a estatística, a matemática,
algoritmos e lógica de programação (VICARI, 2021).
Tratando-se de assistentes pessoais, estamos utilizando uma inteligência
artificial para nos auxiliar em tarefas cotidianas, onde permitimos o acesso a
informações pessoais consideradas sensíveis. Nesse contexto quando uma ação é
solicitada para o assistente pessoal, o mesmo a realiza, retornando ao seu usuário
uma resposta proveniente de um processamento de dados, onde se a resposta for a
esperada pelo usuário, a inteligência artificial a classificará como correta, utilizando
métricas para referencia-la em uma futura consulta. Caso a resposta não esteja de
acordo com o esperado pelo usuário, ela também sofrerá uma classificação,
ganhando um peso menor do que a resposta correta aceita pelo usuário, servindo
também como referencial para uma futura consulta (OLIVEIRA, 2018).
Um problema que está ocorrendo muito nos últimos meses em assistentes
pessoais são ações não autorizadas pelos seus usuários, onde a Alexa da Amazon,
a Siri da Apple ou a Cortana da Microsoft estão realizando compras de bens ou
serviços pela internet, utilizando para isso os dados financeiros e pessoais, sem ao
menos haverem recebidos uma ordem expressa para isso.
Uma solução para tal problema poderá estar associado ao refino na técnica de
classificação utilizada pela inteligência artificial e a seu acesso constante a uma
base de dados atualizada diariamente, podendo evitar assim que o seu usuário sofra
com cobranças indevidas e principalmente não tenha que perder tempo para reparar
a ação executada sem o seu consentimento, ocorrendo também o risco da
exposição de seus dados pessoais na internet (OLIVEIRA, 2018).
Será abordado no contexto histórico da inteligência artificial, o seu emprego em
assistentes pessoais, métodos de classificação que podem ser utilizados, os
problemas gerados pelo seu uso em relação a assertividade dos comandos do
usuário e uma sugestão de como lidar com esse problema de classificação.

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
2 de 12
3

Nessa pesquisa será realizada uma breve explicação sobre os métodos de


classificação, demonstrando qual poderá ser o mais adequado para a solução do
problema de interpretação que ocorre em assistentes pessoais, buscando assim
minimizar a exposição de dados sensíveis do usuário aumentando a confiabilidade
quando ao seu uso.

2. REFERENCIAL TEÓRICO

A inteligência artificial foi criada no início do século 20, tendo como definição
a resposta de uma máquina ao observar o seu ambiente, contrastando com a
inteligência natural dos animais e seres humanos. Sofreu mudanças ao longo do
tempo em seu escopo. Podemos citar como exemplo de mudança ocorrida ao longo
do tempo o reconhecimento de caracteres, o qual era considerado um grande
desafio para uma inteligência artificial, e atualmente tornou-se uma rotina, não sendo
mais considerada como parte integrante de uma inteligência artificial. Conforme
foram sendo descobertos novos usos, estes foram integrados em sua base de
referência do que pode ser considerado como normal, ampliando com isso o escopo
para qualquer nova função que possa surgir (FELTRIN, 2019).

Podemos caracterizar uma inteligência artificial em três tipos, o primeiro é


denominado como Inteligência Focada, a qual é constituída por algoritmos
desenvolvidos para resolver problemas em uma área ou um problema específico. O
segundo tipo recebe a descrição de inteligência generalizada, onde seus algoritmos
se tornam tão capazes em várias tarefas assim como os humanos, utilizando
técnicas de aprendizado de máquina como ferramenta. Já a terceira recebe a
denominação de inteligência artificial superinteligente, onde seus algoritmos são
significantemente mais capazes que os humanos em realizar todas as tarefas
(LUDEMIR, 2021).

O aprendizado de máquina é considerado um subconjunto específico da


inteligência artificial, referindo-se a ação de possibilitar a uma máquina aprender a
partir de um ciclo de respostas. Sua definição como termo existe desde os anos de
1980, mas somente recentemente nos últimos 10 a 15 anos conseguimos obter os

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
3 de 12
4

recursos necessários para o processamento e armazenamento dos dados,


implementando assim o aprendizado de máquina em escala (NORMAN, 2021).

No processo de aprendizado de máquina dispomos basicamente de três


tipos: o aprendizado supervisionado, onde temos basicamente dados de entrada e
de saída treinando manualmente uma rede neural artificial com o intuito de que se
faça o reconhecimento e aprendizagem dos padrões que originaram a saída, o
aprendizado não supervisionado o qual teremos dados acumulados com
informações diversas, realizando o seu processamento através de uma rede neural,
onde a mesma tem como objetivo o reconhecimento de padrões realizando o
agrupamento das informações quanto ao seu tipo, classificando-os de forma natural,
não sabendo o que fazer com essas classificações, ficando pronta para a repetição
do processo. Por último temos o aprendizado por reforço, ocorrendo quando a rede
identifica os acertos e os erros, recebendo recompensas ou penalidades com o
intuito de aprendizagem das ações que foram corretas e incorretas, salvando os
padrões em uma memória de experiência para que a mesma possa ser replicada
(FELTRIN,2019).

Redes Neurais Artificiais (RNA) é uma das técnicas utilizadas pelo


aprendizado de máquina na qual tem se obtido grande sucesso para a solução de
problemas. São modelos matemáticos inspirados em estruturas neurais biológicas,
possuindo capacidade computacional adquirida pelo aprendizado. A informação é
processada em uma RNA através de neurônios artificiais, definidos como neurônio
McCulloch e Pitts ou modelo MCP (HAYKIN, 2001).

O perceptron é considerado o modelo mais simples do aprendizado de


máquina utilizando Redes Neurais, sendo definido em 1957 por Frank Rosemblat,
resolvendo problemas simples linearmente separáveis, sendo composto por uma
estrutura de uma camada única e unidades básicas denominadas de neurônios
MCP, possuindo uma regra para o aprendizado. Seu algoritmo utiliza a correção de
erros como base, existindo assim uma fase para o treinamento e uma fase para
teste do algoritmo (HAYKIN, 2001).

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
4 de 12
5

Quando está na fase de treinamento, os exemplos são rotulados e


submetidos ao algoritmo, onde os parâmetros da rede (pesos) são modificados
ocorrendo uma nova apresentação de um novo exemplo a rede. Após o ajuste dos
parâmetros nessa fase, ocorre a avaliação do sistema.

Visando a resolução de problemas mais complexos, faz-se necessário a


utilização de redes de Perceptrons os quais são organizados em múltiplas camadas
MLP (Multi-Layer Perceptrons), tendo o algoritmo mais utilizado para treinamento
denominado como Backpropagation, o que resolveu muitos problemas (LUDEMIR,
2021).

3. METODOLOGIA

Para a realização desse trabalho de pesquisa científica será utilizado o


método de pesquisa bibliográfica em livros e artigos científicos.

4. DESENVOLVIMENTO

4.1 Funcionamento de uma rede neural.

Segundo Oliveira (2018) podemos considerar o treinamento realizado em


uma rede neural como um processo heurístico, o qual contempla vários passos
contendo tentativas e erros, acarretando com isso a construção aos poucos de um
modelo de configuração com um nível aceitável de erros, onde uma resposta correta
gera acertos na configuração, facilitando a mesma resposta no futuro. Já uma
resposta errada vai gerar acertos na configuração, dificultando com isso a mesma
resposta no futuro.
Quando realizamos uma observação com 2000 seções de treinamentos,
denominados como épocas, seu percentual de erro cai para um valor de um pouco
menos de 1,6x10-11, não sendo zero e muito raramente será, contudo já podemos

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
5 de 12
6

observar que mesmo assim está muito abaixo do que um especialista no assunto
conseguiria atingir.
Ao iniciar a fase de utilização, o processo de aprendizado é interrompido,
colocando a rede para trabalhar, procurando assim resolver os problemas para os
quais ela foi projetada, acontecendo a recalibração dos pesos dos algoritmos
juntamente com os seus limiares, onde são interrompidos e seus valores atingindo
permanecem por todo o período de utilização, podendo ser revistas essas
configurações de tempo em tempos com o objetivo de atualiza-las.
Um exemplo são os assistentes pessoais digitais, como a SIRI, GOOGLE,
ALEXIA entre outros, têm seus parâmetros periodicamente refinados com o objetivo
de gerarem repostas melhores e mais precisas. Quando comparamos as vantagens
de uma rede neural a um sistema não cibernético baseado em seres humanos,
podemos chegar as seguintes definições: pode-se treinar uma rede neural com
milhares ou milhões de respostas ou estímulos, os quais calibram automaticamente
a cada teste os pesos e limiares; a rede neural trabalha com base em dados
concretos e com as subjetividades dos mesmos; como a rede neural é considerada
um sistema cibernético, a mesma acaba não cometendo erros por fadiga, onde por
consequência não precisa de descanso (OLIVEIRA, 2018).

4.2 Rede Neural Perceptron Adaline

Proposta por Windrow e Hoff em 1960, a rede Adaline (Adaptive Linear


Element) possui a sua composição estrutural semelhante ao Perceptron, sendo
diferenciada somente pelo seu algoritmo de treinamento. Possuindo como
características sua adaptabilidade, um algoritmo pioneiro para realizar o treinamento
em redes com múltiplas camadas, o qual foi denominado como Regra Delta, tendo
como base o método dos mínimos quadrados, sendo considerado assim um método
de aprendizado mais suave.
Composta por n sinais de entrada (x1... xn) e possuindo uma única saída, foi
proposto a inclusão de um bloco de sinal de erro com o objetivo de modificar os
valores dos pesos antes de iniciar a função de ativação. Já em um perceptron temos
o xi como sinais de entrada, wi definido como pesos sinápticos associados, θ

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
6 de 12
7

denominado como bias ou limiar de ativação, g como função de ativação, o a qual


pode ser degrau ou bipolar e u como potencial de ativação. A definição do erro pode
ser escrita como erro = d-u, onde o erro é igual ao valor esperado menos o valor do
potencial produzido pela rede para ativação (MOREIRA, 2018).

4.3 Regra Delta

Pode ser definida como método utilizado pelo algoritmo de treinamento de um


perceptron Adaline baseado na descrição dos mínimos quadrados. A regra delta foi
projetada em 1960 por Widrow e Hoff devido a incapacidade do algoritmo de
treinamento do perceptron na geração de pesos para a classificação de dados
denominados como não linearmente separáveis.
Utilizando o método do gradiente descendente, o qual possui a intenção de
diminuir o valor da função de erro, possibilitando com isso a convergência para um
mínimo da função de erro. Seu objetivo é a realização de iterações locais visando
obter o ponto mínimo da função de erro, fixando assim os valores dos pesos quando
o mínimo for encontrado. Funciona através de um vetor com pesos iniciados
aleatoriamente, onde o algoritmo percorre a cada iteração a superfície da função de
erro em direção ao seu ponto de mínimo.
Assim, o processo de treinamento da rede Adaline busca mover de maneira
contínua o vetor de pesos com o objetivo de buscar minimizar o erro quadrático em
relação às amostras de dados que foram disponibilizadas para o aprendizado, pois
independentemente dos valores que foram atribuídos no início ao vetor de pesos, a
busca ocorrerá pelo ótimo (MOREIRA, 2018).

4.4 Rede Neural Perceptron Multicamadas

Quando falamos de um Perceptron Multicamadas (PMC ou MLP – Multi Layer


Perceptron) nos referimos a uma rede neural a qual possui uma ou mais camadas
ocultas, possuindo essas um número indeterminado de neurônios. Nomeamos a
camada como oculta devido a impossibilidade da previsão da saída desejada nas

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
7 de 12
8

camadas intermediárias. Utiliza-se comumente o algoritmo denominado como


retropropagação (Backpropagation) para realizar o treinamento de uma rede MLP.
O perceptron Adaline possui somente um único neurônio de saída
denominado como {y}, já o perceptron MLP possui a capacidade de relacionar o
conhecimento a vários neurônios de saída. Seu algoritmo de aprendizado, o
Backpropagation compõe-se de quatro passos, os quais são descritos abaixo:
No primeiro passo denominado como inicialização, os valores aleatórios dos
limites e dos pesos são atribuídos, onde os valores iniciais irão influenciar a
comportamento da rede e na ausência previa desses valores, os pesos e os limites
deverão possuir valores iniciais aleatórios, sendo os mesmos pequenos e
distribuídos de maneira uniforme.
O segundo passo descrito como ativação, ocorre o calculo dos valores dos
neurônios da camada oculta, juntamente com o calculo dos valores dos neurônios
da camada de saída.
Já o terceiro passo descrito como treinar os pesos, os erros dos neurônios
das camadas de saída e oculta são calculados, sendo efetuado o calculo para a
correção dos pesos, ocorrendo a atualização dos pesos dos neurônios das camadas
de saída e das camadas ocultas.
Finalmente na quarta camada denominada como iteração, o processo de
repetição do passo de ativação ocorre até o critério de erro seja satisfeito.
Uma das limitações presente na rede neural MLP é que quando aumentamos
muito o número de camadas e neurônios, a rede terá a tendência de ficar com um
grande número de parâmetros, aumentando assim o seu peso para processando
chegando ao ponto do hardware não conseguir mais processar, não chegando a um
resultado. Esse foi talvez o motivo para a estagnação desse tipo de rede até que
houvesse a evolução do hardware (MOREIRA, 2018).

5. RESULTADOS OBTIDOS

Podemos mencionar que uma parte do sucesso da inteligência artificial está


relacionada com a quantidade de dados que temos disponíveis nos dia atuais e

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
8 de 12
9

principalmente pela capacidade computacional das máquinas modernas, pois devido


a quantidade e a complexidade dos dados, torna-se necessária uma quantidade
maior de exemplos para que ocorra o aprendizado.

Também não estão disponíveis bons simuladores da vida real, os quais


poderiam gerar dados para serem utilizados em treinamento, onde muitos conceitos
denominados como de alto nível e conhecimento sobre o ambiente acabam sendo
originados pelos seres humanos, os quais rotulam esses dados para serem
utilizados nos algoritmos de Aprendizado de Máquina. Nem sempre esses conjuntos
de dados aplicados no treinamento apresentam uma boa similaridade com o mundo
real, podendo estar enviesados.

Para a resolução dos problemas complexos através de técnicas de


aprendizado de máquinas, faz-se necessário um design automático, eficaz e correto
do sistema. Podemos citar como exemplos, as escolhas que são realizadas no pré-
processamento dos dados, na escolha da família de algoritmos corretos para a
tarefa que se deseja realizar, juntamente com seus hiperparâmetros assim como na
seleção dos atributos utilizados e no pós – processamento (LUDERMIR, 2021).

5.1. Discussão dos resultados:

Ficou evidenciado uma parte pequena desse imenso universo do


Aprendizado de máquina e seus conceitos, onde através de dados aleatórios
podemos extrair informações denominadas como padrões, os quais podemos utilizar
com o objetivo de automatizar e otimizar as tarefas, pois os seres humanos são
falhos na realização de trabalhos repetitivos por um longo período de tempo,
possuindo também a característica de influenciar nos dados utilizados.
Um exemplo dessa automatização segundo Moreira (2018) presente no dia a
dia são os assistentes pessoais. Responsáveis pelas mais diversas tarefas, utilizam
uma rede neural MLP (Multi Layer Perceptron) utilizando o algoritmo denominado
como retropropagação (Backpropagation).

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
9 de 12
10

Mas infelizmente quando se adquire um assistente pessoal, geralmente o seu


usuário não se preocupa em atualiza-lo em períodos curtos para que sua base de
dados possa ser renovada, gerando assim precisão nas respostas. Mesmo que essa
atualização seja realizada de forma autônoma pelo dispositivo, seus fabricantes
acabam restringido a base de dados em duas categorias, aquela disponível sem
custo algum a todos os usuários, e aquela que por serem maior e mais completa
precisa ser comprada, gerando assim um custo mensal ou anual ao usuário.
Nem sempre quando ocorre a interpretação errônea de um comando do
usuário há relacionamento direto com o algoritmo utilizado pelo dispositivo, esse erro
geralmente está relacionado com uma base a qual contém dados insuficientes. Isso
acaba gerando erros de interpretação de comandos os quais são confundidos com
ordens para compras ou aquisição de serviços, onde na maioria das vezes o usuário
só se dará conta na hora em que receber a cobrança.
Assim sendo, os fabricantes também não evidenciam a necessidade de
atualização constante, que o seu produto precisa para se manter em perfeito
funcionamento. Só após a ocorrência de casos de vazamento de informações ou
alguma ação não autorizada, é que o usuário dedica mais atenção aos detalhes
pertinentes ao bom funcionamento do seu dispositivo.

6. CONSIDERAÇÕES FINAIS

Mesmo utilizando rede neural com algoritmo de classificação com grande


eficácia, o usuário consiste no ponto fundamental para que erros possam ser
minimizados, pois a partir da experiência de uso contínuo com diversas interações
obtêm-se dados mais consistentes para que a ocorrência de erros seja mitigada a
um valor muito baixo, mesmo utilizando-se de linguagem natural, a qual contém
ambiguidades que ainda não podem ser compreendidas por uma máquina
(MOREIRA, 2018).
Estudos na área de classificação de padrões podem ser realizados
com o intuito de identificar mudanças em uma amostra de plantas ou animais,
visando a identificação de doenças, ausência de cuidados, ou até mesmo no
melhoramento da variedade ou raça, pois com os recursos atuais baseados em

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
10 de 12
11

Inteligência Artificial e principalmente na análise de imagens, pode-se construir


ferramentas extremamente simples de se usar com alta eficiência ao trabalho que se
pretende realizar.

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
11 de 12
12

REFERÊNCIAS
FELTRIN, Fernando. Ciência de dados e Aprendizado de Máquina: Uma Introdução ás Redes
Neurais Artificiais. eBook kindle, 2019.

HAYKIN, Simon. Redes Neurais Princípios e prática. Porto Alegre: Bookman, 2001.

LUDERMIR, Teresa Bernarda. Inteligência Artificial e Aprendizado de Máquina: estado atual e


tendências, São Paulo, Fev. 2021. Disponível em:
<https://www.scielo.br/j/ea/a/wXBdv8yHBV9xHz8qG5RCgZd/?lang=pt>. Acessado em: 04 Set.2022.

MOREIRA, Sandro. Rede Neural Perceptron Adaline. Goiás, Dec. 2018. Disponível em:
<https://medium.com/ensina-ai/rede-neural-perceptron-adaline-8f69dc419d4e>. Acessado em: 22
Maio 2023.

MOREIRA, Sandro. Rede Neural Perceptron Multicamadas. Goiás Dec. 2018. Disponível em:
<https://medium.com/ensina-ai/rede-neural-perceptron-multicamadas-f9de8471f1a9>. Acessado em:
29 Maio 2023.

NORMAN, Alan T. Aprendizado de Máquinas em ação: Um manual para leigos, guia para
iniciantes. São Paulo: Tektime, 2021.

OLIVEIRA, Ruy Flávio de. Inteligência Artificial. Londrina: Editora e Distribuidora Educacional S.A,
2018.

VICARI, Rosa Maria. Influência das Tecnologias da Inteligência Artificial no ensino. Rio Grande
do Sul, jan.2021. Disponível em:
<https://www.scielo.br/j/ea/a/VqyZbNzYfnCJ8s8Psft4jZf/?format=pdf&lang=pt>. Acessado em 22
Maio 2023.

Projeto entregue ao Curso EaD de Bacharelado em Engenharia de Software como pré-requisito obrigatório à
obtenção do título de Bacharel em Engenharia de Software.
12 de 12

Você também pode gostar