Você está na página 1de 10

APRENDIZADO DE MÁQUINA

Prof. Leonel da Rocha

UNIDADE V – CLASSIFICAÇÃO DE PADRÕES

SUMÁRIO

OBJETIVOS DE APRENDIZAGEM
INTRODUÇÃO................................................................................................................
1 APRENDIZADO SUPERVISIONADO.........................................................................
2 APRENDIZADO NÃO SUPERVISIONADO................................................................
3 APRENDIZADO POR REFORÇO...............................................................................
CONSIDERAÇÕES FINAIS............................................................................................
UNIDADE V – CLASSIFICAÇÃO DE PADRÕES

OBJETIVOS DE APRENDIZAGEM

Mostrar ao aluno os conceitos básicos de classificação de padrões e como


identificar repetições na disposição de objetos de diferentes formas e tamanhos.
Dominar a descrição do padrão e utilizar esse raciocínio para ampliar a sequência
por um número definido de repetições. Disponibilizar métodos de identificação de
padrões e as possibilidades de tomar decisões com pouca intervenção humana.
Explorar a construção de algoritmos que aprendem com seus erros e fazem
previsões sobre dados por meio de diferentes abordagens.
INTRODUÇÃO

Reconhecimento de padrões é uma área da ciência da computação que tem


por objetivo a classificação de objetos dentro de categorias ou classes. Esses
objetos variam conforme cada aplicação, podendo ser imagens, sinais em forma de
ondas (como voz, luz, rádio) ou qualquer outro tipo de medida que precise ser
classificada.
O reconhecimento de padrões já é utilizado há muito tempo: antes da
utilização dos computadores, era formado principalmente por estatística teórica e,
após o surgimento, houve um aumento significativo da demanda por aplicações
práticas que fossem capazes de reconhecer padrões, que por sua vez incentivaram
novas demandas por desenvolvimentos teóricos. Como a evolução da sociedade de
uma fase industrial para uma fase pós-industrial, a produção foi automatizada e a
necessidade de modelos capazes de lidar com a recuperação da informação tornou-
se cada vez mais importante. Essa evolução estimulou o reconhecimento e a
classificação de padrões para além dos limites de conhecimento e de aplicações
utilizadas nos últimos anos. Reconhecer e classificar padrões é fundamental para os
sistemas de tomada de decisão, pois é com base nos padrões que tendências de
consumo, preferências de usuários e clientes podem ser detectadas e tratadas.
Um sistema de reconhecimento de padrões é composto de: um sensor que
obtém dados a serem classificados ou descritos; um mecanismo de extração de
características que computa informações numéricas ou simbólicas dos dados; e um
esquema de classificação dos dados, que dependerá das características extraídas.
A classificação de padrões é baseada na disponibilidade de um conjunto de
padrões que foram previamente classificados, do "conjunto de treinamento" e do
resultado do aprendizado que é caracterizado como um aprendizado
supervisionado. O aprendizado também poderá ser não supervisionado; isso
acontece quando o sistema não recebe informações a priori dos padrões e partir
disso estabelece as classes dos padrões por meio de análise de padrões
estatísticos.
1 APRENDIZADO SUPERVISIONADO

O Aprendizado de Máquina Supervisionado é a tentativa de prever uma


variável dependente com base em uma lista de variáveis independentes. Como pode
ser visto nos exemplos a seguir:

Variáveis Independentes Variáveis Dependentes

Escolaridade, experiência; Salário;

Histórico escolar; Aprovação no Vestibular;

Perfil do motorista, localidade; Risco de sinistro;

Conteúdo de um livro; Escola Literária;

Temperatura alta; Aumento da venda de sorvete;

Imagem viária. Direção de um carro autônomo.


Fonte: O autor (2021).

A característica básica de um sistema de aprendizado supervisionado é que


os dados utilizados para o treinamento contêm a resposta desejada. Ele contém a
variável dependente resultante das variáveis independentes observadas, como pode
ser observado na Figura 1. Nesse caso, diz-se que os dados são anotados com as
respostas ou classes a serem previstas.

Figura 1: Aprendizado supervisionado.

Fonte: tibco.com
Existem algumas técnicas para resolver problemas de aprendizado
supervisionado; entre elas, estão: regressão linear, regressão logística, redes
neurais artificiais, máquinas de suporte vetorial (ou máquinas kernel), árvores de
decisão, k-vizinhos mais próximos e Bayes ingênuo. Entre as áreas de aprendizado
de máquina, o aprendizado de máquina supervisionado é a área que concentra o
maior número de aplicações bem-sucedidas e na qual a maioria dos problemas a
serem resolvidos já estão bem estruturados.

2 APRENDIZADO NÃO SUPERVISIONADO

Não são todos os problemas que podem ser resolvidos com aprendizado
supervisionado, porque conseguir dados anotados, em algumas situações, é
extremamente custoso ou, em casos extremos, até impossível. Um exemplo clássico
é relacionado à venda de produtos e ao perfil dos consumidores: pode existir um
perfil que compre vinho e queijo, carne e carvão ou, ainda, cerveja e fralda. Para
perfis como esses, colocar esses produtos em prateleiras distantes aumentará o
tempo e o percurso do cliente no mercado, podendo proporcionar a compra de
outros produtos. Entretanto, nesse caso se está somente verificando as compras à
qual perfil o consumidor pertence, mas não se sabe quantos perfis de consumidores
existem.

Para situações como essa, o sistema precisa descobrir os perfis sem dados
anotados e os métodos de aprendizado não supervisionados serão utilizados. Como
opção, pode-se observar nos registros de compras se existem padrões repetidos
que possibilitam verificar a inferência de um grupo ou perfil de consumidor. Também
é possível verificar quais produtos são frequentemente comprados juntos, para
aprender uma regra associativa entre eles.

Com o aprendizado não supervisionado, em geral procura-se achar uma


representação mais informativa dos dados disponíveis. Essa representação
geralmente também é a mais simples, resumindo a informação em pontos mais
relevantes. A seguir, podem ser observados alguns exemplos:

Dados Forma Representativa


Compra de produtos; Associação entre os produtos;

Compra de produtos; Perfil dos consumidores;

Dados com várias dimensões; Dados com dimensão reduzida;

Transações financeiras; Transações normais;

Análise textual. Representação matemática das palavras.


Fonte: O autor (2021).

O aprendizado não supervisionado, ilustrado na Figura 2, pode ser aplicado


em sistemas de recomendação de filmes, músicas, detecção de anomalias em
transações financeiras e comerciais e na visualização de dados. As técnicas mais
conhecidas para resolver problemas de aprendizado não supervisionado são as
redes neurais artificiais, expectativa-Maximização, clusterização k-médias, máquina
de suporte vetorial, também conhecida como máquinas kernel, clusterização
hierárquica, florestas isoladoras, word2vec, mapas auto-organizados, análise de
componentes principais, máquinas de Boltzmann restritas, eclat, apriori, t-SNE. Os
problemas de aprendizado não supervisionado são bem mais complicados do que
os problemas de aprendizado supervisionado, em razão de não se ter a reposta
anotada nos dados. Portanto, é extremamente complicado avaliar um modelo de
aprendizado não supervisionado quando o modelo estiver muito próximo do
conhecimento em aprendizado de máquina.

Figura 2: Aprendizado não supervisionado.


Fonte: tibco.com

3 APRENDIZADO POR REFORÇO

Outra técnica de aprendizagem de máquinas é a “aprendizagem por


reforço”, em que a máquina tenta aprender qual é a melhor ação a ser tomada,
levando em consideração as circunstâncias em que a ação será executada.
O ponto futuro é uma variável aleatória; como não se sabe a priori o que
pode acontecer, é importante que a abordagem leve em consideração essa
incerteza e consiga tratar as possíveis mudanças no ambiente do processo de
tomada de decisão. O tratamento de situação futura vem do conceito de
“aprendizagem por reforço” da psicologia, no qual uma recompensa ou punição é
dada a um agente, dependendo da decisão tomada. Com o passar do tempo e a
repetição dos experimentos, é esperado que o agente aprenda a associar as ações
que geram maior recompensa para cada evento que o ambiente lhe apresente e
evite as ações que geram punição ou uma menor recompensa. Na psicologia, esse
tipo de abordagem é chamada de Behaviorismo e tem B. F. Skinner um dos
principais precursores. Ele é um famoso psicólogo que usou a ideia de recompensas
e punições para treinar pombos, a fim de orientar mísseis na Segunda Guerra
Mundial.
Essa abordagem também é vista no aprendizado de máquinas, em que a
máquina observa um “estado da natureza” entre os conjuntos de cenários futuros
possíveis e, com base nessa observação, escolhe uma ação para realizar e recebe
uma recompensa associada a essa ação específica, obtendo então a informação
dessa combinação. O processo irá se repetir até que a máquina consiga escolher a
melhor ação a ser executada para cada um dos cenários possíveis a serem
observados no futuro.
O aprendizado por reforço pode ser exemplificado com o adestramento de
um cão para se sentar com um comando. Num primeiro momento, dificilmente o cão
obedecerá e irá executar o comando, e por isso ele receberá um “reforço negativo”,
ou seja, uma punição verbal ou até uma batida que produza um som – jamais no
cão, obviamente. Quando ele estiver se aproximando do que tem de fazer, é hora de
dar “reforços positivos”, como palavras de aprovação ou incentivo. E, no final,
quando o cão de fato se sentar após o comando, receberá uma recompensa física,
como um alimento, por exemplo. Após várias repetições do mesmo comando, o cão
passará a associar a relação de “causa-efeito” entre o comando e a recompensa que
ele receberá, e com isso “aprenderá” a obedecer a tal comando – isso é o que se
espera. Existe um experimento famoso, conhecido como “cão de Pavlov”, que ilustra
esse paradigma de aprendizagem. Ivan Pavlov foi um cientista russo que defendia a
ideia do “reflexo condicionado”. No experimento, era apresentado um pedaço de
carne a um cão, e o animal passava a salivar pois queria o alimento. Porém, em vez
de apresentar somente a carne ao cão, uma campainha era acionada juntamente
com a apresentação da carne. Com a repetição dessas duas situações, a carne e a
campainha, o cão associava os dois “estímulos” e salivava também quando ouvia a
campainha.
Esse experimento é bastante útil quando trazido para o âmbito da ciência de
dados. No lugar de treinar cachorros, é possível construir uma máquina que analisa
o mercado financeiro e que sincroniza a combinação de ativos comprados ou
vendidos com a “recompensa financeira” da carteira anterior e da variação do
mercado. Também é possível associar o experimento a um automóvel “autônomo”,
que toma decisões em virtude do cenário observado em seu entorno, recebendo
recompensas negativas quando atinge algo ou outros veículos, e, após repetidas
etapas, “aprende” a desviar os obstáculos.
Continuando com o exemplo do adestramento de cães, depois de tê-lo
ensinado a sentar com sucesso, há a necessidade um teste de obediência, que será
fazer o animal ficar sentado enquanto o adestrador se distancia dele. Caso o cão se
sente, ganhará um biscoito, mas, caso fique sentado mesmo quando o adestrador
se afasta, ele ganhará uma recompensa maior. O problema agora é que o cão tem
uma “escolha difícil”, pois ele pode simplesmente sentar e ganhar sempre o biscoito,
mas também pode “explorar” novas situações, em que ele pode ficar parado e
verificar se não há uma recompensa maior ainda. O adestrador continuará dando
reforços positivos e negativos enquanto se afasta, elogiando o cão quando ele fica
parado e repreendendo ao cão quando ele sai do lugar. Nesses casos, será que o
cão está a fim de abrir mão da recompensa que ele já tem “garantida”?
Esse exemplo das etapas do adestramento de um cão ilustra um trade-off,
onde o animal pode escolher “testar” novas situações de ações ótimas em uma
sequência de “estados” não realizados ainda e ir em busca de recompensas
maiores, mas não imediatas – ação conhecida como “exploration”. Ele também
poderá se contentar com a recompensa que ele ganha por meio de uma ação já
conhecida, fato esse conhecido como “exploitation”. Essa ideia pode se estender
para outros contextos, como em finanças, quando é possível refletir o grau de
aversão ao risco de investimento, que é o quanto o investidor está disposto a se
arriscar em busca de retornos maiores, ou se ele está disposto a correr menos
riscos e obter um retorno menor, porém com mais segurança.

Ser capaz de fazer a máquina encontrar um meio termo entre exploration e


exploitation é uma das principais dificuldades da aprendizagem por reforço, sendo
muito pertinente em aplicações mais complicadas, como, por exemplo: ensinar uma
máquina a jogar xadrez, em que é de conhecimento que uma estratégia vencedora
envolve renunciar a uma vantagem imediata, muitas vezes até sacrificando peças,
com o intuito de alcançar sucesso no longo prazo. Além disso, deve-se levar em
consideração as consequências de uma jogada em várias rodadas adiante e que a
resposta do adversário visará a um benefício futuro, e assim por diante.
CONSIDERAÇÕES FINAIS

Após ter contato com os três tipos de aprendizado, a pergunta que vem à
mente é: qual dos três tipos de aprendizado é melhor? Não há uma resposta única e
correta a essa questão, pois ela depende do que se está analisando. Cada problema
tem suas características, e uma solução que funcionou bem para um determinado
problema pode não ser adequada para outro. Portanto, ao se trabalhar com
aprendizado de máquina, onde um volume grande de informações é processado, é
preciso ter consciência de que uma máquina não faz o que se quer, ela faz o que se
manda.
A máquina é um instrumento de conveniência; o desempenho da inteligência
artificial está diretamente ligado à inteligência humana de quem a treinou. Fatores
externos, como o dilema viés-variância, precisam ser tratados com cuidado pelo
pesquisador, para que a máquina forneça de fato os resultados desejados. Técnicas
de regularização e validação cruzada são mecanismos importantes para “guiar” a
máquina e garantir um meio-termo entre acurácia na amostra e poder de
generalização. Nenhuma máquina “saberá mandar”; por isso, é necessário conhecer
o problema a ser resolvido, sendo esse o passo essencial para que o pesquisador
tenha controle sobre a máquina, e não o contrário.

Você também pode gostar