Tipos de Aprendizagem

22/02/2023 17:51 Descomplica | Business Analytics
Tipos de Aprendizagem
N •
a aula passada dissemos que existem basicamente três tipos de
Aprendizagem:
Aprendizagem Supervisionada (Supervised Learning)
•
Aprendizagem não Supervisionada (Unsupervised Learning)
•
Aprendizagem por Reforço (Reinforcement Learning)
Nesta aula daremos mais detalhes de cada uma delas:

Aprendizagem Supervisionada (Supervised Learning)
A aprendizagem supervisionada o tipo de aprendizagem de máquina que
utiliza exemplos rotulados. Nesta aprendizagem uma função faz o
mapeamento entre diversas variáveis independentes (entrada) em uma
variável dependente (saída).
Perceba que temos apenas os dados de entrada e de saída, mas não
temos a função que faz o mapeamento entre a entrada e a saída.
Essa função será inferida pelo algoritmo de aprendizagem de máquina,
baseada nesses dados rotulados, chamados também de dados de
treinamento.
Essa função é chamada de modelo, que será usado para rotular novos
exemplos, onde temos apenas as variáveis de entrada.
A aprendizagem supervisionada é a área da aprendizagem de máquina
https://aulas.descomplica.com.br/pos/mba-em-business-intelligence-0b6a63/turma/business-analytics-e68b31/aula/categorizacao-40c4ff 1/4
que concentra a maioria das aplicações bem-sucedidas e onde a maioria

dos problemas já estão bem definidos.
A aprendizagem supervisionada é utilizada para resolver dois tipos
principais de problemas:
•
O primeiro é de predição, onde desejamos prever um valor numérico
contínuo, como por exemplo o valor de um imóvel, e
•
o segundo é de classificação, onde desejamos rotular uma instância de
dados, como por exemplo classificar um eMail como ham (normal) ou
spam.
Aprendizagem não Supervisionada (Unsupervised Learning)

A aprendizagem não supervisionada é um tipo de aprendizagem de
máquina que utiliza exemplos não rotulados, ou seja, que não possuem
classificação ou categorização.
A aprendizagem não supervisionada identifica aspectos comuns entre as
variáveis e, a presença ou ausência desses aspectos permite agrupar
esses exemplos em categorias.
A busca por esses aspectos comuns pode utilizar diversos algoritmos,
mas todos os modelos procuram encontrar estruturas ocultas, padrões e
características comuns que permitirão agrupar novos exemplos.
Após o encontro dessas características comuns, é possível compreender
o que levou a esse agrupamento e então criar rótulos.
A aprendizagem não supervisionada pode ser utilizada para resolver dois
tipos principais de problemas:
•
O primeiro deles é o agrupamento (Clustering), onde desejamos
agrupar os exemplos em um determinado número de classes ou
categorias, baseado em suas características comuns, e
•
o segundo é a redução de dimensionalidade, onde o objetivo é
encontrar entre as variáveis, aquelas que são dependentes uma das
outras, e substituir o seu conjunto por outra, com menos variáveis.
Aprendizagem por Reforço (Reinforcement Learning)

A Aprendizagem por reforço é um tipo de Programação Dinâmica que
treina algoritmos usando um sistema de recompensa e punição.
Um algoritmo de aprendizagem por reforço, também chamado de agente,
aprende interagindo com o ambiente. O agente recebe recompensas
quando executa as tarefas corretamente e punições caso contrário. O
agente aprende sem a intervenção humana maximizando suas
recompensas e minimizando as penalidades.
A aprendizagem por reforço foi inspirada pela psicologia comportamental
(Behaviorismo). Ela é similar à como uma criança aprende a executar
uma tarefa. O aprendizado por reforço contrasta com outras abordagens
de aprendizado de máquina já que o algoritmo não é explicitamente
informado sobre como realizar uma tarefa, mas deve trabalhar sozinho no
problema.
O agente, que pode ser um carro autônomo ou um programa jogando
xadrez, interage com seu ambiente, recebendo uma recompensa
dependendo de como ele se comporta, como dirigir ao destino com
segurança ou ganhar um jogo. Por outro lado, o agente recebe uma
penalidade por executar incorretamente, como sair da estrada ou ser
xeque-mate.
O agente ao longo do tempo toma decisões para maximizar sua
recompensa e minimizar sua penalidade usando programação dinâmica.
A vantagem dessa abordagem para a aprendizagem de máquina é que
ela permite que um programa aprenda sem que um programador
especifique como um agente deve executar a tarefa.

Os algoritmos de aprendizagem por reforço são utilizados para
gerenciamento de recursos em cluster de computadores, controle de
semáforos, robótica, química, jogos, direção autônoma etc.
Atividade extra
Nome da atividade: Vídeo Youtube How Machines Learn
Link para assistir a atividade: https://www.youtube.com/watch?
v=R9OHn5ZF4Uo
Referência Bibliográfica
SIEGEL, E.
Análise Preditiva: O poder de predizer quem vai clicar, comprar, mentir ou
morrer
Alta Books: 2016
TOM FAWCETT
Data Science para negócios
Alta Books (2016)
JOHN W. FOREMAN
Data Smart. Usando Data Science Para Transformar Informação em
Insight
Alta Books(2016)
Ir para questão

Tipos de Aprendizagem

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Tipos de Aprendizagem

Enviado por

Direitos autorais:

Formatos disponíveis

22/02/2023 17:51 Descomplica | Business Analytics

Aprendizagem Supervisionada (Supervised Learning)

Nesta aula daremos mais detalhes de cada uma delas:

que concentra a maioria das aplicações bem-sucedidas e onde a maioria

Aprendizagem não Supervisionada (Unsupervised Learning)

categorias, baseado em suas características comuns, e

Aprendizagem por Reforço (Reinforcement Learning)

especifique como um agente deve executar a tarefa.

Você também pode gostar