Você está na página 1de 23

INF01017

Aprendizado de Máquina

Introdução ao Aprendizado Não-Supervisionado


Profa. Mariana Recamonde-Mendoza
mrmendoza@inf.ufrgs.br
Classificação dos algoritmos:
Tipos de feedback
Aprendizado
de Máquina
Feedback completo: conjunto de
entradas com respectivas saídas
esperadas (há um atributo alvo)

Supervisionado

Classificação Regressão

2
Classificação dos algoritmos:
Tipos de feedback
Aprendizado
de Máquina
Feedback parcial: crítica
sobre o quão boa foi uma
ação tomada

Supervisionado Por reforço

Classificação Regressão

3
Classificação dos algoritmos:
Tipos de feedback
Aprendizado
de Máquina
Feedback nulo: não há qualquer
informação sobre a saída esperada
(não há atributo alvo)

Supervisionado Por reforço Não supervisionado

Classificação Regressão Associação Agrupamento

Sumarização

4
Classificação dos algoritmos:
Tipos de feedback
Tarefa Descritiva
Aprendizado
de Máquina

Supervisionado Por reforço Não supervisionado

Classificação Regressão Associação Agrupamento

Sumarização

5
Classificação dos algoritmos:
Tipos de tarefas
Preditiva Descritiva Controle

Encontrar padrões que Lidar com controle


Usar informações sobre adaptativo e tomadas de
um conjunto de atributos sejam compreensíveis
por humanos para decisões sucessivas,
para predizer valores aprendendo as
futuros ou descrever e explorar os
dados melhores ações através
desconhecidos de um da maximização de uma
atributo alvo Aprendizado recompensa
não-supervisionado
6
Relembrando…
Dados: Conceitos básicos Maligno
vs Benigno

Diagnóstico de câncer de mama (WBCD)


Atributo alvo
Radius Texture Perimeter Diagnosis
14 23 94 M
15 28 97 M
15 20 95 M
16 21 108 M
20 22 130 M
15 14 102 M
9 21 55 B
9 14 59 B
9 21 60 B
11 19 72 B
9 17 59 B
13 16 81 B

Em aprendizado supervisionado, atributo alvo é a saída esperada, o


fenômeno de interesse sobre o qual se quer fazer previsões. 7
Relembrando…
Dados: Conceitos básicos

Diagnóstico de câncer de mama (WBCD)

Radius Texture Perimeter


14 23 94
15 28 97
15 20 95
16 21 108
20 22 130
15 14 102
9 21 55
9 14 59
9 21 60
11 19 72
9 17 59
13 16 81

Em muitos domínios, não há a disponibilidade do atributo alvo


8
Relembrando…
Aprendizado supervisionado
Exemplos conhecidos (rotulados)
Radius Texture Perimeter Diagnosis
14 23 94 M
15 28 97 M
15 20 95 M
16 21 108 M
20 22 130 M Radius
Modelo
15 14 102 M Texture Diagnosis
9 21 55 B Perimeter
(f)
9 14 59 B Aproximação
9 21 60 B da função f :
11 19 72 B yk = f (xk)
9 17 59 B
13 16 81 B

Atributos Atributo
preditivos Alvo
(entradas) (saída)

Sem atributo alvo, não é possível treinar um modelo para aprender o


mapeamento entre entradas e saídas 9
Aprendizado Não-Supervisionado

Tarefa Descritiva
Aprendizado
de Máquina

Na ausência de um atributo alvo...


● Existem propriedades intrínsecas aos
dados? Não supervisionado

○ Relações entre as instâncias?


○ Associações ou correlações entre
os atributos?
● Objetivo: aprimorar o entendimento Associação Agrupamento
sobre os dados, para auxiliar na tomada
de decisão ou descoberta de
conhecimento
Sumarização

10
Relações entre as instâncias?

Existem subgrupos
nestes dados em função
de similaridades entre
seus atributos?

11
Relações entre as instâncias?
1
po
ru
bg
Su

Existem subgrupos
nestes dados em função
Subgrupo 2
de similaridades entre
seus atributos?

12
Associações entre atributos?
Alguma forte associação
entre as características
das instâncias. no formato
Se A Então C ?

Isto é a ocorrência da
característica A contribui
para a presença da
característica C?

Se glucose=[105,130)}
Então insulin=[0,94.3)

13
Aprendizado Não-Supervisionado

Tarefa Descritiva
Aprendizado
de Máquina

Na ausência de um atributo alvo...


● Existem propriedades intrínsecas aos
dados? Não supervisionado

○ Relações entre as instâncias?


○ Associações ou correlações entre
os atributos?
● Objetivo: aprimorar o entendimento Associação Agrupamento
sobre os dados, para auxiliar na tomada
de decisão ou descoberta de
conhecimento
Sumarização

14
Análise de agrupamentos
Que subpopulações existem nos meus dados?

Encontrar grupos de instâncias tal que

■ instâncias similares (relacionadas)


estejam associadas ao mesmo grupo

■ instâncias dissimilares (não


relacionadas) estejam associadas a
grupos distintos

Estatísticas de assalto e assassinato, em prisões por


100.000 habitantes, nos 50 estados dos EUA em 1973.

15
Análise de agrupamentos
Que subpopulações existem nos meus dados?

Encontrar grupos de instâncias tal que

■ instâncias similares (relacionadas)


estejam associadas ao mesmo grupo

■ instâncias dissimilares (não


relacionadas) estejam associadas a
grupos distintos

Estatísticas de assalto e assassinato, em prisões por


100.000 habitantes, nos 50 estados dos EUA em 1973.
Três grupos de estados de acordo com
similaridades nas estatísticas

16
Análise de agrupamentos
Que subpopulações existem nos meus dados?

Encontrar grupos de instâncias tal que

■ instâncias similares (relacionadas)


estejam associadas ao mesmo grupo

■ instâncias dissimilares (não


relacionadas) estejam associadas a
grupos distintos

Estatísticas de assalto e assassinato, em prisões por


100.000 habitantes, nos 50 estados dos EUA em 1973.
Três grupos de estados de acordo com
similaridades nas estatísticas

Análise da distribuição de valores dos atributos e das instâncias em cada


cluster pode auxiliar na tomada de decisão
17
Análise de agrupamentos
● Resultado:
○ Segmentação dos exemplos em grupos, tal que a similaridade intragrupo
tenha sido maximizada, e a similaridade intergrupos tenha sido minimizada

Em alguns cenários a segmentação dos dados é o interesse e objetivo final

● Segmentação de mercado e de clientes: agrupar pessoas de acordo com similaridades


em diversas dimensões para melhor determinar potencial de venda de um produto, ou
compreender os perfis de pessoas que já são clientes

Análise manual Análise por clustering


18
https://www.optimove.com/learning-center/customer-segmentation-via-cluster-analysis
Análise de agrupamentos
● Resultado:
○ Segmentação dos exemplos em grupos, tal que a similaridade intragrupo
tenha sido maximizada, e a similaridade intergrupos tenha sido minimizada

Em alguns cenários a segmentação dos dados é o interesse e objetivo final

● Segmentação de mercado e de clientes: agrupar pessoas de acordo com similaridades


em diversas dimensões para melhor determinar potencial de venda de um produto, ou
compreender os perfis de pessoas que já são clientes

Descoberta de
“personas” (perfis de
clientes) a partir da
análise de clusters:
permite modelar os
clientes e personalizar
esforços de marketing
para maior efetividade.

Análise manual Análise por clustering


19
https://www.optimove.com/learning-center/customer-segmentation-via-cluster-analysis
Aprendizado Não-Supervisionado

Tarefa Descritiva
Aprendizado
de Máquina

Na ausência de um atributo alvo...


● Existem propriedades intrínsecas aos
dados? Não supervisionado

○ Relações entre as instâncias?


○ Associações ou correlações entre
os atributos?
● Objetivo: aprimorar o entendimento Associação Agrupamento
sobre os dados, para auxiliar na tomada
de decisão ou descoberta de
conhecimento
Sumarização

20
Mineração de Padrões Frequentes

Estratégia bastante comum em Market Basket Analysis

21
Mineração de Padrões Frequentes

Transações

{Diapers, Beer} é um subconjunto de itens frequentes

Diapers → Beer é um exemplo de regra de associação

22
Aprendizado Não-Supervisionado
Tarefa Descritiva

Aprendizado
de Máquina

● Associação
Não supervisionado
○ Mineração de padrões frequentes
○ Algoritmo APRIORI
● Agrupamentos
○ K-means
○ Clustering hierárquico Associação Agrupamento

Sumarização

23

Você também pode gostar