Escolar Documentos
Profissional Documentos
Cultura Documentos
Aprendizado de Mquina
Aula 1
http://www.ic.uff.br/~bianca/aa/
Livro-texto:
Machine Learning Tom M. Mitchell McGraw-Hill, 1997 http://www.cs.cmu.edu/~tom/mlbook.html (Pasta 524, xerox do Bloco E)
Tpicos
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. Introduo Cap. 1 (16/03) Classificao Indutiva Cap. 2 (23/03) rvores de Deciso Cap. 3 (30/03) Ensembles - Artigo (06/04) Avaliao Experimental Cap. 5 (13/04) Teoria do Aprendizado Cap. 7 (20/04) Aprendizado de Regras Cap. 10 (27/04) Redes Neurais Cap. 4 (04/05) Mquinas de Vetor de Suporte Artigo (11/05) Aprendizado Bayesiano Cap. 6 e novo cap. online (18/05) Aprendizado Baseado em Instncias Cap. 8 (25/05) Classificao de Textos Artigo (01/06) Aprendizado No-Supervisionado Artigo (08/06)
Avaliao
Trabalhos Terico (TT) Trabalho Prtico (TP) Listas de Exerccio (LE) = mdia das notas das listas que sero dadas ao longo do curso M = (TT + TP + LE)/3
3 Aula 1 - 16/03/10 4
Aula 1 - 16/03/10
Trabalhos
Trabalho Prtico
Cada aluno dever propr e executar um projeto de aprendizado automtico especificando o tipo de problema, base de dados, metodologia de avaliao e algoritmo(s) a serem utilizados. Desenvolvido ao longo do semestre. Apresentao de 20 minutos no final do curso.
Trabalho Terico
Apresentao de um artigo da rea de aprendizado automtico, escolhido pela professora de acordo com o interesse do aluno. Cada apresentao ter durao de 45 minutos.
Aula 1 - 16/03/10 5
Classificao
Atribuir um objeto/evento a uma categoria, pertencente a um conjunto finito de categorias)
Diagnstico mdico Deteco de fraude em cartes de crdito Deteco de vrus em redes de computadores Filtragem de spam em e-mails Recomendao de produtos em e-commerce Investimentos financeiros Bioinformtica (sequncias de DNA) Reconhecimento de voz Reconhecimento de caracteres Reconhecimento de imagens
Aula 1 - 16/03/10 9
Medindo o desempenho
Acurcia da classificao Corretude da soluo encontrada Qualidade da soluo (comprimento, eficincia) Tempo de execuo
log(tempo)
A dificuldade relativa de humanos em aprender conceitos disjuntivos em relao a conceitos conjuntivos. Lei da prtica
log(# treinamento)
14
Aula 1 - 16/03/10
15
Aula 1 - 16/03/10
16
Aula 1 - 16/03/10
18
Experincia indireta: Dar feedback que no um par de E/S para a funo alvo.
Sequencias potencialmente arbitrrias de jogadas e o resultado final do jogo.
Problema da atribuio de crdito: Como atribuir crdito a jogadas individuais quando a experincia indireta?
Aula 1 - 16/03/10 19
Algoritmo pode pedir o rtulo de um exemplo qualquer no ambiente. Algoritmo pode construir um exemplo e pedir o rtulo desse exemplo. Algoritmo pode conduzir experimentos no ambiente sem ajuda humana.
Aula 1 - 16/03/10 20
Se os exemplos no so independentes, precisamos de classificao coletiva. Se a distribuio de teste diferente, precisamos de aprendizado de transferncia.
Aula 1 - 16/03/10
21
Aula 1 - 16/03/10
22
Aproximando V(b)
Calcular V(b) no tratvel porque envolve buscar em uma rvore completa exponencial. Logo essa definio no-operacional. Uma definio operacional pode ser calculada em tempo razovel (polinomial). Precisamos aprender uma aproximao operacional da funo de avaliao ideal.
Aula 1 - 16/03/10 24
Aula 1 - 16/03/10
23
bp(b): nmero de peas pretas no tabuleiro b rp(b): nmero de peas vermelhas no tabuleiro b bk(b): nmero de reis pretos no tabuleiro b rk(b): nmero de reis vermelhos no tabuleiro b bt(b): nmero de peas ameaadas (i.e. que sero pegas pelo vermelhor na prxima joga) rt(b): nmero de peas vermelhas ameaadas
Aula 1 - 16/03/10 26
Com feedback indireto, valores de treinamento podem ser estimados usando aprendizado de diferena temporal (usado em aprendizado por reforo).
Aula 1 - 16/03/10 27
onde successor(b) a prxima posio do jogo. Valores mais para o final do jogo so inicialmente mais corretos e o treinamento continuado faz com que eles sejam trazidos lentamente para as posies mais do incio.
Aula 1 - 16/03/10 28
Algoritmo de Aprendizado
Usa valores de treinamento da funo alvo para induzir uma definio que esteja de acordo com esses exemplos e que esperamos que generalize para exemplos no vistos. Em estatstica, aprender a aproximar uma funo contnua chamado de regresso. Tenta minimizar uma medida de erro tal ) como: [Vtrain (b) V (b)]2 E = bB B
Aula 1 - 16/03/10 29
error (b ) = Vtrain (b ) V (b )
wi = wi + c f i error (b)
para alguma constante pequena c
Aula 1 - 16/03/10 30
Discusso do LMS
Intuitivamente, LMS executa as seguintes regras:
Se a sada de um exemplo for correta, no faa modificaes. Se a sada for muito alta, diminua os pesos proporcionalmente aos valores das suas caractersticas correspondentes, de tal forma que a sada diminua. Se a sada for muito baixa, aumente os pesos proporcionalmente aos valores das suas caractersticas correspondentes, de tal forma que a sada aumente.
Sob suposies fracas, podemos provar que o LMS ir convergir a um conjunto de pesos que minimiza o erro mdio quadrtico.
Aula 1 - 16/03/10
Funes de Representao
Funes numricas
Regresso linear Redes neurais Mquinas de vetor de suporte (SVMs)
Algoritmos de Busca
Descida de gradiente
Perceptron Backpropagation
Funes simblicas
rvores de deciso Regras em lgica proposicional Regras em lgica de primeira ordem
Programo dinmica
Aprendizado de HMM Aprendizado de PCFG
Diviso e conquista
Induo de rvores de deciso Aprendizado de regras
Computao evolucionria
Algoritmos genticos (GAs) Programao gentica (GP)
Aula 1 - 16/03/10 34
1950s
1960s:
Redes neurais: Perceptron Reconhecimento de padres Teoria do aprendizado no limite Minsky e Papert provam limitaes do Perceptron Induo de conceitos simblicos Algoritmo de Winston Sistemas especialistas e gargalo da aquisio de conhecimento Algoritmo de rvore de deciso ID3 Michalskis AQ e diagnstico de soja Descoberta cientfica com BACON Descoberta matemtica com AM
Aula 1 - 16/03/10 36
Terica
Analisar algoritmos matematicamente e provar teoremas sobre sua:
Complexidade computacional Abilidade de se adaptar aos dados de treinamento Nmero de exemplos de treinamento necessrios para se aprender uma funo correta
1970s:
Aula 1 - 16/03/10
35
1990s
Recursos
Bases de Dados
UCI Repository: http://www.ics.uci.edu/~mlearn/MLRepository.html UCI KDD Archive: http://kdd.ics.uci.edu/summary.data.application.html Statlib: http://lib.stat.cmu.edu/ Delve: http://www.cs.utoronto.ca/~delve/ LETOR: http://research.microsoft.com/enus/um/beijing/projects/letor/index.html
Ferramenta
WEKA: http://www.cs.waikato.ac.nz/ml/weka/
Aula 1 - 16/03/10 39