Escolar Documentos
Profissional Documentos
Cultura Documentos
Costa
Primeira simulação IA -> KNN – K-vizinhos mais próximos
Natal, 8/3/23
https://www.datascienceacademy.com.br/course/fundamentos-de-linguagem-python-
para-analise-de-dados-e-data-science (dá diploma ao final).
Bem, lembrei a todos a assistirem ao minicurso do pessoal do DATA ICMC (USP São
Carlos) ->
Trabalho (exercício):
Com a base de dados IRIS (https://archive.ics.uci.edu/ml/datasets/iris), rodar o KNN
sorteando um número N de amostras das 3 classes para ser a base de dados das
instâncias. Usar as outras para testar.
Ex. N = 5. Como a base de dados tem 150 padrões, em 3 classes, teremos 5
(aleatoriamente) padrões para cada classe, totalizando 15 padrões (instâncias) para a
‘memória’ do classificador.
Calcular distâncias das 135 remanescentes, considerando k = 1, 3, 5, 7 e 9. Quando k =
1, reduz a ‘vizinhos mais próximos’. K está relacionado a votação.
Para montar uma tabela que mostre a acurácia, i.e., número de acertos dividido pelo
total de padrões (cardinalidade) da base de teste.
Lembrem de fazer 10 rodadas para cada experimento. Cada célula acima representa a
média dos acertos na base de dados teste para as 10 simulações. Vocês podem também
guardar a pior e a melhor simulação, além de ter o desvio padrão (que dará uma ideia se
o algoritmo é estável ou não).
Investigar se em Python dá para ‘medir’ o esforço computacional de um algoritmo. Se
sim, a tabela acima poderia também ter o ‘número de operações’ e o ‘uso de memória’.
Fazer também a Confusion Matrix, para as médias de 10 simulações:
Classe 1 2 3
1
2
3
Obs: O trabalho consiste em gerar código (Python) e relatório, enviando tudo zipado
pelo sigaa e/ou colocando em uma pasta no Google Drive e compartilhando, no sigaa, o
endereço.
OBS.2: Para alguns, no início haverá dificuldades, porém, iremos, com tolerância,
avançando nas simulações e discussões. Discutiremos a atividade na próxima quarta,
15/3, às 19:30 h.
• https://www.linkedin.com/pulse/aplica%C3%A7%C3%A3o-pr%C3%A1tica-
em-python-do-algoritmo-k-nearest-knn-rober-junior
• Python KNN Algorithm Tutorial | Python for Big Data Analytics | Edureka -
https://www.youtube.com/watch?v=8pTlCJX59Do
Bons estudos!
Até breve,