Você está na página 1de 24

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS

Sistemas de Informação

TECNOLOGIAS PARA
DESCOBERTA DE CONHECIMENTO
Prof. Saulo Augusto de Paula Pinto

Alex Martins
Caroline Clara
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS

Sistemas de Informação

O KDD COMO FERRAMENTA COMPUTACIONAL


PARA PREDIÇÃO DE CÂNCER DE MAMA
Prof. Saulo Augusto de Paula Pinto

Alex Martins
Caroline Clara
PROBLEMA

• 2º câncer mais comum entre as mulheres;

• 29% de novos casos por ano;

• Cresce progressivamente após os 35 anos;

• Quanto mais cedo o diagnóstico, melhor os


resultados dos tratamentos.

Fonte: INCA – Instituto Nacional do Câncer, 2019


PROBLEMA
PROBLEMA

Câncer é o nome dado a um conjunto de mais de 100 doenças que têm


em comum o crescimento desordenado de células, que invadem tecidos e
órgãos. (INCA, 2019)
PROBLEMA

• Como melhorar o prognóstico do câncer de


mama?

• O que é KDD (knowledge-discovery in


databases)?

• Como o KDD pode ajudar no processo de


predição de câncer de mama?
CONTEXTO
DADOS

• Fonte de Dados: Kaggle

• Site: https://www.kaggle.com/

• No contexto desses dados, temos várias


características das células;

• Nessas características o formato predominante é


o numérico;
DADOS

• 20% dos dados compõe o conjunto de teste;

• A saída esperada é se uma célula é benigna ou


maligna, de acordo com suas características e
com o treinamento realizado através do conjunto
de teste;
METODOLOGIA

Etapas do Processo de KDD (FAYYAD et al., 1996.)


IMPLEMENTAÇÃO
EXPERIMENTOS
RESULTADOS
RESULTADOS
RESULTADOS

Logistic Regression (Fonte: Orange Canvas, 2019)


RESULTADOS

Random Forest (Fonte: Orange Canvas, 2019)


RESULTADOS

SVC - Support Vector Machine (Fonte: Orange Canvas, 2019)


ANÁLISE DOS RESULTADOS

Foram utilizados três métodos para análise e


processamento dos dados:

• Logistic Progression
• Random Forest
• SVM (Support Vector Machine)

Dos métodos, a melhor predição foi do SVM,


com 97% de acurácia.
CONCLUSÕES E TRABALHOS FUTUROS

• As Máquinas de Vetores de Suporte constituem


uma técnica de aprendizado que vem recebendo
crescente atenção da comunidade de
Aprendizado de Máquina (AM).

• Os resultados da aplicação dessa técnica são


comparáveis e muitas vezes superiores aos
obtidos por outros algoritmos de aprendizado,
como as Redes Neurais Artificiais (RNAs).
CONCLUSÕES E TRABALHOS FUTUROS

• É possível encontrar exemplos de aplicações de


sucesso em diversos domínios, como na
categorização de textos, na análise de imagens e
em Bioinformática.

• Foi possível predizer se uma célula é benigna ou


maligna com uma acurácia entre 94% e 97% de
acerto, dependendo do algoritmo utilizado.

Fonte: (LORENA; CARVALHO, 2019)


REFERÊNCIAS BIBLIOGRÁFICAS

FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From data mining


to knowledge discovery: An overview. In: Advances in Knowledge Discovery and Data
Mining, AAAI Press/The MIT Press, England, 1996, p.1-34.
INSTITUTO NACIONAL DO CANCER. O que é câncer. Disponível em:
<https://www.inca.gov.br/o-que-e-cancer>. Acesso em: 09 jun. 2019.

JUNIOR, Raimundo de Acacio Leonel Junior. JUNIOR, João Holanda Freires. SILVA,
Tércio Jorge da Silva. SILVA, Ticiana Linhares Coelho da. MAGALHÃES, Regis Pires.
Mineração de Dados Abertos. In book: Anais da IV Jornada Científica de Sistemas de
Informação, Edition: 1 ed., Chapter: 1, Publisher: Faculdade Maurício de Nassau. Março,
2014.

PRASS, Fernando Sarturi. KDD: Uma visão geral de processo. Disponível em:
<http://fp2.com.br/blog/wp-
content/uploads/2012/07/kdd_uma_visao_geral_do_processo.pdf>. Acesso em: 20 abr.
2019.
REFERÊNCIAS BIBLIOGRÁFICAS

QUEVEDO, Matheus Vinícius. PATRICIA, Mariotto Mozzaquatro. ANTONIAZZI, Rodrigo


Luiz. Aplicação do Data Mining na Descoberta de Perfis de Risco de Câncer.
Disponível em: <https://home.unicruz.edu.br/mercosul/pagina/anais/>. Acesso em 09 jun.
2019.

ROSA, Carla Regina Mazia. STEINER, Maria Teresina Arns. STEINER, Pedro José Neto.
Técnicas de mineração de dados aplicadas a um problema de diagnóstico médico.
Disponível em: <https://www.revistaespacios.com/a16v37n08/16370816.html>. Acesso
em: 09 jun. 2019.

SAÚDE. Câncer de mama: sintomas, tratamentos, causas e prevenção. Disponível


em: <http://www.saude.gov.br/saude-de-a-z/cancer-de-mama>. Acesso em: 09 jun. 2019.

STEINER, Maria Teresinha Arns et al . Abordagem de um problema médico por meio


do processo de KDD com ênfase à análise exploratória dos dados. Gest. Prod., São
Carlos, v. 13, n. 2, p. 325-337, May 2006. Disponível em: <http://www.scielo.br/scielo.php?
script=sci_arttext&pid=S0104-530X2006000200013&lng=en&nrm=iso>. Acesso em: 09
jun. 2019.
DÚVIDAS?
OBRIGADO!

Você também pode gostar