Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstract.
This study examines the outcomes of the Specialization in Data Science and Digital Health at the Federal
University of Pernambuco, focusing on the application of optimization techniques to improve oral cancer
diagnoses. Utilizing data from the National Cancer Institute and methods such as Fuzzy C-Means, Partition
Membership, and Particle Swarm Optimization, the course demonstrated how attribute selection positively
influences the accuracy of predictive models. The findings highlight the SVM Random Forest, which
achieved a precision of 93.13% with the full use of selected attributes, emphasizing the importance of
attribute selection in the effectiveness of machine learning models. This work underscores the value of
integrating data science in clinical practice and interdisciplinary education.
Keywords: Data science, digital health, attribute optimization, cancer diagnosis, machine learning.
impressões dos alunos sobre sua jornada 2 2 0.5368 0.2454 74.0324 1.7051 (-1.14, 0.01); (1.22, -0.05)
educacional, destacando tanto os aspectos 2 2.5 0.5000 0.2454 74.0324 1.7051 (0.03, -0.00); (-0.03, 0.00)
positivos quanto os desafios enfrentados durante 3 1.5 0.5166 0.2483 50.3697 2.3723 (-2.27, -0.03); (1.78, -0.05); (1.76, 0.00)
3 2 0.3620 0.2181 42.9694 1.6581 (0.95, -0.01); (-1.58, -0.04); (0.91, -0.01)
o curso.
3 2.5 0.3334 0.2454 74.0324 1.7051 (0.01, 0.00); (0.09, -0.00); (-0.10, 0.00)
Este relato busca não apenas documentar a 4 1.5 0.4376 0.1627 41.4939 2.2981 (-2.02, -0.85); (2.12, -0.51); (2.02, 0.35);
(-2.01, 0.81)
experiência da turma, mas também servir como 4 2 0.2688 0.2454 74.0324 1.7051 (0.77, 0.00); (-1.72, -0.10); (0.71, 0.01);
(0.63, 0.02)
referência para o aprimoramento contínuo do 4 2.5 0.2501 0.2454 74.0324 1.7051 (-0.15, 0.00); (0.04, -0.00); (0.10, -0.00);
(0.01, 0.00)
programa e para interessados em futuras edições
da especialização. Tabela 1: Métricas de avalia¸c˜ao para diferentes
configura¸c˜oes de n clusters e m, incluindo os valores
2. DESCRIÇÃO DA SOLUÇÃO dos centr´oides dos clusters.
Partition Membership
Metodologia
Antes da aplicação do Partition Membership
Os autores escolheram a base dados do INCA
(Instituto Nacial de Câncer) sendo extraido dados J48: A acurácia foi de 91.1392%
direcionados ao câncer de boca, como
localização, idade, cor de pele, tamanho, genero, RandomForest : A acurácia foi de 100%
consumo de álccol e diagnóstico [1].
SVM: A acurácia foi de 84.3882%
Sobre esses dados foram aplicados Fuzzy C-
Means, Partition Membership e Particle Swarm Resultados obtidos após a seleção de
Optimization atributos
REFERÊNCIAS