Escolar Documentos
Profissional Documentos
Cultura Documentos
Outubro 2023
1
USO DE INTELIGENCIA ARTIFICIAL NA PREDISÃO DE
ATAQUES CARDIACOS
Belo Horizonte
2023
Índice
0.1 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
0.2 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
0.3 objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
0.3.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
0.3.2 Objetivos especificos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.3.3 justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.4 Referencial Teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.4.1 Análise de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.4.2 O que é Inteligencia artificial? . . . . . . . . . . . . . . . . . . . . . . . . 7
0.4.3 O que é Machine learning? . . . . . . . . . . . . . . . . . . . . . . . . . . 8
0.4.4 Ferramentas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
0.4.5 Bilbiotecas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
0.4.6 Causa e abordagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
0.4.7 Tratamento da base de dados . . . . . . . . . . . . . . . . . . . . . . . . 11
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
0.1 RESUMO
Nos últimos anos o mundo se deparou com a pandemia do COVID-19 e consequentemente
com o avanço de tecnologias e campos de estudo em relação saude. Com isso, a área de
Inteligência Artificial, especificamente dentro da medicina, ganhou mais visibilidade e
trouxe avanços e novos estudos, como sobre classificação de pacientes, a partir dos seus
dados e exames clínicos. Essa tecnologia pode ser explorada para melhorar as tomadas
de decisões médicas. Neste trabalho, é proposto o desenvolvimento de uma solução de
Aprendizado de Máquina que visa realizar uma classificação entre pacientes com chances
de ataques cardiacos (infartos). Para isso, foram utilizados para treino e avaliação os
dados disponibilizados em uma base de dados publica do Instituto Brasileiro de Geografia
e Estatística (IBGE) de 2019.
O processo de desemvolvimento do modelo estatistico passa por varias etapas de
desenvolvimento, dando maior importância nos resultados dos exames para as pessoas que
tem tendencia a ataques cardiacos. Os resultados obtidos mostraram que esse campo de
estudo tem um potencial promissor para a prevensão de obitos decorrentes de infartos
sendo possível alcançar até 80% de accuracia, indicando que a cada 100 pacientes testados,
cerca de 80 deles teriam uma predição acertiva na provabilidade de um infarto.
Palavras − chave : Inteligencia artificial, IA, Infarto, Ataque cardiaco
ABSTRACT
In recent years, the world has been faced with the COVID-19 pandemic and consequently
with the advancement of technologies and fields of study in relation to health. As a
result, the area of Artificial Intelligence, specifically within medicine, gained more visibility
and brought advances and new studies, such as on patient classification, based on their
data and clinical examinations. This technology can be exploited to improve medical
decision-making. In this work, we propose the development of a Machine Learning solution
that aims to classify patients with a chance of heart attacks (infarctions). For this, data
made available in a public database of the Brazilian Institute of Geography and Statistics
(IBGE) from 2019 were used for training and evaluation. The process of developing the
statistical model goes through all stages of its development, giving greater importance to
test results for people prone to heart attacks. The results obtained showed that this field
of study has promising potential for the prevention of deaths resulting from heart attacks,
being possible to achieve up to 70% accuracy, indicating that for every 100 patients tested,
around 70 of them would have an accurate prediction of the probability of a heart attack.
Keywords : Artificial intelligence, AI, Heart attack
0.2 INTRODUÇÃO
Nos últimos anos, as técnicas de ML surgiram como métodos altamente eficazes para
previsão e tomada de decisões em diversas disciplinas, incluindo mecanismos de pesquisa
na Internet, publicidade personalizada, processamento de linguagem natural, tendências
financeiras e robótica.
Nos últimos anos, os avanços na tecnologia, especialmente nos campos de ciencia de
dados e inteligência artificial (IA), se mostraram altamente eficazes para previsão e tomada
de decisões em diversas disciplinas, como mecanismos de pesquisa na Internet, publicidade
, processamento de linguagem natural (PLN), tendências financeiras e robótica (1). A
indústria da saúde, com sua vasta quantidade de informações de pacientes, testemunhou
uma mudança de paradigma no uso dessas tecnologias para melhorar os resultados dos
pacientes e otimizar estratégias de tratamento.(2) O infarto agudo do miocárdio, conhecido
tambem como ataque cardiaco, %é uma condição crônica caracterizada basicamente pelo
bloqueio do fluxo sanguineo do coração, em decorrencia disso o orgão para de funcionar
por um periodo de tempo e isso pode levar falencia de parte do tecido, danos permanentes
na região, necrose e até mesmo levar a obito.(3)
Um levantamento do Instituto Nacional de Cardiologia (INC) mostra que, em um
periodo de 14 anos (entre 2008 e 2022), o número de internações por infarto aumentou no
Brasil, alcançando uma media de mais de 150% entre homens (de 5.282 para 13.645) e
mulheres (de 1.930 para 4.973). O estudo realizado pelo INC leva em consideração dados
do Sistema de Internação Hospitalar do Datasus, do Ministério da Saúde. Por isso, a
pesquisa representa todos os pacientes brasileiro de utilizam do Sistema Único de Saúde
(SUS), seja em hospitais publicou ou privados que têm convênio e mais de 70% de todos
os pacientes do pais (4).
Os profissionais de saúde hoje em dia têm acesso a vastas quantidades de dados de
pacientes, incluindo prontuários eletrônicos, dispositivos vestíveis e informações genéticas
(5). Este projeto visa explorar os dados do paciente em conjunto com aplicações práticas de
ciencia de dados na análise do infarto em conjunto com modelos aritmeticos de inteligencia
artificial para predizer a provabilidade de um possivel ataque cardiaco, facilitando um
tratamento prévio a fim de prevenir maiores complicações e fatalidades.
0.3 OBJETIVOS
0.3.3 justificativa
Este projeto busca auxiliar os profissionais da saúde com estudos e dados para que seja
possível um diagnostico precoce mais efetivo ou previsão de possíveis ataques cardiacos.
Levando em conta a letalidade dessa condição é importante o levantamento e diagnostico
mais rápido quanto possível para que não venham a ocorrer complicações ou letalidades
no futuro, por isto a área de abrangência e a necessidade de rápidos diagnósticos faz
com que a pesquisa seja relevante para o âmbito da saúde. (6) Como o investimento
em saude e comunicação aumentaram no periodo da pandemia do COVID-19, há maior
disponibilidade de tecnologia no ambito da saude para a identificação e tratamento de
doenças atualmente, uma maneira rapida e pratica de um pre-diagnostico de riscos de um
ataque cardiaco e muito relevante e aplicavel nos hospitais.(7)
Sistemas Especialistas
Um Sistema Especialista é uma importante área da IA e o sistema que será usado neste
projeto, este tipo de sistema e treinado e capacitado para apresentar conclusões sobre um
tema especifico, desde que haja um conjunto de dados para alimentar e orientar o modelo.
É um sistema baseado em conhecimento, que considera um banco de informações massivo
para tomar conclusões com base nos dados com o intuito de emular a atuação humana
em algum domínio específico e entregar respostas tal qual adiquirir novos conhecimentos
a partir dessa interação, assim como um humano faria.(13) Os modelos de inteligencia
artificial utilizados no projeto são modelos estatisticos que nada mais são alem de sistemas
especialistas de machine learning (aprendizado de maquina) focados em correlações
estatisticas entre os dados fornecidos.
0.4.3 O que é Machine learning?
Nesta era de tecnologia moderna, ha uma quantidade abundante de dados estruturados e
não estruturados como recursos disponiveis. Na segunda metade do século XX, o Machine
leraning (aprendizado de máquina) evoluiu como um subcampo da inteligência artificial
(IA), envolvendo algoritmos de aprendizagem que correlacionam conhecimento dos dados
para fazer previsões. Em vez de exigir que humanos derivem regras e construam modelos
de programas manualmente a partir da análise de dados, o Machine leraning oferece uma
alternativa mais eficiente para capturar o conhecimento nos dados, aprimorar gradualmente
o desempenho de modelos preditivos e tomar decisões baseadas nos dados. (16, 17) Graças
a Ciencia da computação e o aprendizado de maquinas estarem se tormando cada vez mais
areas importantes de pesquisa podemos desfrutar de filtros robustos de spam de e-mail,
programas desafiadores de xadrez e ate mesmo carros autônomos com sofisticados sistemas
de segunrança. Dentro dos algoritmos de aprendizagem de maquina existem três tipos de
aprendizazem diferentes, o aprendizado supervisionado, aprendizado não supervisionado e
o aprendizado por esforço.
Aprendizado supervisionado
0.4.4 Ferramentas
0.4.5 Bilbiotecas
A biblioteca Pandas é um pacote Python que fornece estruturas de dados rápidas, flexíveis
e expressivas, projetadas para tornar o trabalho com dados “relacionais” ou “rotulados”
fácil e intuitivo. Seu objetivo é ser o alicerce fundamental de alto nível para fazer análises
práticas de dados do mundo real em Python. Além disso, tem o objetivo mais amplo de se
tornar a ferramenta de análise/manipulação de dados de código aberto mais poderosa e
flexível disponível em qualquer idioma. O pandas é construído sobre o NumPy e tem como
objetivo se integrar bem em um ambiente de computação científica com muitas outras
bibliotecas de terceiros.(19)
Matplotlib
NumPy
O NumPy (Numerical Python) é uma biblioteca Python de código aberto usada em quase
todos os campos da ciência e da engenharia. É o padrão universal para trabalhar com
dados numéricos em Python e está no centro dos ecossistemas científicos Python e PyData.
A API NumPy é usada extensivamente em conjunto com as bibliotecas Pandas, SciPy,
Matplotlib, scikit-learn, scikit-image e na maioria dos outros pacotes Python científicos e
de ciência de dados. A biblioteca NumPy contém matrizes multi dimensionais e estruturas
de dados matriciais e fornece ndarray, um objeto de matriz N-dimensional, com métodos
para operar-lo com eficiência. NumPy pode ser usado para realizar uma ampla variedade
de operações matemáticas em arrays, adiciona estruturas de dados poderosas ao Python
que garantem cálculos eficientes com arrays e matrizes, por isso foi utilizado como uma
biblioteca base neste projeto.(21)
Isto nos permite fazer uma interconexão entre setores, informações limpas e suscetí-
veis a futuros apontamentos, aplicados fortemente a estas afirmações atualmente e tendo
como uma de suas fortes bases pesquisas quantitativas.
2. Utilizar estes cabeçalhos para que possamos filtrar da base os dados desejados.
5. Aplicar machine learning para que possamos mensurar certas previsões tais como
probabilidade de a pessoa desenvolver algum outro problema ou comorbidade, como
sua alimentação afeta diretamente sua saúde, etc.
6. Entrega de resultados.
Em suma a respeito de nossa base de dados, primeiro teremos de ajustar o nosso dicionário
de informações para que fique mais ordenado, de forma que assim nos possamos relacionar
os dados do dicionário com a base de dados
utilizadas em nosso projeto e após isto estamos lendo tanto o nosso dicionário de dados
quanto posteriormente lendo a base de dados.
Agora como mostrado nas Figuras 2 e 3 estamos ajustando os dados para que assim tanto
a quantidade de colunas aplicadas em nosso dicionário quanto a quantidade de colunas
utilizadas em nossa base de dados estejam equivalentes às mesmas, assim, fazendo com
que nossos dados estejam alinhados e condizentes com o solicitado.
A variável mostrada acima na Figura 4 como dftest está sendo atribuída apenas as
informações abordadas pelo projeto. Como mostrado acima temos algumas perguntas
objetivas como se a pessoa faz alguma dieta, algum médico já o diagnosticou com a
doença e perguntas paralelas sobre a alimentação da pessoa, com o mesmo objetivo de
montarmos uma base para estudar esta doença. Logo após isto criamos uma variável
chamada vardiagnostico para servir de base para filtrarmos os dados desejados, deste
caso sendo aqueles aos quais um médico deu diagnóstico de hipertensão arterial. Por fim
alinhamos os dados para trabalharmos com eles.
Na Figura 5 preparamos nosso dataframe para que o mesmo seja exportado como arquivo
no formato .csv, para que assim nossas futuras análises e aplicação do algoritmos de
machine learning seja mais simples e sucinto afim de gerar um resultado relevante.
Referências
8 CHAUHAN, H. B.; KHER, R. K. A review on data mining and big data analytics for
healthcare solutions. i-Manager’s Journal on Software Engineering, v. 15, n. 3, p. 1–4,
Jan 2021.
16 RASCHKA, S.; MIRJALINI, V. Python machine learning: Machine learning and deep
learning with Python, scikit-learn, and TensorFlow 2. [S.l.]: Packt Publishing Ltd, 2019.
24 KLUMPP, M. et al. Artificial intelligence for hospital health care: Application cases
and answers to challenges in european hospitals. Healthcare, v. 9, n. 8, p. 961, 2021.