Você está na página 1de 12

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

pubs.acs.org/jcim Artigo

Andrographolide: um diterpenóide deCymbopogon schoenanthus Identificado


como um novo composto de sucesso contraTrypanosoma cruziUsando
aprendizado de máquina e abordagens experimentais
Henrique Barbosa, Gabriel Zarzana Espinoza, Maiara Amaral, Erica Valadares de Castro Levatti,
Mariana Babberg Abiuzi, Gabriel Correa Vereusimo, Philipe de Oliveira Fernandes, Vineucius
Gonçalves Maltarollo, André Gustavo Tempone, Kathia Maria Honorio,* e João Henrique Ghilardi
Lago*

Cite isto:https://doi.org/10.1021/acs.jcim.3c01410 Leia online


pubs.acs.org/sharingguidelines para opções sobre como compartilhar artigos publicados de forma legítima.
Baixado via FUNDACAO UNIV FED DO ABC em 15 de março de 2024 às 14:02:34 (UTC). Consulte https://

ACESSO Métricas e mais Recomendações de artigos *siInformações de Apoio


ABSTRATO:A tripanossomíase americana, também conhecida como doença de Chagas, é causada
pelo protozoárioTrypanosoma cruzie apresenta opções limitadas de tratamento. Os produtos
naturais oferecem vários metabólitos estruturalmente complexos com atividades biológicas,
incluindo aqueles com ação anti-T. cruzipotencial. A descoberta e o desenvolvimento de protótipos
baseados em produtos naturais frequentemente apresentam múltiplas fases que poderiam ser
facilitadas por técnicas de aprendizado de máquina para fornecer um método rápido e eficiente
para a seleção de novos candidatos a sucesso. Utilizando Random Forest e k-Nearest Neighbours,
dois modelos foram construídos para prever a atividade biológica de produtos naturais de plantas
contra amastigotas intracelulares deT. cruzi. O diterpenóide andrographolide foi identificado a
partir de uma triagem virtual como um composto de sucesso promissor. A partir de então, foi
isoladoCymbopogon schoenanthuse caracterizado quimicamente por análise de dados espectrais. A
andrographolida foi avaliada contra as formas tripomastigota e amastigota deT. cruzi, mostrando CI
50valores de 29,4 e 2,9μM, respectivamente, enquanto o medicamento padrão benznidazol
apresentou IC50valores de 17,7 e 5,0μM, respectivamente. Além disso, o composto isolado exibiu
uma citotoxicidade reduzida (CC50= 92,8μM) contra células de mamíferos e proporcionou um índice
de seletividade (SI) de 32, semelhante ao do benznidazol (SI = 39). Deem sílicoanálises, podemos
concluir que
andrographolide atende a muitos requisitos implementados pelo DNDeupara ser um composto de sucesso. Portanto, este trabalho obteve com sucesso
modelos de aprendizado de máquina capazes de prever a atividade de compostos contra formas intracelulares deT. cruzi.

■ INTRODUÇÃO
A Organização Pan-Americana da Saúde (OPAS) define a
fluxo de trabalho rotineiro.8Neste contexto, métodos de aprendizado de
máquina podem facilitar esse processo, permitindo uma triagem rápida
e eficiente de compostos em bibliotecas e bancos de dados com custo
Tripanossomíase Americana (TA) como uma doença negligenciada
reduzido e revolucionando o processo.9,10As últimas décadas
conhecida principalmente pelas dificuldades e limitações envolvidas
introduziram técnicas de inteligência artificial, como processamento de
no seu diagnóstico e tratamento e pelo baixo investimento em
linguagem natural e algoritmos de aprendizado de máquina, para
recursos humanos/financeiros que afetam principalmente as
facilitar estudos sobre descoberta de medicamentos.11,12
populações mais pobres do mundo.1-3AT é causada pela infecção
Considerando a prospecção de compostos à base de produtos naturais
pelo parasita protozoárioTrypanosoma cruzi,e apenas dois
para o desenvolvimento de novos anti-T. cruzimedicamentos, vários
medicamentos estão disponíveis em seu arsenal terapêutico:
estudos relataram o uso de abordagens de aprendizado de máquina
benznidazol e nifurtimox. Ambas as drogas foram introduzidas há
integradas com ensaios fenotípicos ou alvos de medicamentos validados,
aproximadamente 60 anos e apresentam eficácia limitada apenas como a cruzaína.13-16Com base nesses aspectos, este
na fase aguda da doença.4,5
Com base neste cenário, o desenvolvimento de novos medicamentos para o
Questão especial:Aprendizado de Máquina em
tratamento da TA é crucial, e os produtos naturais são uma fonte essencial
Bioquiminformática
para a descoberta de novos protótipos moleculares.6,7Contudo, o processo de
descoberta de medicamentos baseados em produtos naturais é trabalhoso e Recebido:13 de setembro de 2023
frequentemente proporciona compostos com potencial biológico conhecido. Revisado: 6 de dezembro de 2023
Assim, novas estratégias para aumentar a eficiência na busca de protótipos de Aceitaram:6 de dezembro de 2023
medicamentos devem ser implantadas no

© XXXX Sociedade Química Americana https://doi.org/10.1021/acs.jcim.3c01410


A J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

trabalho focado na construção de um conjunto de dados de treinados usando uma validação cruzada externa estratificada de 10
produtos naturais comem vitroanti-T. cruziatividade. O conjunto de vezes e testados com 20% do conjunto total, a parte isolada do processo
dados obtido foi utilizado para construir e validar dois modelos de de validação cruzada.
aprendizado de máquina capazes de prever se um produto natural Desempenho do modelo.As seguintes métricas estatísticas
será ativo contra formas intracelulares deT. cruzi.A abordagem foram usadas para medir o desempenho do modelo
citada anteriormente identificou o diterpenóide andrographolide
PT
como um sucesso promissor. Conforme relatado na literatura,17este VP = + FP
PT (1)
diterpenóide foi previamente isolado deAndrographis paniculatae
apresentou diversas ações terapêuticas como antiinflamatória, TN
antioxidante, anticancerígena, antimicrobiana e anti-hiperglicêmica. VP = + FN
TN (2)
Mais recentemente, o uso deA. paniculataextratos para tratamento
de pacientes leves com COVID-19 na Tailândia foram relatados.18 PT
Além disso, o efeito da andrographolida contraT. bruceitambém foi RP = + FN
PT (3)
relatado na literatura,19,20mas sua potência contraT. cruzi não foi
avaliado anteriormente. Para comprovar os efeitos biológicos da TN
NR = + FP
andrographolide, ela foi isolada deCymbopogon schoenan- TN (4)


por issofolhas e testado contra formas amastigotas deT. cruzi.
TRP
RC = VPP +
MATERIAIS E MÉTODOS 2 (5)
Conjuntos de dados.O conjunto de dados utilizado para treinamento PT×TN FP×FN
dos modelos de aprendizado de máquina foi construído em Instant MCC =
(TP + FP)(TP + FN)(TN + FP)(TN + FN) (6)
JChem através de uma extensa revisão de literatura sobre produtos
naturais com anti-T. cruziatividade entre os anos de 2012 e 2021.21O PPV×TPR
conjunto de dados inclui atividade do parasita contra formas 1 pontuação = 2×
PPV + TPR (7)
epimastigotas, tripomastigotas e/ou amastigotas, cepa do parasita,
citotoxicidade contra células de mamíferos e o tipo de célula TPR + TNR
bACC =
correspondente. O conjunto de dados para triagem virtual foi uma
2 (8)
combinação de dados de ID e SMILES, disponíveis no banco de dados de
alvo de atividade de composto anticâncer baseado em plantas naturais p pe
=0
(NPACT), contendo 1.574 compostos. 1 pe (9)
Curadoria de dados.O IC50os valores foram padronizados emμM, e os
compostos foram classificados em duas classes: IC50valores≤ com valor preditivo positivo (VPP), valor preditivo negativo
10,0μM como “ativo” e > 10,0μM como “inativo”. Os protocolos (VPN), sensibilidade ou recall (taxa de verdadeiro positivo, TPR),
foram seguidos conforme proposto por Fourchese outros.22-24para especificidade (taxa de verdadeiro negativo, TNR) e taxa de
curadoria de dados: por exemplo, compostos inorgânicos, sais e classificação correta (CCR), verdadeiro positivo (TP) em relação a
misturas foram excluídos do conjunto de compostos. positivoe previstopositivo, verdadeiro negativo (TN) em relação
Impressão digital molecular.Para construir o modelo de ao fato negativoprevisto negativo, falsopositivo(FP) valores que
aprendizado de máquina, foram utilizados descritores como impressões são negativomas esperado comopositivoe falso negativo (FN)
digitais moleculares, e as configurações das impressões digitais foram em relação apositivovalores indicados comonegativo. Por fim,
baseadas na literatura.25Morgan,26pares de átomos,27MACCS (versão de foi utilizado o Coeficiente de Correlação de Matthews (MCC),
166 bits),28e PubChem29as impressões digitais foram calculadas a partir uma métrica de desempenho amplamente utilizada que mede a
da representação simbólica do SMILES como uma forma binária de associação entre variáveis binárias e suas matrizes de
representação da estrutura molecular usando RDKit (http://www. confusão. Outra forma de medir a precisão do modelo é a
rdkit.org) implementar.30 pontuação F1, que combina pontuações de precisão (PPV) e
Balanceamento de dados.A proporção de dados ativos/inativos para sensibilidade (TPR) para expressar quantas previsões corretas o
formas amastigotas foi desequilibrada, apresentando 69 e 94 entradas, modelo faz em todo o conjunto de dados. Além disso, foram
respectivamente. Uma maneira de equilibrar esses dados foi usar SMOTE calculados a acurácia balanceada (bACC), o escore kappa de
(Synthetic Minority Oversampling Technique),31,32uma técnica específica Cohen e a área sob a curva ROC (característica operacional do
para valores nominais desequilibrados. receptor) para avaliar a acurácia do modelo.35-37
Modelos de aprendizado de máquina.Devido à natureza binária dos Domínio de aplicabilidade.Dada a dificuldade de encontrar um
dados, foi utilizado o algoritmo classificador k-Nearest Neighbours (kNN) método promissor para o cálculo do domínio de aplicabilidade para
variando tipos de impressões digitais, com e sem SMOTE para construir dados binários, este trabalho adaptou o kNN descrito por Roy, Kar e
oito modelos diferentes. O modelo kNN classifica um exemplo com base Das.38No modelo kNN, o domínio de aplicabilidade foi avaliado
nos vizinhos mais próximos sendo este modelo construído com Scikit- calculando diferentes distâncias (1, 3, 5, ..., 23) entre cada molécula
learn33utilizando módulos GridSearchCV, kNeighborsClassifier, sendo do conjunto de teste e todas as moléculas do conjunto de
treinado no algoritmo ball tree utilizando n_neighbors = 1, 3, 5,..., 23, treinamento. Essas distâncias foram então avaliadas usando três
peso = distância, uniforme; tamanho da folha = 15, 30, 45, 60 e métrica componentes do PCA (Principal Component Analysis) no conjunto de
Minkowski para distâncias comp=2. Para evitar overfitting, este modelo dados descritores do modelo39(esses componentes retêm 28% das
foi calculado com validações internas e externas.34O método classificador informações do conjunto completo de dados). Para o modelo RF, a
Random Forest (RF) também foi empregado como técnica auxiliar/ similaridade Tanimoto/Jaccard foi calculada entre cada NPACT e
complementar. Este modelo combina previsões de uma série de árvores molécula de treinamento e entre moléculas de treinamento. Depois
de decisão para classificar os dados. O modelo RF foi disso, a similaridade média dos cinco vizinhos mais próximos foi
usada para

B https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

obter uma pontuação de similaridade, definindo o valor mínimo da pontuação do 4,14 (m, H-15b e H-19a), 3,41−3,36 (m, H-3), 3,31 (s, H-
conjunto de treinamento (0,328) como limite inferior. 19), 2,63−2,52 (m, H-11), 2,42 (m, H-7a), 2,03 (m, H-7b),
Triagem Virtual.Após a construção e validação dos modelos 1,92 (m, H-9), 1,89−1,75 (m, H-1a, H-2 e H-6a), 1,43−
foi realizada a triagem virtual utilizando dados estruturais 1,26 (m, H-1, H-5 e H-6b), 1,22 (s, H-18), 0,75 (s, H-20).
NPACT40uma plataforma on-line (https://webs. iiitd.edu.in/ 13C RMN (125 MHz, CD3DO):δ171,2 (C-16), 147,9 (C-12),
raghava/npact/index.html) com dados sobre compostos 147,4 (C-8), 128,4 (C-13), 107,8
(C-17), 79,5 (C-3), 74,7 (C-
bioativos contra diferentes tipos de câncer. Este banco de dados
15), 65,2 (C-14), 63,6 (C-19), 56,0 (C-9), 54,9 (C-5), 42,3
foi selecionado porque consiste exclusivamente em produtos
(C-4), 38,6 (C-10), 37,6 (C-7 ), 36,7 (C-1), 27,6 (C-2), 24,3
naturais bioativos vegetais.
(C-11), 23,8 (C-6), 22,0 (C-18), 14,1 (C-20). ESI-HRMSeu/z
Procedimentos Computacionais.Este trabalho foi realizado em
373,1988 [M + Na]+(calculado para C20H30Ó5Na 373.1991).
Python com NumPy, Pandas e Scikit-learn para processamento de dados.
O RDKit foi empregado para obtenção de impressões digitais e o
Animais.Todos os animais usados para manterT. cruzi
OriginPro para visualização dos dados. Instant JChem foi usado para
parasitas e macrófagos peritoneais foram obtidos do
gerenciamento, pesquisa e previsão de banco de dados de estrutura, Instituto Adolfo Lutz em seu biotério. Os procedimentos
Instant JChem 20.19.3, ChemAxon (http://www.chemaxon.com). foram aprovados pelo comitê de ética43(Projeto CEUA-IAL
Em sílicoEstudo ADMET.Oem sílicoO estudo ADMET foi 05/2018) observando o Guia para Cuidado e Uso de Animais
realizado usando duas ferramentas online: SwissADME41 de Laboratório da Academia Nacional de Ciências.
(disponível emhttps://www.swissadme.ch) e ADMETlab 2.042 Manutenção de linhagens de tripomastigotas e células de
(disponível emhttps://admetmesh.scbdd.com). mamíferos.T. cruzitripomastigotas (cepa Y) foram mantidos
Procedimentos Cromatográficos e Espectrométricos. Sílica gel usando células renais de macaco Rhesus (LLC-MK2-ATCC) em
60 e sílica gel 60 PF254(da Merck, Darmstadt, Alemanha) foram meio RPMI-1640 suplementado com soro bovino fetal (FBS, 2%)
utilizados para cromatografia em coluna e cromatografia em mantido em 5% de CO2atmosfera umidificada a 37°C. As células
camada fina (TLC), respectivamente. A análise por HPLC foi realizada LLC-MK2 de mamífero e conjuntivas murinas (NCTC clone L929,
em um modelo Thermoscientic Ultimate 3000 com um detector DAD ATCC) foram mantidas com meio RPMI-1640 suplementado com
(modelo UVD-170) com um Kinetex C18coluna analítica (5μm−250× 10% de BFS a 5% de CO2aos 37°C.44
4,6 mm) e usando MeOH:H2O (1% de ácido fórmico) 65:35 como Ensaios Antitripomastigotas.Os tripomastigotas obtidos de
eluente a 1,0 mL/min. A rotação óptica foi registrada em um
culturas LLC-MK2 infectadas foram contados em hemocitômetro
polarímetro JASCO P-2000 (filtro Na,λ= 589 nm) a 25°C. O espectro
Neubauer, semeados a 1×106células/poço (em placas de 96 poços)
UV foi registado utilizando um espectrofotómetro HP 8452 A de
em diluições seriadas de andrographolide (150-1,17 μM) usando
conjunto de díodos 357. Os espectros de RMN foram registrados em
meio RPMI-1640 e incubado em 5% de CO2- atmosfera umidificada a
um Varian Unity INOVA (500 MHz
37°C por 24h. O benznidazol foi utilizado como medicamento
1H e 125 MHz13C) usando CD3OD como solvente e TMS como padrão
interno. Mudanças químicas (δ) padrão e a viabilidade do parasita foi avaliada no ensaio de
são dados em partes por milhão com constantes de acoplamento (J.) resazurina.45
em Hz. O espectro HRMS foi adquirido com ionização por Ensaios Antiamastigotas.Macrófagos peritoneais
electrospray (ESI) em modo de íon positivo em um espectrômetro
Bruker Daltonics MicroTOF QII.
(camundongos BALB/c) foram plaqueados em lâminas de
Material vegetal.Folhas deCymbopogon schoenanthus câmara de 16 poços (NUNC, Thermo Fisher Scientific) a 1×105
foram coletados na cidade de Campinas, Estado de São Paulo, células/poço e incubadas por 24 h 5% CO2-atmosfera
Brasil, em fevereiro/2023. Um exemplar de voucher foi umidificada em 37°C. Os tripomastigotas usados para infectar
comparado com aquele de número SP042740 do Instituto de as células foram lavados em meio RPMI-1640 e semeados a 1×
Biociências da Universidade de São Paulo (IB-USP). Este estudo 106/bem por 2 h. Após esse período, a placa foi lavada com meio
foi registrado no Sistema Nacional de Gestão do Patrimônio RPMI-1640 para remoção dos parasitas não internalizados.
Genético e Conhecimentos Tradicionais Associados (SisGen) do Andrographolide foi incubado (1,25-20μM) com macrófagos
Ministério do Meio Ambiente, Brasil, sob o código A483B45. A infectados por 48 h às 37°C e 5% CO2, usando benznidazol como
investigação experimental e os estudos de campo sobre plantas controle positivo. Os macrófagos foram fixados com MeOH e
(cultivadas ou silvestres), incluindo a recolha de material corados com Giemsa. CI50os valores foram obtidos após
vegetal, têm cumprido as directrizes e legislações institucionais, contagem de células infectadas em microscópio óptico (EVOS
nacionais e internacionais relevantes. M5000) e calculados de acordo com a literatura.44
Isolamento de Andrographolide.Folhas secas e em pó Ensaio de Citotoxicidade e Determinação do Índice de
deC. schoenanthus(45 g) foram secos e extraídos Seletividade.Os ensaios de citotoxicidade foram realizados
sequencialmente comn-hexano (5×100ml). Após a
contra células NCTC (clone L929). As células foram semeadas e
eliminação do solvente sob pressão reduzida, onExtrato de
incubadas a 6× 104/poço em 5% de CO2incubadora umidificada
hexano (765 mg) foi obtido. Parte deste extrato (250 mg) foi
com andrographolide (1,56-200μM) por 48h às 37h°C. O ensaio
submetida a cromatografia em coluna de sílica gel eluída
MTT determinou a concentração citotóxica de 50% (CC50).46A
comn- hexano:EtOAc (6:4 e 3:7) e EtOAc 100% para dar dez
grupos (A-J). Parte do grupo J (20,0 mg) foi purificada por densidade óptica foi obtida em FilterMax F5 (Molecular Devices)
cromatografia em coluna de sílica gel eluída comn a 570 nm. O SI foi determinado usando a razão CC50contra
-hexano:EtOAc 1:1 para gerar 11,9 mg de andrographolide. células NCTC/IC50contra parasitas.
Andrographolida.Sólido amorfo branco (99% de pureza por Análise Estatística.Os ensaios foram realizados em duplicata
HPLC). [α]25D= −64,5 (c0,15, MeOH). UV (MeOH)λmáx. e repetidos em três ensaios independentes. CI50e CC50os valores
(registroε) 225 (4,38)nm.1RMN de 1H (500 MHz, CD3DO):δ foram calculados usando curvas sigmóides dose-resposta no
6,85 (t,J.=6,8 Hz, H-12), 5,01 (d,J.=6,0 Hz, H-14), 4,88 (s, Graph-Pad Prism (software GraphPad Prism 6.0, San Diego, CA,
H-17a), 4,66 (s, H-17b), 4,46 (dd,J.=10,2 e 6,1 Hz, H-15a), EUA).

C https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

Figura 1.Análise da distribuição do conjunto de dados. A: Distribuição das classes e subclasses químicas; B: Distribuição dos dados por cepas; C: Distribuição


entre ativo/inativo por forma de parasita.

b RESULTADOS E DISCUSSÃO 1C), onde foi possível observar um desequilíbrio significativo destes
dados para as formas epimastigota e tripomastigota.
Análise de distribuição de dados.Inicialmente, 363 entradas
Por outro lado, existe uma pequena lacuna entre dados ativos e
(metabólitos vegetais) foram distribuídas entre epimastigotas,
inativos para formas amastigotas, o que possibilita a aplicação de
tripomastigotas e amastigotas IC50valores. Esse conjunto de dados foi
técnicas de aprendizado de máquina a dados desequilibrados. O
filtrado, visando remover duplicatas, o que resultou em 324 compostos
conjunto de dados tem 165 compostos inativos e 25 ativos (os nomes,
únicos. O IC50os valores cobriram um intervalo entre 0,02 e 1630μM; um
limite foi definido com base nas recomendações do Drug for Neglected SMILES, classe e subconjunto de compostos no conjunto de dados de um

Diseasesiniciativa(DNDeu), onde todos os compostos com IC50valores total de 190 compostos estão disponíveis emInformações de Apoio,

inferiores a 10μM foram classificados como ativos e aqueles que não Tabela S1.) antes do SMOTE e 165 compostos inativos / 135 ativos (300 no
atenderam a esse critério foram classificados como inativos. Este total) após o SMOTE. Considerando a divisão treinamento/teste, a
conjunto de dados mostrou predominância de terpenóides (48%), distribuição de compostos foi de 152 no conjunto de treinamento antes
seguidos de alcalóides (26%) e fenilpropanóides (14%), conforme do SMOTE e 262 compostos após o SMOTE, e o conjunto de teste teve 38
mostrado emfigura 1A. Sesquiterpenóides (22%), diterpenóides (15%) e compostos em ambos os cenários (o SMOTE foi usado apenas no
alcalóides quinolina (8%) representaram a maioria das subclasses conjunto de treinamento). Por fim, a biblioteca utilizada na triagem
químicas de produtos naturais neste conjunto. Os dados de atividade virtual possui 1.565 compostos.
estão distribuídos por oito cepas de parasitas, com as cepas Tulahuen e Y Modelos de aprendizado de máquina.Os modelos kNN foram
representando 95% do total de dados, conforme mostrado emfigura 1B. construídos usando dados de impressões digitais Morgan, AtomPairs,
Finalmente, os compostos ativos e inativos foram agrupados por formas MACCS e PubChem para compostos com atividade antiamastigota para
parasitárias (Figura cepas Tulahuen e Y.Figura 2A compara o desempenho deste

D https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

Figura 2.Resultados da análise do modelo kNN. A. Comparação entre modelos construídos com/sem balanceamento SMOTE e diferentes impressões digitais; B.
Avaliação do modelo após balanceamento SMOTE; C. Pontuações métricas para o modelo kNN; D. Comparação entre o modelo kNN e outros modelos com variáveis
embaralhadas, mostrando que o modelo não é obtido aleatoriamente; E. Um PCA tridimensional mostrando o domínio de aplicabilidade para todos os compostos
em conjuntos de treinamento e teste; F. A influência dos fragmentos (bits) na capacidade preditiva do modelo, ligações tracejadas representam átomos aromáticos;
G. Disposição de fragmentos de contribuição positiva e negativa na estrutura de acertos.

modelo utilizando quatro tipos diferentes de impressões digitais em balanceamento por arredondamento (somente caixas), k = 3 e peso =

conjuntos desequilibrados e balanceados com SMOTE, mostrando que, distância, conforme mostrado emFigura 2B. Este modelo foi validado interna e

em geral, os modelos balanceados com SMOTE são mais preditivos, externamente; na validação interna o conjunto de dados foi dividido em

principalmente aquele construído com o Morgan Fingerprint. Desta conjunto de treinamento e conjunto de teste enquanto na validação externa

forma, é possível concluir que o melhor modelo utiliza SMOTE todo o conjunto de dados foi utilizado para treinar o modelo e

E https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

validado com um conjunto de dados independente.Figura 2C mostra os citotoxicidade contra linhas celulares de câncer e atividades
resultados de sete métricas de avaliação de desempenho, incluindo TPR, antiinflamatórias, antivirais e antiparasitárias.49-51A confiabilidade
TNR, bACC, AUC, kappa de Cohen, MCC e pontuação F1. As duas desse resultado foi avaliada verificando se esse composto se
primeiras métricas representam a proporção de verdadeiros positivos e enquadra no domínio de aplicabilidade, ferramenta importante para
negativos classificados corretamente e apresentam valores acima de 0,7 identificar a consistência de uma previsão.52,53EmFigura 2E, é
para validações internas e externas. Este resultado significa que positivo possível observar que a andrographolida está dentro do domínio de
e negativo foram classificados corretamente em mais de 70% das vezes. aplicabilidade comparando sua posição nos três componentes
O parâmetro bACC representa a média aritmética de especificidade (TNR) principais do PCA com o conjunto de treinamento. Abordagem
e sensibilidade (TPR) e avalia o desempenho do modelo. Neste caso, semelhante foi feita utilizando os descritores do modelo RF,
tanto as validações internas como externas foram superiores a 0,8. AUC indicando que o acerto selecionado está dentro do domínio de
indica a separabilidade em uma curva de probabilidade (ROC); valores aplicabilidade. (Uma representação gráfica do domínio de
mais altos de AUC significam que o modelo pode distinguir entre as similaridade é representada em Informações de Apoio, Figura S2.).
classes. Para este modelo, a AUC apresenta valores em torno de 0,9 e 1,0 Além disso, o andrographolide está dentro do domínio de
para validação externa e interna, respectivamente. O coeficiente kappa aplicabilidade e pode ser considerado semelhante ao conjunto de
de Cohen avalia a concordância de duas taxas, sendo que os resultados treinamento, tendo, em média, 67,5% de similaridade usando a
reais e previstos sendo que valores kappa mais elevados representam o impressão digital 2D do AtomPair (uma tabela com estatísticas de
melhor desempenho. O modelo obtido apresentou valores de kappa similaridade de Tanimoto comparando o andrographolide e todo o
superiores a 0,6 para validações internas e externas. O MCC fornece conjunto de dados usando AtomPair, MACCS, Morgan , e as impressões
valores mais altos se o modelo puder prever corretamente dados digitais PubChem são exibidas emInformações de Apoio, Tabela S4.). O
positivos e negativos. coeficiente médio de Tanimoto (Tc) varia de 0,131 (impressão digital de
Morgan) a 0,675 (AtomPair 2D), com valores máximos de Tc iguais a
Considerando as validações internas e externas, o modelo atinge
0,412 e 0,917, respectivamente. A lista completa de valores de Tc para
valores superiores a 0,6. O escore F1, diferente do bACC, é a média
andrographolide em comparação com cada composto do conjunto de
harmônica de sensibilidade e especificidade e minimiza o impacto
treinamento é apresentada emInformações de Apoio, Tabela S5.
de valores elevados neste cálculo. O modelo kNN atinge valores em
A importância das subestruturas para o modelo treinado também
torno de 0,7 e 0,9 nas validações externa e interna,
foi avaliada como o quinto princípio das recomendações da OCDE
respectivamente. Sequencialmente, para verificar se esse modelo foi
para validação de modelos QSAR para fins regulatórios.54É calculado
obtido aleatoriamente, foram construídos mais modelos com
com base em como a ausência de um bit influencia o valor da
variáveis embaralhadas, conforme mostrado emFigura 2D, e estes
métrica escolhida, onde cada bit pode representar diferentes
não obtiveram bons resultados, sugerindo que o modelo não foi
fragmentos moleculares em outras moléculas. Desta forma, os
obtido de forma aleatória. Na próxima etapa, um modelo RF foi
valores negativos impactam positivamente na capacidade preditiva
construído usando impressões digitais de Morgan e os mesmos
do modelo. Foi possível observar uma baixa correlação entre a
dados utilizados no modelo kNN. O modelo RF teve precisão de 0,73,
frequência dos bits e a importância das variáveis, tanto ativas
sensibilidade de 0,73, taxa de classificação correta de 0,78 e
quanto inativas. Para este modelo, oito bits contribuíram
pontuação MCC de 0,53 (uma tabela com métricas estatísticas do
positivamente e sete negativamente para a capacidade preditiva,
modelo RF está disponível emInformações de Apoio, Tabela S2.).
conforme mostrado emFigura 2F.
Triagem Virtual.A seleção do banco de dados para a triagem virtual
Os pares de bits 781/171, 1060/638 e 918/787 exibiram uma
baseou-se na necessidade de limitar a diversidade molecular para ser melhor
colisão de bits, o que significa que um bit representa mais de uma
representada pelo conjunto de treinamento, ou seja, um conjunto de banco de
subestrutura em moléculas diferentes; neste caso, ambos os bits
dados contendo apenas compostos derivados de plantas. Inspirado pelo
(cada par) concordam com a importância positiva ou negativa das
crescente movimento de reaproveitamento de medicamentos,47,48
subestruturas. Para contribuições negativas, os quatro bits que mais
um conjunto de dados contendo compostos naturais bioativos
(NPACT) para triagem de novos anti-T. cruzicandidatos foi usado. contribuíram negativamente foram mais prevalentes nos compostos
Após validação, o modelo kNN foi utilizado para triagem do banco inativos. Em contrapartida, fragmentos compostos exclusivamente
de dados NPACT, visando identificar compostos ativos contra por três (bit 875/1088) e cinco (bit 1199) carbonos aromáticos
formas amastigotas deT. cruzi. A triagem virtual do modelo NPACT contribuíram negativamente para o modelo. Para contribuições
kNN indicou 47 compostos como potencialmente ativos contra positivas, o bit que mais contribuiu positivamente (bit 307) foi o
amastigotas deT. cruzi. Posteriormente, o modelo RF foi utilizado único que necessitou de carbono tetraédrico, possivelmente
para corroborar os resultados obtidos no modelo kNN, chegando a associado a algumas classes de produtos naturais. Com exceção do
423 compostos atingidos. bit 1154 (CO), todos os bits com átomos de nitrogênio ou oxigênio
Os compostos incluídos em ambos os resultados foram então contribuíram positivamente para o modelo, com distinção entre
selecionados, resultando em 20 produtos naturais (o nome e ID NPACT átomos aromáticos e alifáticos; parece estar correlacionado com
de 20 compostos Hit obtidos após filtragem usando NPACT e uma figura propriedades físico-químicas favoráveis. Comparando o bit 918 ou
com estruturas de compostos1-20estão disponíveis em Informações de 787 (C�CC), que contribui positivamente, e o bit 171 ou 781 (C�
Apoio, Tabela S3 e Figura S1.). Em seguida, essas substâncias foram C(C)C), que contribui negativamente, observou-se que a adição do
filtradas por regras de semelhança com medicamentos (regras de segundo carbono à insaturação é prejudicial à capacidade preditiva
Lipinski, Pfizer, GSK e Triângulo Dourado). Pela remoção de compostos do modelo. No entanto, uma sensibilidade ao padrão de ramificação
de interferência Pan-ensaio (PAINS) e toxóforos, aqueles com atividade já em grandes fragmentos compostos por carbonos alifáticos pode ser
conhecida contraT. cruzi, acessibilidade às plantas e propriedades de boa observada comparando-se a broca 1060 ou 683, que contribui
absorção, distribuição, metabolismo, excreção e toxicidade (ADMET) positivamente, e a broca 807, que contribui negativamente.Figura 2
foram selecionadas. Esta abordagem proporcionou um composto - o G destaca fragmentos na estrutura de acertos: mais quatro
diterpenóide andrographolide - conhecido por apresentar diferentes fragmentos essenciais que contribuem positivamente e três
potenciais biológicos, incluindo fragmentos menos importantes

F https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

Esquema 1. Fluxograma de Processo Computacional Usado para Descobrir Composto de Acerto contraT. cruzi

que contribuem negativamente. Um fluxo de trabalho de todos os processos extrato indicou a presença de andrographolide devido aos seguintes
computacionais usados na identificação de ocorrências é mostrado emEsquema 1. sinais: dois singletos emδ4.88 e 4.66, atribuídos para dois
Isolamento e avaliação de anti-T. cruziAtividade de hidrogênios não equivalentes de uma ligação dupla exocíclica
Andrographolide.Com base na identificação de compostos pelos (H-17a e H-17b, respectivamente), um tripleto emδ6,85 (J.=6,8 Hz),
modelos de aprendizado de máquina, realizamos uma busca atribuído ao H-12 de umα,β- sistema lactona insaturado, um dupleto
bibliográfica de plantas nas quais a andrographolida foi previamente emδ5.01 (J.=6,0 Hz), atribuído ao hidrogênio oximetina H-14, e dois
detectada.49,55,56Considerando queCymbopogon schoenanthusL. Spreng singletos emδ1,22 e 0,75, atribuídos aos grupos metila H-18 e H-20,
estava disponível para coleta, o extrato hexânico das folhas desta planta respectivamente. O andrographolide foi assim purificado após
foi preparado e submetido à desreplicação por meio de análise de RMN.1 sucessivas etapas cromatográficas. Sua estrutura química (Figura 3)
Espectro de H NMR de hexano bruto foi confirmado

G https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

afetando as células quentes em concentrações de 10,0, 5,0 e 2,5 μM


(Figura 4).

Figura 4.Inibição da infectividade parasitária da andrographolida em


amastigotas intracelulares deT. cruzi. Os macrófagos foram infectados
com amastigotas e o tratamento, com diferentes concentrações do
composto, foi realizado por 48 horas com benzonidazol como
medicamento de referência. (A) macrófagos não tratados, (B) 10μM, (C) 5
μM e (D) 2,5 μM. Arrow: macrófago infectado; Seta na cabeça:
amastigotas; N, núcleo do macrófago; Barra de escala: 25μm. Um
Figura 3.Estrutura do andrographolida isolada deCymbopogon
experimento representativo foi mostrado.
schoenanthus.

É fundamental mencionar que DNDeu, uma organização sem fins


pela análise de seus dados espectrais, incluindo RMN, MS e lucrativos dedicada à pesquisa e desenvolvimento de tratamentos para
rotação óptica específica57,58(Espectros de RMN e informações doenças negligenciadas, implementou critérios preconizados para a
de MS estão disponíveis emInformações de Apoio, Figuras S3 a descoberta de novos compostos de sucesso para a DC.62,63DNDeudefine
S6.), em comparação com aqueles relatados anteriormente na um valor aceitável de atividade como um IC50< 10,0μM. Portanto, a
literatura.59-61 andrographolide pode ser considerada uma candidata de sucesso, já que
Para investigar a eficácia da andrographolida contra o IC50o valor contra amastigotas foi 2,9μM. Além disso, este composto
T. cruziparasitas, este composto foi inicialmente avaliado para mostrou um CC50valor de 92,8μM, demonstrando citotoxicidade
formas tripomastigotas, resultando em um IC50valor de 29,4μM. O reduzida.18,19Dessa forma, o valor do índice de seletividade da
controle positivo benznidazol apresentou potencial superior, com IC andrographolide (SI = 32,0) foi bastante semelhante ao do benznidazol
50de 17,7μM. No entanto, como os modelos de aprendizado de (SI = 39,3) e superior aos critérios recomendados pelo DNDeu(linhagem
máquina foram construídos para formas amastigotas, a celular 10 vezes mais ativa versus linha celular de mamífero).
andrographolida foi avaliada em relação à forma intracelular deT.
cruzi, mostrando um IC50de 2,9μM, indicando eficácia superior ao Em sílicoAnálise dos parâmetros ADMET, farmacocinéticos e
medicamento padrão benznidazol (IC50= 5,0μM). A citotoxicidade semelhantes a medicamentos da andrographolide.Considerando os
contra células NCTC também foi avaliada, mostrando CC50valores de resultados obtidos anteriormente, alguns aspectos relativos aos parâmetros
92,8 e 190,6μM para andrographolida e benznidazol, ADMET, propriedades farmacocinéticas e perfis farmacológicos, cruciais para o
respectivamente (tabela 1). desenvolvimento de novos medicamentos, foram determinados a partir de
Em relação aos parasitas intracelulares, os valores do índice de silícioferramentas (Figura 5) para andrographolida. O composto hitidentified
seletividade (IS) foram semelhantes aos do medicamento padrão (IS atende a todas as indicações de Lipinski's Regra de Cinco, uma regra comum
= 32,0 e 39,3, respectivamente). Após 48 horas de incubação com para avaliar a semelhança com drogas. Este composto também não apresenta
diferentes concentrações de andrographolida, os macrófagos alertas de PAINS, o que significa que não há subestruturas que possam
infectados com amastigotas foram analisados microscopicamente, interferir nos bioensaios por vários mecanismos.64No entanto, a presença de
revelando que o composto eliminou os amastigotas sem um aceitante de Michael

Tabela 1. Anti-T. cruziDados de atividade e citotoxicidade para Andrographolide e Benznidazol de controle positivo

CIa50(μM) CCb50(μM) SIc


Composto TENTAR AMA NCTC TENTAR AMA
Andrographolida 29,4±4.8 2.9±0,3 92,8±2.3 3.2 32,0
Benznidazol 17,7±2,0 5,0±1,5 190,6±13.4 10.8 39,3

aConcentração inibitória de 50%.bConcentração citotóxica de 50%.cÍndice de seletividade (CC50/IC50); TENTE: formas tripomastigotas; AMA: formas amastigotas.

H https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

Figura 5.Experimental eem sílicodados para andrographolida. A: Propriedades do mapa de radar ADMETlab2. B: Propriedades do mapa de radar SwissADME. Em ambos os casos, a
andrographolida está dentro dos limites estipulados para o candidato a medicamento.

grupo (α,β-sistema insaturado) na estrutura do andrographolide colaboradores69não relataram atividade mutagênica em ensaios de
desempenha um papel importante na metabolização deste composto, Ames realizados em diferentes cepas deSalmonella typhimuriume
uma vez que65este diterpenóide pode ser rapidamente biotransformado sem atividade clastogênicaem vitroem células CHO-K1 para
em um derivado sulfonato (14-desoxi-12-sulfo-andrographolide). Além andrographolide. Li e colegas70avaliaram este composto quanto à
disso, não há alertas de barreira hematoencefálica (BHE) para sua toxicidade cardíaca com a possível interação no hERG K+canal
andrographolide, o que significa permeabilidade reduzida na membrana em células CHO, mostrando um IC50> 100μM, bem dentro da faixa
que protege o sistema nervoso central.66 segura (>10μM). Nossos resultados sugerem que a andrographolide
As plataformas ADMETlab 2.0 e SwissADME fornecem uma visão é um candidato promissor para o desenvolvimento


gráfica de propriedades relevantes para ocorrências eFiguras 5Um e novos medicamentos para tratar a TA.

5B exibe os resultados para andrographolide. A partir desses


resultados foi possível observar que a andrographolida, CONCLUSÕES
representada pelas linhas azuis e vermelhas, estava incluída entre Este trabalho construiu com sucesso dois modelos de aprendizado
os limites superior e inferior. Chellampillai e Pawar67descrever um de máquina capazes de prever a atividade de compostos contra
valor LogP para andrographolide de 2,63±0,13, dentro do DNDeu formas intracelulares deT. cruzia partir de um conjunto de dados
critérios (LogP < 3). Você e colegas65avaliaram a permeabilidade do construído com dados previamente relatados para produtos
andrographolide que apresentou alta absorção nos modelos de naturais bioativos de plantas. Nossoem sílicoA estratégia permitiu
monocamada de células Caco-2 e células MDR1-MDCKII. selecionar o diterpenóide andrographolida por meio de uma
Sharifuddin, Parry e Parry68avaliaram a capacidade da campanha de triagem virtual. Esta substância foi isolada de
andrographolida em induzir alterações cromossômicas em células Cymbopogon schoenanthuse caracterizado quimicamente por RMN
humanas AHH-1 e MCL-5, e este composto não foi genotóxico nas e MS. Este composto mostrou eficácia contra a forma clinicamente
doses testadas (10 a 90μM). Srinivasan e relevante, as amastigotas, apresentando potência semelhante à do

EU https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

o medicamento padrão. É importante ressaltar que este composto Informações completas de contato estão disponíveis
demonstrou reduzida citotoxicidade contra células de mamíferos e alto em: https://pubs.acs.org/10.1021/acs.jcim.3c01410
índice de seletividade. Além disso, a andrographolide apresentou um
perfil adequado de acordo com a ADMET e propriedades semelhantes a Contribuições do autor
drogas obtidas a partir deem sílicoabordagens e quando comparados HB e GZE contribuíram igualmente. HB, GZE, GCV,
com resultados experimentais da literatura. Portanto, considerando os POF, VGM e KMH contribuíram para construir bancos de
critérios de acerto para novos candidatos a fármacos e nossos protocolos dados e modelos de aprendizado de máquina. HB e JHGL
computacionais e experimentais, a andrographolide pode ser contribuíram com procedimentos cromatográficos e
considerada um excelente protótipo em estudos de otimização que caracterização química. HB, KMH, AGT e JHGL contribuíram
visam projetar novos derivados contra na preparação do manuscrito. MA, EVCL, MBA e AGT


. Cruzi. contribuíram nos testes de bioatividade. Todos os autores
leram, revisaram e aprovaram o manuscrito. Todos os
T CONTEÚDO ASSOCIADO autores aprovaram a versão final do manuscrito.
Declaração de disponibilidade de dados Financiamento
Os dados estão disponíveis noInformações de Apoio; informações Este estudo foi financiado em parte peloCoordenação de
adicionais podem ser solicitadas aos autores correspondentes. Aperfeiçoamento de Pessoal de Nível Superior - Brasil(
*siInformações de Apoio CAPES) - Código Financeiro 001. Os autores também
As informações de apoio estão disponíveis gratuitamente em agradecem à Fundação de Amparo à Pesquisa do Estado de
https://pubs.acs.org/doi/10.1021/acs.jcim.3c01410. São Paulo - FAPESP (2017/50333−7, 2020/ 01221−4,
Dados relacionados a compostos, modelos de aprendizado 2021/02789−7, 2021/04464−8 e 2023/ 12447−1 ) e ao
de máquina e HPLC/UV,1H,13Experimentos C e MS (PDF) Conselho Nacional de Desenvolvimento Científico e
Tecnológico - CNPq (301354/2019−4, 405691/2021−1 e
npacto (XLSX)
307672/2021−2) pelo apoio financeiro.
curado_npact (XLSX)


Notas


Os autores declaram não haver interesses financeiros concorrentes.
INFORMAÇÃO SOBRE O AUTOR
Autores Correspondentes
AGRADECIMENTOS
Kathia Maria Honório −Centro de Natural e Humano
Ciências, Universidade Federal do ABC, São Paulo 09210-180, Esta publicação faz parte das atividades da Rede de Pesquisa de
Brasil; Escola de Artes, Ciências e Humanidades, Universidade Produtos Naturais contra Doenças Negligenciadas
de São Paulo, São Paulo 03828-000, Brasil; orcid.org/ (ResNetNPND):http://www.resnetnpnd.org. JHGL, AGT e KMH
agradecem ao CNPq pelos prêmios científicos.


0000-0002-6938-0676; E-mail:kmhonorio@usp.br João
Henrique Ghilardi Lago −Centro de Produtos Naturais e
Ciências Humanas, Universidade Federal do ABC, São Paulo ABREVIATURAS
09210-180, Brasil; orcid.org/0000-0002-1193-8374; OPAS, Organização Pan-Americana da Saúde; NPACT, banco de
E-mail:joao.lago@ufabc.edu.br dados de alvo de atividade de composto anticâncer baseado em
plantas de ocorrência natural; PAINS, Compostos de interferência
Autores
Pan-ensaio; ADMET, absorção, distribuição, metabolismo, excreção e
Henrique Barbosa −Centro de Ciências Naturais e Humanas,
toxicidade


Universidade Federal do ABC, São Paulo 09210-180, Brasil
Gabriel Zarzana Espinoza −Escola de Artes, Ciências e
Humanidades, Universidade de São Paulo, São Paulo 03828-000, REFERÊNCIAS
Brasil (1) Pereiro, AC Diretrizes para Diagnóstico e Tratamento da Doença
Maiara Amaral −Laboratório de Fisiopatologia, Butantan de Chagas.Lanceta2019,393, 1486-1487.
Instituto, São Paulo 05503-900, Brasil (2) Schaub, GA Uma atualização sobre o conhecimento das interações parasita-vetor
da doença de Chagas.Res. Representante Trop. Med.2021,12, 63-76.
Érica Valadares de Castro Levatti −Laboratório de
(3) Organização Mundial da Saúde.Doença de Chagas (também conhecida
Fisiopatologia, Instituto Butantan, São Paulo 05503-900,
como tripanossomíase americana).https://www.who.int/news-room/
Brasil
factsheets/detail/chagas-disease-(american-trypanosomiasis)(acessado em
Mariana Babberg Abiuzi −Laboratório de Fisiopatologia,
17/06/2022).
Instituto Butantan, São Paulo 05503-900, Brasil Gabriel (4) García-Huertas, P.; Cardona-Castro, N. Avanços no tratamento
Correa Veríssimo −Departamento de Farmacêutica da doença de Chagas: novos medicamentos, plantas e alvos
Produtos, Universidade Federal de Minas Gerais, Minas Gerais promissores.Biomédica. Farmacoter.2021,142, Nº 112020.
31270-901, Brasil (5) Falk, N.; Berenstein, AJ; Moscatelli, G.; Morôni, S.; González,
Filipe de Oliveira Fernandes −Departamento de N.; Ballering, G.; Freilij, H.; Altcheh, J. Eficácia do Nifurtimox no
Produtos Farmacêuticos, Universidade Federal de Minas tratamento da doença de Chagas: um estudo de coorte retrospectivo de
Gerais, Minas Gerais 31270-901, Brasil longo prazo em crianças e adultos.Antimicrobiano. Agentes Quimother.
2022,66, Nº e02021-21.
Vinícius Gonçalves Maltarollo −Departamento de
(6) Newman, DJ; Cragg, Produtos Naturais GM como Fontes de Novos
Produtos Farmacêuticos, Universidade Federal de Minas
Medicamentos ao longo das Quase Quatro Décadas, de 01/1981 a 09/2019.
Gerais, Minas Gerais 31270-901, Brasil; orcid.org/0000-0001-
J.Nat. Prod.2020,83, 770-803.
9675-5907 (7) Atanasov, AG; Zotchev, SB; Dirsch, VM; e outros. o Grupo de Trabalho
André Gustavo Tempone −Laboratório de Fisiopatologia, Internacional de Ciências de Produtos Naturais; Supuran, CT Produtos Naturais
Instituto Butantan, São Paulo 05503-900, Brasil; na Descoberta de Medicamentos: Avanços e Oportunidades. Nat. Rev.
orcid.org/0000-0003-2559-7344 Descoberta de Drogas2021,20, 200-216.

J. https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

(8) Berdigaliyev, N.; Aljofan, M. Uma Visão Geral da Descoberta e (25) Melo-Filho, CC; Braga, RC; Muratov, EN; Franco, CH; Moraes,
Desenvolvimento de Medicamentos.Futuro Med. Química.2020,12, 939-947. CB; Freitas-Júnior, LH; Andrade, CH Descoberta de novos ataques
(9) Mak, K.-K.; Pichika, MR Inteligência Artificial no Desenvolvimento de potentes contra intracelularTrypanosoma cruzipor triagem virtual
Medicamentos: Situação Atual e Perspectivas Futuras.Descoberta de baseada em QSAR.EUR. J. Med. Química.2019,163, 649-659.
drogas hoje2019,24, 773-780. (26)Rogers, D.; Hahn, M. Impressões digitais de conectividade estendida.J.
(10) Paulo, D.; Sanap, G.; Shenoy, S.; Kalyane, D.; Kalia, K.; Tekade, Química. Inf. Modelo.2010,50, 742-754.
Inteligência Artificial RK na Descoberta e Desenvolvimento de Medicamentos. (27) Pérez-Nueno, VI; Rabal, O.; Borrell, JI; Teixidó, J. APIF: Uma nova
Descoberta de drogas hoje2021,26, 80-93. impressão digital de interação baseada em pares de átomos e sua
(11) Bellera, CL; Alberta, LN; Sbaraglini, ML; Talevi, A.Em sílico aplicação à triagem virtual.J. Química. Inf. Modelo.2009,49, 1245-1260.
Reposicionamento de Medicamentos para Doença de Chagas.Curr. Med. (28) Cereto-Massagué, A.; Ojeda, MJ; Valls, C.; Mulero, M.; Garcia-Vallvé,
Química.2020, 27, 662-675. S.; Pujadas, G. Pesquisa de similaridade de impressões digitais
(12) Saldívar-González, FI; Aldas-Bulos, VD; Medina-Franco, J. moleculares em triagem virtual.Métodos2015,71, 58-63.
EU.; Plison, F. Descoberta de medicamentos de produtos naturais na era da (29) Han, L.; Wang, Y.; Bryant, SH Desenvolvendo e validando modelos de
inteligência artificial.Química. Ciência.2022,13, 1526–1546. árvore de decisão preditiva a partir de impressões digitais estruturais químicas
(13) Tawaraishi, T.; Ochida, A.; Akao, Y.; Itono, S.; Kamaura, M.; de mineração e dados de triagem de alto rendimento no PubChem. BMC
Akther, T.; Shimada, M.; Canã, S.; Chowdhury, S.; Cao, Y.; Condroski, Bioinformar2008,9, 401.
K.; Engkvist, O.; Francisco, A.; Ghosh, S.; Kaki, R.; Kelly, JM; Kimura, C.; (30) Landrum, G.; Tosco, P.; Kelley, B.; Sriniker, R.; Gedeck; Vianello, R.;
Kogej, T.; Nagaoka, K.; Naito, A.; Pairaudeau, G.; Radu, C.; Roberts, I.; Schneider, N.; Kawashima, E.; Dalke, A.; Dan, N.; Cosgrove, D.; Cole, B.;
Shum, D.; Watanabe, N.; Xie, H.; Yonezawa, S.; Yoshida, O.; Yoshida, Swain, M.; Turco, S.; Savelyev, A.; Jones, G.; Vaucher, A.; Wójcikowski, M.;
R.; Mowbray, C.; Perry, B. Collaborative Virtual Screening identifica Pegue, eu .; Probst, D.; Ujihara, K.; Scalfani, VF; Godin, G.; Pahl, A.;
uma série de 2-aril-4-aminoquinazolina com eficácia em umNa Vivo Bérenger, F.; Varjo, JL; Strets, JP; Gavid, D.Rdkit/Rdkit: lançamento
Modelo deTrypanosoma cruziInfecção.J. Med. Química. 2023,66, 2021_09_5 (terceiro trimestre de 2021); 2022. https://doi.org/10.5281/
1221-1238. ZENODO.6330241(acessado em 22/12/2023).
(31) Lemaitre, G.; Nogueira, F.; Aridas, CK Imbalanced-Learn: uma caixa de
(14) de Souza, ML; Júnior, COR; Ferreira,RS; Chávez, R. M.
ferramentas Python para enfrentar a maldição dos conjuntos de dados
E.; Ferreira, LLG; Slafer, BW; Magalhães, LG; Krogh, R.; Oliveira,
desequilibrados no aprendizado de máquina.J. Mach. Aprender. Res.2017,18, 1−5.
G.; Cruz, FC; Dias, LC; Andricopulo, AD Descoberta de inibidores de cruzaína
(32) Chawla, Nevada; Bowyer, KW; Salão, LO; Kegelmeyer, WP SMOTE:
potentes, reversíveis e competitivos com atividade tripanocida: uma
Técnica de sobreamostragem de minorias sintéticas.J. Artif. Intel. Res.
abordagem de design de medicamentos baseada em estrutura.J. Química. Inf.
2002,16, 321-357.
Modelo.2020,60, 1028-1041.
(33) Pedregosa, F.; Varoquaux, G.; Gramfort, A.; Michel, V.; Thirion,
(15) Martinez-Mayorga, K.; Byler, K.G.; Ramírez-Hernandez, AI; Terrazas-
B.; Grisel, O.; Blondel, M.; Prettenhofer, P.; Weiss, R.; Dubourg, V.;
Alvares, DE Inibidores Cruzain: Esforços Feitos, Leads Atuais e uma
Vanderplas, J.; Passos, A.; Cournapeau, D.; Brucher, M.; Perrot, M.;
Perspectiva Estrutural de Novos Acessos.Descoberta de drogas hoje
Duchesnay, E.́ Scikit-Learn: Aprendizado de Máquina em Python.
2015,20, 890-898.
J. Mach. Aprender. Res.2011,12, 2825 a 2830.
(16) Santos,VC; Leite, P.G.; Santos, LH; Pascutti, PG; Kolb,
(34) Maltarollo, VG Classificação deStaphylococcus aureusInibidores FabI por
P.; Machado, FS; Ferreira, RS Descoberta Baseada na Estrutura de Novos
técnicas de aprendizado de máquina.Internacional J. Quant. Estrutura.- Prop.
Inibidores de Cruzaína com Perfis de Atividade Tripanocida Distintos.EUR. J.
Relatsh.2019,4, 1–14.
Med. Química.2023,257, Nº 115498.
(35) Chicco, D.; Jurman, G. As vantagens do coeficiente de
(17) Zeng, B.; Wei, A.; Zhou, Q.; Yuan, M.; Lei, K.; Liu, Y.; Canção, J.;
correlação de Matthews (MCC) sobre a pontuação F1 e precisão na
Guo, L.; Sim, Q. Andrographolide: Uma Revisão de Sua
avaliação de classificação binária.Genoma BMC2020,21(1), 6.
Farmacologia, Farmacocinética, Toxicidade e Ensaios Clínicos e
(36) Boughorbel, S.; Jarray, F.; El-Anbari, M. Classificador ideal para dados
Pesquisas Farmacêuticas.Fitoter. Res.2022,36, 336-364.
desequilibrados usando a métrica do coeficiente de correlação de Matthews.
(18) Tanwettiyanont, J.; Piriyachananusorn, N.; Sangsoi, L.;
PLoS Um2017,12, Nº e0177678.
Boonsong, B.; Sunpapoa, C.; Tanamatayarat, P.; Na-Ek, N.; (37) Wei, Q.; Dunbrack, RL O papel do treinamento equilibrado e conjuntos de
Kanchanasurakit, S. Uso deAndrographis paniculata(Burm.f.) dados de teste para classificadores binários em bioinformática.PLoS Um 2013,
Parede. ex Nees e risco de pneumonia em pacientes hospitalizados 8, Nº e67863.
com doença leve por coronavírus 2019: um estudo de coorte (38)Roy, K.; Kar, S.; Das, RN Validação de Modelos QSAR. Em
retrospectivo.Frente. Med. 2022,9, Nº 947373. Compreendendo os fundamentos do QSAR para aplicações em ciências
(19) Banerjee, M.; Paraí, D.; Dhar, P.; Roy, M.; Barik, R.; farmacêuticas e avaliação de riscos; Elsevier: 2015; páginas 231 a 289,
Chattopadhyay, S.; Mukherjee, SK Andrographolide induz morte DOI: 10.1016/B978-0-12-801505-6.00007-7.
celular dependente de estresse oxidativo em parasita protozoário (39) Fernandes, PO; Martins, DM; De Souza Bozzi, A.; Martins,
unicelularTrypanosoma brucei.Acta Trop.2017,176, 58-67. APP; De Moraes, AH; Maltarollo, VG Molecular Insights sobre ativação de ABL
(20) Duraõ, R.; Ramalhete, C.; Madureira, AM; Mendes, E.; Duarte, N. Kinase usando modelos de aprendizado de máquina baseados em árvore e
Terpenóides vegetais como compostos de impacto contra a tripanossomíase. acoplamento molecular.Mol. Mergulhadores2021,25, 1301-1314.
Produtos farmacêuticos2022,15, 340. (40) Mangal, M.; Sagar, P.; Singh, H.; Raghava, GPS; Agarwal, S.
(21) Barbosa, H.; Thevenard, F.; Reimaõ, JQ; Tempone, AG; Honório, M. NPACT: Banco de dados de alvos de atividades de compostos anticâncer baseados
KM; Lago, JHG O potencial dos metabólitos secundários das plantas em plantas de ocorrência natural.Ácidos Nucleicos Res.2013,41, D1124 − D1129.
como drogas ou chumbos contraTrypanosoma cruzi-uma
atualização de 2012 a 2021.Curr. Principal. Med. Química.2022, 23, (41)Daina, A.; Michielin, O.; Zoete, V. SwissADME: Uma ferramenta web gratuita para avaliar
159. a farmacocinética, a semelhança com medicamentos e a compatibilidade com a química
(22) Fourches, D.; Muratov, E.; Tropsha, A. Confie, mas verifique: sobre a medicinal de pequenas moléculas.Ciência. Representante.2017,7, 42717.
importância da curadoria de estruturas químicas em quimioinformática e (42) Xiong, G.; Wu, Z.; Yi, J.; Fu, L.; Yang, Z.; Hsieh, C.; Yin, M.; Zeng,
pesquisa de modelagem QSAR.J. Química. Inf. Modelo.2010,50, 1189-1204. X.; Wu, C.; Lu, A.; Chen, X.; Hou, T.; Cao, D. ADMETlab 2.0: Uma
plataforma online integrada para previsões precisas e abrangentes
(23) Fourches, D.; Muratov, E.; Tropsha, A. Curadoria de Dados de propriedades ADMET.Ácidos Nucleicos Res.2021,49, W5 − W14.
Quimiogenômicos.Nat. Química. Biol.2015,11, 535-535.
(24) Fourches, D.; Muratov, E.; Tropsha, A. Confie, mas verifique II: um (43) Thevenard, F.; Brito, I.; Costa-Silva, TA; Tempone, AG; Lago, JHG
guia prático para curadoria de dados quimiogenômicos.J. Química. Inf. Enyne Acetogeninas dePorcelia macrocarpaCascas de frutas
Modelo.2016,56, 1243-1252. exibidas anti-Trypanosoma cruziAtividadeem vitroe causar um

K https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX
Jornal de informação química e modelagem pubs.acs.org/jcim Artigo

Redução do nível de cálcio intracelular nos parasitas.Ciência. Representante. (62) Don, R.; Ioset, J.-R. Estratégias de triagem para identificar nova
2023,13, 10254. diversidade química para desenvolvimento de medicamentos para tratar
(44) Romanelli, M.M.; Amaral, M.; Thevenard, F.; Santa Cruz, L. infecções por cinetoplastídeos.Parasitologia2014,141, 140-146.
M.; Regasini, LO; Migotto, AE; Lago, JHG; Tempone, AG (63) Katsuno, K.; Burrows, JN; Duncan, K.; van Huijsduijnen, R.
Desequilíbrio mitocondrial deTrypanosoma cruziInduzido pelo H.; Kaneko, T.; Kita, K.; Mowbray, CE; Schmatz, D.; Warner, P.; Slingsby, BT Hit
Alcalóide Marinho 6-Bromo-2'-de-N-Metilaplisinopsina.ACS and Lead Criteria na descoberta de medicamentos para doenças infecciosas no
Ômega 2022,7, 28561-28570. mundo em desenvolvimento.Nat. Rev. Descoberta de Drogas2015,14, 751-758.
(45) Galhardo, TS; Ueno, AK; Costa-Silva, TA; Tempone, A.
G.; Carvalho, WA; Fischmeister, C.; Bruneau, C.; Mandelli, D.; Lago, (64) Baell, JB Feeling Nature's PAINS: Produtos Naturais, Medicamentos
de Produtos Naturais e Compostos de Interferência de Pan Assay
JHG Novos Derivados do Dehidrodieugenol B e Seu Éter Metílico
(PAINS).J.Nat. Prod.2016,79, 616-628.
Apresentaram Alto Anti-Trypanosoma cruziAtividade e Causa
(65) Sim, L.; Wang, T.; Tang, L.; Liu, W.; Yang, Z.; Zhou, J.; Zheng,
Despolarização da Membrana Plasmática e Colapso do Potencial da
Z.; Cai, Z.; Zumbir.; Liu, Z. A baixa biodisponibilidade oral de um agente
Membrana Mitocondrial.Química. Biol. Interagir.2022,366, nº
anticancerígeno promissor andrographolide é devido ao extenso metabolismo
110129.
e efluxo pela glicoproteína-P.J. Farmacêutica. Ciência.2011,100, 5007-5017.
(46) Kamiloglu, S.; Sari, G.; Ozdal, T.; Capanoglu, E. Diretrizes para Ensaios de
(66) Hanafy, AS; Dietrich, D.; Fricker, G.; Lamprecht, A. Modelos de barreira
Viabilidade Celular.Frente Alimentar2020,1, 332-349.
hematoencefálica: justificativa para seleção.Av. Entrega de Medicamentos Rev.
(47) Jourdan, J.-P.; Mesa, R.; Rochais, C.; Dallemagne, P. Reposicionamento de
2021,176, Nº 113859.
Medicamentos: Uma Breve Visão Geral.J. Farmacêutica. Farmacol.2020,72, (67) Chellampillai, B.; Pawar, AP Melhorou a biodisponibilidade de
1145-1151. Andrographolide administrado por via oral a partir de nanopartículas
(48) Xue, H.; Li, J.; Xie, H.; Wang, Y. Revisão de abordagens e recursos de sensíveis ao pH.EUR. J. Droga Metab. Farmacocineta2011,35, 123-129.
reposicionamento de medicamentos.Internacional J. Biol. Ciência.2018,14, 1232-1244. (68) Sharifuddin, Y.; Parry, EM; Parry, JM As avaliações de
(49) Patil, R.; Jain, V. Andrographolide: Uma Revisão de Métodos genotoxicidade e citotoxicidade da andrographolideem vitro.Química
Analíticos.J. Cromatogr. Ciência.2021,59, 191-203. Alimentar. Toxicol.2012,50, 1393-1398.
(50) Dai, Y.; Chen, S.-R.; Chai, L.; Zhao, J.; Wang, Y.; Wang, Y. Visão (69) Srinivasan, M.; Preetha, S.; Sudhakar Rao, G.; Tirumurugaan,
geral das atividades farmacológicas deAndrographis paniculata e K.; Seshiah, A.; Ramesh, S. Avaliação de genotoxicidade de
seu composto principal Andrographolide.Crítico. Rev. Nutr. 2019,59, andrographolide no ensaio de mutagenicidade de Ames eem vitroEnsaio
S17-S29. de Aberração Cromossômica.Farmacêutica Inova. J.2021,10, 61-65.
(51) Mussard, E.; César, A.; Lespessailles, E.; Legrain, B.; Berteina-Raboin, (70) Li, W.; Pan, B.; Shi, Y.; Wang, M.; Han, T.; Wang, Q.; Duan,
S.; Toumi, H. Andrographolide, um antioxidante natural: uma atualização. G.; Fu, H. Identificação de Poli (ADP-Ribose) Polimerase 1 e 2
Antioxidantes2019,8, 571. (PARP1/2) como alvos de Andrographolide usando uma abordagem
(52) Mathea, M.; Klingspohn, W.; Baumann, K. Métodos de classificação integrada de biologia química.Química. Comum.2021,57, 6308-6311.
quimioinformática e seu domínio de aplicabilidade.Mol. Informar. 2016,
35, 160-180.
(53) Hanser, T.; Barbeiro, C.; Marchaland, JF; Werner, S.
Domínio de aplicabilidade: rumo a uma definição mais formal.
Ambiente SAR QSAR. Res.2016,27, 865-881.
(54) Gramatica, P. Sobre o Desenvolvimento e Validação de Modelos
QSAR. EmToxicologia Computacional; Métodos em Biologia Molecular;
Reisfeld, B., Mayeno, AN, Eds.; Humana Press: Totowa, NJ, 2013; Vol.930,
páginas 499 a 526,DOI: 10.1007/978-1-62703-059-5_21.
(55) Yagi, S.; Babiker, R.; Tzanova, T.; Schohn, H. Composição Química,
Atividades Antiproliferativas, Antioxidantes e Antibacterianas de Óleos
Essenciais de Plantas Aromáticas que Crescem no Sudão.Pacífico Asiático.
J. Trop. Med.2016,9, 763-770.
(56) Anwar, L.; Santoni, A.; P. Putra, D.; Efdi, M. Diterpenóides
citotóxicos do tipo lactona e triterpenóides deVitex pubescens Vahl.
Rasayan J. Chem.2019,12, 1641 a 1645.
(57) Du, Q.; Jerz, G.; Winterhalter, P. Separação de Andrographolide
e Neoandrographolide das folhas deAndrographis paniculata
Usando Cromatografia Contra-Corrente de Alta Velocidade.J.
Cromatogr. A2003,984, 147-151.
(58) Bodiga, VL; Bátula, J.; Kudle, MR; Vemuri, PK; Bodiga,
S. Andrographolide suprime a hiperpermeabilidade endotelial induzida
por cisplatina através da ativação de PI3K/Akt e eNOS - óxido nítrico
derivado.Bioorg. Med. Química.2020,28, Nº 115809.
(59) Suebsasana, S.; Pongnaratorn, P.; Sattayasai, J.; Arkaravichien,
T.; Tiamcão, S.; Aromdee, C. Efeitos analgésicos, antipiréticos,
antiinflamatórios e tóxicos de derivados de andrographolida em animais
experimentais.Arco. Farmacêutico. Res.2009,32, 1191 a 1200.
(60) Cui, L.; Qiu, F.; Yao, X. Isolamento e identificação de sete
conjugados de glicuronídeo de andrographolide na urina humana.
Droga Metab. Dispos.2005,33, 555-562.
(61) Dutta, N.; Ghosh, S.; Nelson, VK; Sareng, RH; Majumder,
C.; Mandal, SC; Pal, M. Andrographolide regula positivamente os mecanismos
de controle de qualidade de proteínas em células e camundongos por meio da
regulação positiva da função mTORC1.Bioquímica. Biofísica. Acta BBA - Gen.
2021,1865, Nº 129885.

eu https://doi.org/10.1021/acs.jcim.3c01410
J. Química. Inf. Modelo.XXXX, XXX, XXX-XXX

Você também pode gostar