Escolar Documentos
Profissional Documentos
Cultura Documentos
Quimiometria
Quimioinformática como
ferramenta no desenvolvimento
de novas substâncias
Quimioinformática
Quimioinformática
Muitas vezes chamada de técnica in silico
Principais usos:
1. Descoberta de novas drogas (Drug Design and Discovery)
2. Entendimento da relação entre estrutura e atividade biológica (QSAR)
3. Entendimento entre a relação entre estrutura e propriedades físico-
químicas (QSPR)
4. Desenvolvimento de bibliotecas de substâncias químicas
5. Prospecção virtual (virtual screening)
6. Planejamento racional de novas moléculas
7. Reduzir necessidade de testes in vivo e in vitro
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Quimioinformática
O que a Quimioinformática não é ?
• Química Computacional
• Química Quântica
• Bioinformática
• Bioinformática lida com macromoléculas biológicas
• Quimioinformática lida com micromoléculas (mesmo as biológicas) e
macromoléculas sintéticas
• Estatística
• Inteligência artificial aplicada à química
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Quimioinformática
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Tópicos
Descritores Moleculares
Espaço químico
Diversidade molecular
Similaridade Molecular
Classificação e seleção de substâncias
Aprendizagem por máquina
Desenvolvimento de bibliotecas
QSPR
Prospecção virtual
Desenvolvimento de novos materiais
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores moleculares
“Estrutura determina a propriedade”
“Uma propriedade da molécula depende de outras”
Tipos:
0D (Ponto de fusão, ebulição, peso e volume molecular, etc.)
1D (Numero de ligações, de átomos, cargas totais, momento de dipolo.etc.)
2D (distância entre átomos, número de grafos, conectividade,etc)
3D (Volume molecular, raio de van der Waals, TPSA, WASA, SAA, etc.)
4D (volume do sítio ativos, número de interações intermoleculares, etc.)
5D (Tipos de interações com o sistema)
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Espaço Químico
Banco que contém as moléculas e os dados a serem analisados.
Bons dados geram boas análises
Gera-se descritores moleculares para cada molécula no ChemSpace
Molecule i : M (i ) 1 d j (i )
j
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Moleculares
Cada tipo de problema requer uma classe de descritor diferente, ou mesmo vários
tipos de descritores
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Moleculares
Cada tipo de problema requer uma classe de descritor diferente, ou mesmo vários
tipos de descritores
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Moleculares
Descritores Consititucionais
Descritores Topológicos
Descritores geométricos
Descritores eletrostáticos
Descritores quânticos
Descritores Termodinâmicos
Descritores de reatividade
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
O O O
CH2
OH
Geometric
3-D (I, SA, Molecular
Volume)
Quantum-chemical
Molecular orbital structure (HOMO-
LUMO energies, dipole moment)
Electrostatic
Charge distribution (partial
charges, H-bond
donors/acceptors)
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Constitucionais
Número total de átomos
Número total ou relativo de certos elementos na
molécula (C, H, N, O, F, etc.)
Número total ou relativo de certos grupos funcionais na
molécula (C=O, -NH, -OH, etc.)
Tipo e total de ligações na molécula
Tamanho e número total de anéis na molécula
Tipo de anéis presentes na molécula
Peso molecular
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Topológicos
Índice de conectividade
Índice de valência
Índice de formas
Índice de flexibilidade
Índices topológicos eletrônicos
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Geométricos
Área de superfície
Superfície acessível ao solvente
Volume molecular
Índice gravitacional (RDF)
Áreas de sombra da molécula
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Eletrostáticos
Cargas parciais atômicas
Parâmetros de polaridade
Momento de dipolo
Polarizabilidade
Potenciais eletrostáticos na superfície molecular
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Descritores Quânticos
Energia total da molécula
Energia de repulsão eletron-eletron
Energia de ressonância
Cinética eletrônica
Energia total de cinética
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Geração de descritores
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Similaridade Molecular
• Quanto maior a similaridade estrutural entre
as moléculas, mais próximas serão as suas
propriedades
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Medidas de similaridade
Medidas Quantitativas
• numéricas
• Descritores moleculares, impressão digital, bits, etc
n B( x & y )
T ( x, y )
x yi
2
E ( x, y ) i
i 1
B ( x) B ( y ) B ( x & y )
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Tanimoto (padrão)
DTanimoto ( x, y )
x y
i i
1
i min( x , y )i i i
max(x , y )
i i x y min(x , y )
i i i i i i i i
x yi
2
DEuclidean ( x, y ) i
i
DTanimoto ( , ) = 0.68
DEuclidean
( , ) = 21.93
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
•
Impressão digital (bits)
Codificar a conectividade bit-a-bit
• Permite a comparação rápida de duas moléculas
• Construção:
• Encontrar todos os caminhos do grafo
• Gerar um vetor de bits para cada caminho
• Gerar apenas um vetor através da operação OU
length walk bit array
H H
0 C 1010000000
H C C O H 1 C–H 0001010000
1 C–C 0001000100
H H 2 C–C–H 0001000010
2 C–C–O 0100010000
3 C–C–O–H 0000011000
ALL 1111011110
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
0100010100010100010000000001101010011010100000010100000000100000
0100010100010100010000000001101010011010100000000100000000100000
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
e.g. Comparação de
faces requer a
identificação de
características
chaves.
Como as
identificamos?
O mesmo se aplica a
moléculas.
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Input
Camada escondida Saída
Input
Input
Input
Input
Input
Input
Input
Funções Previsão
Input
Parâmetros
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Motivação da SVM
Como separar as duas Como separar as duas
classes? classes?
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Conceitos de SVM
Qual o hiperplano ótimo?
Menor erro de classificação
Maior margem
Distância entre vetores de suporte e o hiperplano
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Conceitos de SVM
Qual o hiperplano ótimo?
Menor erro de classificação
Maior margem
Distância entre vetores de suporte e o hiperplano
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Virtual Screening
Seleção
biblioteca
de substâncias
Triagem virtual
Substâncias
ótimas
protótipos
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
e.g. MW 200-500
Lipinsky
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
Quantitative Structure-Properties-
Relationship (QSPR)
Encontrar correlações entre
estrutura química e determinadas
propriedades
Quantitative Structure-Properties
Relationship (QSPR)
Dados Extrair e organizar descritores
CH2 O
CH2
CH2
CH2
Conjunto de polímeros
QSPR
Y = f(Xi)
Predição Interpretação
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
diacid component
Biblioteca
combinatória
O O O
C Y C O CH2 CH2 C NH CH CH2 O
C O
O
R
2500
diphenol component
n
2500
O O
2000
HO C Y C OH
Combinatória
Succinic Acid Glutaric Acid
Size of library
1500
HO2C HO2C
CO2H CO2H
Adipic Acid 3-Methyl-Adipic Acid
HO2C HO2C O
CO2H O CO2H
Suberic Acid Dioxaoctanedioic Acid
HO2C
Sebacic Acid
CO2H 1000
400
O
HO CH2 C NH CH CH2 OH
n=1,2 C
OR
O
500
OH OH
25 100
OH OH
OH OH
0
Methanol Ethanol Isopropanol Butanol iso-Butanol sec-Butanol
O Y or R
5 10 20 50
OH OH O OH
Hexanol Octanol 2-(2-Ethoxyethoxy)ethanol
OH
OH
CH2 O
CH
NH
O C
H2
OH
Molecular Good
O volume diversity
CH2
CH2
Rotatabl
Dipol e bonds
O e
O
CH2
O
CH2
Moment Poor
of inertia
diversity
Density
Double bonds
Synthesis->
Predict
value
Biol. testing-
ed
> QSPR
model
Cluster representatives
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
1
Dos modelos para o
planejamento racional e síntese
Do modelo QSPR,
selecionar os
melhores descritos
e valores que se
relacionam com a 2
propriedade
desejada
HO2C HO2C
CO2H C O2H
Adipic Acid 3-Methyl-Adipic Acid
HO2C HO2C O
CO2H O CO2H
Planejar e
Suberic Acid Dioxaoctanedioic Acid
HO2C
CO2H
Sebacic Acid
sintestizar HO CH2
n=1,2
O
C NH CH
C O
CH2 OH
novos
OR
OH OH
OH OH
OH OH
Methanol Ethanol Isopropanol Butanol iso-Butanol s ec-Butanol
polímeros
O
OH OH O OH
Hexanol Octanol 2-(2-Ethoxyethoxy)ethanol
OH
OH
Ferramentas:
ChemAxon: http://www.chemaxon.com
Weka: www.cs.waikato.ac.nz/ml/weka/
ADRIANA: http://www.molecular-networks.com/products/adrianacode
THERESA: http://www.molecular-networks.com/products/theresa
Programa de Pós-graduação em Ciências de Materiais (PPGMAt)
Universidade Federal de Mato Grosso
1
Referências