Você está na página 1de 38

Bioinformática

Histórico e conceitos básicos

Raimundo Lima da S. Júnior M.Sc.


Departamento de Biologia
Núcleo de Pesquisas Replicon
PUC-GO

Silva Jr., RL
 Casamento entre a ciência da computação e a biologia
molecular

 É uma área nova - 10 anos atrás o termo nem existia

 Podemos dizer que foi um desdobramento da descoberta


de Watson e Crick (1953) de que o DNA é estruturado
como uma dupla hélice
 Desenvolvimento dos conceitos de ciência
 Plasticidade do desenvolvimento científico
 Exemplos:
– Análise de prognóstico para cárie baseado em radiografias
– Estudos comportamentais através
de análises complexas de
dados de EEG
– Genômica comparativa
– Estrutura de proteínas
 Bioinformática, quimioinformática, neuroinformática
 Biologia computacional
 Genômica, transcriptômica, proteômica, lipidômica e outras
ômicas
 Algoritmos
 Análise estatística de dados
biológicos
 Biologia digital
 Biologia de sistemas
 Data mining
– Text mining
 Todo o tipo de estudo ou de ferramenta que se pode
produzir para obter informação biológica usando
sequências de biomoléculas

 Pouco importa...
 Definição pragmática
– Bioinformática é o que os bioinformatas fazem
Systems
biology

Integrative
biology
 Abordagem pragmática
 No Brasil: faz tudo!
– Sabe utilizar, configurar e gerenciar sistemas
operacionais LINUX
– Sabe programar em uma ou mais linguagens de
programação
– Sabe utilizar e montar bancos de dados em larga escala
– Tem um grande conhecimento em biologia molecular,
estatística
– Escreve o artigo, responde o revisor, consegue dinheiro...
• Os bancos de dados genômicos disponíveis gratuitamente na
internet hoje contêm mais informação biológica do que todos
os cientistas do mundo serão capazes de analisar, não importa
quanto tempo se dediquem

• Dados gratuitos e de qualidade


– Muitas vezes pobremente analisados: a corrida genômica
– Brasil: pra quê financiar pesquisas tão caras?
• Não seria melhor investir na educação?
• Tarefa do bioinformata: ser criativo e produtivo ao mesmo
tempo
– Não perde o tempo da produção do dado
– Economiza “50%” do esforço científico
• Faça da bioinformática o seu ócio criativo
 A história começa na década de 1940 com a invenção do
moderno computador digital

 Ele se chama digital, pois os dados são armazenados com um


alfabeto binário

• Dígitos binários – 0 e 1
• A operação também é digital, baseada na lógica liga/desliga

 Em 1928, Griffith e cols. descobrem o Princípio Transformante

 Em 1944, Avery e cols. descobriram que o DNA era a substância


que carregava a informação genética
Gostaria de saber se podemos Eu acho que nós Não, eu acho que
transformar uma cepa não podemos usar a parte devemos tentar a
virulenta de S. pneumoniae básica do núcleo parte ácida do núcleo
em uma forma virulenta? (a proteína). (o DNA).

1943 ... No laboratório de Oswald Avery, Colin MacLeod e Maclyn McCarty


Genoma Humano:
- 46 cromossomos
- 3,2 x 109 pb e
~30.000 genes
Dogma central da biologia
molecular
Cell
DNA Nucleus membrane

Chain of
DNA amino
bases mRNA acids

Gene

Protein

Ribosome
Nucleotídeo

  

Nucleosídeo

Pentose

OH H
Ribose 2’-desoxirribose
-D-Ribofuranose -D-2-desoxirribofuranose
Base Nitrogenadas

PURINAS

Purina Adenina Guanina

PIRIMIDINAS

Pirimidina Citosina Uracila Timina

Adenina = Timina Guanina  Citosina


Sentido da Fita de DNA
Sentido da Fita de DNA

Base

Base

Base

5’  3’
5’AACGTTGCTATCGT3’
Antiparalelas
Base Nitrogenadas
Grupo Ceto (C=O) e Amino (C-NH2)

PH

PH
Timina Adenina Citosina Guanina

Relação Molar

A C
= 1,0 = 1,0 AT = CG (?)
T G

(A+G) = (T+C)
Chargaff
Base Nitrogenadas
Cavidades Maior e Menor

Cavidade
Maior Volta

Cavidade
Menor
0.34 nm
Ligações Covalentes

Forças de Van der Walls

Interações Iônicas (Mg+2)

Sítios Hidrofóbicos

Sítios Hidrofílicos

Pontes de
Hidrogênio

Estabilidade do DNA: Integridade e Flexibilidade


Ligações Importantes

Ligações Fosfodiéster

Ligação -Glicosídica
Linear x Circular

Plamídeos e Vírus
 A descoberta da hélice dupla, em 1953, mostrou que a
informação genética também é armazenada de forma digital
–Mas diferente do alfabeto binário dos computadores, os dados
genéticos são armazenados com um alfabeto quaternário
• A, C, G e T
 Mais tarde se descobriu que a forma dos genes operarem
também é digital
– Até certo ponto, os genes podem ser “ligados” ou
“desligados”

 Apenas estas observações já seria suficiente para prever, na


década de 1950, que um dia informática e biologia molecular iriam
juntas fazer nascer uma nova área de conhecimento
 O nascimento da área, entretanto, teve de esperar muito
tempo para acontecer

 Essa é a razão da bioinformática ser uma aparente


novidade

 Algumas pessoas consideram que a bioinformática passou


a ser reconhecida como importante pelo mundo científico por
volta de 1995

 Ano que o primeiro genoma de uma bactéria foi publicado

Por que tão longa demora?


 Do lado da biologia molecular o motivo é simples
– Apesar da estrutura do DNA ter sido desvendada em 1953, a
informação nela contida não podia ser “lida”
– Foi como tivéssemos descoberto o alfabeto utilizado para
escrever “o livro da vida”, mas as “palavras” desse livro
estavam com letrinhas tão pequenas que não conseguíamos
lê-las
– Foi preciso esperar até fins da década de 1980 para que
aparecesse uma “lente de aumento” suficientemente boa
que permitisse a leitura dessas letrinhas em grande
quantidade
• Uma máquina automática
– Em 1995, uma única máquina dessas já conseguia ler
milhares de letrinhas por dia
 Do lado da computação foi também preciso um amadurecimento

– Computadores sendo capazes de armazenar cada vez mais informação, de


processá-la de modo cada vez mais rápido, a um custo cada vez menor

– Se o sequenciamento automático do DNA tivesse amadurecido mais


rapidamente, digamos com 20 anos de antecedência, não haveria
computadores com poder suficiente para dar conta dos dados gerados

• Na década de 1970 a unidade básica de armazenamento de


informação era o kilobyte -- 1000 bytes, aproximadamente 1000 letras
• Um computador de grande porte daquela época tinha alguns kbytes
de memória
• Com tal memória um computador desses não seria capaz de processar
nem sequer o genoma de um vírus, que pode chegar a 20 kilobases, ou
20 mil letrinhas; que dirá o genoma humano, com seus 3 bilhões de
letrinhas
Então, através de uma evolução que parece mais ou
menos sincronizada, desembocamos em 1995

– Os computadores já estavam suficientemente poderosos para


poder processar os milhões e milhões de letrinhas que
passaram a vir à luz.

E assim nasceu a bioinformática, com a missão de


ajudar-nos a entender a história que está escrita nesse
livro da vida
Até que ponto essa onda em torno da bioinformática é
justificada?

Afinal de contas, hoje quase toda atividade científica


depende do computador

o Poderíamos falar em física-informática,


astronomia-informática, arqueologia-informática,
etc.

Será que há algo de especial na bioinformática?


 Há dois tipos de problemas em que atua a bioinformática

– O primeiro tipo de problema é chamado de problema


biotecnológico
• O exemplo clássico é o da montagem de DNA

– Uma segunda classe de problemas têm um interesse que vai


além de tecnologias específicas, que transcende qualquer
tecnologia, e diz respeito à natureza mesmo da biologia
molecular
• Queremos saber que informação está contida nos
genomas

Você também pode gostar