Você está na página 1de 14

Introduo Bioinformtica

Prof. IVAn@

Bioinformtica
Unio da cincia da computao com a
biologia molecular
uma rea nova
H 10 anos atrs o termo nem existia
Depois da descoberta de Watson e Crick
(1953) de que o DNA estruturado
como uma hlice dupla; a Bioinformtica
passa a ser um dos instrumentos mais
importante e fundamental para o estudo
da Biologia Molecular.

A histria comea na dcada de 1940 com a inveno do moderno


computador digital

Ele se chama digital, pois os dados so armazenados com um alfabeto


binrio
Dgitos binrios 0 e 1
A operao tambm digital, baseada na lgica liga/desliga
A descoberta da hlice dupla, em 1953, mostrou que a informao
gentica tambm armazenada de forma digital
Mas diferente do alfabeto binrio dos computadores, os dados genticos
so armazenados com um alfabeto quaternrio
A, C, G e T
Mais tarde se descobriu que a forma dos genes operarem tambm digital
At certo ponto, os genes podem ser ligados ou desligados
Apenas estas observaes j seria suficiente para prever, na dcada de
1950, que um dia informtica e biologia molecular iriam juntas fazer
nascer uma nova rea de conhecimento

A bioinformtica passou a ser reconhecida como


Quase
que cientfico
em sintonia
desembocamos
em 1995
importante
pelo mundo
por volta de
1995
Ano que o primeiro genoma de uma bactria foi
publicado

Os computadores j estavam suficientemente


poderosos para poder processar os milhes e
milhes de letrinhas.

A Biologia Molecular
Apesar da estrutura do DNA ter sido desvendada em 1953, a informao nela contida no podia ser
lida
Foi como tivssemos descoberto o alfabeto utilizado para escrever o livro da vida, mas as
palavras desse livro estavam com letrinhas to pequenas que no conseguamos l-las
Foi preciso esperar at fins da dcada de 1980 para que aparecesse uma lente de aumento
suficientemente boa que permitisse a leitura dessas letrinhas em grande quantidade

E assim nasceu a bioinformtica,


A computao
Computadores sendo capazes de armazenar cada vez mais informao, de process-la de modo cada
vez mais rpido, a um custo cada vez menor
Na dcada de 1970 a unidade bsica de armazenamento de informao era o kilobyte -- 1000 bytes,
aproximadamente 1000 letras
Um computador de grande porte daquela poca tinha alguns kbytes de memria
Com tal memria um computador desses no seria capaz de processar nem sequer o genoma de um
vrus, que pode chegar a 20 kilobases, ou 20 mil letrinhas; que dir o genoma humano, com seus 3
bilhes de letrinhas

Primeiro _ problema
chamado de problema
biotecnolgico

Montagem do DNA

Segunda _ diz respeito


natureza da biologia molecular

Saber que informao est


contida nos genomas

Montagem
de DNA

Limitao
tecnolgica
atual

Montagem de DNA
Um genoma de bactria tem em geral 3 ou 4 milhes de letrinhas ou bases
As mquinas seqenciadoras conseguem ler apenas pedaos de cerca de 1000 bases
Ento como possvel ler um livro de 3 ou 4 milhes de letras se s conseguimos ler
fragmentos de 1000 letras?
A soluo gerar uma enorme quantidade de fragmentos que tenham sobreposio
entre si
Para ler 3 ou 4 milhes so necessrios cerca de 100 mil desses fragmentos
necessrio um programa de computador para montar esse quebra cabea

necessario um computador que consiga ler diretamente as 3 ou 4 milhes de bases


Existem dezenas ou centenas de outros problemas na bioinformtica, cada um deles
motivado por uma particular tecnologia

Que problemas so esses? So basicamente de dois tipos


Primeiro- temos a interpretao do DNA como uma linguagem, a linguagem dos genes
Segundo- entender os efeitos da informao gentica

Os genomas contm informao


Por exemplo:
Para diferentes espcies de organismos e para diferentes indivduos de uma espcie,
particularmente a nossa. Essa interpretao requer mtodos, tcnicas, algoritmos que
vm principalmente da informtica, pois afinal ela a cincia da informao
Dar sentido a essa sopa tarefa dos bioinformatas

Algumas Definies
Pesquisa e desenvolvimento de ferramentas computacionais, matemticas
e estatsticas para a resoluo de problemas da Biologia
Biologia Molecular
Nmero de definies Nmero de bioinformatas
Muitos tem sua prpria definio de Bioinformtica, com detalhes sutis
para refletir seu interesse em Cincias Biolgicas

A Computao est para a Biologia da mesma forma que a matemtica est para fsica
Harold Morowitz

Uma combinao de Cincia da Computao, Tecnologia da Informao e Gentica para determinar e


analisar informao gentica
Bits Journal - Bioinformatics: Information Technology & Systems

nfase est se deslocando progressivamente do acmulo de dados para a sua interpretao

Com os sequenciamentos realizados, um grande volume de dados tem sido gerado

Esses dados precisam agora ser analisados

Anlise laboratorial difcil e cara

Ferramentas computacionais sofisticadas so necessrias para a anlise dos dados obtidos

Para muitas dessas anlises,


as ferramentas computacionais
precisam lidar com dados
imprecisos e ruidosos
Tcnicas de laboratrio de Biologia
Molecular quase sempre geram dados
com erros ou imprecises
Erros na coleta de dados
Erros na construo de bases de
dados

Aprendizado de Mquina
Fornece tcnicas para lidar com os problemas acima

ATCTCGTAGCT
ATCTCGTAGCTA
A
ATCTCGTAGCTAG
ATCTCGTAGCT
G
ATCTCGTAGCT
ATCTCGTAGCTAGC
C
ATCTCGTAGCT
ATCTCGTAGCTAGCT
T
ATCTCGTAGCT
ATCTCGTAGCTAGCTA
A
ATCTCGTAGCT
ATCTCGTAGCTAGCTAC
C
ATCTCGTAGCT
ATCTCGTAGCTAGCTACG
G
ATCTCGTAGCT
ATCTCGTAGCTAGCTACGA
A
ATCTCGTAGCT
ATCTCGTAGCTAGCTACGAC
C
ATCTCGTAGCT
G
ATCTCGTAGCTAGCTACGACG
ATCTCGTAGCT
T
ATCTCGTAGCTAGCTACGACGT
C
ATCTCGTAGCT
ATCTCGTAGCTAGCTACGACGTC
T
ATCTCGTAGCT
ATCTCGTAGCTAGCTACGACGTCT
A
ATCTCGTAGCT
ATCTCGTAGCTAGCTACGACGTCTA
TAGAGCATCGATCGATGCTGCAGATGATGCTAGCATCGGCTAGGCGACG

15 milhes

Europeu

Japons

http://www.youtube.com/watch?v=xYDBZdy1WNE

Você também pode gostar