Escolar Documentos
Profissional Documentos
Cultura Documentos
transcriptomas
Prof. Dr. Francisco Prosdocimi
As novas cincias MICAS
Genoma
Transcriptoma
Proteoma
Metaboloma
Fenoma, Lipidoma,
Glicoma, Interactoma,
Spliceoma, Kinoma,
etc.
Genomas e transcriptomas
O genoma nico
O transcriptoma modifica-
se espao-temporalmente
Quais genes esto ativos
num determinado instante
e condio?
Como isso influencia a
adaptao da clula ao
meio?
Proteoma
Montando o genoma da fbula
Abaixo temos uma Fbula Fabulosa do escritor Millr Fernandes que foi, assim
como um genoma, dividida em partes. Monte as partes e produza a seqncia
completa da fbula.
> Frase 1
edoria e calor que fazem os seres humanos - "mas eu no". MORAL DA HISTRIA:
NO MORRE A PASSARADA QUANDO MORRE UM PSSARO.
> Frase 2
ela no pde resistir e exclamou: "Mas, como, seu marido no morreu h cinco
anos?" "Sim, verdade" - respondeu ento a outra, cheia daquela compreenso,
sabed
> Frase 3
Quando a amiga lhe apresentou o garotinho lindo dizendo que era seu filho mais
novo, ela no pde resistir e exclamou: "Mas, com
> Frase 4
dade" - respondeu ento a outra, cheia daquela compreenso, sabedoria e calor
que fazem os seres humanos - "mas eu n
Montagem de genomas
Prof. Dr. Francisco Prosdocimi
Montando um quebra-cabeas
O problema da montagem
Genomas bacterianos normalmente tm o tamanho
medido em dezenas a centenas de quilobases (kb)
Genomas eucariticos tm o genoma medido em
Megabases (Mb) ou gigabases (Gb)
O genoma humano tem 3,1 Gb
Atravs do mtodo de Sanger normalmente produz-
se sequncias de 800bp
Digesto do vetor
Ligao para a produo
da molcula recombinante
Insero em bactria
Como sequenciar
o que no se sabe o que ?
Para sequenciarmos no
mtodo de Sanger,
precisamos utilizar um
primer complementar
extremidade 5 do que
desejamos sequenciar
Vetor de sequenciamento
Primer Universal
Forward e Reverse
Sequenciamento do inserto
desconhecido
Anlise dos Sequencing Reads
Leituras do sequenciamento
(cada uma das sequncias
produzidas)
Tipos de Reads que podemos
encontrar
Vetor + Inserto
Vetor + Inserto + Vetor
Vetor
sequncias repetitivas?
O clustering vai reunir partes
do genoma que no so Sequencing reads
contguas
Deve-se mascarar as
repeties e montar apenas as
partes do genoma sem
repeties
Reconstruo do genoma
Contigs + gaps
No esto presentes na
biblioteca de DNA
Portanto, no so
sequenciadas
Genome finishing
Primer walking consiste
numa tcnica de
fechamento de genomas
Primers so criados para a
realizao de uma PCR
que produzir a sequncia
dos gaps
E se a sequncia for
muito grande?
Montagem de BACs
BAC to BAC sequencing
Mated-pair sequencing
No se sequencia o inserto inteiro
Sequenciamento das extremidades do inserto
Montagem das sequncias das extremidades
Clonagem de insertos com tamanhos variados
(em diferentes tipos de vetores)
Gaps reais e virtuais
Gaps virtuais
Conhece-se o vetor que
contm os mated-pairs
Sabe-se o tamanho ao
qual ele corresponde
(tamanho do inserto)
Shotgun do vetor em
questo
Gaps reais
No se conhece nada
sobre este gap
Pode ter qualquer tamanho
Difcil soluo
Genome coverage
Cobertura do genoma
Antes de tentarmos montar
um genoma, precisamos ter
uma quantidade de bases
cerca de 8x maior do que o
genoma
Garante que havero poucos
gaps reais
Quanto maior a cobertura, menor o
Genoma Humano pblico nmero de contigs (significando que as
molculas foram montadas por
(2001): 2,9X coverage completo)
Identificao de gaps
reais e virtuais
Fechamento de gaps
Publicao do genoma
Montagem de
transcriptomas
Prof. Dr. Francisco Prosdocimi
Genoma X Transcriptoma
Sequenciando ESTs
Expressed Sequence Tags
Etiquetas de sequncias
expressas
O contedo da extremidade 5 da
EST, no entanto, varia devido:
Tamanho do mRNA
Tamanho do inserto clonado
Tamanho amplificado pela
transcriptase reversa
Formas de Splicing do gene
Caractersticas das ESTs
Representam o pool de mRNAs
Possuem de 150 a ~1000 nucleotdeos
Etiquetas de seqncias gnicas
Cada clone seqenciado uma nica vez
Apresentam redundncia
Permitem a identificao dos genes mais
expressos em diferentes fases/tecidos
Permitem a identificao de splicing
alternativo
Montagem dos genes
Contigs
Cada contig representa um
gene completo
A cobertura do contig depende
da expresso de cada gene
Genes muito expressos so
mais vistos
Genes singlets
Menor evidncia
Quantidade de ESTs
sequenciadas e saturao da
biblioteca :. Diminui a redundncia;
:. Aumenta o tamanho;
Sequncias nicas :. Aumenta a qualidade.
Cada uma um gene
Sequncias quimricas
Sequence clustering
Clculo da pontuao de sobreposio
Match / Mismatch / Gap scores
Minmatch (14) / Minscore (30)
Dja
vu?
Produo de ESTs e
ORESTEs
Seqnciamento de genes expressos:
Documentar a existncia de transcritos gnicos
num transcriptoma [otorrin... e ...damonh...]
Utilizao de enzima de
restrio do tipo III (corta
upstream ao stio de
reconhecimento) (NlaIII)
Produo e sequenciamento de
concatmeros
Bioinformtica SAGE
Extrao e contagem das tags
Algus transcritos no geram tags com certa enzima
Tags possuem 10bp ou 17bp (+4 restr. Site)
Mapeamento de tags a genes usando alinhamento de
sequncias (1 to N, N to 1)
Tags no unvocas; repeat regions
Erros de sequenciamento atrapalham a anlise
>SAGE-WT1-A0001-A01.abd 1047 ABI Short SAGE:
GGCAGTGAATTGTAATACGACTCACTATAGGGCGAAT Tag Freq MappedGenes
TGGGCCCTCTAATGCATGTTGACGTGCACTTCCGTAG
CCTCATGTTTTATGGAATCACCTATTATGCCATGACT GCAGACCATA 1451 AB666788, U18897
TTTTCAAAACTAGGCTGTGCCATGTTTACACAGTATG AACAGTTCCA 931 NM_789654
CACACATCTTCCATGGATGTGGACAGAAAATCCTCCA
ACATGATGGCAA GCCAACTCGG 2 NM_123587
CGTGCGGATT 1 NM_123587,
A tag em azul dever ser a o Y15324, P67473,
complemento reverso da sequncia.
MB12983
Microarray
Anlise comparativa da expresso gnica em
high-throughput