Você está na página 1de 35

Sequenciamento de genoma e transcriptomas

Durante dcadas o mtodo de Sanger foi praticamente a nica opo utilizada para sequenciamento de DNA Nos ltimos anos surgiram novas tecnologias de sequenciamento em larga escala que foram denominadas como Next-Generation Sequencing (NGS)

Next Generation sequencing


Apesar de serem apresentadas como um conjunto as varias tecnologias que fazem parte do NGS apresentam principio bem diferentes

Em comum elas tem a paralelizao de diversos processos levando a analise simultnea de milhares de molculas : Sanger ~104 nucleotdeos sequenciados/corrida, NGS ~108-10 nucleotdeos sequenciados/corrida

Estratgias para captura de DNA

2 tipos principais de estratgias:

1- Amplificao clonal: utilizao de PCR em emulso ou amplificao em fase solida


2- deteco a partir de uma nica molcula: Imobilizao de molculas em um suporte solido

Mtodos de sequencamento
Diferentes mtodos podem ser utilizados para o sequenciamento das molculas de DNA: -Terminao ciclo-reversivel -Sequenciamento por ligao -pirosequenciamento -Sequenciamento em tempo real

Terminao ciclo reversvel Adio de nucleotdeos bloqueados ligados a molculas florescentes Desbloqueio de nucleotdeo permite sucessivos ciclos

Sequenciamento por ligao Sondas ligadas a molculas fluorescentes fluorescentes reconhecem 2 bases por ciclo. Necessidade de diversos ciclos de ligao para sequenciar molcula

Pirosequenciamento Reao luminescente acoplada a incorporao de nucleotdeos Sinal fluorescente proporcional ao numero de nucleotdeos incorporados

Sequenciamento em tempo real Nucleotdeos acoplados a molculas fluorescentes ligados a quenchers, somente quando ocorre incorporao h deteco de fluorescncia

Por que seqenciar genomas?


O seqenciamento de genomas o primeiro passo para obter uma descrio completa da composio molecular de cada organismo, pois todas informaes necessria para construo esto presentes no DNA genmico (Entretanto a interpretao estas informaes ainda um problema) Comparao de genomas de diversos indivduos permitira correlacionar caractersticas e sndromes com mutaes de determinados locus do genoma (mesmo que no tenhamos idia da funo deste locus)
Comparaes entre genomas de espcies prximas permite o melhor entendimento dos mecanismos de evoluo de genomas Um melhor conhecimento do genoma permite com que manipulemos este com maior facilidade

Tamanho de genomas

possvel notar que no h uma correlao direta entre tamanho do genoma e complexidade do organismo

Seqenciamento de genomas
Genomas possuem grande numero de bases em seu genoma (105 a 1012) e ate o momento as tcnicas existentes de seqenciamento conseguem amostrar apenas algumas centenas de bases por reao. Deste modo, o genoma tem que ser seqenciado de forma descontinua com milhares de reaes sendo realizadas em paralelo para obteno da informao necessria Isto gera uma grande quantidade de seqncias derivadas do genoma que se apresentam de forma desconexa, visto que no existe nenhuma propriedade intrnseca que permite a ordenao inequvoca destas Deste modo um dos grandes desafio ao seqenciar genomas a montagem destas sequencias de modo que elas possam reproduzir a ordenao encontrada nos cromossomos

Seqenciamento de DNA por fragmentao


Esquematizao da estratgia bsica de seqenciamento de genomas

Quebra do DNA pode ser feita com enzimas de restrio ou via nebulizao Clonagem de fragmentos com tamanho aproximado conhecido importante para a posterior montagem das seqncias

Estratgias de seqenciamento de genomas


Existem duas estratgias bsicas de sequenciamento de genomas : Seqenciamento de clones- DNA cortado em fragmentos grandes (utilizando enzimas de restrio) e clonado em BACs (Cromossomo Artificial de Bactria), que aceitam fragmentos de at ~200 mil bases

Aps isso so selecionados clones que so separadamente cortados (por nebulizao) e sub-clonados em plamideos. Seqenciamento destes sub-clones permitir a reconstituio do clone do BAC
Apesar te ter sido a tcnica de referencia no inicio de sequenciamento de genomas, no mais utilizada com freqncia.

Estratgias de seqenciamento de genomas


Whole Genome Shotgun (WGS)- O genoma inteiro picotado em pedaos de alguns poucos milhares de pares de bases (por nebulizao) e clonado em plasmideos. So realizada clonagens de fragmentos maiores em vetores apropriados (BACs, Fosmideos, etc..) mas somente as pontas so seqenciadas. Seqenciamento das duas extremidade de cada clone realizada e utilizando a informao de seqncia e a estimativa de distancia entre as duas pontas do clone busca-se montar o genoma inteiro
Aps a montagem das seqncias obteremos pedaos que so denominados contigs, no melhor cenrio cada contig deveria representar um cromossomo, mas normalmente o que ocorre a formao de mais de 1 contig por cromossomo devido a regies que apresentam problemas e que no so montadas de modo apropriado

Cobertura de sequenciamento

Devido ao carter randmico de seqenciamento utilizando a tcnica de WGS necessrio seqenciar uma quantidade de bases muito maior do que o numero de bases do genoma (pelo menos 8X mais) devido a redundncia do sequenciamento

Problemas na montagem do DNA


Devido ao alto numero de seqncias repetitivas existe uma alta probabilidade que duas seqncias no contiguas mas que possuam a mesma repetio em sua extremidade possam ser sobrepostas na montagem

Par evitar isso em adio ao algoritmo de alinhamento de DNA utiliza-se a informao de distancia entre as seqncias das pontas de cada clone na montagem do genoma

Montagem do esqueleto do genoma


Apesar de idealmente ser possvel a composio de um nico contig por cromossomo, no isso que ocorre de fato, devido a presena de sequncias repetitivas, regies no clonaveis, etc..
Devido a isso, a analise resultar em diversos contigs por cromossomos. Apesar de no ser possvel sobrepor estas sequencias para obter um contig nico possvel orden-las e estimar a distancia entre elas a fim de produzir um esqueleto do cromossomo. As tcnicas de FISH e mapeamento por segregao so muito utilizadas para esta finalidade.

Mapeamento fsico de seqncias por FISH


Um vez que obtemos os contigs importante a determinao da regio de que cromossomo esta seqncia localizada Para isso utiliza-se uma tcnica de hibridizao em cromossomos (FISH), que utiliza uma sonda que represente uma regio nica no genoma que esteja representada no contig de interesse, o resultado mostrar a regio de qual cromossomo esta seqncia se localiza

Com esta informao possvel utilizar os contig para montar um esqueleto de cada cromossomo.

Mapeamento de sequencias por segregao


Construdo a partir das taxas de recombinao meitica (crossing-over) de marcadores no genoma

Centimorgan- probabilidade de 1% que dois genes se separem em evento de mitose.

Analise de genomas
Uma vez que obtemos a sequncia extensiva do genoma de um organismo possvel analis-la com o intuito de obter uma maior compreenso sobre a informao contida no mesmo.
No entanto tal analise no trivial devido a composio e organizao de genomas.

Complexidade de genomas
Experimentos de cintica de reassociao permitem obter uma estimativa da complexidade de cada genoma De modo geral genomas de eucariotos possuem uma grande frao de regies repetitivas

Complexidade de genomas
Experimentos utilizado pequena quantidade de molculas de mRNA permitem ver que a maior frao do que expresso pela clula provem de regies no repetitivas
Este experimentos permitem deduzir que o DNA composto em grande parte por elementos repetitivos, mas os RNAs so transcritos principalmente de regies no-repetitivas.

Complexidade de genomas
A presena destas regies repetitivas explica em parte porque o tamanho dos genomas no proporcional a complexidade do organismo visto que uma serie de organismos menos completos possuem uma alta quantidade de DNA repetitivo. Este DNA repetitivo no possui uma funo clara e por isso muitas vezes referido como junk DNA

Correlao entre o genoma e a complexidade de organismos


possvel notar um tendncia de organismos mais complexos possurem genes com um maior numero de exons.

Seqenciamento de transcriptomas
Conforme mostrado no slide anterior organismos mais complexos tendem a possuir genes com um alto numero de exons. Alm disso, o genoma destes organismos possuem uma alta quantidade de seqncias nocodificantes e portanto a predio da estrutura de genes no trivial.
Deste modo o seqenciamento direto das molculas de mRNA pode fornecer informaes a respeito da estrutura de um gene, pois representa a molcula madura formada aps os eventos de splicing Alm disso, o seqenciamento de mRNA permite a amostragem direta das seqncias codificantes permitindo com que um menor volume de seqenciamento se obtenha maior informaes sobre as protenas deste organismo

Seqenciamento de transcriptomas
Aps o isolamento das molculas de mRNA realizada a reao de transcriptase reversa que ir gerar um fita de cDNA a partir de um mRNA molde.
Normalmente esta transcrio realizada com um oligo-dT como primer o que permite com que o mRNA interio seja transcrito Os cDNA produzidos so clonados e o conjunto de plasmideos produzidos denominado biblioteca

Seqenciamento de transcriptomas
Entretanto a abundancia de diferente mRNAs em uma clula varia muito. Existem alguns poucos mRNAs que possuem um numero de molculas at 1000 X maior que a maioria dos mRNAs.
Deste modo, seqenciamentos de bibliotecas de mRNAs tendem a amostrar muito umas poucas molculas e pouco um conjunto grande Alm disso, nem todos os mRNA vo estar sendo expressos em um nico tecido ou fase de vida do organismo e por isso para obter uma descrio completa dos mRNAs de um organismos vrios destes devero se amostrados

Utilizao de sequncias de RNA para identificao de genes


Devido ao fato das sequncias de RNA serem derivadas de sequncias genomicas possvel utilizar ferramentas de alinhamento para deduzir a origem da sequncia de RNA. Com isso possvel definir a estrutura de introns e exons de um gene.

Splicing alternativo

Seqenciamento de transcritos permite a deduo de eventos de splicing alternativo a partir do mapeamento deste nas seqncias de DNA genomico

Spidey
Programa de mapeamento de seqncias de mRNA em pores de DNA genmico Possui vantagens em relao a alinhamento no blast2sequences pois o programa busca os stios de splicing e permite apenas um alinhamento por regio do RNA, alem disso o seu algoritimo busca evitar o alinhamento em pores do gene em pseudogenes ou copias do gene adjacentes a este

Spidey

Spidey

Spidey
Exemplo de alinhamento de um exon

Você também pode gostar