Você está na página 1de 21

A SEQUENCIAO EM ANLISES CLINICAS

Prof. Doutor Jos Cabeda

ndice

1.

Mtodos para a sequenciao de fragmentos de DNA ............................................. 2 1.1. 1.2. O mtodo de sequenciao qumica ................................................................. 2 O mtodo de sequenciao de Sanger .............................................................. 2 Clonagem dos fragmentos a sequenciar ................................................... 4 Os terminadores ........................................................................................ 5

1.2.1. 1.2.2. 1.3. 1.4. 1.5. 1.6. 2.

A resoluo dos produtos da reaco de sequenciao .................................... 6 A sequenciao directa por PCR ...................................................................... 8 O sequenciador ABI 310 .................................................................................. 9 Vantagens e limitaes da sequenciao em anlises clnicas ....................... 15

A sequenciao do genoma Humano ...................................................................... 16 2.1. Estratgias para a sequenciao do genoma Humano .................................... 16 O consrcio Pblico: Estratgia do mapeamento ................................... 16 A celera genomics: Estratgia do Whole genome shot-gun................ 19

2.1.1. 2.1.2. 2.2.

Estratgias para a identificao de genes na sequncia do genoma Humano . 20 recurso identificao de genes ortlogos ............................................. 20 Identificao de sequncias conservadas entre espcies ........................ 20 Identificao de zonas de elevada densidade com sequncias consenso para caixas promotoras/enhancers .......................................................... 21

2.2.1. 2.2.2. 2.2.3.

2.2.4.

O mapa de EST....................................................................................... 21

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

1. Mtodos para a sequenciao de fragmentos de DNA


1.1. O mtodo de sequenciao qumica

O mtodo de sequenciao de Maxam-Gilbert utiliza um processo de degradao qumica para cortar o DNA em pontos especficos, produzindo fragmentos de DNA de diversos tamanhos. Os fragmentos assim produzidos so ento separados em gel, o que permite pela determinao do seu tamanho determinar o nucletido que s e encontra em cada posio da sequncia a analisar. Apesar de totalmente automatizado, e da modificao introduzida com a sequenciao multiplex (que permite analisar cerca de 40 clones por gel), este mtodo muito menos utilizado que o mtodo enzimtico (sequenciao de Sanger ou mtodo de sequenciao didesoxi).

1.2.

O mtodo de sequenciao de Sanger

O mtodo original de Sanger para a sequenciao de cidos nucleicos um mtodo enzimtico, utilizando uma reaco simples de polimerizao. Por este motivo, e porque nenhuma polimerase inicia o seu trabalho se no tiver disponvel uma extremidade 3

Fig. 1

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

livre, necessrio para a utilizao deste mtodo ter algum conhecimento da sequncia da extremidade 5 da zona a sequenciar. Com este conhecimento assim possvel desenhar um primer complementar da cadeia a sequenciar, que por hibridizao com esta vai fornecer a necessria extremidade 3 livre. De seguida a reaco prossegue, incorporando nucletidos at que o nucletido incorporado seja um terminador (ver seco frente).

Fig. 2 -

Como na reaco original de Sanger, era efectuado apenas um ciclo de polimerizao, era necessrio garantir uma elevada quantidade de DNA molde, bem como uma grande sensibilidade de deteco dos produtos da reaco. Assim, os nucletidos utilizados eram frequentemente radioactivos, o que aumentava a sensibilidade de deteco dos produtos da reaco. Por outro lado, o aumento da concentrao do DNA molde era assegurado com um passo inicial de clonagem dos fragmentos a sequenciar.

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

1.2.1. Clonagem dos fragmentos a sequenciar

A clonagem dos fragmentos a sequenciar era no perodo pr-PCR a nica forma de garantir, por um lado a especificidade do material a sequenciar, e por outro a existncia de uma amplificao do material gentico antes da reaco de sequenciao. Para clonar o material gentico, este era inicialmente fragmentado (por sonicao, ou mais frequentemente com recurso a reaces de restrio), separado em gel, purificado, e inserido em vectores de sequenciao. Estes no eram mais que plasmdeos ou DNA de fagos, alterados geneticamente, por forma a possurem locais de ligao, e genes de seleco. Os locais de ligao serviam para efectuar o posicionamento do material a sequenciar de forma ordenada e precisa, habitualmente por recurso a reaces de restrio do vector, seguida de incubao com o DNA a sequenciar (insert), seguido de uma reaco de ligase. O vector assim produzido era ento inserido em bactrias. Estas eram cultivadas, habitualmente na presena de antibiticos, o que apenas permitia o crescimento das bactrias que possussem o plasmdeo, j que um dos genes de seleco deste era um gene de resistncia ao antibitico utilizado. Um segundo gene de seleco frequentemente utilizado permitia s colnias bacterianas que tinham incorporado plasmdeo com o insert apresentar cor diferente das colnias cujo plasmdeo no possua insert. O conjunto de colnias obtido era chamado de biblioteca genmica, e destas colnias eram escolhidas algumas para serem sequenciadas. As colnias escolhidas eram ento colocadas em meios lquidos de cultura bacteriana contendo o antibitico anteriormente referido, o que permitia o crescimento exponencial das bactrias, e consequentemente a multiplicao do plasmdeo com o insert. No final da cultura, as bactrias eram utilizadas para purificar o plasmdeo, e deste retirar o insert. Como j foi referido, a sequenciao pelo mtodo de Sanger exige a utilizao de um primer (iniciador), o qual s passvel de ser desenhado quando se conhece a sequncia do DNA alvo. Obviamente que esta situao cria um dilema tipo ovo-galinha (s se pode sequenciar aquilo de que j se conhece a sequncia), a qual no entanto ultrapassvel com recurso ao vector de clonagem. Com efeito, prximo do local de clonagem do insert, o plasmdeo foi alterado por forma a possuir uma sequncia conservada contra a qual pode ser desenhado um primer. No entanto, para utilizar este primer, necessrio que a remoo do insert se faa por forma a que esta sequncia seja 4

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

conservada junto ao insert, o que se faz recorrendo a uma enzima de restrio diferente da inicialmente utilizada. Deste modo, a sequenciao precedida de clonagem tem ainda a vantagem de poder ser realizada, mesmo quando o DNA alvo no possui uma sequncia conhecida.

1.2.2.
Os

Os terminadores
habitualmente enquanto utilizados os na na polimerizao polimerizao de do DNA RNA so so

nucletidos

desoxirribonucletidos,

utilizados

ribonucletidos. O que distingue estes dois tipos de nucletidos a existncia no carbono 2 da ribose de um grupo OH que no existe na desoxirribose (Fig.3). No entanto em ambos os nucletidos existe um grupo OH no carbono 3 (fig. 3). Este grupo hidroxilo (OH) essencial para que os nucletidos possam formar uma ponte fosfodiester com o nucletido seguinte (fig 4), pelo que a remoo deste grupo torna o respectivo nucletido (um didesoxirribonucletido ou ddNTP) um terminador muito eficaz, j que, na incorporao de nucletidos, a polimerase no detecta esta subtil mas decisiva alterao qumica.

Fig.3 -

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

Fig. 4 -

1.3.

A resoluo dos produtos da reaco de sequenciao

Os produtos da reaco de sequenciao de Sanger necessitam ento de ser resolvidos segundo o seu peso molecular em geis de grande resoluo (habitualmente geis de acrilamida). Se em cada reaco de sequenciao for apenas incorporado uma espcie de terminador, cada reaco pode servir como revelador da posio em que aparece o respectivo nucletido. A electroforese em paralelo das 4 reaces irms de sequenciao permite ento obter um gel de sequenciao clssico, que se l seguindo os produtos com peso molecular sucessivamente crescente (Fig. 5). Fig. 5 -

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

Com o intuito de facilitar a leitura dos geis de sequenciao, tornando ao mesmo tempo mais precisas as diferenas de migrao em gel, pretendeu-se incorporar todas as quatro reaces de sequenciao numa s, utilizando para isso terminadores modificados. A modificao adicional consiste na marcao de cada espcie de terminador com um fluorocromo, o que permite que cada produto de PCR especfico emita luz num comprimento de onda bem determinado, e diferente dos demais. Foi assim possvel efectuar todas as reaces num s tubo, correndo todos os produtos numa s lane do gel (Fig. 6), ainda que a leitura dos geis necessite agora de equipamentos especficos capazes de analisar os comprimentos de onda emitidos.

Fig. 5 -

Fig. 6 -

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

1.4.

A sequenciao directa por PCR

O advento do PCR veio permitir a simplificao substancial da sequenciao habitualmente utilizada num laboratrio de rotina. Com efeito, ao contrrio do que ocorre num laboratrio de investigao, a rotina diagnstica no lida frequentemente com sequncias totalmente desconhecidas, j que habitualmente procura apenas detectar mutaes/polimorfismos em genes ou loci previamente bem estudados. Assim, possvel na esmagadora maioria dos casos saltar todos os passos da clonagem, e estabelecimento de bibliotecas genmicas, j que quer a amplificao do material gentico quer a especificidade do produto a sequenciar podem ser conseguidas com recurso a uma reaco de PCR convencional. Desta forma, a sequenciao directa inicia-se com um PCR que amplifica o gene/loci alvo com recurso a primers especficos e previamente escolhidos. A este PCR chamamos PCR simtrico, porque amplifica de igual modo ambas as cadeias do dsDNA original. De seguida, o DNA de novo submetido a 2 novas reaces de PCR em paralelo. Em cada uma destas reaces utilizado apenas um dos primers iniciais, o que faz com que em cada reaco seja amplificado apenas uma das duas cadeias do DNA alvo. Por este motivo este PCR denominado de PCR assimtrico. O PCR assimtrico consiste ele prprio na reaco de sequenciao de Sanger. Por este motivo, a mistura de reaco necessita de possuir os terminadores (ddNTP) ainda que em menor concentrao que os nucletidos normais. Uma vantagem adicional para a utilizao do mtodo da sequenciao directa consiste no facto de a reaco de sequenciao ser ela prpria tambm uma reaco de PCR, o que aumenta muito a quantidade de produto final a ser detectado por electroforese.

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

1.5.

O sequenciador ABI 310

Os produtos da reaco de sequenciao devem ento ser resolvidos em funo do seu tamanho por electroforese. Se tradicionalmente a electroforese vertical em geis de acrilamida era o mtodo de eleio, na ltima dcada, a electroforese capilar tem-se tornado gradualmente tcnica de eleio. As suas vantagens consistem na maior

resoluo, reprodutibilidade, capacidade de automatizao, bem como numa menor exigncia tecnolgica ao nvel dos detectores. O principal problema consiste num habitualmente menor nvel de paralelismo, j que os equipamentos de electroforese

Fig. 7 -

capilar com capacidade para processarem mais que uma amostra em simultneo so consideravelmente mais caros (mas existem, e so utilizados em alguns laboratrios de anlises clnicas de rotina como os de medicina forense!). De longe, o equipamento de electroforese capilar mais utilizado para resolver os produtos de uma reaco de sequenciao o ABI 310 (Fig. 7), pelo que vamos deternos um pouco sobre o seu princpio de funcionamento.

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

O ABI 310 um aparelho de electroforese capilar cujos componentes por questes de segurana (as diferenas de potencial aplicadas so da ordem das dezenas de milhar de volts) se encontram encerrados no interior de 2 portas com janelas (Fig. 7). A abertura das portas (Fig 7 B), permite encontrar vrios componentes. Do lado direito em baixo, podemos visualizar o suporte das amostras (Fig. 8). Por cima deste fica o suporte

Fig. 8 -

trmico para o capilar (Fig. 8), o qual possui tambm uma porta que quando se abre expe o capilar encostado a uma placa de cermica (Fig. 9) que assegurar durante a electroforese a manuteno da temperatura nos nveis programados. esquerda do suporte trmico do capilar encontra-se o suporte da seringa com polmero (Fig. 8), a qual ser utilizada para encher o capilar antes e durante a electroforese. Por baixo da seringa encontramos o bloco de vlvulas, o qual controla o sentido do enchimento com o polmero e liga e desliga a aplicao da diferena de potencial nos momentos programados. O nodo encontra-se aplicado ao tubo com tampo de electroforese, o qual se encontra na extremidade esquerda inferior do bloco de vlvulas (Fig. 8).

10

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

Fig. 9 -

Na extremidade inferior esquerda do suporte trmico do capilar encontra-se a janela de deteco (Fig.9), cuja porta abrindo-se expe a janela transparente do capilar, alinhada com a lente que foca neste a fonte de luz de excitao, e recolhe a emisso de fluorescncia (Fig. 10). Fig. 10 -

11

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

O funcionamento do aparelho consiste ento em : 1) Fazer a montagem do equipamento, nomeadamente do capilar, amostras, tubos suplementares com gua e tampo de electroforese, encher o capilar com polmero, assegurar que no existem bolhas de ar no sistema, e colocar o tampo de electroforese no nodo. 2) Programar num computador a posio (no suporte) de cada amostra, o tipo de polmero e de terminadores utilizados, bem como as condies de electroforese a aplicar. Uma vez terminada a programao, o software controla de modo automtico todo o processo, o qual consiste em: a. O aparelho estabiliza a temperatura do capilar ao valor programado b. Injeco da amostra: consiste na colocao de uma amostra na extremidade do ctodo do capilar, aps o que aplicada uma diferena de potencial, que impele o DNA a entrar no capilar. c. Electroforese: O aparelho interrompe a diferena de potencial, retira a extremidade do capilar do tubo da amostra e lava-a num tubo com gua. De seguida coloca esta extremidade do capilar num tubo com tampo de electroforese e reaplica uma diferena de potencial programada. Durante toda a corrida, o aparelho indica o que est a realizar (Figura 11),

Fig.11 -

12

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

permitindo ao operador acompanhar as vrias fases da electroforese. d. Leitura: Durante a electroforese, o aparelho regista a intensidade de fluorescncia que detectada na janela de leitura para cada um dos canais correspondentes aos terminadores utilizados (figura 12).

Fig. 12 e. No final da electroforese de cada amostra, o processo repetido at no existirem mais amostras a analisar no suporte. f. Anlise: No final do processo, os ficheiros com os dados recolhidos so analisados por um programa que: i. Corrige as diferenas de mobilidade apresentadas devido aos terminadores utilizados ii. Corrige a sobreposio de espectros referente aos fluorocromos acoplados a cada terminador iii. Compara as curvas obtidas, inferindo a sequncia de nucletidos iv. O operador pode (e deve) ainda observar as curvas resultantes (cromatogramas; figura 13), e corrigir eventuais erros na atribuio da sequncia. Por vezes necessrio pedir ao programa para reanalisar os dados utilizando configuraes diferentes, que o operador considere mais adequadas amostra em questo

13

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

Fig.13 -

A utilizao do ABI 310 (ou de qualquer um dos modelos posteriores) para sequenciao, ainda facilitada pela disponibilidade comercial de kits (Fig. 14) e consumveis (Fig. 15) prontos a usar, com protocolos padronizados, e de utilizao relativamente fcil.

Fig. 14 -

Fig. 15 -

14

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

1.6.

Vantagens e limitaes da sequenciao em anlises

clnicas
A utilizao da sequenciao em anlises clnicas apresenta como principal vantagem a identificao inequvoca da existncia de uma mutao/polimorfismo associada a um dado perfil clnico (fentipo). No entanto, necessrio ter presente que no habitualmente razovel (em anlises clnicas) utilizar a sequenciao nas seguintes situaes: 1) Situaes em que o diagnstico tem carcter urgente 2) Situaes em que a informao clnica no permite ter uma ideia precisa de qual o(s) gene(s) em que provvel encontrar a mutao 3) Situaes em que o nmero de genes candidatos muito elevado 4) Situaes em que o(s) gene(s) candidato possui um locus de elevado tamanho e no h uma concentrao habitual das mutaes numa zona do gene. Por outro lado convm ter sempre presente que o tempo de execuo desta tcnica, apesar de j muito reduzido em comparao com o que era possvel h 10 anos, consideravelmente superior ao necessrio para um diagnstico baseado em Real-TimePCR. Convm ainda ter presente, que a identificao de uma alterao gentica num indivduo com uma dada patologia, no associa de imediato essa alterao como causadora do fentipo clnico. Em todos os casos, necessrio estabelecer a natureza da mutao (polimorfismo ou mutao; causadora de alterao proteica ou no; causadora de alterao reguladora do gene ou no; perturbadora dos mecanismos de splicing ou no), bem como estudar a sua ocorrncia ou no numa populao normal, sem os mesmos sinais clnicos. Em suma, a identificao de uma alterao gentica apenas o incio, servindo para justificar a existncia de estudos funcionais. Ressalva-se obviamente desta situao a descoberta de alteraes que j tenham sido previamente identificadas e caracterizadas noutros doentes.

15

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

2. A sequenciao do genoma Humano


2.1. Estratgias para a sequenciao do genoma Humano
2.1.1. O consrcio Pblico: Estratgia do mapeamento

Quando se fala de um mapa do genoma humano, fala-se de realidades que podem ser bastante diversas. A definio original de um mapa do genoma refere-se identificao da posio de marcadores genticos em intervalos to pequenos quanto possvel, ao longo de todo o genoma. Este tipo de mapa tem o intuito de facilitar a identificao da zona do genoma envolvida numa dada doena em estudo. A razo para a utilizao de um mapa deste tipo prende-se com o facto de por crossing-over os marcadores tenderem a recombinar entre si. No entanto, como o crossing-over entre dois loci to mais provvel quanto mais distantes eles se encontrarem um do outro, a frequncia de recombinao entre dois marcadores pode ser utilizada para inferir a sua distncia. Assim, se considerarmos um fentipo clnico como estando associado a um locus gentico desconhecido, a determinao da frequncia com que este hipottico locus se recombina com loci de posio conhecida permite delimitar uma zona do genoma o nde existe maior probabilidade de se encontrar um gene responsvel pela caracterstica clnica em estudo. Estes mapas foram os primeiros a ser desenvolvidos, chamam-se mapas genticos, e procuram ter uma resoluo de aproximadamente 2 Mb (milhes de pares de bases) ou 2 cM (centimorgan; 1 cM corresponde distncia a que se encontram dois loci que recombinam em 1% dos cruzamentos e equivale aproximadamente a 1 Mb). Note-se que num mapa gentico, a localizao do marcador num cromossoma muitas vezes desconhecida, apenas se conhecendo a posio relativa (distncia) entre os vrios marcadores. O mapa gentico pode ser refinado, utilizando tecnologia do DNA recombinante (tcnicas de engenharia gentica). Para esse efeito so produzidos mutantes contendo cromossomas fragmentados por radiao, os quais so depois mantidos por fuso com outras clulas. A determinao de que marcadores permanecem juntos aps a fragmentao permitiu acelerar o processo de mapeamento, bem como obter maior resoluo no mapa gentico. Um outro tipo de mapa, com uma resoluo pretendida da ordem dos 0,1 Mb (ou 100Kb) o mapa fsico. Os mapas fsicos acrescentam relativamente ao mapa gentico

16

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

a informao da localizao do marcador num cromossoma, e em que zona do cromossoma. Obviamente que o mapa fsico de menor resoluo o mapa citogentico ou cromossmico, o qual se baseia na identificao de um padro especfico de bandas cromossmicas aps um tratamento com determinados agentes. Um mapa de cDNA indica a localizao de exes no mapa cromossmico. Um mapa de cosmdeos indica em que zona de que cromossoma se localiza cada um dos fragmentos genmicos clonados em cosmdeos, bem como a sua sobreposio macrorestrio relativa (fig.16). Um mapa de

indica em que zonas de cada

cromossoma uma dada enzima de restrio reconhece o DNA e o fragmenta (forosamente enzimas com um baixo nmero de locais de corte, da o chamar-se macrorestrio). Obviamente, o mapa fsico de maior resoluo a Fig. 16 sequncia completa dos nucletidos em cada

cromossoma (resoluo de 1bp). A estratgia de sequenciao do consrcio pblico que na ltima dcada do sculo XX iniciou o programa de sequenciao do Genoma Humano consistiu em primeiro obter um mapa fsico do genoma ao nvel de cosmdeos, e de subclones destes cosmdeos. Desta forma, esperava-se que o processo de atribuio da ordem de encaixe das sequncias parcelares obtidas fosse mais fcil e mais fidedigno. A estratgia consistiu ento em definir um mapa fsico para um conjunto cromossomas artificiais de levedura (YAC) depois de definir um conjunto mnimo destes clones, subdividir cada clone em sub-clones com sobreposies entre si, clon-los em cromossomas artificiais de bactrias (BAC) contendo cerca de 200000 bp, e mape-los e assim sucessivamente utilizando cosmdeos (40000 bp) e plasmdeos (2-10000 bp) at ter um mapa de clones em plasmdeos, suficientemente pequenos para que pudessem ser sequenciados individualmente (Fig. 17). Deste modo, o resultado da sequenciao de cada clone poderia ser utilizado para, atravs das sobreposies com os clones vizinhos definir uma sequncia contnua que resulte do alinhamento ordenado das sequncias parcelares (Fig. 18) Os resultados revelaram que esta estratgia produz de facto sequncias relativamente fceis de trabalhar e ordenar numa nica sequncia, mas tem o problema de constituir 17

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

um processo moroso e que depende da estabilidade de cada fragmento em YACs, BACs e plasmdeos.

Fig. 17 -

Fig.18 -

18

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

2.1.2. A celera genomics: Estratgia do Whole genome shot-gun


Como resposta grande morosidade do processo de clonagem, mapeamento, e subclonagem, foi desenvolvido um processo alternativo para fragmentos de DNA, o qual consiste em produzir fragmentos aleatrios da sequncia a estudar, e antes mesmo de os mapear, sequenci-los (Fig. 19). Aps a obteno das sequncias, o seu alinhamento numa sequncia contnua feita recorrendo a massivo poder computacional. Esta estratgia permite encurtar

substancialmente o tempo necessrio para obter uma sequncia, mas no assegura que: 1) que todo o DNA alvo tenha sido sequenciado 2) que seja possvel alinhar as sequncias parcelares consenso 3) Que a sequncia consenso tenha sido montada de forma correcta Fig. 19 Para obviar a estas dificuldades, esta numa nica sequncia

estratgia envolve a sequenciao de um nmero muito maior de fragmentos,

procurando assegurar que todo o DNA a estudar foi sequenciado 7 a 9 vezes. Deste modo aumenta-se a redundncia das sequncias parcelares, aumentando a probabilidade de que todo o DNA tenha sido sequenciado, e que a montagem final seja correcta. Esta estratgia foi inicialmente desenvolvida com vista a apressar a sequenciao do genoma, aplicando-a aos clones intermdios (cosmdeos), mas uma nova empresa (Celera Genomics) entretanto fundada com o apoio da Applied Biosystems, pretendeu aplicar esta estratgia a todo o genoma, fundando um plano paralelo de sequenciao do genoma humano, em concorrncia directa com o consrcio pblico. Este projecto, apesar do enorme desafio informtico que acarretava (o passo decisivo consistia na capacidade de formar sequncias contnuas com as sequncias parcelares), acabou por ter um enorme sucesso, devido aos enormes recursos informticos que o projecto congregou (a Celera Genomics possu hoje os

19

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

supercomputadores com mundo).

maior poder de clculo para uso no militar em todo o

2.2.

Estratgias para a identificao de genes na sequncia

do genoma Humano
A descodificao de um genoma, no fica nunca completa com a sequncia de nucletidos que compe cada cromossoma desse genoma, do mesmo modo que nenhum texto compreensvel se as palavras que o compem no tiverem sido identificadas e o seu significado for perceptvel. Na verdade, a sequncia de um genoma, na ausncia da identificao dos respectivos genes e elementos reguladores (sejam eles reguladores da transcrio gentica, da replicao, etc) equivale a possuir um livro escrito numa lngua completamente desconhecida. A informao existe, mas no convertvel em conhecimento, nem utilizvel para outros fins que no o armazenamento. Assim, o passo seguinte elaborao da sequncia de um genoma consiste em identificar os elementos funcionais desse genoma, e as suas funes respectivas. Para tal, existem tambm vrias estratgias complementares.

2.2.1. Recurso identificao de genes ortlogos


Uma vez que hoje em dia dispomos de informao parcelar sobre o genoma de um alargado leque de organismos biolgicos, essa informao (sequncia de genes com funes e elementos reguladores conhecidos) pode ser utilizada para procurar genes homlogos no meio da sopa de letras em que consiste um genoma sequenciado. Pode-se assim encontrar genes com elevada homologia entre espcies diferentes (genes ortlogos), e da deduzir a localizao de um novo gene no genoma sequenciado, bem como uma provvel organizao intro/exo, localizao de promotores e enhancers.

2.2.2. Identificao de sequncias conservadas entre espcies


A disponibilidade de sequncias genmicas quase completas para mais do que um organismo, e em alguns casos para organismos no mesmo ramo evolutivo (ex homemratinho), permite efectuar comparaes entre os genomas, por blocos e encontrar zonas que ao longo da escala evolutiva foram Fig. 20 conservadas com grande homologia. assim 20

A sequenciao em anlises clnicas

Prof. Doutor Jos Cabeda

possvel encontrar zonas genmicas com maior probabilidade de possurem genes.

2.2.3.

Identificao

de

zonas

de

elevada

densidade

com

sequncias consenso para caixas promotoras/enhancers

Fig. 21 -

Conhecem-se hoje sequncias consenso para vrios domnios de ligao a factores de transcrio, bem como sequncias que funcionam como enhancers. Como tanto uns como outros so elementos apenas teis na vizinhana de genes, a sua identificao permite tambm focar a ateno em zonas de maior probabilidade de ocorrncia de genes. Em particular, zonas onde se identificam vrias sequncias consenso para factores de transcrio so fortes candidatos existncia de genes.

2.2.4.

O mapa de EST

Os EST so Expressed sequence tags. Tratam-se de pequenas sequncias derivadas de cDNA (ou de DNA complementares de mRNA), as quais podem ser sequenciadas, marcadas e hibridizadas com os clones, permitindo construir um mapa de zonas de expresso genmica que provavelmente contm genes. De igual modo, as sequncias consenso derivadas dos EST podem ser utilizadas para procurar na sequncia total do genoma onde existem zonas para as quais foram encontrados EST, e que por isso devem conter genes.

21