Você está na página 1de 46

Aplicação da

Biologia Molecular
no Diagnóstico
Laboratorial
Natália Gindri Fiorenza
Maria Paula de Souza Sampaio

Aula 04
Diretor Executivo
DAVID LIRA STEPHEN BARROS
Diretora Editorial
ANDRÉA CÉSAR PEDROSA
Projeto Gráfico
MANUELA CÉSAR ARRUDA
Autor
EDUARDO NASCIMENTO DE ARRUDA
Desenvolvedor
CAIO BENTO GOMES DOS SANTOS
Autoras
NATÁLIA FIORENZA
Olá. Meu nome é Natália Fiorenza. Sou formada em Ciências
Biológicas, com mestrado e doutorado na área de Ciências da Saúde.
Passei por diferentes laboratórios de pesquisa, publicando trabalhos
científicos e participando de muitos Congressos e Cursos em diferentes
áreas de saúde e educação. Fui professora universitária e tutora durante
4 anos do curso de medicina, onde me conectei com minha paixão pela
docência e por metodologias ativas de ensino. Sou ávida por aprender e
ensinar e por trocar conhecimentos quer na area científico-acadêmica,
quer na área de desenvolvimento humano e autoconhecimento. Recebi
com muita alegria o convite da Editora Telesapiens para integrar seu
elenco de autores independentes, pois tenho como propósito transmitir
aquilo que sei e auxiliar outras pessoas no início de sua jornada
profissional. Estarei com você nessa caminhada de muito estudo e
trabalho. Conte comigo!

MARIA PAULA SAMPAIO


Meu nome é Maria Paula, sou graduada em Biomedicina,
habilitada em Citopatologia. Além da prática com a minha habilitação,
pude realizar um curso avançado em Citopatologia Cérvico-Vaginal.
Atualmente, sou voluntária de um projeto de pesquisa na Fundação
Oswaldo Cruz (FIOCRUZ) sobre Patologia Mamária Comparada, onde fiz
iniciação científica por um ano. Em minha jornada de estudante pude
participar ativamente de congressos e projetos de estudo, e sempre
tive uma paixão por ensinar. Junto com Natália, pretendo transmitir todo
o ensinamento que obtive até aqui, buscando sempre aprender mais.
Estamos juntos nesse aprendizado!
Iconográficos
Olá. Meu nome é Manuela César de Arruda. Sou a responsável pelo pro-
jeto gráfico de seu material. Esses ícones irão aparecer em sua trilha de
aprendizagem toda vez que:

INTRODUÇÃO: DEFINIÇÃO:
para o início do houver necessidade
desenvolvimen- de se apresentar
to de uma nova um novo conceito;
competência;
NOTA: IMPORTANTE:
quando forem as observações
necessários obser- escritas tiveram
vações ou comple- que ser prioriza-
mentações para o das para você;
seu conhecimento;
EXPLICANDO VOCÊ SABIA?
MELHOR: curiosidades e inda-
algo precisa ser gações lúdicas sobre
melhor explicado o tema em estudo,
ou detalhado; se forem necessárias;
SAIBA MAIS: REFLITA:
textos, referências se houver a neces-
bibliográficas e sidade de chamar a
links para aprofun- atenção sobre algo
damento do seu a ser refletido ou
conhecimento; discutido sobre;
ACESSE: RESUMINDO:
se for preciso aces- quando for preciso
sar um ou mais sites se fazer um resumo
para fazer download, acumulativo das
assistir vídeos, ler últimas abordagens;
textos, ouvir podcast;
ATIVIDADES: TESTANDO:
quando alguma ativi- quando o desen-
dade de autoapren- volvimento de uma
dizagem for aplicada; competência for
concluído e questões
forem explicadas;
SUMÁRIO
A técnica de sequenciamento 10
Bioinformática 10
Sequenciamento de Sanger 13
Projeto Genoma Humano (PGH) 17
Impactos do PGH 18
Sequenciamento na rotina laboratorial de diagnóstico 21
Sequenciamento de Nova Geração (NGS) 21
Bibliotecas genômicas 22
Pirosequenciamento da Roche 454 24
Plataforma solexa (Illumina) 25
Mapeamento gênico 28
Sequenciamento de exoma 29
Aplicações da técnica de sequenciamento 31
Estudo das ômicas 31
Genômica 32
Transcriptoma 35
Proteoma 37
Metabolômica 38
Avanços tecnológicos do sequenciamento 40
Sequenciamento de terceira geração 40
Bibliotecas de DNA da terceira geração 40
PacBio 41
Oxford Nanopore (MinION) 43
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 7

04
UNIDADE
8 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

INTRODUÇÃO
Nos capítulos anteriores nós compreendemos a estrutura da
molécula da hereditariedade, DNA, o porquê de ela ser considerada
“molécula da hereditariedade” e seus aspectos funcionais. Entendemos
também que toda a trajetória feita por muitos cientistas abriu portas
para compreensões futuras acerca de alguns processos fisiológicos e
regulatórios envolvendo o material genético. Graças à compreensão
das propriedades físicas e químicas, como a desnaturação e a comple-
mentariedade de bases, o ser humano pode desenvolver técnicas
excelentes para o rastreio de doenças. A técnica de sequenciamento
de DNA é muito utilizada na biologia molecular e tem amplas funções
e aplicações no diagnóstico laboratorial. Nessa unidade final, nós
aprenderemos sobre a técnica de sequenciamento, os avanços
tecnológicos que ocorreram nela e sua importância. Vamos nessa?
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 9

OBJETIVOS
Olá. Seja muito bem-vindo à Unidade 4. Nosso objetivo é auxiliar
você no desenvolvimento das seguintes competências profissionais até
o término desta etapa de estudos:
1. Apresentar a técnica de sequenciamento de DNA, assim como
seu breve histórico e o seu funcionamento.
2. Estudar a aplicação do sequenciamento do DNA em
diagnóstico laboratorial, o depósito de sequências utilizadas e a
utilização para identificar, diagnosticar e desenvolver tratamentos.
3. Conhecer as aplicações da técnica de sequenciamento na
área das ômicas da Bioinformática.
4. Entender as técnicas mais recentes de sequenciamento e o
avanço das técnicas, além de conhecer sobre a utilização das tecnologias
para desenvolvimento de produtos e serviços.
Então? Preparado para uma viagem sem volta rumo ao
conhecimento? Ao trabalho!
10 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

A técnica de sequenciamento
INTRODUÇÃO:
Nesse capítulo nós apresentaremos uma nova metodologia
para identificação das sequências de bases em um dado
genoma. Esse sequenciamento tem uma ampla aplicação,
sendo possível utilizá-lo para identificar mutações, regiões
polimórficas, DNA invasor, regiões gênicas importantes e
entre outros. Além do DNA, há a possibilidade de predição
de uma cadeia de mRNA e, portanto, sua cadeia proteica.

Bioinformática
Em linhas gerais, a bioinformática se trata do emprego de ferramentas
computacionais com o intuito de estudar os problemas e questões
biológicas, abrangendo uma gama de aplicabilidades, principalmente
relacionadas à saúde humana, como o planejamento de novos fármacos.
Sendo assim, a bioinformática é uma área multidisciplinar que une as
ferramentas de programação computacional aos elementos biológicos dos
seres vivos, principalmente o DNA. O contato com o DNA jamais fora tão
íntimo ao ponto de enxergar sua organização, uma a um, de tão perto. As
origens proteicas jamais foram tão destrinchadas a ponto de visualizar os
pares de bases responsáveis por originar sua estrutura de aminoácido.
A bioinformática possui duas vertentes muito bem difundidas: (I)
Bioinformática tradicional ou clássica, que trata de identificar a estrutura
sequencial de nucleotídeos e aminoácidos; (II) Bioinformática estrutural,
que aborda questões biológicas de um ponto de vista tridimensional,
abrangendo a maior parte das técnicas voltadas à química computacional
e modelagem molecular. Ou seja, esse último traz a capacidade de
construir a estrutura de uma proteína, por exemplo, em formato 3D.
Assim como tudo já discutido nas unidades passadas, a
bioinformática tem seu momento a partir de 1953 com a elucidação da
dupla hélice do DNA por Watson e Crick, permitindo a compreensão da
sequência de letras que compunha tanto o DNA quanto o RNA. Entretanto,
os trabalhos de Linus Pauling com a estrutura dimensional das proteínas
motivaram Frederick Sanger a querer identificar a sequência exata e em
ordem das bases nitrogenadas no DNA.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 11

VOCÊ SABIA?
Outra contribuição vem de um biólogo molecular chamado
Cyrus Levinthal, onde foi capaz de, além de relatar
mecanismos da replicação do DNA, relacionamento entre
genes e proteínas e a natureza do mRNA, ser considerado
o pai da computação gráfica de proteínas por conseguir
imagens tridimensionais de proteínas e outras estruturas
biológicas. Ele também é conhecido pelo Paradoxo de
Levinthal.

Assim como a biologia molecular, a área computacional está


em constante desenvolvimento, visto que novas funções permitindo
analisar macromoléculas estão surgindo e ganhando sua importância
no cenário mundial. Por exemplo, em 2013, três cientistas, Martin
Karplus, Michael Levitt e Arieh Warshel, foram laureados com o prêmio
Nobel de química por conta de seus trabalhos em dinâmica molecular,
permitindo o estudo acerca da dinâmica e enovelamento das proteínas
por simulações computacionais.
FIgura 1: Os três cientistas laureados ao Nobel de química

Fonte: http://bit.ly/2R7BfEv
12 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

Um dos maiores avanços no campo da bioinformática foi o longo


esforço de cientistas do mundo todo com o único objetivo de sequenciar
o genoma inteiro de uma célula humana. Esse projeto foi chamado de
Projeto Genoma Humano. E a partir disso, criou-se um gigantesco e
crescente volume de sequências de genes cujas relações evolutivas
e funcionais precisam ser elucidadas, como ponto de partida para o
desenvolvimento de novos fármacos.
Como já dito anteriormente, a bioinformática possui divisões
e cada uma dessas divisões possuem suas categorias. Ao avaliar as
duas divisões, é perceptível que a facilidade de análise e obtenção de
resultados está muito mais voltada para a análise de sequências em 1D
do que uma análise de uma estrutura tridimensional (3D). Por exemplo,
algumas informações em uma cadeia polipeptídica não são bem
observadas quando analisada sua estrutura dimensional comparada
com uma análise em uma estrutura sequencial.
A identificação de uma modificação pós-traducional é muito mais
fácil de ser identificada em uma cadeia em sequência do que em uma
molécula estruturalmente formada por átomos espalhados, dispostos
em uma forma tridimensional. Essas diferenças devem levar bastante
em conta na hora de selecionar o modo mais eficaz de análise de uma
determinada sequência proteica, por exemplo.
A análise de sequências é menos custosa computacionalmente,
nos possibilitando lidar com genomas inteiros, nos permitindo realizar
análises de indivíduos ou até mesmo de populações de indivíduos,
levando à compreensão das características biológicas de cada organismo.
As categorias de estudo envolvendo análises de sequências são:
1. Comparação entre sequências (Alinhamento);
2. Identificação de padrões em sequências (Assinaturas);
3. Caracterização de relações evolutivas (Filogenia);
4. Construção e anotação de genomas;
5. Construção de redes (Biologia de Sistemas).
Ao contrário da análise de sequências, estruturas tridimensionais
precisam de um maior poder de processamento para serem manipuladas.
As suas categorias envolvem: (I) Obtenção de modelo 3D para proteínas
e outras biomoléculas (por exemplo, modelagem comparativa); (II)
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 13

Identificação do modo de interação de moléculas (atracamento); (III)


seleção de compostos com maior potencial de inibição (atracamento);
(IV) Caracterização da flexibilidade molecular (Dinâmica Molecular); (V)
Avaliação do efeito de mudanças na estrutura e ambiente molecular na
dinâmica e função de biomoléculas (Dinâmica Molecular).

Sequenciamento de Sanger
Na década de 50, as proteínas começaram a ter suas estruturas
mais exploradas. Linus Pauling e colaboradores identificaram a estrutura
tridimensional de proteínas e, praticamente ao mesmo tempo, um outro
bioquímico chamado Frederick Sanger desvendou a sequência de uma
proteína, a insulina, usando um método de desintegração proteica.
Toda proteína é feita de uma sequência de aminoácidos, ligados
através de ligações polipeptídicas, pontes de hidrogênio, pontes
de van der Waals, entre outras. Entretanto, ao desnaturar a proteína
(processo semelhante ao que ocorre com o DNA com a elevação de
temperatura e alteração no pH), ela acaba desenovelando, tomando sua
estrutura primária, sendo uma cadeia linear. As reações de degradação
promovidas por Sanger eram em cima dessas sequências primárias,
afinal, como já dito anteriormente, identificar componentes proteicos a
partir de estruturas tridimensionais é algo bastante difícil de fazer a partir
de programas computacionais, imaginem através de reações químicas
laboratoriais. Além do mais, o sítio catalítico de algumas enzimas pode
não estar disponível em conformação tridimensional.
Ao promover as reações catalíticas de degradação, ele iria
retirando um aminoácido da cadeia peptídica, dissolveria em solventes
e caracterizaria quimicamente. Esse processo, de um em um, o permitiu
levar o prêmio Nobel de química em 1958 pela identificação da estrutura
da insulina. Tomando por esse mesmo raciocínio, ele tentou sequenciar
o DNA.
A técnica de sequenciamento tem como objetivo a determinação
da sequência de bases nucleotídicas em um pedaço de DNA.
Apesar da técnica de desintegração ter sido metodologicamente
perfeita para a identificação da estrutura da insulina, quando migrada
para o DNA, nenhum resultado satisfatório era obtido. Entretanto, após
14 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

décadas tentando encontrar a melhor forma de sequenciar uma cadeia


de DNA, ele descobriu que se a metodologia fosse usada de forma
inversa, os resultados dariam certo. Foi então que ele resolveu construir
uma cadeia de DNA. De início, assim como em qualquer pesquisa, seu
método foi ineficiente e sujeito. O método dele se baseava na única
técnica disponível na época de síntese de DNA, a Reação em Cadeia
da Polimerase (PCR). Entretanto, não ia dar certo caso ele tentasse
acompanhar o processo de síntese de uma DNA polimerase sem
algum marcador, afinal, as DNA polimerases são enzimas altamente
processivas, podendo colocar entre 500 a 1000 bases por segundo.
Foi então a partir de 1975 que ele resolveu alterar os
desoxinucleosídeos quimicamente de forma que quando uma base
fosse adicionada pela DNA polimerase, a reação parasse, porque essa
alteração química envolvida a retirada de um OH do carbono 3’ do
nucleotídeo, tornando assim aquela fita incapaz de ser montada. Sendo
assim, a fita ia sendo parada em algumas ocasiões quando aparecia um
A marcado, T marcado, G marcado e C marcado. Assim, ele conseguiu
sequenciar um genoma viral pequeno, criando uma metodologia
inovadora para as aplicabilidades da biologia molecular.
Figura 2: Sequenciamento de sanger em eletroforese

Fonte: http://bit.ly/34pmH6I
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 15

Metodologia Empregada
O sequenciamento realizado por Sanger é uma adaptação de
técnica de PCR. Isso significa dizer que os reagentes utilizados para o
sequenciamento serão basicamente os mesmos, a única diferença é que
será adicionado um nucleotídeo quimicamente modificado e marcado,
como se tivesse construindo sondas. Então, os reagentes serão: amostra
de DNA; primers; Taq-polimerase; dNTPS (nucleotídeos comuns); ddNTPS
(nucleotídeos modificados e marcados quimicamente); água e magnésio.
As amostras, junto com os reagentes para PCR serão adicionados
em quatro tubos. Cada tubo terá uma quantidade equivalente de ddNTP,
entretanto, os tubos vão se diferenciar a partir dos ddNTPS, ou seja, será
um tubo para ddATP, outro para ddGTP e assim por diante. Ao adicionar
a amostra com os reagentes, a reação de PCR ocorrerá normalmente,
mediante o aquecimento intercalado em ciclos. Entretanto, o resultado
da reação será diferente.
Ao final da reação, em cada tubo, haverá fragmentos de DNA
com diferentes tamanhos de comprimento, isso porque os ddNTPs são
alterados para não terem mais uma OH, assim, quando esse nucleotídeo
alterado for adicionado na cadeia a ser sintetizada, ele irá impedir que
novos nucleotídeos sejam adicionados. Isso porque, para que haja a
ligação fosfodiester entre dois nucleotídeos, o carbono 3’ precisa ter
uma OH capaz de realizar uma ligação covalente com um oxigênio (O)
presente no grupo fosfato do outro nucleotídeo.
Após a conclusão do PCR, o próximo passo é a corrida em
eletroforese. Como em cada tubo foram geradas cadeias polinucleotídicas
com tamanhos diferentes por conta da ligação dos ddNTPS, isso poderá
ser lido no gel de eletroforese, onde a banda que mais se afastou do poço
representa a primeira base nitrogenada naquela sequência de DNA e a
que menos correu representa a última base daquele mesmo fragmento.
A leitura do resultado vai começar da banda que mais correu em
direção a que menos correu.

Automação do método de Sanger


O avanço tecnológico permitiu que o método de sequenciamento
de Sanger desse um upgrade melhorando a forma de aquisição da
16 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

amostra para o sequenciamento das bases nitrogenadas. A automação


permitiu que máquinas exercessem o processo de mistura dos reagentes,
amplificação das amostras a partir dos quatro dNTPs e quatro ddNTPs,
corrida no gel de eletroforese capilar e aquisição do sequenciamento.
Existem pequenas diferenças, além do fato de estar sendo exercido por
máquinas. A primeira diferença é a marcação das ddNTPs. Esses nucleotídeos
são conjugados a fluorocromos, sendo cada ddNTP estando ligado a um
fluorocromo diferente. A segunda diferença é o tipo da eletroforese realizada
por essa máquina, sendo feita a eletroforese capilar. As fitas de diferentes
tamanhos são corridas por um capilar de um diâmetro o suficiente para que
o fluxo seja de forma enfileirada, de uma forma semelhante ao que acontece
com células ao serem analisadas em citometria de fluxo. Esse capilar
será irradiado um feixe de luz que irá estimular os fluorocromos de forma
individual, fazendo com que cada fluorocromo seja detectado, gerando um
pico correspondente a cada um dos quatros compostos fluorescentes. Esses
picos serão mostrados em uma tela de computador, tendo cada um uma
coloração correspondente ao fluorocromo.
Assim que o pico for sendo emitido, as sequências de bases
correspondentes também serão mostradas. Esse método permite o
sequenciamento de fragmentos de DNA entre 700 a 1000 pares de
base. O método de sequenciamento de Sanger vai permitir a obtenção
de sequências gênicas (transcritos = trascriptomas), além de identificar
a composição de um determinado fragmento de DNA de genoma de
qualquer ser vivo.

IMPORTANTE:
Um fragmento de DNA talvez não seja o suficiente em
contexto de aplicações médicas. Seria necessário o
sequenciamento do genoma inteiro, descobrir a sequência
de bases presente em todo genoma humano, assim tendo
maior visibilidade da característica genotípica de algumas
proteínas e até mesmo processos carcinogênicos. Fora
que, a predição de novos alvos farmacológicos não será a
partir de alguns fragmentos de DNA sequenciados. A partir
daí que em 1990 o Projeto Genoma Humano foi fundado
e a seguir iremos explorar mais sobre esse projeto que foi
concluído em 2003.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 17

Projeto Genoma Humano (PGH)


Iniciado em 1990, o projeto genoma humano foi criado com o intuito
de sequenciar todo o genoma humano e junto a isso, havia também objetivos
como identificar todos os genes humanos, armazenar as informações
geradas em bancos de dados genômicos, o sequenciamento de genomas
de organismos modelos para auxiliar a interpretar a sequência do DNA
humano, melhorar a capacidade computacional para dar suporte a futuras
pesquisas de aplicação comercial, explorar a função de genes por meio da
comparação entre camundongo e humanos, estudar a variabilidade genética
humana e treinar cientistas para trabalhar com a área da genômica, como
aconteceu com os cientistas de países em desenvolvimento como o Brasil.
Apesar de o projeto ter sido executado em 13 anos, a proposta do projeto
visava a conclusão de suas atividades em 2005. O projeto acabou sendo
cumprido antes da data prevista devido aos avanços tecnológicos da época.
O objetivo principal desse projeto foi, primeiramente, articulado
em 1988 por meio de um comitê especial chamado de Academia
Nacional de Ciências dos Estados Unidos e posteriormente adaptada
através de um detalhado planejamento de 5 anos, juntamente escrito
pelo Instituto Nacional de Saúde e Departamento de Energia dos EUA.
Na época, o Nobel James D. Watson, chefe do Instituto Nacional de
Saúde dos EUA, foi recrutado para liderar esse projeto.
Nesse mesmo ano, o PGH já tinha o envolvimento de mais de
5000 cientistas de 250 diferentes laboratórios do mundo todo, contando
com um orçamento total de 3 bilhões de dólares. Devido a participação
ode tantos laboratórios em escala mundial, foi criado um Consórcio
Internacional de Sequenciamento do Genoma Humano, liderado pelo
Instituto Nacional em Pesquisa do Genoma Humano (National Human
Genome Research Institute – NHGRI), subordinado ao Instituto Nacional
de Saúde. Esse foi o projeto mais ousado na área biomédica, genética
e biologia molecular, levando à participação de muitas instituições e
cientistas. Hoje, uma grande parte dos avanços científicos na biologia
molecular se deve aos trabalhos realizados nesse projeto.
A possibilidade de lucro com o patenteamento de regiões do genoma
humano acabou atraindo a atenção de um cientista e empresário em
biotecnologia John Craig Venter, que, em maio de 1998, anunciou a criação
18 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

da empresa privada Celera Genomics. Essa empresa se comprometeu em


sequenciar todo o genoma até 200, contra o final previsto pela comissão.
Graças a uma tecnologia inovadora, o shotgun, empregado com sucesso
no sequenciamento do genoma da Drosophila, a Celera realizou o processo
inteiro de sequenciamento em 13 meses. Essa metodologia de shotgun será
abordada com mais detalhe nos próximos capítulos.
Os pesquisadores decifraram o genoma humano utilizando três
metodologias: (I) determinando a ordem da sequência de todas as bases
dentro do nosso genoma; (II) fazendo mapeamentos os quais localizam
os genes de maiores seções em todos os cromossomos; (III) produzindo
os chamados “linkage maps” através da mesma forma que traços
herdáveis podem ser passado ao longo de gerações.
Todos os genes no organismo humano, presentes no mesmo
cromossomo, podem estar muito próximos ou distantes entre si.
O benefício em encontrar a distância entre dois genes é identificar
a probabilidade de um gene acabar sendo passado via crossingover.

DEFINIÇÃO:
Crossingover é um processo que ocorre durante a meiose
com a finalidade de aumentar a variabilidade genética,
que envolve uma permuta genética, ou seja, uma troca de
partes entre dois cromossomos.

Esse mapeamento de qual gene está próximo de qual, permite


que regiões gênicas sejam mapeadas em cada cromossomo do genoma
humano e também ajuda a identificar qual gene acaba segregando de
forma independente e quais genes estão associados a segregações de
forma conjunta. O mapeamento ajuda a desvendar quais genes são mais
associados com genes polimórficos para suscetibilidade a cânceres.

Impactos do PGH
Ao final de todo o sequenciamento do genoma humano, os
resultados eram impressionantes acerca do genoma humano. Com
o projeto, descobriu-se que o genoma humano contém cerca de 3,2
bilhões de nucleotídeos; o tamanho médio dos genes é de 3.000 bases,
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 19

podendo variar bastante de acordo com algumas regiões polimórficas (já


comentadas anteriormente), sendo o maior deles o gene da distrofina, a
qual tem a capacidade de ligar o citoesqueleto das fibras musculares à
matriz extracelular, sendo a ausência dessa proteína a causa primária de
um dos mais graves tipos de distrofia muscular; a função de cerca de
50% dos genes descobertos era desconhecida; a sequência do genoma
humano é exatamente 99% compatível entre qualquer pessoa, sendo o 1%
podendo ser explorado em casos de investigação de paternidade; cerca
de 3% do genoma é responsável pela síntese de proteínas; sequências
repetidas que não codificam proteínas constituem mais de 50% do genoma
humano, sendo essas sequências repetidas não tendo suas funções
conhecidas, entretanto, ajudam a entender a estrutura e dinâmica dos
cromossomos, visto que essas sequências podem rearranjar seguimentos
cromossômicos, criando genes novos ou modificando genes já existentes.
Outra parte do projeto foi dedicada à comparação com outros
sistemas vivos. Os resultados dessas comparações revelaram que
o genoma humano possui mais sequências repetidas (50%) do que
Arabdopsis thaliana (11%), o verme C. elegans (7%), e Drosophila (3%); mais
do que 40% das proteínas humanas preditas compartilham similaridade
com as proteínas de moscas e de vermes.
Genes estão concentrados em áreas, ao acaso, ao longo do
genoma, com vastas sequências sem código para proteínas entre eles.

VOCÊ SABIA?
Algumas sequências gênicas específicas foram associadas
a numerosas doenças e disfunções, incluindo câncer de
mama, doenças musculares, surdez e cegueira.

Os cientistas localizaram, no genoma humano, milhares de locais


nos quais há diferença de apenas uma base. Essa informação promete
revolucionar o processo de encontrar sequências de DNA associadas com
doenças muito comuns tais como disfunções cardiovasculares, diabetes,
artrite e câncer. Uma das conclusões vinda das análises cromossômicas
concluiu também que o cromossomo 1 (o maior do genoma humano)
tem o maior número de genes - 3.168 – e o cromossomo Y, o menor -344.
20 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

A conclusão desse projeto mostrou que o DNA ainda está pouco


explorado, além também da formulação de novos sequenciamentos em
DNA genômico de vários outros seres vivos e a comparação com o genoma
humano. O estudo das ômicas (proteômica, genômica, metabolômica,
transcriptômica, lipidômica e entre outros) também começou a ganhar
mais força e espaço nas pesquisas em biologia molecular de diversas
áreas do conhecimento, como serão abordados em capítulos futuros.

SAIBA MAIS:
Quer se aprofundar neste tema? Recomendamos o acesso
à seguinte fonte de consulta e aprofundamento, o artigo:
“Projeto Genoma Humano: um retrato da construção do
conhecimento científico sob a ótica da revista Ciência Hoje”,
acessível em: https://bit.ly/2lMZxpk

RESUMINDO:
E então? Gostou do que lhe mostramos? Aprendeu
mesmo tudinho? Agora, só para termos certeza de
que você realmente entendeu o tema de estudo deste
capítulo, vamos resumir tudo o que vimos. Você deve
ter aprendido que a técnica de sequenciamento é muito
sensível e amplamente utilizada na área de bioinformática,
principalmente para identificar a sequência, em ordem,
de pares de base do genoma. Pôde compreender um
pouco a respeito da bioinformática e suas características,
entendendo as suas vertentes. Conheceu a respeito
do Projeto Genoma Humano e sobre seus impactos na
descoberta de informações sobre o genoma humano.
Compreendeu que o sequenciamento pode ser utilizado
também para identificar mutações, regiões polimórficas
da sequência ou regiões gênicas importantes, e também
identificar DNA invasor. Conheceu o sequenciamento de
Sanger e aprendeu sobre a metodologia empregada,
entendendo que é um método semelhante à técnica de
PCR, só que de forma adaptada.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 21

Sequenciamento na rotina laboratorial


de diagnóstico
INTRODUÇÃO:
Neste capítulo veremos uma evolução nos métodos de
sequenciamentos e suas aplicabilidades na rotina de
grandes laboratórios de diagnóstico. Apesar de o método
de Sanger ser um sequenciamento caro, veremos que
novas formas de sequenciamento de alto rendimento e
baixo custo foram desenvolvidas e estão no mercado hoje
em dia. E então, preparado?

Sequenciamento de Nova Geração (NGS)


A automação do método de Sanger foi uma ótima evolução
em seu método de sequenciamento, levando a resultados com maior
qualidade e a um rendimento elevado. O método automatizado de Sanger
foi utilizado no projeto genoma humano como sua fonte metodológica
de sequenciamento do DNA genômico das várias espécies, além do ser
humano. Entretanto, esse método ainda continuava exigindo um alto custo
devido à alta quantidade de rodadas e análises, já que se sequenciavam,
no máximo, 100 Kb por rodada, sendo necessárias centenas, as vezes
milhares, de rodadas para que fosse possível sequenciar um genoma
completo, mesmo se tratando de organismos microbianos. Sendo assim,
a demanda por métodos de sequenciamento de alto rendimento e baixos
custos motivou o desenvolvimento de novas tecnologias.
Com a demanda por novas plataformas de pesquisa, as novas
plataformas de sequenciamento de nova geração (NGS) foram construídas
com o intuito de gerar o sequenciamento do DNA em milhões de pares
de base em uma única corrida e a um preço reduzido. Esse termo foi
inicialmente utilizado para a plataforma Roche 454, entretanto, outras
plataformas, como da Illumina (Solexa), ganharam espaço e o nome
acabou abrangendo essas novas plataformas.
Essas novas plataformas possuem a característica de gerar
informações muitas vezes maior do que as geradas pelo método de
Sanger e com um baixo tempo e custo de sequenciamento. Essa maior
22 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

eficiência vem do fato do uso de novas abordagens, que não são a


formação de fragmentos para análise em eletroforese capilar. Essa nova
abordagem é a clonagem in vitro e sistemas de suporte em sólidos para
as unidades de sequenciamento, não precisando mais do intensivo
trabalho laboratorial de produção de clones bacterianos, da montagem
de placas de sequenciamento e da separação de fragmentos em gel.

IMPORTANTE:
Esse método de clonagem permite que milhares de leituras
possam ser produzidas de uma vez só.

Bibliotecas genômicas
Antes do sequenciamento de fato, existia a necessidade de
construir bibliotecas genômicas, que nada mais é do que transformar
o DNA genômico em fragmentos menores, independente de qual
organismo seja, sendo microbianos e até mesmo mais complexos, como
o humano. Existem duas categorias de métodos, sendo uma através de
cortes promovidos por enzimas de restrição, com cortes precisos no
genoma e a outra a fragmentação mecânica, sendo essa destacada
por conta da alta utilização da metodologia de Shotgun. A seguir será
explicada somente a técnica de Shotgun a qual teve grande relevância
no sequenciamento, ainda mais no projeto genoma humano.
A técnica é baseada no bombardeio do genoma alvo a ser
sequenciado com partículas que possam promover a sua fragmentação.
Essa técnica se assemelha bastante ao seu nome. Após a fragmentação,
terá a formação de vários fragmentos de DNA, com tamanhos
desconhecidos. Esses fragmentos servirão como uma espécie de inserto
a ser adicionado em um plasmídeo de clonagem. Fragmentos pequenos
podem ser completamente sequenciados somente com primers que
anelam ao vetor. Entretanto, para fragmentos mais extensos, o processo
é diferente, devido à limitação da processividade da DNA polimerase,
a qual não tem a capacidade de adicionar quantidades altamente
numerosas de pares de base. Sendo assim, esses fragmentos grandes
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 23

serão clonados nos vetores e posteriormente clivados novamente, para


gerar fragmentos menores e subclonados em plasmídeo. A técnica
descrita se chama shotgun de genoma inteiro (WGS), desenvolvido pela
Celera Genomics durante o projeto genoma humano.
Na época, o consórcio firmado para realizar o trabalho do
sequenciamento também utilizou do sistema de Shotgun, entretanto,
foi uma outra forma da mesma metodologia, chamado de Shotgun
hierárquico. O Shotgun hierárquico é o método utilizado para grandes
fragmentos de genoma, como dito anteriormente, em que realiza um
segundo round de fragmentações para que o DNA extenso seja clivado
em subunidades ainda menores. Apesar dessas técnicas terem sido
bastante utilizadas na época, com a evolução tecnológica e as novas
plataformas de sequenciamento, a produção de bibliotecas genômicas
também mudaram, tornando um processo com menor tempo de
execução, não precisando da utilização de bactérias para clonagem. E
também, as novas plataformas são capazes de sequenciar genes ainda
maiores, deixando de lado a necessidade da utilização de técnicas
alternativas de shotgun.
Figura 3 - Estratégia do sequenciamento shotgun

Fonte: http://bit.ly/33q6Xiv
24 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

A seguir, serão descritas duas plataformas de sequenciamento de


nova geração, a Roche 454 e Solexa da Illumina.

Pirosequenciamento da Roche 454


Como dito anteriormente, os sequenciadores da Roche foram
os primeiros a serem comercializados com uma tecnologia de alto
rendimentos (high-throughput) de DNA, sendo o ponto de largada para
a grande revolução na área da biologia molecular promovida pelos
métodos de sequenciamento. Em critérios de esclarecimento, a 454 é
uma empresa a parte da Roche, entretanto, foi comprada pela grande
empresa farmacêutica (Roche), implementando nestes equipamentos de
sequenciamento o pirosequenciamento. Essa nova metodologia foi, na
verdade, desenvolvida originalmente pela empresa Pyrosequencing AB.
Esse método, de forma mais direta, se baseia de uma cascata
enzimática que culmina na liberação de um pirofosfato (um difosfato).
Antes do sequenciamento, a amostra precisa ser devidamente preparada
através da fragmentação do DNA em fragmentos de 300 a 800pb,
sendo então ligados a adaptadores, A e B, em suas extremidades 3’ e 5’,
respectivamente. O fragmento B possui biotina ligada à extremidade 5’,
permitindo o isolamento dos fragmentos ligados a ambos adaptadores.
Somente serão eluídos na reação os fragmentos A-B, permitindo
que esses fragmentos se ancorem em Beads, esferas, contendo cópias
oligonucleotídicas complementares ao adaptador B ligados ao fragmento.
O outro adaptador é utilizado para o anelamento ao primer, que inicia a
reação de sequenciamento.
As microesferas ligadas aos fragmentos de cadeia única de DNA
a serem amplificados serão imersas em uma solução emulsionante,
contendo água e olho, com reagentes necessários para a amplificação da
fita via PCR em cerca de 1 milhão de cópias. Na emulsão água e óleo, o óleo
formará micelas, sendo que cada uma dessas micelas terá, em seu interior,
as beads ligadas aos fragmentos de DNA. Ou seja, cada micela funcionará
como um micro centro reativo, onde estará ocorrendo a amplificação,
produzindo muitas cópias idênticas de um mesmo fragmento.
Após a amplificação, cada microesfera, ou bead, será, individual-
mente, depositada em uma placa contendo mais de 1,6 milhões de
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 25

poços, com diâmetro necessário para que somente uma bead esteja
alojada em determinado poço. Os reagentes para o pirosequenciamento
são adicionados em cada poço e cada reação vai acontecendo de forma
individual para cada microesfera, contendo um determinado tipo de
fragmento liga à microesfera. Assim, competições por reagente entre
diferentes tipos de fragmentos da biblioteca genômica são excluídos do
raio de possibilidade.
Após a adição dos reagentes, a placa será inserida a um sistema
ótico de leitura. Cada ciclo utilizará uma concentração de reagentes e
uma determinada base nitrogenada. Se o nucleotídeo adicionado for
incorporado à cadeia em amplificação, então um sinal de luz é emitido
e captado, sendo a intensidade desse sinal um reflexo para o número
de uma determinada base nitrogenada adicionada de vez naquele ciclo.
O sinal de luz pode ser utilizado para identificação da informação da
sequência. A liberação da luz é devido a cada reação de adição de um
nucleotídeo, que vai levar na liberação de um pirofosfato (Pi-Pi), sendo
ele então reagido com uma molécula de adenosina pirosulfato pela
enzima ATP-sulfurilase, resultando em uma molécula de ATP, a qual
será consumida por uma luciferase, produzindo liberação de luz. Vale
ressaltar que todas as etapas descritas ocorrem dentro do sequenciador.
Figura 4: Processo de pirosequenciamento

Fonte: https://bit.ly/2kugTaz

Plataforma solexa (Illumina)


Nos anos 90, a Illumina surgiu com a proposta de realização de
exames em biologia molecular através da técnica de microarranjos de
DNA (DNA microarray). Em 2005, a Roche 454 foi lançada e, em 2007,
a Illumina compra a empresa Solexa, que detinha a patente de uma
26 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

plataforma de sequenciamento de DNA chamado Sequenciamento por


Síntese (SBS) e em 2009 lançou a sua primeira plataforma comercial.
O sequenciamento dessa plataforma, assim como a de Sanger, é
mediado à síntese usando nucleotídeos marcados em suas extremidades
5’ e à amplificação da cadeia. A inovação dessa técnica é a clonagem in
vitro dos fragmentos em superfície sólida de vidro, processo também
conhecido como PCR de fase sólida. Então, o processo de obtenção de
bibliotecas de DNA é o mesmo do que envolve a plataforma Roche. Os
fragmentos de DNA serão formados e ligados a adaptadores, A e B, em
ambas extremidades da fita simples de DNA.
A superfície onde os fragmentos de DNA a serem sequenciados
irão ancorar (flow cells) é dividida em 8 linhas, podendo assim utilizar até
8 bibliotecas de DNA para o sequenciamento. Em cada linha, sequências
oligonucleotídicas de adaptadores são ancorados à superfície da reação
pela extremidade 5’, deixando a extremidade 3’ livre para servir de iniciação
da reação de sequenciamento. Como os fragmentos a serem sequenciados
possuem adaptadores em suas extremidades, então eles irão se fixar aos
adaptadores complementares presentes na superfície de clonagem.
Os adaptadores ligados à superfície de clonagem variam de
complementariedade com as extremidades do DNA.
Uma primeira etapa de clonagem é realizada utilizando
nucleotídeos não marcados, para que haja a geração de uma cadeia
complementar à sequência de DNA ligada. Entretanto, após a geração
dessa cadeia complementar, a outra cadeia, inicialmente ligada, será
liberada, lavada, da superfície de clonagem. Logo em seguida, a cadeia
formada irá se ligar diretamente, através da sua outra extremidade
contendo um adaptador livre, ao adaptador mais próximo e que seja
complementar à sua extremidade livre, formando uma ponte, um
fragmento de DNA encurvado que está ligado a dois adaptadores, um
em cada extremidade. Esse DNA formando a ponte será amplificado por
uma DNA polimerase. Ao final da extensão da polimerase, a dupla fita
formada, em forma de ponte, será desnaturada, formando duas cadeias
antiparalelas de fita única presas à superfície de clonagem. Esse processo
é repetido cerca de 35 vezes criando cerca de mil cópias geradas de cada
fragmento nessa PCR de fase sólida, permanecendo umas próximas as
outras, formando grupamentos (clusters) de sequenciamento.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 27

IMPORTANTE:
Cada etapa de desnaturação é necessária para que as
etapas seguintes de sequenciamento ocorram.

A próxima etapa envolve a adição de nucleotídeos marcados em


suas extremidades 5’ com compostos fluorescentes em cada cluster.
Como a quantidade de clusters presentes na superfície de clonagem é
bastante extensa, então a adição de um nucleotídeo em um cluster vai
gerar emissão de sinal o suficiente para a detecção exata da incorporação.
Cada nucleotídeo incorporado vai emitir uma luz correspondente à base
a qual carrega. Até 50 milhões de clusters podem ser produzidos por
linha, representando uma quantidade satisfatória de biblioteca genômica.
A etapa final é a lavagem para a remoção do excedente, remoção
do terminal 3’, responsável pelo bloqueio de novas sínteses indesejáveis
e dos fluorocromos incorporados no ciclo anterior, para que novos ciclos
venham a ocorrer.
Figura 5: Plataforma da Illumina

Fonte: https://bit.ly/2kCpfN6

VOCÊ SABIA?
Existem outras plataformas desenvolvidas, como SOLiD,
Polonator, HelisCope e o IonTorrent que não foram
abordados nessa seção. Entretanto, você pode entender
mais sobre essas outras plataformas e as explicadas no site
da OmixData, disponível em: https://bit.ly/2kFfqxV
28 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

Mapeamento gênico
Como abordado anteriormente, o mapeamento gênico foi uma
das vertentes exploradas pelo projeto genoma humano com o intuito de
mapear cada gene presente no cromossomo humano e sua ligação com
os outros genes também presentes no mesmo cromossomo. No início
de 1900, Thomas Morgan, trabalhando com moscas, percebeu que em
sucessivos cruzamentos, haviam moscas com características agrupadas.
Na lei Mendeliana descobrimos que cada gene era herdado de forma
independente, entretanto, as moscas de Morgan mostraram que haviam
características físicas que estavam atreladas umas às outras. A partir de então
foi descoberto o processo da permuta cromossômica, também chamada de
Linkage ou Crossingover, que corresponde à transposição de dois fragmentos
cromossômicos, um de cada cromossomo, ou seja, uma troca.
Sendo assim, o mapeamento gênico é uma vertente e necessidade
antiga, antes da descoberta da estrutura do DNA. A partir dos anos 70,
todo o aporte científico da época apontava para uma capacidade de
realizar tal feito, o que foi feito através do projeto genoma humano.
Através do sequenciamento da ordem de pares de bases do
genoma humano foram identificados genes que tinham uma maior
probabilidade de serem permutados juntos. Hoje em dia há trabalhos
que calculam a distância entre genes em um cromossomo, sendo quanto
maior a informação em relação à distância entre vários genes, maior a
precisão no mapeamento. Os principais objetivos do mapeamento
do genoma humano são possibilitar prevenção, melhor tratamento e,
finalmente, cura dos distúrbios genéticos.
A atriz Angelina Jolie realizou um teste de sequenciamento,
localizando um polimorfismo frequentemente atrelado ao câncer de
mama. O mapeamento gênico permite que, além dela, outros indivíduos
consigam identificar alelos condicionadores a manifestações sérias,
como a Doença de Huntington, que é uma doença neurodegenerativa
grave, sem a possibilidade de cura, causada por uma mutação, em
qualquer um dos alelos (doença autossômica dominante), no gene
da Huntingtina. A mutação causa uma extensão num tripleto de pares
de base (CAG) levando na tradução de uma proteína mutante e que
degenera as células do cérebro pouco a pouco.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 29

Portanto, até onde seria ética a utilização do mapeamento para a


descoberta de doenças? Por exemplo, no caso da Angelina Jolie, permitiu
que ela descobrisse a mutação para o câncer de mama e retirasse a
mama, para que não houvesse a possibilidade de desenvolver o câncer
de mama. Entretanto, no caso da Doença de Huntington, a pessoa terá
que conviver com a informação de que uma doença altamente mortal
aparecerá na vida dela entre os 30 a 50 anos e que viverá por 15 a 20
anos desde o momento do diagnóstico, sendo esses próximos anos
com baixa qualidade de vida.
Outros discursos éticos giram em torno à capacidade de uma
pessoa em conseguir vagas de emprego. Digamos que o mapeamento
gênico seja um teste bastante disponível para quaisquer situações. O
gerente de uma empresa que está contratando novos empregados
poderia pedir um mapeamento para cada candidato. Caso em algum
candidato seja identificada alguma alteração, por mais que a pessoa não
desenvolva (afinal, existem polimorfismos que representam somente um
aumento na probabilidade), essa pessoa seria descartada da vaga de
emprego. Talvez isso possa acontecer em outras entrevistas também.
Até quando seria ética e necessária a descoberta precoce de algumas
alterações gênicas? Essa é uma técnica que tem seus prós e contras,
sem assim necessária a avalição dos prós e contras.

SAIBA MAIS:
O filme GATTACA conta a história de um jovem que sempre
sonhou viajar ao espaço, mas vive em uma sociedade que
discrimina ou descarta a mão de obra de quaisquer pessoas
que apresentem uma alteração ou polimorfismo preditor
de doença. O filme traz a reflexão sobre a ética envolvendo
o mapeamento e a descoberta precoce de doenças.

Sequenciamento de exoma
O exoma refere-se ao conjunto de bases codificáveis em um
gene. Ao relembrar o capítulo 1, veremos que um gene eucarioto
possui sua sequência gênica que é transcrita em uma molécula de
mRNA. Entretanto, essa molécula vai passar por processamentos pós-
transcricionais, os splicings. Os splicings servem para remover da cadeia
30 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

de mRNA as sequências introns, ou seja, sequencias não codificáveis,


deixando somente os exons. Então, exoma refere-se à cadeia dos pares
de bases em um gene que são codificáveis. Apesar de poder analisar as
regiões codificáveis em um genoma a partir do mRNA, não seria correto
dizer que a análise de exomas serviria para análise de mRNA.
As técnicas de sequenciamento são capazes de identificar os
trechos puramente codificáveis. Essa análise é de grande utilidade, já
que tem a capacidade de estudar a maioria das doenças de origem
genética conhecida, por exemplo a Doença de Huntington e o câncer
de mama, utilizando plataformas como Illumina e Roche 454.
Embora seja de grande aplicabilidade, ela possui algumas
limitações, por exemplo na detecção de alterações estruturais, como
inversões e translocações.

RESUMINDO:
E então? Gostou do que lhe mostramos? Aprendeu
mesmo tudinho? Agora, só para termos certeza de
que você realmente entendeu o tema de estudo deste
capítulo, vamos resumir tudo o que vimos. Você deve ter
aprendido que o sequenciamento é amplamente utilizado
no diagnóstico laboratorial, viu que existem alguns tipos de
sequenciamento já descobertos, como o Sequenciamento
de Nova Geração, que é utilizado com o intuito de gerar
o sequenciamento do DNA em milhões de pares de
base em uma única corrida e a um preço reduzido. Viu
que existem bibliotecas genômicas que transformam o
DNA genômico em fragmentos menores. Conheceu a
respeito de duas plataformas de sequenciamento de nova
geração existentes, a Roche 454 e Solexa da Illumina, e
aprendeu sobre suas funcionalidades. Refletiu sobre a ética
envolvendo a descoberta precoce de alterações gênicas.
Aprendeu sobre o mapeamento gênico, utilizado para
mapear cada gene presente no cromossomo humano e,
por fim, aprendeu sobre o sequenciamento de exoma, que
possui capacidade de estudar a maioria das doenças de
origem genética conhecida.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 31

Aplicações da técnica de sequenciamento


INTRODUÇÃO:
Nós iremos abordar alguns ramos de análise de sequencias
gênicas gerados após sequenciamento. Após os resultados
do projeto genoma humano, o estudo das ômicas vieram
à tona como uma ferramenta de análise genotípica de
um genoma, de qualquer espécie, e como esse genoma
pode reagir a partir de fatores externos. Preparado para
mergulhar nesse capítulo?

Estudo das ômicas


Os avanços promovidos por aqueles dedicados ao estudo do
sequenciamento das bases do DNA permitiram que hoje o DNA e outras
macromoléculas consigam ser analisados de diferentes formas, afim
de identificar a constituição genotípica de um determinado genoma,
suas regiões codificáveis que são transcritas, as macromoléculas ativas
traduzidas a partir dos transcritos gênicos e as interações dinâmicas feitas
por elas para a geração de um fenótipo a partir de uma via metabólica.
Sendo assim, a bioinformática consegue analisar o dogma central da
biologia molecular de forma muita mais precisa e interdisciplinar.
Devido à grande participação da área computacional, muito
tem se investido na geração de algoritmos e programas para analisar
as sequências genômicas geradas. Programas de montagem de
genomas existiam, entretanto, eram capazes de analisar uma pequena
quantidade de dados, como os do fago λ e do CMV, com tamanhos
de aproximadamente 48.000 pares de base e 229.000 pares de
base, respectivamente. Essa quantidade de pares de base geradas,
representante do genoma inteiro desses vírus, faz parte do estudo do
genoma, ou seja, de todos os elementos pertencentes ao genoma:
regiões codificantes, regiões regulatórias, regiões não codificantes,
exons e íntrons (para os eucariotos).
O genoma tem a capacidade de transcrever suas regiões
codificantes em moléculas transportadoras dessas regiões. Os RNAs
mensageiros são as únicas moléculas capacitadas em traduzir as
32 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

mensagens criptografadas no genoma em seus verdadeiros significados


através do dicionário chamado código genético. O estudo desses
transcritos, da ativação dos genes, se chama transcriptoma, onde será
de bastante utilidade para analisar níveis de regulação da expressão
gênica. A análise do transcriptoma abrange todas as formas alternativas
de um mRNA a partir de uma transcrição.
A partir da geração do mRNA, haverá a produção da molécula
ativa, ou seja, tradução do código criptografado em uma palavra com
um sentido. Portanto, a análise da cadeia de aminoácidos em uma
determinada proteína, das interações proteína-proteína e a conformação
estrutural fazem parte da proteoma. Além da proteína, existem outros
produtos metabólicos que as células podem produzir. Todos esses
produtos metabólitos em célula, tecido ou organismo fazem parte da
metabolômica, onde, em conjunto com a análise de proteínas, irão
predizer as características fenotípicas de um determinado indivíduo.
Existem outros tipos de ômicas a serem estudadas, entretanto,
para critério de fluxo de informação genética, iremos abordar somente
esses quatro estudos.

Genômica
Como já dito, genômica é o estudo de todo o genoma de um
organismo. Nos Homo sapiens, o genoma haploide (contendo somente
uma cópia de cada cromossomo) possui 3 bilhões de pares de base,
com cerca de 25.000 genes. Sendo assim, somente 2 a 3% de todo o
genoma é composto por regiões codificáveis, enquanto 98 ou 97% são
compostos por regiões não codificáveis e regiões regulatórias.
A análise genômica permite identificar regiões hipervariáveis,
podendo levar a variações genéticas predispostas ao desenvolvimento
de doenças ou não.
As repetições em tandem (microssatélites) são regiões altamente
polimórficas atreladas à variabilidade entre cada ser humano, assim
como a extensão da repetição do tripleto CAG é um gene que, quando
presente na forma haploide, já é o suficiente para a geração de doenças.
A semelhança entre essas duas variações gênicas é que ambas fazem
parte dos 1% de diferença entre cada ser humano. As alterações
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 33

genômicas podem ser alterações simples em um nucleotídeo, levando


a diversas mutações como a missense, mutações pontuais e alterações
estruturais. Ambos tipos de alterações, quando encontradas em regiões
codificáveis, podem ser capazes de alterar funções proteicas. Entretanto,
essas alterações presentes em regiões não codificáveis, provavelmente
alteram a expressão gênica, processos de splicing ou não alteram.
Desde a elucidação das características do genoma humano,
dados genômicos têm sido gerados em velocidade e qualidade maiores,
permitindo os estudos focados em genes individuais para a comparação
genômica entre toda a população. Antes o melhor método utilizado
para sequenciamento era o de Sanger, envolvendo várias etapas que
consumiam tempo e custo. Hoje, o sequenciamento de nova geração
permite que a análise seja feita de forma muito mais rápida e eficiente. Após
o término do sequenciamento, fragmentos de leitura (reads) são gerados.
Para a montagem genômica, será necessário unir esses fragmentos em
um. Para isso, diferentes metodologias são utilizadas a depender da forma
de sequenciamento, a qual possui determinados programas de montagem.
Para o sequenciamento de Sanger, cada um desses reads são
alinhados entre si na procura de regiões de identidade ou de sobreposição,
de maneira a construir fragmentos contíguos (contigs), os quais podem
ser definidos como a união de duas ou mais sequências formadas por
sobreposição de elementos comuns a pelo menos duas sequências.
Diferente dos eucariotos, nos procariotos, ao final do sequencia-
mento de seus genomas, é esperada a obtenção de uma sequência
única, a qual representa toda a sequência nucleotídica do cromossomo.
Esse processo se caracteriza como microbioma.
Ao ser analisado o genoma de organismos eucariotos, nos quais se
encontra uma grande variação no número de cromossomos, um grande
número de contigs é esperado. O genoma dos eucariotos, ao menos dos
eucariotos superiores, é muito mais complexo, tornando o processo de
montagem difícil devido a dois motivos: uma quantidade considerável de
sequências repetitivas, que dificulta o processo de montagem devido a
alinhamentos de alto escore com diversas sequências e o seu tamanho,
podendo chegar a mais de 3 bilhões de pares de bases, em organismos
humanos.
34 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

Entretanto, para superar essas dificuldades, alguns processos são


adotados, os quais se assemelham bastante ao segundo método de
shotgun (shotgun hierárquico). Em casos de bibliotecas muito grandes,
serão necessários a formação de sub-bibliotecas e o sequenciamento
delas. Essas sub-bibliotecas formarão mais contigs ainda menores.
Esse conjunto de contigs será utilizado para a geração de scaffolds.
Geralmente são necessários passos adicionais de clonagem de regiões
específicas do genoma para o posterior fechamento do genoma.

DEFINIÇÃO:
Scaffods são criados encadeando contigs usando informa-
ções adicionais sobre a posição e orientação relativa dos
contigs no genoma.

Figura 6: Os processos de construção do genoma


em um sequenciamento – Scaffolds e contigs

Fonte: http://bit.ly/2Y06suE

Um dos maiores desafios para a montagem do genoma reside


na adequada montagem de regiões altamente repetitivas, como
os minissatélites, microssatélites, Elementos Nucleares Pequenos
Intercalados (SINEs), Elementos Nucleares Longos Intercalados (LINEs),
transposons, retrotransposons e clusters de DNAr (genes responsáveis
pela síntese dos RNAs ribossômicos – rRNA). Estas diferentes classes
podem diferir em tamanho como de centenas de pares de bases,
SINEs e microssatélites, a dezenas de milhares pares de bases, como
os clusters de rDNA, podendo chegar a fazer parte de 50% ou mais do
tamanho do cromossomo humano.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 35

Sendo assim, o grande desafio na montagem de sequências


genômicas reside na identificação da localização cromossômica e
quantificação destes fragmentos de repetição. Desta forma, para superar
esse desafio, a montagem de genoma reside em duas formas: obtenção
de reads com tamanho menor do que uma unidade repetitiva, para
formar contigs que só tenha unidades de repetição, podendo identifica-
las e obtenção de reads maiores do que uma unidade de repetição,
podendo localizar a posição cromossômica dessas repetições.

Transcriptoma

DEFINIÇÃO:
O estudo da transcriptoma é a análise da quantidade total
de dados transcritos, RNA, em uma célula, consistindo em
RNAs capazes de codificar uma mensagem em cadeia
proteica (mRNA equivalente a 1 a 4% dos RNAs transcritos) e
RNAs não codificáveis (rRNA, tRNA, iRNA, miRNA e lcnRNA,
fazendo parte de mais de 95% dos RNAs existentes).

A análise da transcrição gênica via mRNA provem visões acerca


do nível de expressão de genes específicos dentro de uma célula ou em
um órgão bem específico. Características como ausência ou presença
de quantificação de um transcrito; avaliação de splicings alternativos
para poder predizer isoformas proteicas; e análise quantitativa da
influência de um genótipo na expressão de um gene, permitem um
melhor entendimento da dinâmica do metabolismo celular e uma melhor
observação se uma mudança em um perfil de transcriptoma pode levar
no desenvolvimento de doenças.
Entre a década de 80 e os anos 2000, havia métodos de
sequenciamento de RNA a partir da técnica de Sanger: EST (expressed
sequence tags) e SAGE (serial analysis of gene expression). Esses
métodos, assim como a técnica de Sanger, eram de baixos rendimentos,
necessitando então outras técnicas de alto rendimento e baixo custo
para a realização do sequenciamento de RNA. Devido a essa demanda,
naquele período o método de microarray foi o método mais empregado
para a identificação de expressão gênica. Entretanto, com a evolução dos
36 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

sequenciadores de nova geração, outras áreas do estudo (ômicas) foram


sendo adaptadas para essas novas plataformas de sequenciamento,
dentre elas a transcriptoma.
Para a diferenciação, o termo “RNA-Seq” foi utilizado para se
referir à aplicação do sequenciamento a transcritos de RNA. Essa
aplicabilidade é muito importante para aqueles organismos que possuem
uma concentração de íntrons muito grande, como em eucariotos. Ao
contrário do genoma, o material da vez será um cDNA, pegado a partir
de uma transcriptase reversa de um mRNA. Sendo assim, uma grande
concentração de cDNA (pool de cDNA) será clonado e sequenciado pela
metodologia de Sanger, ou será sequenciado pelos sequenciadores de
nova geração. Uma grande lista de reads será obtida, os quais serão
utilizados para a montagem de um genoma de novo (sequência nova)
ou ancorados a sequências genômicas para ajudar a reconhecer as
sequências codificantes naquele genoma.

VOCÊ SABIA?
A utilização de RNA-Seq pode mensurar o efeito de diferentes
exposições de um genoma a fatores externos. Como a
expressão gênica varia de acordo com as condições na
qual um indivíduo, ou outro ser vivo, se encontra, então essa
técnica consegue mensurar a expressão de diferentes genes
simultaneamente. Essa análise, denominada de Expressão
Gênica Diferencial, permite entender o perfil de expressão de
um determinado organismo a diferentes condições.

A grande porcentagem dos trabalhos estuda o mRNA, entretanto,


um volume crescente de trabalhos sobre RNAs não codificantes, com
passível papel regulatório, estão sendo avaliados por essa metodologia.
Um exemplo é análise de miRNA através do mirDeep2.
Como já foi explicado, os miRNA são RNAs não codificáveis têm a
função de controlar a expressão gênica através da ancoragem ao mRNA,
impedindo a sua tradução ou promovendo a sua degradação. Esses miRNA
podem ser derivados de regiões gênicas ou não gênicas. Além do mais,
nem sempre o alvo daquele miRNA é equivalente ao que ele é derivado,
já que a sua sequência final nem sempre será um reflexo direto da porção
genômica da que lhe originou, sendo que essas moléculas podem passar
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 37

por diferentes modificações enzimáticas durante a sua biogênese. Nestes


casos, as subclasses desses miRNAs são chamadas de isomiR.
A mesma abordagem utilizada para o sequenciamento do mRNA
pode ser utilizada para o do miRNA, modificando algumas coisas no
protocolo, como o uso de adaptadores específicos, etapas de circulari-
zação e seleção por tamanho. A partir dos miRNAs identificados na
análise, é possível determinar os genes alvo, vias de regulação e
variações na expressão destes RNA.

Proteoma
O estudo da proteoma é a análise de todo o conjunto de proteína
em uma célula, tecido ou organismo. A proteômica é o estudo da proteoma,
entretanto, combinando algumas outras apropriações como proteoma
estrutural e interação proteína-proteína (PPI). Comparando o estudo da
proteoma em relação à transcriptoma e genoma, conseguimos identificar um
aumento na complexidade dos estudos, visto que 4 nucleotídeos de DNA e
RNA, em combinação valendo repetição, dá origem a 20 aminoácidos, os quais
podem interagir entre si formando conformações distintas para produzir uma
proteína funcional no final. Outra coisa relevante é que múltiplas isoformas
de uma proteína pode ser originada a partir de processos alternativos de
splicing. Então, a proteoma trabalha em cima da cadeia primária da proteína,
identificando ou quantificando-a, a proteoma estrutural trabalha em cima da
construção tridimensional da proteína e os tipos de modificações proteicas e
as PPIs trabalham com as interações funcionais das proteínas.
O estudo da estrutura primária da proteína tem o potencial
de descrever a diferenciação tecidual e descoberta de marcadores
diagnósticos para doenças.
Somente o estudo da cadeia primária não vai gerar resultados
satisfatórios, a predição da estrutura tridimensional da proteína é
importante já que a função proteica depende de como essa proteína é
enovelada. Estudar a estrutura primária deixa mais fácil a atividade de
identificação da estrutura de uma determinada proteína e até mesmo
das mutações ocasionadas por trocas de aminoácidos.
Proteínas 3D são obtidas através de métodos de raio-X, ressonância
nuclear magnética e microscopia crio-eletrônica. Essas técnicas tem o
38 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

intuito de: (I) visualizar um domínio proteico, (II) inferir um mecanismo


molecular e função proteica, (III) estudar mudanças estruturais devido a
mutações genética, as quais levaram na mudança de aminoácidos e (IV)
descobrimento de novas drogas farmacêuticas.
Análise em proteoma é algo extremamente dinâmico, afinal
tudo depende do tipo de amostra e as condições de amostragem. Por
exemplo, uma mesma técnica em proteoma aplicada em amostras com
elevadas heterogeneidades, acaba complicando a comparação entre
diferentes estudos, dificultando também uma compreensão universal a
partir de uma referência para a proteômica humana.
Outra aplicação da proteômica é a avaliação da PPI. A PPI ocorre
quando duas proteínas interagem fisicamente em um complexo. O
interesse crescente no entendimento do poder das interações funcionais
entre proteínas é baseado na hipótese de que duas proteínas em
interação provavelmente compartilham tarefas em comum.

Metabolômica
Os metabólitos são, como o nome já diz, produtos oriundos do
metabolismo. Esses produtos são capazes de realizar uma predição
da expressão gênica de um determinado organismo. Sendo assim, os
metabólitos, em conjunto com as proteínas, são um reflexo do nível de
transcrição envolvendo aquele genoma e o nível de transcrição também
diz a interação que a célula tem com o meio externo ou como anda o
equilíbrio interno.

VOCÊ SABIA?
Sendo assim, sem mais delongas, o estudo do conjunto de
metabólitos envolvendo uma célula, tecido ou organismo e
a sua medida quantitativa após estímulos fisiopatológicos
ou modificações genéticas é chamado de Metabolômica.

Normalmente, os estudos metabólicos envolvem muito mais


ramificações bioquímicas, já que essa é uma visão integrada da
bioquímica em organismos complexos. Existem duas ramificações
dessa área: Metabolômica alvo, definida com a análise quantitativa
de um ou mais pré-metabólitos selecionados de determinada classe
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 39

química, ou que estejam associados a rotas metabólicas específicas; e


Metabolômica global, definida pela análise quantitativa do maior número
de metabólitos possíveis, pertencentes a diversas classes químicas,
contidas no sistema biológico estudado. Vale ressaltar que esse estudo
se baseia bastante em comparações.
A análise Metabolômica de um grupo de indivíduos exposto a
alterações ambientais, genéticas ou sobre uso de medicamentos em
comparação a um grupo não exposto. Essa comparação pode fornecer
informações essenciais para o entendimento da geração de um fenótipo
devido à exposição de algum fator, seja ele ambiental, químico ou genético.
Essa é uma área que anda sendo aplicada a diversas ocasiões,
em análises clínicas, nutrição, educação física, ambiental, toxicologia
forense, genética, doenças infectocontagiosas e entre outros.

VOCÊ SABIA?
Para ficar sabendo mais sobre os procedimentos
envolvendo a Metabolômica, leia o artigo Metabolômica:
Definições, Estado-da-arte e Aplicações Representativas,
disponível no link: https://bit.ly/2lP0AoM

RESUMINDO:
E então? Gostou do que lhe mostramos? Aprendeu mesmo
tudinho?Agora, só para termos certeza de quevocê realmente
entendeu o tema de estudo deste capítulo, vamos resumir
tudo o que vimos. Você deve ter visto detalhadamente
as aplicações da técnica do sequenciamento, como
genômica, proteômica, tanscriptoma e metabolômica, que
correspondem ao estudo das ômicas. Viu que genômica
é o estudo de todo o genoma de um organismo e que o
estudo da transcriptoma é a análise da quantidade total de
dados transcritos. Aprendeu que proteômica é a análise
de todo o conjunto de proteína em uma célula, tecido ou
organismo e que metabolômica é o estudo do conjunto
de metabólitos. Compreendeu a aplicabilidade de todas
essas técnicas, viu que podem ser utilizadas em áreas de
genética, na detecção de doenças infectocontagiosas,
oncologia, análises clínicas, entre outras áreas. Devido a
isso, muito tem se investido na geração de algoritmos e
programas para analisar as sequências genômicas geradas.
40 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

Avanços tecnológicos do sequenciamento


INTRODUÇÃO:
Neste último capítulo sobre a aplicação da biologia
molecular no diagnóstico laboratorial você aprenderá
sobre os novos métodos de sequenciamento, ainda
mais avançados, que nos permite mais adaptação ao
sequenciamento de pares de base de características
diversas e abordaremos exemplos de aplicabilidades
práticas desses novos métodos de sequenciamento.

Sequenciamento de terceira geração


As plataformas de sequenciamento de segunda geração,
explicadas no capítulo 2, ainda são as plataformas mais utilizadas para
o sequenciamento de dados. Entretanto, elas possuem a característica
de sequenciar dados de leituras curtas (short-reads), tornando o
processo de leitura bastante complicado quando se trata de processo
de montagem de genomas ou transcritos longos. Além do mais, ainda
existem dificuldades explicadas anteriormente, entretanto, acabam
aparecendo quando se trata da montagem de genomas e de transcritos
longos. O problema envolvendo os genomas é a reconstrução de
sequências contendo repetições em tandem (microssatélites, SINEs) e
a reconstrução de genes que possuem muitas cópias no genoma. No
caso dos transcritos longos, o problema é reconstruir com exatidão os
transcritos longos que possuem bastante isoformas.
Sendo assim, mais uma vez houve a demanda por novas
plataformas que se adaptassem a essas condições envolvendo o
sequenciamento. A seguir, serão abordadas algumas plataformas de
sequenciamento long-read. Entretanto, antes serão abordadas as formas
de clonagem de bibliotecas de DNA adaptadas às novas plataformas.

Bibliotecas de DNA da terceira geração


A função das bibliotecas de DNA seria a fragmentação do gene
da multiplicação dos fragmentos através do uso de plasmídeos de
clonagem. Entretanto, essa metodologia é bem empregada quando se
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 41

trata de plataformas de sequenciamento de short-reads, onde a leitura


de fragmentos grandes seria inviável devido à própria característica do
sequenciador.
Portanto, em sequenciadores de terceira geração, tendo a
capacidade de realizar leituras longas, a construção de bibliotecas de
DNA não será necessária, podendo sequenciar as duas fitas de DNA
genômico, ou no caso da Oxford Nanopore, uma só.

PacBio
A plataforma de sequenciamento SMRT (single-molecule real-
time sequencing), comercializado pelo Pacific Biosciences (PacBio),
utiliza uma abordagem de sequenciamento em tempo real, sendo
algumas etapas de seu processo bastante similares com a utilizada pela
HeliScope. Entretanto, ao contrário da HeliScope que lê 25 a 35 pares de
base, a SMRT tem a capacidade de leitura extremamente aumentada,
alcançando, aproximadamente, 20Kb.
Figura 7: Sequenciamento pela plataforma PacBio

Fonte: http://bit.ly/35D2GKb

O sequenciamento promovido pela HeliScope ocorre através do


aprisionamento dos fragmentos a serem sequenciados em uma placa de
vidro (assim como os outros já mencionados) e a adição dos reagentes
para a amplificação das fitas aderidas. Os nucleotídeos adicionados são
42 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

marcados com um fluorocromo que, ao sofrer a varredura do sistema


ótico do aparelho, irá emitir um sinal fluorescente que será detectado
individualmente por um sensor de alta resolução.
A semelhança entre o sequenciamento da HeliScope e a SMRT
está na forma de sequenciamento. Após a desnaturação do DNA, as
extremidades de ambas as fitas serão unidas, formando uma fita única
celular com auto pareamento. A fita circular vai gerar somente uma única
amplificação/sequenciamento em alguns ciclos, como se fosse uma
nova PCR, só que agora em um genoma. Essas leituras são chamadas
de CCS (clusters of circular consensus).
Figura 8: Processo de CCS (clusters of circular consensus)

Fonte: http://bit.ly/2DoWNUK

Esse processo é realizado dentro de um nano-poço, sendo


que em cada nano-poço há uma DNA-polimerase fixada. A cada ciclo,
uma base diferente é adicionada e, ao ser adicionado, um fluoróforo é
liberado.
Entretanto, na PacBio, a reação enzimática é detectada em tempo
real, bem como a velocidade com qual era realizada a incorporação.
Essa reação enzimática é capaz de detectar alterações epigenéticas,
como metilações em bases específicas, visto que a atividade dessa
enzima acaba sendo alterada.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 43

Oxford Nanopore (MinION)


Uma plataforma bastante diferenciada e tanto quanto revolucionária
de sequenciamento é a fabricada pela empresa Oxford, Nanopore –
MinION. Essa técnica é baseada em sequenciamento em nanoporos, os
quais contem proteínas canais que têm a função de emitir uma corrente
elétrica à medida que a amostra de DNA vai passando pelos nanoporos.
Além de realizar leituras em longos fragmentos, também é capaz de
realizar em fragmentos curtos, dando uma maior flexibilidade na leitura.
Uma das características que faz essa plataforma ser revolucionária
é o tamanho do sequenciador, chegando a pesar cerca de 100 gramas,
tornando um sequenciador portátil e tendo também uma porta USB para
a transferência de dados para a máquina, seja computador ou laptop.
Uma outra grande vantagem é o custo de aquisição dessa plataforma,
custando cerca de U$ 1.000,00, enquanto um sequenciador Ion Torrent
pode custar cerca de R$ 200.000 no Brasil. Entretanto, essa plataforma
ainda não tem a precisão de análise que as outras plataformas possuem,
tendo que ser melhorado o seu poder de leitura, afinal, é uma tecnologia
bastante acessível e fácil de manusear.
Figura 9: MinION – Oxford Nanopore

Fonte: http://bit.ly/35D2U3Z

Pesquisadores têm testado a precisão diagnóstica de MinION


para uma aplicabilidade em laboratório de diagnóstico. O projeto ZIBRA
possui o intuito de ampliar o banco de dados genômicos do vírus Zika,
utilizando o sequenciador da Oxford. Embora essa plataforma ainda não
seja bastante confiável para laboratório de diagnóstico, houve trabalhos
com a Nanopore para detectar a diversidade genética do vírus Ebola em
Guiné, obtendo sucesso nos resultados.
44 Aplicação da Biologia Molecular no Diagnóstico Laboratorial

SAIBA MAIS:
Para conhecer mais a respeito do projeto Zibra e seus
resultados, acesse ao site oficial do projeto, disponível em:
https://bit.ly/2mbtPm3

RESUMINDO:
E então? Gostou do que lhe mostramos? Aprendeu mesmo
tudinho? Agora, só para termos certeza de que você
realmente entendeu o tema de estudo deste capítulo,
vamos resumir tudo o que vimos. Você deve ter visto
detalhadamente as os tipos de sequenciamentos mais
utilizados em laboratórios e os avanços tecnológicos que
ocorreram com as plataformas. Aprendeu que existem
diferentes tipos de leituras, como a short-read e long-read,
que irão influenciar o processo de leitura de transcritos
que podem ser longos ou curtos. Compreendeu que os
sequenciadores de terceira geração possuem capacidade
de ler transcritos mais longos, tendo uma vantagem com
relação aos sequenciadores de segunda geração (que
ainda são mais utilizados). Conheceu sobre a PacBio, que
utiliza uma abordagem de sequenciamento em tempo real
e sobre a minION que realiza o sequenciamento através de
nanoporos. Entendeu a importância dessas técnicas para o
diagnóstico laboratorial, auxiliando no sequenciamento de
vírus como Zika e Ebola.
Aplicação da Biologia Molecular no Diagnóstico Laboratorial 45

BIBLIOGRAFIA
Analisando miRNAs com mirDeep2 - omixdata - Medium. (n.d.).
Retrieved September 7, 2019, from: http://bit.ly/37FNYUy.
Caimano, M. J., Sivasankaran, S. K., Allard, A., Hurley, D., Hokamp,
K., Grassmann, A. A., … Nally, J. E. (2014). A Model System for Studying the
Transcriptomic and Physiological Changes Associated with Mammalian
Host-Adaptation by Leptospira interrogans Serovar Copenhageni. PLoS
Pathogens, 10(3). http://bit.ly/2XQXnnT.
Manzoni, C., Kia, D. A., Vandrovcova, J., Hardy, J., Wood, N. W.,
Lewis, P. A., & Ferrari, R. (2018). Genome, transcriptome and proteome:
The rise of omics data and their integration in biomedical sciences.
Briefings in Bioinformatics, 19(2), 286-302. http://bit.ly/2OTuCCZ.
Sequenciamentos de 3a e 4a geração: ao infinito e mais além!
- Profissão Biotec. (n.d.). Retrieved September 7, 2019, from: http://bit.
ly/2KXTXu0.

Você também pode gostar