Você está na página 1de 25

Análise de Fragmentos

A análise de fragmentos através de eletroforese capilar é uma técnica amplamente


empregada na pesquisa genética. Essa técnica baseia-se na determinação do tamanho
de fragmentos amplificados por PCR, utilizando primers marcados com fluorescência,
por comparação com um marcador de tamanho conhecido (size standard). O uso de
diferentes fluorescências permite a análise vários fragmentos (lócos) ao mesmo tempo.

Após a PCR, os fragmentos são submetidos a uma eletroforese capilar, nos sequenciadores
automáticos de DNA.

As principais aplicações da análise de fragmentos são:


1. Análise de Microssatélites (regiões repetitivas)
2. Genotipagem de SNPs
3. Identificação Humana
4. Diagnóstico Clínico (KRAS & BRAF)
5. AFLP (Amplified Fragment Length Polymorphism)
6. RFLP (Restriction Fragment Length Polymorphism)
7. Quimerismo
8. ISSR (Inter-Simple Sequence Repeat)
9. MLPA (Multiplex Ligation-dependent Probe Amplification) - The MLPA® procedure from A
to Z
10. LOH (Loss of Heterozigozity)

Veja abaixo quais são os principais problemas associados a análise de fragmentos por
eletroforese capilar.

1. Picos +A/-A
Durante a PCR muitas polimerases inserem uma adenina no final dos fragmentos. Quando
apenas parte dos fragmentos estam adenilados, um pico menor é vizualizado junto ao pico
correspondente do fragmento. A estratégia para resolver este problema é forçar a adenilação
dos fragmentos, aumentando o tempo de extensão final na PCR.

2. Picos Stutter
Os picos stutter são artefatos resultantes da amplificação dos microssatélites,
caracterizados pela presença de umaunidade de repetição mais curta em relação ao alelo princ
ipal (frequência de 3-12%). Para um dado loco STR, a probabilidade de
stutter geralmente aumenta com
o tamanho dos alelos (maior número de unidades de repetição) e com
o tamanho da unidade de repetição (em pares de bases). A porcentagem de stutter
é proporcional à concentração de cloreto de magnésio (MgCl2) e é muito
reprodutível para um determinado alelo.

A quantificação dos picos pode facilitar a interpretação dos resultados quando ocorre sobreposi
ção dos picos com stutters.

3. Allele Drop-out
Drop-out = falha de amplificação de locos/alelos específicos. A possibilidade de ocorrer drop-
out aumenta quando se utilizam-se pequenas quantidades de DNA, quando existe algum
contaminante inibidor na amostra (ex: hematina, ácido húmico, fenol, etc.), ou quando as
amostras estão degradadas ou comprometidas.

4. Sinal muito intenso (Offscale)


A ocorrência de um sinal muito intenso resultante das suas amostras ou do Size Standard pode
derrubar os valores de qualidade dos genótipos atribuídos às suas amostras.
Picos com sinais muito intensos são marcados pelo software GeneMapper com uma faixa lilás.
Exemplo de amostra com sinal "estourado".

Para diminuir os problemas de sinal muito intenso, você precisa otimizar a diluição do seu
produto de PCR e a quantidade de Size Standard utilizado, para que o sinal não ultrapasse o
limiar máximo de detecção do software. Além disso, para aumentar a precisão e a
confiabilidade dos seus resultados, procure sempre otimizar o preparo da sua amostra de
modo que a intensidade dos picos seja semelhante a intensidade dos picos do Size Standard.
Quando você pretende analisar mais de um marcador em um mesmo ensaio, é também
fundamental que a intensidade dos picos de cada marcador seja o mais próxima possível.

Teste com diferentes proporções dos marcadores em cada amostra.


Em destaque o melhor resultado.

O excesso de primers que não foram incorporados na reação de PCR também pode
provocar um "estouro" de sinal, prejudicando as análises. Para resolver este tipo de problema
você pode customizar o seu Size Standard, deixando de fora os picos iniciais, geralmente
excluindo o pico da posição 35.
Importante (1): Mantenha a temperatura da sala do seu sequenciador sempre
constante (próxima 22 °C), principalmente durante as corridas. A oscilação da temperatura
pode alterar o padrão de migração das amostras e do Size Standard, interferindo na
construção da curva para determinação do tamanho dos fragmentos.

Importante (2): Procure sempre avaliar todas as amostras do seu projeto


utilizando o mesmo Size Standard, a mesma plataforma de sequenciamento, o mesmo tipo de
polímero e o mesmo comprimento de capliar. Diferentes Size Standards pode levar a obtenção
de alelos (tamanhos) diferentes, quando na verdade os alelos são os mesmos. O mesmo pode
acontecer quando são utilizados diferentes equipamentos para a eletroforese capilar, quando
se muda o tipo de polímero ou o comprimento do capilar. Veja o exemplo da figura abaixo, na
qual o mesmo alelo é identificado com tamanhos diferentes em diferentes plataformas:

Para evitar este tipo de erro você pode também utilizar controles positivos com genótipos
conhecidos ou uma escada alélica para analisar suas amostras.

Você tem ou já teve outros problemas. Envie


seus comentários.

...
Considerações sobre o Software GeneMapper®
Installation and Administration Guide
Reference and Troubleshooting Guide
Microsatellite Analysis Getting Started Guide
SNPlex™ System Analysis Getting Started Guide
AFLP® System Analysis Getting Started Guide
User Bulletin - Autoanalysis Guide

Com o auxílio do software GeneMapper você pode analisar seus dados de microssatélites,
SNaPshot, AFLP, LOH, MLPA, entre outros. Durate as análises são verificados componentes
de qualidade para cada uma das amostras e para os genótipos associados a estas
amostras. Para cada um desses componentes é atribuído um status,
como é visto na figura abaixo,

Veja abaixo uma descrição de alguns componentes e problemas que podem estar associados
a falha destes componentes:

OS - Offscale
Este componente é visualizado tanto na aba das amostras como dos genótipos. Entretanto,
seu significado difere em cada uma das abas. Na aba das amostras, a falha neste componente
está associada ao fato de um ou mais picos do Size Standard terem excedido o limiar máximo
de detecção. Já na aba dos genótipos a falha está relacionada à ocorrência de picos da
amostra que excedem o limiar máximo de detecção.
A falha no Offscale pode ser corrigida através da diminuição da quantitade de Size Standard ou
de amostra no preparo solução a ser levada para o sequenciador.
Importante: o uso de água ao invés de formamida no preparo da solução pode
produzir picos artificiais com intensidade elevada.

SQ - Sizing Quality
O Sizing Quality verifica a similaridade entre o padrão de fragmentos especificado para o Size
Standard e a distribuição real dos picos do Size Standard na minha amostra. A medida
do Sizing Quality é a combinação de valores que medem o sucesso de alguns algorítmos,
como os utilizados para a construção da curva “size-calling” do Size Standard, a partir da qual
o tamanho dos fragmentos pode ser determinado. O valor de SQ varia de 0 a 1 e, de acordo
com o threshold definido nas configurações do nosso método de análises, pode passar ou
falhar.
Problemas neste componente podem ser resolvidos através da otimização da quantidade de
Size Standard utilizado no preparo das amostras e pela utilização de um Size Standard
adequado para o DyeSet das amostras e para o tamanho dos fragmentos em análise.
GQ - Genotype Quality
O Genotype Quality é um resumo das medidas de qualidade associadas àquele genótipo.
Baixos valores de qualidade nos demais componentes, como para o OS, o SQ, etc, reduzem o
valor do Genotype Quality cerca de 50% (fator de correção 0,5). Quando o GQ das suas
amostras estiver baixo verifique qual é o processo de qualidade que está causando este
problema, para que ele possa ser corrigido.

Sequenciamento

Seus resultados de sequenciamento não estão tão bons quanto você gostaria?
Os eletroferogramas da sua corrida podem dar várias pistas do que pode ter
ocorrido e de como você pode melhorar seus resultados.

Exemplo de um dado analisado de excelente qualidade

Quando você sequencia produtos de PCR, o primeiro passo é obter um ótimo resultado de
PCR, otimizando seu protocolo para que sua amplificação seja específica para fragmento de
interesse. Produtos de PCR inespecíficos são um dos principais problemas na obtenção um
sequenciamento de qualidade.
Além disso, a quantidade de material de partida (DNA molde) para a sua reação de
sequenciamento é extremamente crítica para a obtenção de boas sequências. As quantidades
variam de acordo com o tamanho dos fragmentos que você pretende sequenciar. A tabela
abaixo pode servir como ponto de partida para a otimização da sua reação de sequenciamento.
O sistema Qubit®, da Invitrogen, faz a quantificação do DNA por fluorometria, e é mais
indicado que os métodos baseados em absorbância, pois quantifica especificamente o DNA
presente na solução.
A purificação, tanto do produto de PCR, quanto da reação de sequenciamento, é fundamental
para a obtenção de bons resultados de sequenciamento. Existem diversos Kits para a
purificação do produto de PCR, visite o site da Invitrogen e escolha o mais adequado para o
seu projeto. A Invitrogen também possui alguns Kits para purificação da reação de
sequenciamento (Sequencing Reaction Purification), entretanto o BigDye XTerminator®
Purification Kit é um dos protocolos mais rápidos e confiáveis.
Mesmo tomando todos os cuidados acima, ainda podem ocorrer problemas no nosso
sequenciamento.
Eletroferogramas mal resolvidos, com muitos picos sobrepostos, podem ser resultado do uso
de algorítimos de análise que são inespecíficos para o Kit (dye set) de sequenciamento
utilizado. Verifique sempre se o "basecaller" e o "mobility file" estão de acordo com o seu Kit.
Se não estiverem, reanalise seus dados utilizando os algorítimos adequados.
No seu programa de análises, verifique sempre a janela EPT para cada eletroferograma. Essa
janela mostra o status da corrente, da voltagem, temperatura do forno e potência do laser, que
são informações importantes para resolver problemas na sua corrida. Veja abaixo um exemplo
de como esses parâmetros devem se corportar durante uma boa corrida.

Oscilações na corrente podem levar a dados incosistentes ou até mesmo


falhas na leitura das sequências. Dentre as inúmeras causas para oscilação na
corrente, podemos citar: bolhas no bloco ou capilar, erros no preparo do
tampão, tampão velho, capilar entupido, decomposição do polímero e a
ocorrência de um arco voltáico no equipamento. A figura abaixo mostra um
capilar com problemas na corrente (linha verde).

Veja a seguir alguns exemplos de eletroferogramas que podem ajudar a identificar


problemas no sequenciamento.
1. Amplificação inespecífica
No dado bruto do sequenciamento, picos verdes que caracterizam o final dos fragmentos
amplificados por PCR (adenilação destes) podem ser observados.

O eletroferograma analisado mostra picos sobrepostos que impedem a determinação exata da


sequência.

2. Muito DNA molde na reação de sequenciamento


O excesso de DNA na reação de sequenciamento desequilibra a reação de modo que todos os
reagentes são consumidos rapidamente e uma quantidade muito maior de fragmentos curtos é
gerada, em relação aos maiores. No dado bruto é possível observar um perfil triangular do
sinal.

Obs. Muitas vezes esses perfis podem ser resultado do uso de pouco Mix na reação de
sequenciamento, pouco primer ou pouco DNA molde, presença d econtaminantes que inibem a
polimerase, ou ainda degradação do produto da reação de sequenciamento.

3. Ausência de sinal
Um eletroferograma sem sinal pode ter muitas causas, como a perda do material durante a
purificação da reação de sequenciamento, falha na reação de sequenciamento, ausência de
corrente durante a corrida, capilar entupido, mau funcionamento do kit de sequenciamento,
presença de inibidores na reação de sequenciamento (ex. Fenol) entre outros. Em muitos
desses casos, é muito comum a visualização de um pico alto no inicio do eletroferograma, que
correspode aos dideoxinucleotídeos que nao foram incorporados na reação.

4. Sinal muito baixo


Sinal muito baixo no eletroferograma pode ser reultado da utilização da quantidade insuficiente
de DNA molde na reação de sequenciamento ou falha na reação. Pode ainda ser resultado de
um tempo muito curto de injeção, da existência de sal na amostra ou de bolhas no tubo da
amostra ou de um volume muito baixo de amostra. O sinal baixo se confunde com o
background e impede a determinação precisa da sequência.
5. Sinal muito alto
Sinal muito alto pode ser resultado de excesso de DNA molde na reação de sequenciamento
ou de um tempo excessivo de injeção. O sinal muito alto prejudica a análise espectral e gera
um excesso de ruído (falsos picos).

6. Sinal aparece muito tarde no eletroferograma


Isto pode ocorrer devido ao uso de capilares muito longos, de uma injeção excessiva de
material no equipamento ou até mesmo de variações na temperatura da sala de
sequenciamento.

Muitas vezes isso pode estar associado a perda de resolução da amostra. Nesses casos, as
principais causas são a contaminação durante a eletroforese, a presença de água no polimero,
o não preenchimento adequado do capilar, etc.
7. Background elevado
Contaminação na água, polímero, seringas, blocos,
etc., resulta em background elevado. Além disso, sujeira nos capilares, nos
espelhos, polímero velho, etc, também podem levar a um background elevado.
Um background
elavado pode prejudicar a eletroforese e diminuir a vida útil dos capilares.

8. Contaminação da reação de sequenciamento


Dado bruto mostrando "contaminação verde" aparecendo junto
com os fragmentos de
DNA, talvezdevido a contaminações resultantes de má qualidade da extração d
e DNA, talco ou outro produto fluorescente na amostra. Contaminação com
primers ou produtos inespecíficos podem gerar perfis semelhantes.

No dado analisado observam-se picos duplos ao longo de toda sequência.

Problemas com o alinhamento da câmera CCD e com a calibração espectral também podem
estar entre as causas desses perfis.

9. Queda de uma das fluorescências


Verifique o software de análise que você está utilizando. Este problema problema geralmente
deve-se ao uso de versões anteriores do softaware Sequencing Analyzis v5.2, que possuem
erros no "basecaller".

10. Linha de base negativa


Contaminação em todas as fluorescências, abaixo do nível 0 de intensidade. Procure lavar
todos os componentes do sistema, realizando o wizard no software Data Collection.

11. Queda brusca na linha de base


Isso se deve provavelmente a problemas no sistema do equipamento e pode levar a perda de
dados no ponto da queda. Entre em contato com um técnico da empresa fabricante.
12. Queda brusca e permanente no sinal
Queda permanente no sinal indica provavelmente o final do fragmento sendo analisado. Isso
ocorre principalemnte no sequenciamento de fragmentos curtos de DNA.

Muitas vezes, o sinal cai antes do final do fragmento, provavelmente devido ao uso de
quantidade insuficiente de Mix de sequenciamento ou por um problema da polimerase em
sintetizar através de um contexto específico de bases.

13. Problemas na purificação


Centrifugação ou álcool na concentração errada (dado bruto) causando a perda
dos fragmentos menores durante a purificação.

excesso de álcool (dado analisado). Artefatos que atrapalham a


Centrifugação ou
leitura da sequência, localizados proximos as posições 70, 120 e 180 do
eletroferograma são indicativos de uma purificação ruim.
14. Contaminação por etanol
Mancha fluorescente ocasionada por problemas na remoção total
de etanol após a precipitação geraerros na determinação das bases.

15. Picos de Polímero


Picos agudos, de todas as
cores, numa mesma posição devido à cristais de uréia no polímero.
Paraevitar, retirar da geladeira o polímero ~30 min antes
de colocar no equipamento.
Obs. Bolhas e pó (como talco) também podem gerar picos semelhantes quando passarm pela
janela de detecção.
Picos de uma única cor podem ser resultado elevada temperatura do polímero, pouco volume
de amostra no poço ou flutuações na corrente.

Grandes picos no final da corrida também podem aparecer, um artefato associado aos
sistemas de eletroforese capilar, mas que nao interfere na qualidade dos dados.

16. Capliar velho


Picos com arraste para a direita e
com má resolução (vales pouco profundos entre os picos).
Obs. Injeção em excesso e contaminação do primer de sequenciamento com primers n+1 ou n-
1 também podem gerar perfis semelhantes.

17. Sujeira no capilar


No dado bruto os picos
são inicialmente agudos, mas ficam gradualmente alargados e arrastadosdevid
o ao entupimento temporário do capilar. Causas comuns incluem proteínas e o
utras sujeiras daextração de DNA. A perda gradual da resolução ao longo da
sequência também pode ser devido a degradação da amostra, da formamida,
do capilar, injeção em excesso ou oscilação na corrente durante a corrida.
18. Degradação da Formamida
Formamida degradada impede, entre outras coisas, a captura da fluorescência e a migração
ideal dos fragmentos através do capilar. Formamida de boa qualidade permece congelada
qaundo está no freezer. Se sua formamida estiver líquida, troque por uma nova.

19. Dimeros de primers


Sequências curtas formadas por dimeros de primers são amplificadas preferenciamente. Para
resolver esse problema, redesenhe seus primers e utilize enzimas com sistema "hot start".
No dados analisado observa-se:

20. Picos irregulares de C com o BigDye® Terminators v3.1


Degradação do Kit de sequenciamento ou da formamida podem levar perfis como os de
abaixo. A exposição da reação de sequenciamento à luz, calor, condições ácidas, etc, pode
degradar os produtos e levar a esses mesmos perfis. A ressuspenção das amostras em água
pode levar a formação de estruturas internas e falhas na migração dos fragmentos.

21. Picos irregulares de G com o BigDye® Terminators v1.1 e v3.1


Degradação do Kit de sequenciamento ou da formamida podem levar perfis como os de
abaixo. A exposição da reação de sequenciamento à luz, calor, condições ácidas, etc, pode
degradar os produtos e levar a esses mesmos perfis. A ressuspenção das amostras em água
pode levar a formação de estruturas internas e falhas na migração dos fragmentos.

22. Compressão dos picos


Geralmente ocorre em regiões ricas em conteúdo GC devido a não desnaturação do produto.
23. Picos duplos sob bases específicas
Esse tipo de problema ocorre principalmente devido à uma calibarção espectral incorreta ou
pela injeção de muita amostra no capilar.

24. Sequências repetitivas


Regiões repetitivas promovem instabilidades durante a amplificação devido a dificuldade da
polimerase em sintetizar através dessas regiões. No eletroferograma observam-se picos
sobrepostos após a região repetitiva.

25. Polimorfismos de inserção-deleção


Esses polimorfismos causam a sobreposição dos picos na sequência a partir do ponto em que
ocorrem.

26. Perda da resolução no meio da sequência


Ocorre provavelmente devido à presença de contaminantes na amostra ou no sistema, bolhas
no capilar, substituição parcial do polímero velho pelo novo, etc.
Análise de metilação por
sequenciamento

A metilação do DNA é um dos


mecanismos mais importantes para a regulação
da expressão gênica. Perfis de metilação estão
associados não apenas aos diferentes tipos
celulares e tecidos e à idade do organismo, mas
também às condiçoes fisiológicas deste
organismo.

As regiões metiladas geralmente estão


associadas as reigões promotoras dos genes, formando domínios que são conhecidos como
ilhas CpG. Essas ilhas, qaundo metiladas, promovem o silenciamento gênico.
A metodologia tradicional para análise de regiões metiladas envolve o tratamento do DNA com
bissulfito, que promove a conversão de todas as citosinas não metiladas em uracilas. A
identificação das citosinas metiladas e não metiladas nos sítios CpG pode então ser realizada
por PCR Metilação-Específica, ou, mais frequentemente, por sequenciamento. O nível de
metilação das regiões genômicas de interesse também pode ser determinado por análise de
fragmentos ou através da construção de uma curva de dissociação (HRM).
O methylSEQr™ Bisulfite Conversion Kit é uma excelente opção para conversão do DNA
por bissulfito.
Existem outras abordagens que podem ser utilizadas, como por exemplo a seleção de regiões
metiladas através do uso de kits capazes de capturar essas regiões, como por exemplo
o MethylMiner™ Methylated DNA Enrichment Kit. As regiões capturadas podem,
posteriormente, ser analisadas de diversas maneiras, incluindo sequenciamento e análise de
fragmentos.
O desenho dos primes para a análise de metilação é um dos passos mais críticos da
metodologia, tanto quando se pretende analisar a metilação pelos métodos tradicionais, como
a PCR Metilação-Específica, como por sequenciamento e análise de fragmentos.
Para a análise de metilação por sequenciamento ou análise de fragmentos os primers para
amplificação precisam ser posicionados em regiões flanqueadoras do segmento que se
pretende avaliar e não é recomendado que contenham sítios CpG. Além disso, também é
recomendado que os primers contenham o maior número possível de Cs (fora dos sítios CpG),
para que amplifiquem especificamente o DNA convertido por bissulfito.
O software Methyl Primer Express é uma ferramenta gratuita e bastante útil para projeção e
avaliação dos primers para estudos de metilação. Faça o download para seu computador.

Para saber mais sobre os estudos de metilação em diferentes organismos acesse o


banco de dados: http://www.methdb.de/
(MethDB - the database for DNA methylation and environmental epigenetic
effects)

...
Veja a seguir alguns problemas que podem
ocorrer na análise de metilação por
sequenciamento
1. Picos alargados
Fragmentos com conversão parcial das citosinas migram de forma desigual e promovem
distorções nos picos. Otimizar a conversão por bissulfito pode ajudar a resolver este problema.
2. Conversão parcial do DNA
A conversão parcial por bissulfito pode levar a ocorrência de picos sobrepostos ao longo de
toda sequência.

3. Picos duplos no inicio da sequência


Esse perfil deve-se a formação de dimeros de primer e sua amplificação durante a PCR. A
utilização de polimerases com sistema "hot start" pode diminuir esse problema. Caso contrário,
redesenhe seus primers.

4. Picos específicos sob bases específicas


Quando sequências tratadas com bissulfito são analisadas usando o ABI basecaller, o software
pode supercalibrar para a ausência de picos de citosina.
5. Picos duplos após sequência repetitiva
Regiões repetitivas promovem instabilidades durante a amplificação devido a dificuldade da
polimerase em sintetizar através dessas regiões. No eletroferograma observam-se picos
sobrepostos após a região repetitiva.
PCR x Sequenciamento

Muito embora muitos possam confundir, a


reação de sequenciamento não é uma PCR,
apesar de também basear-se no princípio de
cópia do DNA in vitro, utilizando uma DNA
polimerase. Tanto isso é verdade, que o
sequenciamento foi desenvolvido pelo menos
seis anos antes da PCR.
A PCR impulsionou o estudo por sequenciamento de regiões específicas do DNA, entretanto,
ainda hoje é possível fazer sequenciamento, sem utilizar uma reação de PCR previamente.
Todos os grandes projetos genoma foram desenvolvidos sem a utilização da PCR, através da
clonagem do DNA genômico fragmentado.

Você sabe quais as principais diferenças entre a reação de sequenciamento e a PCR?


A principal diferença é o fato de a PCR ser uma amplificação exponêncial do DNA, enquanto
que a reação de sequenciamento é uma amplificação linear, pois apenas uma das fitas é
utilizada como molde para cópia (apenas um primer é adicionado a reação e não um par de
primers como na PCR).

PCR
Reação de Sequenciamento

Além disso, na reação de sequenciamento é utilizada uma mistura de deoxinucleotídeos


(dNTPs) e dideoxinucleotídeos (ddNTPs), enquanto que na PCR são utilizados apenas dNTPs.
Os ddNTPs são marcados com moléculas fluorescentes e, quando incorporados pela
polimerase à molécula crescente de DNA, levam à interrupção do seu alongamento, pois
possuem a extemidade 3' modificada.

Modelo esquemático mostrando as diferenças entre uma molécula de dNTP e uma de ddNTP.

Leia os discursos dos vencedores do Prêmio Nobel de Química de 1980, Frederick Sanger,
pelo desenvolvimento da técnica de sequenciamento, e de 1993, de Kary B. Mullis, pelo
desenvolvimento da PCR.

Você também pode gostar