Você está na página 1de 16

E.

Novaes

Universidade Federal de Lavras


Departamento de Biologia
Pós-Graduação em Genética e Melhoramento de Plantas

GENÔMICA E BIOINFORMÁTICA

Aula 5 – SNPs e Genotipagem por Sequenciamento

Professor: Evandro Novaes

Introdução

• Sequência referência é só o início


• Próximo passos: entender a natureza e a distribuição da
variabilidade genética nos indivíduos

1
E. Novaes

Polimorfismos
• Na definição clássica (genética de pop.) são
diferenças nas moléculas de DNA da população,
em que o alelo mais frequente possui <99%.
– Através desse critério, boa parte da variabilidade (alelos
raros) são desconsiderados

Mutações vs. Polimorfismo


• Mutação é o ato (pontual) que causa alterações
no genoma.
• Todos os polimorfismos se originam a partir de
mutações
• No entanto a mutação já ocorreu há algum
tempo e, portanto, os polimorfismos não podem
mais ser denominados mutação

2
E. Novaes

Polimorfismos
- Larga escala: variações estruturais

Single Nucleotide Polymorphism (SNPs)

• Forma mais comum de polimorfismo nos genomas

• Diversidade de SNPs em seres humanos é de 0,1%


– 1 SNP a cada 1000bp diferencia pares de indivíduos
selecionados aleatóriamente
– 3 milhões de SNPs

• Em plantas essa diversidade pode ser >2%

3
E. Novaes

SNPs
• São alterações que afetam uma base nucleotídica
• Indels de uma base também podem ser considerados SNPs
• Classificações:
– Natureza do nucleotídeo afetado: não codante ou codante (sinônimo ou
não sinônimo)
– Tipo de alteração de base: transição ou transversão

Descoberta de SNPs

4
E. Novaes

Descoberta de SNPs
• Se dá através da comparação das sequências de
diferentes cromossomos (haplótipos);

• Quanto mais indivíduos são sequenciados, maior é a


probabilidade de se detectar os SNPs

P = 1 - (1 - p) 2n

Descoberta de SNPs
• Sequências podem ser geradas de novo ou obtidas de bancos de
dados genômicos
– No passado, era comum a mineração de bancos de ESTs para descoberta de
SNPs

• SNPs identificados devem ter uma nota de qualidade baseado:


– Número de reads alinhados

– Qualidade das bases naquela região

• Software muito utilizado com Sanger – PolyBayes


– NGS: GATK, FreeBayes, SoapSNP, SAMTools

10

5
E. Novaes

11

Genotipagem de SNPs

12

6
E. Novaes

Tecnologias de genotipagem de SNPs

• Metodologias “low-throughput” (baixa eficiência)

• Baseadas em microarranjo

• Baseadas em “single base extention”


– Illumina Infinium
– Sequenom

• Descoberta e genotipagem de SNPs com


sequenciamento de alta performance (NGS)
– Genotype by sequencing (GBS)

13

Infinium

14

7
E. Novaes

Infinium

15

BeadArrays

16

8
E. Novaes

17

Descoberta e genotipagem de SNPs com


sequenciamento de alta performance

18

9
E. Novaes

Genotipagem por sequenciamento


• Descoberta e genotipagem ao mesmo tempo: não
necessita SNPs préviamente descobertos
(democratização)
• Sequenciamento completo de vários genomas ainda é
proibitivo
– Para a grande maioria das aplicações não necessitamos de uma
completa genotipagem do genoma
– Mesmo nos estudos de associação, esforços de genotipagem
podem ser reduzidos devido ao desequilíbrio de ligação

19

Genotipagem por sequenciamento


• Grande eficiência das novas tecnologias de
sequenciamento permite genotipagem de SNPs em vários
indivíduos (multiplex) em uma mesma rodada de seq.

• No entanto:
– Maior taxa de erro exige maior profundidade de cobertura (>20x)
para que SNPs tenham confiabilidade
• Redução da complexidade do genoma

20

10
E. Novaes

Redução de complexidade

• Sequênciamento de RNA
– Em humanos somente uns 2-3% do genoma
está representado nos mRNA

21

Redução de complexidade
• Uso de sondas-isca (“Sequence capture”)
– Vem sendo muito utilizado para captura e
sequênciamento dos exons

https://www.nature.com/articles/nbt.1975

22

11
E. Novaes

Métodos

23

Redução de complexidade
• Uso de enzimas de restrição seguido de
amplificação
– Já utilizado há muito tempo: AFLPs, genotipagem de
SNPs com microarranjos, etc.

24

12
E. Novaes

25

26

13
E. Novaes

27

Universidade Federal de Lavras


Departamento de Biologia
Pós-Graduação em Genética e Melhoramento de Plantas

GENÔMICA E BIOINFORMÁTICA

Prática com Genotipagem de SNPs

Professor: Evandro Novaes

28

14
E. Novaes

Genotipagem de polimorfismos
SNPs e Indels

29

Arquivo fastq1
Pipeline (forward)
Arquivo fastq2
(reverse)

Genotipagem Mapeamento dos


reads em genoma de
de SNPs e referência
bwa
Indels:
Identificação seqs duplicadas
Picard Tools

Filtragem de polimorfismos Identificação de polimorfismos


GATK - VariantFiltration GATK - HaplotypeCaller

Avaliação dos polimorfismos


VCFTools

Anotação do efeito dos


SNPs e Indels
SnpEff

30

15
E. Novaes

Sequências genômicas de E. coli

http://www.ncbi.nlm.nih.gov/sra/DRX019805

31

SNPEff annotation

http://snpeff.sourceforge.net/SnpEff_manual.html#outputSummary

32

16

Você também pode gostar