Você está na página 1de 38

Next Generation Sequencing:

Ferramentas de bioinformática e
estratégias de análise genética

Outubro 2018
Sobre mim

● Biólogo / UFMG
● Doutorado em Bioinformática / UFMG
● Bioinformata no Varstation / HIAE

Rafael L M Guedes
Objetivo
Visão geral de um pipeline de análise de amostras de NGS

Agenda
- Arquivos brutos de sequenciamento
- Mapeamento
- Chamada de variantes
- Anotação
- Classificação clínica
1.Visão geral de um
pipeline de NGS

Outubro 2018
Visão geral de um pipeline de NGS (Next Generation Sequencing)
PACIENTE AMOSTRA SEQUENCIAMENTO

Mapeamento Variantes
Tabela de
FASTQ BAM VCF variantes
anotadas

PROCESSAMENTO

ANÁLISE LAUDO
Linha do tempo do sequenciamento
Principais categorias de sequenciamentos NGS

Sequenciamento alvo Exoma Genoma completo


2. Arquivos brutos de
sequenciamento

Outubro 2018
FASTQ

● “Arquivo bruto” padrão do sequenciamento;


● Evolução do formato FASTA (valores de qualidade por base adicionados);
● Arquivo formado por blocos de 4 linhas:
○ Nome da sequência (read);
○ Sequência de bases nitrogenadas;
○ + (elemento opcional com o nome da sequência);
○ Qualidade de cada elemento da sequência;
Qualidade das bases em FASTQ: escala Phred

Código Score de Probabilidade de chamada Acurácia de


qualidade na errada de base (P) chamada de
escala Phred (Q) base

+ 10 1 em 10 90%

5 20 1 em 100 99%

? 30 1 em 1.000 99,9%

I 40 1 em 10.000 99,99%
3. Mapeamento

Outubro 2018
Mapeamento
O objetivo é alinhar os trechos de DNA contidos no FASTQ com a sequência de referência

SAM/
BAM

T C T A T C T A
T C T A T T C T
C G T T T C T A
C T A C T T T C
C G T T T C T A
C G T T C T A C
Principais algoritmos para mapeamento
Principais métricas de chamada de base e mapeamento
4. Chamada de
variantes

Outubro 2018
Chamada de variantes

REF G T

C A

C A

C
Chamada de variantes
DP=5 DP=4 DP=4 DP=3
REF G T

C A

C A

AF=1 AF=0 AF=0.5 AF=0


Visualização no Integrative Genomic Viewer (IGV)
Chamada de variantes – arquivo VCF (Variant call format)

Documentação oficial: http://samtools.github.io/hts-specs/VCFv4.3.pdf


Ferramentas para chamada de variantes

Pabinger et al. (2014) Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, Krabichler B, Speicher MR, Zschocke J, Trajanoski Z. A survey
of tools for variant analysis of next-generation genome sequencing data. Briefings in Bioinformatics. 2014;15(2):256–278. doi: 10.1093/bib/bbs086.
Métricas que podem apontar falsos positivos

• Cobertura;
• Frequência alélica (VAF);
• Região da variante (p. ex. homopolímero);
• Presença da variante em outras amostras da mesma corrida.
5. Anotação

Outubro 2018
Anotação de variantes

Tabela de variantes
VCF
anotadas
Anotação

Bases de dados públicos


Ferramentas para anotação

Pabinger et al. (2014) Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, Krabichler B, Speicher MR, Zschocke J, Trajanoski Z. A survey
of tools for variant analysis of next-generation genome sequencing data. Briefings in Bioinformatics. 2014;15(2):256–278. doi: 10.1093/bib/bbs086.
Bancos de dados populacionais

Richards S1, Aziz N2, Bale S3, Bick D4, Das S5, Gastier-Foster J6, Grody WW7, Hegde M8, Lyon E9, Spector E10, Voelkerding K9, Rehm HL11; ACMG
Laboratory Quality Assurance Committee. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the
American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 2015 May;17(5):405-24. doi:
10.1038/gim.2015.30. Epub 2015 Mar 5.
Bancos de dados de doenças

Richards S1, Aziz N2, Bale S3, Bick D4, Das S5, Gastier-Foster J6, Grody WW7, Hegde M8, Lyon E9, Spector E10, Voelkerding K9, Rehm HL11; ACMG
Laboratory Quality Assurance Committee. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the
American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 2015 May;17(5):405-24. doi:
10.1038/gim.2015.30. Epub 2015 Mar 5.
Bancos de dados de predição
6. Classificação clínica

Outubro 2018
Classificação de variantes germinativas

O guideline da ACMG de 2015 apresenta 28 níveis de evidência para


diferenciar variantes benignas e variantes patogênicas
Classificação de variantes germinativas

Patogênica
Provavelmente patogênica
De significância incerta (VUS)
Provavelmente benigna
Benigna
Classificação de variantes germinativas
Classificação de variantes somáticas

O guideline da AMP de 2017 apresenta 4 níveis de evidência para


associar medicamentos a variantes ligadas a tumores
Classificação de variantes somáticas
Laudo para o paciente
7. Conclusões

Outubro 2018
Mensagens importantes

• Exames genéticos estão mais acessíveis e são importantes


ferramentas de diagnóstico

• Existem diversas ferramentas disponíveis e é importante entender suas


aplicações e limitações para analisar os dados

• Fluxo de análise complexo e multidisciplinar


Sugestão de livro prático
Obrigado!

rafael.muniz@varstation.com
Outubro 2018

Você também pode gostar