Escolar Documentos
Profissional Documentos
Cultura Documentos
Departamento de Biologia
Pós-Graduação em Genética e Melhoramento de Plantas
PGM553
GENÔMICA E BIOINFORMÁTICA
Avaliação
© E. Novaes 1
Programa
1. Histórico. A demanda por ferramentas de Bioinformática.
2. Práticas com bancos de dados Genômicos.
a. NCBI
b. Phytozome
c. ePlant
3. Ferramentas básicas de análise de sequências de DNA e
proteínas.
a. Recursos e ferramentas de análise do NCBI.
b. A análise BLAST.
c. Ferramentas de desenho de primers.
d. Ferramentas de identificação de microssatélites.
e. Predição de localização subcelular e de peptídeo
sinal
4. Ferramentas de análise de dados de sequenciamento
(Sanger).
a. Base-calling. A estatística phred.
b. Detecção de vetores/fragmentos contaminantes.
c. Ferramentas de assembly.
d. Ferramentas de clusterização.
5. Análise de sequências de nova geração (NGS).
a. Controle de qualidade.
b. Assembly de genomas de novo.
c. Ferramentas de detecção e análise de polimorfismos
de uma única base (SNPs).
d. Reconstrução do transcritoma via RNAseq.
e. Análise de expressão gênica por RNAseq.
Cronograma
© E. Novaes 2
5
© E. Novaes 3
O que veremos hoje?
1. Breve revisão de Biologia Molecular
2. Definição e breve histórico da ciência.
3. Práticas com bancos de dados e navegadores de
genomas
Revisão de BioMol
© E. Novaes 4
Estrutura do genoma
10
© E. Novaes 5
Estrutura tridimensional do DNA (forma B)
11
12
© E. Novaes 6
Transcrição pode ocorrer em qualquer
uma das fitas moldes do DNA
13
14
© E. Novaes 7
RNA forma estruturas secundárias
15
RNAfold:
MFE secondary structure
Base-pair probability
http://rna.tbi.univie.ac.at
16
© E. Novaes 8
Promotor da RNA polimerase II
17
18
© E. Novaes 9
Nature 489, 57–74 (06 September 2012)
doi:10.1038/nature11247
“Here we report evidence that three-quarters of the human genome is capable of being transcribed,”
19
Processamento do mRNA
20
© E. Novaes 10
Alguns fatores de processamento se
ligam na cauda da RNA polimerase
21
22
© E. Novaes 11
Porque acumular íntrons?
23
Tradução
• Complexidade adicional em relação a
transcrição;
• Como o próprio nome diz, envolve mudança
de linguagem;
3’ 5’ Proteína
N- ... Hi Cys Gln ... -C
s
5’ 3’
Transcriçã Tradução
o mRNA
5’ ... CAUUGCCAGU ... 3’
24
© E. Novaes 12
Qual é a regra dessa tradução?
25
Código genético
26
© E. Novaes 13
Precisamos de um tradutor
i.e. adaptador entre o códon e o aminoácido
Bases modificadas
D = diidrouridina
Ψ= pseudo-uridina
27
40S – códon-
anticódon
60S – ligação
peptídica
28
© E. Novaes 14
Estrutura do maior rRNA procarioto
29
30
© E. Novaes 15
Traduzindo uma molécula de mRNA
31
32
© E. Novaes 16
Tamanho dos genomas
33
34
© E. Novaes 17
35
Histórico e Importância
Bioinformática
36
© E. Novaes 18
O dogma central da biologia
Vias metabólicas
37
Purinas Pirimidinas
38
© E. Novaes 19
Simplicidade e fluxo de informação
aproximam dogma central da computação
Computação
Código genético
39
40
© E. Novaes 20
Biologia
Bioinformática
Ciências da Tecnologia da
Computação Informação
41
42
© E. Novaes 21
Bioinformática
• Atua na análise de sequências das macromoléculas do
dogma central (DNA, RNA e proteínas), principalmente em
duas áreas:
– Genômica funcional
• Sequenciamento, montagem e anotação de genes e genomas;
• Análise de expressão gênica;
– Genômica comparativa
• Identificação e genotipagem de polimorfismos (SNPs, CNVs, e outras)
• Anotação funcional
• Filogenia
43
Origem da Bioinformática
44
© E. Novaes 22
Histórico acompanha o desenvolvimento da
Biologia na busca pelo entendimento da vida
45
Estatística Bioinformática
Genômica
Ciência da computação
46
© E. Novaes 23
Surgimento da genômica
• Nas últimas décadas (1970-hoje), houve o surgimento
de técnicas revolucionárias de biologia molecular
– Exemplo: enzimas de restrição, técnica de PCR e métodos de
sequenciamento de DNA cada vez mais eficientes;
47
A Era Genômica
48
© E. Novaes 24
49
50
© E. Novaes 25
Histórico da genômica
• 1977: Frederick Sanger sequencia o primeiro genoma
– vírus bacteriófago Φ-X174 (5,368 bp)
51
52
© E. Novaes 26
Um genoma de referência é só o início
53
54
© E. Novaes 27
Precisa-se de sequências!
Next-generation sequencers (NGS):
55
Precisa-se de computadores!
56
© E. Novaes 28
Usos e objetivos da genômica e
bioinformática
57
Objetivos fundamentais
1. Montagem de sequências (genômicas e expressas)
58
© E. Novaes 29
Objetivos fundamentais
2. Identificar e anotar todos os genes encontrados nas sequências
genômicas
59
Objetivos fundamentais
3. Caracterizar a diversidade nucleotídica nas sequências de DNA
60
© E. Novaes 30
Objetivos fundamentais
4. Analisar a expressão de todos os genes em uma ou mais
condições (ontogenéticas e/ou ambientais)
61
Objetivos fundamentais
5. Criar e manter base de dados genômicos na web para
facilitar o acesso e estudo comparativo dos genomas
62
© E. Novaes 31
Seleção Genômica
63
Seleção Genômica
64
© E. Novaes 32
Predição Genômica
65
Filogenia Molecular
66
© E. Novaes 33
Genômica Comparativa
67
68
© E. Novaes 34
69
70
© E. Novaes 35
71
Mapeamento genético
Genótipo Freq. N. indiv.
L1 L2 SSR1/SSR2 esperada observado
MM 1/4 5
X ML 1/4 3
LM 1/4 2
L2 LL 1/4 6
F1:
X recombinantes ML + LM 5
r= = = = 0,31
Total Total 16
1 2 3 4 5 6 7 8
RC1: SSR 10
SSR 12
MM LM LL ML MM LM LL ML
...
9 1 1 12 13 14 15 16
0 1
SSR 10
SSR 12
E. Novaes ©
LL LL MM MM LL ML LL MM
72
© E. Novaes 36
Mapa genético de Eucalyptus
E. Novaes ©
73
F2:
E. Novaes ©
74
© E. Novaes 37
Localização Blast
75
© E. Novaes 38