Você está na página 1de 38

Universidade Federal de Lavras

Departamento de Biologia
Pós-Graduação em Genética e Melhoramento de Plantas

PGM553

GENÔMICA E BIOINFORMÁTICA

Prof. Evandro Novaes


evandro.novaes@ufla.br
https://forgenetics.wordpress.com/

Avaliação

• 3 relatórios práticos – 25% cada


– A idéia é estimular a utilização das ferramentas apresentadas
em aula através de um problema
• Seminário sobre artigos a serem selecionados nas
próximas aulas – peso de 25%

© E. Novaes 1
Programa
1. Histórico. A demanda por ferramentas de Bioinformática.
2. Práticas com bancos de dados Genômicos.
a. NCBI
b. Phytozome
c. ePlant
3. Ferramentas básicas de análise de sequências de DNA e
proteínas.
a. Recursos e ferramentas de análise do NCBI.
b. A análise BLAST.
c. Ferramentas de desenho de primers.
d. Ferramentas de identificação de microssatélites.
e. Predição de localização subcelular e de peptídeo
sinal
4. Ferramentas de análise de dados de sequenciamento
(Sanger).
a. Base-calling. A estatística phred.
b. Detecção de vetores/fragmentos contaminantes.
c. Ferramentas de assembly.
d. Ferramentas de clusterização.
5. Análise de sequências de nova geração (NGS).
a. Controle de qualidade.
b. Assembly de genomas de novo.
c. Ferramentas de detecção e análise de polimorfismos
de uma única base (SNPs).
d. Reconstrução do transcritoma via RNAseq.
e. Análise de expressão gênica por RNAseq.

Cronograma

Dia 26/04 03/05 10/05 17/05 24/05 31/05 07/06


Teórica Histórico e Alinhamento Sequenciament Montagem de Genotipagem de Análises de
importância de sequências o NGS Genomas SNPs genética de
da e marcadores populações
Bioinformáti microssatélites
ca
Prática Bancos e Blast, Continuação Prática com o Montagem de Genotipagem de Diversidade e
navegadores identificação da prática Linux Genomas SNPs estrutura genética
de genomas de SSRs e com o Blast e com SNPs
localização de a busca por
proteínas SSRs

Dia 14/06 21/06


Teórica Análises de expressão gênica Seminários

Prática Análise de expressão gênica via


RNA-Seq

© E. Novaes 2
5

© E. Novaes 3
O que veremos hoje?
1. Breve revisão de Biologia Molecular
2. Definição e breve histórico da ciência.
3. Práticas com bancos de dados e navegadores de
genomas

Revisão de BioMol

Estrutura e Função dos Ácidos Nuclêicos

© E. Novaes 4
Estrutura do genoma

10

© E. Novaes 5
Estrutura tridimensional do DNA (forma B)

11

Existe outro ácido nucléico importante


RNA

12

© E. Novaes 6
Transcrição pode ocorrer em qualquer
uma das fitas moldes do DNA

13

RNA polimeraze cataliza a síntese de


RNA utlizando DNA como molde

14

© E. Novaes 7
RNA forma estruturas secundárias

15

RNAfold:
MFE secondary structure

Base-pair probability

http://rna.tbi.univie.ac.at

16

© E. Novaes 8
Promotor da RNA polimerase II

17

18

© E. Novaes 9
Nature 489, 57–74 (06 September 2012)
doi:10.1038/nature11247

“Here we report evidence that three-quarters of the human genome is capable of being transcribed,”

19

Processamento do mRNA

20

© E. Novaes 10
Alguns fatores de processamento se
ligam na cauda da RNA polimerase

21

Splicing – remoção dos introns


• Diferentemente dos procariotos, os genes de eucariotos não
possuem a região codante de forma contínua

22

© E. Novaes 11
Porque acumular íntrons?

Gene de rato que controla a contração das células musculares

23

Tradução
• Complexidade adicional em relação a
transcrição;
• Como o próprio nome diz, envolve mudança
de linguagem;
3’ 5’ Proteína
N- ... Hi Cys Gln ... -C
s
5’ 3’

Transcriçã Tradução
o mRNA
5’ ... CAUUGCCAGU ... 3’

24

© E. Novaes 12
Qual é a regra dessa tradução?

• DNA possui 4 letras, já a proteína 20.

25

Código genético

O código genético é universal?

26

© E. Novaes 13
Precisamos de um tradutor
i.e. adaptador entre o códon e o aminoácido
Bases modificadas
D = diidrouridina
Ψ= pseudo-uridina

O anticódon se liga ao códon UUC, que codifica uma fenilalanina.

27

Ligação peptídica ocorre nos ribossomos

40S – códon-
anticódon
60S – ligação
peptídica

28

© E. Novaes 14
Estrutura do maior rRNA procarioto

29

Ribossomos possuem 4 sítios de


ligação ao RNA

30

© E. Novaes 15
Traduzindo uma molécula de mRNA

31

32

© E. Novaes 16
Tamanho dos genomas

Medido em número de pares de base por complemento haplóide.

33

Genoma de mamíferos sequenciados

34

© E. Novaes 17
35

Histórico e Importância

Bioinformática

36

© E. Novaes 18
O dogma central da biologia
Vias metabólicas

- Direcionalidade no sentido da informação Fenótipo


- DNA armazena toda a informação genética

37

Apesar da importância, o DNA é uma


molécula relativamente simples

Purinas Pirimidinas

38

© E. Novaes 19
Simplicidade e fluxo de informação
aproximam dogma central da computação

Computação
Código genético

39

”Bioinformatics is often defined as the


application of computational techniques
to understand and organise the
information associated with biological
macromolecules.”

Macromoléculas do Dogma Central


- DNA, RNA e proteínas

40

© E. Novaes 20
Biologia

Bioinformática

Ciências da Tecnologia da
Computação Informação

Slide gentilmente cedido pelo Prof. Alexandre Coelho

41

Pode ser considerado um ramo da


Biologia Computacional
• Biologia Computacional é um campo de estudo interdisciplinar que aplica técnicas da
ciência da computação para problemas da biologia. Os campos da biologia que mais se
beneficiam da Biologia Computacional incluem:
– Bioinformática, que aplica algoritmos e técnicas estatísticas para bancos de dados de
informação biológica, que geralmente consistem de grande número sequências de DNA, RNA ou
proteínas.
– Biomodelagem computacional, um campo da biocibernática para a construção de modelos
computacionais de sistemas biológicos.
– Simulação molecular, um campo que lida com métodos teóricos e técnicas computacionais para
modelar ou imitar o comportamento de moléculas.
– Biologia Sistêmica, que modela redes de interação biológica de grande escala.
– Bioquímica e biofísica computacional

42

© E. Novaes 21
Bioinformática
• Atua na análise de sequências das macromoléculas do
dogma central (DNA, RNA e proteínas), principalmente em
duas áreas:
– Genômica funcional
• Sequenciamento, montagem e anotação de genes e genomas;
• Análise de expressão gênica;
– Genômica comparativa
• Identificação e genotipagem de polimorfismos (SNPs, CNVs, e outras)
• Anotação funcional
• Filogenia

43

Origem da Bioinformática

44

© E. Novaes 22
Histórico acompanha o desenvolvimento da
Biologia na busca pelo entendimento da vida

45

Bioinformática assume grande importância


com a Genômica
• A ciência genômica se ocupa do estudo da estrutura,
conteúdo, e evolução dos genomas.
• Quantidade de dados obtidos em estudos genômicos é
imensa;
• Análise dos dados requer ferramentas poderosas da
matemática e computação;

Estatística Bioinformática

Genômica

Ciência da computação

46

© E. Novaes 23
Surgimento da genômica
• Nas últimas décadas (1970-hoje), houve o surgimento
de técnicas revolucionárias de biologia molecular
– Exemplo: enzimas de restrição, técnica de PCR e métodos de
sequenciamento de DNA cada vez mais eficientes;

• Gerando uma explosão na quantidade de dados


biológicos disponíveis.

47

A Era Genômica

Slide gentilmente cedido pelo Prof. Alexandre Coelho

48

© E. Novaes 24
49

50

© E. Novaes 25
Histórico da genômica
• 1977: Frederick Sanger sequencia o primeiro genoma
– vírus bacteriófago Φ-X174 (5,368 bp)

• 1995: sequenciado o genoma do primeiro organismo de vida livre -


Haemophilus influenzae (1.8 Mb)

• 2003: Genoma humano sequenciado

• 2015: 1000 Genomes sequenced


– www.internationalgenome.org

51

52

© E. Novaes 26
Um genoma de referência é só o início

53

Um genoma de referência é só o início

54

© E. Novaes 27
Precisa-se de sequências!
Next-generation sequencers (NGS):

55

Precisa-se de computadores!

56

© E. Novaes 28
Usos e objetivos da genômica e
bioinformática

57

Objetivos fundamentais
1. Montagem de sequências (genômicas e expressas)

58

© E. Novaes 29
Objetivos fundamentais
2. Identificar e anotar todos os genes encontrados nas sequências
genômicas

59

Objetivos fundamentais
3. Caracterizar a diversidade nucleotídica nas sequências de DNA

60

© E. Novaes 30
Objetivos fundamentais
4. Analisar a expressão de todos os genes em uma ou mais
condições (ontogenéticas e/ou ambientais)

61

Objetivos fundamentais
5. Criar e manter base de dados genômicos na web para
facilitar o acesso e estudo comparativo dos genomas

62

© E. Novaes 31
Seleção Genômica

Slide gentilmente cedido pelo Prof. Alexandre Coelho

63

Seleção Genômica

✓ Cada indivíduo é caracterizado para milhares de


loci simultanemente
y1 y2 y3 yn
✓ Métodos estatísticos baseados no uso de
modelos lineares mistos e inferência Bayesiana
(Meuwissen et al., 2001)

Slide gentilmente cedido pelo Prof. Alexandre Coelho

64

© E. Novaes 32
Predição Genômica

Slide gentilmente cedido pelo Prof. Alexandre Coelho

65

Filogenia Molecular

Slide gentilmente cedido pelo Prof. Alexandre Coelho

66

© E. Novaes 33
Genômica Comparativa

Moore et al. (1995)

Slide gentilmente cedido pelo Prof. Alexandre Coelho

67

68

© E. Novaes 34
69

70

© E. Novaes 35
71

Mapeamento genético
Genótipo Freq. N. indiv.
L1 L2 SSR1/SSR2 esperada observado
MM 1/4 5
X ML 1/4 3
LM 1/4 2
L2 LL 1/4 6
F1:
X recombinantes ML + LM 5
r= = = = 0,31
Total Total 16

1 2 3 4 5 6 7 8
RC1: SSR 10
SSR 12

MM LM LL ML MM LM LL ML
...
9 1 1 12 13 14 15 16
0 1
SSR 10
SSR 12

E. Novaes ©
LL LL MM MM LL ML LL MM

72

© E. Novaes 36
Mapa genético de Eucalyptus
E. Novaes ©

73

Utilidade - mapeamento de QTL

F2:

E. Novaes ©

74

© E. Novaes 37
Localização Blast

75

© E. Novaes 38

Você também pode gostar