Você está na página 1de 8

01/09/2021

Centro Universitário Estácio


Bacharelado Em Biomedicina
A Era do BIG DATA
Disciplina: Tecnologia Biomédica § “Grande volume de informação criado e amazenado”
§ Geram impactos em diversas áreas:
• Econômica
• Social
• Política
• Saúde

A análise adequada de tais grandes conjuntos de dados permite


encontrar novas correlações, como por exemplo: "tendências de
negócios no local, prevenção de doenças, combate à criminalidade e
assim por diante"

Profª. Drª.: Samara Rodrigues Bonfim Damasceno Oliveira

1 2

O que fazem os bancos de dados? Níveis de organização e o Dogma Central


1. Organizam, arquivam e distribuem sequências de DNA e § Bancos de dados incluem:
RNA coletadas coletadas de projetos genoma, publicações üSequências de ácidos nucléicos, incluindo genomas
científicas e depósitos de patentes; completos;
2. Revistas científicas exigem como requisito para publicação üSequências de aminoácidos de proteínas;
o depósito das sequências nesses bancos; üEstruturas de proteínas e ácidos nucléicos;
3. Cada entrada tem a forma de um arquivo texto contendo üFunções de genes e proteínas;
dados e anotações para uma sequência.
üPadrão de expressão de genes;
üVias metabólicas e redes de interação e controle;
üPublicações.

3 4

Níveis de organização e o Dogma Central Níveis de organização e o Dogma Central

5 6

1
01/09/2021

Níveis de organização e o Dogma Central

“A importância do dogma central no entendimento da


informação e função biológicas pode ser exemplificada no
fato de que ele aborda os três tipos mais comuns de
moléculas estudadas por técnicas de bioinformática, o DNA, o
RNA e as proteínas, estabelecendo um fluxo de informação
universal à vida como conhecemos.”

Verli, 2014 – Bioinformática: da


biologia à flexibilidade molecular
Para estudar!
Capítulos 1, 2, 3 e 4

7 8

Características fundamentais do DNA e RNA

9 10

Como as informações são depositadas? Como as informações são depositadas?


As sequências de DNA e RNA são depositadas como fita única: As sequências de DNA e RNA são depositadas como fita única:
1º: A fita de DNA depositada é a fita senso: 2º: A fita de RNA depositada não é complementar ao DNA e sim semelhante à fita
senso do DNA:
5´-AATGGCATGCCTA-3´
DNA
3 ´-TTACCGTACGGAT-5’ Fitas se abrem para
DNA ATGCGTTACCTTAGTCAGTCTCATCTCAGGTGTCATCTTTTCTTACTGATC
transcrição
Uma das fitas é usada
Fita não-molde (senso) (+) 5´-AATGGCATGCCTA-3´ como molde mRNA ATGCGTTACCTTCATCTCAGGTTTACTGATC Apenas éxons

Sequências da fita não-molde 5´-AAUGGCAUGCCUA-3´ RNA


e do RNA são iguais 3´-TTACCGTACGGAT-5’
Fita não-molde contêm o significado ü O RNA mensageiro constitui apenas os éxons da fita original de DNA;
da informação genética (seq. de um ü O RNA mensageiro NÃO está na forma de fita complementar;
gene): fita senso (sense) ou ü O RNA mensageiro não está depositado com suas bases de uracil (que é o
codificadora Fita molde (anti-senso) (-): serve de molde
ü que na realidade ocorre), mas sim com as bases de timina.
para a síntese do RNA.
ü (cDNA).

11 12

2
01/09/2021

Estrutura do Gene Eucarioto Processamento do RNA

13 14

Processamento do RNA

15 16

Sequenciamento Sequenciamento Automático


do DNA
Sanger, Gilbert (Nobel 1980)

Leroy Hood

30kb por corrida

17 18

3
01/09/2021

A nova revolução da Genômica


Nova tecnologia

§ Dispensa clonagem dos fragmentos em sistemas


bacterianos
§ Dispensa a preparação de DNA molde para sequenciamento
§ Reações feitas em paralelo em volume extremamente
454 Solexa - Illumina SOLiD - ABI pequeno - nanotecnologia

~120 MB de DNA ~01 GB de DNA ~03 GB de DNA


por corrida por corrida por corrida

12KB/US$ 100KB/US$ 300KB/US$

Tecnologia de Capilar = 0.5KB/US$

19 20

Aplicações Sequenciamento de novo

§Sequenciamento de Genomas
• sequenciamento de novo
• re-sequenciamento - variabilidade SNPs e mutações

§Sequenciamento de Transcriptomas
• variabilidade - splicing, poliadenilação
• quantificação de expressão gênica

21 22

Re-sequenciamento Transcriptoma

23 24

4
01/09/2021

Projeto 454 Fapesp/LICR


Genoma Humano do Câncer Projeto 454 Venter/LICR

# sequências 1.2 milhões 520 mil


Participantes: LICR-SP, LICR-NY, Venter Institute
# sequenciadores 05 MegaBaces 01 454
Objetivo: Sequenciamento extensivo dos genes expressos
na linhagem celular HCC1954 (tumor de mama) buscando # corridas ~15,000 01

conhecer, com um único set de dados, alterações genéticas


e epi-genéticas neste tipo Custo (US$)* 12 milhões 10 mil

de câncer.

Sequenciador: 454
* Excluindo o preço dos aparelhos

25 26

Um objetivo a curto prazo Os sequenciadores de nova geração


promovem uma mudança no paradigma

Geração de dados
deixa de ser o fator
limitante Com os bilhões de
datapoints gerados em
horas, o processamento e
análise dos dados tornou-se
o maior gargalo das
pesquisas biomédicas.

27 28

Bioinformática - Importância
Bioinformática
§Poucas pessoas adequadamente treinadas em
Biologia e Computação.
§Desenvolvimento de ferramentas.
§Biologia em larga-escala. Produção de dados em §Forma de explorar novos dados.
massa gera uma demanda para análises §Processamento de dados gerados por
computacionais. projetos em larga-escala.
§Uma nova forma de se fazer ciência dirigida
§Economiza tempo e dinheiro. por hipóteses.

29 30

5
01/09/2021

Bioinformática Cinco websites que todos devem


conhecer
§ NCBI (The National Center for Biotechnology Information;
O Bioinformata O Usuário • http://www.ncbi.nlm.nih.gov/
§ EBI (The European Bioinformatics Institute)
- Manipula a informação. • http://www.ebi.ac.uk/
- Recursos da Web.
- Desenvolve ferramentas § The UCSC Genome Browser
- Local ou remoto. • http://genome.ucsc.edu/
- Bancos de dados locais. - nada de programação. § SwissProt/ExPASy (Swiss Bioinformatics Resource)
- Local. - pouca habilidade de TI. • http://expasy.cbr.nrc.ca/sprot/
- Mta programação. § PDB (The Protein Databank)
- Habilidades de TI. • http://www.rcsb.org/PDB/

31 32

NCBI (http://www.ncbi.nlm.nih.gov/)

§ Acesso aos bancos de dados via Entrez


• Medline/OMIM
• Genbank/Genpept/Structures
§ Servidor de BLAST
• Todos os tipos de Blast
§ Portal do Genoma Humano
§ Muito, muito mais……..

33 34

EBI (http://www.ebi.ac.uk/)

§ Acesso a bancos de dados via SRS


• EMBL, SwissProt, ……
§ Muitas outras ferramentas
• ClustalW, DALI, …

35 36

6
01/09/2021

UCSC Genome Browser


(http://genome.ucsc.edu/)
§ Banco de dados e Browser para genomas de diferentes
espécies
• Humano, camundongo, rato, zebrafish, etc….
§ Muitas outras ferramentas
• SNPs, domínios prtéicos, genômica comparativa, etc….

37 38

SwissProt (http://www.expasy.ch/sprot/)

§ Checagem manual.
• O número de entradas errôneas é bastante reduzido.
§ Cross-link extensivo com outros bancos
§ SwissProt é o ‘gold-standard’ em termos de bancos de dados e
é o melhor lugar para se começar uma análise se vc procura
info para uma ou poucas

39 40

Protein Data Bank – PDB


(http://www.rcsb.org/pdb/)

§ Armazena a estrutura tri-dimensional para milhares de


proteínas

§ Acesso a vários serviços relacionados a biologia estrutural

41 42

7
01/09/2021

Bancos de
Sequência Primários

GenBank (USA)
http://www.ncbi.nlm.nih.gov/Genbank

EMBL (Europa)
http://www.ebi.ac.uk/embl/

DDBJ (Japão)
http://www.ddbj.nig.ac.jp/

43 44

Profª. Drª. Samara Rodrigues Bonfim Damasceno Oliveira.


Biomédica
Especialista em Biotecnologia
Doutora e Mestre em Farmacologia
Pós-Doutora em Fisiologia e Farmacologia
samara.damasceno@estacio.br

45

Você também pode gostar