Você está na página 1de 34

Faculdade Estácio do Amazonas

Disciplina: Biotecnologia e bioinformática

Bancos de Dados: funções


e utilizações. Anotação
Gênica

Prof. Dra. Luciana Belmont


INTRODUÇÃO
BANCO DE DADOS - BD

 Conceito
- Um banco de dados pode ser considerado coleção de dados inter-
relacionados, projetado para suprir as necessidades de um grupo
específico de aplicações e usuários

 Função
- Um banco de dados organiza e estrutura as informações de modo a
facilitar consultas, atualizações pelos pesquisadores

 A maioria dos BD’s estão atrelados a um


SGBD – (Sistema de Gerenciamento de
Banco de Dados)

DADOS
SGBD’
s
 Um SGBD é um conjunto de softwares que permitem armazenar,
modificar e extrair dados de um banco, provendo para isso um
ambiente que seja adequado e eficiente.

 Este sistema é responsável por intermediar os processos de


construção, manipulação e administração do banco de dados
solicitados pelos usuários ou por outras aplicações.

 Principais SGBD’s
DADOS BIOLÓGICOS EM
BIOINFORMÁTICA
BANCO DE DADOS PÚBLICOS (BDBs)
EM BIOINFORMÁTICA

 Três BDBs a partir do tipo de conteúdo neles


armazenado

 primários
 secundários
 especializados
BANCO DE DADOS BIOLÓGICOS

 BDBs primários

 Armazenam dados originais de sequências de nucleotídeos ou


proteínas
BANCO DE DADOS BIOLÓGICOS

 BDBs primários

–Utilizam-se basicamente arquivos de tipo texto simples (ex:


tipo fasta) para armazenar essas informações.

–Dentre os principais BDBs primários destacam-se o GenBank, o


EMBL e o DDBJ (Xiong, 2006).
BANCO DE DADOS BIOLÓGICOS

 BDBs primários
BANCO DE DADOS BIOLÓGICOS

 BDBs secundários

 armazenam resultados de análises feitas a partir de


dados primários

- a partir de sequências de nucleotídeos ou de


proteínas
armazenados em BDBs primários
BANCO DE DADOS BIOLÓGICOS
 BDBs secundários

Dados são armazenados utilizando SGBDs

– O SWISS-Prot e o PIR (Protein Information Resources)


são exemplos de BDBs secundários que armazenam
informações referentes às proteínas, incluindo:

• Anotações de funcionalidades
• Estruturas tridimensionais e
• Literatura associada
BANCO DE DADOS BIOLÓGICOS

 BDBs secundários
BANCO DE DADOS BIOLÓGICOS
 BDBs especializados

– São aqueles que atendem a um interesse particular de pesquisa.

– Dados são armazenados utilizando SGBDs ou arquivos

–Por exemplo: Flybase, HIV sequence database e RDP (Ribosomal


Database Project) são BDBs especializados para um particular
organismo ou tipo de dado
BANCO DE DADOS BIOLÓGICOS

 BDBs especializados
BANCO DE DADOS PÚBLICOS EM
BIOINFORMÁTICA
 BDBs primários
- GenBank (http://www.ncbi.nlm.nih.gov/)
- DDBJ – DNA Data Bank of Japan (http://www.ddbj.nig.ac.jp/)
- EBI – European Bioinformatics Institute (http://www.ebi.ac.uk/)
- PDB – Protein Data Bank (http://www.rcsb.org/pdb)

 BDBs secundários
-PIR – Protein Information Resource
(http://www-nbrf.georgetown.edu/)
-Swiss-Prot - (http://www.expasy.org/)
-KEGG - Kyoto Encyclopedia of Genes and Genomes
- (http://www.genome.ad.jp/kegg/)
BUSCA DE INFORMAÇÃO
O que se pode descobrir sobre um gene por meio de uma
busca a um BD?
• Informação evolutiva: genes homólogos, frequências dos alelos

• Informação genômica: localização no cromossomo, intros, UTRs,


regiões reguladoras
• Informação estrutural: estruturas da proteína correspondente, tipos
de folds, domínios estruturais;
• Informação de expressão: expressão específica a um dado tecido,
fenótipos, doenças;

• Informação funcional: função molecular/enzimática, papel em


diferentes rotas, papel em doenças;
BUSCA DE INFORMAÇÃO

 Busca de informação sobre genes e produtos


gênicos

• Gene e produtos gênicos são geralmente organizados por sequência

- Sequências genômicas codificam todas características de um


organismo
- Produtos gênicos são descritos unicamente por sua sequência
- Sequências similares entre biomoléculas indica tanto uma função
similar quanto um relacionamento evolutivo

• Sequências de macromoléculas proporciona chaves biologicamente


significativas para busca em BD
NCBI - NATIONAL CENTER FOR
BIOTECHNOLOGY INFORMATION

 O NCBI fornece acesso a


genomas completos de mais
de 5.700 organismos.
Genomas significam tanto
sequências completas de
organismos quanto os que
ainda estão em processo de
sequenciamento.
BANCOS DE DADOS DO NCBI
Genbank
FASTA, GenBank
>gi|187830767|ref|NM_000546.4| Homo sapiens tumor
protein p53 (TP53), transcript variant 1, mRNA
GATTGGGGTTTTCCCCTCCCATGTGCTCAAGACTGGCGCTAAAAGTTTTGAGC
TTCTCAAAAGTCTAGAGCCACCGTCCAGGGAGCAGGTAGCTGCTGGGCTCCGG
GGACACTTTGCGTTCGGGCTGGGAGCGTGCTTTCCACGACGGTGACACGCTTC
CCTGGATTGGCAGCCAGACTGCCTTCCGGGTCACTGCCATGGAGGAGCCGCAG
TCAGATCCTAGCGTCGAGCCCCCTCTGAGTCAGGAAACATTTTCAGACCTATG
GAAACTACTTCCTGAAAACAACGTTCTGTCCCCCTTGCCGTCCCAAGCAATGG
ATGATTTGATGCTGTCCCCGGACGATATTGAACAATGGTTCACTGAAGACCCA
GGTCCAGATGAAGCTCCCAG(...)
BANCOS DE DADOS DO NCBI
 Taxonomy
 Permite verificar o número de sequências de nucleotídeos, proteínas
e genomas de espécies

 Contém a classificação taxonômica completa das espécies


- Incluindo categorias não-lineanas
BANCOS DE DADOS DO NCBI
 RefSeq

 Banco de dados de sequências de


referência para genomas

- É o verdadeiro NR

 Dividido em genoma,
cDNA e proteína

 Contém sequências
de splicing
alternativo
METABOLISMO DO AMIDO E DA SACAROSE
Bioinformatics: alive and kicking
Lincoln D Stein

A bioinformática tornou-se central demais


para a biologia para ser deixada para
especialistas em bioinformática. Os biólogos
são todos bioinformatas agora.

Você também pode gostar