Você está na página 1de 5

MiRBase (http://www.mirbase.

org/)

Banco de dados para busca de sequencias de miRNA maduros j publicados.


Cada entrada no banco representa uma predio da poro hairpin de um
transcrito de miRNA, contendo:
o Informao da localizao
o Sequencia do miRNA maduro
o Anotaes relacionados a sua descoberta, estrutura e funo
o Nomenclatura
3 primeiras letras organismo
Numero de identificao do miRNA
5p ou 3p origem da sequencia
Termo mir representa uma predio de poro hairpin do transcrito de
miRNA
Termo miR - representa sequencia de miRNA maduro
A pesquisa realizada pelo nome do miRNA, ou a partir de outros dados do
miRNA de interesse.
Redireciona para outros bancos de predio de miRNA alvo
Exemplo: pesquisa do mir-29

MirDB (http://mirdb.org/)

Banco de dados que prediz miRNA alvo e anotaes funcionais de miRNA,


utilizando a ferramenta MirTarget (analisa interaes de miRNA alvo de
sequenciamento de alta qualidade)
Todos os alvos tem um score de predio entre 50-100, como atribudo pelo
MirTarget. No qual, maior score representa maior confiana estatstica na
predio do resultado.

DIANA TOOLS
(http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=site/page&view=software)
Site/Software que permite acesso a ferramentas fornecidos por mirPath,
microT v4, microT-CDS e Tarbase v6
UNIPROT (http://www.uniprot.org) - The Universal Protein Resource

Banco de dados que engloba trs pilares: UniProt Knowledgebase (UniProtKB),


the UniProt Reference Clusters (UniRef), and the UniProt Archive (UniParc).

A procura no banco de dados pode ser feita pelo nome da protena, gene,
doena, local celular, organismo ou palavras chaves.
Na pgina da protena voc encontra as seguintes sees: Names and origin,
References, General annotation, Cross-references, Keywords, Sequence
annotation, Sequence,
Nesses dados se tem informaes sobre sequncias confiveis de protenas e
descrio de produtos proteicos alternativos (devido a splicing alternativo,
iniciao alternativa, edio de RNA ...);Nomes de protenas e genes;
nomenclatura e sinnimos utilizados na literatura e outros bancos de dados;
funo proteica; informao especfica da enzima (Atividade cataltica,
cofatores, via metablica, regulao); domnios e sites biologicamente
relevantes; PTMs; sub-celular localizaes; expresso de tecido; expresso
durante embrio; desenvolvimento e / ou diferenciao celular; informao da
estrutura quaternria; polimorfismos; semelhanas para outras protenas;
envolvimento em doenas; referncias cruzadas para numerosas bases de dados;
vocabulrios controlados em vrios (sub) sees; Qualificadores para dados
preditos ou propagados.
Para baixar conjuntos de dados completos no formato de arquivo plano original,
formato fasta, formato XML ou RDF, v para www.uniprot.org/downloads.
UniProtKB lanado a cada 4 semanas.

SIFT (http://sift.jcvi.org/) - Sorting Intolerant From Tolerant

Algoritmo que prediz se uma substituio de aminocido deletria para funo


de uma protena.

Classifica as substituies em tolerantes e intolerantes.

Para isso, utiliza conservao de sequncias e caracterstica de aminocidos.

Para classificar as substituies, trs etapas so realizadas:

1. So buscadas sequncias similares a de interesse que podem ter


funo semelhante;
2. realizado o alinhamento entre essas sequncias;
3. So calculadas probabilidades normalizadas para as substituies, o
que gera um score utilizado para a classificao.
Na pgina inicial dessa ferramenta, existem vrias opes diferentes de
submisso da substituio que se deseja prever a tolerncia. Cada opo est
acompanhada de uma descrio e de link que exemplifica o formato da
submisso:

Exemplo: Realizaremos a predio de variante que troca um triptofano (W) por


uma arginina (R) na posio 391 da protena Esfingomielina fosfodiesterase 1.

- Para isso, utilizaremos a opo SIFT Human Protein. O cdigo da protena


(ENSP) seguido da especificao da variante so colocados:
ENSP00000340409,W391R. Em seguida, os dados so enviados.

- O Output do SIFT apresenta a predio (pode ser TOLERATED ou


DAMAGING) e o score calculado.
SIFT score: Valor que pode ir de 0 a 1. Se estiver entre 0 e 0,05, a variante
considerada DAMAGING. Se estiver acima de 0,05, a variante considerada
tolerante.

Outras ferramentas do SIFT no relacionadas predio de variantes:

- Restrict to Coding Variants: diz se uma variante est presente em uma


regio codificadora ou no codificadora.

- Classify Human Indels: caracteriza posies cromossmicas de indels.


Fornece informaes como localizao relativa da indel (comeo ou final
da protena), a sequncia da protena modificada pela indel e se a
alterao provoca Nonsense mediated decay.

PROVEAN (Protein Variation Effect Analyzer): ferramenta que prediz se uma


substituio de aminocido (nica ou mltipla) ou indel tem impacto na funo
de uma protena.

Outros bancos de predies: PolyPhen-2, Mutation Taster

- PolyPhen-2 (Polymorphism Phenotyping v2)


(http://genetics.bwh.harvard.edu/pph2/): predio do impacto de substituies de
aminocidos. Para a predio, o algoritmo considera caractersticas da sequncia
da protena e tambm de sua estrutura. Uma substituio pode ser classificada
em benign, possibly damaging e probably damaging.

- Mutation Taster (www.mutationtaster.org): predio do impacto de SNVs


(single nucleotide variants) e indels (insero/deleo). Classifica as variantes
em: disease causing, disease causing automatic, polymorphism e
polymorphism automatic.

SWISS MODEL (https://swissmodel.expasy.org/)

Servio integrado dedicado modelagem de homologia proteica. Orienta o


usurio na construo de modelos de homologia proteica em diferentes nveis de
complexidade.
Dado um alinhamento de modelo e uma estrutura de modelo, todas as
informaes estruturais conservadas so transferidas para um modelo inicial
correspondente seqncia de destino. A modelagem de loop feita usando
uma abordagem de banco de dados para encontrar candidatos de modelo de loop
apropriados que so ento adaptados ao ambiente usando CCD (Canutescu et
al.). As cadeias laterais so modeladas utilizando uma biblioteca de rotmeros
dependentes da estrutura principal (Shapovalov et al.) com base em SCWRL4
(Krivov et al.) pelo laboratrio Dunbrack. Um ltimo passo de minimizao de
energia realizado usando a biblioteca de mecnica molecular OpenMM
(Eastman et al.). O modelo final selecionado com base na estimativa da
qualidade do modelo empregando potenciais estatsticos de fora mdia.
A construo de um modelo de homologia compreende quatro etapas principais:
- Identificao do modelo estrutural

- Alinhamento da sequencia alvo e estrutura do modelo

- Construo do modelo

- Avaliao da qualidade do modelo

Na aba Modelling existem diversos modos para a construo do modelo que diferem
em relao a dificuldade de modelagem.

1. Create an account > Email > Senha para login

2. Exemplo 1: protena Esfingomielina fosfodiesterase 1 (ASM).

3. Start Modelling/myWorkspace (Automated Mode) > http://www.uniprot.org/ >


Paste FASTA > Search for template> Summary > Templates > Models
- Essa opo permite a seleo de um modelo
- Identifica modelos adequados com base em Blast (Altschul et al.) e HHblits
(Remmert et al.).
4. Modelling > Alingment Mode > Template Library (PDB/SMTL FASTA or
Clustal). Se o modelo desejado para a modelagem for conhecido e disponvel no
Swiss Model Template Library (SMTL) um alinhamento de modelo alvo no formato
FASTA ou ClustalW pode ser usado para iniciar o processo de modelagem,
ignorando assim a busca pelo modelo. Para isso, faz-se necessrio um PDB ID da
protena, que pode ser encontrado no banco http://www.rcsb.org/pdb/home/home.do
5. Modelling > Template Library > PDB ID >
http://www.rcsb.org/pdb/home/home.do > Nome da protena > ID > Copy and paste
no SMTL.
6. Modelling > DeepView Project Mode (programa para baixar o arquivo link para
download http://spdbv.vital-it.ch/ ). Baixando o arquivo possivel ver o exemplo.
Utilizado em situaes de modelagem difceis, onde o alinhamento correto entre o
alvo e o modelo no pode ser claramente determinado por mtodo de sequncia.

Você também pode gostar