Você está na página 1de 3

Anotao de seqncias

I Curso de Aperfeioamento em Bioinformtica da UFMG Anotao


Alessandra C. Faria-Campos, D. Sc. Anotao de seqncias um processo mltiplo, pelo qual uma ou mais seqncias brutas de DNA ou de aminocido so analisadas com a finalidade de atribuir caractersticas biolgicas para o entendimento do contexto biolgico em que estas se inserem, ou seja, sua funo (Stein, 2001)

O que anotao
Atribuir as seqncias: Nomes Caractersticas funcionais Caractersticas fsicas (mapping) Estrutura Participao em vias metablicas

Perguntas a serem respondidas


Quais seqncias codificam protenas ou RNAs estruturais? Qual a funo dos produtos gnicos preditos? possvel ligar o gentipo ao fentipo (Ex: Quais genes esto ativos e e, que momento Porque duas linhagens do mesmo patgeno variam em patogenicidade) possvel traar a histria evolutiva do organismo a partir da seqncia e organizao do seu genoma

Tipo de anotaao
Anotao automtica: feita atravs de softwares O comptador toma as decises em relao a anotao Funciona bem para seqncias fcies de anotar, Seqncias dificeis de anotar requerem anotao manual Anotao manual: feita por um curador humano Anotao de mlehor qualidade Gasta muito tempo

Anotao gnica
Nveis de anotao
Anotao no nvel de nucleotdeos: procura por genes Em procariotos: mais simples; procura por janelas abertas de leitura Em eucariotos: complicada pela presena de ntrons e stios de splicing alternativo Anotao no nvel de protenas: nomeao de protenas e suas possveis funes Anotao no nvel de processos: relacionar o genoma a processos biolgicos

Busca por genes - Predio Ab Initio


Etapas da anotao
Comea com a predio de genes atravs da : identificao de ORFs Exame da composio de bases entre as regies codificadoras e no codificadoras Reconhecimento computacional do gene (exons, introns, limite exon-intron) usando uma variedade de algoritmos de busca de genes (GLIMMER, GRAIL, FGENEH, GENSCAN GLIMMER-HMM, etc)

Busca de genes - caracteristicas


Procariotos Alta densidade de genes (1/1Kb) Ausncia de introns Regies intergnicas curtas Eucariotos Menor densidade de genes (1/200 Kb) Presena de introns e splicing alternativo Presena de repeties

Buscas de Homologia
Comparao de duas seqncias de dois organismos diferentes ou do mesmo organismo para determinar um alinhamento local timo
query TAGTCGATATGGGTGTAAATATGCAGTCGTACGACG AGTATTGGTGTAAATATGCAGTCGTACGACGAGTTGTAA subject

Problemas comuns nas anotaes


Similaridade X Homologia Genes hipotticos Genes depositados em bancos de dados sem funo Geralmente, aparecem em organismos filogenticamente prximos Genes hipotticos conservados Genes depositados em bancos de dados sem funo Aparecem em diversos genomas de organismos filogenticamente distantes Falta de padronizao dos vocabulrios de anotao Erros/falta de anotao nos banco de dados pblicos

Programas ou plataformas de anotao

Qualidade da anotao
Erros de anotao so facilmente propagveis e geram um crculo vicioso pois seqncias de anotao ruim podero alimentar os bancos de dados que sero utilizados na anotao O curador manual deve exercer seu bom senso ao atribuir uma anotao a uma seqncia. Ex: ausncia de catalase em S. mansoni

Você também pode gostar