Você está na página 1de 2

Bioinformtica , 2009

EXERCCIO N2
No exerccio proposto pretende-se que analisem uma sequncia de DNA, que
identifiquem uma ORF (open reading frame), determinem a protena que ir expressar e
a bactria que a expressa.

A sequncia de DNA a seguinte:


TACGCAATGCGTATCATTCTGCTGGGCGCTCCGGGCGCAGGTAAAGGTACTCAGGCTCAATTCATCATGGAGAAAT
ACGGCATTCCGCAAATCTCTACTGGTGACATGTTGCGCGCCGCTGTAAAAGCAGGTTCTGAGTTAGGTCTGAAAGC
AAAAGAAATTATGGATGCGGGCAAGTTGGTGACTGATGAGTTAGTTATCGCATTAGTCAAAGAACGTATCACACAGG
AAGATTGCCGCGATGGTTTTCTGTTAGACGGGTTCCCGCGTACCATTCCTCAGGCAGATGCCATGAAAGAAGCCGG
TATCAAAGTTGATTATGTGCTGGAGTTTGATGTTCCAGACGAGCTGATTGTTGAGCGCATTGTCGGCCGTCGGGTA
CATGCTGCTTCAGGCCGTGTTTATCACGTTAAATTCAACCCACCTAAAGTTGAAGATAAAGATGATGTTACCGGTGA
AGAGCTGACTATTCGTAAAGATGATCAGGAAGCGACTGTCCGTAAGCGTCTTATCGAATATCATCAACAAACTGCAC
CATTGGTTTCTTACTATCATAAAGAAGCGGATGCAGGTAATACGCAATATTTTAAACTGGACGGAACCCGTAATGTA
GCAGAAGTCAGTGCTGAACTGGCGACTATTCTCGGTTAATTCTGGATGGCCTTATAGCTAAGGCGGTTTAAGGCCG
CCTTAGCTATTTCAAGTAAGAAGGGCGTAGTACCTACAAAAGGAGATTTGGCATGATGCAAAGCAAACCCGGCGTA
TTAATGGTTAATTTGGGGACACCAGATGCTCCAACGTCGAAAGCTATCAAGCGTTATTTAGCTGAGTTTTTGAGTGA
CCGCCGGGTAGTTGATACTTCCCCATTGCTATGGTGGCCATTGCTGCATGGTGTTATTTTACCGCTTCGGTCACCA
CGTGTAGCAAAACTTTATCAATCCGTTTGGATGGAAGAGGGCTCTCCTTTATTGGTTTATAGCCGCCGCCAGCAGAA
AGCACTGGCAGCAAGAATGCCTGATATTCCTGTAGAATTAGGCATGAGCTATGGTTCAC

1. Comece por identificar uma ORF na sequncia de DNA apresentada.


Para isso, lembre-se que em bactrias, uma ORF num fragmento de RNA comea
por um AUG (o qual corresponde a um ATG na sequncia de DNA) e pode terminar
por um dos 3 codes de terminao: UAA, UAG ou UGA (os quais correspondem a
TAA, TAG ou TGA na sequncia de DNA).
Neste sentido, siga algumas dicas para encontrar uma ORF neste fragmento de
DNA bacteriano:
(a) A ORF deve iniciar-se com um codo de iniciao (ATG);
Nota: neste exerccio o primeiro ATG o codo de iniciao, mas lembre-se que
no ter esta informao quando procurar num gene real,
(b) Deve terminar com um codo stop: um TAA, TAG ou TGA,
(c) Deve ter pelo menos 300 nucletidos de comprimento (para que codifique para
100 aminocidos),
(d) Ambos os codes start e stop devem estar includos na sequncia da ORF. Por
isso, o nmero total de bases na sequncia (entre o codo start e stop) deve ser
divisvel por 3.

2. Para a identificao da protena:


I. Traduo da sequncia de nucletidos
(a) Seleccione a sequncia da ORF e copie-a,
(b) V ao ExPASy server (http://www.expasy.org/tools/dna.html) - ferramenta de
traduo e, na opo Please enter a DNA or RNA sequence in the box below
(numbers and blanks are ignored). cole a sequncia obtida,
(c) Seleccione de seguida a opo Verbose (Met, Stop, spaces between
residues) como escolha do formato e clique em Translate Sequence.,
(d) Grave a sequncia obtida num ficheiro parte,
(e) Onde est escrito Met altere para M e onde est o codo stop altere para -,
(f) Grave a sequncia.

II. Identificao da protena

Para a identificao da protena propriamente dita:


(a) V pgina do NCBI BLAST page (http://www.ncbi.nlm.nih.gov/BLAST/) e
seleccione a opo Protein-Protein Blast,
(b) Copie a sua sequncia proteca para a Search Box,
(c) Use os valores por defeito (default values) para o resto da pgina e clique na
opo BLAST,
(d) Uma vez na pgina de formatao, clique na opo Format,
A protena certa dever ser a primeira da lista.

Qual a protena? E de que organismo se trata?

23 Maro de 2009

Você também pode gostar