Você está na página 1de 17

Algoritmos para Alinhamento de Sequncias

Gerardo Valdisio Rodrigues Viana


Universidade Estadual do Cear

Hlio Augusto Sabia Moura
Faculdade Loureno Filho


RESUMO

Comparar sequncias de caracteres um problema de grande interesse da Cincia da Computao.
Muitas so as aplicaes nos gerenciadores de banco de dados, processadores de texto e em diversas
ferramentas da Bioinformtica. Uma forma de comparar duas ou mais sequncias atravs da construo
de um alinhamento entre elas. Algoritmos bsicos para fazer um alinhamento buscam sempre sua melhor
forma, ou seja, aquela que corresponda ao maior grau de similaridade entre as sequncias comparadas.
Aqui so apresentadas algumas tcnicas algortmicas desenvolvidas para o alinhamento simples que
corresponde comparao entre duas sequncias, e mltiplo, entre trs ou mais sequncias.

Palavras-chave: Alinhamento, Bioinformtica, Otimizao, Similaridade entre Sequncias.


1 INTRODUO

A Bioinformtica uma rea interdisciplinar que utiliza tcnicas da Cincia da
Computao, da Matemtica aplicada e da Estatstica para resolver problemas da Biologia. No
estudo da evoluo e das funes da microbiologia, comum a necessidade de comparar
molculas de vrias espcies. Neste contexto, as sequncias constituem as estruturas primitivas
que indicam como os aminocidos se encontram combinados em um gene ou em uma protena;
um alinhamento procura determinar o grau de similaridade entre estas sequncias, na sua
totalidade ou entre seus fragmentos.
Pode-se ento dizer que um alinhamento de sequncias uma forma de organizar
sequncias de DNA (DeoxyriboNucleic Acid), de RNA (RiboNucleic Acid) ou de protenas, para
identificar regies similares indicativas de relaes funcionais, estruturais ou evolucionrias
entre elas (WATERMAN, 1995). Os resultados de um alinhamento so teis na anlise de
genomas ou na anlise de regies conservadoras dos genes que sofreram mutaes, bem como
68 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010
no estudo das estruturas secundrias das protenas e na gerao de informaes para construo
de rvores filogenticas (VIANA, 2007).
Os algoritmos desenvolvidos para fazer alinhamentos buscam sempre a forma que
corresponda ao maior grau de similaridade entre as sequncias comparadas. A ideia central
destas tcnicas minimizar as diferenas entre elas, ou seja, seu objetivo principal buscar um
alinhamento timo. No contexto da teoria da complexidade, este um problema de otimizao
chamado, em geral, de AVS (Alinhamento de Vrias Sequncias) onde se procura a soluo
tima que corresponde maior similaridade. No so conhecidos algoritmos que resolvam o
problema do AVS em tempo polinomial, portanto ele classificado como um problema da
classe NP-completo (Non deterministic Polynomial-time complete). Uma demonstrao desta
classificao pode ser vista em Wang & Jiang (1994). Especificamente, para duas sequncias,
chamado problema do APS (Alinhamento de Pares de Sequncias), a soluo tima obtida em
tempo polinomial.
Para entender como se processa um alinhamento e como pode ser computado o grau de
similaridade entre duas ou mais sequncias, so apresentados alguns dos principais algoritmos
desenvolvidos para esse fim. Alm disso, so citadas vrias referncias com o objetivo de
orientar queles que desejam realizar um estudo mais aprofundado deste assunto. O trabalho
est assim organizado: na seo 2, so definidos os elementos necessrios para se fazer um
alinhamento e indicados quais os tipos existentes. Na seo 3, apresentamos vrias tcnicas de
alinhamento e seus algoritmos, enquanto que, na seo 4 so mostradas as aplicaes deste
problema; por fim, a seo 5 trata da concluso do trabalho.

2 CONCEITOS BSICOS
2.1 Smbolos e Sequncias
Um alfabeto E um conjunto finito, no vazio, de caracteres ou smbolos, incluindo o
smbolo especial para representar um caractere branco, espao ou trao.
Exemplo 1: E = {A,C,G,T,} o alfabeto com as bases nitrogenadas.
Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 69

Exemplo 2: E' = {A,C,D,E,F,G,H,I,K,L,M,M,P,Q,R,S,T,V,W,Y,} o alfabeto com os
20 aminocidos naturais.

Uma sequncia s sobre E uma cadeia de caracteres s=(c
1
, c
2
, ... ,c
n
) e E
n
, neZ
+
. Nesse
caso, o comprimento, ou tamanho da cadeia n = |s|. Um segmento s [i..j], ou fragmento,
uma sequncia definida para i s j, correspondendo a um trecho de s, contguo ou no, ou seja,
s[i..j] = (c
i
, c
i+1
, ... ,c
j
).
Exemplo 3: s= CGTAAGCTT uma sequncia do alfabeto E, sendo s[3..6]= TAAG.
2.2 Alinhamento Simples
Um alinhamento simples uma forma de descrever a relao entre duas sequncias s
1
e
s
2
. O processo consiste em introduzir espaos ou lacunas (gaps), representados pelo smbolo
, que correspondem aos deslocamentos dos segmentos, de modo que a maioria dos caracteres
seja idntica em algumas posies (match). Esses espaos podem ser inseridos nas extremidades
ou no interior de s
1
e s
2
, de modo que, s
1
[j] e s
2
[j],

numa determinada posio j, no sejam
smbolos simultaneamente iguais a . Esta propriedade chamada de alinhamento livre de
colunas em branco.
Exemplo 4: Para s
1
= AAGCCTC e s
2
= AAACT, apresentamos a seguir algumas
formas de alinhamento, entre vrios possveis:
AAGCCTC
AAA CT
AAGCCTC
AAA CT
AAGCCTC
AAACT
AAGCCTC
AA ACT
s'
1
s'
2

( a) ( b) (c) (d)
Uma ligeira inspeo entre s
1
e s
2
mostra que estas duas sequncias so parecidas, embora
o alinhamento sugerido no caso (c) no seja desejado, visto que no ressalta este fato. Tcnicas
70 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010
para avaliar o grau de similaridade entre sequncias, a serem mostradas na seo 3, permitem
decidir, entre todas as possibilidades, qual a melhor delas.
Para avaliar o grau de complexidade deste problema, podemos computar quantos
alinhamentos (q) possveis existem entre duas sequncias, da seguinte forma:
- Se |s
1
| = |s
2
| e no forem includos espaos, existe apenas um alinhamento, ou
seja, q=1.
- Se n= mx { |s
1
| , |s
2
| }, j com espaos includos, no pior caso, temos:


Exemplo 5:


ou seja, mais de 138 bilhes de alinhamentos possveis.

A razo obtida na expresso anterior advm da aproximao de Stirling (GRAHAN et al.,
1995) para o fatorial de n, , de modo que:

Para se obter uma padronizao no clculo de uma funo de pontuao que corresponde
ao grau de similaridade, se |s
1
| = n
1
e |s
2
| = n
2
, com n
1
= n
2
devem ser inseridos espaos tais
que as duas cadeias finais fiquem de mesmo tamanho, ou seja, |s'
1
| = |s'
2
| = n.
2.3 Alinhamento Mltiplo
Seja k um inteiro positivo e s
1
, s
2
, . . . ,

s
k
sequncias sobre um alfabeto E\{} com
|s
i
|=n
i
, i=1..k. Um alinhamento mltiplo (CARRILLO & LIPMAN, 1988) A corresponde a
Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 71

uma matriz A
ij
de ordem k x n, com entradas em E onde n > mx{ n
i
,

i=1..k } de modo que a
linha A
i
do alinhamento seja a sequncia s
i
com possveis espaos inseridos entre seus
caracteres.
Como dito anteriormente, se k=2, o problema conhecido como APS (Alinhamento de
Pares de Sequncias) e se k>2, como AVS (Alinhamento de Vrias Sequncias).
2.4 Tipos de Alinhamento
2.4.1 Global
o tipo mais comum e envolve a comparao de uma extremidade a outra, conforme visto
no Exemplo 4. Aps a incluso dos espaos, as sequncias sero alinhadas uma sobre a outra
para permitir que seja aplicada uma avaliao do grau de similaridade entre elas. Programas
disponveis em bases de dados pblicas, como o CLUSTAL (2010) e o MULTALIN (2010),
realizam este tipo de alinhamento.
2.4.2 Local
O propsito encontrar e extrair um ou mais segmentos das sequncias comparadas que
exibam alta similaridade. No caso, a avaliao seria feita de forma parcial, ou seja, somente nos
segmentos selecionados. Os programas Blast - Basic Local Alignment Search Tool (ALTSCHUL
et al., 1997) e Fasta Fast Alignment (PEARSON & LIPMAN, 1988) so as ferramentas de
busca de alinhamento local mais utilizadas.
2.4.3 Global ou Local
O alinhamento global frequentemente utilizado para determinar regies conservadas
entre sequncias homlogas
1
enquanto que o alinhamento local geralmente utilizado na busca
de segmentos homlogos em Banco de Dados pblicos (NCBI, 2010) e na montagem de
genomas.

1
A homologia a ferramenta bsica da Biologia comparada que retrata a similaridade entre espcies
descendentes de um ancestral comum.
72 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010
2.5 Grau de Similaridade
Uma maneira usual de atribuir escores no alinhamento de duas sequncias dada pela
estratgia de associar a cada coluna j das sequncias alinhadas uma pontuao ou peso w
j

da seguinte forma:

A funo de pontuao ou funo objetivo seria dada pela equao seguinte, onde maiores
valores para f indicam que s
1
e s
2
so mais similares.

Exemplo 6 Considerando os alinhamentos (a) e (b) do Exemplo 4 teramos:
s
1

A A G C C T C
s
3

A A G C C T C
s
2

A A A C T
s
4

A A A C T
w
j

+1 +1 1 2 +1 +1 2
w
j

2 +1 +1 2 2 +1 +1 2
(a) f (s
1
,s
2
) = 1+112+1+12 = 1 (b) f (s
3
,s
4
) = 2+1+122+1+12 = 4
Como f (s
1
,s
2
) > f (s
3
,s
4
) ento o alinhamento (a) melhor que o (b).
Utilizando este critrio poderia comparar vrias sequncias e decidir quais so as mais
semelhantes entre si.
Exemplo 7: Considerando as sequncias r, s e t da tabela abaixo, observa-se que s e t so
mais prximas entre si do que as demais combinaes. Estes resultados podem ser dispostos
numa matriz de distncias.
r L L C C E G E
f (r,s) = +1+1+1+12221+1+1 = 1
s L L C C C T W M G E
f (r,t) = 1+1+1+12221+1+1 = 3
t C L C C R T W M G E
f (s,t) = 1+1+1+11+1+1+1+1+1 = +6
Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 73


2.6 Sequncias Biolgicas
Para os pesquisadores da rea de Biologia Molecular, o importante obter o alinhamento
que tenha mais significado biolgico. Quando se comparam sequncias biolgicas, procura-se
ento verificar a evidncia de que elas tiveram um ancestral comum e consensual que as
divergncias ocorreram por processos de mutao ou de seleo natural.
O processo de mutao mais simples considera substituio, insero e eliminao de
caracteres, e a seleo natural tem a capacidade de potenciar umas mutaes em prejuzo das
outras. Eventos como inverses e transposies no so detectados pelos algoritmos
tradicionais. As ferramentas existentes geram matrizes de distncias que so elementos bsicos
para gerao de rvores filogenticas. Estes algoritmos comparam genes das espcies em
estudo, dispondo as pontuaes numa tabela de pesos (escores), de modo que bases
nitrogenadas iguais tm escore igual a (+2) e diferentes, igual a (1) indicando a uma
penalidade; para os deslocamentos o escore nulo.
Exemplo 8: Para as sequncias do Exemplo 6 seria considerada a seguinte tabela:
A C T G
A +2
1 1 1
C
1
+2
1 1
T
1 1
+2
1
G
1 1 1
+2

s
1

A A G C C T C
s
3

A A G C C T C
s
2

A A A C T
s
4

A A A C T
w
j

+2 +2 1 0 +2 +2 0
w
j

0 +2 +2 0 0 +2 +2 0
(a) f (s
1
,s
2
) = 2+21+0+2+2+0 = 7 (b) f (s
3
,s
4
) = 0+2+2+0+0+2+2+0 = 8
Como o objetivo agora minimizar as penalidades, teramos f (s
1
,s
2
) < f (s
3
,s
4
), portanto,
o alinhamento (a) tambm seria considerado melhor que o (b). Por este aspecto, no havendo
penalizao para os deslocamentos, significa que mais provvel isto acontecer do que uma
74 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010
mudana de base (AC, GA, por exemplo). Do ponto de vista biolgico, a mutao entre
bases no ocorre com a mesma probabilidade, devido composio das mesmas. Transies
(mudanas de bases da mesma classe) so mais frequentes que transverses (mudanas de
bases de classes distintas). As classes das bases nitrogenadas so as purinas (Adenina e
Guanina) e piridinas (Citosina e Timina).
Exemplo 9: Para atender a estas consideraes, a tabela a ser usada ficaria assim:
A C T G
A +2 1 1 0,5 0
C 1 +2 0,5 1 0
T 1 0,5 +2 1 0
G 0,5 1 1 +2 0

0 0 0 0 x
Nos alinhamentos mltiplos, a escolha da funo menos relevante, pois a comparao
feita entre sequncias que representam espcies distintas.
2.7 Distncia de Edio
A distncia de edio entre sequncias o nmero mnimo de operaes de edio
(insero, remoo ou substituio de caracteres) necessrias para transformar uma sequncia
em outra. Se as operaes no tm custos uniformes, utiliza-se o menor custo da transformao.
As tpicas distncia de edio utilizadas so a de Hamming (1980), Levenshtein
(HIRSCHBERG, 1997) e a de Damerau (1964). A primeira permite apenas substituio de
caracteres e restrita para strings (cadeias) de mesmo tamanho. Uma de suas aplicaes para
o problema CSP Closest String Problem (VIANA et al., 2008). Para as duas seguintes, os
strings podem ter tamanhos diferentes, sendo que a de Levenshtein calcula o custo de edio,
considerando somente as trs operaes bsicas citadas, enquanto que a de Damerau uma
variao da mtrica de Levenshtein, sendo que considera tambm a operao de inverso de
caracteres adjacentes.
Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 75

2.8 Distncia Evolutiva
Duas sequncias s
1
e s
2
esto a uma distncia evolutiva dita PAM1, se uma srie de
mutaes do tipo troca de caracteres convertem s
1
em s
2
com uma mdia de 1% (uma troca a
cada 100 aminocidos). O termo PAM Point Accepted Mutation refere-se matriz de
substituio utilizada no alinhamento de protenas homlogas. Uma mutao aceita refere-se
quela gerada entre duas sequncias que no provoca a extino da espcie que contm a
sequncia descendente sob o ponto de vista filogentico.
Uma matriz PAM (DAYHOFF, 1978) define um processo estocstico para gerao da
pontuao de seus termos, sem interesse no escopo deste trabalho.

3 PRINCIPAIS ALGORITMOS PARA O PROBLEMA DO ALINHAMENTO
3.1 Preliminares
Todos os algoritmos apresentados constam de dois procedimentos, um (DIST) para o
clculo das distncias ou gerao da matriz de pontuao, e outro (ALIGN) para determinar o
alinhamento timo que corresponde ao melhor alinhamento ou pontuao mnima.
Entrada duas sequncias seE e teE, de tamanhos, respectivamente, iguais a m e n.
Notao A[i,j] = d(s[1..i] , t [1..j]) d(s,t) = d(s[1..m] , t [1..n]) = A[m,n], d=distncia
Matriz de pontuao A de ordem (m+1) x (n+1), incluindo o smbolo



Um estudo completo destes e de outros algoritmos pode ser encontrado em Brito (2003).

76 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010
3.2 Algoritmos APS (Alinhamento de Pares de Sequncias)




Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 77



Uma variante deste algoritmo o mtodo de Economia de Espao (HIRSCHBERG, 1975)
que altera a estrutura de dados do clculo da distncia utilizando um vetor linear a[0..n] em
substituio matriz de pontuao.
Outras tcnicas so similares s apresentadas, com alterao na gerao da matriz de
pontuao, por exemplo, o algoritmo de Needlman & Wunsch (1970) utiliza programao
dinmica para fazer o alinhamento global e o de Smith & Waterman (1981) faz uma busca em
regies com semelhana local, sem considerar todo seu comprimento.
Os algoritmos da seo seguinte fazem o alinhamento mltiplo. O primeiro deles, Gusfield
(1997), um algoritmo de aproximao (VAZIRANI, 2003).

78 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010

3.3 Algoritmos AVS (Alinhamento de Vrias de Sequncias)


A razo de aproximao do Algoritmo 3 dada pelo fator o=(22/k), de modo que para
duas sequncias (k=2) o algoritmo exato (o=1). O procedimento JUNCTION, correspondente
ao Algoritmo 4, encontra-se na pgina seguinte.
Outros algoritmos para o AVS usam uma interpretao estatstica na pontuao dos
alinhamentos. A gerao da matriz de distncias evolutivas evidencia um modelo de mutao
com o pareamento de caracteres ao acaso atravs do logaritmo da razo de probabilidades
log-odd scores. Como referncia, citamos o Modelo de Markov de Estados Ocultos Hidden
Markov Model que um mtodo de inferncia (FORBES & PEYRARD, 2001).


Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 79




4 APLICAES PARA O PROBLEMA DO ALINHAMENTO
4.1 Gerao de Matrizes de Distncias Evolutivas
Programas conhecidos como Protdist, Dnadist e Distmat do pacote Phylip Phylogeny
Inference Package (FELSENSTEIN, 1993) que fazem alinhamento de mltiplas sequncias,
teis para o problema da filogenia, geram as matrizes de distncias, utilizando os seguintes
mtodos ou algoritmos, Jukes & Cantor (1969), Tajima & Nei (1984), Kimura (1980), Mega3
(KUMAR et al., 2004) e Jin-Nei Gamma distance (JIN & NEI, 1990).
80 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010
4.2 Montagem de Fragmentos
Um projeto genoma tem como objetivo determinar as sequncias de DNA completas de
todos os cromossomos de um organismo. Os sequenciadores disponveis em laboratrios de
gentica so limitados a sequenciar milhares de bases nitrogenadas, no entanto, mesmo os
organismos menos complexos, como as bactrias, so formados por milhes destas bases. Uma
maneira de amenizar este problema fragmentar o DNA e a seguir montar as subsequncias, ou
fragmentos, obtidos.
Foram desenvolvidos montadores de genomas que utilizam os resultados obtidos pelos
algoritmos de alinhamento aqui descritos, para reconstruir a sequncia completa do DNA
(Sequencing Whole Genomes).

5 CONCLUSO
A comparao de sequncias de caracteres, feita atravs do processo de alinhamento,
uma das tarefas bsicas da Bioinformtica, conforme os algoritmos e as aplicaes
apresentadas. Vimos que para alinhar duas sequncias existem algoritmos eficientes exatos para
obter a soluo tima, embora alguns deles enquadram-se na categoria de pseudo-polinomiais.
Para o caso de vrias sequncias, o problema do alinhamento mltiplo NP-difcil. Assim
foi observado que necessrio desenvolver novos algoritmos, para sua resoluo em tempo,
hbil buscando sempre solues bem aproximadas da soluo tima.













Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 81

Sequence Alignment Algorithms
ABSTRACT

Comparing strings is a problem of great interest in computer science. There are many applications
in the database managers, word processors and various tools of Computational Biology. One way to
compare two or more sequences is by building an alignment between them. Basic algorithms for
alignment seek the best shape that corresponds to the highest degree of similarity between the sequences
compared. This article presents some algorithmic techniques developed to align sequences corresponding
to the simple comparison with two sequences, and multiple, with three or more sequences.

Keywords: Alignment, Computational Biology, Optimization, Sequence Similarity.



REFERNCIAS

ALTSCHUL, S.F., MADDEN, T.L., SCHFFER, A.A., ZHANG, J., ZHANG, Z., MILLER, W. and
LIPMAN, D.J., Gapped BLAST and PSI-BLAST: a new generation of protein database search programs.
Nucleic Acids Research, 25:33894202, 1997.

BRITO, R.T., Alinhamento de Sequncias Biolgicas, Dissertao de Mestrado, IME/USP, Instituto de
Matemtica e Estatstica Universidade de So Paulo, 2003.

CARRILLO, H. and LIPMAN, D., The multiple sequence alignment problem in biology, SIAM Journal
of Applied Mathematics, 48(5):10731082, 1988.

CLUSTAL, Disponvel em: <www.ebi.ac.uk/clustalw>, Setembro, 2010.

DAMERAU, F., A technique for computer detection and correction of spelling errors, Comm. of the
ACM, 7(3):171176, 1964.

DAYHOFF, M.O., SCHWARTZ, R.M., ORCUTT, B.C., A model of evolutionary change in proteins,
Atlas of Protein Sequence and Structure 5(3):345352, 1978.

FELSENSTEIN, J., PHYLIP Phylogeny Inference Package: Computer Programs for Inferring
Phylogenies, version 3.69, University of Washington, Seatle, WA, 1993. <http://evolution.genetics.
washington.edu/phylip.html>, September, 2010.

FORBES, F. and PEYRARD, N., Hidden Markov Models Selection Criteria based on Mean Field-like
approximations, INRIA Institute National de Recherche en Informatique et Automatique, Rapport
#4371, 33p., Fvrier, 2001.
82 Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010

GRAHAN, R. L., KNUTH, D. E. and PATASHNIK, O., Matemtica Concreta: Fundamentos para a
Cincia da Computao, Rio de Janeiro: LTC, 1995.

GUSFIELD, D., Algorithms on strings, trees and sequences: Computer Science and Computational
Biology, Cambridge University Press, 1997.

HAMMING, R. W., Coding and information theory, Prentice-Hall, Inc., 1980.

HIRSCHBERG, D. S., Serial computations of Levenshtein distances, Pattern Matching Algorithms, A.
Apostolico and Z. Galil, editors, Oxford University Press, p. 123141, 1997.

_________________, A linear space algorithm for computing maximal common subsequences,
Communications of the ACM 18:341343, 1975.

JIN, L. and NEI, M., Limitations of the evolutionary parsimony method of phylogenetic analysis.
Molecular Biology and Evolutions, 7:82102, 1990.
JUKES, T.H. and CANTOR, R.C., Evolution of Protein Molecules, in Mammalian Protein Metabolism,
chapter 2, p. 22132, New York: Academic Press, 1969.

KIMURA, M., A simple method for estimating evolutionary rates of base substitutions through
comparative studies of nucleotide sequences, Molecular Evolutions, 16:111120, 1980.

KUMAR, S., TAMURA, K. and NEI, M., MEGA3: Integrated software for molecular evolutionary
genetics analysis and sequence alignment, Bioinformatics, 5(2):150163, 2004.

MULTALIN, Disponvel em: <http://multalin.toulouse.inra.fr/multalin>, Setembro, 2010.

NCBI National Center for Biotechnology Information, disponvel em <http://ncbi.nlm.nih.gov>,
Setembro, 2010.

NEEDLEMAN, S. B. and WUNSCH, C. D., A general method applicable to the search for similarities in
the amino acid sequence of two proteins, Journal of Molecular Biology 48 (3): 44353, 1970.

PEARSON, W. R. and LIPMAN, D. J., Improved tools for biological sequence comparison. PNAS
Proceedings of the National Academy of Sciences, 85:24442448, 1988.

SMITH, T. F. and WATERMAN, M. S., Identification of common molecular subsequences, Journal of
Molecular Biology 147:195197, 1981.

TAJIMA, F. and M. NEI, M., Estimation of evolutionary distance between nucleotide sequences,
Molecular Biology and Evolutions, 1(3):269285, 1984.

VAZIRANI, V.V., Approximation Algorithms, Berlin: Springer-Verlag, 2003.

VIANA, G.V.R., GOMES, F.C., MENESES, C.N. and PARDALOS, P.M., A parallel multistart
algorithm for the closest string problem, Computers & Operations Research 35:36363643, 2008.
Revista Cientfica da Faculdade Loureno Filho - v.7, n.1, 2010 83


VIANA, G.V.R., Tcnicas para Construo de rvores Filogenticas, Tese de Doutorado, DC/UFC,
Departamento de Computao Universidade Federal do Cear, Fortaleza: 2007.

WANG, L. and JIANG, T., On the complexity of multiple sequence alignment, Journal of Computational
Biology, 1:337348, 1994.

WATERMAN, M. S., Introduction to computational biology: Maps, sequences and genomes, Chapman
and Hall, 1995.


Gerardo Valdisio Rodrigues Viana
Doutor em Cincia da Computao - UFC/USP
Professor Associado - UECE
reas de interesse: Otimizao Combinatria, Algoritmos e Bioinformtica.
e-mail: valdisio@gmail.com

Hlio Augusto Sabia Moura
Professor de Desenvolvimento da Faculdade Loureno Filho
Mestrando em Computao Aplicada - MPCOMP / UECE
Analista de Sistemas do Departamento de Informtica da UECE
reas de interesse: Engenharia de Software, Linguagens de Programao e Desenvolvimento em Java
e-mail: helio.moura@uece.br

Você também pode gostar