Você está na página 1de 14

Identificao de organismos patognicos do ponto de vista

bioinformtico
Nos ltimos 15anos a microbiologia passou por momentos de mudana
relativamente aos mtodos moleculares. Novas sequncias aparecem
diariamente em bases de dados pblicas e novas ferramentas informticas e
servidores servidores Web esto publicadas numa base regular.
Grandes avanos na identificao molecular de organismos Patognicos foram
feitos porque surgiram novos mtodos de biotecnologia que muitas vezes exigem
uma anlise aprofundada de sequncias.
No entanto, grandes dificuldades em parte permanecem devido ao
desenvolvimento de mtodos eficientes porque as bases de dados pblicas
contm muitas mal anotadas ou em sequncias parciais (muitas vezes de ordem
ambiental origem) e tambm porque existem poucos servidores Web dedicados a
bases de dados.
Introduo
Em microbiologia, diagnsticos baseados em cidos nucleicos gradualmente
substituem os mtodos baseados em culturas
Processos que dependem do PCR de um nico gene ou de vrias sequncias
requerem a concepo de oligmeros de amplificao e
hibridao.
O sequenciamento massa ou catalogao atravs da unidade 16S rRNA
produzem sequncias que tm de ser adaptadas a um banco de dados
sequncias conhecidas.
1. DDBJ, EMBL e GenBank tem como objectivo o intercmbio de dados (URL:
http://www.insdc.org) contendo sequncias conhecidas.
2. Blast usado para recuperar sequncias semelhantes, ACNUC, SRS ou
Entrez recuperam sequncias de acordo com palavras-chave.
3. Existem muitos utilitrios livres para alinhar sequncias, calcular e
visualizar
rvores
filogenticas.
(URL:http://bioinfo.unice.fr/softwares/oligo_softwares.html).
4. Por ltimo desenho de primers e sondas pode ser feito utilizando vrias
ferramentas. (URL:http://bioinfo.unice.fr/softwares/oligo_softwares.html).

Recuperao de sequncias necessrias pode ser, difcil, o desenho de primers e


sondas tedioso e pode resultar em menor qualidade e resultados se mltiplos
critrios para o design deste no so devidamente tratados.
Novas sequncias fluem mais rpido do que os programas podem lidar
Ex:
Deixou de ser fcil fazer o Blast em genes da unidade 16S rRNA isolados para
descobrir a qual bactria esta relacionada porque novas sequencias do rRNA
originam de clones no cultivados.
Sequncias no so facilmente obtidas por Blast (porque muitas so bastante
divergentes), ou por palavras-chave porque as suas anotaes so
frequentemente insuficientes ou no esto no formato standard.
Alm disso, e em contraste com a comunidade dedicada para a anlise de
genomas completos, existem poucos servios centralizado ou servidores web que
angriam dados, que os tratam e publicam para posterior consulta e anlise como
ferramenta.
Finalmente, bioinformaticos continuam a publicar novas ferramentas, mas
existem poucos estudos que faam a comparao entre eles e, de facto, analisar
"quo bom" estas novas ferramentas esto.
Anlises detalhadas sero restritos a bactrias aquticas, para o qual vamos
analisar seqncias disponveis e solues possveis para a anlise de
diagnstico, de mtodos antes da sua real experimentao.
Escolha de um gene-alvo
Genes alvo para a identificao bacteriana pode ser o gene (rRNA) da unidade
16S.
Algumas espcies so sempre patognicas, e genes da unidade 16S rRNA
muitas vezes a soluo, porque muitas sequncias foram publicadas.
PCR primers hibridacin sondas e tem sido geralmente
descrita e testada; finalmente software especfico e
Web sites que esto disponveis
Casos do lateral transferts
ou muito semelhantes 16S rRNA sequncias genticas
(revista em referncia, tambm destacou a
necessidade de utilizar outros ou mais rpida evoluo genes
Alguns destes genes foram, no entanto, completamente
seqenciado em muito poucos diferentes cepas ou espcies, tornando

duvidoso que verdadeiramente universal ou especficas oligmeros tm


sido realmente concebido.
Tambm a ausncia generalizada de muito
conservadas domnios torna primers e sondas design
difcil. Finalmente, h sempre a chance de que ainda
Existem seqncias desconhecidas variante que vai escapar molecular
porque a deteco de mutaes.
O ltimo caso
aplica-se aos clones que se tornam patognicos s depois
aquisio de patogenicidade genes ou quando
patogenicidade depende do contedo gentico, isto ,
pela regulao diferencial de alguns genes ou integrao de
genes (ou domnios), que pertencem espcie ou gnero
gentico, mas nem sempre esto presentes em um determinado clone
Nesses casos, os genes alvo patogenicidade
melhor escolha, com dificuldades semelhantes s domsticas
genes.
Para outras abordagens, tais como multilocos seqncia
digitando (MLST) e anlise de nmero varivel de tandem
repete (VNTR) ver referncias para
exemplos.
Para Eukaria (frequentemente protistas), a abordagem muito semelhante,
mas existem muitas vezes menos disponveis a partir de seqncias
diferentes cepas ou espcies.
Pelo contrrio, uma vez pode-se esperar menos divergncia (devido menor
populao tamanhos e mais lento diviso taxas) para estar presente em uma
populao
Finalmente, os vrus so uma situao muito diferente, uma vez que existe no
housekeeping gene homlogo compartilhado entre vrus,
taxas de mutao e se espera que sejam muito mais elevados.
Recuperao de sequncia de dados para a maioria de organismos
patognicos aquticos
Uma lista de agentes patognicos susceptveis de serem encontradas
em ambientes aquticos foi construdo

e utilizada para a query-Gen


Banco liberao 163 (atualizaes at 5 de fevereiro de 2008) com
ACNUC.
As questes colocadas eram "quais so as
respectivos nmeros de inscries codifica genes e protenas
disponveis para cada organismo "(uma entrada uma apresentao
separada
identificado pelo seu nmero adeso, pode conter
as seqncias de vrios genes), e "quantos completa
genomas esto disponveis .

Estes dados (Tabela 1) demonstram


situaes contrastantes para os diferentes agentes patognicos;
Alguns organismos tm sido amplamente seqenciado, tanto em
termos de entradas, bem como completar genomas.
Outro patgenos, especialmente entre Eukarya ter recolhido pouco
como patgenos de interesse para o filo Apicomplexa, a
Nematoda dracunculus, e Naegleria fowleri.
Finalmente, para
Bactrias e Eukarya, pesquisando pelo nome espcie bastante
fcil, mas em busca de vrus, o nome do anfitrio frequentemente
includa no nome do organismo, fazendo buscas
mais difcil. A fim de obter todas as sequncias de
um determinado vrus, muitas vezes necessrio usar uma consulta
mais elevados
fim palavra-chave (Tabela 1).
GenBank continha cerca de 1 188 211 entradas bacteriana
(patognicos ou no), a 16S rRNA gene sozinho contribuindo
647 899 seqncias.
Notvel que muitos desses
seqncias foram curtas para muito curto (50-500 nt, 2530331
entradas), apenas 186 310 entradas tinham um comprimento de 1 200 ou
mais.
Apenas 32 900 dessas longas seqncias pertencia a
anotada como cepas cultivadas cerca de 8 000 diferentes
espcies.
Considerando-se todos os cadastros bacteriana, a nifH gene
(envolvidos
na fixao de nitrognio) foi o mais seqenciado (9 421
entradas), seguido por gyrB (um tipo de codificao topoisomerase
II,
6 845 sequncias) e rpoB (que codifica para a subunidade b do
RNA polimerase, 6 231 sequncias).
Por via aqutica bacteriana
patgenos e surpreendentemente o MDH gene (que
codifica para uma enzima que catalisa a interconverso
de malato e oxaloacetato) foram os mais seqenciado,
seguida por trs genes housekeeping: gyrB, rpoB, e
recA.

GyrB genes (seqncias disponveis de 337 gneros e


1 483 espcies, a maioria sequenciados gneros: Pseudomonas e
Vibrio), rpoB (seqncias disponveis de 238 gneros e
1 565 espcies, a maioria sequenciados gnero: Mycobacterium)
e recA (seqncias disponveis de 232 gneros e 999
espcies, a maioria sequenciados gnero: Vibrio) tm sido amplamente
utilizados como marcadores taxonmicos.
Domnios seqenciado
O nvel de seqncia divergncia, bem como a durao da
disponveis sequncias conduzir a resoluo filogentica.
Ele
no possvel fornecer essa facilmente uma avaliao no
bacteriana, devido a diferentes sequncias de genes
esto disponveis para uma ampla, mas diferente da distribuio de
txons.
Por isso, conteve a anlise para o Vibrio
sequncias ou gyrB, recA, e rpoB.
Para simplificar o
anlises e resultados, seqncias proticas foram baixados e
alinhados.
O comprimento mostrou que a maioria das distribuies
apresentaram seqncias no cobrem todo o comprimento
(Tabela 2), como resultado de muitas seqncias PCR amplificaes
usando 'universal' primers, o que torna a avaliao da
publicado primers difcil.
como resultado de muitas seqncias PCR amplificaes
usando 'universal' primers, o que torna a avaliao da
publicado primers difcil.
-Primers para gene amplificao, um estudo de caso

Mesmo utilizando bioinformtica anlises, teria sido


muito pesado, se no impossvel, avaliar publicados
primers para cada gene e para apresentar os resultados aqui.
Tal como um estudo de caso foi utilizado o PMI (macrfagos
infecciosidade potentiator) Legionella no gene que codifica para uma
superfcie
protenas, necessrias para optimizar infeco de macrfagos

Consultando a literatura retornou 44 publicaes que utilizaram


PMI como um alvo para a identificao, e para efeitos de
presente reviso, analisamos apenas dois estudos recentes
Temos obtido um total de 278 seqncias em PImx Legionella
espcies, das quais apenas 146 foram distintas (no contidos na
uma seqncia mais longa).
Ns avaliamos a forma como cada Oligomer
seria vincular a cada variante do PMI sequncias genticas
(Tabela 3). particularmente surpreendente que engodamento Mip-R1
mostra um descompasso para a maioria das seqncias na primeira
posio, uma
simples sopro confirmou este problema.

Para os outros oligmeros,


esta anlise demonstra que um nmero de
sequncias variante provavelmente no ser bem reconhecido.
Tambm analisaram se o gene estava presente em PImx Legionella
diferentes espcies de L. pneumophila e acoplado Tm
clculo com uma rvore filogentica (Figura 1).
O facto de o
PMI gene tambm est presente em outras espcies de Legionella no

claramente afirmado nestas publicaes (mas ver referncia) e, desde


lateral gene transferncias so bastante comuns
em bactrias, no claro se realmente presentes primers
amplificar PImx genes em cada cepa L. pneumophila (ver
Figura 1).
Bioinformatic tools

Dependendo das mltiplas tarefas, ferramentas disponveis no NCBI,


EBI ou noutro local, um nmero de servidores ou programas
podem ajudar a anlise:

GreenGenes. O greengenes aplicao web fornece


acesso a uma seqncia 16S rRNA gene alinhamento
para navegar, decapagem, probing, e download:
URL: http://greengenes.lbl.gov.
PubMLST. Este site acessvel ao pblico MLST
bases de dados e software: URL: http://pubmlst.org,
Legionella PMI gene Sequence Database. Esta base de dados
permite a comparao de um novo gene PMI DNA
seqncias com seqncias de referncia de todos os descritos
espcies de Legionella: URL:
http://www.hpa.org.uk/cfi/bioinformatics/ewgli/legionellamips.h
tm
leBIBI. Blast em bases de dados da SSU-rDNA, gyrB, recA,
soda, rpoB, tmRNA, tuf e groel2-hsp65 gene
seqncias e ferramentas para a identificao bacteriana:
http://umr5558-sud-str1.univ-lyon1.fr/lebibi/lebibi.cgi.
ICB. Identificao e classificao de bactrias
de dados usando gyrB: URL: http://seasquirt.mbio.-co.jp/icb/.
GPMS. Bactrias patognicas estirpe genotipificao essencialmente
para fins epidemiolgicos, com base em polimrficos
tandem repeat digitando: URL: http://minisatellites.u-psud.fr.
VNTR. Tipagem molecular de bactrias usando varivel
nmero par repete URL: http://vntr.csie.ntu.edu.tw.

OHM. Uma ferramenta que produz heatmaps" representa em


uma forma visual o Tm de primers, um conjunto de
sequncias (pode ser combinado com TreeDyn URL:
http://bioinfo.unice.fr/ohm.
A Blast server, to Blast 16S rRNA sequences on
cultured bacteria only: URL:
http://bioinfo.unice.fr/blast.
Um alto-servidor, para Altos-16S rRNA seqncias em
cultivadas bactrias apenas URL: http://bioinfo.unice.fr/blast.
DDBJ. Um servidor para Blast apenas em alto-16S rRNA gene
sequncias apenas (rpido): URL: http://blast.ddbj.nig.ac.jp/tope.html.

A lista de nomes com Prokaryotic cumpreme


nomenclatura (agora incluindo 16S rRNA adeso
nmeros): URL: http://www.bacterio.cict.fr/.
Norovrus Epidemiologia Molecular Database. O
norovrus banco de dados contm uma coleo de mais de 1000
sequncias de norovrus estirpes e epidemiolgicos associados
dados:URL:http://www.hpa.org.uk/cfi/bioinformatics/norwalk/noro
virus.htm.

Concluso
Se nenhuma das opes acima podem ser utilizados servidores (este
no um
lista exaustiva), seqncia recuperao, alinhamentos, Filogenias
baseadas,
e desenho de iniciadores pode ser muito demorado
e entediante para os cientistas que no pode escrever computador
programas.
Seqncia de recuperao utilizando palavras-chave muitas vezes
mais eficiente do que uma exploso. SRS (Advanced Search formulrio)
ou ainda melhor ACNUC ou ferramentas especficas devem ser
preferiu Entrez, porque elas so mais poderosas para
seqncia recuperao.
Combinao de palavras-chave para o gene ou
gene produtos com seu nome ou txon ID e um filtro
na seqncia comprimento (muito curto seqncias so inteis)
frequentemente muito eficientes. Uma vez que anotaes no so
padro,
construir uma lista de produtos gentica muitas vezes necessrio
(ver
materiais adicionais).
Se h muitas seqncias,
possvel agrupamento dessas seqncias em uma determinada semelhana
nvel (utilizando blastclust ou CD-hit [49]) e um alinhamento
representante seqncia por cluster.
Uma inspeco visual
alinhamentos de seqncias revela que no se alinham bem;
eles muitas vezes so o resultado de um erro de anotao ou tenham a
ser invertido-complementada.

As demais seqncias
pode ento ser acrescentado a este "bom" alinhamento (utilizando
Clustal
Perfil opo, por exemplo).
Para gene codifica uma protena
Transalign programa como pode ser uma boa escolha
Ao recuperar a partir de primers publicaes, documentos mais
antigos
so muitas vezes inteis porque primers foram desenhados utilizando
um
muito poucos nmeros de seqncias (primers podem ser analisados
usando o servidor da web j referido, para produzir dados
semelhante figura 1).
Finalmente, h uma grande diferena entre a amplificao
utilizando DNA extrado de uma cultura pura e DNA
extrados de uma amostra ambiental.
Primrio (P)
liga para o seu alvo de DNA (T), de acordo com a clssica
equao [P] [T] / [PT] = quilmetros.
A presena de um ou dois
diferenas entre o P seqncia ea T seqncia
maio influenciam fortemente o valor do quilmetro.
Com o DNA
extrados de uma cultura pura [T], pode ser suficientemente
to elevados que [PT], grande o suficiente para a PCR de sucesso.
No ambiente de DNA, e na presena de mismatch (
es), a cartilha pode vincular a muitos outros domnios (em
baixa afinidade, mas em muitos lugares), de modo que [PT] no
grande suficiente para permitir uma amplificao bem sucedida
Esta a razo pela qual,
para estudos ambientais, qualquer publicao deve primers
sempre ser cuidadosamente verificada em comparao com recm publicado seqncias.

Você também pode gostar