Relatório de Aulas Práticas de Bioinformática

UNIVERSIDADE FEDERAL DE SÃO JOÃO DEL REI
CAMPUS CENTRO-OESTE DONA LINDU

BACHARELADO EM BIOQUÍMICA
Disciplina: Bioinformática
Relatório de aulas práticas de Bioinformática
Aluno: Allan Kardec Moreira de Aguiar

Professor: Israel José Pereira Garcia;
Marcus Vinícius Gonçalves Antunes
Junho /2023
Divinópolis/MG
2
Introdução
A Proteus mirabilis é uma bactéria Gram-negativa em forma de bastonete que se destaca
por sua capacidade de produzir uréase, e pode infectar seres humanos, causando infecções do
trato urinário associadas a cateteres (CAUTIs), sendo geralmente polimicrobianas
(ARMBRUSTER,2017). Essa bactéria é capaz de sobreviver em uma ampla variedade de
ambientes, como solo, fonte de água e esgoto, mas é considerada principalmente um comensal
do trato gastrointestinal humano e animal (WENNER,1919; ARMBRUSTER,2012). As
descobertas científicas sobre as alterações morfológicas dessa bactéria são fundamentais para
compreender a sua patogenia (ARMBRUSTER, 2012).
A bioinformática é uma disciplina das Ciências Biologicas que lidar com o grande
volume de dados biológicos, sendo de caráter interdisciplinar que e se dedica ao
desenvolvimento de métodos e ferramentas, como programas de computador, para analisar
dados moleculares biológicos de forma computacional (in silico) (LUSCOMBE, 2001). As
proteínas hipotéticas (HPs) ou proteínas desconhecidas são proteínas que não foram ligadas a
genes e que ainda não foram caracterizadas (Goharrizi,2019).
De acordo com Moriya (2007), após a identificação de um gene, é crucial compreender
sua função potencial, que busca inicialmente essa possível função por meio da comparação de
similaridade entre as novas sequências (obtidas a partir do sequenciamento do organismo em
questão) e as sequências já catalogadas em bancos de dados. Quando duas sequências biológicas
compartilham uma mesma descendência, diz-se que aquelas sequências são sequências
homólogas, sejam sequências nucleotídicas (genes homólogos) ou sequências aminoacídicas
(proteínas homólogas) (KOONIN, 2005).
O objetivo do estudo foi utilizar ferramentas de Bioinformática para predição da
estrutura e função da proteína hipotética de Protheus mirabilis (cepa: CRPM10,nat-host: Homo
sapiens), Gene ID: 43110045 com pb: 243, visando identificar regiões que podem gerar
peptídeos com atividade antibacteriana e com possíveis aplicabilidade na produção de vacinas
ou terapias imunológicas .
3
Materiais e Métodos
Para a realização desse estudo foi escolhido no NCBI na opção genoma o organismo
Proteus mirabílis (cepa: CRPM10, nat-host: Homo sapiens) (Tabela-1), no qual foi selecionado
o Gene ID: 43110045com 243 pb que codifica uma proteína hipotética.
Proteus mirabilis (cepa: CRPM10, nat-host: Homo sapiens)

Mb):comprimento total médio GC% mediano: N° Gene Proteínas rRNA tRNA
4,00 38,9 3.752 3.557 22 83
Na primeira aula prática (aula-4), selecionamos a sequência de nucleotídeos da

proteína hipotética no formato FASTA e a salvamos em um arquivo no formato WordPad. Em
seguida, utilizamos o Basic Local Alignment Search Tool (BLAST) do NCBI disponível online
em : https://blast.ncbi.nlm.nih.gov/Blast.cgi, para verificar se essa sequência gênica estava
presente em outros organismos. Após a análise, selecionamos as sequências gênicas de cinco
organismos diferentes: E. coli, K. pneumoniae, Salmonella enterica, K. michiganensis e E.
kobei, para verificar a relação de similaridade com a sequência gênica da proteína hipotética
(PH) de Proteus mirabilis.
Todas as cinco sequências dos organismos foram baixadas e salvas no formato
FASTA, como sequências alinhadas (Aligned Sequences) (Figura-1). Em seguida, essas
sequências foram organizadas em um único documento no formato WordPad, utilizando o
nome abreviado dos organismos, sem espaço nem acentos, e com o sinal ´´>`` antes de cada
nome (Figura-2).
Não foi necessário realizar o complemento reverso nas cinco sequências selecionadas,
uma vez que todas elas apresentaram o mesmo início da cadeia de nucleotídeos que a sequência
alvo da (HP) FY167_RS19525 de P.mirabilis. O servidor online que realiza a conversão da
sequência em seu complemento reverso está disponível em:
https://www.bioinformatics.org/sms 2/rev_comp.html Para realizar a comparação entre a
sequência alvo, com as sequências de aminoácidos ou nucleotídeos dos outros organismos ao
longo de toda sua extensão, utilizamos o software Multalin disponível em :
http://multalin.toulouse.inra.fr/multalin/, para realizar o alinhamento global da sequência.
4
Figura-1. Dowload da Sequencia no formato Fasta (aligned sequences)
Figura-2. Sequências gênica dos cinco organismos selecionados em formato Fasta

para análises no Multalin, com sinal de > para serem lidos no programa.
5
Depois disso, as sequências foram submetidas ao software Multiple Sequence

Alignment CLUSTAL OMEGA disponível em: http://multalin.toulouse.inra.fr/multalin/, para gerar
uma árvore filogenética a partir da sequência alvo, comparando a relação evolutiva de
homologia com as sequências escolhidas na etapa BLAST.
Análise genômica e Estrutura proteica Aula-5
Para as análises genômica e estrutura proteica, tias como identificação de genes

adquiridos de resistência a antibióticos, identificação de genes de virulência adquiridos,
determinação de sítios de modificação de restrição, e identifica genes envolvidos na síntese de
micotoxinas.
Foi utilizado o formato FASTA para inserir a Sequência de aminoácidos aa

>WP_004219612.1 obtida no NCBI da proteína hipotética de P.mirabilis, que possui 80
aminoácidos lineares, no servidor REsFinder-4.1. Este servidor, disponível em: disponível em:
https://www.genomicepidemiology.org/services/ , para predição da identificação de genes
adquiridos de resistência a antibióticos, identificação de genes de virulência adquiridos,
determinação de sítios de modificação de restrição e identificação de genes envolvidos na
síntese de micotoxinas produzidas por fungos. A (tabela-2) mostra a sequência de aminoácidos
utilizada.
(Tabela-2). Sequência de aminoácidos da Proteína Hipotética FY167_RS19525 de

P.mirabilis Sequência de aminoácidos aa.
>WP_004219612.1 proteína hipotética [Bactérias P.mirabilis]
>MGGNKFATRMAWQGARALFYGIYKKSTSRKREGFGDSGTGILFCLWCVA
FHALPGIMEPAAEVTHSFPVCPAGTFSPVTA
Foi utilizado o servidor DTU Health SignalP - 6.0 disponível em:

https://services.healthtech.dtu.dk/service.php?SignalP, para previsão de peptídeo sinal e seus
locais de clivagem.
Foi feita a caracterização físico química da (HP) FY167_RS19525, através do
Programa: Protparam, disponível em: https://web.expasy.org/protparam/, para analisar os
6
seguintes parâmetros: Peso molecular, Meia-vida estimada, pI teórico, composição de

aminoácidos, número total de resíduos positivos e negativos, índice de instabilidade, índice
alifático, e média geral de hidropaticidade (GRAVY).
Também foi feito análise para verificar a temperatura de desnaturação da (HP)
FY167_RS19525, no servidor Tm Predicto disponível em: http://tm.life.nthu.edu.tw/. Após
isso, foi feita análises para predição se a (HP) FY167_RS19525, poderia sofrer modificações
pós-traducionais, fosforilação por meio do NetPhos 3.1, e glicosilação (O ouN) por meio do
servidor YinOYang 1.2 disponível em: http://www.cbs.dtu.dk/servi ces/YinOYang/, e
sulfatação.
Para predizer os padrões de fosforilação foi utilizado os seguintes servidores Programa:
NetPhos 3.1 disponível em: https://services.healthtech.dtu.dk/service.php, NetPhos-3.1
NetPhosBac - 1.0 (Bactérias) para predição de sítios de sulfatação – ExPASY disponível em:
https://web.expasy.org/sulfinator/ , e para identificação de sinais para âncora de GPI, por meio
do servidor NetGPI - 1.1 GPI Anchor predictions disponível em :
https://services.healthtech.dtu.dk/service.php?NetGPI , e Big-PI (The GPI Prediction Server
Version 3.0, disponível em : https://mendel.imp.ac.at/gpi/gpi_server.html.
Localização Celular-aula 6
Para as análises de predição da localização celular foi utilizado o servidor, BUSCA
disponível em: https://busca.biocomp.unibo.it/ que integra diferentes ferramentas para prever a
característica de proteínas relacionadas á localização, bem como ferramentas para discriminar
a localização subcelular de proteínas globulares e de membrana, o CELLO v.2.5 disponível
em: http://cello.life.nctu.edu.tw. Os resultados da análise de localização celular da proteína
hipotética, realizada pelo programa CELLO, fornecem informações sobre a previsão da
localização celular da proteína em diferentes compartimentos celulares, cada resultado é
acompanhado por um valor de confiabilidade que indica o grau de certeza da previsão.
Também foi utilizado o DeepTMHMM disponível em:
https://services.healthtech.dtu.dk/service.php?DeepLoc , que é usado para prever a topologia
de membrana transmembranares em relação a bicamada lipídica da membrana celular. Além
disso , foi utilizado o CCtop disponível em: http://cctop.ttk.hu/job/submit, uma ferramenta de
bioinformática usada para prever e analisar os locais de clivagem de proteínas, bem como o
programa Protter disponível em: http://cctop.ttk.hu/job/submit, um programa de código aberto
7
desenvolvido para a visualização de proteoformas e a integração interativa de recursos de

sequência anotados e preditos juntamente com evidências proteômicas experimentais.
Predição de estrutura e função da proteína hipotética-aula 7
Para realizar a predição de estrutura e função da proteína hipotética, foram utilizados os

seguintes programas e ferramentas:
1. Identificação de motivos de sequência:

 Programa: MOTIF Search
 Link: https://www.genome.jp/tools/motif/MOTIF.html.
 Descrição: O MOTIF Search é uma ferramenta online desenvolvida pelo Instituto de
pesquisa em Genômica do Japão, que permite a identificação e análise de motivos de
sequência em sequências de DNA ou proteínas.
2. Análise funcional e anotação da sequência:
 Programa: InterPro
 Link: https://www.genome.jp/tools/motif/MOTIF.html.
 Descrição: O InterPro é utilizado para a análise funcional e anotação da sequência da
proteína hipotética.
3. Predição da estrutura secundária:
 Softwares: PRABI e PROTEUS
 Links: https://npsa-prabi.ibcp.fr/cgi-
bin/npsa_automat.pl?page=/NPSA/npsa_predator.html, e
http://www.proteus2.ca/proteus2/index.jsp.
 Descrição: Os softwares PRABI e PROTEUS foram utilizados para realizar as análises
de estrutura secundária da proteína hipotética. O PRABI foi utilizado para prever a
estrutura secundária e identificar regiões de potencial estrutura de hélice, folha ou
regiões desordenadas.
4. Predição da estrutura tridimensional:
 Programa: SWISS-MODEL, AlphaFold
8
 Links: SWISS-MODEL: https://swissmodel.expasy.org/interactive ,

https://colab.research.google.com/github/sokrypton/ColabFold/blob/main/AlphaFold2.
ipynb .
 Descrição: O SWISS-MODEL, um programa de modelagem de proteínas, foi utilizado
para inferir a estrutura tridimensional da proteína hipotética com base na similaridade
de sequências com proteínas de estrutura conhecida. Além disso, foi realizada a análise
com o AlphaFold para a predição da estrutura tridimensional.
5. Predição da função da proteína:
 Programas: PSIPRED e DeepGOWeb
 Links: PSIPRED: http://bioinf.cs.ucl.ac.uk/psipred/ , DeepGOWeb:
http://bioinf.cs.ucl.ac.uk/psipred/
 Descrição: O PSIPRED foi utilizado para a predição da função da proteína hipotética,
enquanto o DeepGOWeb foi utilizado para obter informações funcionais adicionais.
Predição de ações bioquímicas aula-8.
Para realizar as análises de predição de ações bioquímicas, potencial antigênico,

potencial de alergenicidade e previsão de epítopos de células B, predição de peptídeo
anticancerígenos, predição de peptídeo hemolítico, predição de propriedades antioxidantes de
peptídeos, predição de epítolos anti-inflamatórios, e predição de virulência, foram utilizados os
seguintes programas e ferramentas:
1. Predição de potencial antigênico:
 Programa: VaxiJen 2.0
 Link: http://www.ddg-pharmfac.net/vaxijen/VaxiJen/VaxiJen.html
 O Vaxijen V2.0 é uma ferramenta computacional reconhecida por sua capacidade de
realizar predições relacionadas ao potencial antigênico de proteínas. A sequência de
aminoácidos da proteína hipotética FY167_RS19525 de P.mirabilis foi inserida no
formato FASTA, no programa para estimar a probabilidade de reconhecimento pelo
sistema imunológico.
2. Predição de epítopos de células B:
 Programa: Bepipred Linear Epitope Prediction 2.0
 Link: http://tools.iedb.org/bcell/
9
 Descrição: Utilizamos o Bepipred Linear Epitope Prediction 2.0 para realizar a

análise de predição de epitópos de células B da protepina hipotética FY167_RS19525
de P.mirabilis. Ferramentas de previsão de epítopos de células B que destinam-se a
prever regiões de proteínas que provavelmente serão reconhecidas como epítopos no
contexto de uma resposta de células B.
3. Predição de peptídeos anticancerígenos:
 Programa: AntCP 2.0
 Link: https://webs.iiitd.edu.in/raghava/anticp2/
 Descrição: O AntCP 2.0 é um programa desenvolvido para prever e projetar peptídeos
anticancerígenos com alta precisão, utiliza o maior conjunto de dados possível de
peptídeos anticancerígenos e não anticancerígenos. O conjunto de dados principal
consiste em 861 peptídeos anticancerígenos validados experimentalmente e 861
peptídeos não anticancerígenos ou antimicrobianos validados.
4. Predição de peptídeos hemolíticos:
 Programa: HemoPI (Previsão e triagem de peptídeos hemolíticos)
 Link: https://webs.iiitd.edu.in/raghava/hemopi/index.php
 Descrição: Este servidor permite ao usuário prever o potencial hemolítico,
hemotóxico ou de lise de hemácias de um peptídeo.
5. Predição de propriedades antioxidantes de peptídeos:
 Link: https://services.healthtech.dtu.dk/service.php?AnOxPeP red-1.0
 Descrição: O AnOxPePred - 1.0 é utilizado para prever as propriedades antioxidantes,
como a captura de radicais livres e quelação de íons, de peptídeos.
6. Predição de epítopos anti-inflamatórios:
 Programa: Antilnflam
 Link: http://metagenomics.iiserb.ac.in/antiinflam/
 Descrição: O AntiInflam é utilizado para a predição de epítopos anti-inflamatórios
7. Predição de virulência:
 Programa: VirulentPred
 Link: http://bioinfo.icgeb.res.in/virulent/
 Descrição: O VirulentPred é um método de previsão de proteína virulenta bacteriana
baseado na Support Vector Machine (SVM) de cascata bicamada.
8. Previsão de peptídeos antibacterianos.
 Programa: AntiBP
 Link: https://webs.iiitd.edu.in/raghava/antibp/submit.html
10
 Descrição: AntiBP Server A server for the prediction of the antibacterial peptides.
AntiBP Server Um servidor para a previsão dos peptídeos antibacterianos
9. Predição de peptídeo antifúngico
 Programa: Antifp
 Link: https://webs.iiitd.edu.in/raghava/antifp/scan.php
 Descrição: Com esta ferramenta o usuário pode identificar regiões em uma proteína,
que estão contribuindo para a concepção do peptídeo antifúngico, que pode ser
posteriormente removido ou alterado. Ao contrário, aqui os usuários também podem
pesquisar uma sequência de proteínas para descobrir novos peptídeos antifúngicos.
Resultados e Discussão
Os resultados da análise de similaridade usando o BLAST, obtidos da sequência da

proteína hipotética (HP) FY167_RS19525, revelaram a presença de várias sequências genéticas
semelhantes em outros organismos, com identidade de 99,59% (Figura-1). Dentre esses
organismos, foram identificadas bactérias como Citrobacter freundii strain,Klebsiella
pneumoniae, Escherichia coli, Enterobacter homoaechei, entre outros. Algoritmos que fazem
comparação de sequências conseguem mensurar o grau de similaridade entre sequências ou até
mesmo predizer se aquelas tais sequências são ou não são homólogas (Maia,2019).
Figura-1. Resultados das análises no BLAST para encontrar regiões de similaridade entre
sequências biológicas.
11
O alinhamento das cinco sequências selecionadas na etapa BLAST para análises de

similaridade, com a sequência da proteína hipotética (HP) FY167_RS19525 de Proteus
mirabilis, revelou resultados que podem contribuir para a compreensão da relação entre esses
organismos e a possível função da (HP) de estudo.
Ao realizar o alinhamento utilizando o programa MULTALIN, observamos que todas as
sequências dos organismos selecionados apresentam uma alta similaridade com a sequência da
(HP) de P.mirabilis. quando se comparam sequências proteicas próximas na escala evolutiva,
pode-se dizer que duas proteínas têm a mesma função quando o grau de similaridade entre elas
for acima de 50%, 23 que representa a porcentagem de resíduos de aminoácidos conservados
entre as duas sequências quando comparadas (PEARSON, 2015)
Essas similaridades sugere uma possível relação evolutiva ou funcional entre as
sequências dos organismos analisados com a sequência da (HP) FY167_RS19525 em estudo.
Os resultados obtidos no Multalin mostraram alto consenso de similaridade entre as sequências
de nucleotídeos analisadas (Figura-2). Além disso, o alinhamento revelou regiões divergentes,
menos conservadas, onde ocorrem variações nas sequências dos organismos.
Figura-2. Resultados de análises no Multalin Alto consenso Consenso neutro Baixo consenso
.
.
12
A arvore filogenética criada a partir da sequência da (HP), FY167_RS19525 de

P.mirabilis, comparada com as sequências escolhidas na etapa BLAST permitiu avaliar a relação
evolutiva de homologia entre as sequências (Figura-3). A raiz da árvore filogenética representa
a linhagem ancestral e as pontas das ramificações representa os descendentes desse ancestral
(´´Sala Darwin", 2018).
Conforme você avança da raiz para as pontas, você está avançando no tempo, e quando
uma linhagem se divide ocorrendo um evento de especiação, que acontece quando uma única
linhagem ancestral dá origem a duas mais linhagens filhas (UCMP,2006). Assim, o nó
representa um evento de especiação, e a arvore filogenética traça padrões de ancestralidade
compartilhados entre linhagens, onde cada linhagem tem uma parte de sua história que é única
e outra parte que é compartilhada com outras linhagens(UCMP,2006).
Uma informação importante para os pesquisadores é saber quais grupos de seres vivos
compartilham um único ancestral comum e exclusivo. Essa informação possibilita definirmos
um clado válido para ser utilizado na abordagem filogenética. Clado: é um agrupamento que
inclui um ancestral comum e exclusivo e todos os descendentes (viventes e extintos) desse
ancestral (´´Sala Darwin", 2018). Assim, P.mirabilis,K.apneumoniae, e E.coli, partilham um
ancestral comum exclusivo.
Figura-3. Resultados de comparação das sequências de nucleotídeos da P.mirabilis

FY167_RS19525 com as sequências d K.apneumoniae,E.coli,Salmonellaenterica,
K.michiganensis,E.kobei, com o programa Clustal Omega. Nó: evento de especiação ,
Homologias entre as sequências ancestral comum entre
P.mirabilis e K.apneumoniar
P.mirabilis,K.apneumoni
ae,E.coli formam um Ancestral único de
clado P.mirabilis
13
Discussão : Aula-5
Com relação a análise no ResFinder-4.1 para identificação de genes adquiridos de
resistência a antibióticos, os resultados indicam que possivelmente o gene-alvo escolhido não
é um gene de resistência a antibiótico ( Tabela-3).
Tabela-3. Server-Results ResFinder-4.1 Identificação de genes adquiridos de resistência a

antibióticos.
Fenótipo previsto por
Antimicrobiano Classe
WGS
vancomycin glycopeptide Não resistente
mupirocin pseudomonic acid Não resistente
tobramycin aminoglycoside Não resistente
virginiamycin m streptogramin a Não resistente
isepamicin aminoglycoside Não resistente
virginiamycin s streptogramin b Não resistente
hydrogen peroxide peroxide Não resistente
hydrogen peroxide aminoglycoside Não resistente
ampicillin beta-lactam Não resistente
astromicin aminoglycoside Não resistente
lividomycin aminoglycoside Não resistente
sulfamethoxazole folate pathway antagonist Não resistente
temocillin beta-lactam Não resistente
trimethoprim folate pathway antagonist Não resistente
oleandomycin macrolide Não resistente
florfenicol amphenicol Não resistente
fluoroquinolone quinolone Não resistente
quinupristin streptogramin b Não resistente
ceftriaxone beta-lactam Não resistente
cephalothin beta-lactam Não resistente
lincomycin lincosamide Não resistente
spectinomycin aminocyclitol Não resistente
quinupristin+dalfopristin streptogramin a Não resistente
paromomycin aminoglycoside Não resistente
clindamycin lincosamide Não resistente
amoxicillin+clavulanic acid beta-lactam Não resistente
gentamicin aminoglycoside Não resistente
tiamulin pleuromutilin Não resistente
ceftiofur under_development Não resistente
erythromycin macrolide Não resistente
kanamycin aminoglycoside Não resistente
teicoplanin glycopeptide Não resistente
amikacin aminoglycoside Não resistente
14
tigecycline tetracycline Não resistente

ticarcillin+clavulanic acid beta-lactam Não resistente
cephalotin beta-lactam Não resistente
cefoxitin beta-lactam Não resistente
hygromycin aminoglycoside Não resistente
penicillin beta-lactam Não resistente
neomycin aminoglycoside Não resistente
ribostamycin aminoglycoside Não resistente
dalfopristin streptogramin a Não resistente
piperacillin beta-lactam Não resistente
telithromycin macrolide Não resistente
unknown quinolone quinolone Não resistente
amoxicillin beta-lactam Não resistente
meropenem beta-lactam Não resistente
ethidium bromide quaternary ammonium compound Não resistente
sisomicin aminoglycoside Não resistente
unknown aminoglycoside aminoglycoside Não resistente
cefepime beta-lactam Não resistente
butiromycin aminoglycoside Não resistente
doxycycline tetracycline Não resistente
piperacillin+tazobactam beta-lactam Não resistente
fusidic acid steroid antibacterial Não resistente
ciprofloxacin quinolone Não resistente
colistin polymyxin Não resistente
temperature heat Não resistente
imipenem beta-lactam Não resistente
arbekacin aminoglycoside Não resistente
nalidixic acid quinolone Não resistente
metronidazole nitroimidazole Não resistente
cefixime beta-lactam Não resistente
bleomycin aminoglycoside Não resistente
pristinamycin ia streptogramin b Não resistente
formaldehyde aldehyde Não resistente
tylosin macrolide Não resistente
benzylkonium chloride quaternary ammonium compound Não resistente
cefotaxime+clavulanic acid beta-lactam Não resistente
rifampicin rifamycin Não resistente
fosfomycin fosfomycin Não resistente
ceftazidime beta-lactam Não resistente
fortimicin aminoglycoside Não resistente
carbomycin macrolide Não resistente
ticarcillin beta-lactam Não resistente
azithromycin macrolide Não resistente
15
chlorhexidine quaternary ammonium compound Não resistente

kasugamycin aminoglycoside Não resistente
chloramphenicol amphenicol Não resistente
cetylpyridinium chloride quaternary ammonium compound Não resistente
ampicillin+clavulanic acid beta-lactam Não resistente
cefotaxime beta-lactam Não resistente
piperacillin+clavulanic acid beta-lactam Não resistente
ceftazidime+avibactam beta-lactam Não resistente
apramycin aminoglycoside Não resistente
spiramycin macrolide Não resistente
dibekacin aminoglycoside Não resistente
ertapenem beta-lactam Não resistente
tetracycline tetracycline Não resistente
linezolid oxazolidinone Não resistente
netilmicin aminoglycoside Não resistente
minocycline tetracycline Não resistente
aztreonam beta-lactam Não resistente
unknown beta-lactam beta-lactam Não resistente
pristinamycin iia streptogramin a Não resistente
streptomycin aminoglycoside Não resistente
Para análise de predição de genes de virulência adquiridos, os resultados indicam que

não foram encontrados identificação de gene de virulência adquiridos.
Figura-4. Análises para predição de genes de resistência

16
Os resultados obtidos pelo programa Restriction-ModificationFinder 1.1, revelaram que

a sequência da (HP), FY167_RS19525 de P.mirabilis não apresentou sítios de modificação de
restrição (Figura-5). Essa observação indica que essa sequência específica não possui locais
onde a enzima de restrição pode se ligar e cortar o DNA. Por outro lado, a análise no ToxFinder-
1 não identificou a presença de genes conhecidos relacionados á síntese de micotoxinas, na
sequência da (HP), FY167_RS19525 de P.mirabilis. Esses resultados sugere a ausência de genes
de síntese de micotoxinas, isso pode indicar que a sequência de estudo não produz essas
substâncias tóxicas (Figura-6). Os resultados da análise genômica estão listados na (Tabela-4).
Figura-5. Resultados de análises no Restriction-ModificationFinder 1.1.
Figura-6. Análise no ToxFinder-1.0

17
Tabela-4. Resultados da análise genômica e Estrutura proteica Aula-5
Análise genômica Resultado

Identificação de genes
adquiridos de resistência a Não
antibióticos
Identificação de genes de
Não
virulência adquiridos
Determinação de sítios de modificação de restrição Não

Identifica genes envolvidos na síntese de
Não
micotoxinas
Não
Além disso foi feito análise para verificar se na sequência da (HP), FY167_RS19525, o
gene é patógeno humano. O organismo de entrada foi previsto como patógeno não humano
como ilustrado na (Figura-7).
Figura-7. Previsão da patogenicidade de uma bactéria para hospedeiros humanos.

18
O programa SignalP 6.0 foi utilizado para previsão de peptídeo sinal. Nossos resultados
revelam que a sequência alvo não possui peptídeo sinal como indicado na (Figura-8).
Sequência de aminoácido sem peptídeo sinal sugere que a proteína não é (exportada).
Figura-8. SignalP-6.0 - Results
Com base nos dados, a proteína hipotética parece não possuir um peptídeo sinal,
sugerindo que sua função pode estar relacionada a processos intracelulares e não á exportação
para fora da célula. Signal Peptide (Sec/SPI): A probabilidade de a sequência possuir um
peptídeo sinal no sistema de secreção tipo II (Sec/SPI) é indicada como 0.0002. Isso sugere que
a probabilidade dessa proteína hipotética possuir um peptídeo sinal desse tipo é muito baixa.
Para a caracterização físico química da Proteína hipotética (HP), FY167_RS19525
realizada com o programa Protparam , o N-terminal da sequência considerada é M (Met), e
meia-vida estimada foi de: 30 horas (reticulócitos de mamíferos, in vitro). >20 horas (levedura,
in vivo). >10 horas (Escherichia coli, in vivo), com coeficientes de extinção em unidades de
M-1 cm-1, a 280 nm medidos em água. A (Tabela -5 ),mostra os resultados obtidos.
Tabela-5. Resultados da análise para caracterização físico química com o programa Protparam.
19
Formula: C391H590N104O104S6 Numero de átomos: 1195
Parâmetros Valores
Número de aminoácidos 80
Peso molecular 8603.98

pI teórico 9.30
N° Total de resíduo carregados negativamente (Asp +
4
Glu)
N° Total de resíduo carregados positivamente (Arg +
8
Lys)
Índice de instabilidade 50.34
Índice alifático 61.13
Média geral de hidropaticidade (GRAVY) 0.134
Para predição da temperatura de desnaturação da (PH) foi utilizado o Tm Predicto
Figura-9.
A proteína pode sofre modificações pós-traducionais?
Os resultados da análise para predição de sítios de O-glicosilação, com o programa

YinOYang 1.2, revelaram 11 sítios de O-glicosilação na senquência da (HP) FY167_RS19525,
20
como indicado na (Figura-10). Entretanto , a sequência alvo não revelou nenhum local previsto
predição de N-glicosilação (Figura-11), e indicando 11 pontos de padrão de fosforilação :26
S (65%), 28 S (57%), 37 S (56%) e 66 S (69%) , (Figura-12).
Figura-10. Resultados da análise para predição de sítios de O-glicosilação, com o programa

YinOYang 1.2.
21
Figura-11. Resultados de análises para previsão de sítio de N-glicosilação
Figura-12. Resultados de análises de pontos de fosforilação com o programa NetPhos-3.1

NetPhosBac - 1.0 : 26 S (65%), 28 S (57%), 37 S (56%) e 66 S (69%)
Tabela-6. Servidor de previsão de GPI

22
Não ancorado em
previsões
Sequence GPI
Prediction: Not GPI-Anchored Likelihood 0.989
Figura-13. Resultados para detecção de sinais para âncora de GPI servidor NetGPI - 1.1
Figura-14. Resultados do Big-PI Prediction.

23
Figura-15. Predição de sítios de sulfatação – ExPASY.
Tabela-7
Parâmetros Valores
Tm 55-65 °C
O-Glicosilação Sim
N-Glicosilação Não
Fosforilação Sim (26 S, 28 S, 37 S e 66T)

Sulfatação Não
Sinais de âncora para GPI Não
Discussão-aula-6. Localização celular
Esses resultados indicam a probabilidade estimada da proteína hipotética estar

localizada em diferentes compartimentos celulares. Os resultados de localização celular
24
realizadas com o programa BUSCA indicaram uma possível localização no citoplasma (Figura-
17). A análise utilizando o programa BUSCA proporcionou insights valiosos sobre a
localização celular da proteína hipotética em estudo. O score de 0.7 indica uma confiança
moderada na previsão de localização celular. É importante mencionar que scores mais altos
geralmente indicam previsões mais precisas e confiáveis. Portanto, um score de 0.7 sugere que
a proteína pode estar localizada no citoplasma, mais é necessário considerar outras informações
e realizar experimentos adicionais para confirmar essa localização.
Figura-16. Resultados de análises de localização celular realizadas com o programa BUSCA.
G)-term: Gene Ontology (GO) term associado á localização subcelular prevista para a proteína. Score:
pontuação de confiança atribuída pelo algoritmo utilizado pelo BuscaBiocomp para previsão da localização
subcelular da proteína. Alternative Localization: possíveis localizações subcelulares alternativas; FEatures:
características estruturais ou funcionais da proteína que foram utilizadas pelo algoritmo para a previsão da
localização subcelular.
O programa CELLO forneceu previsões para a localização celular da proteína hipotética

com base em diferentes aspectos de sua composição e sequências vizinhas (Figura-17). A
análise incluiu composição de aminoácidos, composição de N-peptídeo, composição de
sequências particionada, composição físico-química e composição de sequência vizinha. A
análise de composição de aminoácidos previu uma localização periplasmática para a sequência
alvo (PH), com um índice de confiabilidade de 0.379. Isso sugere que a proteína pode ser
25
direcionada para o espaço periplasmático, o que está de acordo com seu possível papel em
processos extracelulares.
Em contraste, a análise da composição de N-peptídeos indicou uma localização
citoplasmática, com um índice de confiabilidade um pouco maior com 0.397. Isso sugere que a
protína também pode ter um papel funcional dentro do compartimento citoplasmático da célula.
A análise da composição de sequência particionada suportou uma localização citoplasmática,
com um índice de confiabilidade de 0.362. A análise de composição físico-química resultou
no índice de confiabilidade mais alto, de 0.701, indicando uma forte probabilidade de
localização citoplasmática. Essa análise leva em consideração as propriedades físico-química
da proteína, que podem fornecer informações valiosas sobre sua localização subcelular.
Figura-17. Resultados de análises de localização celular da proteína hipotética de Proteus
mirabilis com o software CELLO.
Amino Acid Comp Localization (Localização) : Periplasmic (Periplasmático);

Realiability (Confiabilidade):0.379; N-peptide Composition (Composição de N-peptídeos):
localização Cytoplasmic (Citoplasmático): Confiabilidade 0.397; Partitioned Sequence
Composition (Composição de sequência particionada) :localização citoplasmática
Confiabilidade 0.362; Physico-chemical Composition (Composição Físico-Química):
Localização : citoplasmática , confiabilidade 0.701; Neighboring Sequence Composition
(Composição de sequência visinha): localização : Periplasmática , confiabilidade : 0.304.
Cytoplasmic (Citoplasmático): 1.788; Periplasmic (Periplasmático): 1.406; Extracellular
(Extracelular): 0.849; InnerMEmbrane (Membrana interna): 0.763; e OuterMembrane
(Membrana externa): 0.194 .
26
Os resultados obtidos por meio do programa BUSCA e do software CELLO forneceram

evidências consistentes de que a proteína hipotética pode estar localizada no citoplasma. A
coincidência entre esses dias abordagens distintas reforça a confiabilidade dessas previsões.
A análise realizada no programa DeepLoc 2.0, indicou que a proteína hipotética tem
uma probabilidade de 0.5355 de ser localizada no citoplasma. Essa predição está em
consonância com os resultados obtidos anteriormente pelo programa BUSCA e pelo software
CELLO, que também indicaram o citoplasma como a localização provável da proteína.
A indicação de que a proteína hipotética está localizada no citoplasma, pode implicar
seu papel na regulação de vias metabólicas e interações com outras proteínas ou componentes
celulares presente no citoplasma. É importante notar que o programa forneceu probabilidade
para outras localizações celulares, como núcleo, membrana celular , mitocôndrias, plastídio,
retículo endoplasmático, lisossomo/vacúolo, complexo de Golgi e peroxissomo (Figura-18).
Essas probabilidades indicam a possibilidade de a proteína hipotética estar presente em outras
localizações celulares além do citoplasma. No entanto , a maior probabilidade de localização
no citoplasma sugere que essa é a localização principal ou predominante.
Figura-18. Resultados de análise de predição da localização celular da Proteína hipotética

de Proteus mirabilis com o programa Deeploc 2.0 .
Os resultados obtidos no programa indicaram que a proteína hipotética tem uma maior
probabilidade de estar localizada no citoplasma celular (Tabela-7). A indicação de localização
no citoplasma sugere que a proteína pode estar envolvida em atividades metabólicas e funções
27
Tabela-8.Localização subcelular da proteína hipotética de Proteus mirabilis
Programa Probabilidade Resultados obtidos
BUSCA 70.0 % Citoplasma
CELLO 70,10% Citoplasma
Deeploc 2.0 53,55 % e 49,12% Citoplasma/Mitocôndria
DeePTMHMM-Prediction
DeepTMHMM é usado para prever a topologia de membrana de proteínas, o que auxilia

na compreensão de sua função e na investigação de sua participação em processos biológicos
específicos relacionados à membrana celular. Ele é capaz de identificar os segmentos
transmembranares, bem como outras características relevantes, como regiões solúveis ou
domínios citoplasmáticos ou extracelulares.
A análise realizada pelo DeepTMHMM na sequência de aminoácidos da proteína
hipotética revelou a ausência de regiões transmembranares (Figura-19). Isso sugere que a
proteína é predominantemente solúvel e não atravessa a membrana celular. A ausência de
regiões transmembrana indica que a proteína não está envolvida diretamente nas funções
relacionadas á membrana. Isso indica que a proteína é predominantemente solúvel, sem
segmentos que atravessam a membrana celular. A previsão de que a proteína hipotética é
solúvel e localizada na região externa da célula (outside) sugere que ela pode desempenhar um
papel extracelular ou estar associada á matriz extracelular.
Figura-19. Análise realizada pelo DeepTMHMM.

28
Com base na análise dos dados fornecidos pela CCTop, podemos observar os seguintes:
os resultados mostram os locais de clivagem previstos na sequência de aminoácidos da proteína
hipotética. Esses locais são onde a proteína é suscetível a ser quebrada por proteases. A
confiabilidade da previsão nessa análise foi de 68%. (Figura-20). Isso indica que existe uma
certa margem de incerteza associada aos resultados. Quanto maior for o valor de confiabilidade,
mais confiáveis serão as previsões.
Figura-20.
A topologia prevista indica a distribuição das regiões da proteína na membrana. Os

dados sugerem que a proteína possui um total de 1 região transmembrana (TM). A
confiabilidade da previsão é de 68,336%. A topologia é a seguinte: Região de 1 a 33: Região
Interna (I); Região de 34 a 50: Região Transmembranar (M); Região de 51 a 80: Região externa
(O). A (tabela-8) mostra os resultados obtidos das análises de localização celular.
Através da visualização interativa e integração de dados, o Protter ajudou a identificar

padrões e correlações entre as características da estrutura da proteína. Os resultados são
29
mostrados na (Figura-21) (a) temos uma representação da estrutura da proteína no modelo do

Protter fora da membrana , em (b) temos uma representação da (HP) na região extracelular, e
em (c) representa a estrutura vista no modelo padrão do Protter (automático).
Figura-21. Resultados de análises da estrutura da proteína com o Protter

(a) (b) (c)
Tabela-8. Resultados das análises para predição da localização celular.
Parâmetro Observação
Localização celular Citosol
Topologia Solúvel
Discussão: Predição de estrutura e função da proteína hipotética-aula 7

30
Objetivos da aula, foi investigar, Quais estruturas e função da minha proteína? Quais
domínios estão presentes na minha sequência? As análises com a ferramenta MOTIF Search,
para identificar e analisar a presença de motivos de sequência na (PH) , os resultados não
revelaram a presença de motivos significativos na proteína hipotética (Figura-23).
Figura-7. Resultados de análise com o MOTIF Search para Proteus mirabilis proteína
hipotética Gene ID: 43110045.
Figura-22.
Para as análises de predição de qual família de proteínas pertence a (HP) de estudo, não
foram encontrados nenhuma predição da sequencia alvo.
Figura-23. Resultados da análise com o
A análise realizada pelo programa Predator para a sequência genética

em questão revelou informações sobre a composição estrutural da proteína
hipotética. De acordo com os resultados, a maior proporção de estrutura
secundária prevista é a região de "Random coil" (44 resíduos ou 55% da
31
sequência). Essa designação indica que essas regiões não apresentam uma
estrutura secundária definida, ou seja, não são hélices, folhas ou outras
estruturas. Por outro lado, o programa Predator previu que 36 resíduos (45%
da sequência) estão em uma conformação de "Alpha helix" (Hh).
Os resultados indicam que a proteína hipotética possui uma proporção
significativa de regiões com conformações estruturais indefinidas (Random
coil), enquanto uma porção menor da sequência é prevista como uma hélice
alfa (Alpha helix). Essas informações podem fornecer pistas iniciais sobre as
características estruturais da proteína, mas investigações adicionais são
necessárias para entender sua função e importância biológica de maneira
mais abrangente.
Figura-24.
Os resultados adicionais obtidos a partir das análises realizadas pelos programas PRABI
e PROTEUS para a proteína hipotética confirmam as informações previamente discutidas.
32
O programa PROTEUS forneceu uma análise mais completa dos dados. De acordo com
os resultados, a sequência da proteína hipotética, não foi identificada nenhuma região de hélice
transmembranar ou sinal peptídico na sequência. Em relação ás previsões de estrutura
secundária, o PROTEUS indica que 38% da sequência é prevista como hélice 930 resíduos),
enquanto nenhum resíduo é previsto como folha beta (Beta sheet). A maior porção da sequência
(63%, ou 50 resíduos) é prevista como estrutura em espiral (Coil), que corresponde a regiões
sem estrutura secundária definida. Além disso, os resultados revelam que nenhuma porção da
sequência é prevista como conteúdo de sinal peptídico ou conteúdo de membrana.
Figura-25
Os resultados para predição da estrutura terciária realizado com o SWISS-MODEL

estão representados da (Figura-26), e para o AlfaFold 2, os resultados estão representados na
(Figura-27).
Figura-26. Estrutura terciária obtidas com o SWISS-MODEL, a partir da sequência de

aminoácidos da proteína (HP) alvo.
33
Figura-27. AlphaFold-Protheus mirabilis estrutura tridimensional da proteína (HP) FY167_RS19525
QUAL A FUNÇÃO DA MINHA SEQUÊNCIA?

34
Figura-28. Resultados UCL Department of Computer Science: Bioinformatics Group
Infelizmente, não foram encontrados resultados satisfatórios para um conjunto de

sequências de proteínas semelhantes com anotações experimentais.
Figura-39.
Predição de ações bioquímicas aula-8.

35
Os resultados obtidos das análises de predição de ações bioquímicas conduzidas durante

a aula 8 são apresentados na (Tabela-9). É importante ressaltar que a análise de virulência por
meio do programa VirulenPred, não pôde ser realizada devido a problemas técnicos no servidor,
o que resultou em múltiplas tentativas sem a obtenção de resultados.
Tabela-9. Resultados de análises de predição imunológica, potencial antigênico , potencial de

alergicidade, previsão de epítopos de células b, predição de peptídeo anticâncer, previsão e
triagem virtual de peptídeos hemolíticos, peptídeo antioxidante, predição de epítopos anti-
inflamatório, predição de Virulência, previsão de peptídeos antibacterianos e predição de peptídeo
antifúngico.
Ações Bioquímicas
Ações Potencial
Antigênica Sim
Alergenicidade Não
Epítopos de células B Sim
Anticancer Sim
Hemolítica Baixa
Antioxidante Sim
Anti-inflamatória Sim
Virulência ?
Antibacteriano Sim
Antifúngico Não
Para avaliar a capacidade de uma proteína em gerar uma resposta imune e sua potencial
utilização como candidata a vacina, foi empregado o programa VaxiJen V2, para realizar a
predição. Os resultados obtidos revelaram um valor de potencial antigênico de 0,6390 (Figura-
30). Essa pontuação indica uma probabilidade de que a proteína seja reconhecida pelo sistema
imunológico e desencadeie uma resposta imune. A capacidade de uma proteína em gerar uma
resposta imune é um fator determinante na seleção de candidatas a vacina.
Figura-30. Resultados para avaliar a capacidade em gerar resposta imune com o

programa VaxiJen V2.0.
36
Os resultados para predição de alergicidade feitas no programa AlgPred 2.0 ,revelaram

que a (HP) de P.mirabilis não tem Potencial alergênico. O AlgPred 2.0 é um servidor web
desenvolvido como uma versão atualizada do AlgPred original criado em 2006, e tem como
objetivo realizar previsões de proteínas alergênicas e identificar regiões alergênicas dentro de
uma proteína (SHARMA, 2020).
Figura-31. Resultados de predição de alergicidade feitas no programa AlgPred 2.0.
Para as análises de predição de epitópos de células B, com o Epitope Prediction and

Analysis Tools, para identificar possíveis regiões que são reconhecidas pelas células B do
sistema imunológico. Os resultados obtidos foram analisados considerando a pontuação de
predição de epitópos de células B, foi identificado várias regiões da sequência de aminoácidos
da (HP) FY167_RS19525 foram preditas como possíveis epitópos de células B. Esses resultados
sugerem que a (HP) FY167_RS19525 possui regiões imunogênicas que podem desencadear uma
resposta imune mediado por células B.
Os dados obtidos com o programa AntCP 2.0 para predição de peptídeo Anticâncer,
revelaram que de 50 peptídeos da sequência alvo (HP) FY167_RS19525, 36 sequências de
peptídeos apresentaram resultados positivos para atividade anticâncer (Figura-33), com
destaque para a sequência FHALPGIMEP que apresentou score de 0.84 .
Figura-32.Resultados de predição de epitópos de células B

37
Figura-33. Resultados de análise para peptídeo anticâncer com o AntiCO 2.0.

38
As análises para prever o potencial hemolítico da sequência alvo utilizando o servidor

HemoPI, mostrou um baixo valor de score para potencial hemolítico. A sequência peptídica
que teve maior score na análise para identificação de peptídeo anticâncer , foi submetida a
previsão e triagem virtual de peptídeo hemolíticos, através do servidor HemoPI.
Os resultados, mostrou um score de 0,49, indicando uma provável potencial hemolítico
para a sequência da (HP) FY167_RS19525. A pontuação PROB é a pontuação SVM normalizada
e varia entre 0 e 1, ou seja, 1 muito provavelmente hemolítico, 0 muito improvável que seja
hemolítico.
Figura-34.
Os dados de predição de propriedades antioxidantes de peptídeos, realizadas com o

auxílio do programa AnOxPePred , no qual prevê as propriedades antioxidantes (eliminação de
radicais livres e quelação de íons) de peptídeos usando rede neural convolucional, indicaram
39
um score de 0,65 para a sequência AWQGARALFYGIYKKSTSRK, 0.64,

WQGARALFYGIYKKSTSRK, e 0.6 WQGARALFYGIYKKSTSR , respectivamente.
Figura-35. Resultados de predição de Peptídeo antioxidante com o AnOxPePred - 1.0.
De acordo com as análises realizadas com o programa AntiInflam , os resultados de

predição de epítopos anti-inflamatório, indicam que o a proteína (HP) gene FY167_RS19525
possui uma fidelidade média (Figura-36), ou seja, abaixo do 0,468 até maior ou igual a 0,388.
Figura-36. Predição de epítopos anti-inflamatório
Verificar se a proteína aumenta a virulência (Observação: durante a aula o servidor

não funcionou, e posteriormente após várias tentativas de acesso , também não obtive consegui
40
acessar). Diante do exposto não foi possível fazer essa análise com o servidor :
http://bioinfo.icgeb.res.in/virulent/.
Após realizar a análise da FY167_RS19525 utilizando o AntiBP para prever peptídeos

antibacterianos, foi possível identificar os primeiros 23 peptídeos com atividade antibacteriana.
Desses peptídeos, três foram destacados com suas respectivas pontuações: Peptídeo 1: 1,105;
Peptídeo 2: 1,074; Peptídeo 3: 1,05.
Figura-37.Resultados de análises para predição de peptídeos antibacterianos utilizando

o AntiBP.
De acordo com os resultados obtidos por meio das análises realizadas com o Antifp,
constatou-se que a proteína hipotética FY167_RS19525 não apresentou peptídeo antifúngico
(conforme ilustra na figura-38).
41
Figura-38. Resultados obtidos com o programa Antifp.
Conclusão
Em suma, as análises de Bioinformática aplicadas ao estudo da proteína hipotética

FY166-RS19525 de P.mirabilis proporcionaram informações valiosas sobre sua estrutura,
localização, características físico-químicas e possíveis funções. Os resultados indicaram que
essa proteína é encontrada no citosol, sem peptídeo sinal e solúvel, sugerindo sua não
exportação.
Além disso, a ausência de genes de virulência adquiridos, sítios de modificação de
restrição e genes envolvidos na síntese de micotoxinas reforça a natureza não patogênica da
proteína hipotética estudada. No entanto, vale destacar que foram identificadas regiões
imunogênicas que podem desencadear uma resposta imune mediada por células B, sem
evidências de potencial alérgico.
Os achados também revelaram uma possível aplicabilidade terapêutica da proteína, com
sequências de peptídeos apresentando atividade anticâncer e um potencial antigênico. Além
disso, a presença de múltiplos epitópos de células B sugere um potencial para o
desenvolvimento de vacinas ou terapias imunológicas.
Por fim, a identificação de peptídeo com atividade antibacteriana oferece perspectivas

promissoras para a utilização desses compostos no combate a infecções bacterianas. No entanto,
42
é importante salientar que não foram encontrados peptídeo com atividade antifúngica,
sugerindo a necessidade de investigações adicionais nesse aspecto.
Em conjunto, esses resultados fornecem uma visão abrangente e detalhada da proteína
hipotética FY166-RS19525, contribuindo para a compreensão de sua estrutura, função e
potenciais aplicações biotecnológicas. Futuros estudos podem se beneficiar dessas descobertas
para aprofundar a investigação da proteína e explorar seu potencial terapêutico em diversas
áreas da saúde e biologia molecular.
Referências
ARMBRUSTER, C.E.; MOBLEY, H.L.T.; PEARSON, M.M. Pathogenesis of Proteus

mirabilis Infection. EcoSal Plus, 8(1, 2017. doi:10.1128/ecosalplus.esp-0009-2017
ARMBRUSTER, C.E.; MOBLEY,H.L.T. Merging mythology and morphology: the

multifaceted lifestyle of Proteus mirabilis. Nat Rev Microbiol 10:743–754, 2012.
Goldberg T, Hecht M, Hamp T, Karl T, Yachdav G, Nielsen H, Rost B et al. LocTree3 previsão
de localização. Nucleic Acids Research 2014. PMID: 24848019
Goldberg T, Hamp T e Rost B: LocTree2 prevê localização para todos os domínios da
vida. Bioinformática 2012, 28:i458-i465. PMID: 22962467
GOHARRIRI,K.J.;AMIRMAHANI,F.;FATEHI,F.;NAZARI,M.;MOOSAVI,S.S.Functional
Annotation of Two Hypothetical Proteins Reveals Valuable Proteins Involved in Response to
Salinity: An in silico Approach . J Genet Resour, v.5,n(2), p.72-82, 2019.
LUSCOMBE, N. M.; GREENBAUM, D.; GERSTEIN, M. What is bioinformatics? An

introduction and overview. Yearbook Of Medical Informatics, v. 10, n. 01, p.83-100, ago. 2001.
Georg Thieme Verlag KG.
43
MORIYA, Y. et al. KAAS: an automatic genome annotation and pathway reconstruction server.
Nucleic Acids Research, v. 35, p.182-185, 8 mai. 2007. Oxford University Press (OUP).
MAIA,G.A. Ferramenta integrada para anotação de proteínas hipotéticas : estudo de caso

utilizando análises proteogenômicas em Trypanosoma rangeli / Guilherme Augusto Maia ;
orientador, Dr. Glauber Wagner , 2019. 79 p. Dissertação (mestrado) - Universidade Federal de
Santa Catarina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Biotecnologia
e Biociências, Florianópolis, 2019.
SILVEIRA, A.C.O.; SOUZA, H.A.P.H.M.; ALBINI, C.A. A Gardnerella vaginalis e as

infecções do trato urinário. Bras Patol Med Lab, v. 46, n. 4, p. 295-300,
2010. doi:10.1590/s1676-24442010000400006
WENNER,J.J;RETTGER,L.F.; A systematic study of the Proteus group of bacteria. J Bacteriol

4:331–353, 1919.
Sala Darwin UFG | INCT Ecologia Evolução Conservação da Biodiversida. 2018. Disponível
em: https://eecbio.ufg.br/p/24844-sala-darwin-ufg. Pdf acesso em: 10 jun. 2023.
Museu de Paleontologia da Universidade da Califórnia (The University of California Museum

of Paleontology – UCMP. 2006. Disponível em:
http://ecologia.ib.usp.br/evosite/evo101/IIBPhylogenies.shtml. Aceso em: 10 jun. 2023.
Real-time whole-genome sequencing for routine typing, surveillance, and outbreak detection
of verotoxigenic Escherichia coli.
Joensen KG, Scheutz F, Lund O, Hasman H, Kaas RS, Nielsen EM, Aarestrup FM.
J. Clin. Micobiol. 2014. 52(5): 1501-1510.
Copyright DTU 2011 / All rights reserved

Center for Genomic Epidemiology, DTU, Kemitorvet, Building 204, 2800 Kgs. Lyngby,
Denmark
44
Contact: Vibeke Dybdahl Hammer, Telephone: +45 3588 6420, E-mail: vdha@food.dtu.dk
Funded by: The Danish Council for Strategic Research
Last modified May 22, 2012 11:08:01 GMT
Eisenhaber B., Bork P., Eisenhaber F.

"Sequence properties of GPI-anchored proteins near the omega-site: constraints for the
polypeptide binding site of the putative transamidase"
Protein Engineering (1998) 11, No.12, 1155-1161
Sunyaev S.R., Eisenhaber F., Rodchenkov I.V., Eisenhaber B., Tumanyan V.G., and Kuznetsov
E.N.
"Prediction of potential GPI-modification sites in proprotein sequences"
Protein Engineering (1999) 12, No.5, 387-394
Eisenhaber B., Bork P., Eisenhaber F.

"Prediction of potential GPI-modification sites in proprotein sequences"
JMB (1999) 292 (3), 741-758
Eisenhaber B., Bork P., Yuan Y., Loeffler G., Eisenhaber F.

"Automated annotation of GPI anchor sites: case study C.elegans"
TIBS (2000) 25 (7), 340-341
Jeppe Hallgren, Konstantinos D. Tsirigos, Mads D. Pedersen, José Juan Almagro Armenteros,
Paolo Marcatili, Henrik Nielsen, Anders Krogh and Ole Winther (2022). DeepTMHMM
predicts alpha and beta transmembrane proteins using deep neural networks.
https://doi.org/10.1101/2022.04.08.487609
Bepipred Linear Epitope Prediction 2.0:

Jespersen MC, Peters B, Nielsen M, Marcatili P. 2017. BepiPred-2.0: improving sequence-
based B-cell epitope prediction using conformational epitopes. Nucleic Acids Res (Web Server
issue). 2:2.
PMID: 28472356
Antifungico: If you are using this webserver, please cite, Agrawal et al. (2018) In silico
approach for prediction of antifungal peptides. Front. Microbiol., 9:23. ===
45
Resfinder : Real-time whole-genome sequencing for routine typing, surveillance, and outbreak
detection of verotoxigenic Escherichia coli.
Joensen KG, Scheutz F, Lund O, Hasman H, Kaas RS, Nielsen EM, Aarestrup FM.
J. Clin. Micobiol. 2014. 52(5): 1501-1510.
View the abstract
In Silico Genotyping of Escherichia coli Isolates for Extraintestinal Virulence Genes by Use of
Whole-Genome Sequencing Data.
Malberg Tetzschner AM, Johnson JR, Johnston BD, Lund O, Scheutz F.
J. Clin. Microbiol. 2020. 58(10): e01269-20. doi:10.1128/JCM.01269-20.
View the abstract
KOONIN, E. V. Orthologs, Paralogs, and Evolutionary Genomics. Annual Review Of

Genetics, v. 39, n. 1, p.309-338, dez. 2005. Annual Reviews.
ProtParam References
Gasteiger E., Hoogland C., Gattiker A., Duvaud S., Wilkins M.R., Appel R.D., Bairoch A.;
Protein Identification and Analysis Tools on the Expasy Server;
(In) John M. Walker (ed): The Proteomics Protocols Handbook, Humana Press (2005).
pp. 571-607
Full text - Copyright Humana Press.
PEARSON, W. R. Protein Function Prediction: Problems and Pitfalls. Current Protocols In

Bioinformatics, p.4121-4128, 3 set. 2015. John Wiley & Sons, Inc.

Relatório de Aulas Práticas de Bioinformática

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Relatório de Aulas Práticas de Bioinformática

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE FEDERAL DE SÃO JOÃO DEL REI

CAMPUS CENTRO-OESTE DONA LINDU

Relatório de aulas práticas de Bioinformática

Aluno: Allan Kardec Moreira de Aguiar

Proteus mirabilis (cepa: CRPM10, nat-host: Homo sapiens)

Na primeira aula prática (aula-4), selecionamos a sequência de nucleotídeos da

Figura-1. Dowload da Sequencia no formato Fasta (aligned sequences)

Figura-2. Sequências gênica dos cinco organismos selecionados em formato Fasta

Depois disso, as sequências foram submetidas ao software Multiple Sequence

Análise genômica e Estrutura proteica Aula-5

Para as análises genômica e estrutura proteica, tias como identificação de genes

Foi utilizado o formato FASTA para inserir a Sequência de aminoácidos aa

(Tabela-2). Sequência de aminoácidos da Proteína Hipotética FY167_RS19525 de

Foi utilizado o servidor DTU Health SignalP - 6.0 disponível em:

seguintes parâmetros: Peso molecular, Meia-vida estimada, pI teórico, composição de

desenvolvido para a visualização de proteoformas e a integração interativa de recursos de

Predição de estrutura e função da proteína hipotética-aula 7

Para realizar a predição de estrutura e função da proteína hipotética, foram utilizados os

1. Identificação de motivos de sequência:

 Links: SWISS-MODEL: https://swissmodel.expasy.org/interactive ,

Predição de ações bioquímicas aula-8.

Para realizar as análises de predição de ações bioquímicas, potencial antigênico,

 Descrição: Utilizamos o Bepipred Linear Epitope Prediction 2.0 para realizar a

Os resultados da análise de similaridade usando o BLAST, obtidos da sequência da

O alinhamento das cinco sequências selecionadas na etapa BLAST para análises de

A arvore filogenética criada a partir da sequência da (HP), FY167_RS19525 de

Figura-3. Resultados de comparação das sequências de nucleotídeos da P.mirabilis

Tabela-3. Server-Results ResFinder-4.1 Identificação de genes adquiridos de resistência a

tigecycline tetracycline Não resistente

chlorhexidine quaternary ammonium compound Não resistente

Para análise de predição de genes de virulência adquiridos, os resultados indicam que

Figura-4. Análises para predição de genes de resistência

Os resultados obtidos pelo programa Restriction-ModificationFinder 1.1, revelaram que

Figura-5. Resultados de análises no Restriction-ModificationFinder 1.1.

Figura-6. Análise no ToxFinder-1.0

Tabela-4. Resultados da análise genômica e Estrutura proteica Aula-5

Análise genômica Resultado

Determinação de sítios de modificação de restrição Não

Figura-7. Previsão da patogenicidade de uma bactéria para hospedeiros humanos.

Figura-8. SignalP-6.0 - Results

Formula: C391H590N104O104S6 Numero de átomos: 1195

Peso molecular 8603.98

Para predição da temperatura de desnaturação da (PH) foi utilizado o Tm Predicto

A proteína pode sofre modificações pós-traducionais?

Os resultados da análise para predição de sítios de O-glicosilação, com o programa

Figura-10. Resultados da análise para predição de sítios de O-glicosilação, com o programa

Figura-11. Resultados de análises para previsão de sítio de N-glicosilação

Figura-12. Resultados de análises de pontos de fosforilação com o programa NetPhos-3.1

Tabela-6. Servidor de previsão de GPI

Figura-14. Resultados do Big-PI Prediction.

Figura-15. Predição de sítios de sulfatação – ExPASY.

Fosforilação Sim (26 S, 28 S, 37 S e 66T)

Discussão-aula-6. Localização celular

Esses resultados indicam a probabilidade estimada da proteína hipotética estar

Figura-16. Resultados de análises de localização celular realizadas com o programa BUSCA.

O programa CELLO forneceu previsões para a localização celular da proteína hipotética

Amino Acid Comp Localization (Localização) : Periplasmic (Periplasmático);

Os resultados obtidos por meio do programa BUSCA e do software CELLO forneceram

Figura-18. Resultados de análise de predição da localização celular da Proteína hipotética

Tabela-8.Localização subcelular da proteína hipotética de Proteus mirabilis

Programa Probabilidade Resultados obtidos

BUSCA 70.0 % Citoplasma

CELLO 70,10% Citoplasma