Escolar Documentos
Profissional Documentos
Cultura Documentos
Disciplina: Bioinformática
Junho /2023
Divinópolis/MG
2
Introdução
A Proteus mirabilis é uma bactéria Gram-negativa em forma de bastonete que se destaca
por sua capacidade de produzir uréase, e pode infectar seres humanos, causando infecções do
trato urinário associadas a cateteres (CAUTIs), sendo geralmente polimicrobianas
(ARMBRUSTER,2017). Essa bactéria é capaz de sobreviver em uma ampla variedade de
ambientes, como solo, fonte de água e esgoto, mas é considerada principalmente um comensal
do trato gastrointestinal humano e animal (WENNER,1919; ARMBRUSTER,2012). As
descobertas científicas sobre as alterações morfológicas dessa bactéria são fundamentais para
compreender a sua patogenia (ARMBRUSTER, 2012).
A bioinformática é uma disciplina das Ciências Biologicas que lidar com o grande
volume de dados biológicos, sendo de caráter interdisciplinar que e se dedica ao
desenvolvimento de métodos e ferramentas, como programas de computador, para analisar
dados moleculares biológicos de forma computacional (in silico) (LUSCOMBE, 2001). As
proteínas hipotéticas (HPs) ou proteínas desconhecidas são proteínas que não foram ligadas a
genes e que ainda não foram caracterizadas (Goharrizi,2019).
De acordo com Moriya (2007), após a identificação de um gene, é crucial compreender
sua função potencial, que busca inicialmente essa possível função por meio da comparação de
similaridade entre as novas sequências (obtidas a partir do sequenciamento do organismo em
questão) e as sequências já catalogadas em bancos de dados. Quando duas sequências biológicas
compartilham uma mesma descendência, diz-se que aquelas sequências são sequências
homólogas, sejam sequências nucleotídicas (genes homólogos) ou sequências aminoacídicas
(proteínas homólogas) (KOONIN, 2005).
O objetivo do estudo foi utilizar ferramentas de Bioinformática para predição da
estrutura e função da proteína hipotética de Protheus mirabilis (cepa: CRPM10,nat-host: Homo
sapiens), Gene ID: 43110045 com pb: 243, visando identificar regiões que podem gerar
peptídeos com atividade antibacteriana e com possíveis aplicabilidade na produção de vacinas
ou terapias imunológicas .
3
Materiais e Métodos
Para a realização desse estudo foi escolhido no NCBI na opção genoma o organismo
Proteus mirabílis (cepa: CRPM10, nat-host: Homo sapiens) (Tabela-1), no qual foi selecionado
o Gene ID: 43110045com 243 pb que codifica uma proteína hipotética.
Localização Celular-aula 6
Para as análises de predição da localização celular foi utilizado o servidor, BUSCA
disponível em: https://busca.biocomp.unibo.it/ que integra diferentes ferramentas para prever a
característica de proteínas relacionadas á localização, bem como ferramentas para discriminar
a localização subcelular de proteínas globulares e de membrana, o CELLO v.2.5 disponível
em: http://cello.life.nctu.edu.tw. Os resultados da análise de localização celular da proteína
hipotética, realizada pelo programa CELLO, fornecem informações sobre a previsão da
localização celular da proteína em diferentes compartimentos celulares, cada resultado é
acompanhado por um valor de confiabilidade que indica o grau de certeza da previsão.
Também foi utilizado o DeepTMHMM disponível em:
https://services.healthtech.dtu.dk/service.php?DeepLoc , que é usado para prever a topologia
de membrana transmembranares em relação a bicamada lipídica da membrana celular. Além
disso , foi utilizado o CCtop disponível em: http://cctop.ttk.hu/job/submit, uma ferramenta de
bioinformática usada para prever e analisar os locais de clivagem de proteínas, bem como o
programa Protter disponível em: http://cctop.ttk.hu/job/submit, um programa de código aberto
7
Descrição: AntiBP Server A server for the prediction of the antibacterial peptides.
AntiBP Server Um servidor para a previsão dos peptídeos antibacterianos
9. Predição de peptídeo antifúngico
Programa: Antifp
Link: https://webs.iiitd.edu.in/raghava/antifp/scan.php
Descrição: Com esta ferramenta o usuário pode identificar regiões em uma proteína,
que estão contribuindo para a concepção do peptídeo antifúngico, que pode ser
posteriormente removido ou alterado. Ao contrário, aqui os usuários também podem
pesquisar uma sequência de proteínas para descobrir novos peptídeos antifúngicos.
Resultados e Discussão
Figura-1. Resultados das análises no BLAST para encontrar regiões de similaridade entre
sequências biológicas.
11
Figura-2. Resultados de análises no Multalin Alto consenso Consenso neutro Baixo consenso
.
.
12
Conforme você avança da raiz para as pontas, você está avançando no tempo, e quando
uma linhagem se divide ocorrendo um evento de especiação, que acontece quando uma única
linhagem ancestral dá origem a duas mais linhagens filhas (UCMP,2006). Assim, o nó
representa um evento de especiação, e a arvore filogenética traça padrões de ancestralidade
compartilhados entre linhagens, onde cada linhagem tem uma parte de sua história que é única
e outra parte que é compartilhada com outras linhagens(UCMP,2006).
Uma informação importante para os pesquisadores é saber quais grupos de seres vivos
compartilham um único ancestral comum e exclusivo. Essa informação possibilita definirmos
um clado válido para ser utilizado na abordagem filogenética. Clado: é um agrupamento que
inclui um ancestral comum e exclusivo e todos os descendentes (viventes e extintos) desse
ancestral (´´Sala Darwin", 2018). Assim, P.mirabilis,K.apneumoniae, e E.coli, partilham um
ancestral comum exclusivo.
Discussão : Aula-5
Com relação a análise no ResFinder-4.1 para identificação de genes adquiridos de
resistência a antibióticos, os resultados indicam que possivelmente o gene-alvo escolhido não
é um gene de resistência a antibiótico ( Tabela-3).
Identificação de genes de
Não
virulência adquiridos
Além disso foi feito análise para verificar se na sequência da (HP), FY167_RS19525, o
gene é patógeno humano. O organismo de entrada foi previsto como patógeno não humano
como ilustrado na (Figura-7).
O programa SignalP 6.0 foi utilizado para previsão de peptídeo sinal. Nossos resultados
revelam que a sequência alvo não possui peptídeo sinal como indicado na (Figura-8).
Sequência de aminoácido sem peptídeo sinal sugere que a proteína não é (exportada).
Com base nos dados, a proteína hipotética parece não possuir um peptídeo sinal,
sugerindo que sua função pode estar relacionada a processos intracelulares e não á exportação
para fora da célula. Signal Peptide (Sec/SPI): A probabilidade de a sequência possuir um
peptídeo sinal no sistema de secreção tipo II (Sec/SPI) é indicada como 0.0002. Isso sugere que
a probabilidade dessa proteína hipotética possuir um peptídeo sinal desse tipo é muito baixa.
Para a caracterização físico química da Proteína hipotética (HP), FY167_RS19525
realizada com o programa Protparam , o N-terminal da sequência considerada é M (Met), e
meia-vida estimada foi de: 30 horas (reticulócitos de mamíferos, in vitro). >20 horas (levedura,
in vivo). >10 horas (Escherichia coli, in vivo), com coeficientes de extinção em unidades de
M-1 cm-1, a 280 nm medidos em água. A (Tabela -5 ),mostra os resultados obtidos.
Tabela-5. Resultados da análise para caracterização físico química com o programa Protparam.
19
Parâmetros Valores
Número de aminoácidos 80
Figura-9.
como indicado na (Figura-10). Entretanto , a sequência alvo não revelou nenhum local previsto
predição de N-glicosilação (Figura-11), e indicando 11 pontos de padrão de fosforilação :26
S (65%), 28 S (57%), 37 S (56%) e 66 S (69%) , (Figura-12).
Não ancorado em
previsões
Sequence GPI
Prediction: Not GPI-Anchored Likelihood 0.989
Figura-13. Resultados para detecção de sinais para âncora de GPI servidor NetGPI - 1.1
Tabela-7
Parâmetros Valores
Tm 55-65 °C
O-Glicosilação Sim
N-Glicosilação Não
realizadas com o programa BUSCA indicaram uma possível localização no citoplasma (Figura-
17). A análise utilizando o programa BUSCA proporcionou insights valiosos sobre a
localização celular da proteína hipotética em estudo. O score de 0.7 indica uma confiança
moderada na previsão de localização celular. É importante mencionar que scores mais altos
geralmente indicam previsões mais precisas e confiáveis. Portanto, um score de 0.7 sugere que
a proteína pode estar localizada no citoplasma, mais é necessário considerar outras informações
e realizar experimentos adicionais para confirmar essa localização.
G)-term: Gene Ontology (GO) term associado á localização subcelular prevista para a proteína. Score:
pontuação de confiança atribuída pelo algoritmo utilizado pelo BuscaBiocomp para previsão da localização
subcelular da proteína. Alternative Localization: possíveis localizações subcelulares alternativas; FEatures:
características estruturais ou funcionais da proteína que foram utilizadas pelo algoritmo para a previsão da
localização subcelular.
direcionada para o espaço periplasmático, o que está de acordo com seu possível papel em
processos extracelulares.
Em contraste, a análise da composição de N-peptídeos indicou uma localização
citoplasmática, com um índice de confiabilidade um pouco maior com 0.397. Isso sugere que a
protína também pode ter um papel funcional dentro do compartimento citoplasmático da célula.
A análise da composição de sequência particionada suportou uma localização citoplasmática,
com um índice de confiabilidade de 0.362. A análise de composição físico-química resultou
no índice de confiabilidade mais alto, de 0.701, indicando uma forte probabilidade de
localização citoplasmática. Essa análise leva em consideração as propriedades físico-química
da proteína, que podem fornecer informações valiosas sobre sua localização subcelular.
Figura-17. Resultados de análises de localização celular da proteína hipotética de Proteus
mirabilis com o software CELLO.
A análise realizada no programa DeepLoc 2.0, indicou que a proteína hipotética tem
uma probabilidade de 0.5355 de ser localizada no citoplasma. Essa predição está em
consonância com os resultados obtidos anteriormente pelo programa BUSCA e pelo software
CELLO, que também indicaram o citoplasma como a localização provável da proteína.
A indicação de que a proteína hipotética está localizada no citoplasma, pode implicar
seu papel na regulação de vias metabólicas e interações com outras proteínas ou componentes
celulares presente no citoplasma. É importante notar que o programa forneceu probabilidade
para outras localizações celulares, como núcleo, membrana celular , mitocôndrias, plastídio,
retículo endoplasmático, lisossomo/vacúolo, complexo de Golgi e peroxissomo (Figura-18).
Essas probabilidades indicam a possibilidade de a proteína hipotética estar presente em outras
localizações celulares além do citoplasma. No entanto , a maior probabilidade de localização
no citoplasma sugere que essa é a localização principal ou predominante.
Os resultados obtidos no programa indicaram que a proteína hipotética tem uma maior
probabilidade de estar localizada no citoplasma celular (Tabela-7). A indicação de localização
no citoplasma sugere que a proteína pode estar envolvida em atividades metabólicas e funções
27
DeePTMHMM-Prediction
Com base na análise dos dados fornecidos pela CCTop, podemos observar os seguintes:
os resultados mostram os locais de clivagem previstos na sequência de aminoácidos da proteína
hipotética. Esses locais são onde a proteína é suscetível a ser quebrada por proteases. A
confiabilidade da previsão nessa análise foi de 68%. (Figura-20). Isso indica que existe uma
certa margem de incerteza associada aos resultados. Quanto maior for o valor de confiabilidade,
mais confiáveis serão as previsões.
Figura-20.
Parâmetro Observação
Localização celular Citosol
Topologia Solúvel
Objetivos da aula, foi investigar, Quais estruturas e função da minha proteína? Quais
domínios estão presentes na minha sequência? As análises com a ferramenta MOTIF Search,
para identificar e analisar a presença de motivos de sequência na (PH) , os resultados não
revelaram a presença de motivos significativos na proteína hipotética (Figura-23).
Figura-7. Resultados de análise com o MOTIF Search para Proteus mirabilis proteína
hipotética Gene ID: 43110045.
Figura-22.
Para as análises de predição de qual família de proteínas pertence a (HP) de estudo, não
foram encontrados nenhuma predição da sequencia alvo.
Figura-23. Resultados da análise com o
sequência). Essa designação indica que essas regiões não apresentam uma
estrutura secundária definida, ou seja, não são hélices, folhas ou outras
estruturas. Por outro lado, o programa Predator previu que 36 resíduos (45%
da sequência) estão em uma conformação de "Alpha helix" (Hh).
Os resultados indicam que a proteína hipotética possui uma proporção
significativa de regiões com conformações estruturais indefinidas (Random
coil), enquanto uma porção menor da sequência é prevista como uma hélice
alfa (Alpha helix). Essas informações podem fornecer pistas iniciais sobre as
características estruturais da proteína, mas investigações adicionais são
necessárias para entender sua função e importância biológica de maneira
mais abrangente.
Figura-24.
Os resultados adicionais obtidos a partir das análises realizadas pelos programas PRABI
e PROTEUS para a proteína hipotética confirmam as informações previamente discutidas.
32
O programa PROTEUS forneceu uma análise mais completa dos dados. De acordo com
os resultados, a sequência da proteína hipotética, não foi identificada nenhuma região de hélice
transmembranar ou sinal peptídico na sequência. Em relação ás previsões de estrutura
secundária, o PROTEUS indica que 38% da sequência é prevista como hélice 930 resíduos),
enquanto nenhum resíduo é previsto como folha beta (Beta sheet). A maior porção da sequência
(63%, ou 50 resíduos) é prevista como estrutura em espiral (Coil), que corresponde a regiões
sem estrutura secundária definida. Além disso, os resultados revelam que nenhuma porção da
sequência é prevista como conteúdo de sinal peptídico ou conteúdo de membrana.
Figura-25
Para avaliar a capacidade de uma proteína em gerar uma resposta imune e sua potencial
utilização como candidata a vacina, foi empregado o programa VaxiJen V2, para realizar a
predição. Os resultados obtidos revelaram um valor de potencial antigênico de 0,6390 (Figura-
30). Essa pontuação indica uma probabilidade de que a proteína seja reconhecida pelo sistema
imunológico e desencadeie uma resposta imune. A capacidade de uma proteína em gerar uma
resposta imune é um fator determinante na seleção de candidatas a vacina.
acessar). Diante do exposto não foi possível fazer essa análise com o servidor :
http://bioinfo.icgeb.res.in/virulent/.
De acordo com os resultados obtidos por meio das análises realizadas com o Antifp,
constatou-se que a proteína hipotética FY167_RS19525 não apresentou peptídeo antifúngico
(conforme ilustra na figura-38).
41
Conclusão
é importante salientar que não foram encontrados peptídeo com atividade antifúngica,
sugerindo a necessidade de investigações adicionais nesse aspecto.
Em conjunto, esses resultados fornecem uma visão abrangente e detalhada da proteína
hipotética FY166-RS19525, contribuindo para a compreensão de sua estrutura, função e
potenciais aplicações biotecnológicas. Futuros estudos podem se beneficiar dessas descobertas
para aprofundar a investigação da proteína e explorar seu potencial terapêutico em diversas
áreas da saúde e biologia molecular.
Referências
Goldberg T, Hecht M, Hamp T, Karl T, Yachdav G, Nielsen H, Rost B et al. LocTree3 previsão
de localização. Nucleic Acids Research 2014. PMID: 24848019
Goldberg T, Hamp T e Rost B: LocTree2 prevê localização para todos os domínios da
vida. Bioinformática 2012, 28:i458-i465. PMID: 22962467
GOHARRIRI,K.J.;AMIRMAHANI,F.;FATEHI,F.;NAZARI,M.;MOOSAVI,S.S.Functional
Annotation of Two Hypothetical Proteins Reveals Valuable Proteins Involved in Response to
Salinity: An in silico Approach . J Genet Resour, v.5,n(2), p.72-82, 2019.
MORIYA, Y. et al. KAAS: an automatic genome annotation and pathway reconstruction server.
Nucleic Acids Research, v. 35, p.182-185, 8 mai. 2007. Oxford University Press (OUP).
Sala Darwin UFG | INCT Ecologia Evolução Conservação da Biodiversida. 2018. Disponível
em: https://eecbio.ufg.br/p/24844-sala-darwin-ufg. Pdf acesso em: 10 jun. 2023.
Real-time whole-genome sequencing for routine typing, surveillance, and outbreak detection
of verotoxigenic Escherichia coli.
Joensen KG, Scheutz F, Lund O, Hasman H, Kaas RS, Nielsen EM, Aarestrup FM.
J. Clin. Micobiol. 2014. 52(5): 1501-1510.
Contact: Vibeke Dybdahl Hammer, Telephone: +45 3588 6420, E-mail: vdha@food.dtu.dk
Funded by: The Danish Council for Strategic Research
Last modified May 22, 2012 11:08:01 GMT
Sunyaev S.R., Eisenhaber F., Rodchenkov I.V., Eisenhaber B., Tumanyan V.G., and Kuznetsov
E.N.
"Prediction of potential GPI-modification sites in proprotein sequences"
Protein Engineering (1999) 12, No.5, 387-394
Jeppe Hallgren, Konstantinos D. Tsirigos, Mads D. Pedersen, José Juan Almagro Armenteros,
Paolo Marcatili, Henrik Nielsen, Anders Krogh and Ole Winther (2022). DeepTMHMM
predicts alpha and beta transmembrane proteins using deep neural networks.
https://doi.org/10.1101/2022.04.08.487609
Antifungico: If you are using this webserver, please cite, Agrawal et al. (2018) In silico
approach for prediction of antifungal peptides. Front. Microbiol., 9:23. ===
45
Resfinder : Real-time whole-genome sequencing for routine typing, surveillance, and outbreak
detection of verotoxigenic Escherichia coli.
Joensen KG, Scheutz F, Lund O, Hasman H, Kaas RS, Nielsen EM, Aarestrup FM.
J. Clin. Micobiol. 2014. 52(5): 1501-1510.
View the abstract
In Silico Genotyping of Escherichia coli Isolates for Extraintestinal Virulence Genes by Use of
Whole-Genome Sequencing Data.
Malberg Tetzschner AM, Johnson JR, Johnston BD, Lund O, Scheutz F.
J. Clin. Microbiol. 2020. 58(10): e01269-20. doi:10.1128/JCM.01269-20.
View the abstract
ProtParam References
Gasteiger E., Hoogland C., Gattiker A., Duvaud S., Wilkins M.R., Appel R.D., Bairoch A.;
Protein Identification and Analysis Tools on the Expasy Server;
(In) John M. Walker (ed): The Proteomics Protocols Handbook, Humana Press (2005).
pp. 571-607
Full text - Copyright Humana Press.