Você está na página 1de 13

Genômica, Transcriptômica e Proteômica

Genômica, Transcriptômica e Proteômica

Estão cada vez mais em evidência no cenário científico, devido aos mecanismos
envolvidos na expressão e interação dos genes. Assim como a compreensão das
redes funcionais estabelecidas pelas proteínas.

Para as diferentes análises nos nucleotídeos são utilizados quatros principais


bancos de dados: INSDC (INTERNATIONAL NUCLEOTIDE SEQUENCE DATABASE), o
DDBJ (DATA BANK OF JAPAN), o EMBL (EMBL NUCLEOTIDE SEQUENCE DATABASE) e
o GenBank.
Genômica, Transcriptômica e Proteômica

Os registros de associação incluem dados de genes individuais, genomas completos, RNAs,


anotações, sequências expressas, cDNAs e sequências sintéticas. Por serem bancos de dados
primaries, são a fonte inicial de bancos de dados em biologia molecular.

Bancos de dados secundários são uma fonte de anotações estáveis onde os genes são anotados
por evidências derivadas de proteínas conhecidas, cDNAs e sequências expressas.

Outro banco de dados é o RefSeq (REFERENCE SEQUENCE) que disponibiliza sequências


compreensíveis, integradas e não-redundantes, incluindo DNA genômico, transcritos e proteínas
de diversos organismos.

Por outro lado, o Genome Review representa uma versão da sequência original de um
cromossomo ou plasmídeo, com informações importadas de fontes que incluem o UniProt
(UNIVERSAL PROTEIN RESOURCE), Gene Ontology (GO), projeto GOA (GO ANNOTATION), InterPro
e HoGenom, além de serem disponibilizadas referências cruzadas com 18 bancos de dados.
Genômica, Transcriptômica e Proteômica

Para a identificação de genes, em seres eucariotos, dois softwares são muito utilizados, o Glimmer
e o Genemark. Eles analisam as ORFs (janelas de leitura na sequência), sendo que cada uma é
alinhada e comparada com as de outras espécies conhecidas e depositadas em bancos de dados
como GenBank e SwissProt.

A anotação é considerada completa quando o genoma está decodificado e minimamente anotado,


com seus genes identificados e conferidos. A anotação funcional se dá através da comparação das
sequências obtidas com as depositadas em bancos de dados como o GenBank e o Blast, sendo o
último uma ferramenta mais amplamente utilizada para esse tipo de comparação.

Existem também os bancos de EST (EXPRESSED SEQUENCE TAG) que ao invés de sequenciar todo o
genoma de um organismo e depois tentar descobrir quais são seus genes, apenas os genes
expressos pelo organismo são capturados e sequenciados.
Genômica, Transcriptômica e Proteômica

A evolução da bioinformática, iniciada com análises de sequenciamento, tem oferecido avanços


nas ciências “ômicas”, principalmente nas anotações dos transcriptomas, permitindo a
interrelação entre o genoma funcional e a informação codificada.

Atualmente, estudos moleculares requerem a interação entre análises genômicas, celulares e


dados de bioinformática, a qual apresenta, gradativamente, um papel essencial na geração de
resultados aliados a alta tecnologia.

Uma das ferramentas mais utilizadas na análise transcriptômica é a tecnologia de microarranjo


que constitui uma das principais ferramentas para estudos de expressão gênica, sendo muito
aproveitada na avaliação de aspectos da biologia de sistemas e o estudo dos perfis de interação
entre diversas biomoléculas.
Genômica, Transcriptômica e Proteômica

O grande desafio enfrentado por estudiosos e bioinformatas é descobrir qual a estrutura


tridimensional adotada pelas proteínas a partir da estrutura primária. No entanto, as
ferramentas in silico disponíveis atualmente ainda não são totalmente confiáveis.

Os métodos experimentais utilizados para obtenção da estrutura tridimensional são


cristalografia por difração de raio-X e ressonância magnética nuclear. Entretanto, esses
métodos podem ser onerosos e de difícil execução, além de apresentarem limitações
técnicas.

Estas e outras dificuldades fazem com que a quantidade de estruturas de proteínas


decifradas ainda compõe uma pequena fração do total de proteínas existentes.
Genômica, Transcriptômica e Proteômica

No estudo completo das proteínas, integrando estrutura e função, os


pesquisadores utilizam bancos de dados diversos que possam atender os
diferentes ramos da proteômica. Um dos mais usados é o banco de dados Entrez
Protein, um depósito de sequências disponibilizado pelo NCBI e compiladoatravés
de uma variedade de fontes.

O banco contêm as sequências de proteínas submetidas aos bancos PIR (PROTEIN


INFORMATION RESOURCE), UniProtKB/Swiss-Prot, PRF (PROTEIN RESEARCH
FOUNDATION) e PDB. Outro, também muito utilizado é o UniProt, um catálogo de
dados de sequências e funções de proteínas, mantido pelo consórcio UniProt.
Genômica, Transcriptômica e Proteômica

O UniProtKB/Swiss-Prot é um banco anotado manualmente com informações


extraídas da literatura e análises computacionais, contendo níveis mínimos de
redundância e alto nível de integração com outros bancos de dados.

Na análise de dados obtidos utilizando a eletroforese bidimensional, o banco de


dados SWISS-2DPAGE é o mais útil, pois armazena resultados experimentais que
utilizam esta metodologia e acrescenta uma variedade de referências cruzadas
com outros bancos de dados semelhantes, além do UniProtKB/Swiss-Prot.
Genômica, Transcriptômica e Proteômica

No entanto, se o objetivo é descrever a função molecular, o contexto biológico e a


localização celular do produto gênico, o Gene Ontology é o mais indicado.

Um método alternativo e não-experimental é a modelagem molecular, baseada em


conhecimentos estereoquímicos dos aminoácidos. Uma das maneiras de se fazer a
modelagem molecular é através da homologia entre sequências, em que uma delas já
possui forma tridimensional definida.

Outro tipo de modelagem é o Threading, que compara estrutura de uma proteína teste
com a estrutura de outra proteína conhecida com uma pequena similaridade de
sequência. Neste modelo é levada em consideração a distância entre os resíduos de
aminoácidos, a estrutura secundária e as características físico-químicas.
Genômica, Transcriptômica e Proteômica

Referências:

CAO, YQ., et al. Digital PCR as an Emerging Tool Monitoring of Microbial Biodegradation. Molecules. 2020, Feb 25(3):706, 1-18.

CHEN, Q., GUO, W., FENG, L., YE, X., XIE, W., HUANG, X. and LIU, J. Transcriptome and proteome analysis of Eucalyptus infected
with Calonectria pseudoreteaudii. J. Proteomics 115, 117–131, 2015.

ESPÍNDULA, F.S.et al. Recursos de bioinformática aplicados às ciências ômicas como genômica, transcriptômica, proteômica,
interatômica e metabolômica. Bioscience Journal, Uberlândia, v. 26, n. 3, p. 463-477, Maio/Junho 2010.

GAUTHERET, D.; POIROT, O.; LOPEZ, F.; AUDIC, S.; CLARVERIE, J. M. Alternate polyadenylation in human mRNAs: a large-scale
analysis by EST clustering. Genome Research, Cold Spring Harbor, US, v. 8, p. 524-530, 1998.

HAN, Y., GUO, S., MUEGGE, K., ZHANG, W. and ZHOU, B. Advanced Applications of RNA Sequencing and Challenges. Bioinform.
Biol. Insights, 29, 2015.
Genômica, Transcriptômica e Proteômica

Referências:

KIM, K.H., KANG, Y.J., KIM, D.H., YOON, M.Y., MOON, J.-K., KIM, M.Y., VAN, K. and LEE, S.-H. RNA-Seq Analysis of a Soybean
Near-Isogenic Line Carrying Bacterial Leaf Pustule-Resistant and -Susceptible Alleles. DNA Res. 18, 483–497, 2011.

MARTIN, J.A. & WANG, Z. Next-generation transcriptome assembly. Nat. Rev. Genet. 12, 671–682, 2011.

MATTHEWS, B. F.; DEVINE, T. E.; WEISEMANN, J. M.; BEARD, H. S.; LEWERS, K. S.; MACDONALD, M. H.; PARK, Y. B.; MAITI, R.;
LIN, J.; KUO, J.; PEDRONI, J. J.; CREGAN, P. B.; SAUNDERS, J. A. Incorporation of sequence cDNA and genomic markers into
soybean genetic map. Crop Science, Madison, US, v. 41, p. 516-521, 2001.

MOREIRA, L.M; et al. Ciências Genômicas: Fundamentos e Aplicações. 1a Edição. Ribeirão Preto: Cubo, 2015.

MORETON, J., IZQUIERDO, A. AND EMES, R.D. Assembly, Assessment, and Availability of De novo Generated Eukaryotic
Transcriptomes. Front. Genet. 6, 2016.
Genômica, Transcriptômica e Proteômica

Referências:

PROSDOCIMI & SANTOS. Sobre bioinformática, genoma e ciência. Ciência Hoje, 2006, v. 35, n. 209, p. 54-57.

PROSDOCIMI, F. Introdução à bioinformática. Revista Biotecnologia Ciência & Desenvolvimento, 2007, p. 03-74.

SUGIMOTO, M., KAWAKAMI, M., ROBERT, M., SOGA, T., & TOMITA, M. Bioinformatics Tools for Mass Spectroscopy-Based
Metabolomic Data Processing and Analysis. Current bioinformatics, 2012, v.7, n.1, p.96–108.

VELCULESCU, V.E.; ZHANG, L.; VOGELSTEIN, B.; KINZLER, K.W. 1995. Serial Analysis of Gene Expression. Science. v. 270. p. 484-
487.

VERLI, H; et al. Bioinformática: Da Biologia à Flexibilidade Molecular. 1a Edição. São Paulo: SBBq, 2014.

WESTERMANN, A.J., GORSKI, S. a. and VOGEL, J. Dual RNA-seq of pathogen and host. Nat. Rev. Microbiol. 10, 618–630, 2012.

ZAHA, A.; FERREIRA, H.B.; PASSAGLIA, L.M.P. Biologia Molecular Básica. 5a Edição. Porto Alegre: Artmed, 2014.
Obrigada!

Você também pode gostar