Você está na página 1de 7

Bioinformática

Sala: LIG, UFRJ


Prof. Douglas Terra Machado - UFRJ
Email: dougterra@gmail.com

Nome: Maria Eduarda Araujo de Oliveira


Data:19/06/2023
Curso:Biotecnologia

Observação:
O envio desse roteiro deve ser em formato PDF e o nome do
arquivo deve estar como:
SEU_NOME_E_SOBRENOME_CURSO_DATA_ESTUDO_DIRIGIDO_AULA06_GENOMIC
A_FUNCIONAL
Disciplina Bioinformática UFRJ, campus Duque de Caxias
Prof. Douglas Terra Machado

Estudo Dirigido Bioinformática


Módulo: Genômica Funcional

1. Defina a genômica funcional.


R.: A disciplina em questão engloba a análise abrangente do genoma em
relação à função do ácido desoxirribonucleico (DNA), que inclui tanto
os genes quanto os elementos não genéticos, bem como os ribonucleicos
preparados (RNAs), as proteínas codificadas e suas ramificações.

2. Como a genômica funcional auxilia em uma compreensão mais


completa da função genômica?
R.: Dentro da genômica funcional, a abordagem consiste em aplicar os
conhecimentos atuais sobre a função genética, visando desenvolver um
modelo que estabeleça uma ligação entre o genótipo e o fenótipo.

3. Como a epigenética influencia na expressão gênica?


R.: A epigenética diz respeito a alterações reversíveis na expressão
dos genes que não envolvem modificações na sequência do DNA. Essas
alterações epigenéticas podem ocorrer por meio de modificações
químicas nas moléculas de DNA e nas proteínas associadas a ele. O
impacto da epigenética na expressão gênica é significativo e
desempenha um papel crucial no desenvolvimento. Uma dessas
modificações é a modificação da cromatina, que se refere à estrutura
onde o DNA é organizado no núcleo das células. A cromatina pode estar
em um estado aberto e acessível aos fatores de transcrição, permitindo
a expressão gênica, ou em um estado fechado e compacto, silenciando a
expressão gênica. Outra modificação importante é a metilação do DNA,
que envolve a adição de grupos metil ao DNA, principalmente nas
regiões ricas em nucleotídeos CpG (ilhas CpG). Além dos genes que
codificam proteínas, o genoma humano também contém regiões que
produzem moléculas de RNA não codificante, que também desempenham um
papel na regulação genética.ica funcional, nossa abordagem consiste em
aplicar os conhecimentos atuais sobre a função genética, visando
desenvolver um modelo que estabeleça uma ligação entre o genótipo e o
fenótipo.

4. É possível que uma região esteja eucromática, com a


região promotora dos genes contidos nessa região
acessível para a transcrição, mas esses genes não estejam
sendo transcritos? Como a epigenética pode explicar essa
situação?

1
Disciplina Bioinformática UFRJ, campus Duque de Caxias
Prof. Douglas Terra Machado

R.: Sim, é possível que uma região esteja em estado eucromático, ou


seja, com a região promotora dos genes acessível para a transcrição,
mas que esses genes não estejam sendo transcritos. A regulação
precisa da expressão gênica é fortemente influenciada pela
epigenética, que pode explicar essa situação por meio de diferentes
mecanismos epigenéticos. Um dos principais mecanismos epigenéticos
envolvidos é a modificação das histonas, que são proteínas
responsáveis pela compactação do DNA na cromatina. Modificações
químicas específicas, como metilação, acetilação, fosforilação e
ubiquitinação, nas histonas podem afetar a atividade dos genes. Além
disso, a metilação do DNA também pode desempenhar um papel na
regulação da expressão gênica. A metilação de regiões regulatórias,
como a região promotora, geralmente está associada à repressão da
transcrição, uma vez que a presença de grupos metil pode interferir
na ligação dos fatores de transcrição. Outro fator epigenético que
pode influenciar a transcrição gênica é a presença de RNA não
codificante, como os microRNAs. Os microRNAs têm a capacidade de se
ligar a sequências específicas do RNA mensageiro (mRNA) e interferir
em sua tradução em proteínas, resultando na inibição da expressão
gênica.

5. Defina com suas palavras o que é RNA-Seq. Qual a


diferença em relação ao microarray?
R.: RNA-Seq (RNA sequencing) é uma técnica de análise genômica que
permite investigar e quantificar a expressão gênica em larga escala.
Utilizando o sequenciamento de próxima geração (Next-Generation
Sequencing, NGS), o RNA-Seq determina a sequência e a abundância das
moléculas de RNA presentes em uma amostra. A diferença principal entre
RNA-Seq e microarray reside na abordagem utilizada para a análise da
expressão gênica. Em microarrays, pequenas sondas de DNA pré-
determinadas são fixadas em uma matriz e o RNA extraído da amostra é
hibridizado com essas sondas. A intensidade do sinal gerado reflete a
quantidade de RNA correspondente presente na amostra. Os microarrays
são projetados para detectar conjuntos específicos de genes
previamente selecionados. Já o RNA-Seq utiliza o sequenciamento de
nova geração para determinar a sequência completa de todas as
moléculas de RNA presentes na amostra. Isso inclui tanto o RNA
mensageiro (mRNA), que contém as informações para a produção de
proteínas, quanto outros tipos de RNA, como os microRNAs e o RNA não
codificante. Com o RNA-Seq, é possível obter uma visão mais abrangente
e detalhada da expressão gênica em comparação com os microarrays.

6. O que significa uma matriz de contagem de reads obtida a


partir de um experimento de RNA-Seq? Forneça um exemplo
de uma matriz de contagem de reads que contenha pelo
menos cinco genes com contagens de expressão em três
replicatas biológicas?
R.: Uma matriz de contagem de reads resultante de um
experimento de RNA-Seq é uma tabela que registra a
quantidade de reads (sequências curtas de RNA) mapeadas
em cada gene em uma determinada amostra. Cada linha da
matriz corresponde a um gene, enquanto cada coluna
representa uma replicata biológica ou uma amostra em
particular.Replicata 1 Replicata 2 Replicata 3
2
Disciplina Bioinformática UFRJ, campus Duque de Caxias
Prof. Douglas Terra Machado

-
Gene A 250 300 280
Gene B 100 120 110
Gene C 800 850 820
Gene D 50 60 55
Gene E 400 380 410

Neste exemplo, os genes A, B, C, D e E são listados nas


linhas, enquanto as três replicatas biológicas são
representadas nas colunas. Cada valor na matriz indica o
número de reads mapeadas em um determinado gene para uma
replicata biológica específica. Por exemplo, o gene A
possui 250 reads na replicata 1, 300 reads na replicata 2
e 280 reads na replicata 3.

7. Fale sobre as etapas envolvidas na preparação de


bibliotecas para o sequenciamento de RNAs.
R.: 1- Preparar a biblioteca de sequenciamento; 2- Sequenciar; 3-
Análise dos dados. Preparar a biblioteca de sequenciamento, 1 passo:
Isolamento dos RNAs; 2 passo: Fragmentação; 3 passo: Converter os
fragmentos de RNA em cDNA. 4 passo: Adicionar os adaptadores; 5
passo: Amplificação por PCR; 6 passo: Controle de qualidade (

3
Disciplina Bioinformática UFRJ, campus Duque de Caxias
Prof. Douglas Terra Machado

Verificar a concentração da biblioteca e Verificar o tamanho dos


fragmentos na biblioteca ). 2- Sequenciar. 3- Análise dos dados,
Temos os dados brutos do sequenciamento (arquivos FASTA/FASTQ com as
reads), precisamos: Filtrar reads de qualidade ruim; Alinhar as reads
de alta qualidade em um genoma; Quantificar o número de reads
para cada gene.)

8. Por que a normalização das contagens de reads na matriz


de análise é importante após o sequenciamento de RNAs?
R.: Essas métricas são normalizadas levando em
consideração: a profundidade do sequenciamento (expressa
em 'por milhão'), onde um sequenciamento mais profundo
tende a resultar em um maior número de reads mapeando em
cada gene; e o tamanho do gene (expresso em 'por
kilobase'), uma vez que genes maiores têm uma tendência
de ter mais reads mapeando em sua extensão.

9. Explique como realizar a normalização das contagens das


reads utilizando os métodos RPKM e FPKM, ou seja, como
calculá-los. Quais outros métodos de normalização
existem? Cite ao menos mais um.
R.: A normalização das contagens de reads em experimentos de RNA-Seq é
um passo crucial para comparar a expressão gênica entre diferentes
amostras, levando em consideração fatores como a profundidade do
sequenciamento e a composição da biblioteca. O RPKM é comumente
utilizado para normalizar os dados de RNA-Seq em amostras individuais.
O cálculo do RPKM envolve três etapas: primeiro, é calculado o número
de reads mapeadas para um gene específico; em seguida, é calculado o
tamanho efetivo do gene, geralmente em kilobases (KB), para compensar
a variação no comprimento dos genes; por fim, o número de reads
mapeadas é normalizado pela extensão efetiva do gene e pelo número
total de reads mapeadas no experimento (em milhões). O FPKM é uma
medida semelhante ao RPKM, mas leva em consideração os fragmentos
(pares de reads) mapeados em vez de reads individuais. É
frequentemente utilizado quando ocorre a fragmentação do cDNA antes do
sequenciamento. O cálculo do FPKM segue as mesmas etapas do RPKM, mas
utiliza o número de fragmentos mapeados em vez de reads individuais. O
TPM (Transcripts Per Million) é uma medida de normalização que se
baseia na abundância relativa dos transcritos. Nesse método, o número
de transcritos de um gene é normalizado pelo tamanho do gene (em
kilobases) e pelo número total de transcritos em milhões. O TPM
fornece uma estimativa da abundância relativa dos genes em uma
amostra.

10. Explique a importância de replicatas biológicas e


técnicas em estudos de RNA-Seq.
R.: Réplicas técnicas são utilizadas para repetir as etapas técnicas
ou experimentais utilizando a mesma amostra biológica, a fim de medir
com precisão a variação técnica e removê-la durante a análise. Já as
réplicas biológicas utilizam diferentes amostras biológicas da mesma
condição experimental para medir a variação biológica entre as
amostras.
4
Disciplina Bioinformática UFRJ, campus Duque de Caxias
Prof. Douglas Terra Machado

As réplicas biológicas são fundamentais por diversos motivos.


Primeiramente, considera-se a variabilidade biológica ao incluí-las,
levando em conta as diferenças inerentes entre indivíduos ou amostras
biológicas do mesmo grupo experimental. Essa abordagem é importante
porque a expressão gênica pode variar devido a fatores biológicos,
como diferenças genéticas, idade, sexo, condições de saúde, entre
outros. As réplicas biológicas auxiliam na captura dessa variabilidade
e permitem distinguir os efeitos verdadeiramente biológicos dos ruídos
experimentais.

Além disso, as réplicas biológicas permitem uma estimativa de


reproducibilidade dos resultados. Ao comparar as expressões gênicas
entre as réplicas, é possível verificar se os padrões de expressão são
consistentes e replicáveis, aumentando assim a confiabilidade dos
resultados.

A inclusão de réplicas biológicas também contribui para uma análise


estatística robusta da expressão gênica. Elas fornecem uma base
estatística sólida, permitindo calcular medidas de variabilidade, como
desvio padrão e coeficiente de variação, e realizar testes
estatísticos adequados para identificar genes diferencialmente
expressos entre as condições experimentais.

Por outro lado, as réplicas técnicas são utilizadas para avaliar a


variação técnica inerente ao processo de sequenciamento de RNA-Seq,
como a amplificação do cDNA, eficiência de ligação dos adaptadores e
variações no sequenciamento em si. Essas réplicas auxiliam na
identificação e avaliação dessa variação técnica, permitindo
distinguir as variações reais na expressão gênica das variações
introduzidas pelos procedimentos técnicos.

Além disso, a inclusão de réplicas técnicas auxilia na detecção de


possíveis artefatos experimentais. Diferenças significativas entre as
réplicas técnicas podem indicar problemas no processo experimental,
como contaminação, erros na etapa de amplificação ou sequenciamento.

Por fim, as réplicas técnicas permitem avaliar a reproducibilidade do


processo experimental. Ao comparar os resultados das réplicas
técnicas, é possível verificar se as etapas técnicas foram executadas
de maneira consistente e se os resultados são replicáveis.

Por que é importante identificar e estudar genes diferencialmente


expressos? Como essa informação pode ajudar a compreender
processos biológicos e patológicos?
R.: A identificação e estudo de genes com expressão diferencial
desempenham um papel crucial na compreensão dos processos biológicos e
patológicos em nível molecular. Essa identificação permite a
caracterização de vias e processos biológicos ativos em diferentes
condições. Além disso, a descoberta de genes com expressão diferencial
pode levar à identificação de biomarcadores, que são indicadores
moleculares associados a estados biológicos específicos ou condições
patológicas. O estudo de genes com expressão diferencial em doenças
também contribui para a compreensão dos processos patológicos
subjacentes. Ao comparar a expressão gênica entre amostras de doença e
de controle, é possível identificar genes envolvidos em doenças
específicas. Essas informações são essenciais para entender as bases
moleculares das doenças e podem direcionar pesquisas futuras visando
5
Disciplina Bioinformática UFRJ, campus Duque de Caxias
Prof. Douglas Terra Machado

ao desenvolvimento de terapias mais eficazes. Além disso, a


identificação de genes com expressão diferencial em doenças pode ser
de grande relevância na busca por alvos terapêuticos. Genes cuja
expressão esteja alterada em doenças podem se tornar alvos para o
desenvolvimento de terapias direcionadas, como medicamentos
específicos ou terapias genéticas, visando restaurar a expressão
normal desses genes ou modular suas funções para o tratamento da
doença em questão.

Você também pode gostar