Escolar Documentos
Profissional Documentos
Cultura Documentos
Vanessa Galli
Introdução ao RNA-Seq
Desta forma, o RNA-seq tem se mostrado uma ferramenta poderosa com uma
infinidade de aplicações, de estudos detalhados de processos biológicos em nível de
células específicas a informações relevantes de questões fundamentais na biologia em
escala evolutiva, representando um recurso robusto para fornecer um grande número de
sequências.
Exemplo para o caso em que o tamanho do Kmer for definido como ‘21
nucleotídeos’, o diretório de saída for ‘kmer-21’ e o banco de RNA-Seq for chamado
‘GEK69.fa’:
-ins_length: para que informe o tamanho em pares de base das sequencias ‘paired-end’.
-read_trkg: para realizer uma montage mais detalhada (yes | no), usualmente requerido.
-conserveLong: para manter contigs com reads longos neles (yes | no)
$ oases <output_directory>/
Para arquivos menores, basta importar utilizando File> Import> Fasta reads file.
- Em ‘Guidance only reads’, os reads informados nesta etapa não serão utilizados para a
construção dos grafos de Bruijn, apenas para resolver ambiguidades nos grafos.
- Em ‘Minimum contig length’ é possível definir o tamanho mínimo dos contigs que
serão apresentados, sendo 200pb o padrão. Para bancos muito grande é aconselhável
aumentar este valor.
Na etapa seguinte você pode solicitar que um ‘report’ da montagem seja gerado,
como o apresentado abaixo:
Assim, ao final da montagem, dois arquivos são gerados, um contendo as
sequencias de contigs formadas e outro contendo a descrição destes contigs. Exporte
estes arquivos clicando com o botão direito no nome do arquivo que se encontra à
esquerda na tela. Exporte as sequencias no formato fasta e a o ‘summary report’ em pdf.
Para criar uma tabela de resultados, você deve selecionar todos estes arquivos
usando a tecla Ctrl> clica com direito> new> track list
Duplo clique em ‘ESC-1 (GE), na ‘track list’, abrirá uma tabela que está
conectada com a figura acima.
.
o Median coverage. This is the median coverage for all exons (for all reads - not
only the unique ones). Reads spanning exon-exon boundaries are not included.
o Chromosome region start. Start position of the annotated gene.
o Chromosome region end. End position of the annotated gene.
Agora crie uma ‘track list’ contendo os 4 arquivos GE, os quatro arquivos TE, os
4 arquivos de reads.
Na pasta ESC vs NPC (GE), abra o arquivo e localize o gene Rps15a. Selecione
o gene e na ‘track list’ clique em ‘zoom-to-selection’, para visualizar a diferença de
expressão (quantos reads mapeiam em cada banco de dados). Para verificar se esta
diferença é estatisticamente significativa, podemos realizar uma “Análise empírica de
DGE’:
Mantenha os parâmetros de dispersão padrões, e na janela seguinte marque FDR.
No mesmo arquivo ESC vs. NPC (GE) serão incluídas algumas colunas na
tabela referentes à análise estatística, com o nome de ‘ EDGE tesst: ESC vs NPC,
tagwise dispersions’. Filtre utilizando fold change > 1.5 e FDR < 0.001.
Agora clique no ‘volcano plot’ segurando a tecla ‘ctrl’. Conforme clicar em um
dos genes, ele aparecerá marcado em vermelho no gráfico.