Você está na página 1de 6

Transcriptmica

DNAmRNA (no necessariamente) protena


mRNA DNA (por meio do vrus)
No h relao direta entre um mRNA produzindo uma protena. H definies em uns (ex:
marcadores) que no se refletem no outro. Marcador de protena totalmente diferente de marcador
de mRNA.
Transcriptmica:
FUNDAMENTOS
Tcnicas:
Microarray triagem (na clnica)
GEO e GEO2R (normalizaes)
Sequenciamento (assim como tnhamos em genomas, temos em mRNA)
E-Utilities
Dogma central da biologia molecular:
Temos isso num compartimento dentro de uma clula (maquinaria celular que produz mRNA e
depois protena)
Composio qumica do mRNA diferente do DNA leva a uma molcula simples-fita (e no
dupla), logo uma molcula mais instvel.
mais difcil trabalhar com RNA: Transformamos o RNA em DNA pra conseguir trabalhar com
RNA dupla fita.
(fator de transcrio se liga a regio promotora)
Enzimas (ex: girase) para abrir a dupla fita at sintetizar o mRNA.
RNA solto na clula faz muitas vezes dobramento sobre si mesmo. Faz estruturas que tambm so
informativas. H algoritmos (principalmente de regies transcritas, regies preditas) que buscam a
sequncia secundria estvel do mRNA. Dobramentos s se formam por pareamento de sequncias
com ela mesma.
Tipos de RNA
Piwis: um dos primeiros a serem codificados
H vrios RNAs no codificantes, so importantes nos processos biolgicos. No so mais
entendidos como exceo.
Small interfering RNAs: pareamento perfeito, sem partes para fora, identidade perfeita.
MicroRNAs: no tem pareamento perfeito, no h identidade perfeita, no tem 100% de cobertura.
Fao RNA, ele pode se dobrar sobre si mesmo e formar uma estrutura que se dobra. Tenho RNA
dupla fita agora, que pode interagir com outra molcula de RNA. Genes de microRNAs podem
inibir (REGULAR) genes meus. MicroRNAs regulam expresso de DNA. Essa regulao ocorre
por pareamento.
RNA regula RNA, o pedao de RNA quebrado (como ele se dobrou, dupla fita) quebra outro
RNA. Essa quebra feita por meio das enzimas RISC. Se pareamento no perfeito, no sabemos
qual RNA ele regula.
RNA no codificante RNA que regula RNA.
MiRBase: base de RNAs. Precisamos disso porque o pareamento geralmente no perfeito. Quero
uma maquinaria que fao 100% de identidade.
Sntese de RNA sempre em um sentido. Passo por somente uma das fitas e formo outra fita.

H regio promotora e regio codificante.


A leitura feita sempre atravs de trades (cdons), leio RNA mensageiro usando esses cdons.
Leitura do cdon determina o aminocido. H tabela de cdon aminocido que varia, ex:
organismo em condies extremas tm prevalncia de certos aminocidos, o que se reflete na
tabela. RNA transportador traz os hairpins.
Regio promotora de eucariotos tm propriedades diferentes dos procariotos. Pra eucariotos mais
difcil a leitura.
Mundo RNA tem duas camadas de informao: sequncia e estrutura secundria (o hairpin). DNA
tem s uma: sequncia.
Forquilha: aberturas que vo sendo transferidas.
5' fala que self e poliA. Declara RNA como self, como meu (no oriundo de invaso viral, no
vou destruir).
Alm da definio do que self, preciso conseguir tirar regies intrnicas do meu RNA, porque
para os codificantes, s devem ficar os xons.
Temos mecanismos de splicing de RNA: possibilidade de tirar regies intrnicas, fazendo uma
combinao de xons; EX: E1 I1 E2 E3 (splicing) E1 E2 E3. H algo entre ntros e xons que
indicam o que era ntron ou xon.
Splicing alternativo: poder combinar esses xons de maneira alternativa. EX: E1 E2; E1 E3. Isso
d uma variabilidade muito grande. Uma mesma regio genmica pode dar origem a vrias
protenas. tima forma de compactao.
Para fazer isso: sobra-se regio uma sobre a outra. Splicing alternativo ou stio de clivagem
alternativo (outro mecanismo que traz variabilidade, mais de uma protena para uma regio).
Em procariotos tem-se a possibilidade de, quando fao sntese do RNA, produzir vrios genes
juntos. Vrias sequncias numa molcula de RNA que d origem a vrias protenas.
Eucariotos no tm isso!
MicroRNAs, possibilidades dos RNAs se dobrarem sobre si mesmos.
O que defino como marcador de RNA no se reflete no marcador pra protenas. No d pra falar
que um RNA d origem a uma protena (no 1:1). Um RNA pode dar origem a vrias protenas
diferentes.
Temos tcnicas de RNA de interferncia para silenciar genes especficos.

Tcnicas
Bibliotecas de cDNA: transformar mRNA em DNA.
Posso fazer um primer (poliT: TTTT) e colocar polimerase para sintetizar uma molcula
complementar. cDNA no tem mais os ntrons. Isso ento diferente de um DNA genmico, que
tambm uma molcula dupla-fita mas tem ntrons. Posso pegar cDNA e jogar num plasmdeo. Ao
grudar essa seq em um plasmdeo, posso inserir plasmdeo numa bactria e deixar ela duplicar. Ela
duplica e gera mais plasmdeos ainda.
Bibliotecas de cDNA esto intimamente ligadas a sequenciamento Sanger.
Para conseguir sequenciar um transcriptoma precisava de mRNA maduros, fazer bibliotecas e da
sequenciar. Os primeiros transcriptomas foram feitos usando bibliotecas de cDNAs (que levavam
2-3 anos pra fazer processo difcil, exaustivo, porm necessrio no primeiro cenrio). E muitas
vezes se descobre que se sequenciou o que no se queria ser sequenciado.
ESTs: quando coloco oligoT (primer) e sintetizar no sentido oposto. Molcula complementar tinha
s um pedao. Esses so os ESTs.
A partir de primers aleatrios era possvel codificar (ORESTES). Consigo pegar seqs de outras

regies da sequncia que os ESTs no conseguiam. ORESTES tiveram papel importante na tarefa
de fechar o sequenciamento do genoma humano.
Microarray: olho s mRNA. Vou colocar amostras em contato com uma lmina que j tem
previamente selecionados os genes que vou estudar. Essa lmina de microArray tem regies onde
tem um rob que coloca molcula na lmina. Lmina tem regies chamadas spots (cada uma com
um gene: G1, G2, G3 chega a at 44 mil genes para estudar uma anlise de transcrio de uma
amostra).
Primeiro ponto de bioinfo: escolher no genoma quem sero os genes estudados. Esses genes devem
ser traduzidos em oligos nucleotdeos (pensando em especificidade).
Hoje em dia podemos comprar microarrays. Exoma: defino quais xons estou estudando. Deve-se
ter cuidado com o que comprar pois o que se quer estudar pode no estar l. Os chips de exomas
no tem codificantes.
Fazer a bioinfo: definir o que se vai estudar e garantir que se vai estudar o que se quer.
Tenho uma lmina com genes limitados a serem estudados. Ela deve ser muito bem pensada para se
garantir que se vai estudar o que se quer.
Vamos hibridizar a amostra (h RNA na amostra, que instvel: se transforma eles em cDNAs).
Coloco sopa de amostras na lmina. Probabilisticamente todos os RNAs se encontram nos spots.
Garantia de que a intensidade de florescncia corresponde da amostra. Consigo olhar ao mesmo
tempo para at 44mil xons diferentes. uma tcnica de triagem.
Na clnica: spots com (genes interessantes com) marcadores interessantes para poder identificar
doenas. H perfil gnico agora. Mdico tem um conjunto de genes que se vai olhar e identificar
tipo de cncer por exemplo. H um software por trs, pois probabilstico.
SAGE: assim como ESTs, sequencio a partir do poliT uma sequncia, mas nesse caso a seq.
menor. Caiu em desuso muito rpido pois a seq. muito pequena. Mas trouxe algo importante: os
tiling arrays (arrays sequenciais que cobre genoma inteiro) trouxeram perfil de expresso onde
vemos que h muita coisa no codificante. H no codificante de forma muito mais forte que
imaginvamos (mRNA no codificantes). mRNA mesmo, pois h poliA, no ntron. H regies
descritas como transcritas que no so codificantes. Da vieram as tcnicas de sequenciamento.
RNA-Seq: pirossequenciamento, usar sequenciadores, para RNA. No preciso mais de bibliotecas
de RNA. Muito mais rpido. Mesmo problema De Novo vs sequenciamento (?). Info mais ntegra:
quando consigo mapear meu genoma. Se no, preciso de algo equivalente ao De Novo.
Novamente, 1o problema: contaminante. Tiro contaminantes e remonto.
(Sequenciamento sanger no larga escala)
Muitos no codificantes so micro RNAs. um problema em aberto descobrir o algoritmo.
Microarrays: https://www.youtube.com/watch?v=ePFE7yg7LvM
Saio do dado bruto, passo para normalizaes genes diferencialmente expressos
busca por grupo diferencialmente expressos
Modelo estatstico para cada grupo diferente
Microarray: primeira etapa tem todo um trabalho de bioinfo para determinar ao que cada um dos
spots corresponde (xon? Seq. inteira?).
Depois que tenho lmina higienizo amostras e hibridizo na lmina.
Scaneio lmina com laser e vejo comprimentos de onda.
Em microarray trabalhamos muitas vezes com razo de expresso. Quanto um gene est expresso.
Sempre preciso de uma referncia

Objetivos finais de uma anlise de dados de microarray. Pode ser que no estejam representados os
genes que respondam tais questes na plataforma de microarray! desafio
R+bioconductor: traz qualidade, pois aberto. Pacote de bioinformtica. Robustez muito boa.
BASE: aberta tambm mas usa banco de dados por trs (engessa forma que voc enxerga o
experimento).
MIDAS e spotfire pago
Vrias ferramentas pra fazer esse tipo de anlise.
Dado bruto: matriz de expresso onde para cada gene h 2 informaes pelo menos
Depois posso fazer uma busca gene a gene ou uma busca em grupos. Em grupos: pensando em gene
anthology. Se ver a via inteira alterada: mais significativo. Em um gene diferente, outra viso.
Dado bruto: no array, posso ter para cada spot, a prpria hibridizao dos reagentes com a lmina
(hibridizao: mexer os reagentes com os spots para garantir que os reagentes se liguem aos spots)
causava um background. Sinal: leitura do sinal menos o background (ex: se background (rudo) era
15 e sinal 10, isso no significativo). Isso vale pra cDNA microarrays.
Plataformas atualmente de oligoarrays, nem olha-se mais tanto o background (reagentes no
deixam o background muito grande). Info ainda existe. EX: se algum encosta na plataforma isso
interfere no sinal entra o background. Se houver isso, devo tirar essa informao (devo subtrair
do sinal). Ento background ainda muito informativo na qualidade do sinal inicial.
1a etapa de normalizao: retirada de background desnecessrio (cabelo, dedo, etc). Ou fazer
subtrao ou tirar esse sinal.
Ainda tem problema nas cores.
MAplot (prova): grfico que permite visualizar razo de expresso por intensidade
log2 (R/G) ; R red; G green
log2(R*G) = intensidade
Grfico razo de expresso por log2(R*G) = intensidade
Corante verde incorpora mais (brilha mais) que corante vermelho!
2a etapa de normalizao: corrigir incorporao de diferencial dos corantes.
Fao isso atravs do grfico de Maplot.
O mtodo usado de chama lowess: janela deslizante que se passa no grfico MAplot, calculo mdia
para janela e trago nuvem para ficar centrada no 0.
Para comparar lminas que vm de diferentes lugares e obtidas de diferentes formas entre si:
primeiro precisamos usar uma referncia em comum. Em seguida, centralizo essas amostras.
Grfico de bloxpot: mostra a distribuio de dados. Seu meio a mediana.
Se duas lminas tm medianas com diferena muito grande, pode ser erro experimental (lote de
reagentes, laser utilizado, etc). Mas isso no esperado. O esperado que todas fiquem muito
prximas, tanto a mediana como a distribuio.
3a etapa de normalizao: normalizao entre arrays (between arrays). Tratar de lminas diferentes
do padro das outras.
Posso usar o lowess aqui.
Depois de fazer essas 3 etapas de normalizao, posso fazer a anlise.
1a anlise: teste-t: teste paramtrico, mas expresso de um gene leva a uma distribuio normal? A
princpio no se sabe. Mas uma forma de comear.
Mas existem testes no paramtricos, que so o ideal, porque expresso de gene no

necessariamente normal.
E anlise com grupos?
NCBI: search com tudo vazio: vejo todas as bases de dados
GEO Datasets dataset browser (mostra j alguns experimentos).
GSE18198: um experimento de microarray tenho plataforma
Reference Series: abre em uma nova aba
Platform (1): ''
Data table: quando se compra o array, escolhe tais propriedades
Clica em cluster analysis
Tem perfil de expresso de todos os genes. D pra ver como cada gene est. Preto: menos diferena
entre os experimentos. Mas no tem probabilidade agregada.
Preciso do p-valor.
Data analysis tools
Compare 2 sets of samples

Rank means e value means so no paramtricos.


Maior p-valor: mais significante
KOPT: group A, HPB: group B
Lista quem grupo A e B.
Resultado: no tem resultados.
Mudamos p-valor.
Nessa interface s h intervalos de p-valor. Ordeno resultados. Ordenar por subgrupo
3 spots avaliando PPP2CA (por isso h 3 resultados). Espera-se que eles estejam concordantes. H
variantes de splicing. Se o perfil de algum est diferente, analiso de forma separada: por probe e no
por gene.
Anlise por grupos: uso kmeans quando tenho direcionamento biolgico por trs, sei que h
subgrupos ali.
Pra experimentos de microarray, comearam a pedir info mnima do experimento pra poder
reproduzir. Existem infos mnimas (coleta de amostra, tratamento de dados brutos) que se deve
dizer pra que qualquer um consiga se reproduzir.
Fizemos essa anlise usando teste paramtrico.
Clicar em Analyze with GEO2R
R script: consegue rodar R
Define groups
Cria labels, depois seleciona grupos com ctrl e depois clica de novo na label
Correo de p-valor deve ser feita quando se faz busca exaustiva entre cada um.
OPTIONS
A mais bem aceita a false discovery rate (no bruta igual a bonferroni, que s multiplica)
GEO2R: top 250
vai dar lista de genes. Vai mostrar coluna de p valor bruto e p valor ajustado
Saio da interface grfica e consigo usar o R para analisar
Sobre a atividade:
Pegar sequncia, rodar BLASTs, criar documento com print screen dos resultados (mostra
identidade, cobertura)
Qual sabor do blast, contra quais parmetros
Mapear no genome browser
Achar gene mais provvel da sequncia recebida e explicar motivo da concluso que levou ao gene.

Atravs desse gene chegar no pubmed (na publicao). Separar ento 3 publicaes vinculadas.
Seq 2: responder quantos genes esto l. Jogar seq nos programas (as respostas podem ser
diferentes) e responder.
(Mapear no refseq para tirar a dvida).

Interesses relacionados