Você está na página 1de 26

Anotao de Genomas

Etapas Pr-anotao

Tcnicas Computacionais para Anlise de Dados em Bioinformtica

Aprendizado de Mquina (Inteligncia Artificial) Programas de computador que melhoram seu desempenho por meio de experincia

Aprendizado de Mquina Conceitos Bsicos


Aprendizado Supervisionado
Programa recebe conjunto de exemplos na forma (entrada, rtulo_desejado)

Aprendizado No-supervisionado
Indutor recebe apenas atributos de entrada Encontrar aglomerados

1- Redes Neurais
Sistema paralelos distribudos compostos por unidades de processamento Nodos (sinapses) que calculam as funes matemticas

2- Algoritmo Gentico
Baseada em eventos genticos: mutao, recombinao e seleo. Aplicaes no alinhamento de seqncia, filognia. Possvel trabalhar com dados grandes e complexos

Algoritmo Gentico
Indivduo = soluo para 1 problema Soluo de um problema:
gera populao de indivduos avalia a aptido seleo do mais adaptado sofre mutao/recombinao nova populao avalia aptido

3- rvores de Deciso
Forma mais simples:
Lista de perguntas respostas sim ou no Hierarquicamente arranjadas Levam a uma deciso

Estrutura da rvore determinada por meio de aprendizado

3- rvores de Deciso
Novo padro: Contm cdon de parada dowstream e tamanho da seqncia menor que limiar
Contm cdon de parada? No No-gene Sim Cdon de parada downstream? No No-gene Sim Tamanho da seqncia > limiar? No No-gene Sim Gene

3- rvores de Deciso
Vantagens: Estrutura de fcil manipulao Produzem modelos que podem ser facilmente interpretados por humanos Desvantagens: Pouca robustez a dados de grande dimenso Acurcia afetada por atributos pouco relevantes Dificuldade em lidar com dados contnuos

Tcnicas de Agrupamento
Dado um conjunto de objetos, colocar os objetos em grupos baseados na similaridade entre eles Utilizado para encontrar padres inesperados nos dados Inerentemente um problema no definido claramente

Como agrupar os animais seguintes?

Tcnicas de Agrupamento
Dado um conjunto de objetos, colocar os objetos em grupos baseados na similaridade entre eles Utilizado para encontrar padres inesperados nos dados Inerentemente um problema no definido claramente

Como agrupar os animais seguintes?

Com bico

Sem bico

Tcnicas de Agrupamento
Dado um conjunto de objetos, colocar os objetos em grupos baseados na similaridade entre eles Utilizado para encontrar padres inesperados nos dados Inerentemente um problema no definido claramente

Como agrupar os animais seguintes?

gua

Terra

4- Tcnicas de Agrupamento
Dado um conjunto de objetos, colocar os objetos em grupos baseados na similaridade entre eles Utilizado para encontrar padres inesperados nos dados Inerentemente um problema no definido claramente

Como agrupar os animais seguintes?

Ovparo

Mamfero

4- Agrupamento Hierrquico
Passo 1: Transforme a matriz n (genes) * m (experimentos) na matriz de distncias n(genes) * n(genes)
Exp 1 Gene A Gene B Gene C Exp 2 Exp 3 Exp 4 Gene A Gene B Gene C Gene A 0 ? ? 0 ? 0 Gene B Gene C

Passo 2: Agrupe genes baseado na matriz de distncia e desenhe um dendograma at restar apenas um n

Situao Prtica Reconhecimento de genes


Abordagens para localizao de genes:
Busca por sinal: localiza indiretamente, por sinais associados expresso gnica
Promotores Stios de incio de traduo

Busca por contedo: identifica segmentos do DNA com propriedades (padres) de regies codificadoras

Busca por Sinal


Classificao: dada janela de tamanho fixo, determinar se h sinal em uma posio particular


Sinal na posio 3?

Classificador
Posio 1 = C Posio 2 = T Posio 3 = T Posio 4 = A Posio 5 = C Posio 6 = G

Tamanho da janela Instncias alinhadas

...ATCCTTACGCGTA... ...ATCCTTACGCGTA... janela

Busca por Sinal Splicing


Lapedes et al. (1989): Ads e RNs Janelas: 11, 21 e 41
Entrada: Cadeia de nucleotdeos Posio 8 = ? A Posio 3 = ? A Negativo C Negativo G C Positivo G T Posio 9 = ? A Negativo C G Negativo T Negativo Regies Doadoras

Negativo

Positivo

Positivo