Você está na página 1de 3

ALINE DE PAULA DIAS DA SILVA

RELATÓRIO BIOINFORMÁTICA

Rio de Janeiro
2019
A aula inaugural da disciplina de Bioinformática abrangeu os conceitos básicos da
disciplina, como o histórico, campos de atuação da bioinformática e Linux, como
primeira atividade foi proposta a busca do genoma do Homo sapiens para identificar
o tamanho do genoma e número de genes nos cromossomos X e Y e também o
genoma da Escherichia coli, Drosophila melanogaster e Influenza A. Toda a busca
deveria ser feita no site do NCBI, o GenBank.

Já na segunda aula, foi apresentado o conceito de lógica, tabela-verdade, os


principais operadores lógicos, lógica de 1ª ordem e lógica de argumentação. Como
atividade foi passado um exercício com os principais operadores lógicos como
negação, conjunção, disjunção inclusiva, disjunção exclusiva e condicional, nos
quais após a resolução dos exercícios deveriam ser classificados como verdadeiros
ou falsos.

Na aula de introdução ao Linux vimos a interface da linha de comando do Linux


(CLI) e alguns comandos como o de mudança de diretório ‘cd’ e ‘ls’. Como atividade
foi proposto criar um arquivo de texto no Gedit para cada dia de aula contendo
<dia>, <disciplina> e <professor> e utilizar o comando ‘cat’ esse comando permite
que se concatene os arquivos desejados. E após foi pedido para que usássemos um
comando que contasse o número de linhas, palavras e caracteres de cada arquivo,
utilizamos o comando ‘wc’ que permite contar os caracteres, linhas e palavras e
exibe na saída padrão.

Na aula de alinhamento, vimos alguns tipos de alinhamento e a ferramenta BLAST


que consiste em um algoritmo hospedado no site do NCBI no qual compara as
informações de sequências de aminoácidos ou nucleotídeos. Existindo assim, o
BLASTn, BLASTp, BLASTx, etc. A atividade proposta foi acessar o BLAST Browser.

Recolhemos também algumas informações no site do NCBI sobre os genomas de


Haemophilus influenzae, Methanococcus jannaschii, Saccharomyces cerevisiae,
Escherichia coli, Caenorhabditis elegans, Drosophila melanogaster, Arabidopsis
thaliana, Homo sapiens, Schizosaccharomyces pombe, Oryza sativa, Mus musculus,
Pan troglodites.

Após a aula de sequenciamento, aprendemos os tipos de informação obtida e como


esses dados seriam registrados, os dados sendo gerados na forma de bases
nitrogenadas e os arquivos de sequenciamento em formatos SFF, XSQ, FASTA,
FASTAQ, SAM, BAM, UBAM. Como atividade foi proposto obter arquivos no formato
FASTA de proteínas de alguns organismos como: green fluorescent protein
[Neisseria gonorrhoeae]; protein fluorecent in blue light [Cucurbita pepo subsp. pepo]
e red fluorescent protein [Branchiostoma belcheri], concatenar esses arquivos
utilizando o comando ‘cat’ e contar o número de sequências, para isso utilizamos o
comando ‘grep-c’ que irá contar a quantidade de linhas desse arquivo. Em relação
aos arquivos de anotação, foi proposto a obtenção do arquivo GFF do cromossomo
1 de Macaca mulatta e do cromossomo X de Homo sapiens e importar os dados
para planilhas no excel.
Vimos nas aulas seguintes que anotação é um método in silico que consiste na
identificação e caracterização de regiões funcionais e pode ser do tipo automatizada
ou manual. Como atividade foi proposto acessar o KEGG (Kyoto Encyclopedia of
Genes and Genomes) que é um banco de dados que hospedam genomas, vias
metabólicas e registram interações moleculares. Nesse banco de dados, deveríamos
pesquisar por: bicicleta de Krebs, metabolismo de lipídeos de membrana e produção
aeróbica de energia.

Nas últimas aulas vimos sobre CASP (Critical Assessment of Protein Structure
Prediction) e enovelamento de proteínas e métodos como o de novo e o ab initio. A
atividade realizada consistia em acessar o PDB (Protein Data Bank) e buscar por
“Base excision repair” e identificamos 139 estruturas, 86 ligantes, sendo 53 humanas
e 72 são estruturas complexo proteína-DNA. Também procuramos pela seção
“molécula do mês” e buscamos pelo receptor de insulina para visualização de sua
estrutura 3D. Na mesma seção, procuramos pela insulina e sua estrutura 4ins, do
organismo Sus scrofa (javali), os principais autores do trabalho e sua estrutura 3D.
Como última atividade, obtivemos a sequência do gene AAF51208 (Drosophila
melanogaster) no GenBank, salvamos em formato FASTA e utilizamos o site do
SWISS-MODEL para fazer uma predição da estrutura da proteína. No site SWISS-
MODEL foi gerada uma imagem 3D através da sequência dada, utilizando assim um
método de novo.

Você também pode gostar