Você está na página 1de 11

MARIANA SANTOS SIMES

A BIOLOGIA NA ERA DA INFORMTICA

Este trabalho tem por finalidade apresentar um resumo referente ao primeiro captulo do livro Desenvolvendo bioinformtica: ferramentas de software para aplicaes em biologia com a adio de informaes extras sobre os tpicos para crdito na matria Bioinformtica, ministrada pelo Professor Luciano Bernardes.

ILHUS BAHIA, BRASIL 2011

A biologia na era da informtica Num mundo em que o conhecimento cada vez mais ultrapassa barreiras, surge, da interseco da biologia com a informtica, a bioinformtica. Essa cincia, apesar de ainda ser um tanto vanguardista, desperta o interesse de pesquisadores de reas que vo desde a lingstica at a matemtica e mostra-se muito promissora para sanar dvidas como a determinao funcional de protenas. Atualmente, j possvel, com auxlio dos conhecimentos dessa rea, o seqenciamento de genes, a sua comparao com outras sequncias de DNA e, conseqentemente, a obteno de alguns resultados de grande relevncia. Mas a bioinformtica apenas uma das ramificaes do grande campo da biologia computacional, cincia que une biologia com computao e matemtica. Dela tambm faz parte a biologia sistmica, por exemplo. Essa outra ramificao estuda as interaes entre as entidades biolgicas de um organismo, como os genes e as enzimas de um metabolismo. A biologia computacional, e em especfico a bioinformtica, mostrou ao longo dos ltimos anos um crescimento bastante expressivo e promete revolucionar o conhecimento cientfico deste sculo. Como a computao est mudando a biologia?

possvel expressar as cadeias do DNA e do RNA atravs de smbolos. Assim, faz-se a comparao de diversas sequncias entre si, a fim de notar semelhanas, sejam elas em sua forma, funes ou nas posies de bases nitrogenadas. Essa comparao foi apelidada de comparao seqencial. Uma outra ferramenta importante para a bioinformtica so os bancos de sequncias genmicas, disponibilizados na Web. Podendo ser de iniciativa pblica ou privada, esses bancos oferecem uma infinidade de informaes para serem analisadas e estudadas. Os bancos, que surgiram com o decorrer da evoluo da bioinformtica, j so largamente utilizados pelo mundo afora. Na Amaznia, por exemplo, a Embrapa, Empresa Brasileira de Pesquisa e Agropecuria, faz uso de bancos genticos para o estudo e a conservao de inmeras espcies da biodiversidade do bioma brasileiro. Atravs deles, estudos para melhorar a produtividade, aumentar a resistncia e ampliar o potencial nutricional esto sendo feitos e prometem ajudar na preservao das espcies desse local. 1. O olho da mosca O genoma da Drospophila melanogaster, mosca-das-frutas, um molde vastamente utilizado para o estudo de diversos animais. Curiosa a relao entre essa espcie e o homem. A mosca possui um gene, o eyeless, que quando eliminado culmina em mocas sem olhos. J a espcie humana possui um gene responsvel pela aniridia: surgimento de olhos sem ris. Se o gene para a aniridia for colocado em uma mosca sem olhos, ou seja, com

o gene eyeless, o inseto nascer com olhos normais. Esse caso um timo objeto de estudo para a Bioinformtica: a comparao entre as bases da sequncia gentica a chave para a sua resposta e a principal ferramenta utilizada pelos profissionais da rea. Atualmente, programas como o BLAST e o FASTA, permitem que vrias combinaes possam ser encontradas em segundos utilizando o alinhamento de sequencias 2. Rtulos nas sequncias de genes O DNA ou uma protena podem ser reduzidos a um cdigo, um rtulo que poder ser relacionado a um gene, sua protena, sua ao no metabolismo, sua funo, dentre outros aspectos. Usar o rtulo permite identificar unicamente um gente, acessar e comparar no s a sequncia de pares de base como tambm as vrias outras informaes que estaro associadas a ele. Logo, a obteno de um resultado, mesmo que este seja apenas parcial, j algo extremamente significativo. 3. Comparao do eyeless e da aniridia com o BLAST Uma comparao no BLAST, como a entre o eyeless e aniridia, mostrar os trechos e as posies de semelhana em um conjunto de trs linhas. A superior e a inferior so as dos respectivos genes e a linha do meio mostra a combinao entre elas. Um sinal de adio mostra semelhana qumica entre os aminocidos e ausncia de qualquer sinal mostra que os monmeros no se assemelham. Dessa forma, o BLAST pode mostrar no s as semelhanas, como tambm relaes no exatas e de grande importncia biolgica. Bioinformtica apenas a criao de bancos de dados?

Como o prprio nome j sugere, a bioinformtica uma ramificao da biologia. Logo, sua funo entender o funcionamento dos elementos vivos para a construo de ferramentas que ajudem nesse processo. Desse ponto de encontro entre a computao e a biologia surgem, no s as anlises sequenciais, como tambm a anlise quantitativa de populaes e modelagem metablica, por exemplo. Uma sequencia no interpretada uma sequencia desperdiada. Nesse contexto, entra o trabalho dos bioinformatas, que examinam os cdigos obtidos. Logo, a criao de bancos foi um esperto passo dos pesquisadores para a organizao das tantas informaes por eles obtidas. Os bancos nada mais so do que conseqncias da bioinformtica e no objetivos dela. 1. A primeira era da informao em biologia Os problemas com gerenciamento de informaes entre bilogos datam do sculo XVII, desde a catalogao de animais e vegetais. Com o decorrer das descobertas e das pesquisas, a grande quantidade de informao parecia no ter fim. Foi s por volta de 1830 que Linnaeus institui os

princpios da taxonomia, baseados na seguinte hierarquia crescente: espcie, gnero, famlia, ordem, classe, filo e reino. Com isto estabelecido, ficava a decidir como organizar e armazenar informaes sobre as milhes de espcies ento catalogadas do planeta. Novamente, entram os computadores com o advento de programas de taxonomia online, como o Projeto rvore da Vida, da Universidade do Arizona, e o banco de dados de Taxonomia do NCBI. O que a informtica significa para os bilogos?

Provavelmente, cada bilogo ter sua prpria concepo do que a bioinformtica. Mas todos concordam em um aspecto: a bioinformtica se encarrega da estruturao de dados. Mais especificamente, os especialistas dessa rea encarregam-se de criar ferramentas que permitam a previso da funo de um ser com base em seu genoma. Para Miguel Ortega, coordenador do Ncleo de Bioinformtica da UFMG, A bioinformtica tem uma personalidade prpria, uma cincia um pouco mais aplicada, assim como a fsica, em relao s engenharias, e a biologia, comparada medicina, afirma e acrescenta: Temos que simular, realizar experimentos, assim como nos laboratrios de biologia. E, ainda, preciso verificar os dados e provar que aquela estratgia de anlise funciona.

Que desafios a biologia oferece aos cientistas da computao?

Como toda e qualquer cincia, a bioinformtica tambm enfrenta seus prprios obstculos, dentre os quais trs se destacam. Um deles a criao de sistemas de informaes que auxiliem os bilogos a no se perderem em meio a tantas informaes e conseguirem fazer as relaes necessrias. Um outro juntar as informaes do genoma com as caractersticas bioqumicas das molculas para a obteno de modelos mais completos. Por fim, ainda h o desafio de entender como a cadeia polipeptdica se dobra, alcanando a sua estrutura final. Contudo, aos poucos esses desafios podero ser superados. Novos programas surgem, mais profissionais se interessam pela rea e, consequentemente, empresas, de iniciativa privada ou pblica, aumentam seus investimentos na rea. Um exemplo disso foi a inveno do STING Millennium Suite que j apresenta a capacidade de combinar informaes fornecidas pela Web com ferramentas de anlise estrutural, fazendo desse software uma inovao na anlise de molculas. Que habilidades deve ter um especialista em bioinformtica?

Um especialista em bioinformtica necessita ter alguns pr-requisitos para alcanar o xito nessa rea. So eles: o conhecimento de programao na linguagem adequada, experincia com pacotes de software de biologia

molecular, trabalho em ambientes computacionais com Linux ou Unix, compreenso do dogma central e formao em alguma rea biolgica. Joo Paulo Kitajima defende em seu artigo Bioinformtica: manual de utilizao que, alm desses outros pr-requisitos citados acima, um bioinformata precisa (d)a capacidade de compreender o que os usurios ou clientes necessitam para resolver os problemas. Para ele, um bioinformata precisa saber se relacionar com as pessoas e colocar-se no lugar de seu cliente, uma vez que as vezes nem eles mesmos podem saber o que esperar do resultado. Por que os bilogos usam computadores?

Os computadores so as principais ferramentas para a compreenso de qualquer sistema que possa ser explanado matematicamente. Um aspecto interessante defendido por Joo Carlos Setubal, em A origem e o sentido da bioinformtica, a similaridade da funo do computador na bioinformtica com o seu contexto de criao. Essa mquina foi criada, em meados da II Guerra Mundial pelos ingleses, no intuito de decifrar o cdigo alemo e sua principal funo na bioinformtica e decifrar a informao gentica. 1. Uma nova abordagem da coleta de dados Muitas tcnicas e artifcios surgiram ou se aprimoraram para dinamizar o trabalho dos especialistas em bioinformtica. A cristalografia por raios X, por exemplo, possibilita a obteno de um grupo de reflexes cristalogrficas proteicas em minutos, ao invs de dias. A tecnologia de microarray, por sua vez, permite o transporte de milhares de experimentos de expresso gnica simultaneamente atravs de um chip. H ainda o software de anlise automtica, onde uma estrutura protica pode ser finalizada em dias, em vez de meses. Um aspecto de talvez mais importncia ainda foi o aprimoramento da Internet. A Web permitiu o compartilhamento de dados e a transferncia de informaes de maneira revolucionria. Como configurar um PC para realizar pesquisas em bioinformtica?

essencial para as pesquisas desta rea a utilizao do Unix, um sistema operacional de computadores potentes (como servidores e estaes de trabalho). Uma outra opo, nova no mercado, o Linux, um sistema operacional Unix com o cdigo aberto. Ai est o que poderia ser um grande obstculo para o desenvolvimento da bioinformtica: a necessidade de usar Linux, num mundo dominado pela Microsoft. No entanto, analisando os dois sistemas, o Linux tambm apresenta alguns prs interessantes. Alm de ser gratuito e ter muitos de seus utilitrios no estilo freeware, sua segurana quando comparada a do Windows maior.

1. Por que usar Unix ou Linux? O Linux possibilita ao seu usurio um fcil acesso as ferramentas programadas para o Unix, o que inclui: criao e execuo de programas, trabalhos em rede, processamento de textos, dentre outros. O Linux uma opo bastante prtica, cuja eficincia melhora proporcionalmente a sua popularizao. Um obstculo para o seu bom funcionamento pode ser a existncia de uma maioria de sistemas Mac ou PC em um lugar. Que informaes e software esto disponveis?

As informaes disponveis so do mesmo tipo das pesquisadas por bilogos em livros impressos h alguns anos, porm, agora, elas esto livres em bancos da Web e podem ser processadas em programas como o BLAST e o FASTA, por exemplo. Certos programas, como esses citados, se tornaram quase padres para algum problema em especfico, enquanto que outros dilemas ainda nem sequer contam com algum programa para a sua resoluo. Programas como o Bioconductor Project e o TIGR T4 so caractersticos para anlise de sequencias, visando conseguir genes e padres especficos, como o de uma clula cancergena. possvel aprender uma linguagem de programao por conta prpria?

Ter prtica com projetos e experimentao um pr-requisito para programar um computador. Aprender uma linguagem mais cientfica no tarefa fcil, porm, tornou-se bem menos complicada com o desenvolvimento da Perl. Ela uma linguagem flexvel que comeou como uma para script e transformou-se em uma para programao. O ponto essencial para domin-la a prtica. Peter Norvig, em seu artigo Teach Yourself Programming in Ten Years (ou na traduo de Augusto Radtke Aprenda a programar em 10 anos), defende alm da essencial prtica, que o aprendiz sempre se desafie em tarefas alm de sua capacidade e corrija seus erros para uma aprendizagem mais eficaz. Como usar as informaes da Web?

Um aspecto chave para a correta e eficiente utilizao das informaes da Web saber diferenciar os dados estruturados dos desestruturados e identificar o formato que se adeqe as suas necessidades. Isso se mostrar decisivo na hora da coleta de informaes para as pesquisas. Nesse quesito uma boa pedida so os bancos de dados pblicos. Recentamente, o Google Labs inaugurou o Google Public Data Explorer, uma ferramenta para visualizao de dados pblicos armazenados pelo Google que reuniu mais de 80 pesquisas.

Como entender os dados de alinhamento de sequncia?

O primeiro passo tirar sees cruzadas e subconjuntos de conjuntos multivariados complexos. Quando armazenados de uma maneira acessvel, a prxima etapa arrancar as informaes importantes e visualiz-las. Para essa ltima parte pode ser necessrio um programa de visualizao. Dentre os programas de visualizao mais famosos e utilizados est o Phrad, que agrupa os resultados obtidos em sequencias. Ele tambm possibilita a edio bases e conta com vrios recursos. Como escrever um programa para alinhar duas sequncias biolgicas?

Um importante aspecto em um programador a sua capacidade de sempre procurar antes de fazer todo o trabalho. Dessa maneira, tempo e pacincia sero poupados. Os programadores Perl geram cdigos que reduzem as operaes em mdulos, por exemplo, e j h projetos para a criao de mdulos-padro para anlise de sequencia biolgica. O software Clustalw-MPI um dos mais populares quando se fala de mltiplo alinhamento de sequencias. O programa semi-livre destaca-se no j comentado alinhamento mltiplo, na construo de rvores guias e na definio varivel do ambiente. Como prever a estrutura protica a partir da sequencia?

Essa uma pergunta ainda sem resposta na bioinformtica. O que j existe de fato so ferramentas que auxiliem o pesquisador para ele mesmo encontrar tais respostas. Joo Carlos Setubal, em seu artigo A origem e o sentido da bioinformtica, define esse dilema como de linguagem. Ele afirma: Os genomas contm informao. Queremos saber que informao est contida neles. Que perguntas a bioinformtica pode responder?

Como qualquer outra cincia, a bioinformtica tenta relacionar suas descobertas com o cotidiano, no intuito de melhor-lo. No caso da rea biolgica, seus objetivos giram em torno da cura de doenas, na gerao de alimentos, na descoberta de novos remdios e produtos qumicos e na recuperao ambiental. Para a bioinformtica, o foco o genoma e as informaes que eles oferecem. Carlos Vogt, em Bioinformtica, genes e inovao, chega a afirmar que (...) o fato que hoje caminhamos cada vez mais forte e celeremente para explicaes materiais da vida e da complexidade de seu funcionamento. Isso que, sem dvida, est ligado descoberta do DNA e ao desenvolvimento da

biologia molecular se deve tambm aos resultados cada vez mais sofisticados das tecnologias da informao e, em particular, nesse caso, bioinformtica. Vrias questes s puderam ser esclarecidas, indireta ou diretamente, depois que os conhecimentos da bioinformtica puderam estudar o sequenciamento de genes. Essa cincia pode no ser considerada a profisso do futuro, mas ainda muito tem para ser explorada.

Referncias Bibliogrficas

A biologia na era da informtica GIBAS, Cynthia e JAMBECK, Per. Desenvolvendo bioinformtica: ferramentas de software para aplicaes em biologia. Rio de Janeiro, 2011 [Acadmico - Biologia Computacional], disponvel em <HTTP:// www.academicoo.com/biologia-computacional/>, acessado dia 10 de maro de 2011 Como a computao est mudando a biologia?

REGINA, Sglia. Bancos genticos ajudam a conservar a Amaznia. 19 de janeiro de 2011. Disponvel em: www.agenciaamazonia.com.br/index.php?option=com_content&view=article &id=836:bancos-geneticos-ajudam-a-conservar-aamazonia&catid=1:noticias&Itemid=704 Bioinformtica apenas a criao de bancos de dados?

ALMEIDA, Karina. Mineiros estudam o parasita da esquistossomose. Revista Minas faz cincia de junho de 2003, volume 15. Disponvel em: <HTTP://www.revista.fapemig.br/materia.php?id=66>, acessado dia 10 de maro de 2011 O que a bioinformtica significa para os bilogos?

ALMEIDA, Karina. Mineiros estudam o parasita da esquistossomose. Revista Minas faz cincia de junho de 2003, volume 15. Disponvel em: <HTTP://www.revista.fapemig.br/materia.php?id=66>, acessado dia 10 de maro de 2011 Que desafios a biologia oferece aos cientistas da computao?

FALCO, Paula Kuser; YAMAGISHI, Michel; HIGA, Roberto; NESHICH, Goram. Sting Millennium Suite: ferramentas para anlise estrutural de protenas. 2003. Disponvel em: <HTTP://www.comciencia.br/reportagens/bioinformatica/bio16.shtml>, acessado dia 10 de maro de 2011 Que habilidades deve ter um especialista em bioinformtica?

KITAJIMA, Joo Paulo. Bioinformtica: manual de utilizao. 2003. Disponvel em: <HTTP://www.comciencia.br/reportagens/bioinformatica/bio12.shtml>, acessado dia 10 de maro de 2011

Por que os bilogos usam computadores?

SETUBAL, Joo Carlos. A origem e o sentido da bioinformtica. 2003. Disponvel em: <HTTP:// www.comciencia.br/reportagens/bioinformatica/bio10.shtml>, acessado dia 10 de maro de 2011 Como configurar um PC para realizar pesquisas em bioinformtica?

ROCHA, Helbert. Linux VS Windows: saiba suas diferenas. 12 de fevereiro de 2010. Disponvel em: <HTTP://www.meupinguim.com/linux-vswindows-suas-diferencas/>, acessado dia 10 de maro de 2010 Que informaes e software esto disponveis?

PIOLLI, Alessandro. Software para bioinformtica ganha o mundo. 2003. Disponvel em: <HTTP:// www.comciencia.br/reportagens/bioinformatica/bio03.shtml>, acessado dia 10 de maro de 2011 possvel aprender uma linguagem de programao por conta prpria?

NORVIG, Peter. Aprenda a programar em dez anos. 2001. Traduo por Augusto Radtke. Disponvel em: <HTTP://www.pihisall.wordpress.com/2007/03/15/aprenda-a-programar-emdez-anos/>, acessado dia 10 de maro de 2011 Como usar as informaes da Web?

NOW!, Redao IDG. Servio que mostra dados pblicos em forma grfica estria no Google Labs. 08 de maro de 2010. Disponvel em: <HTTP://www.idgnow.uol.com.br/internet/2010/03/08/servico-que-mostradados-publicos-em-forma-grafica-estreia-no-google-labs/>, acessado dia 10 de maro de 2011 Como entender os dados de alinhamento de sequencia?

[NUGEN Ncleo de Genmica e Bioinformtica], disponvel em: <http://nugen.uece.br/?p=links>, acessado dia 10 de maro de 2011 Como escrever um programa para alinhar duas sequencias biolgicas?

SILVA, Jos Cleydson Ferreira da. Bioinformtica - Clustalw-MPI: Anlise Filogentica utilizando computao paralela e distribuda. 09 de julho de 2010. Disponvel em: <HTTP://www.vivaolinux.com.br/artigos/impressora.php?codigo=11702>, acessado em 10 de maro de 2011

Como prever a estrutura protica a partir da sequencia?

SETUBAL, Joo Carlos. A origem e o sentido da bioinformtica. 2003. Disponvel em: <HTTP: www.comciencia.br/reportagens/bioinformatica/bio10.shtml>, acessado dia 10 de maro de 2011 Que perguntas a bioinformtica pode responder?

VOGT, Carlos. Bioinformtica, genes e inovao. 2003. Disponvel em: <HTTP://www.comciencia.br/reportagens/bioinformatica/bio01.shtml>, acessado dia 10 de maro de 2011