Universidade TecnoIgica FederaI do Paran(UTFPR), Campus CornIio Procpio - PR Laboratrio de BiotecnoIogia VegetaI, Instituto Agronmico do Paran (IAPAR), Londrina - PR EMBRAPA - Caf/IAPAR, Londrina - PR Introduo O Brasil o maior produtor mundial de caf, que proporcionou uma receita que ultrapassou US$ 5,6 bilhes de dlares em 2010. 0 Brasil tambm um grande exportadores e o segundo maior consumidor alm de possuir um dos maiores programas mundiais de pesquisas em caf. Avanos significativos da cafeicultura brasileira em anos recentes, como o crescimento da produtividade, esto relacionados a pesados investimentos em pesquisa e desenvolvimento em reas importantes como melhoramento gentico, fitotecnica, fitopatologia e mais recentemente a biotecnologia. TabeIa 1 - Receita gerada comexportaes de caf e estimativas para 2011, (http://www.cafepoint.com.br/) Hoje existem bancos de dados com mais de 200 mil sequncias de DNA, o que permitiu a identificao de mais de 30 mil genes responsveis pelos diversos mecanismos fisiolgicos de crescimento e desenvolvimento do cafeeiro. Com o desenvolvimento de programas e bancos de dados podemos realizar a tarefa no s da anlise dos dados disponveis, mas tambm na gerao de novos conhecimentos. Nosso principal foco foi desenvolver e implementar ferramentas de bioinformtica para explorar dados pblicos de caf. Em particular, comparar os dados de genes expressos no desenvolvimento de frutos e folhas, com direcionamento para potenciais usos em aplicaes biotecnolgicas. Materiais e Mtodos No computador utilizado foi instalado o sistema operacional UBUNTU 10.10. alm de aplicativos como BLAST, pgAdmin , Java Virtual Machine (JVM) e NetBeans 7.0. Figura 1 - SimboIos dos programas utiIizados, Ubuntu, Net beans, PostgreSQL/pgAdmin e Java respectivamente As sequncias usadas foram retiradas do trabalho do Mondego et al. (2011), que fez uma anlise completa de ESTs em Coffea arabica e Coffea canephora disponveis em bancos de dados pblicos. Tambm foram utilizadas as sequncias de frutos de caf com 18, 22, 30, 42 e 46 semanas obtidas pela Cornell University e Nestle AS, totalizando 64162 sequncias. Aps importar as sequncias obtidas no banco de dados, elas foram exportadas para dois arquivos texto no formato fasta, substituindo o header pelo respectivo id da sequncias, ambas as operaes, importao e exportao, foram realizadas utilizando programas Java. Depois foi rodado um BLAST entre o query contendo as sequncias de frutos e o Banco de Dados contendo os dados do trabalho do Mondego et. al. (2011). ResuItados e Discusso nicialmente foi realizada a instalao e configurao de um computador para anlise inicial de bioinformtica em dados de EST de caf. A partir de tal configurao e instalao, foi possvel iniciar a anlise dos dados descritos anteriormente. Resultando em um arquivo texto com 522,8 MB gerado da comparao entre sequncias de frutos (com 18, 22, 30, 42 e 46 semanas) e o trabalho do Mondego et. AL. (2011). Atualmente, relatrios dessa anlise desses conjuntos de dados esto sendo finalizados. Mais especificamente, a parte de interface e integrao com o banco de dados, de forma a ser uma ferramenta fcil para busca e cruzamento de informaes esto sendo finalizadas, bem como teste da ferramenta.. ConcIuses Nossa proposta foi apresentar anlise feita de dados de transcriptoma de caf. No caso foi gerado um arquivo com as sequncias de fruto de caf (18, 22, 30, 42 e 46 semanas) e outra com dados gerais em diversas condies disponvel em bancos pblicos. O princpio foi comparar, via programa BLAST, tais conjuntos para poder extrados tais informaes, importar para um Banco de Dados e torn-la disponvel para pesquisas entre todos do laboratrio ou colaboradores. Materiais e Mtodos Introduo ResuItados e Discusso ConcIuso