CONTRIBUIÇÕES DO USO DE DATA WAREHOUSE PARA O ARMAZENAMENTO DE DADOS EM BIOINFORMÁTICA Luiz Fernando Pico o IFMS – Instituto Federal de Mato

Grosso do Sul Nova Andradina – MS, Brasil luizpicolo@luizpicolo.com.br RESUMO Com o aumento das in orma!"es provenientes das #reas biol$%icas, a Biolo%ia e a in orm#tica encontraram um ponto em comum, ori%inando assim, a Bioin orm#tica. &ste novo ramo da ci'ncia tem como ob(etivo utilizar o poder computacional para or%anizar e estruturar os dados de orma compreens)vel. Neste sentido, as tecnolo%ias computacionais s*o utilizadas para acilitar o processo de consulta, cruzamentos e a%re%a!"es de dados. &ste arti%o, buscou+se demonstrar os Data Warehouses e suas contribui!"es para o armazenamento de dados em Bioin orm#tica, por serem uma lon%a s,rie de vis"es de dados tiradas ao lon%o do tempo, proporcionando aos pes-uisadores in orma!"es por meio da correla!*o entre os dados. Pa a!ra" c#a!e$ Bioin orm#tica, Data Warehouse, Banco de .ados. %& INTRODUÇ'O Na sociedade contempor/nea a tecnolo%ia n*o , al%o distante ou somente acess)vel aos %randes pensadores cient) icos ou empresas, ela est# presente nos a azeres comuns de todos. A utiliza!*o do celular, a televis*o, ou o simples ato de se consultar a internet, nada mas s*o do -ue e0emplos do crescimento tecnol$%ico -ue se vive nos tempos atuais. Assim, a tecnolo%ia %erou mudan!as -ue oram incorporadas e s*o utilizadas de orma -uase transparente pela sociedade. 1ara Mattar Neto 234456, outro ato -ue merece aten!*o, e -ue so reu mudan!as devido a computa!*o, s*o os conceitos relacionados ao ac7mulo de in orma!"es. 1ara o autor, acumular in orma!"es n*o deve ser compreendido como sinal de sabedoria, pois na era da in orm#tica, todas as in orma!"es s*o armazenadas, disponibilizadas e transmitidas por poderosos bancos de dados, os -uais azem parte deste cabedal tecnol$%ico da contemporaneidade vi%ente. 1ara ele, a 8abilidade de estabelecer cone0"es entre as in orma!"es , o ato primordial para a %era!*o de in orma!"es relevantes sobre o tema -ue , pes-uisado. Neste sentido, como a irma Mattar Neto 234456, a in orm#tica caracteriza+se como um nova tecnolo%ia intelectual -ue potencializa n*o apenas a mem$ria, mas tamb,m di erentes ormas de racioc)nio e perspectivas sobre a in orma!*o. 9o%o, tratar in orma!"es e

8# est# similaridade com os conceitos de Mattar Neto 234456. a Bioin orm#tica. 9o%o. posteriormente. absorve todos estes conceitos apresentados por Mattar Neto 234456. a Bioin orm#tica busca utilizar o poder computacional para armazenar e trata as in orma!"es obtendo assim novos e relevantes in orma!"es. mas sim uma erramenta -ue amplia as possibilidades e au0ilia no cruzamento de in orma!"es e tomada de decis"es.m de tratar as memas com e-uipamentos de alta precis*o. de n*o ser somente uma orma de armazena%em. com o avan!o de ambas as partes. analisadas. como erramenta computacional. <al ci'ncia. ou se(a. este arti%o tem como ob(etivo demostrar um dos principais es or!os computacionais para sanar al%uns destes problemas relacionados ao armazenamento e ao tratamento das in orma!"es.. torna+se claro -ue a biolo%ia.3 n*o somente acumul#+las tornou+se a orma mais e icaz de se obter resultados satis at$rios. . Se%undo :oc8a 234. nos dias atuais. &st# nova ci'ncia -ue seria criada. e an#lo%a as ideias de Mattar Neto 234456. 1ortanto. tratadas e. necessitam ser armazenadas.m est*o incorporadas a tecnolo%ia e ao tratamento de seus dados e a %era!*o de in orma!"es relevantes. um campo de pes-uisa -ue est# em r#pido crescimento sendo desenvolvida para atender as necessidades da manipula!*o de %randes volumes de . como no caso das pes-uisas %en?micas. Se%undo @ueiroz 234. Neste sentido. ambas ci'ncias encontraram entre si um ponto em comum. mas tamb. as ci'ncias biol$%icas tamb. criada em meados dos anos =4. >m Data Warehouse. 1or este motivo.6.entro deste conte0to. visto -ue. a tecnolo%ia dos Data Warehouses apresenta uma alternativa para o tratamento das in orma!"es em Bioin orm#tica. Como na sociedade. (& RE)IS'O TE*RICA Ao adentrar a teoria -ue embasa os meios pelos -uais a in orm#tica se li%a as pes-uisas biol$%icas. este ramo da ci'ncia . oi c8amada de Bioin orm#tica. com o avan!o da biolo%ia e da in orm#tica. toda in orma!*o produzida. sur%ia a partir da necessidade da biolo%ia de n*o apenas armazenar as in orma!"es %eradas. para uma compreens*o mais minuciosa. tratar+se+# especi icadamente sobre os Data Warehouses e suas contribui!"es para o armazenamento de in orma!"es em Bioin orm#tica. sur%e um ponto em comum -ue une as duas ci'ncias ori%inalizando um novo ramo de pes-uisa. sendo -ue.36. A Bioin orm#tica pode ser compreendida como uma #rea multidisciplinar. seria imposs)vel sem os recursos -ue a computa!*o proporciona.

ori%inam+se a partir dos es or!os individuais de v#rios pes-uisadores. P8ttpBQQSSS.tica. 34. na -u)mica. Cutro ato interessante -ue imp"e o uso de erramentas computacionais . em Naneiro de 34.tica. Cutro e0emplo deste crescimento absurdo de dados %en?micos . podem crescer na ordem de um petabyte por ano.nlm.m cerca de A4 mil %enes. a se-u'ncia completa de um indiv)duo tem cerca de A bil8"es de bancos de .. 4. >m e0emplo. 3 A C %enoma 2con(unto de %enes de uma esp.ac..ni8.ticos e bio-u)micos. 456 e0p"em -ueB o %rande volume de in orma!*o %erado pelos pro(etos de an#lise de . ou se(a. passou a conter -uase . Da Bioin orm#tica EFG tem como ob(etivo desenvolver e aplicar t.san%er.sc. 4A6.3 Centro de 1es-uisa e de se-uenciamento de . a %rande escala de dados ori%inados das pes-uisas realizadas por meio do pro(eto %enoma .ispon)vel emB P8ttpBQQeducar.NA brit/nico.NA publicamente dispon)veis. varia!*o e de aspectos relacionados O descend'ncia..ispon)veis emB P8ttpBQQSSS. Acessado emB 34 .A4 bil8"es.A dados %en. .uTQR GenBanT . No Sanger Center3 (# e0istem al%umas dezenas de terabytes armazenados com uma estimativa de crescimento.8tmlR. Acessado emB 45 . distribui!*o.cnicas computacionais no estudo da %en. os -uais. ci'ncia da computa!*o. an#lise e interpreta!*o das in orma!"es.==4.ncbi. e -ue. e conse-uentemente con irma!*o deste ato. Feli0 et al 23443.5 bil8"es de dados e. Com o in)cio deste pro(eto em . oi a publica!*o do %enoma 8umano o -ual cont. o volume de in orma!"es derivadas do con8ecimento %en?mico tornou+se e0ponencialmente crescente. Neste sentido.Q%enomaQ%enoma.ez 34. Assim. entre outros. se%undo 9i c8itz 2344L6. na biolo%ia. da biolo%ia molecular e da bio-u)micaH 2II&CJC:&K e 9&A9. Sua abran%'ncia se az em diversos aspectos e em v#rios campos cient) icos comoB na )sica..brQlicenciaturaQ344.6 buscando a compreens*o e a rela!*o das diversas in orma!"es racionadas e oriundas destas diversas #reas biol$%icas.usp.ez 34. Com taman8a -uantidade de in orma!"es necessitou+se de erramentas computacionais -ue pudessem sistematicamente armazenar tal -uantidade de dados para -ue os mesmos se tornassem ontes de estudos.3 . p. se%uindo assim em ritmo de crescimento constante. 8eran!a. or%anizar e estruturar estas in orma!"es em uma entidade compreensiva e e0tremamente importante para a biolo%iaH 2:CCMA. armazenamento. -ue . p.%ovQ%enbanTQR.cie6 est# contido na #rea da ci'ncia denominada %en. o GenBank3 o -ual armazenava -uase . Da Bioin orm#tica usa o poder computacional para catalo%ar.NA. .. respons#vel pelo estudo da reprodu!*o. EFG uma cole!*o anotada de todas as se-u'ncias de . processamento. 1ortanto. 344L. Cutra caracter)stica da Bioin orm#tica de ine+se por ser uma modalidade -ue envolve aspectos de a-uisi!*o. p.

rico direcionado O acilitar o processo de de inir. 4A6 Bancos de dados. a de ser estruturado para determinado im. 9o%o. ou se(a. a a irma!*o de 9i sc8itz 2344L6 neste ponto entra em concord/ncia com a de <aTi. Italiano e Ferreira 234456 com o tempo. 4A6 a irma -ueB um sistema de banco de dados . os dados e erramentas de an#lise. devem ser implementados. &sses incluem os pr$prios dados.s passaram a utilizar di erentes ormas de representa!*o ou modelos U 5 1ara maiores in orma!"es visiteB 8ttpBQQSSS. Ao contr#rio da proposta eita para os bancos de dados. o 8ardSare do sistema.m incluir o ciclo de vida de um banco de dados..ados ou 2SGB. s*o a cole!*o de dados lo%icamente relacionados -ue cont. 456 por meio de uma inter ace de alto n)vel. p.3 .brQposbioin oQcv34. o -ual inclui todos os componentes -ue s*o envolvidos na or%aniza!*o dos recursos.o in%l's. -ue disponibilizem. a m)dia de armazenamento e os aplicativos -ue acessam e atualizam os dados. bancos de dados.m al%um si%ni icado. -ue os bancos de dados representam aspectos do mundo real.esta orma.m dos so tSares. I<A9IANC & F&::&I:A. 9i sc8itz 2344L.U transcriptomasU tem tornado cada vez mais comple0o o armazenamento e a an#lise dos dados.ime. encontrar a mel8or orma de armazenamento e de pes-uisa 2S@956 para os dados %erados. de modo con i#vel. . 1ara contornar tal di iculdade. apoiando+se na a irma!*o acima. construir e manipular bancos de dados de diversas aplica!"es. os SGB. o desa io apresentado pela Bioin orm#tica . Cutra caracter)stica apontada pelos autores .Qeduardoreis. parte importante da or%aniza!*o de um sistema de in orma!*o. o SG. e toda altera!*o no Dm)ni mundoH provoca altera!*o em sua base de dados. Italiano & Ferreira 234456. 2F&9IV. %erando assim.pd Acessado emB 34 . elas s*o estruturas constru)das e posteriormente preenc8idas para um prop$sito espec) ico. . se%undo <aTai.. Italiano e Ferreira 234456. EFG parte de um sistema de in orma!*o. ou se(a. p. 3445. N# os DSistemas Gerenciadores de banco de .usp. o Dm)ni mundoH.ez 34.s6 s*o uma cole!*o de pro%ramas -ue permitem aos usu#rios criarem e manipularem um banco de dadosH 2<AKAI. em -ue ambos os autores atribuem aos bancos de dados a import/ncia na or%aniza!*o e na posterior utiliza!*o dos dados. Structured @uerW 9an%ua%e ou 9in%ua%em de Consulta &struturada. o so tSare do SGB. p. o ciclo de vida um sistema de in orma!*o deve tamb. ou como os pr$prios dizem. Se%undo <aTai. 29IFSCMI<J. p. 1or isto. 456 Nustamente neste ponto. Al. 3443. bene )cios para o ob(etivo -ue o mesmo oi criado. 344L.s6 -ue possam suportar taman8a %randeza de in orma!"es. pode+se irmar -ue 8# a prem'ncia de bancos de dados robustos e sistemas %erenciadores de bancos de dados 2SGB. o sistema de banco de dados .B tem prop$sito mais %en.

A se%unda etapa se deu a leitura do material e o ic8amento do mesmo. Ap$s o ic8amento se ez a or%aniza!*o l$%ica dos assunto. permitindo ao investi%ador a cobertura de uma %ama de en?menos maior -ue o mesmo poderia pes-uisar diretamente.5 de dados para descrever a estrutura das in orma!"es contidas em seus bancos de dados. oi a busca de ontes re erentes ao tema proposto. &m primeiro momento oi eita a aborda%em dos estudos re erentes a Bioin orm#tica e banco de dados.ata Iare8ouses para atender os re-uisitos da Bioin orm#tica. A 7ltima etapa oi o relacionamento de todas as ideias e a cria!*o deste arti%o. -& METODOLO. em particular.m. realizou+se a busca de te0tos sobre os conceitos de Data Warehouses e como os mesmos estavam sendo utilizados e estruturados para o armazenamento dos dados. A maioria das pes-uisas s*o realizadas com base principalmente em materiais obtidos em ontes biblio%r# icas.46.ETI)OS C presente arti%o apresenta os resultados de uma pes-uisa -ue teve como ob(etivo principal compreender o uso dos Data Warehouses para o armazenamento das in orma!"es provenientes da Bioin orm#tica atentando assim Os discuss"es relacionadas aos aspectos deste ramo cient) ico e. o ob(etivo de se pro(etar um banco de dados . . oram de inidos al%uns ob(etivos espec) icosB Compreender os relevantes -ue azem a cone0*o entre a ci'ncia biol$%ica e a computa!*oX .IA A metodolo%ia. para o au0)lio do mesmo para uturas tomadas de decis"es e cone0*o entre in orma!"es. Assim. acomodar in orma!"es para -ue usu#rios em potencial possam usu ruir dos dados -ue o mesmo cont.emostrar a contribui!*o dos Data Warehouses para a tomada de decis"es em Bioin orm#ticaX . de orma #%il e ob(etiva. a -ual oi divida em duas sub+etapas. adotada para a elabora!*o deste arti%o oi constitu)da da pes-uisa biblio%r# ica. buscando a rela!*o entre estas duas lin8as de pes-uisa. A primeira etapa. toda pes-uisa acad'mica re-uer em determinados momentos a realiza!*o do trabal8o caracterizado como pes-uisa biblio%r# ica. com base nos conceitos de Gil 234. Se%undo o autor. +& OB. 9o%o ap$s.escobrir como est*o sendo estruturados os . 1ara a mel8or compreens*o do ob(etivo %eral.

. 2006. n*o ser*o eitas dentro de laborat$rios biol$%icos. n7meros simples. conse-uentemente. a compara!*o e o armazenamento. ou dados %en. como dados multim)dia. de %randes cadeias de caracteres se torna di )cil de ser e0ecutada. mas em plata ormas computacionais de alto desempen8o. n*o por ser somente um ato. &ntretanto. Figura 1: Etapas realizadas para armazenar um segmento (sucessão de genes) de DNA em um banco de dados. bancos de dados para pes-uisar os dados. todos os %enes ser*o encontrados. se%undo IieczoreT e 9eal 2344L6. Neste sentido. car#ter ou datas.ticos 2sucess*o de %enes6. como a descoberta de doen!as 8eredit#rias ou a cura de males (# e0istentes por e0emplo. muitos dos desenvolvimentos paralelos a estas descobertas. como pode ser visualizado na Fi%ura . com sistemas de armazenamento em massa -ue conter*o os dados %en?micos. (WIECZOREK e LEAL. dados espaciais. as -uais acarretar*o mudan!as beni%nas na #rea da medicina. -ue bancos de dados. mas um tend'ncia com o volume de dados %erados. a busca. te0to.. p. as -uais s*oB tecnolo%ias de Warehousing6 para dados L C termo Warehousing n*o possui tradu!*o ade-uada para o portu%u's. identi icando semel8an!as e padr"es. bem como a inte%ra!*o so tSare para a uni ica!*o das atias de con8ecimento desenvolvidas nas diversas institui!"es.L /& DISCUSS'O DOS RESULTADOS >m problema a ser superado ao se tratar sobre banco de dados para Bioin orm#tica . t'm sido em %rande parte usados para administrar dados empresariais. &0istem -uatro tecnolo%ias -ue tendem a resolver os problemas re erentes a armazenamento de dados biol$%icos. 04) Baner(ee 234446 relata em suas e0plana!"es sobre plata ormas de banco de dados para Bioin orm#tica -ue. 1oucos bancos de dados tiveram uma 8abilidade nativa para lidar com dados comple0os.

cnica utilizada para recupera!*o e inte%ra!*o de dados a partir de ontes distribu)das. Se%undo <aTai. para este arti%o.rie de vis"es do banco de dados. tiradas ao lon%o do tempoH 2<AKAI. como a pr$pria denomina!*o in orma. e tecnolo%ias de portal de Internet -ue possam permitir a publica!*o das in orma!"es de pes-uisas. cruzamentos e a%re%a!"es de dadosX • Ser le0)vel para suportar %randes mudan!as e -uantidade de in orma!*oX dentre rocessing ou processamento anal)tico online6 e outrasX • &star dispon)vel para o acesso para -ue os usu#rios possam intera%ir com os dados de orma r#pida e ob(etivaX .+ de inidas. 9o%o. Neste sentido.ticosX a ar-uitetura de e0tensibilidade para armazenamento de dados nativamente e e0ecu!*o de estruturas de procuraX tecnolo%ias de inte%ra!*o de dados para 8abilitar -uest"es 8etero%'neas por ontes biol$%icas distribu)das.m dados 8ist$ricos de anos. Sendo -ue. para todos os prop$sitos pr#ticos. 3445. >m Data Warehouse sumaria os dados -ue s*o or%anizados em dimens"es. N# um Data Warehouse armazena dados para an#lise e tomada de decis*o. Cs dados contidos em um Data Warehouse s*o or%anizados e armazenados com a perspectiva de lon%o prazo. 8etero%'neas. Z=6. armazena dados das transa!"es di#rias nas -uais s*o e0ecutadas opera!"es pr. Isso pode envolver consultas -ue variam em sua comple0idade. Italiano e Ferreira 234456 um Warehousing pode ser de inido como uma t. 1or este motivo os dados podem so rer mudan!as. &stes dados s*o armazenados em um %rande dep$sito c8amado de Data Warehouse. I<A9IANC & F&::&I:A. pois o mesmo cont. 1ara Bon%iolo 2344L6 uma di erencial -ue se destaca entre um Data Warehouse e um banco de dados transacional est# no ato de -ue o se%undo.esta orma.ticos. pode+se a irmar -ue Dos dados armazenados no Data Warehouse s*o. possivelmente. disponibilizando+os para consultas e an#lises por meio de aplica!"es C9A1 2On-Line Analytical sistemas de suporte O decis*o. aut?nomas e. uma lon%a s. os Data Warehouses proporcionam tanto # Bioin orm#tica como para empresas. visando desta orma a .Y em padr"es %en. se ocar# apenas nas tecnolo%ias de Warehousing para dados em padr"es %en. uma base concreta de a%re%a!*o de dados para uturas an#lises. al%umas caracter)sticas necess#rias para este ambiente de armazenamentos s*oB • Inte%ra!*o de dados de m7ltiplas ontesX • Facilitar o processo de consulta. p.

p. n*o s*o materializados. Seibel 234446 prop"e uma complementa!*o * aborda%em do Data Warehouse. oriundas de diversas localidades e banco de dados di erentes. como . 1or.m com rela!*o O atualiza!*o das inst/ncias de dados 2os pes-uisadores precisam ter acesso aos dados mais recentes6. ontes de dados cient) icos. 4U6. mesmo sendo bem aceita est# aborda%em para o tratamento dos problemas da inte%ra!*o de dados vindouros de ontes de dados distribu)das e 8etero%'neas. Se%undo Critc8loS 234446. a -ual pode ser visualizada na Fi%ura 3" >ma ar-uitetura baseada na aborda%em !rapper-#e$ia$or di ere undamentalmente da aborda%em Data Warehouse pelo ato de -ue os dados. estas aborda%ens podem ser complementares pois o mediador pode ser usado como onte de dados para a implementa!*o do Data Warehouse 2S&IB&9. uma das camadas presentes em um Data Warehouse s*o os Wrappers. 9o%o. Seibel 234446 aponta -ue est# orma de inte%ra!*o tamb. e outra s*o os (e$iators 2Mediadores6 -ue o erecem o acoplamento entre provedores e consumidores de dados por envio de servi!os -ue tratam a -uest*o sem/ntica e sinta0e entre os ob(etos dos sistemas locais. 9o%o. Ao contr#rio de aplica!"es comerciais. Sempre -ue uma onte de dados muda suas in orma!"es. em sua %rande maioria.U6.==L o La!rence Li%er#ore &ational Laboratory deu inicio ao pro(eto Data'oun$ry para a cria!*o de um Data Warehouse para o armazenamentos de dados %en?micos. a inte%ra!*o de dados proporcionada por um Data !arehouse uma in ra estrutura -ue permite criar e manter uma vis*o consistente de v#rias ontes de dados aut?nomas. &m . &ntretanto. na primeira. para sanar este problema. p. baseando+se na a irma!*o (# citada. os Wrappers e os (e$iators. permitindo manipular esses recursos por meio de uma lin%ua%em de alto n)vel. . s*o e0tremamente din/micas e. 3444.Z realiza!*o de compara!"es e pes-uisas nas in orma!"es contidas. os -uais permitem Do acesso Os ontes de dados distribu)das e 8etero%'neas e promovem a trans orma!*o entre o modelo de dados da onte e o modelo de dados internoH 2C[CC. 3445.m n*o atende O inte%ra!*o de in orma!"es biol$%icas com rela!*o O atualiza!*o dos es-uemas e tamb. &ste sistema ornece uma vis*o uni orme dos recursos -ue est*o dispon)veis para usu#rios. Como as in orma!"es provenientes da Bioin orm#tica n*o s*o oriundas apenas de uma onte e sim de uma a%lomera!*o de dados vindouros de laborat$rios biol$%icos espal8ados em v#rios centros universit#rios e laborat$rios de pes-uisa. dando en ase a dados %en?micos.m. para a cria!*o de um Data Warehouse deve+se criar uma estrutura com alto %rau de le0ibilidade para lidar com a natureza din/mica do dom)nio. Cutra caracter)stica b#sica est# na sua inte%ra!*o de dados.

mesmo inte%rando v#rias ontes de dados -ue so ram mudan!as constantemente.G dados de orma distribu)da tem seus problemas e limita!"es.. como oi a irmado por Baner(ee 234446. Cutro ato -ue (usti ica a utiliza!*o dos Data Warehouse .m dos v#rios problemas e solu!"es (# citados. 08) IieczoreT e 9eal 2344L6 e0p"e -ue. como restri!"es de recursos do servidor remoto. -ueB consultar E. com as car%as e recar%as eitas em um Data Warehouse.G pela rede... al. devem ser atualizados para -ue estas modi ica!"es se(am espel8adas no Data Warehouse" Figura 2: Arquitetura de um Data Warehouse. uma tend'ncia para o armazenamento de dados oriundos das pes-uisas %en?micas. preocupa!*o com a se%uran!a dos dados E. Contudo. C Data Warehouse. (CRITCHLOW et al . al. 2000. p. v#rios pes-uisadores se debru!am sobre o assunto para criar solu!"es para tal situa!*o.m da lo%)stica inerente a . nada mais plaus)vel -ue. ainda 8# %randes desa ios para a introdu!*o desta aborda%em. p. . pois deve+se manter um Data Warehouse e0tremamente uncional. Z56. pois os dados %erados n*o s*o armazenados apenas em um banco de dados.= mostra a Fi%ura 3. 344L. os pes-uisadores precisam de uma orma #cil e intuitiva de acessar todos estes dadosH 2BCNGIC9C. DCom a proli era!*o destes bancos de dados p7blicos -ue tem sido observado nos 7ltimos anos. 9o%o.. mas espal8ados em diversas institui!"es de pes-uisas espal8adas pelo mundo. todos os laborat$rios de pes-uisas possam ter em m*os uma c$pia das in orma!"es para -ue os mesmos possam realizar suas pes-uisas mediante aos dados coletados. baseando+ se nestas in orma!"es.

3. uma consulta pode ser al8a devido a est# circunst/ncia. pode+se incluir a possibilidade de erros ao se retornar certa -uantidade de dados. s*o constru)dos para -ue tais dados se(am armazenados e acessados de orma a n*o serem limitados por tabelas e lin8as estritamente relacionais.pd R Acessado emB 45 . al.m de re-uerer -ue consultas comple0as inte%rem dados 8etero%'neos de ontes distintas. A Da3a4a"e P a35or6 5or Bioin5or6a3ic". sendo -ue. al. uma pes-uisa -ue volte a vis*o para o Brasil. por meio deste cruzamentos de dados . -ue se obt'm resultados -ue levar*o os pes-uisadores a descobertas para cura de doen!as e preven!*o de males 8eredit#rios. o maior interesse em utilizar os Data Warehouses est# tamb. p. se%undo Bon%iolo 2344L6. Assim um .ispon)vel emB P8ttpBQQSSS. Sandeepan. Num ambiente assim. como est*o sendo utilizados os bancos de dados para o armazenamento das in orma!"es provenientes das pes-uisas eitas no Brasil. seria de %rande import/ncia para uturas discuss"es sobre o assunto.B]Bioin ormatics. Como os dados est*o distribu)dos em servidores remotos. 344L. pois os mesmos. uma erramenta importante para a Bioin orm#tica. permitindo cruzamentos e a%re%a!"es. os mesmos convertem e limpam seus dados e implementam erramentas -ue acilitam a nave%a!*o pelos mesmos. 1ara trabal8os uturos pode+se mencionar.m de inte%rar v#rios bancos 8etero%'neos. 2BCNGIC9C..%randpoo8ba8. na lin8a de pes-uisa sobre banco de dados. an#lises e cruzamentos entre v#rias in orma!"es.4 consulta de bancos distribu)dos.netQSandeepanQ\9. pois. Assim.m da limita!*o citada. Cutro adendo .m no ato -ue. . 0& CONSIDERAÇÕES FINAIS &ste arti%o procurou evidenciar como os Data Warehouses contribuem para o armazenamento e a pes-uisa dos dados em Bioin orm#tica. consultas distribu)das -ue %erem um %rande volume de dados s*o di )ceis de processar. 1& REFER2NCIAS BAN&:N&&.ata Iare8ouse . . -ue. as -uais s*o t*o importantes para as pes-uisas biol$%icas. Com est# erramenta tecnol$%ica. este arti%o. :edSood S8ores. Z56 Al. buscou demostrar um panorama %eral. os pes-uisadores podem azer compara!"es.ez 34. 3444. a disponibilidade dos mesmos n*o pode ser %arantida e. Cracle Corporation.

. . 344L..]ZL. @>&I:CJ. Ale0andre.o de 8e""oa" 8ara o" a4ora3<rio" de 8e"=ui"a. &d. MA<<A: N&<C. :io Grande do NorteB >F:N.uarte.. S*o 1auloB Atlas. A8o"3i a de In3roduC.o de Fon3e" de Dado" e A8 icaCEe" de Bio o:ia Mo ecu ar.ez 34. C)cero 1in8o.ispon)vel emB P8ttpBQQSSS. <AKAI.:>MMCN.3 C[CC. 9uiz Fernando Bessa.u es.. F&9IV..X N>NIC:. I68 e6en3ando >ra88er" ?6 e re aciona 8ara o Codi6"& 3445..A. :enato At)lio.3.natalnet.ez 34. :CCMA.ispon)vel emB P tpBQQSSS..pd R Acessado emB .`tWpe_pd R Acessado emB 34 .=A=`rep_rep. An7 i"e 8anor96ica da Bioin5or673ica no Bra"i $ Pro8o"3a da :e"3.ispon)vel emB P8ttpBQQcodims. .. No*o &duardo. Isabel Cristina.ispon)vel emB P8ttpBQQipe. Marcelo. 344L.brQ. Bio+AVSB U6a Ar=ui3e3ura 8ara In3e:raC. 3445.. ..usp.3. &duardo. &lis/n%ela.brQpubQdocsQt8esesQ43]18. . S.3.]seibel.BGQmaterialb34cursob34bioin oQ9eitura b34ComplementarQarti%osQCamin8osb34eb34<endb&Anciasb34dob34usob34de b34Bancob34de34. II&CJC:&K.in . <erence.brQsbc344LQpd Qar-43Y. 3. <atiana Mara.X S9&JAK. >&S1I. Nuliana de Maria.brQ%en isQinde0. :on. <om.4. S*o 1auloB >S1.X M&NCSSI.ez 34. C:I<CM9CI. \icente &u%enio de :osa.pd R Acessado emB . 1>C+:io.p8p^ option_com]p8ocadoSnload`vieS_cate%orW`doSnload_.lprm.3.U .tica.eduQvieSdocQdoSnload^doi_.unesc. 3443. An O!er!ie> o5 Bioin5or6a3ic" Re"earc# a3 La>rence Li!er6ore Na3iona La4ora3or@& 3444.com.pd R Acessado emB 4A . S*o 1auloB Saraiva.ez 34. 344L.X 9&A9. In3roduC.X I<A9IANC..X F&::&I:A.pd R Acessado emB 4= .puc+ rio. . ed.3.bib.ime. S&IB&9.ispon)vel emB P tpBQQ tp.4. Me3odo o:ia Cien3B5ica na Era da In5or673ica.ez 34. 3445. Ant?nio Carlos.AA.netQbibliotecaQsumarioQ44443&Q44443&AZ.4 .ez 34. .pd R Acessado emB . . BANCO DE DADOS EM BIONINFORMÁTICA.ispon)vel emB P8ttpBQQ%en isU4. &milio Mario. No*o Au%usto.ispon)vel emB P8ttpBQQciteseer0. GI9.cbme%. . 34.=U5U=U4.3. Ca6in#o" e TendFncia" do u"o de Bando de Dado" e6 Bioin5or673ica& C&>91. . .pd R Acessado emB . . A :u6a" Pe"=ui"a" e6 Banco" de Dado" e Bioin5or673ica..in .X A::>.ispon)vel emB P8ttpBQQarti%ocienti ico.unicamp.X M>SICK.usp. . 9IFSCMI<J.X NCG>&I:A.ispon)vel emB P8ttpBQQSSS.ist. BCNGIC9C. Co6o e a4orar 8roAe3o" de 8e"=ui"a& 5.ez 34.pd R Acessado emB 34 ..o a Banco de Dado".brQpublicacoesQMono%ra ia]<atiana.ez 34.brQa(e Qapostila.3.psu. .4Bintroducao+a+ bioin ormatica`id_YBapostilas+e+arti%os`Itemid_LZR Acessado emB .uol.esal-.ez 34.X .ez 34.o D Bioin5or673ica.brQuploadsQartc].3.u v.adosb34emb34Bioin ormb&.pd R Acessado emB 4. Crici7ma. F#bio <ebaldi Silveira. 34. Csvaldo Kotaro.eno6a Funciona & 3443. NC:G&.Y .brQca eQpubQ eli0+% . :odri%o .ispon)vel emB P8ttpBQQSSS.4 .r%io.3. 1aulo.

Sign up to vote on this title
UsefulNot useful