CONTRIBUIÇÕES DO USO DE DATA WAREHOUSE PARA O ARMAZENAMENTO DE DADOS EM BIOINFORMÁTICA Luiz Fernando Pico o IFMS – Instituto Federal de Mato

Grosso do Sul Nova Andradina – MS, Brasil luizpicolo@luizpicolo.com.br RESUMO Com o aumento das in orma!"es provenientes das #reas biol$%icas, a Biolo%ia e a in orm#tica encontraram um ponto em comum, ori%inando assim, a Bioin orm#tica. &ste novo ramo da ci'ncia tem como ob(etivo utilizar o poder computacional para or%anizar e estruturar os dados de orma compreens)vel. Neste sentido, as tecnolo%ias computacionais s*o utilizadas para acilitar o processo de consulta, cruzamentos e a%re%a!"es de dados. &ste arti%o, buscou+se demonstrar os Data Warehouses e suas contribui!"es para o armazenamento de dados em Bioin orm#tica, por serem uma lon%a s,rie de vis"es de dados tiradas ao lon%o do tempo, proporcionando aos pes-uisadores in orma!"es por meio da correla!*o entre os dados. Pa a!ra" c#a!e$ Bioin orm#tica, Data Warehouse, Banco de .ados. %& INTRODUÇ'O Na sociedade contempor/nea a tecnolo%ia n*o , al%o distante ou somente acess)vel aos %randes pensadores cient) icos ou empresas, ela est# presente nos a azeres comuns de todos. A utiliza!*o do celular, a televis*o, ou o simples ato de se consultar a internet, nada mas s*o do -ue e0emplos do crescimento tecnol$%ico -ue se vive nos tempos atuais. Assim, a tecnolo%ia %erou mudan!as -ue oram incorporadas e s*o utilizadas de orma -uase transparente pela sociedade. 1ara Mattar Neto 234456, outro ato -ue merece aten!*o, e -ue so reu mudan!as devido a computa!*o, s*o os conceitos relacionados ao ac7mulo de in orma!"es. 1ara o autor, acumular in orma!"es n*o deve ser compreendido como sinal de sabedoria, pois na era da in orm#tica, todas as in orma!"es s*o armazenadas, disponibilizadas e transmitidas por poderosos bancos de dados, os -uais azem parte deste cabedal tecnol$%ico da contemporaneidade vi%ente. 1ara ele, a 8abilidade de estabelecer cone0"es entre as in orma!"es , o ato primordial para a %era!*o de in orma!"es relevantes sobre o tema -ue , pes-uisado. Neste sentido, como a irma Mattar Neto 234456, a in orm#tica caracteriza+se como um nova tecnolo%ia intelectual -ue potencializa n*o apenas a mem$ria, mas tamb,m di erentes ormas de racioc)nio e perspectivas sobre a in orma!*o. 9o%o, tratar in orma!"es e

. visto -ue. Se%undo :oc8a 234. como erramenta computacional. toda in orma!*o produzida.entro deste conte0to. e an#lo%a as ideias de Mattar Neto 234456. analisadas. Se%undo @ueiroz 234. tratar+se+# especi icadamente sobre os Data Warehouses e suas contribui!"es para o armazenamento de in orma!"es em Bioin orm#tica. este arti%o tem como ob(etivo demostrar um dos principais es or!os computacionais para sanar al%uns destes problemas relacionados ao armazenamento e ao tratamento das in orma!"es. este ramo da ci'ncia . nos dias atuais. >m Data Warehouse. com o avan!o de ambas as partes. com o avan!o da biolo%ia e da in orm#tica. de n*o ser somente uma orma de armazena%em.6. ou se(a. <al ci'ncia. (& RE)IS'O TE*RICA Ao adentrar a teoria -ue embasa os meios pelos -uais a in orm#tica se li%a as pes-uisas biol$%icas. um campo de pes-uisa -ue est# em r#pido crescimento sendo desenvolvida para atender as necessidades da manipula!*o de %randes volumes de . &st# nova ci'ncia -ue seria criada. para uma compreens*o mais minuciosa. a Bioin orm#tica. necessitam ser armazenadas. torna+se claro -ue a biolo%ia. 8# est# similaridade com os conceitos de Mattar Neto 234456.3 n*o somente acumul#+las tornou+se a orma mais e icaz de se obter resultados satis at$rios. oi c8amada de Bioin orm#tica. 9o%o. a Bioin orm#tica busca utilizar o poder computacional para armazenar e trata as in orma!"es obtendo assim novos e relevantes in orma!"es. tratadas e. . mas sim uma erramenta -ue amplia as possibilidades e au0ilia no cruzamento de in orma!"es e tomada de decis"es. mas tamb. seria imposs)vel sem os recursos -ue a computa!*o proporciona.36. Como na sociedade. sendo -ue. sur%ia a partir da necessidade da biolo%ia de n*o apenas armazenar as in orma!"es %eradas. posteriormente. a tecnolo%ia dos Data Warehouses apresenta uma alternativa para o tratamento das in orma!"es em Bioin orm#tica. absorve todos estes conceitos apresentados por Mattar Neto 234456. como no caso das pes-uisas %en?micas. 1or este motivo. Neste sentido. sur%e um ponto em comum -ue une as duas ci'ncias ori%inalizando um novo ramo de pes-uisa. 1ortanto. criada em meados dos anos =4. A Bioin orm#tica pode ser compreendida como uma #rea multidisciplinar.m de tratar as memas com e-uipamentos de alta precis*o. as ci'ncias biol$%icas tamb. ambas ci'ncias encontraram entre si um ponto em comum.m est*o incorporadas a tecnolo%ia e ao tratamento de seus dados e a %era!*o de in orma!"es relevantes.

Com o in)cio deste pro(eto em . o GenBank3 o -ual armazenava -uase . -ue . 8eran!a. na -u)mica.NA. Da Bioin orm#tica usa o poder computacional para catalo%ar.ncbi.uTQR GenBanT . Acessado emB 34 .cie6 est# contido na #rea da ci'ncia denominada %en.. a se-u'ncia completa de um indiv)duo tem cerca de A bil8"es de bancos de .Q%enomaQ%enoma.. Da Bioin orm#tica EFG tem como ob(etivo desenvolver e aplicar t. EFG uma cole!*o anotada de todas as se-u'ncias de . processamento. Sua abran%'ncia se az em diversos aspectos e em v#rios campos cient) icos comoB na )sica. .A dados %en.san%er.brQlicenciaturaQ344.ac. >m e0emplo. 1ortanto.. 3 A C %enoma 2con(unto de %enes de uma esp.tica.sc. se%uindo assim em ritmo de crescimento constante. armazenamento. 4. 344L. ou se(a. entre outros.ez 34. 34.ispon)vel emB P8ttpBQQeducar.usp.%ovQ%enbanTQR.==4. e -ue. varia!*o e de aspectos relacionados O descend'ncia.ispon)veis emB P8ttpBQQSSS.NA brit/nico.A4 bil8"es. e conse-uentemente con irma!*o deste ato. distribui!*o.5 bil8"es de dados e. podem crescer na ordem de um petabyte por ano. Feli0 et al 23443. se%undo 9i c8itz 2344L6. o volume de in orma!"es derivadas do con8ecimento %en?mico tornou+se e0ponencialmente crescente. oi a publica!*o do %enoma 8umano o -ual cont. Cutro e0emplo deste crescimento absurdo de dados %en?micos .8tmlR.cnicas computacionais no estudo da %en.nlm. Cutra caracter)stica da Bioin orm#tica de ine+se por ser uma modalidade -ue envolve aspectos de a-uisi!*o.ez 34. passou a conter -uase .m cerca de A4 mil %enes. a %rande escala de dados ori%inados das pes-uisas realizadas por meio do pro(eto %enoma . or%anizar e estruturar estas in orma!"es em uma entidade compreensiva e e0tremamente importante para a biolo%iaH 2:CCMA. . em Naneiro de 34.NA publicamente dispon)veis. Assim. p.6 buscando a compreens*o e a rela!*o das diversas in orma!"es racionadas e oriundas destas diversas #reas biol$%icas.3 .. Cutro ato interessante -ue imp"e o uso de erramentas computacionais . da biolo%ia molecular e da bio-u)micaH 2II&CJC:&K e 9&A9.tica. ori%inam+se a partir dos es or!os individuais de v#rios pes-uisadores.3 Centro de 1es-uisa e de se-uenciamento de . os -uais. p. ci'ncia da computa!*o. 4A6. an#lise e interpreta!*o das in orma!"es. P8ttpBQQSSS. Com taman8a -uantidade de in orma!"es necessitou+se de erramentas computacionais -ue pudessem sistematicamente armazenar tal -uantidade de dados para -ue os mesmos se tornassem ontes de estudos. na biolo%ia. No Sanger Center3 (# e0istem al%umas dezenas de terabytes armazenados com uma estimativa de crescimento. Acessado emB 45 . p..ticos e bio-u)micos. 456 e0p"em -ueB o %rande volume de in orma!*o %erado pelos pro(etos de an#lise de . Neste sentido. respons#vel pelo estudo da reprodu!*o.ni8.

Italiano e Ferreira 234456. 2F&9IV.. ou como os pr$prios dizem. os dados e erramentas de an#lise. construir e manipular bancos de dados de diversas aplica!"es.ados ou 2SGB. o SG. se%undo <aTai. bancos de dados.ez 34. o -ual inclui todos os componentes -ue s*o envolvidos na or%aniza!*o dos recursos. bene )cios para o ob(etivo -ue o mesmo oi criado. parte importante da or%aniza!*o de um sistema de in orma!*o. Ao contr#rio da proposta eita para os bancos de dados.B tem prop$sito mais %en.esta orma. 3443. Se%undo <aTai.U transcriptomasU tem tornado cada vez mais comple0o o armazenamento e a an#lise dos dados. 9o%o. Cutra caracter)stica apontada pelos autores . Al.s6 -ue possam suportar taman8a %randeza de in orma!"es. 4A6 Bancos de dados. I<A9IANC & F&::&I:A.m al%um si%ni icado. apoiando+se na a irma!*o acima. de modo con i#vel. 1ara contornar tal di iculdade. o desa io apresentado pela Bioin orm#tica . encontrar a mel8or orma de armazenamento e de pes-uisa 2S@956 para os dados %erados. &sses incluem os pr$prios dados.s6 s*o uma cole!*o de pro%ramas -ue permitem aos usu#rios criarem e manipularem um banco de dadosH 2<AKAI. os SGB.m dos so tSares. o Dm)ni mundoH. 344L. 9i sc8itz 2344L.brQposbioin oQcv34.o in%l's.usp. 456 por meio de uma inter ace de alto n)vel. 3445. 4A6 a irma -ueB um sistema de banco de dados . . o sistema de banco de dados . ou se(a.m incluir o ciclo de vida de um banco de dados. -ue os bancos de dados representam aspectos do mundo real.3 . p. N# os DSistemas Gerenciadores de banco de . o ciclo de vida um sistema de in orma!*o deve tamb..rico direcionado O acilitar o processo de de inir. elas s*o estruturas constru)das e posteriormente preenc8idas para um prop$sito espec) ico.s passaram a utilizar di erentes ormas de representa!*o ou modelos U 5 1ara maiores in orma!"es visiteB 8ttpBQQSSS. pode+se irmar -ue 8# a prem'ncia de bancos de dados robustos e sistemas %erenciadores de bancos de dados 2SGB. p.ime. Italiano e Ferreira 234456 com o tempo. 29IFSCMI<J. Italiano & Ferreira 234456. %erando assim. s*o a cole!*o de dados lo%icamente relacionados -ue cont. em -ue ambos os autores atribuem aos bancos de dados a import/ncia na or%aniza!*o e na posterior utiliza!*o dos dados. Structured @uerW 9an%ua%e ou 9in%ua%em de Consulta &struturada. p. devem ser implementados.pd Acessado emB 34 . a a irma!*o de 9i sc8itz 2344L6 neste ponto entra em concord/ncia com a de <aTi. 1or isto. p. a m)dia de armazenamento e os aplicativos -ue acessam e atualizam os dados.Qeduardoreis. e toda altera!*o no Dm)ni mundoH provoca altera!*o em sua base de dados. o 8ardSare do sistema. 456 Nustamente neste ponto. ou se(a. EFG parte de um sistema de in orma!*o. o so tSare do SGB. a de ser estruturado para determinado im. -ue disponibilizem. .

5 de dados para descrever a estrutura das in orma!"es contidas em seus bancos de dados. com base nos conceitos de Gil 234. A primeira etapa. o ob(etivo de se pro(etar um banco de dados . Se%undo o autor. A maioria das pes-uisas s*o realizadas com base principalmente em materiais obtidos em ontes biblio%r# icas. de orma #%il e ob(etiva.46. realizou+se a busca de te0tos sobre os conceitos de Data Warehouses e como os mesmos estavam sendo utilizados e estruturados para o armazenamento dos dados. para o au0)lio do mesmo para uturas tomadas de decis"es e cone0*o entre in orma!"es.emostrar a contribui!*o dos Data Warehouses para a tomada de decis"es em Bioin orm#ticaX . . &m primeiro momento oi eita a aborda%em dos estudos re erentes a Bioin orm#tica e banco de dados. oram de inidos al%uns ob(etivos espec) icosB Compreender os relevantes -ue azem a cone0*o entre a ci'ncia biol$%ica e a computa!*oX . oi a busca de ontes re erentes ao tema proposto.escobrir como est*o sendo estruturados os . A se%unda etapa se deu a leitura do material e o ic8amento do mesmo. -& METODOLO.IA A metodolo%ia. Assim. a -ual oi divida em duas sub+etapas. 9o%o ap$s. +& OB. A 7ltima etapa oi o relacionamento de todas as ideias e a cria!*o deste arti%o. toda pes-uisa acad'mica re-uer em determinados momentos a realiza!*o do trabal8o caracterizado como pes-uisa biblio%r# ica.ata Iare8ouses para atender os re-uisitos da Bioin orm#tica. em particular.m. permitindo ao investi%ador a cobertura de uma %ama de en?menos maior -ue o mesmo poderia pes-uisar diretamente. Ap$s o ic8amento se ez a or%aniza!*o l$%ica dos assunto. 1ara a mel8or compreens*o do ob(etivo %eral.ETI)OS C presente arti%o apresenta os resultados de uma pes-uisa -ue teve como ob(etivo principal compreender o uso dos Data Warehouses para o armazenamento das in orma!"es provenientes da Bioin orm#tica atentando assim Os discuss"es relacionadas aos aspectos deste ramo cient) ico e. adotada para a elabora!*o deste arti%o oi constitu)da da pes-uisa biblio%r# ica. acomodar in orma!"es para -ue usu#rios em potencial possam usu ruir dos dados -ue o mesmo cont. buscando a rela!*o entre estas duas lin8as de pes-uisa.

dados espaciais. bem como a inte%ra!*o so tSare para a uni ica!*o das atias de con8ecimento desenvolvidas nas diversas institui!"es. ou dados %en. car#ter ou datas. de %randes cadeias de caracteres se torna di )cil de ser e0ecutada. com sistemas de armazenamento em massa -ue conter*o os dados %en?micos.ticos 2sucess*o de %enes6. Figura 1: Etapas realizadas para armazenar um segmento (sucessão de genes) de DNA em um banco de dados. &0istem -uatro tecnolo%ias -ue tendem a resolver os problemas re erentes a armazenamento de dados biol$%icos. 2006. 04) Baner(ee 234446 relata em suas e0plana!"es sobre plata ormas de banco de dados para Bioin orm#tica -ue.. se%undo IieczoreT e 9eal 2344L6. (WIECZOREK e LEAL. muitos dos desenvolvimentos paralelos a estas descobertas. como dados multim)dia. as -uais acarretar*o mudan!as beni%nas na #rea da medicina. mas em plata ormas computacionais de alto desempen8o. p. n7meros simples. n*o ser*o eitas dentro de laborat$rios biol$%icos. te0to. todos os %enes ser*o encontrados. as -uais s*oB tecnolo%ias de Warehousing6 para dados L C termo Warehousing n*o possui tradu!*o ade-uada para o portu%u's. conse-uentemente. como a descoberta de doen!as 8eredit#rias ou a cura de males (# e0istentes por e0emplo. -ue bancos de dados. bancos de dados para pes-uisar os dados. . como pode ser visualizado na Fi%ura . 1oucos bancos de dados tiveram uma 8abilidade nativa para lidar com dados comple0os. identi icando semel8an!as e padr"es. t'm sido em %rande parte usados para administrar dados empresariais.L /& DISCUSS'O DOS RESULTADOS >m problema a ser superado ao se tratar sobre banco de dados para Bioin orm#tica . Neste sentido. &ntretanto. n*o por ser somente um ato. a busca. mas um tend'ncia com o volume de dados %erados. a compara!*o e o armazenamento.

9o%o. al%umas caracter)sticas necess#rias para este ambiente de armazenamentos s*oB • Inte%ra!*o de dados de m7ltiplas ontesX • Facilitar o processo de consulta. disponibilizando+os para consultas e an#lises por meio de aplica!"es C9A1 2On-Line Analytical sistemas de suporte O decis*o.ticos. Sendo -ue. &stes dados s*o armazenados em um %rande dep$sito c8amado de Data Warehouse. possivelmente. Italiano e Ferreira 234456 um Warehousing pode ser de inido como uma t.rie de vis"es do banco de dados.cnica utilizada para recupera!*o e inte%ra!*o de dados a partir de ontes distribu)das. Se%undo <aTai. 8etero%'neas. uma lon%a s. Neste sentido. e tecnolo%ias de portal de Internet -ue possam permitir a publica!*o das in orma!"es de pes-uisas. para este arti%o.Y em padr"es %en. para todos os prop$sitos pr#ticos. se ocar# apenas nas tecnolo%ias de Warehousing para dados em padr"es %en. >m Data Warehouse sumaria os dados -ue s*o or%anizados em dimens"es. armazena dados das transa!"es di#rias nas -uais s*o e0ecutadas opera!"es pr. como a pr$pria denomina!*o in orma. pois o mesmo cont. Isso pode envolver consultas -ue variam em sua comple0idade. 1or este motivo os dados podem so rer mudan!as. Cs dados contidos em um Data Warehouse s*o or%anizados e armazenados com a perspectiva de lon%o prazo. tiradas ao lon%o do tempoH 2<AKAI. pode+se a irmar -ue Dos dados armazenados no Data Warehouse s*o. Z=6.ticosX a ar-uitetura de e0tensibilidade para armazenamento de dados nativamente e e0ecu!*o de estruturas de procuraX tecnolo%ias de inte%ra!*o de dados para 8abilitar -uest"es 8etero%'neas por ontes biol$%icas distribu)das. p. visando desta orma a . cruzamentos e a%re%a!"es de dadosX • Ser le0)vel para suportar %randes mudan!as e -uantidade de in orma!*oX dentre rocessing ou processamento anal)tico online6 e outrasX • &star dispon)vel para o acesso para -ue os usu#rios possam intera%ir com os dados de orma r#pida e ob(etivaX . N# um Data Warehouse armazena dados para an#lise e tomada de decis*o. 1ara Bon%iolo 2344L6 uma di erencial -ue se destaca entre um Data Warehouse e um banco de dados transacional est# no ato de -ue o se%undo. I<A9IANC & F&::&I:A. os Data Warehouses proporcionam tanto # Bioin orm#tica como para empresas. aut?nomas e.m dados 8ist$ricos de anos. uma base concreta de a%re%a!*o de dados para uturas an#lises.+ de inidas. 3445.esta orma.

os Wrappers e os (e$iators. na primeira.m. n*o s*o materializados. p. Sempre -ue uma onte de dados muda suas in orma!"es. Cutra caracter)stica b#sica est# na sua inte%ra!*o de dados. s*o e0tremamente din/micas e. Se%undo Critc8loS 234446. para a cria!*o de um Data Warehouse deve+se criar uma estrutura com alto %rau de le0ibilidade para lidar com a natureza din/mica do dom)nio. 9o%o. permitindo manipular esses recursos por meio de uma lin%ua%em de alto n)vel. p. 3444. 4U6. em sua %rande maioria. &m . &ntretanto. baseando+se na a irma!*o (# citada. 1or. e outra s*o os (e$iators 2Mediadores6 -ue o erecem o acoplamento entre provedores e consumidores de dados por envio de servi!os -ue tratam a -uest*o sem/ntica e sinta0e entre os ob(etos dos sistemas locais.==L o La!rence Li%er#ore &ational Laboratory deu inicio ao pro(eto Data'oun$ry para a cria!*o de um Data Warehouse para o armazenamentos de dados %en?micos.Z realiza!*o de compara!"es e pes-uisas nas in orma!"es contidas. ontes de dados cient) icos. os -uais permitem Do acesso Os ontes de dados distribu)das e 8etero%'neas e promovem a trans orma!*o entre o modelo de dados da onte e o modelo de dados internoH 2C[CC. . Seibel 234446 aponta -ue est# orma de inte%ra!*o tamb. a -ual pode ser visualizada na Fi%ura 3" >ma ar-uitetura baseada na aborda%em !rapper-#e$ia$or di ere undamentalmente da aborda%em Data Warehouse pelo ato de -ue os dados. uma das camadas presentes em um Data Warehouse s*o os Wrappers. Seibel 234446 prop"e uma complementa!*o * aborda%em do Data Warehouse.m com rela!*o O atualiza!*o das inst/ncias de dados 2os pes-uisadores precisam ter acesso aos dados mais recentes6. &ste sistema ornece uma vis*o uni orme dos recursos -ue est*o dispon)veis para usu#rios. 3445. mesmo sendo bem aceita est# aborda%em para o tratamento dos problemas da inte%ra!*o de dados vindouros de ontes de dados distribu)das e 8etero%'neas.U6. Ao contr#rio de aplica!"es comerciais. oriundas de diversas localidades e banco de dados di erentes. como . estas aborda%ens podem ser complementares pois o mediador pode ser usado como onte de dados para a implementa!*o do Data Warehouse 2S&IB&9. para sanar este problema. 9o%o. Como as in orma!"es provenientes da Bioin orm#tica n*o s*o oriundas apenas de uma onte e sim de uma a%lomera!*o de dados vindouros de laborat$rios biol$%icos espal8ados em v#rios centros universit#rios e laborat$rios de pes-uisa. a inte%ra!*o de dados proporcionada por um Data !arehouse uma in ra estrutura -ue permite criar e manter uma vis*o consistente de v#rias ontes de dados aut?nomas.m n*o atende O inte%ra!*o de in orma!"es biol$%icas com rela!*o O atualiza!*o dos es-uemas e tamb. dando en ase a dados %en?micos.

2000. nada mais plaus)vel -ue. p. al.. DCom a proli era!*o destes bancos de dados p7blicos -ue tem sido observado nos 7ltimos anos.. -ueB consultar E. uma tend'ncia para o armazenamento de dados oriundos das pes-uisas %en?micas.G pela rede. p. . C Data Warehouse. pois os dados %erados n*o s*o armazenados apenas em um banco de dados. os pes-uisadores precisam de uma orma #cil e intuitiva de acessar todos estes dadosH 2BCNGIC9C. al. ainda 8# %randes desa ios para a introdu!*o desta aborda%em. mas espal8ados em diversas institui!"es de pes-uisas espal8adas pelo mundo. 9o%o. pois deve+se manter um Data Warehouse e0tremamente uncional. como restri!"es de recursos do servidor remoto.m da lo%)stica inerente a . 344L.= mostra a Fi%ura 3. preocupa!*o com a se%uran!a dos dados E. mesmo inte%rando v#rias ontes de dados -ue so ram mudan!as constantemente.. todos os laborat$rios de pes-uisas possam ter em m*os uma c$pia das in orma!"es para -ue os mesmos possam realizar suas pes-uisas mediante aos dados coletados.m dos v#rios problemas e solu!"es (# citados. com as car%as e recar%as eitas em um Data Warehouse. baseando+ se nestas in orma!"es. 08) IieczoreT e 9eal 2344L6 e0p"e -ue.G dados de orma distribu)da tem seus problemas e limita!"es. Z56. como oi a irmado por Baner(ee 234446. Contudo. devem ser atualizados para -ue estas modi ica!"es se(am espel8adas no Data Warehouse" Figura 2: Arquitetura de um Data Warehouse. (CRITCHLOW et al . v#rios pes-uisadores se debru!am sobre o assunto para criar solu!"es para tal situa!*o. Cutro ato -ue (usti ica a utiliza!*o dos Data Warehouse ..

na lin8a de pes-uisa sobre banco de dados. Z56 Al. . pode+se incluir a possibilidade de erros ao se retornar certa -uantidade de dados. Cracle Corporation. como est*o sendo utilizados os bancos de dados para o armazenamento das in orma!"es provenientes das pes-uisas eitas no Brasil.m da limita!*o citada. Com est# erramenta tecnol$%ica. 0& CONSIDERAÇÕES FINAIS &ste arti%o procurou evidenciar como os Data Warehouses contribuem para o armazenamento e a pes-uisa dos dados em Bioin orm#tica. Sandeepan.m no ato -ue. consultas distribu)das -ue %erem um %rande volume de dados s*o di )ceis de processar.ata Iare8ouse .m de inte%rar v#rios bancos 8etero%'neos.m de re-uerer -ue consultas comple0as inte%rem dados 8etero%'neos de ontes distintas.. 3444. A Da3a4a"e P a35or6 5or Bioin5or6a3ic". uma erramenta importante para a Bioin orm#tica. an#lises e cruzamentos entre v#rias in orma!"es. . o maior interesse em utilizar os Data Warehouses est# tamb. os pes-uisadores podem azer compara!"es. Como os dados est*o distribu)dos em servidores remotos. permitindo cruzamentos e a%re%a!"es. Assim.%randpoo8ba8. pois os mesmos. a disponibilidade dos mesmos n*o pode ser %arantida e. al. 1ara trabal8os uturos pode+se mencionar. al. s*o constru)dos para -ue tais dados se(am armazenados e acessados de orma a n*o serem limitados por tabelas e lin8as estritamente relacionais. Assim um . Cutro adendo .ispon)vel emB P8ttpBQQSSS.netQSandeepanQ\9. uma pes-uisa -ue volte a vis*o para o Brasil.B]Bioin ormatics. -ue. as -uais s*o t*o importantes para as pes-uisas biol$%icas. 1& REFER2NCIAS BAN&:N&&. os mesmos convertem e limpam seus dados e implementam erramentas -ue acilitam a nave%a!*o pelos mesmos. 344L.pd R Acessado emB 45 . buscou demostrar um panorama %eral. :edSood S8ores. p. -ue se obt'm resultados -ue levar*o os pes-uisadores a descobertas para cura de doen!as e preven!*o de males 8eredit#rios. Num ambiente assim. seria de %rande import/ncia para uturas discuss"es sobre o assunto. por meio deste cruzamentos de dados . se%undo Bon%iolo 2344L6. este arti%o. sendo -ue.ez 34. pois. uma consulta pode ser al8a devido a est# circunst/ncia. 2BCNGIC9C.3.4 consulta de bancos distribu)dos.

X . F&9IV. Ale0andre.X 9&A9.puc+ rio...u es.netQbibliotecaQsumarioQ44443&Q44443&AZ. 344L. &lis/n%ela.X M&NCSSI.brQ.3.pd R Acessado emB 4A . .=A=`rep_rep. MA<<A: N&<C. S*o 1auloB Atlas.r%io. 9IFSCMI<J.ez 34. GI9. Me3odo o:ia Cien3B5ica na Era da In5or673ica.X NCG>&I:A.A.ispon)vel emB P tpBQQSSS.3.ez 34.adosb34emb34Bioin ormb&. Nuliana de Maria. ..BGQmaterialb34cursob34bioin oQ9eitura b34ComplementarQarti%osQCamin8osb34eb34<endb&Anciasb34dob34usob34de b34Bancob34de34. Marcelo. Csvaldo Kotaro.psu.usp.ez 34. <AKAI.X S9&JAK.pd R Acessado emB .X I<A9IANC. &duardo.3.lprm. S*o 1auloB Saraiva.. S*o 1auloB >S1.ime. 3.ispon)vel emB P8ttpBQQciteseer0.brQsbc344LQpd Qar-43Y. \icente &u%enio de :osa. :odri%o . .tica.ispon)vel emB P8ttpBQQarti%ocienti ico. An7 i"e 8anor96ica da Bioin5or673ica no Bra"i $ Pro8o"3a da :e"3. ed. .ispon)vel emB P8ttpBQQSSS. C)cero 1in8o.X M>SICK.4. 344L. S. II&CJC:&K.bib.X A::>.pd R Acessado emB . Isabel Cristina. :CCMA. <atiana Mara. 34. .brQa(e Qapostila.]ZL.pd R Acessado emB .in . No*o Au%usto.. <om.uarte.cbme%. >&S1I.brQpubQdocsQt8esesQ43]18.ez 34. . F#bio <ebaldi Silveira. BANCO DE DADOS EM BIONINFORMÁTICA. 34.ez 34.unicamp. .in . Bio+AVSB U6a Ar=ui3e3ura 8ara In3e:raC.3 C[CC. Ant?nio Carlos.3. .brQ%en isQinde0.u v.unesc.4Bintroducao+a+ bioin ormatica`id_YBapostilas+e+arti%os`Itemid_LZR Acessado emB .eno6a Funciona & 3443.pd R Acessado emB 34 . @>&I:CJ.3. BCNGIC9C. NC:G&. 9uiz Fernando Bessa. .ispon)vel emB P8ttpBQQ%en isU4. I68 e6en3ando >ra88er" ?6 e re aciona 8ara o Codi6"& 3445. No*o &duardo.:>MMCN.4 .X F&::&I:A..usp. A8o"3i a de In3roduC.ispon)vel emB P tpBQQ tp. Crici7ma.pd R Acessado emB .. <erence. . Co6o e a4orar 8roAe3o" de 8e"=ui"a& 5.ispon)vel emB P8ttpBQQSSS..natalnet.. C:I<CM9CI. S&IB&9.ez 34.p8p^ option_com]p8ocadoSnload`vieS_cate%orW`doSnload_. . Ca6in#o" e TendFncia" do u"o de Bando de Dado" e6 Bioin5or673ica& C&>91.]seibel.ez 34.o de Fon3e" de Dado" e A8 icaCEe" de Bio o:ia Mo ecu ar. 344L. :enato At)lio.. &milio Mario.o a Banco de Dado". An O!er!ie> o5 Bioin5or6a3ic" Re"earc# a3 La>rence Li!er6ore Na3iona La4ora3or@& 3444. 3445.eduQvieSdocQdoSnload^doi_. 1>C+:io.o de 8e""oa" 8ara o" a4ora3<rio" de 8e"=ui"a.ist.ez 34.4 .esal-.brQuploadsQartc].brQca eQpubQ eli0+% . :io Grande do NorteB >F:N. . 3445.uol. &d. 3443. :on.3.4..`tWpe_pd R Acessado emB 34 .. A :u6a" Pe"=ui"a" e6 Banco" de Dado" e Bioin5or673ica.ez 34.X N>NIC:. .pd R Acessado emB 4.ispon)vel emB P8ttpBQQipe.3. 1aulo. In3roduC.Y .ispon)vel emB P8ttpBQQcodims.U .pd R Acessado emB 4= .o D Bioin5or673ica. .=U5U=U4.ispon)vel emB P8ttpBQQSSS.com.3.brQpublicacoesQMono%ra ia]<atiana.3.AA.ez 34.

Sign up to vote on this title
UsefulNot useful