CONTRIBUIÇÕES DO USO DE DATA WAREHOUSE PARA O ARMAZENAMENTO DE DADOS EM BIOINFORMÁTICA Luiz Fernando Pico o IFMS – Instituto Federal de Mato

Grosso do Sul Nova Andradina – MS, Brasil luizpicolo@luizpicolo.com.br RESUMO Com o aumento das in orma!"es provenientes das #reas biol$%icas, a Biolo%ia e a in orm#tica encontraram um ponto em comum, ori%inando assim, a Bioin orm#tica. &ste novo ramo da ci'ncia tem como ob(etivo utilizar o poder computacional para or%anizar e estruturar os dados de orma compreens)vel. Neste sentido, as tecnolo%ias computacionais s*o utilizadas para acilitar o processo de consulta, cruzamentos e a%re%a!"es de dados. &ste arti%o, buscou+se demonstrar os Data Warehouses e suas contribui!"es para o armazenamento de dados em Bioin orm#tica, por serem uma lon%a s,rie de vis"es de dados tiradas ao lon%o do tempo, proporcionando aos pes-uisadores in orma!"es por meio da correla!*o entre os dados. Pa a!ra" c#a!e$ Bioin orm#tica, Data Warehouse, Banco de .ados. %& INTRODUÇ'O Na sociedade contempor/nea a tecnolo%ia n*o , al%o distante ou somente acess)vel aos %randes pensadores cient) icos ou empresas, ela est# presente nos a azeres comuns de todos. A utiliza!*o do celular, a televis*o, ou o simples ato de se consultar a internet, nada mas s*o do -ue e0emplos do crescimento tecnol$%ico -ue se vive nos tempos atuais. Assim, a tecnolo%ia %erou mudan!as -ue oram incorporadas e s*o utilizadas de orma -uase transparente pela sociedade. 1ara Mattar Neto 234456, outro ato -ue merece aten!*o, e -ue so reu mudan!as devido a computa!*o, s*o os conceitos relacionados ao ac7mulo de in orma!"es. 1ara o autor, acumular in orma!"es n*o deve ser compreendido como sinal de sabedoria, pois na era da in orm#tica, todas as in orma!"es s*o armazenadas, disponibilizadas e transmitidas por poderosos bancos de dados, os -uais azem parte deste cabedal tecnol$%ico da contemporaneidade vi%ente. 1ara ele, a 8abilidade de estabelecer cone0"es entre as in orma!"es , o ato primordial para a %era!*o de in orma!"es relevantes sobre o tema -ue , pes-uisado. Neste sentido, como a irma Mattar Neto 234456, a in orm#tica caracteriza+se como um nova tecnolo%ia intelectual -ue potencializa n*o apenas a mem$ria, mas tamb,m di erentes ormas de racioc)nio e perspectivas sobre a in orma!*o. 9o%o, tratar in orma!"es e

ou se(a. e an#lo%a as ideias de Mattar Neto 234456. Se%undo @ueiroz 234. de n*o ser somente uma orma de armazena%em. .m de tratar as memas com e-uipamentos de alta precis*o. A Bioin orm#tica pode ser compreendida como uma #rea multidisciplinar. (& RE)IS'O TE*RICA Ao adentrar a teoria -ue embasa os meios pelos -uais a in orm#tica se li%a as pes-uisas biol$%icas. a Bioin orm#tica busca utilizar o poder computacional para armazenar e trata as in orma!"es obtendo assim novos e relevantes in orma!"es. 1or este motivo.. para uma compreens*o mais minuciosa. este arti%o tem como ob(etivo demostrar um dos principais es or!os computacionais para sanar al%uns destes problemas relacionados ao armazenamento e ao tratamento das in orma!"es. com o avan!o de ambas as partes. com o avan!o da biolo%ia e da in orm#tica. >m Data Warehouse. tratadas e. seria imposs)vel sem os recursos -ue a computa!*o proporciona. mas sim uma erramenta -ue amplia as possibilidades e au0ilia no cruzamento de in orma!"es e tomada de decis"es. posteriormente. <al ci'ncia. um campo de pes-uisa -ue est# em r#pido crescimento sendo desenvolvida para atender as necessidades da manipula!*o de %randes volumes de . &st# nova ci'ncia -ue seria criada. as ci'ncias biol$%icas tamb. visto -ue. mas tamb.m est*o incorporadas a tecnolo%ia e ao tratamento de seus dados e a %era!*o de in orma!"es relevantes. sur%ia a partir da necessidade da biolo%ia de n*o apenas armazenar as in orma!"es %eradas. analisadas. absorve todos estes conceitos apresentados por Mattar Neto 234456. tratar+se+# especi icadamente sobre os Data Warehouses e suas contribui!"es para o armazenamento de in orma!"es em Bioin orm#tica.36. sur%e um ponto em comum -ue une as duas ci'ncias ori%inalizando um novo ramo de pes-uisa. como no caso das pes-uisas %en?micas.6. sendo -ue.entro deste conte0to. criada em meados dos anos =4. 9o%o.3 n*o somente acumul#+las tornou+se a orma mais e icaz de se obter resultados satis at$rios. toda in orma!*o produzida. Se%undo :oc8a 234. necessitam ser armazenadas. como erramenta computacional. este ramo da ci'ncia . 8# est# similaridade com os conceitos de Mattar Neto 234456. Neste sentido. a Bioin orm#tica. ambas ci'ncias encontraram entre si um ponto em comum. 1ortanto. torna+se claro -ue a biolo%ia. Como na sociedade. oi c8amada de Bioin orm#tica. nos dias atuais. a tecnolo%ia dos Data Warehouses apresenta uma alternativa para o tratamento das in orma!"es em Bioin orm#tica.

.ni8. Cutro ato interessante -ue imp"e o uso de erramentas computacionais . -ue . 8eran!a. 456 e0p"em -ueB o %rande volume de in orma!*o %erado pelos pro(etos de an#lise de . respons#vel pelo estudo da reprodu!*o.A dados %en..5 bil8"es de dados e. 4A6. p.Q%enomaQ%enoma. em Naneiro de 34.6 buscando a compreens*o e a rela!*o das diversas in orma!"es racionadas e oriundas destas diversas #reas biol$%icas. passou a conter -uase . se%uindo assim em ritmo de crescimento constante. Com taman8a -uantidade de in orma!"es necessitou+se de erramentas computacionais -ue pudessem sistematicamente armazenar tal -uantidade de dados para -ue os mesmos se tornassem ontes de estudos. Com o in)cio deste pro(eto em .NA.8tmlR. processamento.cie6 est# contido na #rea da ci'ncia denominada %en. Cutro e0emplo deste crescimento absurdo de dados %en?micos . se%undo 9i c8itz 2344L6. na biolo%ia. na -u)mica. No Sanger Center3 (# e0istem al%umas dezenas de terabytes armazenados com uma estimativa de crescimento. Sua abran%'ncia se az em diversos aspectos e em v#rios campos cient) icos comoB na )sica. 34.==4.usp. Cutra caracter)stica da Bioin orm#tica de ine+se por ser uma modalidade -ue envolve aspectos de a-uisi!*o.san%er. EFG uma cole!*o anotada de todas as se-u'ncias de . o volume de in orma!"es derivadas do con8ecimento %en?mico tornou+se e0ponencialmente crescente. 1ortanto.. p.NA publicamente dispon)veis. 4.ncbi.ispon)vel emB P8ttpBQQeducar. e -ue.ez 34.m cerca de A4 mil %enes.ac. Acessado emB 45 .NA brit/nico.nlm. ci'ncia da computa!*o.3 Centro de 1es-uisa e de se-uenciamento de .ispon)veis emB P8ttpBQQSSS. 3 A C %enoma 2con(unto de %enes de uma esp. o GenBank3 o -ual armazenava -uase . >m e0emplo.cnicas computacionais no estudo da %en.uTQR GenBanT ..ticos e bio-u)micos. or%anizar e estruturar estas in orma!"es em uma entidade compreensiva e e0tremamente importante para a biolo%iaH 2:CCMA. ou se(a. os -uais. P8ttpBQQSSS. 344L. e conse-uentemente con irma!*o deste ato. p.A4 bil8"es.3 . Da Bioin orm#tica EFG tem como ob(etivo desenvolver e aplicar t. Feli0 et al 23443. varia!*o e de aspectos relacionados O descend'ncia.%ovQ%enbanTQR. .ez 34.sc. da biolo%ia molecular e da bio-u)micaH 2II&CJC:&K e 9&A9. Da Bioin orm#tica usa o poder computacional para catalo%ar. oi a publica!*o do %enoma 8umano o -ual cont. Assim.tica.tica. ori%inam+se a partir dos es or!os individuais de v#rios pes-uisadores.brQlicenciaturaQ344. entre outros.. distribui!*o. a se-u'ncia completa de um indiv)duo tem cerca de A bil8"es de bancos de . podem crescer na ordem de um petabyte por ano. a %rande escala de dados ori%inados das pes-uisas realizadas por meio do pro(eto %enoma . armazenamento. Neste sentido. an#lise e interpreta!*o das in orma!"es. Acessado emB 34 ..

N# os DSistemas Gerenciadores de banco de . bene )cios para o ob(etivo -ue o mesmo oi criado.rico direcionado O acilitar o processo de de inir. 1or isto.. &sses incluem os pr$prios dados. bancos de dados.s6 s*o uma cole!*o de pro%ramas -ue permitem aos usu#rios criarem e manipularem um banco de dadosH 2<AKAI. o 8ardSare do sistema. Structured @uerW 9an%ua%e ou 9in%ua%em de Consulta &struturada. Italiano e Ferreira 234456. Italiano & Ferreira 234456. 344L. a m)dia de armazenamento e os aplicativos -ue acessam e atualizam os dados. o desa io apresentado pela Bioin orm#tica . o Dm)ni mundoH. os SGB. Italiano e Ferreira 234456 com o tempo. %erando assim.o in%l's. construir e manipular bancos de dados de diversas aplica!"es. s*o a cole!*o de dados lo%icamente relacionados -ue cont. 29IFSCMI<J. devem ser implementados. 4A6 Bancos de dados.3 . de modo con i#vel. 456 por meio de uma inter ace de alto n)vel.ime. 1ara contornar tal di iculdade. se%undo <aTai. o ciclo de vida um sistema de in orma!*o deve tamb. p. o so tSare do SGB. Cutra caracter)stica apontada pelos autores .Qeduardoreis. -ue disponibilizem. Al. a a irma!*o de 9i sc8itz 2344L6 neste ponto entra em concord/ncia com a de <aTi.pd Acessado emB 34 . parte importante da or%aniza!*o de um sistema de in orma!*o. ou como os pr$prios dizem. o SG. p. encontrar a mel8or orma de armazenamento e de pes-uisa 2S@956 para os dados %erados.s passaram a utilizar di erentes ormas de representa!*o ou modelos U 5 1ara maiores in orma!"es visiteB 8ttpBQQSSS.U transcriptomasU tem tornado cada vez mais comple0o o armazenamento e a an#lise dos dados.esta orma.usp. apoiando+se na a irma!*o acima. . p. 456 Nustamente neste ponto. a de ser estruturado para determinado im.B tem prop$sito mais %en. Se%undo <aTai. elas s*o estruturas constru)das e posteriormente preenc8idas para um prop$sito espec) ico. . 3443.m al%um si%ni icado. EFG parte de um sistema de in orma!*o. os dados e erramentas de an#lise. I<A9IANC & F&::&I:A.m dos so tSares. 4A6 a irma -ueB um sistema de banco de dados . ou se(a.ados ou 2SGB. pode+se irmar -ue 8# a prem'ncia de bancos de dados robustos e sistemas %erenciadores de bancos de dados 2SGB. 3445. em -ue ambos os autores atribuem aos bancos de dados a import/ncia na or%aniza!*o e na posterior utiliza!*o dos dados. Ao contr#rio da proposta eita para os bancos de dados.s6 -ue possam suportar taman8a %randeza de in orma!"es. -ue os bancos de dados representam aspectos do mundo real.brQposbioin oQcv34. o sistema de banco de dados . 2F&9IV.ez 34. p. o -ual inclui todos os componentes -ue s*o envolvidos na or%aniza!*o dos recursos.m incluir o ciclo de vida de um banco de dados. 9o%o. ou se(a. 9i sc8itz 2344L.. e toda altera!*o no Dm)ni mundoH provoca altera!*o em sua base de dados.

Assim.ata Iare8ouses para atender os re-uisitos da Bioin orm#tica. +& OB. A 7ltima etapa oi o relacionamento de todas as ideias e a cria!*o deste arti%o. .m. Se%undo o autor.escobrir como est*o sendo estruturados os . realizou+se a busca de te0tos sobre os conceitos de Data Warehouses e como os mesmos estavam sendo utilizados e estruturados para o armazenamento dos dados. -& METODOLO. buscando a rela!*o entre estas duas lin8as de pes-uisa. acomodar in orma!"es para -ue usu#rios em potencial possam usu ruir dos dados -ue o mesmo cont. em particular. toda pes-uisa acad'mica re-uer em determinados momentos a realiza!*o do trabal8o caracterizado como pes-uisa biblio%r# ica. adotada para a elabora!*o deste arti%o oi constitu)da da pes-uisa biblio%r# ica. &m primeiro momento oi eita a aborda%em dos estudos re erentes a Bioin orm#tica e banco de dados. a -ual oi divida em duas sub+etapas. A maioria das pes-uisas s*o realizadas com base principalmente em materiais obtidos em ontes biblio%r# icas. Ap$s o ic8amento se ez a or%aniza!*o l$%ica dos assunto.ETI)OS C presente arti%o apresenta os resultados de uma pes-uisa -ue teve como ob(etivo principal compreender o uso dos Data Warehouses para o armazenamento das in orma!"es provenientes da Bioin orm#tica atentando assim Os discuss"es relacionadas aos aspectos deste ramo cient) ico e. o ob(etivo de se pro(etar um banco de dados . de orma #%il e ob(etiva.IA A metodolo%ia. 1ara a mel8or compreens*o do ob(etivo %eral. permitindo ao investi%ador a cobertura de uma %ama de en?menos maior -ue o mesmo poderia pes-uisar diretamente.46. oram de inidos al%uns ob(etivos espec) icosB Compreender os relevantes -ue azem a cone0*o entre a ci'ncia biol$%ica e a computa!*oX . A primeira etapa.5 de dados para descrever a estrutura das in orma!"es contidas em seus bancos de dados. A se%unda etapa se deu a leitura do material e o ic8amento do mesmo. 9o%o ap$s. com base nos conceitos de Gil 234. oi a busca de ontes re erentes ao tema proposto. para o au0)lio do mesmo para uturas tomadas de decis"es e cone0*o entre in orma!"es.emostrar a contribui!*o dos Data Warehouses para a tomada de decis"es em Bioin orm#ticaX .

n7meros simples.. (WIECZOREK e LEAL. Figura 1: Etapas realizadas para armazenar um segmento (sucessão de genes) de DNA em um banco de dados. a compara!*o e o armazenamento. n*o ser*o eitas dentro de laborat$rios biol$%icos. como a descoberta de doen!as 8eredit#rias ou a cura de males (# e0istentes por e0emplo.L /& DISCUSS'O DOS RESULTADOS >m problema a ser superado ao se tratar sobre banco de dados para Bioin orm#tica . com sistemas de armazenamento em massa -ue conter*o os dados %en?micos. dados espaciais. conse-uentemente. Neste sentido. n*o por ser somente um ato. &ntretanto. as -uais s*oB tecnolo%ias de Warehousing6 para dados L C termo Warehousing n*o possui tradu!*o ade-uada para o portu%u's. 04) Baner(ee 234446 relata em suas e0plana!"es sobre plata ormas de banco de dados para Bioin orm#tica -ue. 2006. mas um tend'ncia com o volume de dados %erados. . p. te0to. como pode ser visualizado na Fi%ura . se%undo IieczoreT e 9eal 2344L6. as -uais acarretar*o mudan!as beni%nas na #rea da medicina. muitos dos desenvolvimentos paralelos a estas descobertas. &0istem -uatro tecnolo%ias -ue tendem a resolver os problemas re erentes a armazenamento de dados biol$%icos. -ue bancos de dados. car#ter ou datas. a busca. 1oucos bancos de dados tiveram uma 8abilidade nativa para lidar com dados comple0os. mas em plata ormas computacionais de alto desempen8o. de %randes cadeias de caracteres se torna di )cil de ser e0ecutada.ticos 2sucess*o de %enes6. ou dados %en. bancos de dados para pes-uisar os dados. t'm sido em %rande parte usados para administrar dados empresariais. todos os %enes ser*o encontrados. identi icando semel8an!as e padr"es. bem como a inte%ra!*o so tSare para a uni ica!*o das atias de con8ecimento desenvolvidas nas diversas institui!"es. como dados multim)dia.

como a pr$pria denomina!*o in orma. para este arti%o. os Data Warehouses proporcionam tanto # Bioin orm#tica como para empresas.Y em padr"es %en. Isso pode envolver consultas -ue variam em sua comple0idade. tiradas ao lon%o do tempoH 2<AKAI. Z=6. p. 9o%o. se ocar# apenas nas tecnolo%ias de Warehousing para dados em padr"es %en. pois o mesmo cont. 1or este motivo os dados podem so rer mudan!as. N# um Data Warehouse armazena dados para an#lise e tomada de decis*o.ticos. disponibilizando+os para consultas e an#lises por meio de aplica!"es C9A1 2On-Line Analytical sistemas de suporte O decis*o.esta orma. e tecnolo%ias de portal de Internet -ue possam permitir a publica!*o das in orma!"es de pes-uisas.+ de inidas. visando desta orma a . 3445.cnica utilizada para recupera!*o e inte%ra!*o de dados a partir de ontes distribu)das. I<A9IANC & F&::&I:A. &stes dados s*o armazenados em um %rande dep$sito c8amado de Data Warehouse. Sendo -ue. pode+se a irmar -ue Dos dados armazenados no Data Warehouse s*o. para todos os prop$sitos pr#ticos.rie de vis"es do banco de dados. 8etero%'neas. cruzamentos e a%re%a!"es de dadosX • Ser le0)vel para suportar %randes mudan!as e -uantidade de in orma!*oX dentre rocessing ou processamento anal)tico online6 e outrasX • &star dispon)vel para o acesso para -ue os usu#rios possam intera%ir com os dados de orma r#pida e ob(etivaX . Cs dados contidos em um Data Warehouse s*o or%anizados e armazenados com a perspectiva de lon%o prazo. uma lon%a s. 1ara Bon%iolo 2344L6 uma di erencial -ue se destaca entre um Data Warehouse e um banco de dados transacional est# no ato de -ue o se%undo. al%umas caracter)sticas necess#rias para este ambiente de armazenamentos s*oB • Inte%ra!*o de dados de m7ltiplas ontesX • Facilitar o processo de consulta. Neste sentido. Se%undo <aTai.m dados 8ist$ricos de anos. >m Data Warehouse sumaria os dados -ue s*o or%anizados em dimens"es. Italiano e Ferreira 234456 um Warehousing pode ser de inido como uma t. aut?nomas e. possivelmente. armazena dados das transa!"es di#rias nas -uais s*o e0ecutadas opera!"es pr. uma base concreta de a%re%a!*o de dados para uturas an#lises.ticosX a ar-uitetura de e0tensibilidade para armazenamento de dados nativamente e e0ecu!*o de estruturas de procuraX tecnolo%ias de inte%ra!*o de dados para 8abilitar -uest"es 8etero%'neas por ontes biol$%icas distribu)das.

dando en ase a dados %en?micos. s*o e0tremamente din/micas e. 3444. 3445. permitindo manipular esses recursos por meio de uma lin%ua%em de alto n)vel. &ste sistema ornece uma vis*o uni orme dos recursos -ue est*o dispon)veis para usu#rios. como . &ntretanto. p. uma das camadas presentes em um Data Warehouse s*o os Wrappers. . para a cria!*o de um Data Warehouse deve+se criar uma estrutura com alto %rau de le0ibilidade para lidar com a natureza din/mica do dom)nio.m.m com rela!*o O atualiza!*o das inst/ncias de dados 2os pes-uisadores precisam ter acesso aos dados mais recentes6.==L o La!rence Li%er#ore &ational Laboratory deu inicio ao pro(eto Data'oun$ry para a cria!*o de um Data Warehouse para o armazenamentos de dados %en?micos. mesmo sendo bem aceita est# aborda%em para o tratamento dos problemas da inte%ra!*o de dados vindouros de ontes de dados distribu)das e 8etero%'neas. ontes de dados cient) icos. Seibel 234446 aponta -ue est# orma de inte%ra!*o tamb. os -uais permitem Do acesso Os ontes de dados distribu)das e 8etero%'neas e promovem a trans orma!*o entre o modelo de dados da onte e o modelo de dados internoH 2C[CC.Z realiza!*o de compara!"es e pes-uisas nas in orma!"es contidas. a inte%ra!*o de dados proporcionada por um Data !arehouse uma in ra estrutura -ue permite criar e manter uma vis*o consistente de v#rias ontes de dados aut?nomas. os Wrappers e os (e$iators.m n*o atende O inte%ra!*o de in orma!"es biol$%icas com rela!*o O atualiza!*o dos es-uemas e tamb. Como as in orma!"es provenientes da Bioin orm#tica n*o s*o oriundas apenas de uma onte e sim de uma a%lomera!*o de dados vindouros de laborat$rios biol$%icos espal8ados em v#rios centros universit#rios e laborat$rios de pes-uisa. Cutra caracter)stica b#sica est# na sua inte%ra!*o de dados.U6. a -ual pode ser visualizada na Fi%ura 3" >ma ar-uitetura baseada na aborda%em !rapper-#e$ia$or di ere undamentalmente da aborda%em Data Warehouse pelo ato de -ue os dados. em sua %rande maioria. na primeira. Ao contr#rio de aplica!"es comerciais. para sanar este problema. Sempre -ue uma onte de dados muda suas in orma!"es. 1or. Se%undo Critc8loS 234446. p. oriundas de diversas localidades e banco de dados di erentes. 4U6. estas aborda%ens podem ser complementares pois o mediador pode ser usado como onte de dados para a implementa!*o do Data Warehouse 2S&IB&9. &m . n*o s*o materializados. baseando+se na a irma!*o (# citada. 9o%o. e outra s*o os (e$iators 2Mediadores6 -ue o erecem o acoplamento entre provedores e consumidores de dados por envio de servi!os -ue tratam a -uest*o sem/ntica e sinta0e entre os ob(etos dos sistemas locais. Seibel 234446 prop"e uma complementa!*o * aborda%em do Data Warehouse. 9o%o.

ainda 8# %randes desa ios para a introdu!*o desta aborda%em. pois os dados %erados n*o s*o armazenados apenas em um banco de dados. 2000.m da lo%)stica inerente a . nada mais plaus)vel -ue. 08) IieczoreT e 9eal 2344L6 e0p"e -ue. p.. com as car%as e recar%as eitas em um Data Warehouse. v#rios pes-uisadores se debru!am sobre o assunto para criar solu!"es para tal situa!*o. Cutro ato -ue (usti ica a utiliza!*o dos Data Warehouse . p. (CRITCHLOW et al . como oi a irmado por Baner(ee 234446. al.G pela rede. uma tend'ncia para o armazenamento de dados oriundos das pes-uisas %en?micas. mas espal8ados em diversas institui!"es de pes-uisas espal8adas pelo mundo. 9o%o. devem ser atualizados para -ue estas modi ica!"es se(am espel8adas no Data Warehouse" Figura 2: Arquitetura de um Data Warehouse. preocupa!*o com a se%uran!a dos dados E. . Z56. DCom a proli era!*o destes bancos de dados p7blicos -ue tem sido observado nos 7ltimos anos.. al. C Data Warehouse. pois deve+se manter um Data Warehouse e0tremamente uncional. 344L. -ueB consultar E.. baseando+ se nestas in orma!"es. como restri!"es de recursos do servidor remoto. todos os laborat$rios de pes-uisas possam ter em m*os uma c$pia das in orma!"es para -ue os mesmos possam realizar suas pes-uisas mediante aos dados coletados.m dos v#rios problemas e solu!"es (# citados. os pes-uisadores precisam de uma orma #cil e intuitiva de acessar todos estes dadosH 2BCNGIC9C. mesmo inte%rando v#rias ontes de dados -ue so ram mudan!as constantemente..= mostra a Fi%ura 3.G dados de orma distribu)da tem seus problemas e limita!"es. Contudo.

4 consulta de bancos distribu)dos.B]Bioin ormatics. as -uais s*o t*o importantes para as pes-uisas biol$%icas. s*o constru)dos para -ue tais dados se(am armazenados e acessados de orma a n*o serem limitados por tabelas e lin8as estritamente relacionais. . por meio deste cruzamentos de dados . Assim.pd R Acessado emB 45 .netQSandeepanQ\9. pode+se incluir a possibilidade de erros ao se retornar certa -uantidade de dados. 2BCNGIC9C. -ue. Cutro adendo .3. Z56 Al. na lin8a de pes-uisa sobre banco de dados.m no ato -ue. os mesmos convertem e limpam seus dados e implementam erramentas -ue acilitam a nave%a!*o pelos mesmos. uma consulta pode ser al8a devido a est# circunst/ncia. Como os dados est*o distribu)dos em servidores remotos. pois. .m da limita!*o citada. consultas distribu)das -ue %erem um %rande volume de dados s*o di )ceis de processar.m de re-uerer -ue consultas comple0as inte%rem dados 8etero%'neos de ontes distintas. permitindo cruzamentos e a%re%a!"es. 1& REFER2NCIAS BAN&:N&&. 344L. p.. como est*o sendo utilizados os bancos de dados para o armazenamento das in orma!"es provenientes das pes-uisas eitas no Brasil. :edSood S8ores. Assim um . A Da3a4a"e P a35or6 5or Bioin5or6a3ic".%randpoo8ba8. seria de %rande import/ncia para uturas discuss"es sobre o assunto. pois os mesmos. al. este arti%o. Num ambiente assim. -ue se obt'm resultados -ue levar*o os pes-uisadores a descobertas para cura de doen!as e preven!*o de males 8eredit#rios.ez 34. an#lises e cruzamentos entre v#rias in orma!"es.ata Iare8ouse . o maior interesse em utilizar os Data Warehouses est# tamb. 3444. uma pes-uisa -ue volte a vis*o para o Brasil. buscou demostrar um panorama %eral.ispon)vel emB P8ttpBQQSSS. uma erramenta importante para a Bioin orm#tica.m de inte%rar v#rios bancos 8etero%'neos. os pes-uisadores podem azer compara!"es. Com est# erramenta tecnol$%ica. Sandeepan. sendo -ue. a disponibilidade dos mesmos n*o pode ser %arantida e. 0& CONSIDERAÇÕES FINAIS &ste arti%o procurou evidenciar como os Data Warehouses contribuem para o armazenamento e a pes-uisa dos dados em Bioin orm#tica. 1ara trabal8os uturos pode+se mencionar. al. Cracle Corporation. se%undo Bon%iolo 2344L6.

esal-.o de Fon3e" de Dado" e A8 icaCEe" de Bio o:ia Mo ecu ar. 9uiz Fernando Bessa..o de 8e""oa" 8ara o" a4ora3<rio" de 8e"=ui"a. Me3odo o:ia Cien3B5ica na Era da In5or673ica.3.A.3 C[CC.pd R Acessado emB .r%io.=U5U=U4.ispon)vel emB P8ttpBQQSSS. :CCMA.ist.brQpublicacoesQMono%ra ia]<atiana.u v. 34.p8p^ option_com]p8ocadoSnload`vieS_cate%orW`doSnload_.unesc.X .tica.ispon)vel emB P tpBQQSSS. 344L. :enato At)lio.]seibel. .in .4. 34.uol.3.ez 34.ez 34. Nuliana de Maria.ispon)vel emB P8ttpBQQipe.3.X M&NCSSI. Isabel Cristina. <om. S&IB&9.`tWpe_pd R Acessado emB 34 . . . 344L. .4 . C:I<CM9CI.X NCG>&I:A.X M>SICK.com. .in . 3445. BANCO DE DADOS EM BIONINFORMÁTICA. MA<<A: N&<C.ispon)vel emB P8ttpBQQSSS.uarte..cbme%.brQa(e Qapostila..3.netQbibliotecaQsumarioQ44443&Q44443&AZ.]ZL.ispon)vel emB P8ttpBQQcodims. :io Grande do NorteB >F:N.brQ. . 3443.X I<A9IANC.ispon)vel emB P8ttpBQQSSS. <atiana Mara.ez 34. An7 i"e 8anor96ica da Bioin5or673ica no Bra"i $ Pro8o"3a da :e"3.ispon)vel emB P8ttpBQQ%en isU4.eno6a Funciona & 3443. S*o 1auloB >S1.brQuploadsQartc]. BCNGIC9C.X A::>.o a Banco de Dado".pd R Acessado emB 4A . Ca6in#o" e TendFncia" do u"o de Bando de Dado" e6 Bioin5or673ica& C&>91.puc+ rio. S. . . S*o 1auloB Saraiva.pd R Acessado emB . . 344L. &d. F&9IV.o D Bioin5or673ica. .u es. II&CJC:&K. Marcelo... . ed.ez 34.. F#bio <ebaldi Silveira.pd R Acessado emB 4.. 3445. I68 e6en3ando >ra88er" ?6 e re aciona 8ara o Codi6"& 3445.3.X 9&A9. GI9.Y .:>MMCN. A8o"3i a de In3roduC.bib.X S9&JAK. <AKAI. &duardo. C)cero 1in8o. Csvaldo Kotaro.X N>NIC:. @>&I:CJ.ez 34.ispon)vel emB P8ttpBQQarti%ocienti ico. &milio Mario.lprm.ez 34.brQsbc344LQpd Qar-43Y.brQpubQdocsQt8esesQ43]18. Ant?nio Carlos. NC:G&. 9IFSCMI<J.ez 34. &lis/n%ela. 3.X F&::&I:A.usp. >&S1I. Co6o e a4orar 8roAe3o" de 8e"=ui"a& 5.eduQvieSdocQdoSnload^doi_.unicamp.=A=`rep_rep.3.psu.4 . Crici7ma.3..ispon)vel emB P8ttpBQQciteseer0.4.. Ale0andre. :on.ez 34.pd R Acessado emB . :odri%o . 1>C+:io.AA. Bio+AVSB U6a Ar=ui3e3ura 8ara In3e:raC.ime. S*o 1auloB Atlas.adosb34emb34Bioin ormb&.3.. .ez 34. In3roduC.. A :u6a" Pe"=ui"a" e6 Banco" de Dado" e Bioin5or673ica.4Bintroducao+a+ bioin ormatica`id_YBapostilas+e+arti%os`Itemid_LZR Acessado emB . No*o &duardo.pd R Acessado emB 4= .U . No*o Au%usto.brQ%en isQinde0. . \icente &u%enio de :osa. <erence.pd R Acessado emB .pd R Acessado emB 34 .brQca eQpubQ eli0+% .ez 34. An O!er!ie> o5 Bioin5or6a3ic" Re"earc# a3 La>rence Li!er6ore Na3iona La4ora3or@& 3444.ispon)vel emB P tpBQQ tp.3..BGQmaterialb34cursob34bioin oQ9eitura b34ComplementarQarti%osQCamin8osb34eb34<endb&Anciasb34dob34usob34de b34Bancob34de34.natalnet. 1aulo.usp. .