Você está na página 1de 11

CONTRIBUIES DO USO DE DATA WAREHOUSE PARA O ARMAZENAMENTO DE DADOS EM BIOINFORMTICA Luiz Fernando Pico o IFMS Instituto Federal de Mato

o Grosso do Sul Nova Andradina MS, Brasil luizpicolo@luizpicolo.com.br RESUMO Com o aumento das in orma!"es provenientes das #reas biol$%icas, a Biolo%ia e a in orm#tica encontraram um ponto em comum, ori%inando assim, a Bioin orm#tica. &ste novo ramo da ci'ncia tem como ob(etivo utilizar o poder computacional para or%anizar e estruturar os dados de orma compreens)vel. Neste sentido, as tecnolo%ias computacionais s*o utilizadas para acilitar o processo de consulta, cruzamentos e a%re%a!"es de dados. &ste arti%o, buscou+se demonstrar os Data Warehouses e suas contribui!"es para o armazenamento de dados em Bioin orm#tica, por serem uma lon%a s,rie de vis"es de dados tiradas ao lon%o do tempo, proporcionando aos pes-uisadores in orma!"es por meio da correla!*o entre os dados. Pa a!ra" c#a!e$ Bioin orm#tica, Data Warehouse, Banco de .ados. %& INTRODU'O Na sociedade contempor/nea a tecnolo%ia n*o , al%o distante ou somente acess)vel aos %randes pensadores cient) icos ou empresas, ela est# presente nos a azeres comuns de todos. A utiliza!*o do celular, a televis*o, ou o simples ato de se consultar a internet, nada mas s*o do -ue e0emplos do crescimento tecnol$%ico -ue se vive nos tempos atuais. Assim, a tecnolo%ia %erou mudan!as -ue oram incorporadas e s*o utilizadas de orma -uase transparente pela sociedade. 1ara Mattar Neto 234456, outro ato -ue merece aten!*o, e -ue so reu mudan!as devido a computa!*o, s*o os conceitos relacionados ao ac7mulo de in orma!"es. 1ara o autor, acumular in orma!"es n*o deve ser compreendido como sinal de sabedoria, pois na era da in orm#tica, todas as in orma!"es s*o armazenadas, disponibilizadas e transmitidas por poderosos bancos de dados, os -uais azem parte deste cabedal tecnol$%ico da contemporaneidade vi%ente. 1ara ele, a 8abilidade de estabelecer cone0"es entre as in orma!"es , o ato primordial para a %era!*o de in orma!"es relevantes sobre o tema -ue , pes-uisado. Neste sentido, como a irma Mattar Neto 234456, a in orm#tica caracteriza+se como um nova tecnolo%ia intelectual -ue potencializa n*o apenas a mem$ria, mas tamb,m di erentes ormas de racioc)nio e perspectivas sobre a in orma!*o. 9o%o, tratar in orma!"es e

3 n*o somente acumul#+las tornou+se a orma mais e icaz de se obter resultados satis at$rios. Como na sociedade, e an#lo%a as ideias de Mattar Neto 234456, as ci'ncias biol$%icas tamb,m est*o incorporadas a tecnolo%ia e ao tratamento de seus dados e a %era!*o de in orma!"es relevantes. Se%undo :oc8a 234;;6, com o avan!o da biolo%ia e da in orm#tica, ambas ci'ncias encontraram entre si um ponto em comum. &st# nova ci'ncia -ue seria criada, sur%ia a partir da necessidade da biolo%ia de n*o apenas armazenar as in orma!"es %eradas, mas tamb,m de tratar as memas com e-uipamentos de alta precis*o. <al ci'ncia, criada em meados dos anos =4, oi c8amada de Bioin orm#tica. 1or este motivo, 8# est# similaridade com os conceitos de Mattar Neto 234456, sendo -ue, a Bioin orm#tica busca utilizar o poder computacional para armazenar e trata as in orma!"es obtendo assim novos e relevantes in orma!"es. .entro deste conte0to, a tecnolo%ia dos Data Warehouses apresenta uma alternativa para o tratamento das in orma!"es em Bioin orm#tica. >m Data Warehouse, como erramenta computacional, absorve todos estes conceitos apresentados por Mattar Neto 234456, ou se(a, de n*o ser somente uma orma de armazena%em, mas sim uma erramenta -ue amplia as possibilidades e au0ilia no cruzamento de in orma!"es e tomada de decis"es. Neste sentido, este arti%o tem como ob(etivo demostrar um dos principais es or!os computacionais para sanar al%uns destes problemas relacionados ao armazenamento e ao tratamento das in orma!"es. 1ortanto, para uma compreens*o mais minuciosa, tratar+se+# especi icadamente sobre os Data Warehouses e suas contribui!"es para o armazenamento de in orma!"es em Bioin orm#tica. (& RE)IS'O TE*RICA Ao adentrar a teoria -ue embasa os meios pelos -uais a in orm#tica se li%a as pes-uisas biol$%icas, torna+se claro -ue a biolo%ia, nos dias atuais, seria imposs)vel sem os recursos -ue a computa!*o proporciona, visto -ue, toda in orma!*o produzida, como no caso das pes-uisas %en?micas, necessitam ser armazenadas, tratadas e, posteriormente, analisadas. 9o%o, com o avan!o de ambas as partes, sur%e um ponto em comum -ue une as duas ci'ncias ori%inalizando um novo ramo de pes-uisa, a Bioin orm#tica. A Bioin orm#tica pode ser compreendida como uma #rea multidisciplinar. Se%undo @ueiroz 234;36, este ramo da ci'ncia , um campo de pes-uisa -ue est# em r#pido crescimento sendo desenvolvida para atender as necessidades da manipula!*o de %randes volumes de

A dados %en,ticos e bio-u)micos, os -uais, ori%inam+se a partir dos es or!os individuais de v#rios pes-uisadores. Sua abran%'ncia se az em diversos aspectos e em v#rios campos cient) icos comoB na )sica, na -u)mica, na biolo%ia, ci'ncia da computa!*o, entre outros. Cutra caracter)stica da Bioin orm#tica de ine+se por ser uma modalidade -ue envolve aspectos de a-uisi!*o, processamento, armazenamento, distribui!*o, an#lise e interpreta!*o das in orma!"es. Assim, Da Bioin orm#tica EFG tem como ob(etivo desenvolver e aplicar t,cnicas computacionais no estudo da %en,tica, da biolo%ia molecular e da bio-u)micaH 2II&CJC:&K e 9&A9, 344L, p. 4;6 buscando a compreens*o e a rela!*o das diversas in orma!"es racionadas e oriundas destas diversas #reas biol$%icas. 1ortanto, Da Bioin orm#tica usa o poder computacional para catalo%ar, or%anizar e estruturar estas in orma!"es em uma entidade compreensiva e e0tremamente importante para a biolo%iaH 2:CCMA, 34;;, p. 4A6. Cutro ato interessante -ue imp"e o uso de erramentas computacionais , a %rande escala de dados ori%inados das pes-uisas realizadas por meio do pro(eto %enoma ;. Com o in)cio deste pro(eto em ;==4, o volume de in orma!"es derivadas do con8ecimento %en?mico tornou+se e0ponencialmente crescente. >m e0emplo, e conse-uentemente con irma!*o deste ato, oi a publica!*o do %enoma 8umano o -ual cont,m cerca de A4 mil %enes, ou se(a, a se-u'ncia completa de um indiv)duo tem cerca de A bil8"es de bancos de .NA. No Sanger Center3 (# e0istem al%umas dezenas de terabytes armazenados com uma estimativa de crescimento, e -ue, se%undo 9i c8itz 2344L6, podem crescer na ordem de um petabyte por ano. Cutro e0emplo deste crescimento absurdo de dados %en?micos , o GenBank3 o -ual armazenava -uase ;5 bil8"es de dados e, em Naneiro de 34;;, passou a conter -uase ;A4 bil8"es, se%uindo assim em ritmo de crescimento constante. Com taman8a -uantidade de in orma!"es necessitou+se de erramentas computacionais -ue pudessem sistematicamente armazenar tal -uantidade de dados para -ue os mesmos se tornassem ontes de estudos. Neste sentido, Feli0 et al 23443, p. 456 e0p"em -ueB
o %rande volume de in orma!*o %erado pelos pro(etos de an#lise de
;

3 A

C %enoma 2con(unto de %enes de uma esp,cie6 est# contido na #rea da ci'ncia denominada %en,tica, -ue , respons#vel pelo estudo da reprodu!*o, 8eran!a, varia!*o e de aspectos relacionados O descend'ncia. .ispon)vel emB P8ttpBQQeducar.sc.usp.brQlicenciaturaQ344;Q%enomaQ%enoma.8tmlR. Acessado emB 45 .ez 34;3 Centro de 1es-uisa e de se-uenciamento de .NA brit/nico. P8ttpBQQSSS.san%er.ac.uTQR GenBanT , EFG uma cole!*o anotada de todas as se-u'ncias de .NA publicamente dispon)veis. .ispon)veis emB P8ttpBQQSSS.ncbi.nlm.ni8.%ovQ%enbanTQR. Acessado emB 34 .ez 34;3

U
transcriptomasU tem tornado cada vez mais comple0o o armazenamento e a an#lise dos dados. 1ara contornar tal di iculdade, devem ser implementados, bancos de dados, -ue disponibilizem, de modo con i#vel, os dados e erramentas de an#lise. 2F&9IV, 3443, p. 456

Nustamente neste ponto, apoiando+se na a irma!*o acima, pode+se irmar -ue 8# a prem'ncia de bancos de dados robustos e sistemas %erenciadores de bancos de dados 2SGB.s6 -ue possam suportar taman8a %randeza de in orma!"es. Al,m dos so tSares, o desa io apresentado pela Bioin orm#tica , encontrar a mel8or orma de armazenamento e de pes-uisa 2S@956 para os dados %erados. 9i sc8itz 2344L, p. 4A6 a irma -ueB
um sistema de banco de dados , EFG parte de um sistema de in orma!*o, o -ual inclui todos os componentes -ue s*o envolvidos na or%aniza!*o dos recursos. &sses incluem os pr$prios dados, o so tSare do SGB., o 8ardSare do sistema, a m)dia de armazenamento e os aplicativos -ue acessam e atualizam os dados. .esta orma, o sistema de banco de dados , parte importante da or%aniza!*o de um sistema de in orma!*o. 1or isto, o ciclo de vida um sistema de in orma!*o deve tamb,m incluir o ciclo de vida de um banco de dados. 29IFSCMI<J, 344L, p. 4A6

Bancos de dados, se%undo <aTai, Italiano e Ferreira 234456, s*o a cole!*o de dados lo%icamente relacionados -ue cont,m al%um si%ni icado, ou se(a, elas s*o estruturas constru)das e posteriormente preenc8idas para um prop$sito espec) ico. Cutra caracter)stica apontada pelos autores , -ue os bancos de dados representam aspectos do mundo real, ou como os pr$prios dizem, o Dm)ni mundoH, e toda altera!*o no Dm)ni mundoH provoca altera!*o em sua base de dados. 9o%o, a a irma!*o de 9i sc8itz 2344L6 neste ponto entra em concord/ncia com a de <aTi, Italiano & Ferreira 234456, em -ue ambos os autores atribuem aos bancos de dados a import/ncia na or%aniza!*o e na posterior utiliza!*o dos dados, %erando assim, bene )cios para o ob(etivo -ue o mesmo oi criado. N# os DSistemas Gerenciadores de banco de .ados ou 2SGB.s6 s*o uma cole!*o de pro%ramas -ue permitem aos usu#rios criarem e manipularem um banco de dadosH 2<AKAI, I<A9IANC & F&::&I:A, 3445, p. 456 por meio de uma inter ace de alto n)vel. Ao contr#rio da proposta eita para os bancos de dados, ou se(a, a de ser estruturado para determinado im, o SG.B tem prop$sito mais %en,rico direcionado O acilitar o processo de de inir, construir e manipular bancos de dados de diversas aplica!"es. Se%undo <aTai, Italiano e Ferreira 234456 com o tempo, os SGB.s passaram a utilizar di erentes ormas de representa!*o ou modelos
U

1ara maiores in orma!"es visiteB 8ttpBQQSSS.ime.usp.brQposbioin oQcv34;;Qeduardoreis.pd Acessado emB 34 .ez 34;3 .o in%l's, Structured @uerW 9an%ua%e ou 9in%ua%em de Consulta &struturada.

5 de dados para descrever a estrutura das in orma!"es contidas em seus bancos de dados. Assim, o ob(etivo de se pro(etar um banco de dados , acomodar in orma!"es para -ue usu#rios em potencial possam usu ruir dos dados -ue o mesmo cont,m, de orma #%il e ob(etiva. +& OB,ETI)OS C presente arti%o apresenta os resultados de uma pes-uisa -ue teve como ob(etivo principal compreender o uso dos Data Warehouses para o armazenamento das in orma!"es provenientes da Bioin orm#tica atentando assim Os discuss"es relacionadas aos aspectos deste ramo cient) ico e, em particular, para o au0)lio do mesmo para uturas tomadas de decis"es e cone0*o entre in orma!"es. 1ara a mel8or compreens*o do ob(etivo %eral, oram de inidos al%uns ob(etivos espec) icosB Compreender os relevantes -ue azem a cone0*o entre a ci'ncia biol$%ica e a computa!*oX .emostrar a contribui!*o dos Data Warehouses para a tomada de decis"es em Bioin orm#ticaX .escobrir como est*o sendo estruturados os .ata Iare8ouses para atender os re-uisitos da Bioin orm#tica. -& METODOLO.IA A metodolo%ia, com base nos conceitos de Gil 234;46, adotada para a elabora!*o deste arti%o oi constitu)da da pes-uisa biblio%r# ica. Se%undo o autor, toda pes-uisa acad'mica re-uer em determinados momentos a realiza!*o do trabal8o caracterizado como pes-uisa biblio%r# ica. A maioria das pes-uisas s*o realizadas com base principalmente em materiais obtidos em ontes biblio%r# icas, permitindo ao investi%ador a cobertura de uma %ama de en?menos maior -ue o mesmo poderia pes-uisar diretamente. A primeira etapa, a -ual oi divida em duas sub+etapas, oi a busca de ontes re erentes ao tema proposto. &m primeiro momento oi eita a aborda%em dos estudos re erentes a Bioin orm#tica e banco de dados, buscando a rela!*o entre estas duas lin8as de pes-uisa. 9o%o ap$s, realizou+se a busca de te0tos sobre os conceitos de Data Warehouses e como os mesmos estavam sendo utilizados e estruturados para o armazenamento dos dados. A se%unda etapa se deu a leitura do material e o ic8amento do mesmo. Ap$s o ic8amento se ez a or%aniza!*o l$%ica dos assunto. A 7ltima etapa oi o relacionamento de todas as ideias e a cria!*o deste arti%o.

L /& DISCUSS'O DOS RESULTADOS >m problema a ser superado ao se tratar sobre banco de dados para Bioin orm#tica , -ue bancos de dados, se%undo IieczoreT e 9eal 2344L6, t'm sido em %rande parte usados para administrar dados empresariais, n7meros simples, car#ter ou datas. 1oucos bancos de dados tiveram uma 8abilidade nativa para lidar com dados comple0os, como dados multim)dia, te0to, dados espaciais, ou dados %en,ticos 2sucess*o de %enes6. Neste sentido, a busca, a compara!*o e o armazenamento, como pode ser visualizado na Fi%ura ;, de %randes cadeias de caracteres se torna di )cil de ser e0ecutada.

Figura 1: Etapas realizadas para armazenar um segmento (sucesso de genes) de DNA em um banco de dados. (WIECZOREK e LEAL, 2006, p. 04)

Baner(ee 234446 relata em suas e0plana!"es sobre plata ormas de banco de dados para Bioin orm#tica -ue, conse-uentemente, todos os %enes ser*o encontrados, n*o por ser somente um ato, mas um tend'ncia com o volume de dados %erados. &ntretanto, muitos dos desenvolvimentos paralelos a estas descobertas, as -uais acarretar*o mudan!as beni%nas na #rea da medicina, como a descoberta de doen!as 8eredit#rias ou a cura de males (# e0istentes por e0emplo, n*o ser*o eitas dentro de laborat$rios biol$%icos, mas em plata ormas computacionais de alto desempen8o, com sistemas de armazenamento em massa -ue conter*o os dados %en?micos, bancos de dados para pes-uisar os dados, identi icando semel8an!as e padr"es, bem como a inte%ra!*o so tSare para a uni ica!*o das atias de con8ecimento desenvolvidas nas diversas institui!"es. &0istem -uatro tecnolo%ias -ue tendem a resolver os problemas re erentes a armazenamento de dados biol$%icos, as -uais s*oB tecnolo%ias de Warehousing6 para dados
L

C termo Warehousing n*o possui tradu!*o ade-uada para o portu%u's.

Y em padr"es %en,ticosX a ar-uitetura de e0tensibilidade para armazenamento de dados nativamente e e0ecu!*o de estruturas de procuraX tecnolo%ias de inte%ra!*o de dados para 8abilitar -uest"es 8etero%'neas por ontes biol$%icas distribu)das, e tecnolo%ias de portal de Internet -ue possam permitir a publica!*o das in orma!"es de pes-uisas. Sendo -ue, para este arti%o, se ocar# apenas nas tecnolo%ias de Warehousing para dados em padr"es %en,ticos. Se%undo <aTai, Italiano e Ferreira 234456 um Warehousing pode ser de inido como uma t,cnica utilizada para recupera!*o e inte%ra!*o de dados a partir de ontes distribu)das, aut?nomas e, possivelmente, 8etero%'neas. &stes dados s*o armazenados em um %rande dep$sito c8amado de Data Warehouse. >m Data Warehouse sumaria os dados -ue s*o or%anizados em dimens"es, disponibilizando+os para consultas e an#lises por meio de aplica!"es C9A1 2On-Line Analytical sistemas de suporte O decis*o. 1ara Bon%iolo 2344L6 uma di erencial -ue se destaca entre um Data Warehouse e um banco de dados transacional est# no ato de -ue o se%undo, como a pr$pria denomina!*o in orma, armazena dados das transa!"es di#rias nas -uais s*o e0ecutadas opera!"es pr,+ de inidas. 1or este motivo os dados podem so rer mudan!as. N# um Data Warehouse armazena dados para an#lise e tomada de decis*o. Isso pode envolver consultas -ue variam em sua comple0idade, pois o mesmo cont,m dados 8ist$ricos de anos. 9o%o, al%umas caracter)sticas necess#rias para este ambiente de armazenamentos s*oB
Inte%ra!*o de dados de m7ltiplas ontesX Facilitar o processo de consulta, cruzamentos e a%re%a!"es de dadosX Ser le0)vel para suportar %randes mudan!as e -uantidade de in orma!*oX dentre

rocessing ou processamento anal)tico online6 e

outrasX
&star dispon)vel para o acesso para -ue os usu#rios possam intera%ir com os dados

de orma r#pida e ob(etivaX .esta orma, pode+se a irmar -ue Dos dados armazenados no Data Warehouse s*o, para todos os prop$sitos pr#ticos, uma lon%a s,rie de vis"es do banco de dados, tiradas ao lon%o do tempoH 2<AKAI, I<A9IANC & F&::&I:A, 3445, p. Z=6. Neste sentido, os Data Warehouses proporcionam tanto # Bioin orm#tica como para empresas, uma base concreta de a%re%a!*o de dados para uturas an#lises. Cs dados contidos em um Data Warehouse s*o or%anizados e armazenados com a perspectiva de lon%o prazo, visando desta orma a

Z realiza!*o de compara!"es e pes-uisas nas in orma!"es contidas. Cutra caracter)stica b#sica est# na sua inte%ra!*o de dados. Como as in orma!"es provenientes da Bioin orm#tica n*o s*o oriundas apenas de uma onte e sim de uma a%lomera!*o de dados vindouros de laborat$rios biol$%icos espal8ados em v#rios centros universit#rios e laborat$rios de pes-uisa, a inte%ra!*o de dados proporcionada por um Data !arehouse uma in ra estrutura -ue permite criar e manter uma vis*o consistente de v#rias ontes de dados aut?nomas. &ntretanto, mesmo sendo bem aceita est# aborda%em para o tratamento dos problemas da inte%ra!*o de dados vindouros de ontes de dados distribu)das e 8etero%'neas, Seibel 234446 aponta -ue est# orma de inte%ra!*o tamb,m n*o atende O inte%ra!*o de in orma!"es biol$%icas com rela!*o O atualiza!*o dos es-uemas e tamb,m com rela!*o O atualiza!*o das inst/ncias de dados 2os pes-uisadores precisam ter acesso aos dados mais recentes6. 9o%o, baseando+se na a irma!*o (# citada, Seibel 234446 prop"e uma complementa!*o * aborda%em do Data Warehouse, a -ual pode ser visualizada na Fi%ura 3"
>ma ar-uitetura baseada na aborda%em !rapper-#e$ia$or di ere undamentalmente da aborda%em Data Warehouse pelo ato de -ue os dados, na primeira, n*o s*o materializados. 1or,m, estas aborda%ens podem ser complementares pois o mediador pode ser usado como onte de dados para a implementa!*o do Data Warehouse 2S&IB&9, 3444, p. 4U6.

&m ;==L

o La!rence Li%er#ore &ational Laboratory deu inicio ao pro(eto

Data'oun$ry para a cria!*o de um Data Warehouse para o armazenamentos de dados %en?micos. Se%undo Critc8loS 234446, para a cria!*o de um Data Warehouse deve+se criar uma estrutura com alto %rau de le0ibilidade para lidar com a natureza din/mica do dom)nio. Ao contr#rio de aplica!"es comerciais, ontes de dados cient) icos, dando en ase a dados %en?micos, s*o e0tremamente din/micas e, em sua %rande maioria, oriundas de diversas localidades e banco de dados di erentes. 9o%o, para sanar este problema, uma das camadas presentes em um Data Warehouse s*o os Wrappers, os -uais permitem Do acesso Os ontes de dados distribu)das e 8etero%'neas e promovem a trans orma!*o entre o modelo de dados da onte e o modelo de dados internoH 2C[CC, 3445, p. ;U6, e outra s*o os (e$iators 2Mediadores6 -ue o erecem o acoplamento entre provedores e consumidores de dados por envio de servi!os -ue tratam a -uest*o sem/ntica e sinta0e entre os ob(etos dos sistemas locais. &ste sistema ornece uma vis*o uni orme dos recursos -ue est*o dispon)veis para usu#rios, permitindo manipular esses recursos por meio de uma lin%ua%em de alto n)vel. Sempre -ue uma onte de dados muda suas in orma!"es, os Wrappers e os (e$iators, como

= mostra a Fi%ura 3, devem ser atualizados para -ue estas modi ica!"es se(am espel8adas no Data Warehouse"

Figura 2: Arquitetura de um Data Warehouse. (CRITCHLOW et al , 2000, p. 08)

IieczoreT e 9eal 2344L6 e0p"e -ue, al,m dos v#rios problemas e solu!"es (# citados, ainda 8# %randes desa ios para a introdu!*o desta aborda%em, pois deve+se manter um Data Warehouse e0tremamente uncional, mesmo inte%rando v#rias ontes de dados -ue so ram mudan!as constantemente. Contudo, v#rios pes-uisadores se debru!am sobre o assunto para criar solu!"es para tal situa!*o. C Data Warehouse, como oi a irmado por Baner(ee 234446, , uma tend'ncia para o armazenamento de dados oriundos das pes-uisas %en?micas, pois os dados %erados n*o s*o armazenados apenas em um banco de dados, mas espal8ados em diversas institui!"es de pes-uisas espal8adas pelo mundo. DCom a proli era!*o destes bancos de dados p7blicos -ue tem sido observado nos 7ltimos anos, os pes-uisadores precisam de uma orma #cil e intuitiva de acessar todos estes dadosH 2BCNGIC9C, 344L, p. Z56. 9o%o, baseando+ se nestas in orma!"es, nada mais plaus)vel -ue, com as car%as e recar%as eitas em um Data Warehouse, todos os laborat$rios de pes-uisas possam ter em m*os uma c$pia das in orma!"es para -ue os mesmos possam realizar suas pes-uisas mediante aos dados coletados. Cutro ato -ue (usti ica a utiliza!*o dos Data Warehouse , -ueB
consultar E...G dados de orma distribu)da tem seus problemas e limita!"es, como restri!"es de recursos do servidor remoto, preocupa!*o com a se%uran!a dos dados E...G pela rede, al,m da lo%)stica inerente a

;4
consulta de bancos distribu)dos. Num ambiente assim, consultas distribu)das -ue %erem um %rande volume de dados s*o di )ceis de processar, al,m de re-uerer -ue consultas comple0as inte%rem dados 8etero%'neos de ontes distintas. 2BCNGIC9C, 344L, p. Z56

Al,m da limita!*o citada, pode+se incluir a possibilidade de erros ao se retornar certa -uantidade de dados. Como os dados est*o distribu)dos em servidores remotos, a disponibilidade dos mesmos n*o pode ser %arantida e, uma consulta pode ser al8a devido a est# circunst/ncia. Assim um .ata Iare8ouse , uma erramenta importante para a Bioin orm#tica, pois os mesmos, se%undo Bon%iolo 2344L6, s*o constru)dos para -ue tais dados se(am armazenados e acessados de orma a n*o serem limitados por tabelas e lin8as estritamente relacionais. Cutro adendo , -ue, o maior interesse em utilizar os Data Warehouses est# tamb,m no ato -ue, al,m de inte%rar v#rios bancos 8etero%'neos, os mesmos convertem e limpam seus dados e implementam erramentas -ue acilitam a nave%a!*o pelos mesmos, permitindo cruzamentos e a%re%a!"es. 0& CONSIDERAES FINAIS &ste arti%o procurou evidenciar como os Data Warehouses contribuem para o armazenamento e a pes-uisa dos dados em Bioin orm#tica. Com est# erramenta tecnol$%ica, os pes-uisadores podem azer compara!"es, an#lises e cruzamentos entre v#rias in orma!"es, as -uais s*o t*o importantes para as pes-uisas biol$%icas, pois, por meio deste cruzamentos de dados , -ue se obt'm resultados -ue levar*o os pes-uisadores a descobertas para cura de doen!as e preven!*o de males 8eredit#rios. 1ara trabal8os uturos pode+se mencionar, na lin8a de pes-uisa sobre banco de dados, como est*o sendo utilizados os bancos de dados para o armazenamento das in orma!"es provenientes das pes-uisas eitas no Brasil, sendo -ue, este arti%o, buscou demostrar um panorama %eral. Assim, uma pes-uisa -ue volte a vis*o para o Brasil, seria de %rande import/ncia para uturas discuss"es sobre o assunto. 1& REFER2NCIAS BAN&:N&&, Sandeepan. A Da3a4a"e P a35or6 5or Bioin5or6a3ic". Cracle Corporation, :edSood S8ores, 3444. .ispon)vel emB P8ttpBQQSSS.%randpoo8ba8.netQSandeepanQ\9.B]Bioin ormatics.pd R Acessado emB 45 .ez 34;3.

;; BCNGIC9C, &lis/n%ela. An7 i"e 8anor96ica da Bioin5or673ica no Bra"i $ Pro8o"3a da :e"3;o de 8e""oa" 8ara o" a4ora3<rio" de 8e"=ui"a. Crici7ma, 344L. .ispon)vel emB P8ttpBQQSSS.bib.unesc.netQbibliotecaQsumarioQ44443&Q44443&AZ.pd R Acessado emB 34 .ez 34;3 C[CC, <atiana Mara. I68 e6en3ando >ra88er" ?6 e re aciona 8ara o Codi6"& 3445. .ispon)vel emB P8ttpBQQcodims.lprm.in .u es.brQpublicacoesQMono%ra ia]<atiana.pd R Acessado emB 4= .ez 34;3. C:I<CM9CI, <erence.X M>SICK, :on.X S9&JAK, <om. An O!er!ie> o5 Bioin5or6a3ic" Re"earc# a3 La>rence Li!er6ore Na3iona La4ora3or@& 3444. .ispon)vel emB P8ttpBQQciteseer0.ist.psu.eduQvieSdocQdoSnload^doi_;4.;.;.AA.=A=`rep_rep;`tWpe_pd R Acessado emB 34 .ez 34;3. F&9IV, Nuliana de Maria.X .:>MMCN., :odri%o .uarte.X NCG>&I:A, F#bio <ebaldi Silveira.X N>NIC:, \icente &u%enio de :osa. NC:G&, :enato At)lio.X A::>.A, 1aulo.X M&NCSSI, Marcelo. .eno6a Funciona & 3443. .ispon)vel emB P8ttpBQQipe.cbme%.unicamp.brQca eQpubQ eli0+% .pd R Acessado emB ;4 .ez 34;3. GI9, Ant?nio Carlos. Co6o e a4orar 8roAe3o" de 8e"=ui"a& 5. &d. S*o 1auloB Atlas, 34;4. 9IFSCMI<J, S,r%io. A :u6a" Pe"=ui"a" e6 Banco" de Dado" e Bioin5or673ica. 1>C+:io, 344L. .ispon)vel emB P8ttpBQQSSS.natalnet.brQsbc344LQpd Qar-43Y;.pd R Acessado emB 4A .ez 34;3. MA<<A: N&<C, No*o Au%usto. Me3odo o:ia Cien3B5ica na Era da In5or673ica. 3. ed. S*o 1auloB Saraiva, 3445. @>&I:CJ, Ale0andre. A8o"3i a de In3roduC;o D Bioin5or673ica. :io Grande do NorteB >F:N, 3443. .ispon)vel emB P8ttpBQQ%en isU4.esal-.usp.brQ%en isQinde0.p8p^ option_com]p8ocadoSnload`vieS_cate%orW`doSnload_;4Bintroducao+a+ bioin ormatica`id_YBapostilas+e+arti%os`Itemid_LZR Acessado emB ;; .ez 34;3. :CCMA, C)cero 1in8o. BANCO DE DADOS EM BIONINFORMTICA. >&S1I, 34;;. .ispon)vel emB P8ttpBQQarti%ocienti ico.uol.com.brQuploadsQartc];;=U5U=U4;]ZL.pd R Acessado emB ;U .ez 34;3. S&IB&9, 9uiz Fernando Bessa. Bio+AVSB U6a Ar=ui3e3ura 8ara In3e:raC;o de Fon3e" de Dado" e A8 icaCEe" de Bio o:ia Mo ecu ar. .ispon)vel emB P tpBQQ tp.in .puc+ rio.brQpubQdocsQt8esesQ43]18.]seibel.pd R Acessado emB 4; .ez 34;3. <AKAI, Csvaldo Kotaro.X I<A9IANC, Isabel Cristina.X F&::&I:A, No*o &duardo. In3roduC;o a Banco de Dado". S*o 1auloB >S1, 3445. .ispon)vel emB P8ttpBQQSSS.ime.usp.brQa(e Qapostila.pd R Acessado emB ;Y .ez 34;3. II&CJC:&K, &milio Mario.X 9&A9, &duardo. Ca6in#o" e TendFncia" do u"o de Bando de Dado" e6 Bioin5or673ica& C&>91, 344L. .ispon)vel emB P tpBQQSSS.u v.brQ.BGQmaterialb34cursob34bioin oQ9eitura b34ComplementarQarti%osQCamin8osb34eb34<endb&Anciasb34dob34usob34de b34Bancob34de34.adosb34emb34Bioin ormb&;tica.pd R Acessado emB ;4 .ez 34;3.