Você está na página 1de 3

Armazenamento de Dados em Moléculas de DNA

Gabriel Zurawski de Souza


gabrielzds03@gmail.com
Pontifícia Universidade Católica do RS
Porto Alegre, RS, Brasil

RESUMO condicionam o desenvolvimento dessa tecnologia estão: a alta densi-


O presente trabalho busca apresentar os conceitos básicos para o dade de armazenamento (devido a grande capacidade das moléculas
compreendimento do estudo que busca usar moléculas de DNA de DNA de serem condensadas), o baixo consumo de energia, e
(Ácido Desoxirribonucleico) como forma de armazenamento de a longa vida útil dessas moléculas que superam os componentes
dados, assim como já é feito hoje em dias por meio de dispositi- eletrônicos já utilizados, além é claro das estruturas das cadeias de
vos eletrônicos como: Discos Rígidos, Pendrives, SSDs (Solid-state DNA formadas por bases nitrogenadas (Citosina, Guanina, Adenina
drive), entre outros. Esse trabalho também apresentará alguns avan- e Timina) que se assemelham a forma binária como dados já são
ços na área e uma panorama da capacidade que essa tecnologia tem armazenados, baseados em 0 e 1.
para superar em muito os já existentes métodos de armazenamento.
ACM Reference Format:
Gabriel Zurawski de Souza. 2022. Armazenamento de Dados em Moléculas
de DNA. In Produção textual - Metodologia Científica - PUCRS 2022/1. ACM,
New York, NY, USA, 3 pages. https://doi.org/10.1145/1122445.1122456

1 INTRODUÇÃO
Durante a década de 1970, havia uma enorme limitação na quanti-
dade de dados que podia ser armazenado, compartilhado e trans-
portado. Um disquete, por exemplo, também chamado de floppy
disk, não armazenava mais do que 1,44Mb, o que forçava muitas 2 METODOLOGIA
vezes a utilização de diversos deles para compartilhar um único Os três artigos utilizados para a realização desse resumo foram sele-
arquivo, vídeo ou programa. Anos mais tarde, com a chegada dos cionados pensando em: apresentar um panorama geral do assunto
CDs e DVDs (que inicialmente armazenavam 700Mb) e Pendrives abordado, apresentar as capacidades que a tecnologia proveniente
(que inicialmente armazenavam 8Mb, mas que hoje já se encontra desse estudo podem vir a ter e exemplificar métodos que são atual-
na casa do 1Tb) a capacidade de armazenamento aumentou substan- mente pesquisados na área para a viabilização dessa possível nova
cialmente. Porém, ainda assim continuava surgindo a necessidade tecnologia.
de armazenar mais e mais dados e novas tecnologias cada vez mais
avançadas surgiam para sanar essa carência, como por exemplo,
discos Blu-ray (de até 100Gb de memória) e Discos Rígidos (que já
chegam a 15Tb). Esse enorme e constante avanço prova o cresci-
mento exponencial da quantidade de dados gerados que precisam
ser armazenados. Contudo, com os serviços de nuvem, o Big Data
e a necessidade do público de armazenar arquivos de maior qua-
lidade gráfica: como jogos eletrônicos, filmes, fotos e vídeos em
resoluções cada vez mais altas (4K e 8K), a tecnologia não vem mais
conseguindo acompanhar esse crescimento.
Umas das formas mais estudadas hoje em dia para o armaze-
namento de grandes quantidades de dados é o uso de moléculas 3 A BIOBOLOGIA POR DE TRÁS
de DNA (Ácido Desoxirribonucleico), umas das “mídias” de maior
No ano de 1953, após diversos avanços no estudo de uma estrutura
capacidade de armazenamento da natureza. Dentre os fatores que
peculiar no núcleo de células humanas denominada DNA, James
Watson e Francis Crick fizeram uma das últimas maiores descober-
Permission to make digital or hard copies of all or part of this work for personal or
classroom use is granted without fee provided that copies are not made or distributed tas da biologia molecular, a estrutura em dupla hélice da cadeia de
for profit or commercial advantage and that copies bear this notice and the full citation DNA, a qual proporciona maior compactação das cadeias, permi-
on the first page. Copyrights for components of this work owned by others than ACM tindo que se desenvolvam maiores e mais complexas e capazes de
must be honored. Abstracting with credit is permitted. To copy otherwise, or republish,
to post on servers or to redistribute to lists, requires prior specific permission and/or a armazenar ainda mais informações genéticas.
fee. Request permissions from permissions@acm.org. Uma molécula de DNA pode ser entendida como uma longa
Metodologia Científica, Semestre 2022/1„ Porto Alegre, RS cadeia formada por quatro tipos de bases nitrogenadas, que por
© 2022 Association for Computing Machinery.
ACM ISBN 978-1-4503-9999-9/18/06. . . $15.00 sua vez formam pares: Adenina (A), Timina (T), Citosina (C) e
https://doi.org/10.1145/1122445.1122456 Guanina(G), assim como mostra a figura 1.
Metodologia Científica, Semestre 2022/1„ Porto Alegre, RS Gabriel Zurawski de Souza

ser armazenada. A segunda etapa, a sintetização, é aquela que irá


por meio de processos químicos formar a cadeia de DNA com as
bases nitrogenadas, produto da codificação. Aqui ocorrerá a síntese
artificial do DNA que armazenará os dados. A partir dessa etapa os
dados já estarão armazenados na molécula de DNA e esses poderão
ser guardados em algum recipiente ou estrutura. A terceira etapa, a
reação em cadeia da polimerase (ou PCR), a qual já faz parte do pro-
cesso de leitura dos dados, se resume em um processo de fazer uma
cópia e amplificar um segmento da cadeia de DNA que se deseja
ler (ou então da cadeia inteira se assim for necessário). A quarta
etapa, o sequenciamento do DNA (ou de parte dele), é o processo
- como o próprio nome diz - de sequenciar as bases nitrogenadas
do segmento que passou pelo processo de PCR, para então ler as
bases nitrogenadas que compõem a informação. A quinta e última
etapa, a decodificação, é o método contrário da codificação, em
que a sequência de bases nitrogenadas é codificada de volta para a
forma de números binários, para que então possa ser interpretada
por um computador.
Figura 1: Estrutura em dupla hélice com os bases nitrogena-
das e seus respectivos pares.

Estima-se que uma molécula de DNA de massa unitária de cerca


de 1021 bases poderia armazenar até 455 Eb de informação. Além
disso, a durabilidade é outro ponto forte das moléculas de DNA.
Pesquisas feitas hoje ainda são capazes de sequenciar genomas
de até 180 milhões de anos encontrados em plantas fossilizadas.
Logo, sua durabilidade é maior do que qualquer outro dispositivo
já utilizado para armazenar dados, além de sua alta resistência à
decomposição mesmo em ambientes de baixas e altas temperaturas.

3.1 Método de Armazenamento


O armazenamento e leitura de dados - que são inicialmente binários
- ocorre mediante 5 etapas: a codificação, a sintetização, a reação em
Figura 2: Etapas do armazenamento e leitura dos dados em
cadeia da polimerase, o sequenciamento do DNA, e a decodificação.
uma cadeia de DNA
A primeira etapa, a codificação, é a responsável por converter
os números binários que constituem um dado - seja imagem, texto,
vídeo, áudio, etc - em uma sequência de bases nitrogenadas que,
3.2 Problemas
na próxima etapa, serão sintetizadas e irão compor uma cadeia
de DNA. Aqui entra a primeira área a ser melhor estudada: qual Mesmo com a tecnologia atual ainda existem problemas que invia-
a melhor forma de se codificar a informação? Pois enquanto os bilizam o uso de DNA como forma de armazenamento de dados. O
números binários podem assumir apenas dois valores (0 ou 1) uma processo de sintetização de DNA ainda é um processo caro e extre-
sequência de bases pode assumir até quatro valores (A, T, G e C) mamente lento se comparado com outras formas de armazenamento
tornando assim a codificação menos restrita e com maiores possi- como Discos Rígidos, SSDs e DVDs. Além disso, a atual tecnologia
bilidades. Tomemos como exemplo duas maneiras de codificação não é capaz de sequenciar grandes cadeias, mas apenas pequenas
para o mesmo caso: para a codificação da letra “e” que tem como parcelas delas. E, ainda assim, todo o processo de leitura levaria
número binário correspondente 01100101. Poderíamos utilizar ape- muito tempo, mesmo que fosse para a leitura de pouco bits. Outro
nas 2 bases nitrogenadas, uma para representar o 0 e outra para fator é a impossibilidade de se alterar a cadeia de DNA após ela ser
representar o 1. Por exemplo, usar A para representar 1 e T para sintetizada, permitindo apenas a leitura e a produção de cópias, as
representar 0. Nesse caso teríamos como resultado TAATTATA e quais essas sim poderiam passar por alterações na sua cadeia. Logo
assim um total de 8 espaços na cadeia de DNA seriam ocupados tornando o processo limitado e não permitindo a gravação e leitura
para guardar apenas uma letra. Por outro lado, poderíamos utilizar instantânea que temos com os dispositivos atuais.
A para representar 00, T para representar 01, G para representar 10
e C para representar 11. Nesse caso teríamos como resultado TGTT, 4 CONCLUSÕES
e assim um total de 4 espaços na cadeia de DNA seriam ocupados - a Atualmente, apesar de um uso mais popular e doméstico dessa tec-
metade em comparação ao primeiro caso. Logo, através de relações nologia não ser viável, em um futuro próximo o armazenamento
matemáticas seria possível otimizar o uso de espaços utilizados nas de dados em moléculas de DNA pode ser um valioso recurso no ar-
cadeias de DNA, que dependeria também do tipo de informação a mazenamento de informações a respeito da nossa história. Museus
Armazenamento de Dados em Moléculas de DNA Metodologia Científica, Semestre 2022/1„ Porto Alegre, RS

e estúdios de cinema tiveram sua atenção atraída por essa tecno- 5 REFERÊNCIAS
logia devido a sua capacidade de armazenar para a posterioridade [1] Bingzhe Li, Nae Young Song, Li Ou, David H. C.Du: Can We
uma quantidade massiva de dados. Além disso, em um futuro mais Store the Whole World’s Data in DNA Storage? HotStorage 2020
distante, a quantidade de dados será tão massiva que os dispositi- [2] Chenyang Wang, Guannan Ma, Di Wei, Xinru Zhang, Peihan
vos convencionais não serão mais capazes de armazenar. Estima-se Wang, Cuidan Li, Jing Xing, Zheng Wei, Bo Duan, Dongxin Yang,
que apenas em 2020 a quantidade de dados gerados no mundo já Pei Wang, Dongbo Bu, Fei Chen: Mainstream encoding-decoding
teria chegado a 44 trilhões de gigabytes. Logo, a alta capacidade de methods of DNA data storage. CCF Trans. High Perform. Comput.
armazenamento de dados oferecida por essa tecnologia, apesar de 4(1): 23-33 (2022)
ainda longe do seu aperfeiçoamento, é um dos melhores meios de [3] Shuguang Liu, Zhenxing Ye, Maolong Chen: Next Generation
sanar essa futura carência que o mundo irá passar. Information Storage Technology: DNA Data Storage. ICMLC 2020:
213-217
https://www.bringit.com.br/blog/dicas-e-tutoriais-para-notebook/armazenamen
conheca-as-principais-caracteristicas-de-dispositivo/

Você também pode gostar