O DNA pode armazenar dados digitais, como arquivos visuais e de áudio
Science Image Co / Alamy
A inteligência synthetic pode ler os dados armazenados em fios de DNA dentro de 10 minutos, em vez dos dias necessários para métodos anteriores, aproximando o armazenamento de DNA do uso prático na computação.
“O DNA pode armazenar grandes quantidades de dados de uma forma extremamente compacta e permanecer intacto por milhares de anos”, diz Daniella Bar-Lev na Universidade da Califórnia, San Diego. “Além disso, o DNA é naturalmente replicável, oferecendo uma vantagem única para a preservação de dados de longo prazo.”
Mas recuperar as informações codificadas no DNA é um desafio monumental, porque os fios são misturados e confusos quando armazenados. Durante o processo de codificação de dados, as cadeias individuais às vezes são replicadas imperfeitamente e alguns fragmentos podem ser perdidos inteiramente. Como resultado, os dados de leitura armazenados no DNA podem se parecer reconstruindo um livro de uma caixa cheia de páginas raladas e de erro de digitação.
“Os métodos tradicionais lutam com esse caos, exigindo dias de processamento”, diz Bar-Lev. A nova abordagem “simplifica isso com a IA treinada para identificar padrões no barulho”, diz ela.
Bar-Lev e seus colegas desenvolveram um método de IA chamado DNAformer que pode decodificar com rapidez e precisão sequências de DNA confusas. O sistema inclui um modelo de IA de aprendizado profundo treinado para reconstruir sequências de DNA, um algoritmo de computador separado que identifica e corrige erros e um terceiro algoritmo de decodificação que converte tudo de volta em dados digitais enquanto corrige os erros restantes.
Em experimentos, o DNAformer poderia ler 100 megabytes de dados armazenados em DNA quase 90 vezes mais rápido que o próximo método mais rápido-que foi desenvolvido com algoritmos de computação tradicionais baseados em regras-enquanto alcançava uma precisão melhor ou comparável. Os dados decodificados incluíram uma imagem colorida de tubos de teste, um clipe de áudio de 24 segundos do famoso discurso de desembarque da lua de Astronaut Neil Armstrong e texto escrito sobre por que o DNA é um meio de armazenamento de dados promissores.
A equipe planeja desenvolver versões do DNAformer adaptadas a técnicas mais recentes para codificar dados no DNA, diz Omer Sabary na Technion – Instituto de Tecnologia de Israel.
“Fundamentalmente, como nossa abordagem não depende de métodos específicos de síntese ou sequenciamento de DNA (DNA), ela pode ser adaptada às tecnologias futuras, ainda assim desenvolvidas, que podem ser mais viáveis comercialmente”, diz ele.
Tópicos: