AI kan afkode digitale data, der er gemt i DNA på få minutter i stedet for dage

En ny AI-baseret metode kan nøjagtigt gendanne digitale data fra DNA-strenge næsten 90 gange hurtigere end ældre teknikker, hvilket øger muligheden for praktisk DNA-lagring til beregning

DNA kan gemme digitale data, såsom visuelle og lydfiler

Kunstig intelligens kan læse data, der er gemt i DNA -strenge inden for 10 minutter i stedet for de krævede dage til tidligere metoder, hvilket bringer DNA -opbevaring tættere på praktisk brug i computing.

”DNA kan gemme store mængder data i en ekstremt kompakt form og forblive intakt i tusinder af år,” siger Daniella Bar-Lev ved University of California, San Diego. “Derudover er DNA naturligt replikerbar og tilbyder en unik fordel til langvarig databeskyttelse.”

Men at hente de oplysninger, der er kodet i DNA, er en monumental udfordring, fordi trådene blandes og virvler sammen, når de opbevares. Under datakodningsprocessen replikeres individuelle tråde undertiden ufuldkommen, og nogle fragmenter kan gå helt tabt. Som et resultat kan læsning af data, der er gemt i DNA, ligne rekonstruktion af en bog fra en kasse fyldt med strimlet, skrivefejlsider.

”Traditionelle metoder kæmper med dette kaos og kræver behandlingsdage,” siger Bar-Lev. Den nye tilgang “strømline dette med AI trænet til at se mønstre i støj”, siger hun.

Bar-Lev og hendes kolleger udviklede en AI-drevet metode kaldet dnaformer, der hurtigt og nøjagtigt kan afkode virvlet DNA-sekvenser. Systemet inkluderer en dyb indlærings -AI -model, der er trænet til at rekonstruere DNA -sekvenser, en separat computeralgoritme, der identificerer og korrigerer fejl og en tredje afkodningsalgoritme, der konverterer alt tilbage til digitale data, mens de løser resterende fejl.

I eksperimenter kunne DNAcormer læse 100 megabyte DNA-lagerdata næsten 90 gange hurtigere end den næste hurtigste metode-som blev udviklet med traditionelle, reglerbaserede computeralgoritmer-mens den opnåede bedre eller sammenlignelig nøjagtighed. De afkodede data omfattede et farvet billede af reagensglas, et 24-sekunders lydklip af astronaut Neil Armstrongs berømte månelandingstale og skrevet tekst om, hvorfor DNA er et lovende datalagringsmedium.

Holdet planlægger at udvikle versioner af DNAformer, der er skræddersyet til nyere teknikker til kodning af data til DNA, siger Omer Sabary ved Technion – Israel Institute of Technology.

”Af afgørende betydning, fordi vores tilgang ikke er afhængig af specifikke (DNA) syntese eller sekventeringsmetoder, kan det tilpasses fremtidige, endnu ikke-overudviklede teknologier, der kan være mere kommercielt levedygtige,” siger han.