A DNS mint tartós és hatékony biológiai adattár a digitális adatok számára 169; Assmann Alapítvány

Hírek a tudománytól

A DNS mint hosszú távú és hatékony biológiai adathordozó a digitális adatok számára [169]

A személyre szabott orvoslás koncepciója azt ígéri, hogy a betegségek megelőzésére és kezelésére vonatkozó ajánlásokat a lehető legnagyobb mértékben az egyes betegekhez igazítja (1). A siker érdekében először nagy mennyiségű adatot kell összegyűjteni, kiértékelni és mindenekelőtt menteni.

hatékony

A hagyományos adathordozók, például a merevlemezek, viszonylag rövid életűek. Ezen adatgyűjtemények megőrzése érdekében rendszeresen másolni kell őket. A Columbia Egyetem és a New York Genome Center (NYGC) két tudósa kiaknázza a DNS anyagban rejlő lehetőségeket, mint a digitális információ biológiai tárházát (2). A mobiltelefonon történő video streaminghez tervezett algoritmus segítségével sikerült egy teljes számítógépes operációs rendszert, egy filmet és más fájlokat tömöríteniük DNS oligonukleotidokban, és sértetlenül visszakeresni őket.

Tudományos részletek

A genetikai hordozók szinte tökéletes tárolóközegek. A DNS évezredek alatt rendkívül tömörített információkat kap, és technikailag nem korszerűtlen.

A számítástechnika professzora, Yaniv Erlich, a Columbia Data Science Institute munkatársa, és munkatársa, Dina Zielinski most a New York Genome Centerrel együttműködve bebizonyították, hogy a DNS alkalmas a digitális adatok sértetlenségére is. Hat reprezentatív fájlt választottak ki a DNS-be kódolásra; egy komplett számítógépes operációs rendszer, a francia rövidfilm A vonat megérkezése La Ciotatba 1895-től, az Amazon 50 dollár értékű ajándékkártyája, számítógépes vírus, úttörő jelvény és Claude Shannon információelméletíró 1948-as kiadványa.

Mesterfájlban egyesítve a hat adathordozót bináris kód rövid sztringekké alakították át, amelyek egyekből és nullákból álltak. A szökőkútkorrekciós algoritmus segített ezeket a húrokat véletlenszerűen hozzárendelni a DNS négy nukleotidbázisához: A, G, C és T, és törölni hibakombinációkat. A kapott információcseppek vonalkódokat kaptak a visszafejtéshez.

A DNS-szintézis startupja, a San Francisco-i Twist Bioscience az így leírt 72 000 DNS-szálat transzformálta DNS-molekulákká. Végül, de nem utolsósorban, a digitális információkat hibamentesen lehívták ezekből a biomolekulákból. Kódolási technológiájukkal a tudósoknak is sikerült lemásolniuk a DNS-szálakat, és így hibátlan másolatokat készítettek az eredeti fájlokból.

A tömörítési teljesítmény is figyelemre méltó volt. Minden bázikus nukleotidba átlagosan 1,6 bitet csomagoltunk, legalább 60% -kal több adatot, mint a hagyományos technikákkal. Csak egyetlen gramm DNS-anyag szükséges 215 petabájt (= 1 000 000 000 000 bájt) adat tárolásához. A biomolekulákat tehát a valaha használt legsűrűbb adattároló eszköznek tekintik. A digitális adatok biológiai tárolásban történő archiválása még mindig túl drága ahhoz, hogy nagyobb mértékben felhasználják őket. 7000 dollár kellett a DNS szálainak elkészítéséhez, és további 2000 dollár kellett a megfejtésükhöz.