2012. aug 21.

16. A DNS-be gépelhető könyv

írta: _Maverick
16. A DNS-be gépelhető könyv

If you can write DNA, you are no longer limited to 'what is', but to what you could make.”

-Drew Endy-

dns.jpgBizonyára sokan emlékeznek a 90-es évek közepén beszerzett első személyi számítógépükre, a csodálatos tárolási kapacitású merevlemezre, mely végeláthatatlannak tűnő 128 Megabyte adatot is képes volt akár elraktározni. Az egymás közt cserélgetett kislemezek időszaka volt ez, amikor szinte elképzelhetetlen volt, hogy egyszer könnyűszerrel nőjük majd ki az 1 TB-s külső HD-t is a fényképeknek, videóknak, archivált munka file-oknak köszönhetően. Mára eljutottunk oda, hogy lényegében minden információ digitalizált, és gyakorlatilag folyamatosan hely problémákkal küzdünk szorgosan szortírozva a fontos és eldobható információkat, vagy egyszerűen non-stop bővítve a kapacitásunkat.

George M. Church és Sriram Kosuri csoportja a Harvard orvosi karán egy tulajdonképpen egyszerű, mégis meghökkentően hatékony és elegáns eljárást dolgozott ki a növekvő adatmennyiség archiválására. Az alapgondolat egyszerűségében gyönyörködtet: gondoljunk egy végtelenül bonyolult, komplex leírást igénylő objektumra, és nézzük meg, hogy miként tárolható az azt definiáló adathalmaz. Ez az objektum jelen esetben egy élő szervezet – akár maga az emberi test –, melynél komplexebb alkotást keresve sem találhatnánk a természetben, a beépített 'merevlemez' pedig a mindenki által jól ismert DNS molekula, mely a megfelelő nukleobázisok hosszú sorának formájában magában hordozza teljes lényünket.

coding-decoding-dna-storage-640x413.jpg

Church és csapata egyszerűen fogta a tárolni kívánt információt – jelen esetben egy könyvet –, melyet aztán az ismert módszerrel 0-k és 1-esek sorává alakított, felkészítvén azt a digitális tárolásra. A szokásos procedúra azonban nem állt meg itt, ugyanis ezúttal a biteket egy DNS molekulába próbálták elraktározni, ehhez pedig át kellett konvertálni a 0-k és 1-ek sokaságát nukleobázisokká. Ez a lépés egyszerűen történt: az adenint és a citozint 0-ként, a timint és a guanint pedig 1-ként definiálták. A DNS szekvenciák előállítása már megoldott, viszont minél hosszabb az adott szekvencia, annál nehezebb és költségesebb a folyamat. Éppen ezért a könyvet apró darabokra bontották – hasonlóan ahhoz, ahogy az adatokat a floppy-n lévő szektorokra szétosztják –, és minden darabot elláttak egy 19 bites címmel, hogy később azonosítani tudják helyüket. Az így létrehozott rövidebb szekvenciák már szintetizálhatóak és tárolhatóak egy üveg chipre 'nyomtatva' őket. Élő baktériumokat nem szerencsés felhasználni, mert a számukra értelmetlen szekvencia túlságosan hamar kiveszne evolúciós okokból kifolyólag.

Maga az eljárás tehát tulajdonképpen roppant egyszerűen összefoglalható, azonban eddig komoly korlátozó tényező volt a DNS előállítás és analizálás lassúsága. A Human Genome Project keretében egyetlen emberi genom vizsgálata (kb. 3 milliárd bázispár) évekbe telt, a modern mikrofluidikai eljárásoknak köszönhetően ez azonban mára alig igényel 3 órát. Ez természetesen még mindig nagyon lassú egy hagyományos tárolóhoz képest, de archiválásra tökéletesen megfelelő. Annál is inkább, mert az elérhető adatsűrűség lélegzetelállító.

Egyetlen gramm DNS 700 terabyte adatot tud elraktározni (14000 db 50 gigás Blu-ray lemezről beszélünk). A legmodernebb hagyományos tárolóból annyi kellene ehhez, hogy összsúlyuk elérni a 151 kilogrammot, nem beszélve térfogatukról.

Fontos hangsúlyozni, hogy itt ténylegesen csak tárolásról beszélhetünk, mivel a DNS láncot a kívánt bázisokkal úgy szintetizálják. Ez azonban aligha jelenthet problémát a fentebb vázolt tárolási kapacitás mellett. A raktározás viszont megbízható – akár évszázadokon át is –, szemben a külső merevlemezekkel, melyek mozgó alkatrészeik miatt időnként eltávoznak az örök bitmezőkre. 5,27 millió bitből mindössze 10 volt hibás, és a hagyományos hibakereső eljárások lényegében zavar nélkül implementálhatóak – ezeken felül a nagy kapacitás miatt egész egyszerűen sok példányban is elkészülhet minden egyes szekvencia, amelyek összevetésével a hibák kizárhatóak.

Jelen pillanatban ez a módszer a költségek miatt még nem versenyképes, de a rohamos fejlődésnek köszönhetően az árak folyamatosan zuhannak, és rövidesen elérhetik az ehhez szükséges szintet is, új távlatokat nyitva az adattárolás horizontján. A DNS megértése tehát nem csak a „mit hozhatunk létre” irányában jelenthet új távlatokat, hanem a „mit tárolhatunk” témakörében is.  

/A teljes publikáció megtalálható a Science magazinban./

Források


Writing the Book in DNA (Harvard)

Extremetech

Guardian

Smithsonian.com

Szólj hozzá

adattárolás fókuszpont DNS IT Harvard