2013. nov 29.

81. Hogy történik a DNS szekvenálás?

írta: _Maverick
81. Hogy történik a DNS szekvenálás?

logo.jpgA mai cikkel egy hosszú gondolatmenetet indítunk útjára, mely egymáshoz látszólag nem kapcsolódó témákat felölelve (ezzel is alátámasztva a fő mondanivalót) halad majd heteken keresztül a végkifejlet felé. Szeretnénk egy kicsit jobban érzékeltetni azt, hogy a tudomány milyen kulcsfontosságú szerepet játszik a 21. században, hogy mennyire nélkülözhetetlen ahhoz, hogy az emberiség választ tudjon adni az előtte tornyosuló példátlan kihívásokra, hogy mennyire összefügg egymással szinte minden modern világunkban. Látnunk kell azt is, hogy a jelenlegi társadalmi, politikai rendszerek az esetek döntő többségében bizonyos szempontból tévúton járnak a kritikus problémák felismerését illetően – vagy egyszerűen csak nem a lényegi kérdésekre koncentrálnak a rövid távú célokat szem előtt tartva -, az intézményrendszerek pedig nem tudnak lépést tartani a technikai fejlődés következtében hihetetlen sebességgel változó világgal, ennek eredményeként azok az áttörések, felismerések, melyek orvosolhatnák problémáinkat, sokszor nem tudnak kilépni a kutatóintézetek falai közül, mert nem sikerül hidat létesíteni a politikusok, kutatók, gazdasági szakemberek, mérnökök és egyéb társadalmi csoportok közt megnyílt tátongó szakadékok felett azok egymástól különböző motivációja, érdeklődési területe és érdekei miatt.

A részletek érzékeltetéséhez meg kell majd értenünk bizonyos változásokat, így többek közt az emberiség rendelkezésre álló információ mértékének egészen döbbenetes ütemű gyarapodását, a „Big Data” („Nagy Adat”) új világát és annak az élet minden területére kiható következményeit. Ahhoz, hogy ezt kellően szemléletesen tudjuk bemutatni, elsőként majd az orvostudomány területéről hozunk példát, viszont hogy ez a rész ne lógjon a levegőben, először nem árt tudnunk, hogy miként történik a DNS szekvenálás. Meg hát minden kontextustól függetlenül: régen írtunk már „Hogy működik?” típusú bejegyzést, éppen itt az ideje! Tovább után shotgun és gélben úszó bázispárok következnek!

dna_str_sm.gifA dezoxiribonukleinsav (DNS) a genetikai információt magában tároló összetett molekula. A tárolás mikéntje a digitális adattároláshoz hasonló, csak amíg számítógépeink mindent információt nullák és egyesek sorozatává konvertálnak, addig a DNS négy karakterrel dolgozik: négy heterociklusos bázissal, melyek az adenin (A), citozin (C), guanin (G) és timin (T) névre hallgatnak.

Mivel egy adott élő szervezet teljes tervrajza ilyen láncokban tárolódik, így érthető módon erős volt a késztetés arra, hogy el tudjuk olvasni azokat. De mégis milyen hosszú ez a leírás? Az ember esetében uszkve 3 milliárd karakter. Ez a szám önmagában talán nem mond sokat, de ha kinyomtatnánk mindezt, akkor a megtelő telefonkönyveket egymásra pakolva egy olyan 170 méter magasságú oszlopot kapnánk. És még csak egyetlen ember genetikai kódjáról (genom) beszéltünk! Érezhető hát, hogy már csak a puszta terjedelméből adódóan sem éppen könnyű olvasmányról beszélünk. Nézzük, hogy lehet nekifogni!

Először is: le lehet másolni az információt. A DNS molekula egy kettős csavar, a két lánc közti kapcsolatot az teremti meg, hogy a bázisok képesek páronként egymáshoz kapcsolódni: A a T-hez, G a C-hez. Ez az egyértelmű megfeleltetés azért jó, mert a kettős lánc egyik szála meghatározza a másikat, vagyis tulajdonképpen egy adott szál komplementeréhez hozzákapcsolva a megfelelő bázisokat le lehet másolni azt. Ez elengedhetetlen lesz a kód olvasásához, vagyis a DNS szekvenáláshoz.

250px-Frederick_Sanger2.jpgSzámos különböző módszer létezik, melyek az idők során egyre fejlődtek. A ma legelterjedtebb megoldások alapja az úgynevezett Sanger-módszer, ezt fogjuk bemutatni. Ezt Frederick Sanger angol biokémikus dolgozta ki, amiért 1980-ban Nobel-díjjal jutalmazták. Pontosabban azért, mert a módszerrel első ízben sikerült egy élőlény genomját teljes egészében meghatároznia. A szóban forgó olvasmány az ember genomjához képest egy röpke kis fogalmazvány volt csak: egy bakteriofágról beszélünk, de ez az áttörés nyitotta meg a hosszú utat az emberi genom szekvenálása felé. (Ez volt Sanger második Nobel-díja, az elsőt 1958-ban az inzulinmolekula szerkezetének meghatározásáért kapta.)

A módszer lényegét a már említett másolás, és annak adott betűnél való megszakításának lehetősége adja. Nézzük az alábbi ábrát!

sequencing_med.jpeg

A cél a felül látható ATGACTGAGC szakasz párjának elolvasása. Ehhez először is rengeteg példányban előállítják az ATGACTGAGC szegmenst az eredeti lánc másolásával, majd 4 külön keveréket hoznak létre 4 kémcsőben. Minden kémcsőbe bekerül ez a szakasz, továbbá A, C, G és T bázisok elegye, melyek elkezdenek hozzákapcsolódni a kérdéses szegmenshez (az azonos kezdőpontot egy itt nem részletezendő módszerrel biztosítják). Ezen felül mindegyik keverékhez hozzáadják a 4 bázis egyikének módosított változatát (ddA, ddC, ddG, ddT). Ezek abban különböznek az eredetiektől, hogy hiányzik róluk egy a további kapcsolódást lehetővé tevő csoport, amelynek eredményeként ha ezek beépülnek egy láncba, akkor az nem tud tovább növekedni, nem lesz mihez kapcsolódnia az újabb elemnek. Egy adott keverékben így olyan részmásolatok jönnek létre, melyek mind ugyanott kezdődnek és mindig egy adott betűre végződnek: az első kémcsőben T-re, a másodikban A-ra, stb. A továbbiakban maradjunk a példában az első kémcsőnél. A láncok azért különböző hosszúságúak, mert a bázisok véletlenszerűen kapcsolódnak, vagyis elképzelhető, hogy egy normális T megelőzi a ddT-t a kapcsolódási pontért folytatott versenyúszásban, ezáltal a lánc zavartalanul tovább tud növekedni legalább a következő T-ig. Elegendően nagy számú lánc esetében biztosak lehetünk benne, hogy minden lehetséges hossz előáll.

Nincs más dolgunk tehát, mint fogni az első kémcső tartalmát, hossz szerint sorba rendezni a szakaszokat, és leolvasni, hogy hányadik helyeken áll T betű:

ddextend.jpg

Ha ezt megtesszük mind a 4 mintával, akkor már el is olvastuk az adott DNS szakaszt. De miként lehetséges ez?

sequence4.jpgAz elektroforézis nevű eljárással, melynek során a kémcsőből vett mintát egy gélben futtatják elektromos áram segítségével. A létrehozott elektromos tér a molekulákat a viszkózus közegben a berendezés egyik végéből a másikba hajtja. Minél kisebb egy molekula, annál könnyebben mozog a gélben, így annál messzebbre jut. Ennek eredményeként a molekulák méret szerint térben szétválnak. Ha a 4 kémcső tartalmát egymás mellett futtatjuk, akkor a végén egy az ábrán látható mintázathoz hasonlót kapunk. 

Ezt már csak le kell olvasni. Mindez azonban érezhetően igen fáradtságos munka, mely hosszú láncok esetében csak nehezen és lassan lenne kivitelezhető. Szerencsére sikerült mindezt automatizálni. Ebben az esetben a 4 kémcső tartalmát nem külön, hanem egy sávban futtatják, a négyféle lánczáró bázishoz (ddT, ddA, ddG, ddC) pedig 4, különböző színnel fluoreszkáló fehérjét kapcsolnak. A gél alján a masírozó molekulacsoportok sorát lézerrel gerjesztve azok aztán az adott zárókarakternek megfelelő színben pompáznak.

A kibocsátott fény hullámhossza egy detektorral meghatározható, és ezzel betűről-betűre, automatikusan előáll a karaktersor. Ilyen módszerrel legfeljebb nagyjából 900-1000 karakterből álló láncokat lehet szekvenálni. Mint láthattuk, az emberi genom ennél sok-sok nagyságrenddel hosszabb, így azt valahogy fel kell darabolni. Ez több lépésben történik.

laser.GIF

Az első lépésben a genomot 100-400 ezer bázis hosszúságú szakaszokra bontják. Ezeket nevezik BAC-nak (bacterial artificial chromosome). Az elnevezés onnan származik, hogy a szakaszokat baktériumokba ültetve másolják. A BAC darabokat megjelölik, vagyis lehet tudni, hogy hol helyezkednek el az eredeti genomban, ahogy a második sorban látható az alábbi ábrán, rendezett sort alkotnak. Ezt a rendezettséget az egyes BAC darabok szekvenálásánál hagyják hátra, amikor is a 'shotgun' módszert alkalmazzák: a számos példányban előállított BAC darabokat véletlenszerűen összetörik olyan kis méretű szakaszokra, melyek már a Sanger-módszerrel olvashatóak. Az eredmény sok ismert szakasz, melyeket ugyan el lehet olvasni, de nem lehet tudni, hogy a BAC-on belül hol helyezkedtek el eredetileg. Ezen a ponton a bámulatos képességű algoritmusok veszik át a gyeplőt, és elkezdenek a kis, egymással átfedő darabokkal legózni. Addig rakosgatják egymás mellé a darabokat, míg végül a helyes konfiguráció megtalálásával előáll a darabokból a teljes BAC szakasz.

shotgun.png
Ez az a lépés, amely miatt a számítási képesség fejlődése elengedhetetlenül szükséges volt az emberi genom szekvenálásához. Az ezért a célért küzdő Human Genom Project 1990-ben indult, és 2003-ban ért véget. Összesen 2,7 milliárd dollárba került, és több mint egy évtizedig tartott, eredményeként egyetlen emberi genomot sikerült meghatározni. A technika fejlődésének köszönhetően a 3 milliárd karakter tekintélyes részét a projekt utolsó 1-2 évében olvasták el. Ez a felfutó tendencia azóta is tart, ennek eredményként a genom szekvenálásának költsége és időigénye radikálisan csökken azóta is, de ez már egy másik történet... 

/Ha a leírás néhol nehezen volt követhető a vizualizáció hiánya miatt, akkor ajánljuk az alábbi videót, mely bár angol nyelven van, de annak értése nélkül is jól illusztrálja az elhangzottakat./

 

Források

A kémia portálja

BioNinja

life technologies

Galeridacristata's Blog (magyar)

National Human Genome Research Institute

The University of Michigan

Davidson College

Wikipédia

Sociedad Mexicana de Ciencias Genómicas (angol nyelvű animáció)

 

Ha tetszett a bejegyzés, és szeretnél frissen értesülni az újakról, illetve szívesen olvasnád azokat az írásokat is, melyeket csak ajánlunk, de külön bejegyzéssé nem érnek (vagy nincs szükség kiegészítésükre), vagy a megnéznéd a tudomány világából származó képeket és a hozzájuk kapcsolódó minibejegyzéseket, akkor csatlakozz a blog Facebook oldalához a jobb hasábban megtalálható alkalmazás segítségével, vagy csak nézd meg azokat az ugyanott található linkekre kattintva (FB regisztráció nélkül is elérhetőek)! 

Ha pedig szívesen bemutatnád saját szakterületedet, kutatási témádat, vagy blogunk profiljába illő érdeklődési körödet, akkor írj a jobb oldalon megadott e-mail címre! Nagyon nagy örömmel adnánk helyt magyar egyetemeken tevékenykedő kutatócsoportok munkásságáról szóló beszámolóknak! 

Szólj hozzá

genetika szekvenálás fókuszpont DNS