3. fejezet - Genom és evolúció: A genom struktúra diverzitásának alapjai

Tartalom

Szabályozógének
Repetitív szekvenciák és transzpozábilis genetikai elemek
Változó genomok I. ­- Változások a kromoszómák szintjén
A genomméret evolúciója
Genomduplikáció
Kromoszómaduplikációk
Génduplikációk
Változó genomok II — Változó és változékony gének
Neutrális teória — elméleti alapvetés
Gének és fehérjék evolúciója
Adaptív evolúció és neutralitás
Evolúciós genomika
A humán genom dokumentálja génkészletünk történetét
Duplikációk az evolúcióban
A genomméret csökkenhet génvesztéssel
Szimbiózis és horizontális géntranszfer
Az X/Y kromoszómák kialakulása: genomikai kutatások kromoszomális szinten
Transzpozonok és evolúciós fordulatok

A genomszerkezet változatosan alakult az élővilág nagy ágaiban. A baktériumok és vírusok genomjai sok szempontból a hatékonyság és - az ebből eredő - kompaktság mintaképei: genomjukat maximális gyorsasággal replikálják, tehát alapvetően csakis olyan géneket tartalmaznak, amelyekre szükségük van, a „felesleges”, funkció nélküli DNS alig-alig van jelen. A gyors növekedés és korai reprodukció előnyös az olyan élőlények esetén, amelyek gyakorta esnek át gyors populációnövekedésen. A vírusoknál és baktériumoknál a kis genom előnyös, mivel gyorsabban lemásolódhatnak, ami kulcsjelentőségű adaptáció, ha a fajok közötti vagy a gazda-parazita verseny a forrásokért erőteljes. Valóban, sok vírus és baktérium „áramvonalasította” a genomját azáltal, hogy sok "felesleges"géntől megszabadultak (genom erózió vagy génvesztés).

Az eukarióta genomokat a prokariótákéhoz hasonlítva azok hatalmas méretűek, nemkódoló és ismétlődő szekvenciákat tartalmaznak, amelyeknek nem biztos, hogy van egyáltalán funkciója. Az emlős genom minden tekintetben impozáns, ha egy baktériumgenomhoz viszonyítjuk, akár méretét akár komplexitását vesszük tekintetbe.

Az eukarióta gének nagy részét intronok szakítják meg. Az eubaktériumok és archeák génjeiben kevés az intron, és eltávolításuk az elsődleges transzkriptumból más mechanizmussal,az ún. ön-szerkesztés (self-splicing) útján történik. A prokarióták és eukarióták intronjai közötti hasonlóság alapján Walter Gilbert, aki az intronokat az 1970-es évek végén fedezte fel, 1987-ben arra a következtetésre jutott, hogy minden mai életforma ősében jelen lehettek intronok, és egyszerűen elvesztek azokból a génekből és genomokból, amelyekben ma nem fordulnak elő. Ez az „intronok korán” („introns early”) hipotézis ma is nagymértékben elfogadott. Ugyanakkor az ellenkező nézet szerint az intronok olyan struktúrák, amelyek csak jóval később jelentek meg, a prokarióta-eukarióta hasadás után („intronok későn”, „introns late” hipotézis). Az elmélet mellett szól, hogy számos, filogenetikailag bazális (ősi) taxonban nincsenek intronok. Ugyancsak támogatja az utóbbi hipotézist, hogy a legtöbb intron a növényekben és az állatokban is bizonyos kládokra korlátozódik, ami viszonylag kései eredetükre enged következtetni.

Az eukarióta genomok alapvető sajátsága, hogy arányaiban jelentősen több nemkódoló DNS-t tartalmaznak, mint a prokarióta genomok. A humán genomnak csak kb. 1,5 %-a áll fehérje-kódoló szekvenciákból. A tipikus emberi gén akár 95%-ban intronokból állhat.

Hatalmas, nemkódoló DNS-ből álló régiók alkothatnak nagyrészt „önző DNS-t”(„selfish DNA”), amely pusztán replikálja magát, és akkumulálódik a genomokban. Némileg váratlanul a nemkódoló DNS több, mint 10%-a erősen konzervált a régen szétvált fajokban, mint például az egér és az ember, ami arra utal, hogy erős szelekciós nyomás tartja fenn. Sok nemkódoló régió, közte intronok is átíródik RNS szekvenciákká, mint például mikroRNS-ek, amelyek általában 22 bázispár hosszúságúak. Ezek a diverz szekvenciák, amelyek közül némelyik akár 50 000 példányban van jelen, fontos szerepet játszanak a génszabályozásban.

Sok eukarióta gén elsődleges transzkriptuma alternatív splicingon esik át, így egy gén akár többféle mRNS-t is kódolhat. Klasszikus példa a CD44 gén, amely egy sejtek közötti interakciókban szerepet játszó sejtfelszíni glikoproteint kódol. A CD44 génnek 21 exonja van, amelyek közül 12 alternatív splicingon esik át, így potenciálisan több százféle fehérjevariáns jöhet létre. Az alternatív splicing (RNS szerkesztés) fontos mechanizmus, melynek révén a metazoák növelhetik a korlátozott számú génről termelődő fehérjéik funkcionális diverzitását. Az alternatív splicing mintázatáról és szabályozásáról a különböző taxonokban kevés adat áll rendelkezésre.

Az eukarióta genom specifikus sajátságai tehát, amelyek, különböznek a prokariótákétól:

- az egyes gének folyamatossága a legtöbbször megszakad (exonok + intronok)

- bizonyos szekvenciák több példányban fordulhatnak elő

- sokszor óriási DNS-szakaszok nem kapcsolódnak fehérje szintézishez

- a genom megoszlik a sejtmag és a sejtorganellumok között

Szabályozógének

A struktúrgéneken kívül tisztán szabályozó szerepű gének is vannak, pl. homeobox (hox) gének, amelyek (többek között) a testtengelyek kialakulását , a pax gén a szem szerkezetének kialakulását szabályozza. Ezek „mestergének”, azaz a génszabályozási hierarchiában magasan helyezkednek el. Az alájuk rendelt géneket „target-” vagy célgéneknek nevezzük.

A hox-gének klaszterekben helyezkednek el. A klaszterben 3’ irányba lévő gén előbb fejeződik ki az ontogenezis során és az embrióban is az elülső (anterior) testvég fejlődését befolyásolja. Úgy is fogalmazhatunk, hogy kolinearitás figyelhető meg a gének kromoszómán elfoglalt helye és kifejeződési mintázata között. A mestergének testszerveződésért felelős csoportja egy fontos géncsoport a “toolkit” (szerszámosláda) gének osztályának tagja, amelyek az állatok általános testszerveződésének (body plan, Bauplan= testtervének) kialakításában vesznek részt, és az élet általuk “evolúcióképesebbé” vált a soksejtű állatok körében.

A Hox gének az állatoknál mutatják a fent jellemzett kifejeződési mintázatot (kolinearitás). Igaz, hogy az élővilág egyéb részeiben is előfordulnak, de ott „egyszerű” szabályozó génekként működnek. Ennek szellemében vezették be a zootípus fogalmát, ami az ilyen típusú génkifejeződés alapján definiálja az állatokat, és elkülöníti őket az egyéb élőlényektől. Erős indikációk vannak az irányba, hogy a testfelépítés bonyolultabbá válása a filogenezisben összefügg a Hox gének és klasztereik bonyolultabbá válásával.

Hox gének száma:

Szivacsok 1

Ízeltlábúak 8 (1 klaszterben)

Amphioxus (fejgerinchúros) 13 (1 klaszterben)

Emlősök 38 (4 klaszterben)

Sokak szerint 2 genom-megkettőződés történt a gerincesek fejlődése során.

Egerek és legyek Hox génjei közül 6 közös, ezeknek az új- és ősszájúak közös ősében is meg kellett lenniük.

A C-érték

Miért nem a "legfejlettebb", azaz morfológiailag legkomplexebb organizmusoké a legnagyobb méretű genom?

Az ember genomja 3,2 gigabázis (Gb), azaz 3,2 milliárd bázispár, míg Protopterusé (tüdőshal) 140 Gb, egyes egysejtűeké több száz Gb-nyi, a Fritillaria (növény) 130 Gb-nyi genommal bír. A genomméret különbségeinek fő oka általában a nemkódoló DNS, a genomméret legtöbbször retrotranszpozonok hatására sokszorozódik.

A genomméretet gyakorta mérik pikogrammokban (pg): 1 pg DNS jó közelítéssel megfelel 1 Gigabázisnak (Gb), azaz 1 milliárd bázispárnyi szekvenciának. A DNS mennyiségét az egyes fajok haploid genomjának C-értékével jellemezzük. Ahogy genomok százainak mérete összehasonlíthatóvá vált, különös C-érték mintázat rajzolódott ki. Azt várták, hogy az anatómiai, fiziológiai és viselkedési szempontból komplexebb élőlényeknek komplexebb, ennél fogva nagyobb genomjuk van. Az elvárás azonban csak nagyon tág értelemben teljesül.

A metazoáknál és a virágos növényeknél a C-érték 108 bp - 1011 bp között van. A nagyobb taxonómiai egységeken belül is hatalmas különbségek lehetnek (pl. a kétéltűeknél 109 bp-1011 bp közötti értékek fordulnak elő), de a nagyobb egységeken belüli minimális genomméret nő a komplexitás növekedésével. Az első valódi többsejtű törzseknél a C-érték 107-108 bp nagyságrendbe esik. A C-elegans C-értéke 8x107 bp.

Az evolúciós fán emelkedve az élőlények komplexitása és a DNS mennyisége közötti kapcsolat homályos, bár a komplexitással a minimális genomméret általában nő (pl. a gerinceseken belül). A nagy taxonokon belül – gerincesek, virágos növények – nincs kapcsolat a morfológiai komplexitás és a genomméret között. A gerinceseken belül a gömbhal (Fugu) haploid genommérete 0,5 Gb, az egér-, és emberi genom 3 Gb körüli méretű (az emberé egészen pontosan 3,2 Gb), míg a szalamandrák genommérete elérheti az 50 Gb-t.

Bizonyos taxonómiai egységeken belül a genomméret szórása viszonylag kicsi. A madaraknál, hüllőknél és emlősöknél az osztályon belül kicsi (kb. kétszeres) a variáció. Más esetekben – elsősorban a rovaroknál, kétéltűeknél és a növényeknél – a C-értékek közötti különbségek az osztályokon belül akár tízszeres lehet. A házilégy (Musca domestica) genommérete pl. 8,6x108 bp, míg a közeli rokon Drosophila melanogasteré 1,4x108bp.

A C-érték paradoxon fogalom azt jelenti, hogy a genomméret és a genetikai komplexitás között ellentét van, amely kétféleképpen nyilvánul meg:

  1. A DNS-nek jóval nagyobb mennyisége van jelen, mint amire a fehérjék kódolásához szükség van.

  2. A C-értékek óriási mértékben különböznek olyan fajok között, amelyeknek komplexitása nem különbözik. A kétéltűeknél, pl. a legkisebb genom alig kevesebb, mint 109 bp, míg a legnagyobb 1011 bp körüli nagyságú. A már említett szalamandrák körében tízszeres különbségek figyelhetők meg, még egy genuson belül is kétszeres különbség tapasztalható, ami megfelel a gerincesekben tapasztalt különbségeknek. Ekkora komplexitásbeli különbség nem tükröződik a kétéltűeknél, így a DNS-többletért más módon kell elszámolnunk.