Genomika „sensu stricto” — rövid áttekintés

A genomika (egy élőlény teljes genetikai információjának vizsgálata), mint önálló tudományág – ha vannak még ilyenek a biológián belül - az 1980-as években jelent meg, majd az 1990-es évektől számos faj genom projektjével rohamos fejlődésnek indult.

Gyökerei azonban jóval korábbiak, a DNS-szekvencia meghatározásával egyidősek. Az első, teljességében megszekvenált genom a Φ-X174 bakteriofágé volt, amelyet 1980-ban közöltek. Sanger - a szekvenálás egyik atyja - végzi el Φ-X174 bakteriofág genom szekvenálását, amely kis mérete folytán ezekben a technikai szempontból korai időkben is kezelhető volt: az egyszálú DNS-e 5386 nukleotidból áll, ennek 95%-a 11 gént kódol. 1982-ben Sanger, munkatársaival a λ-fág 10-szer hosszabb genomját is megszekvenálta, ez 48502 bp hosszú.

1984. július: Az MRC (Medical Research Council) kutatói (UK) leírják az Epstein-Barr vírus teljes 170 kb méretû DNS szekvenciáját (Nature).

1985. december: Kary Mullis és társai a Cetus Corp.-nál kifejlesztik a PCR (polymerase chain reaction = polimeráz láncreakció) technikát (Science), amely óriási lökést adott a robosztus szekvenálási technikák megjelenéséhez.

1986. június: Leroy Hood és Lloyd Smith (Caltech) kifejlesztik az elsõ DNS szekvenáló automatát. (Nature)

1989-ben Francis Collins és Lap-Chee Tsui megszekvenálja az első eukarióta gént, amely a CFTR fehérjét kódolja, e gén hibája okozza a cisztás fibrózist.

1989. októberében megalakul a NIH–nél a NCHGR (National Center for Human Genom Research).A Humán Genom Projekt több állam által támogatott, nemzetközi projekt, amelyet

1990-ben indítottak el 15 éves időtartamra, hárommilliárd dollár támogatással (fő támogatója az USA két hatalmas intézménye, a Department of Energy és a National Institutes of Health (NIH). A program első igazgatója ugyanaz a Watson volt, aki megfejtette a DNS kettős spirált.1993. áprilisától az NCHGR új igazgatója Francis Collins (Univ. Michigan)

1990. augusztus: Négy modell szervezeten megindul a nagy léptékű szekvenálás (Mycoplasma capricolum, Escherichia coli, Caenorhabditis elegans, Saccharomyces cerevisiae).

1991-ben J. Craig Venter és munkatársai a Smallpox vírus shotgun szekvenáló módszerrel nyert térképét közlik le

1991. júniusában japán kutatók elkezdik a rizs genom szekvenálását.

1995. júliusában Venter és Claire Fraser (TIGR) továbbá Hamilton Smith (John Hopkins) publikálják a Haemophilus influenzae baktérium, mint az első sejt teljes genomjának szekvenciáját.

Archebaktériumok

Archaea genomstruktúra:

A két tucatnyi ismert Archeánál 0,49 Mbp-tól (Nanoarchaeum equitans) 5,75 Mbp-ig (Methanosarcina acetivorans) terjed a genomméret, ez összevethető a bakteriális genomokkal (0,58 Mbp-9,11 Mbp; 256 faj alapján).

A baktériumokhoz es eukariótákhoz hasonlóan az ősbaktériumoknál is genomméretét genetikai események sora alakította: kimutathatóak a génduplikáció, laterális géntranszfer, öröklődés során történő génvesztés látványos példái. A baktériumokhoz hasonlóan 3 fő mechanizmus segíti elő a genom plaszticitást: a replikációs terminusokhoz kapcsolt átrendeződés, inszerciós szekvencia mediált rekombináció és DNS integráció a tRNS génekbe. Értékelve ezeket a mechanizmusokat a genom plaszticitás olyan mértékű mint a baktériumoknál. 

A legkisebb genomú ősbaktériumok és baktériumok a legkevésbé változó élőhelyekre korlátozódik (pl.: egy bizonyos gazdaszervezetre). A legkisebb szabadon élő ősbaktériumok a Termoplasmatales és a hidrogenotróp 1. osztályba tartozó metanogének csoportjába tartoznak. A nagy genommal rendelkezőek legkomplexebb élőhelyeken lelhetőek fel. 

A genomméret csakúgy, mint a baktériumoknál arányos a kódolt gének számával, kb. 1000 bp-ra jut egy gén, majdnem állandó a "kódolási sűrűség".  (Ez alól a Methanomicrobiales a kivétel, náluk jelentősen csökken a kódoló tartalom aránya.)

Az archaeák genomjának fő komponense mindig egy cirkuláris kromoszóma. (Egyedül a Haloarcula marismortui-nak van egy második, sokkal kisebb kromoszómája).

Az összes archaea extrakromoszómális elem cirkuláris, az extrém halofilek és a metanogének körében gyakori a meglétük, de előfordulnak a Crenarchaeota-csoportban is. 

Az átlagos G+C tartalom és a genomméret között nem áll fent korreláció sem az archaeák esetében sem a baktériumoknál. 

A G+C tartalom az archaea kromoszómákban nem egyenletes, gyakran szignifikáns eltérés adódik a kódoló és a nemkódoló régiók között. Az upstream promoter szekvenciák inkább A+T gazdagok (pl. TATA box-ok), így létre tudnak hozni egy rigid, meghajlott szerkezetet ami sokkal könnyebben kitekeredik. A terminális régiókra szintén jellemző, hogy inkább A+T-ben míg a replikációs origó(k) környéke inkább G+C-ben gazdag. 

Míg a bateriális genomok egy kiindulási pontot használnak a replikációhoz, addig némelyik ősbaktérium többet is használ, de sokkal kevesebbet, mint az eukarióták.

A genomok összevetéséből kiderül, hogy a nagy léptékű, replikációs origó központú, szimmetrikus inverziók ugyanolyan gyakoriak az ősbaktériumokban mint a baktériumokban. Ősbaktériumokban (mint a baktériumokban) jellemző a koreguláció és koexpresszió.

A protein kódoló gének (ORF) struktúrája egyezik a bakteriális ORF-ekkel, nincsenek gyakori megszakító intronok. Tehát struktúra szintjén a genom a baktériumra hasonlít, a géntermékek homológiája tekintetében viszont inkább az eukariótákra. 

Fellelhetőek specifikus intronok az archaea rRNS- és tRNS-ekben, melyek kivágása hasonlít az eukarióta tRNS intronra jellemző folyamatra. 1-es és 2-es típusú intronok gyakorisága nem ismert az archaeákban,a spliceoszómás intronokból viszont sokkal kevesebb van mint az eukariótákban. 

Az archaeákban sokkal több az inteinnel (öneltávolításra képes fehérjeszegmensek; „protein intronok”) rendelkező fehérjét kódoló gén mint a baktériumokban illetve az eukariótákban. 

Összegzésképpen: Struktúrális különbségek alapján az eukarióta genomok egyértelműen elkülöníthetőek az archaea és a bakteriális genomoktól. Az archaea és a baktérium genomok viszont ugyanazoknak a tulajdonságoknak a variációiban térnek el, alapjaiban nem különböznek a gén és genomstruktúrájukban.

A Saccharomycescerevisiae genomja

Az egysejtű gombák közé tartozó pék vagy sörélesztő ( Saccharomyces cerevisiae) ősi idők óta az ember második legjobb barátja. Azonban a S. cerevisiae jelentősége túlmutat a mindennapos élelmiszeripari alkalmazásán, mivel a genomikai kutatások szempontjából mérföldkőnek számító lépések megtételéhez segítette hozzá a tudományterületet. Az 1980-as évek elején a genom szekvenálások előfutáraként a "magasabb rendű" állatok genomjának fizikai térképezését végezték a terület kutatói, amihez gyakran a S. cerevisiae-ben kifejlesztett mesterséges kromoszómát (Yeast Artificial Chromosome - YAC) használták. A YAC-ok használatával minden addiginál nagyobb méretű (0,1 - 1,0 Mb) kromoszóma szakaszok klónozása vált lehetővé, ami jelentősen felgyorsította a fizikai térképezés meglehetősen lassú tempóját. A S. cerevisiae hódító útja a genomika területén az első teljes hosszában megszekvenált eukarióta kromoszóma (III. kromoszóma - 315 kb.) 1992-es publikálásával folytattódott. A következő években az élesztő további kromoszómáinak a szekvenciája vált ismertté, végül ezt a folyamatot koronázta meg 1996-ban a teljes genomi szekvencia közzé tétele. A S. cerevisiae genomját azóta többször újra szekvenálták és más élesztőgomba szekvenciákkal vetették össze, ennek eredményeként jelenleg a legjobban karakterizált eukarióta genomnak számít. A 16 élesztő kromoszóma 12.1 Mb-os genomot hordoz, amin ~6500 ORF-et azonosítottak. A genom méretének és az ORF számnak a hányadosa utal arra, hogy egy rendkívül kompakt genomról van szó. Az élesztő gének átlagos mérete 1,45kb és csupán ritkán (4%) szakítja meg a kódoló szakaszt intronalis szekvencia. Az intronok rövidek és a gén 5’ végéhez közel helyezkednek el. A pre-mRNS-ből történő hatékony intron eltávolítást erősen konzerválódott splicing szekvenciák biztosítják. Ez is hozzájárulhat ahhoz, hogy az alternativ splicing - eltérően a magasabb rendűeknél tapasztalt gyakorisággal szemben - ritka kivételnek számít. Az intergenikus régiók szintén rövidek, kevés repetitiv elemmel megtüzdelve. A "klasszikus" fehérje és RNS (tRNS, rRNS és snoRNS) gének mellett, 15 olyan ncRNS (fehérjét nem-kódoló RNS) gén is előfordul, ami ismeretlen funkciójú RNS-t kódol. A ncRNS-k bizonyos osztálya - más élőlényekből származó adatok alapján - a transzkripciós szabályozásban és a kromatin szerveződésében játszik szerepet. Ennek fényében van remény arra, hogy a S. cerevisiae úttörő szerepe a genomika, pontosabban a funkcionális genomika területén továbbra is megmarad.

A további genomoknak, kiemelten a humán genomnak külön fejezetet szentelünk. Sorrendjük kissé önkényes, eleinte követjük a tényleges történések sorrendjét, majd lazán fűzzük fel a genomokat. Miután az Eubaktériumok számos jeles tananyagban tárgyalásra kerülnek, és mondanivalónk szempontjából nem bírnak különös jelentőséggel, ezeket nem tárgyaljuk.

Caenorhabditis elegans

A C. elegans volt az első soksejtű organizmus, amelynek teljes genomszekvenciáját meghatározták. A 97Mb méretű genomja 6 kromoszómába rendeződ. A hím egyedekben az X ivari kromoszóma mellett nincsen Y kromoszóma (XO ivari kariotípus).

Genomja kb. 8-szor nagyobb az élesztőénél. Az exonok a genom közelítőleg 27%-át teszik ki, génenként átlagosan 5 intron van. Eukarióta viszonylatban az 1gén/5 kb génsűrűség viszonylag alacsony. A gének 25%-a rokon funkciójú gének klasztereiből áll, az eukarióták körében különlegességnek számító operonokkal (közösen szabályozott gének együttese).

A Drosophila melanogaster genomja

A Drosophila melanogaster teljes kromoszómális állománya 180 Mb-t tesz ki. Ennek 2/3-a viszonylag laza szerkezetű eukromatin. Ez tartalmazza az aktív gének jelentős részét. A kompakt heterokromatin elsősorban a centromer körüli régióra jellemző: kevés benne a kódoló régió, főleg a AATAACATAG szekvencia tandem ismétlődéseiből áll.

A két nagy autoszóma, a 2. és 3. kromoszómák mellett egy kis, 1Mb-nyi autoszóma (4. kromoszóma), és az X és Y nemi kromoszómák találhatók a genomban. Az Y kromoszóma géntartalma minimális és heterokromatikus régiók alkotják.

13.600 körüli génszáma kb. kétszerese az élesztő genomban található génszámnak. Géndenzitása 1gén/9kb.

A genom meghatározása óriási nemzetközi összefogással történt, ennek főszereplői a Celera Genomics és a Berkeley Egyetem voltak. A szekvenálás fő módszere (a whole genome shotgun sequencing) a projekt indulása idején még nem volt bizonyítottan alkalmas hasonló méretű feladatok kivitelezésére.

A szekvencia annotációja egy a Celera által 1999 novemberében rendezett találkozón történt, a jelen levő szakértők a évszázados múltját képviselték.

A további kutatások bebizonyították, hogy a melanogaster fehérjekódoló génjeinek 44%-a, a C. elegans hasonló génjeinek 25%-a rendelkezik humán homológgal.

Bizonyos fehérjék (pl. cytc) funkciója azonos a három fajban, más esetekben a homológ fehérjék funkciója eltérő.

A szekvenciaszinten fellelhető döbbenetes átfedések jelentősége elméleti és orvostudományi szempontból is felbecsülhetetlen.

Fugu rubripes

A fugu a japánok konyhaművészetéből elhíresült, halálos idegmérget tartalmazó halfaj, amely a japán virtus jelképévé is vált. Sydney Brenner zseniális választása volt a fugu, kis genommérete miatt. A Fugu Genome Project-et 1989-ben kezdték Sydney Brenner és kollégái. A megfogalmazott cél világos volt: egy olyan gerinces genom, amely a minimális méret mellett a maximális komplexitással bír, ugyanakkor a humán genommal nagyfokú homológiát mutat. Korábbi tanulmányok alapján a gömbhalféléknek alacsony genomiális DNS tartalmuk van.

1968-ban Hinegardner több mint 100, a csontos halak osztályába tartozó fajt vizsgált meg fluorimetrikus analízissel és azt az eredményt kapta, hogy a gömbhalaknak 6-/8-szor kisebb genomja van, mint az embernek.

A teljes fugu genom 2002-re készült el szekvencia vázlat formájában (a második teljesen megszekvenált gerinces genom). Mérete 400 Mb, 22 kromoszómája van, ennek 90%-a egyedi szekvencia, kevesebb mint 10%-a repetitív DNS.

Akárcsak a humán genomban, a génlókuszok nem egyenletesen oszlanak el, találunk szórt és sűrűbb régiókat. A Fugu genom relatív tömörsége részben az intron és intragénikus szekvenciák méretének csökkenésének, részben a repetitív szakaszok relatíve alacsony arányának köszönhető. A transzpozábilis elemek viszonylag alacsony kópiaszámban vannak jelen a Fugu genomban.

Az intronok 75%-a 425 bp alatti (humán: 2609 bp), a teljes számuk megközelítőleg azonos.

A Fugu genom magasabb GC tartalommal rendelkezik (44,2%), mint a humán genom (40,3%).

A csontos halak általában több duplikációt tartalmaznak, mint a tetrapodák, ez a Fugura is igaz.

A humán fehérjék 25%-ára nem találtak homológot a Fugu-ban.Ezt a csoportot összevetették Drosophila, C. elegans, S. cerevisiae fehérjékkel, további 429 olyan fehérjét azonosítottak, amelyek ezekben a szervezetekben lévő bizonyos fehérjékkel hasonlóságot mutattak, vagyis a fuguból elvesztek.

A Fugu-ból hiányzó fehérjék közé tartoznak az immunrendszeri sejtfelszíni receptor- ligand kapcsolatban, valamint a hematopoetikus rendszerben részt vevő fehérjék, valamint az immun citokinek.

Toll-receptorokat és IL-1 szerű receptorokat azonosítottak.

Fehérjedomén szinten nagymértékű hasonlóság tapasztalható a Fugu és az ember között.

Ez viszont nem feltétlen jelent megalapozott hasonlóságot a fehérjék evolúciójában.

A Fugu genom ismerete kiemelten fontos összehasonlító elemzésekhez a gerincesek között.

Egyik legfontosabb gerinces modellorganizmus a szabályozó elemek vizsgálatához (főleg. cisz-szabályzó elemek, ld. regulatív evolúció).

Homo sapiens

1999. decemberében brit, japán és amerikai kutatók együttműködésével publikussá vált a 22-es kromoszóma teljes szekvenciája (Nature).

2000. májusában a German által vezetett HGP konzorcium és japán kutatók együttműködésével publikálták a humán 21-es kromoszóma teljes szekvenciáját (Nature)

2000. júniusában a Fehér Házban tartott ceremónián jelentik be, hogy a HGP és a Celera szimultán publikálják a humán genom szekvenciáját közel 90%-os lefedettség mellett.

2003 ápr. 14.én az International Human Genome Sequencing Consortium a National Human Genome Research Institute (NHGRI) és a Department of Energy (DOE) bejelenti, hogy a HGP sikeresen befejeződött, több mint 2 évvel korábban, mint ahogyan azt tervezték. A humán genomot leíró Nature cikk ápr. 24.-én jelent meg, pontosan a DNS kettős hélixet leíró, a biológiát teljesen átformáló közlemény 50. születésnapján.

2006-ban meghatározták az emberi genom utolsó, hiányzó részleteit is. A DNS szekvenálási technológiák óriási fejlődése gyorsította fel mindkét projekt munkáját az utolsó három évben.

A The Institute for Genomic Research (Tiger) már korábban igen jelentős eredményeket ért el olyan komplex bioinformatikai rendszerek kidolgozásával, amelyek alkalmasak voltak hatalmas DNS-szekvencia-adatbázisok kezelésére. Eddig közel 30 000 humán gént azonosítottak.

A HGP 9 ember mintáját szekvenálta meg, amelyek közül 8-at biztosan férfiakból izoláltak. Azért döntöttek férfiak mellett, mert a nők genomi könyvtára két kópiában tartalmazza az X (ivari) kromoszómát, az Y kromoszómáról azonban semmit sem mondana.

Felmerült, hogy a kutatásban részt vevők közül kerülnének ki a donorok. Ezt azonban etikai okokból kifolyólag elvetették.

Sokakat meglepett, hogy „csak” kb. 30.000 gén van a humán genomban. Volt aki 100.000-re becsülte. A gének száma mindössze kétszerese a Drosophilában meghatározottaknak.

A komplexitás titka nem a gének számában, hanem a gének által meghatározott fehérjék összerakási módjában van rejtve. Fontos szerepet játszik az alternatív splicing mechanizmusa, amely következtében egy gén többféle fehérjét is meghatározhat. A variálható komplexitás másik aspektusa a fehérjék doménszerkezete: egy adott domén többféle fehérjében is előfordulhat.

Nyers szekvencia adatok alapján megállapítható hogy az exonok átlagos hossza: 100-200 bp, az intronoké: 1000-4000 bp, 1 gén pedig átlagosan 7-9 exonból áll.

A nyers szekvenciájának megismerése arra is rámutatott, hogy génállományunk több mint 90%-a funkcionálisan semleges, nem tartalmaz átíródó információt, és feltehetően nincs hatással a fenotípusra.

A hasznos információ, azaz a ténylegesen fehérjékben megjelenő rész tartalmazza az exonokat, a transzfer és riboszomális RNS-ek génjeit, továbbá agén kifejeződésének (expressziójának) szabályozásáért felelős DNS-szakaszokat (promóter, enhancer régiók).

A maradék 90 %-ban nem haszontalan információ van, sok fontos funkciót betöltő szekvenciát a program nem azonosított.

Pl.: a kromatinállomány sejtmagban történő elrendezésében is specifikus DNS szakaszok játszanak szerepet.

A humán genom mintegy 45%-át nagyrészt retrovírus eredetű, „parazita” szekvenciák (transzpozonok) sorozatai teszik ki. Ezek olyan ismétlődő elemek, amelyek önmagukat szaporították a törzsfejlődés során. Idetartoznak a LINE (long interspersed elements) szekvenciák (20 - 25%) és a SINE szekvenciák (short interspersed repeats) (10 – 15%).

Lehet, hogy ezek között van olyan, ami mégiscsak összefügg az emberi gének működésével. Megállapították ugyanis, hogy az idetartozó Alu szekvencia majdnem minden gén környezetében előfordul, ennek szerepe azonban nem ismeretes. Vannak a genomunkban kiterjedt, egyszerű ismétlések is (például T betűk hosszú sorozata).

Az első eredmények alapján azt gondolhatjuk, hogy kisszámú génünk a retroviralis szekvenciák tengerében, szigetekként fordul elő. Az, hogy egy adott területen mennyi gén van, szintén igen változatos. Vannak igen aktív kromoszomális területek, míg máshol a gének sűrűsége alacsony. Érdekes módon a kromoszómavégek is tartalmazhatnak géneket.

A nyers szekvenciák alapján 2 embernek is nagyfokú eltérést mutatott a szekvenciája (0,1 %), tehát az egyezés 99,9 %-os volt. Azaz 1.000.000 bp közül átlagosan 800 különbözik. Ezekből vezethetők le pl. a nagyrasszok közötti kölönbségek.

Az emberek közti DNS-szekvencia-variabilitásokat polimorfizmusnak nevezzük. A polimorfizmusokat két fő csoportba szokás sorolni. Az egyik fő típus az egypontos nukleotidvariáció (single nucleotide polymorphism, SNP). Az SNP azt jelenti, hogy a különböző eredetű humán szekvenciák egy adott pontban többféle variációban létezhetnek. Másik forrása a hosszúságpolimorfizmus. A genomra általában jellemző, hogy sok benne az ismétlődő szekvenciarészlet. Ez nem csak a „parazita” információra vonatkozik, mert a kódológénekben is előfordulnak ismétlőszakaszok. Az eltérés az egyes emberek között az ismétlési számban lehet, ezáltal az adott szakasz hosszabb vagy rövidebb. Az ismétlődő információ egységének hossza változó. Vannak nagyon rövid ismétlések (short tandem repeats, STR), ahol 1–5 betűből álló egység ismétlődik egymás után sokszor. A hosszabb ismétléseket változó számú egymás utáni ismétlésnek (variable number of tandem repeats, VNTR) nevezik.

Humán genom projekt eredményei óriási mértékben hozzájárultak-hozzájárulnak a monogénes öröklődésű betegségekért felelős gének azonosításához.

Egy nyilvános adatbázisban tették közzé az 1000 Genom projekt elnevezésű tudományos program első szakaszának eredményeit, amelyek a humán genetikai állomány minden eddiginél átfogóbb és részletesebb elemzését adják.

Az 1000 Genom projekt, amely amerikai, brit, kínai és német kutatócsoportok együttműködéséből indult 2008-ban, hatalmas segítséget nyújt majd az orvosi kutatásokban és új megvilágításba helyezi az emberi evolúció folyamatát is

A szakemberek összesen 8000 milliárd emberi DNS bázispár feltérképezését végezték el az elmúlt két évben. A kutatók ezentúl ingyen hozzáférhetnek az adatbankhoz, méghozzá három internetes oldalon is, amelyek közül az egyik az 1000 Genom projekt saját oldala [1] .

Amikorra elkészül, a hatalmas adatbázis a világ 27 különböző populációjából származó 2500 ember teljes genetikai anyagának információit tartalmazza majd. A Pekingi Genomikai Intézet 400 mongoloid, illetve afrikai populációból származó ember genetikai térképének elkészítését vállalta.

A mostani eredmények segítségével könnyebben lehet majd felmérni a különböző gén-feltérképező eljárások hatékonyságát. A kutatók pedig alaposabban is szemügyre vehetik majd az egyes betegségekkel összefüggő genomok szerkezetét.

Platypus

Hagyományosan a kloákásokat a Prototheria emlős-alosztályba sorolják, amely a Therapsida vonalból fejlődött ki. Ez vezetett a Theria alosztályhoz, amely az erszényesekre és a méhlepényesekre vált szét. Akárcsak maga az állat anatómiája, genomja is ősi madár- és emlősöktől származtatott jegyek fúziója.

A Platypus kariotípusa 52 kromoszómát tartalmaz mindkét nemben (néhány nagy és sok kicsi, makro- és mikrokromoszómák)

Több szexkromoszómájuk van, némi homológiával a madarak Z-kromoszómájával. A hímek 5X és 5Y kromoszómája egy láncot alkot a meiózis során, amelyek (5X) vagy (5Y) szegregálódik a spermiumokba .

A Platypus-ban nagy számban találhatók ncRNS-ek és snoRNS-ek, amelyek nagymértékű felsokszorozódást mutatnak, köszönhetően legalább egy retrotranszpozon alcsaládnak. Ezek közül némelyek expresszálódnak, és így funkcionálisak.Teljesen kifejlődött piRNS és miRNS útvonalakkal rendelkeznek, az utóbbiak egy része Monotremata- specifikus, egyesek azonban megtalálhatók mind az emlősökben, mind a madarakban.

A 18.527 protein-kódoló gén a Theria-alosztály tagjainak megfelelő tartományába esik.

Különösen érdekesek azok a gének, melyek összekapcsolják a kloákásokat a hüllőkkel (tojásrakás, méregtermelés), akárcsak azok, melyek emlőssé teszik őket (tejelválasztás), illetve az erszényesekkel közös tulajdonságokért felelős gének (antibakteriális fehérjék), valamint a kacsacsőrű emlős-specifikus tulajdonságok, mint a víz alatti gyűjtögetéshez kapcsolódó, érzékszerveiben kifejeződő gének. Például a víz alatti kemo-receptorok anatómiai adaptációjáért az 1-es típusú vomeronasalis gének különösen nagy száma felelős.

A tejfehérje gének repertoárja az emlősökre jellemző, de ezen gének szerveződése konzerválódott az utolsó közös ősük óta.

A Platypus genom vegyes ismétlődéseinek nagy számú előfordulása inkább hüllőkre jellemző tulajdonság.

Az eredetspecifikus expressziós mintázatok azokban a régiókban, ahol redukálódott vegyes ismétlődések vannak, arra engednek következtetni, hogy az elevenszülő emlősök imprinting-evolúciója - azaz a génkifejeződés szülőkre jellemző mintázatának öröklődése, amely a gének metilációs mintázatainak különbözőségéből ered - az ismétlődő elemek feldúsulásával kapcsolatos.

A Platypus genom hüllő-, emlős- és unikális jellemzői sok támpontot adnak az emlős genom funkciójának és evolúciójának megértéséhez.

Egér

Az egér, mint genetikai rendszer legfontosabb sajátsága, hogy az ember modelljeként használható.Mint méhlepényes emlős, biológiájában és fiziológiájában nagyon közel áll az emberhez.

Az egér és az ember genomja nagymértékben hasonló. Az egyikben azonosított gén a másik genomban homológia alapján megtalálhatók. A génszabályozási mechanizmusok is nagyon hasonlóak a két fajban.

Az ember után az egér volt a második emlős, amelynek génállománya ismertté vált a kutatók előtt.

Az első (kereskedelmi) verziót 2002. május 7.-én a Mouse Genome Sequencing Consortium (MGSC) publikálta. A projekt költségvetése jelentős, 58 millió dollárba került.

Alig egy év alatt az egér DNS-állományának 96 százalékát azonosították!

Teljes (nyilvános) verzió: 2002. december 5-én jelent meg: a brit Sanger Institute, az angliai székhelyű European Bio-informatics Institute, valamint az amerikai Whitehead Institute és a Washington Egyetem szakemberei a Nature című brit tudományos szaklapban tették közzé a egér géntérképét. 2001 májusában a Celera Genomics, a genetikai térképezések területén vezető biotechnológiai cég már bejelentette, hogy elkészült az egér genetika állományának feltérképezésével. A cég adatai azonban csak fizetés ellenében voltak elérhetők, nyilvánosan nem közölték őket.

A genom 2,5 milliárd bázispár hosszúságú (2,5 Gbp, ember: 3.2 Gbp). Az egér genom 19 autoszómát, valamint az X és Y nemi kromoszómákat (ember: 22 + X/Y) tartalmazza.A gének száma: ~ 30.000 (mint a miénk). Az egér és a humán kromoszómák morfológiája és sávmintázata különböző. Az egér és az ember kromoszómáinak összehasonlításakor jelentős szinténia (azonos gének azonos sorrendben, esetleg különböző helyen lelhetők fel a kromoszómákon) figyelhető meg. A szinténia általános az emlősök között. Konzervált szinténikus szakaszok átlagos hossza 17 Mb. Az egér és ember evolúciós szétválása óta (85 millió év) mintegy 170 átrendeződés történt. A szinténia fontos felhasználása, hogy fenotípus változást okozó allélok vagy DNS markerek segítségével az egyik fajban azonosított lókusz kikereshető a másik fajban is.

Az egér gének 99 %-ának megvan a megfelelője az ember génállományában is (a mi génjeink 80 %-ának van egér megfelelője)!

Az egér génjeinek megfejtése során 1200, addig nem ismert emberi gént fedeztek fel.

Az összes gén (30.000) közül tehát csak 300 azoknak a száma, amelyek a két fajt összevetve egyedinek mondhatók (azaz 1 % az eltérés) ezen a téren!!!

Nagy egyezések figyelhetők meg az egér és az ember genomok fehérjéket nem kódoló részében is.

A legjelentősebb eltérések a szaporodásért, a szaglásért, az immunrendszer működéséért és a kiválasztásért, méregtelenítésért felelős gének terén mutathatók ki.

Az egereknek több szaglással kapcsolatos génjük van, melyek segítenek az étel, a társak és az ellenségek felismerésében.

Miután a szaporodás valóságos művészei, az egereknek érthető módon több reprodukciós génjük is van.

Ezenkívül 84 olyan génnel rendelkeznek, melyek a máj méregtelenítésében játszanak szerepet (az emberek 63 ilyen génjével szemben). Valószínű oka az, hogy piszkosabb (azaz immunstimuláló) környezetben élnek.

Az egerek genetikai állományának minél pontosabb ismerete igen értékes eszköz a kutatók kezében.

Az egerekben számos emberi betegséget lehet modellezni. Mivel az embernél fellépő különféle betegségek kialakulásában szerepet játszó gének 90 százaléka azonos az egérben és az emberben, a felfedezés felgyorsíthatja az ezzel kapcsolatos kutatásokat.

Állatkísérletek során egyes gének kiiktatásával (knockout technika) lépésről-lépésre fel tudják tárni, hogy melyik génnek mi a szerepe egy adott betegség kialakulásában.

Lehetőség nyílik az ember és az egér genetikai állományában való gyors keresésre, a szekvenciák összehasonlítására, az azonos pozíciójú gének és szabályozó régiók megtalálására (szinténia).

Megjegyezzük, hogy az egérhez hasonló fontosságú modell szervezet a vándorpatkány (Rattus norvegicus). A patkány genom szekvenciája 2004 áprilisa óta áll rendelkezésre (n=21; 20+X/Y). Az emberi genomnál kb. 5%-kal kisebb. A szekvenciák divergenciája és a kromoszómaátrendeződések rátája gyorsabb az emberitől kb. 75 millió éve elvált rágcsáló vonalban, ami jól követhető a 12-24 millió éve elvált egér-patkány vonalakban is. Az emberi genomban gyakoribbak a duplikációk: jórészt ez magyarázza a nem elhanyagolható méretkülönbséget.

Az egér és patkánygenomok tehát alapvető eszközök az emberi genom analíziséhez is.

Makákó

A Rhesus makákó teljes genom szekvenciáját 2007. április 13-án tették közzé.

A rhesus makákó (Macaca mulatta) főemlős faj mintegy 25 millió évvel ezelőtt vált el Homo sapiens-el közös őstől.

A makákók genetikai-, és fiziológiai szempontból is hasonlítanak az emberekre, ezért a rhesus majmok a legszélesebb körben használt nem emberi főemlősök az alap- és alkalmazott orvosbiológiai kutatásokban. A „rokonság” az ember és a makákók között rendkívül fontos, mert a humán orvosbiológiai kutatásokban szükség van állati modellekre, legfőképp főemlősökre.A rágcsálókhoz képest, amelyek több mint 70 millió éve váltak el az emberrel közös őstől, a makákók nagyobb hasonlóságot mutatnak az emberi fiziológiával és a neurobiológiával, valamint fogékonyak a fertőző és anyagcsere-betegségekkel szemben.

A biomedicinában mérföldkő volt, amikor azonosították makákókban a "Rhesus factort" (vér csoportok); megismerték a neuroanatómiáját és neurofiziológiáját. A legfontosabb, a kórokozókra - s köztük az emberi kórokozókra - adott immunválaszuk, beleértve a majom immunhiány vírust és az influenzát, a mienkhez hasonló. Ezek a tények tették a makákót preferált modellszervezetté a vakcina fejlesztés területén.

Kevésbé ismert, hogy ezen állatok „hozzájárultak” az amerikai űrprogramhoz - rhesus majom sokkal korábban volt az űrben, mint a csimpánz.

Meghatározták a genom szekvenciáját egy indiai nőstény Macaca mulatta-nak és összehasonlították az adatokat csimpánzok és az emberek genomjaival, hogy megfejtsék az ősi főemlős génállományának szerkezetét a pozitív kiválasztódás eseményeit, valamint a leszármazás-specifikus expanziókat és a gén családokba való rendeződést.

Az átlagos emberi-makákó szekvencia azonosság 93%-os.

Ez a hármas összehasonlítás sok genetikai változásra és mutációs mechanizmusokra világított rá..

A genom méret 3,000 Mb, kb. 32 000 gént tartalmaz

A makákó genom 20 autoszómába és az X/Y szex kromoszómákba szerveződik.

Összevetve a humán kromoszómákkal három fúzió, egy hasadás és 48 töréspont mutatható ki kromoszóma festéssel, hibridizációs technikával és összehasonlító analízissel. Ez több, mint a csimpánzok hasonló mutatója.

Néhány makákó kromoszóma "akrocentrikusabb", azaz egyik karja jóval rövidebb, mint a neki megfelelő humán; számos esetben azonban nehéz különbséget találni a kromoszómáink között.

Az összehasonlított humán és makákó szekvenciák átlagosan 93, 54%-ban megegyeznek.

Ha azonban a kis inszerciókat és töréseket is figyelembe vesszük, az azonosság 90,76%-ra csökken.

Figyelembe véve, hogy bizonyos régiókat nehéz összehangolni, ilyenek például a származás-specifikus ismétlődő elemek, tovább csökken az azonosság szintje.

Pl. az X kromoszóma esetében kevesebb eltérés volt (94,26%-ban azonos). A GC-tartalom is csak kevéssé tér el 40,71% vs. 40,74%).

A makákó genom ismerete lehetővé tette a felhalmozott finomabb változások részletes tanulmányozását az ortológ főemlős génekben.

A humán-makákó ortológok 89%-a különbözik aminosav szinten, ezzel szemben humán-csimpánz ortológok csak 71%-a.

Így összevetve a sokkal hasonlóbb csimpánz-humán genomokat a makákóéval a természetes szelekció hatására lehet következtetni.

A csimpánz genom program

2005 szeptember 1.én a Nature című folyóiratban megjelentették egy, az USA-ban élő, a Pan troglodytes verus alfajba tartozó, akkor 24 éves, és sajnos a megjelenés előtt elhalálozott Clint nevű csimpánz genomjának szekvenciáját.

Legfontosabb eredmények:

A genom mérete 3,1 Gb, 24 pár kromoszómába rendeződik.

A genom 96%-a pontosan illeszthető a humán genomhoz. Figyelembe véve az emberek és csimpánzok közötti különbségeket, a különbség az illeszkedő szekvenciák között a két faj között 1% lehet. A csimpánztól való különbözőségünkért kb. 13 Mb-nyi különbséget tartanak meghatározónak.

A két faj közötti 4%-nyi nem illeszkedő szekvencia inszerciókat és deléciókat jelent (5 millió inszerció/deléció). Kb 45 Mb szekvencia nem megfeleltethető egymásnak mindkét oldalról. Többet tesz ki az ilyen különbség, mint a bázisszubsztitúciók (35 millió SNP van jelen). A különbségek eloszlása nem egyenletes: 1 Mb-ra számítva 0,005-0,025%. Több a különbség a telomérek környékén. A különbségek kisebbek az X, mint az Y kromoszóma esetén. A csimpánz és humán Y kromoszómáknál 6 szekvencia osztályt különítenek el – ebből 4 MSY (male-specific region of the Y chromosome) eukromatin. A csimpánz Y kromoszómán kétszer annyi palindroma (középpontosan szimmetrikus szekvencia) van, fehérjekódoló gének, géncsaládok viszont elvesztek.

Számos kromoszóma átrendeződés ismeretes a két genom között, köztük egy szépen elemzett különbség az emberben, hogy a második kromoszómánk két csimpánzkromoszómának felel meg, vonalunkon történt egy robertsoni transzlokáció (két akrocentrikus kromoszóma egy metacentrikus kromoszómává egyesül).

20 véletlenszerűen kiválasztott csimpánz cDNS szekvencia 99,31%-ban (±0,38) egyezett meg a humán ortológgal

Aminósav szinten: 99,36% (±0,66) azonosság figyelhető meg: a homológ fehérjék átlagosan 2 aminosavbanban különböznek egymástól.

20 vizsgált fehérjéből 7 AS-sorrendje teljesen megegyezett. Az először vizsgált 13 454 ortológ fehérje 29%-a megtalálható a csimpánz genomban is identikus formában.

Bár a legtöbb fehérje nagyon hasonló, bizonyos fehérjéknél a neutrális mutációk alacsony aránya pozitív szelekció mellett szól (ld. neutrális evolúció). Ide tartozik a glycophorin C és a granulolysin, amelyeknek a fertőzések elleni küzdelemben van szerepük, ill. más fehérjék, amelyeknek a reprodukcióban (a reprodukcióra hat legközvetlenebbül a szelekció, igy ezek a jellegek esnek át leggyorsabb evolúción).

Kimutatták, hogy az agyban kifejeződő gének kifejeződése gyorsabban változik az emberi vonalban.

Az agyi transzkripciós faktorok közül 90-nek az expressziós szintje szignifikánsan különbözik a két fajban.

A FOXP2 (forkhead box P2) transzkripciós faktor változásai (2 aminosavban különbözik a csimpánzétól, és a vele megegyező egérfehérjétől) pl. az elemzések szerint kapcsolatosak a beszéd kialakulásával (ld. 2. fejezet).

Megjegyezzük, hogy a szekvenciák analízise arra utal, hogy a két faj, a csimpánz és az ember elválása után még egyszer hibridizálhatott, néhány milló évvel az elválás után.

Lúdfű (Arabidopsis thaliana)

Az elsõ növényi teljes genom az Arabidopsis thaliana (lúdfû) genomja, aminek szekvenálását 2000. decemberére fejezték be.

5 kromoszómája 125 Mb (az egyik legkisebb növényi genom, a kukorica genomja 45-ször ekkora). A többi növényhez képest kevés ismétlődő szakaszt tartalmaz.A géndenzitás nagy, a 26 ezer fehérjekódoló gén 40 %-át foglalja el a genomnak - 1 gén / 4 kb DNS, nagyon kevés repetitív DNS-t tartalmaz. A fehérjék 65 %-a a fehérjéknek több mint egy gén által kódolt, ami a faj tetrapoid eredete mellet szólt!

Alternatív splicingot kb. 1600 génnél, a gének 6%-nál mutattak ki.

Míg az Arabidopsis genomjában a gének elszórtan helyezkednek el, addig a kukoricán és a rizsen végzett kutatások szerint az egyszikűek génjei nagyobb csoportokat képeznek, amelyeket nagyméretű, nem kódoló régiók tagolnak.

A növények között az egyik legkisebb genommal rendelkező lúdfüvet (Arabidopsis thaliana) az egyszikű rizs (Oryza sativa) genomjának meghatározása követte 2000-ben.

A modellértékű lúdfű és rizs után napjainkban többek között egy pillangós növény, a Medicago trunculata teljes genomját szekvenálják meg. Ez a kutatás több olyan gén szerepét és meglétét is tisztázhatja, mely a növény–mikróba kölcsönhatásokban, illetve a szimbiotikus nitrogénfixációban is szerepet játszik.

A lucernához hasonlító pillangós mellett, a legkisebb genomú fás szárú, a 450 millió bázispár nagyságú eukaliptusszal történt kezdeti próbálkozások után hatalmas erővel folynak a fás szárú rezgő nyár (Populus tremula) genomjának kutatására irányuló törekvések. Az ebből származó eredmények rávilágíthatnak a fás- és a lágyszárú növények szerveződési és élettani különbségeinek molekuláris hátterére, miközben maga a növény jelentős gazdasági haszonnal bír.

Szintén gazdasági megfontolásokból folyik a kukorica (Zea mays) génállományának feltárása (lásd 1.4, a fejezet későbbi részében). Ezen kívül nagy mennyiségű biológiai adat származik a paradicsomból, a szójából és a gyapotból is.