Iratkozz fel a blogra!

Magamról

Barta Endre vagyok, molekuláris biológus, bioinformatikus.

A célom ezzel a bloggal, hogy a saját szemszögemből bemutassam a genomikát.

Különböző rovatokat tervezek, így a napi és a heti hírek, a napi és a heti genomok, a miaza rovatot, amiben a genomika fogalmait próbálom bemutatni, és mivel elég későn csatlakoztam, lesznek retrospektív posztok is. Szeretnék néha egy kicsit provokatív is lenni és így érdemi vitákat generálni a szakmában és más érdeklődők között is.

E-mail: endre.barta [at] gmail.com

Friss topikok

  • madbal: Kedves Endre! En azt az informaciot talaltam, hogy a szekvenalas 454 technologiaval tortent, www.m... (2011.09.23. 15:19) Kender genomszekvenálás
  • attila.szanto: Szia Endre! Gratulalunk a bloghoz, nagyon szinvonalas es erdekes. Sok sikert hozza! (2010.05.01. 20:36) Mi az a referencia genom?

Utolsó kommentek

  • madbal: Kedves Endre! En azt az informaciot talaltam, hogy a szekvenalas 454 technologiaval tortent, www.m... (2011.09.23. 15:19) Kender genomszekvenálás
  • attila.szanto: Szia Endre! Gratulalunk a bloghoz, nagyon szinvonalas es erdekes. Sok sikert hozza! (2010.05.01. 20:36) Mi az a referencia genom?
  • Utolsó 20

Címkék

Linkblog

Búza genomika Franciaországban

2011.03.30. 23:09 :: ebarta

Franciaországban elindítanak egy új búza genomkezdeményezést.  A programra 9 év alatt 39 millió eurót (több mint 10 milliárd forint) kívánnak fordítani (ebből 9 millió eurót, azaz 2,4 milliárd forintot már oda is ítéltek).  A Long-Term Wheat Genomics to Breeding Program (BreedWheat) konzorcium vezetője az INRA, a francia nemzeti agrárkutató intézet és a 26 résztvevő tagból kilenc ipari partner.
A konzorcium hosszú távú célja a genomika segítségével erősíteni a búzanemesítést. Meg akarnak szekvenálni egy búzakromoszómát (mivel máshol is szekvenálnak búzát, és a technológiai is nagyon fejlődik, egy-két év múlva nyílván már több búzafajta is meg lesz szekvenálva), és minél több SNP-t szeretnének találni. Az SNP-k közül ki szeretnének válogatni 5500 SNP markert, és ezekkel karakterizálni a nemzeti törzsgyűjtemény 5000 búzafajtáját. Ilyen SNP „azonosítója” például ma már minden tenyészmarhának van Franciaországban.
A program fontos része a megfelelő technológiák kidolgozása és emellett ki akarnak alakítani egy olyan bioinformatikai platformot, ami lehetővé teszi a kutatóknak a keletkező iszonyatos adathalmazban való eligazodást.
Megjegyzem a franciák valami hasonlót csinálnak a marhanemesítésben is. És már jó ideje készülhettek erre, egymás után alakították ki a (mezőgazdasági) genomikai kutatáshoz szükséges infrastruktúrát, azaz Párizs mellett szekvenáló központot, Toulouse-ban genotipizáló központot hoztak létre és most döntöttek egy új, állítólag hatalmas, Párizs melletti bioinformatikai intézet létrehozásáról is.

Forrás: GenomeWeb
 

Szólj hozzá!

Címkék: növény tudománypolitika napihír

In memoriam SRA

2011.02.16. 23:01 :: ebarta

Korábban akartam írni egy posztot az EMBL adatbázis eltűnéséről. Most azonban sajnos egy NCBI-os bejelentés kapcsán egy másik adatbázis haláláról, vagy legalábbis hibernálásáról kell írnom.


Az SRA (Sequence Read Archive) adatbázis tulajdonképpen a Trace  Archive lerakat újgenerációs folytatása. A Trace Archive adatbázis a hagyományos Sanger-féle szekvenálások adatait tartalmazza. Nemcsak a szekvenciákat, hanem az egyes bázisok leolvasásának a minőségi értékeit is. Az elsődleges adatbázisokban a már összerakott szekvenciákat tárolják, ellenben ha az adott szekvenciát mondjuk 6X lefedettséggel szekvenálták, akkor a Trace Archive-ban 12x annyi adat lesz (6x a szekvencia és 6x a minőségi értékek). A Trace Archive-ba a legtöbb adatot 2000 és 2005 között rakták, amikor sorban szekvenálták a gerinces genomokat a shotgun módszerrel.


Amikor elindultak az újgenerációs szekvenálások, nyilvánvaló volt, hogy ezeknek a nyers adatait is egy adatbázisban kell összegyűjteni. Ez lett az SRA. Eleinte lelkesen a beszkennelt képfájlokat is tárolták, majd hamar nyilvánvalóvá vált, hogy ez tarthatatlan, és amúgy sincs rá szükség. Aztán egészen a mai napig úgy tűnt, hogy ez egy fenntartható állapot, bár már voltak jelek hogy gondok vannak, a fájlok letöltésére például egy ASPERA CONNECT nevű programot ajánlanak (ez nekünk ingyenes, de az NCBI nyílván fizet a szerverért).


Mire lehetett használni az adatbázisban tárolt adatokat?

Én például most írtam egy szkriptet, ami automatikusan letölti az SRA-ban tárolt ChIP-seq nyers szekvenálási adatokat és feldolgozza (referencia genomhoz illeszti, megkeresi a ChIP régiókat, peak-eket, majd elemzi) azokat. Bár a peak régiók adatai a beküldők cikkeiben leírtak szerint általában szintén elérhetőek, sokszor érdemes újra analizálni a nyers adatokat.


Mi lehet az oka az adatbázis megszűnésének?

A közleményben anyagi okokra hivatkoznak, ami ismerve az NCBI és általában az amerikai kutatások finanszírozását, kissé viccesnek tűnik. Inkább azt gondolom, hogy a jelenlegi szinten lehetetlen fenntartani a szolgáltatás színvonalát, azaz
1.    Nem tudnak annyi új diszket venni/installálni amennyi kell
2.    De méginkább az, hogy technikailag nem tudják biztosítani a sávszélességet a le és feltöltéseknek.
Ha ez igaz, az azért is nagyon érdekes, mert amióta (1993) aktívan figyelemmel kisérem a bioinformatika és a számítástechnika fejlődését, azt láttam, hogy a kettő valamennyire együtt fejlődik, és ez a harmónia tört/törik most meg.
Mi a helyzet Európában?  Az EBI egyből kiadott egy közleményt, hogy folytatják a nyers szekvenálási adatok befogadását az ENA adatbázisban (ami a poszt elején említett EMBL utódja).
Összefoglalva azt lehet mondani, hogy az eset ismételten rávilágít arra a problémára, hogy az újgenerációs szekvenálások kezelése információtechnológiailag is egyre nagyobb kihívást jelentenek. Erre jó lenne felkészültnek lenni. Az egyik lehetséges és nagyon hatékony módszer az erőforrások szétosztása, disztribúciója lenne. Az EU-ban van egy kezdeményezés az EBI vezetésével amit ELIXIR-nek hívnak. Ez pontosan ezt csinálná, de sajnos eddig csak néhány európai ország csatlakozott (persze Magyarország se). Remélem ez az eset rávilágít arra, hogy milyen fontos lenne egy ilyen együttműködés.
 

Szólj hozzá!

Címkék: elixir ebi ngs napihír ncbi

Új korszak a genomikában

2011.02.04. 00:51 :: ebarta

Az éves Advances in Genome Biology and Technology találkozón a Complete Genomics nevű cég bejelentette, hogy 60 teljesen megszekvenált, nagy lefedettségű genomszekvenciát tesz közzé. Két ftp helyről most 40, majd áprilistól újabb 20 genomszekvenciát lehet letölteni.


A Complete Genomics-ról én eddig annyit tudtam, hogy van valami saját újgenerációs szekvenáló platformjuk (egyébként 70 bázist tud leolvasni), csak szolgáltatást végeznek (hazai szakmai körökben felmerült, hogy Magyarországra hozhatnának egy ilyen „szekvenálógyárat”), és nagyon olcsók lesznek. De eddig nem tulajdonítottam nagy jelentőséget ennek. Ez a bejelentés azonban véleményem szerint alapjaiban fogja felforgatni a humán genomika amúgy sem éppen állónak nevezhető vízét.


Nézzük az adatokat. A 60 genomot 55x lefedettséggel szekvenálták, ami összesen 12.2 terabázis adatot jelent. Összehasonlításképp a legnagyobb ilyen publikus, akadémiai összefogásban történő szekvenáló projekt, az 1000genom keretében a legutóbbi publikáció szerint 6 nagy lefedettségű és 179 alacsony lefedettségű genomszekvencia érhető el.


Ez már így önmagában is nagyon izgalmas, mellesleg azonban azt is közölték, hogy már 1000 megrendelő genomját is megszekvenálták, és a mostani kapacitásukkal képesek havonta 400!! új genomszekvenciát meghatározni. Ja és a cég részvényei ahogy nézem, majd négy százalékkal emelkedtek ma.


A napokban azzal szenvedtem, hogy megpróbáltam (egyelőre nem sok sikerrel) letölteni és elemezni az 1000genomes projekt SNP adatait. Természetesen egyből ránéztem ezekre a Complete Genomics által közzétett adatokra is. Háááát, még ha el is tekintünk attól a logisztikai kihívástól, hogy hogyan lehet ilyen mennyiségű adatot letölteni (például már külön módszereket ajánlanak a nagysebességű hálózati eléréssel rendelkezők számára), akkor is egyszerűen kell néhány óra csak arra, hogy egyáltalán kitaláljuk, hogy melyik fájlban mi van.


És hogy miért olyan nagy jelentőségű ez? Egyrészt maga a 60 genomszekvencia is nagyon érdekes tudományosan, másrészt , és talán ez fontosabb, ez komoly árversenyt indíthat be az újgenerációs szekvenálási szolgáltatások és a platformok tekintetében. Ez pedig azt jelenti, hogy egyrészt a kutatólaboratóriumok számára egyre elérhetőbb lesz egy-egy teljes genomszekvencia meghatározása, másrészt egyre többen akarják majd megszekvenáltatni a genomjukat.
 

Szólj hozzá!

Címkék: 1000genomes complete genomics

India genetikai diverzitása – a nagyobb nemzetek már elkezdték keresni „genetikai identitásukat”

2010.12.17. 10:11 :: ebarta

Az emberi genetikai (DNS szintjén kifejeződő) diverzitás egyik „klasszikus” vizsgálati módszere egyes mitokondriális, Y kromoszóma vagy riboszómális  RNS-t meghatározó DNS darabok szekvenálása többnyire PCR reakció után. A Humán Genom Program egyik nagy eredménye, hogy leírt 2.1 millió SNP-t. Ez lehetővé tette a nagy microarray gyártó cégek számára, hogy kiválasszanak ezek közül – a technológia fejlődésével egyre nagyobb számú –SNP-t, és azokat egyedenként genotipizálják, azaz megállapítsák, hogy az egyes egyedekben melyik allél homozigóta, vagy mindkét allél előfordul-e (heterozigóta). Ezeken a csipeken alapszik a HapMap vizsgálat és a legtöbb Genom-szintű asszociációs vizsgálat (GWAS) is. Az újgenerációs szekvenálás azonban magasabb szintre emelte a populációk vizsgálatát, az ismert SNP-k száma minden egyes megszekvenált egyed esetében akár több tízezres értékben növekedhet, és ma már arról beszélnek, hogy a mai humán populációban kb. 60 millió SNP lehet. Természetesen a teljes genom szekvenálás eredménye korábban nem remélt szintű genetikai analízist tesz lehetővé, és hallva a legújabb terveket (az angolok például tízezer genomot akarnak megszekvenálni egy-két éven belül), hamarosan számottevően növekedni fognak az ismereteink az emberi faj genetikai fejlődéséről az elmúlt évezredek populációgenetikai folyamatairól.

Nem mindenkinek állnak (vagy nem álltak egy-két éve, amikor a most közlés alatt álló cikkekhez kapcsolódó kísérleteket tervezték) azonban rendelkezésre a legújabb eszközök, ezért alternatív megoldásokat alkalmaznak. Egy a Genome Biology-ban közölt publikációban például azt a megoldást választották, hogy egy úgynevezett ENCODE régiót (100 kbp) választottak ki, és szekvenáltak meg 92 Dél-Indiából származó mintában hagyományos Sanger, kapilláris szekvenálással. Céljuk természetesen az volt, hogy megismerjék az adott populáció ( három kaszt!-ból és egy törzsi populációcsoportból választották a mintákat) genetikai diverzitását, genetikai kapcsolatát a többi populációval, és lássák, hogy az indiai populáció hogyan viszonyult a kiindulási afrikai populációkhoz. A módszer lehetőséget adott arra is, hogy összehasonlítsák az eredményeket a HapMap projekt keretében 772 egyedből (ebben csak japán ázsiaiak vannak) ugyanerre a régióra kapott adatokkal.

Néhány érdekes eredmény: A 92 egyed 100kbp-os régiójának megszekvenálásával 453 SNP-t azonosítottak, ami 221 bázispáronként egy SNP. Ez a teljes genomra vetítve 13,6 millió SNP-t jelent csak ebben a szűk populációban (nyilvánvaló, hogy egy ausztrál, dél-afrikai vagy éppen eszkimó egyeddel ezek a populációk már több tízezer éve nem keveredtek, ezért azokban teljesem más SNP-k akkumlálódhattak). Ha kombinálták az eredményeket a 722 HapMap egyed adataival, összesen 1484 SNP-t kaptak, ami már 67 bázisbáronként jelent egy SNP-t, genom szintre extrapolálva pedig 44.5 millió SNP-t (az ENSEMBL adatbázisban most 24.6 millió SNP van annotálva). Ebből az 1484 SNP-ből 234 (15.8%) volt Dél-India specifikus. Egyedenként vizsgálva másfél egyedi SNP-t találunk, azaz két emberben van 3 SNP, amit máshol még nem láttak. Ez kicsit alacsonyabb, mint az afrikaiaknál (2.4), de magasabb az európai (1.3) és a kelet-ázsiai (1.1) értékeknél.

Az már a korábbi „klasszikus” módszerekkel végzett vizsgálatokból kiderült, hogy az indai szubkontinens már az első nagy kivándorlás során benépesült, és a későbbi hullám(ok) populációival is keveredtek az itt letelepedő népek. Az is ismert, hogy az indiai szub-kontinens egy „átjáróház” volt a népek vándorlása során, és hogy Indiában rendkívül sokféle nép él eltérő nyelvi és kulturális hagyományokkal. A jelen vizsgálat ezeket az ismereteket a genetika szintjén is alátámasztotta. A számítások szerint az ősi eurázsiai populációk 88-112 ezer éve váltak el afrikai rokonaiktól, míg a különféle eurázsiai populációkon belül az elválás ideje csak 27-39 ezer év. Ez egy újabb bizonyíték a késleltetett terjeszkedés elméletére, amely szerint az afrikaikról leváló ős eurázsiai populációk az nagy eurázsiai expanzió előtt még „parkoltak, táboroztak” valahol (leginkább a Közel-Keleten) vagy 40 ezer évig, amikor is már nem keveredtek az afrikai populációkkal.

Ez a vizsgálat jól mutatja, hogy a genomika eszközeivel még nagyon sok érdekes populációgenetikai tényre derülhet fény, és hogy érdemes ilyen vizsgálatokat végezni. És persze nem lehet nem észrevenni a tendenciát, hogy minden nép keresi a maga „genetikai identitását” is, amire az új genomikai módszerek széles, és megjegyzem akár kis országok számára is elérhető eszköztárat nyújtanak. Izgalmas évek jönnek ebből a szempontból az biztos!
 

Szólj hozzá!

Címkék: snp hapmap populáció genomika

Ülő Bika genomja

2010.08.31. 23:52 :: ebarta

Egy ártatlan, de PR szempontból jól felépített hír szerint meg akarják szekvenálni Ülő Bika (Tatanka Ijotake, Sitting Bull) a legendás sziú indián genomját. A szándékot az a dán kutató jelentette be (Eske Willerslev, Koppenhágai Egyetem), aki mint ahogy azt már korábban megírtam, az egyik vezetője volt annak a dán csoportnak, akik meghatározták a grönlandi ősember genomszekvenciáját. Az egybeesés nem véletlen, a dán kutatók dolgozták ki azt az eljárást, amely segítségével a hajból (és nem a hajhagymából) kivont DNS-t tudják használni a szekvenáláshoz.
És hogy miért érdekes az egész?

  • Eske Willerslev valahol azt nyilatkozta, hogy már gyerekkorában lenyűgözte Ülő Bika legendája, ezért választotta most (én inkább Winnetou-ra szavaznék természetesen :-)).
  • Ülő Bika maradványainak a kiléte bizonytalan, ellenben a halála után levágták az egyik hajfonatát (hajhagymák nélkül), ami megvan, és a leszármazottak támogatják az ötletet.
  • A bejelentés élénk vitát váltott ki a blogoszférában, ugyanis egyből többen megkérdőjelezték, hogy mi haszna van közpénzekből (volt) celebritásokat szekvenálni? A vélemények megoszlanak, van aki szerint nem szabadna, van aki meg (és vele értek egyet) azt mondja, hogy a magas PR érték miatt érdemes ilyesmire áldozni. Mások kiemelik, hogy az eredményből fontos adatokat nyerhetünk az amerikai, európaiakkal még nem keveredett őslakosság genetikai örökségéről.
  • És persze megindult mindenkinek a fantáziája, hogy kiket lenne még érdemes felvenni a szekvenálandó celebek listájára. Ezen persze magyar viszonylatban is elgondolkodhatunk. Bár Petőfi Sándor maradványait  úgy hiszem még mindig nem találták meg, azért érdemes lenne nagyjaink haj (ajánlom például Zámbó Jimmy alias A király legendás fürtjeit ;-)) és csontmaradványai után kutatni.

Szólj hozzá!

Címkék: celeb genom napihír paleogenomika

süti beállítások módosítása