Iratkozz fel a blogra!

Magamról

Barta Endre vagyok, molekuláris biológus, bioinformatikus.

A célom ezzel a bloggal, hogy a saját szemszögemből bemutassam a genomikát.

Különböző rovatokat tervezek, így a napi és a heti hírek, a napi és a heti genomok, a miaza rovatot, amiben a genomika fogalmait próbálom bemutatni, és mivel elég későn csatlakoztam, lesznek retrospektív posztok is. Szeretnék néha egy kicsit provokatív is lenni és így érdemi vitákat generálni a szakmában és más érdeklődők között is.

E-mail: endre.barta [at] gmail.com

Friss topikok

  • madbal: Kedves Endre! En azt az informaciot talaltam, hogy a szekvenalas 454 technologiaval tortent, www.m... (2011.09.23. 15:19) Kender genomszekvenálás
  • attila.szanto: Szia Endre! Gratulalunk a bloghoz, nagyon szinvonalas es erdekes. Sok sikert hozza! (2010.05.01. 20:36) Mi az a referencia genom?

Utolsó kommentek

  • madbal: Kedves Endre! En azt az informaciot talaltam, hogy a szekvenalas 454 technologiaval tortent, www.m... (2011.09.23. 15:19) Kender genomszekvenálás
  • attila.szanto: Szia Endre! Gratulalunk a bloghoz, nagyon szinvonalas es erdekes. Sok sikert hozza! (2010.05.01. 20:36) Mi az a referencia genom?
  • Utolsó 20

Címkék

Linkblog

Next Generation Sequencing II workshop (Ruvo di Puglia, Olaszország)

2010.06.21. 16:34 :: ebarta

A múlt héten volt szerencsém részt venni Olaszországban az EMBnet és EMBRACE szervezésében tartott „Next Generation Sequencing II” workshop-on. Az alábbiakban az előadásokról és a gyakorlati bemutatókról szeretnék írni néhány érdekességet:

1. Peter Rice: Next EMBOSS release and NGS
Peter elmondta, hogy az EMBOSS szokásos következő kibocsátása július 15-én lesz, és hogy természetesen az EMBOSS fejlesztői közössége is felismerte, hogy szükséges lenne az NGS szekvenciákkal kapcsolatos eszközök, programok implementálására. Már az előző EMBOSS is ismerte a fastq formátumot (kipróbáltam, használtam, tényleg működik), ezt most továbbfejlesztik. 2009-ben nyertek egy három éves grantot, amelyben 100 új programot ígértek az EMBOSS-ba, de úgy látom, hogy ezek inkább majd csak jövőre kerülnek be. A fejlesztők mindazonáltal várják az ötleteket.

2. Stefan Marklund: Epigenetic analysis using NGS
Stefan először ismertette a tyúk kísérleteiket, amelynek során egy gyorsan és egy lassan növő fajtát vizsgálnak. A különböző vonalakat keresztezik és a hosszadalmas térképezés helyett megszekvenálják az utódokat, úgy keresik a jellegért felelős, vagy ahhoz kapcsolt markereket. Ezután részletesen beszélt arról, hogy lehet a DNS metilációt vizsgálni NGS módszerekkel.

3. Bastien Chevreux: MIRA3 – Computer assisted editing of genomic sequences
Bastien egy világcégnek dolgozik, amely, mint mondta, az egyik legnagyobb a legkevésbé ismert cégek közül (vitaminokat, ételfestékeket, táplálék kiegészítőket gyárt). A cég nagyon sokat fermentál, és rájöttek, hogy a használt baktérium és gombatörzsek megszekvenálása nagyon fontos, mivel kiderült, hogy az esetek többségében nem minden úgy van DNS szinten, mint ahogyan azt a törzseket fejlesztő biológusok hiszik. A baktériumszekvenálásokról annyit mondott, hogy az ismétlődő szekvenciák miatt csak akkor van esély a genom de novo összerakására, ha párhuzamosan csinálnak 454 és short read szekvenálást. Bastien az előző munkahelyén, a heidelbergi DKFZ-ben kifejlesztett egy de novo assembler-t, és miután a DKFZ-től engedélyt kapott, hogy a programot szabad felhasználásúvá tegye, „szabadidejében” fejleszti tovább. Természetesen kaptunk egy rövid áttekintést arról, hogy hogy működnek ezek a programok, és melyiknek mi az erőssége. A lényeg az, hogy emlős méretben a de novo összerakás még nem nagyon működik, főleg nem, ha csak short read-eket használnak. Az egyetlen ilyen példa eddig a panda genom, de azzal kapcsolatban is vannak kételyek. Egyébként a Jingcho, a kínai EMBnet node menedzser megerősítette, hogy a pekingi BGI intézetben valóban meg akarnak szekvenálni 1000 új gerinces és növényi genomot, amihez azért kell majd jó de novo assembler szoftver. A MIRA3 program elég jó, beszéltem egy svéd barátommal, aki rendszeresen használja, és szerinte jól teljesít, igaz egy 128 GB RAM-ot tartalmazó linux PC-t kellett összerakni hozzá.

Alberto Policiti: Enhanced reference guided assembly
Egy újabb de novo assembler, ami állítólag képes használni rokon fajok már kész genomját segítségképp. Sajnos nem volt olyan meggyőző (egyébként korábban már fejlesztettek NGS illesztőt és „sima” de novo assembler-t is). A program tulajdonképpen egy pipeline, ami még nincs igazán összerakva. Demonstrálni se nagyon tudták hogy működik, csak szőlő kloroplaszt genomon mutattak adatokat (az egész fejlesztés a szőlő szekvenálásból indult ki).

Rasko Leinonen: Sequence Read Archive
Korábban már örömmel láttam, hogy az NCBI-os SRA (Short Read Archive) mellett végre elindult az európai testvére is ENA néven, ráadásul egy integrált megoldásban az összes EMBL adatbank rekord archívumával együtt. Azt azért meg kell jegyezni, hogy még nem teljesen tökéletesen működik (próbáltam többször is használni). A lényeg hogy hasonlóan a három elsődleges DNS adatbankhoz, ez is tükrözve lesz Európa, Japán és Amerika között, ezért például nem is használnak szalagos mentést (hová jutottunk!). Érdekesség, hogy jelenleg 22.8 TByte Illumina, 1.5 TByte Solid és 1.4 TByte 454 adat található az adatbázisban.

David Horner: Analysis of smallvRNA deep sequence data
David Horner egy érdekes áttekintést adott a kis RNS-ek NGS szekvenálásával kapcsolatos bioinformatikai feladatokról, módszerekről. Érdekesség, hogy ő is a szőlő szekvenálással kapcsolatos egyik olasz csoportban dolgozik.

Massimilano Gentile Chip-seq data analysis and visualization using Chipster
Az olasz neve ellenére Massimilano Helsinkiben dolgozik a CSC-ben, ami a finn kutatási számítógépes szolgáltató intézmény, és ami ellentétben például a magyar NIIF-fel magas szinten foglalkozik bioinformatikai szolgáltatásokkal, helyt ad a finn EMBnet node-nak és már elkötelezte magát Finnország részéről, hogy csatlakozik az ELIXIR-hez is. A Chipster egy R-en, Bioconductor-on Java-n és egy csomó kiegészítő programon alapuló ingyenes microarray elemző felület. A rövidesen kibocsátandó új verzióban azonban megjelenik két újdonság is, egyrészt elkezdték az NGS alkalmazások implementálását, másrészt csináltak egy iszonyatosan gyors genom browsert, ami külön is elérhető lesz, és kiváló alternatívája lehet az IGV-nek. Az NGS feldolgozásnál először a ChIP-seq analízist valósították meg (a következő az RNA-seq lesz). Ez azt jelenti, hogy a nekünk csak a short read-ek illesztését kell beadni a programnak, a többit (a „peak” keresést és még néhány kiegészítő vizsgálatot, mint az ismert transzkripciós faktor kötőhelyek keresését (a JASPAR alapján) elvégzi a program egy gombnyomásra! A „peak” kereséshez összehasonlították az elérhető programokat, és végül a MACS-ot választották.

A második nap úgynevezett „hack-a-thon” szekció volt, ami során élesben kipróbálhattuk volna a különböző eszközöket (jelesül az NGS szekvencia beküldést, a MIRA és a többi genom aösszerakót). Ez az első NGS workshop-on tavaly novemberben Rómában kitűnően sikerült is, ott ugyanis a CASPUR-ban (Inter-University Consortium for the Application of Super-Computing for Universities and Research) közvetlen szuperszámítógép elérésünk volt. Most azonban a második nap már nem volt internet elérés a szállodában (gondolom nem bírta a hálózat és a rendszergazda az 50 bioinformatikus okozta forgalmat), ezért csak egy-egy bemutatót néztünk meg. Persze azért ez is nagyon tanulságos volt, például most már tudom, hogy kezdjek hozzá egy  ChIP-seq adat beküldéséhez.
 

Szólj hozzá!

Napi hírek – A velünk élő mikrobák

2010.05.20. 23:09 :: ebarta

Miközben egyre több reklám sugallja, hogy az lenne számunkra a jó, ha gyakorlatilag steril körülmények között élnénk, tudvalevő, hogy mikrobák milliárdjaival élünk békés egymás élésben. Különböző mikroorganizmusok tömege és a bőrünkön, az emésztő szervrendszerünkben, a genitáliákban és a húgyutakban.
A metagenomika a környezeti mintákból származó kevert DNS izolátumokat szekvenál. Korábban már több érdekes cikk jelent meg az emberi bőrből és a belekből származó DNS minták metagenomikai elemzéséről. Már ezekből is világossá vált, hogy rajtunk és bennünk élő mikrobiom nagyon változatos, egyén és nem függő, és például összefüggésbe lehet hozni az elhízással.
A héten a Science-ben jelent meg egy cikk, amelyben az amerikai „US Human Microbiome Project” egy 157 millió dolláros, öt éves projekt bevezető lépéseként megszekvenáltak és annotáltak 178 mikroba törzset. A törzseket a fent említett helyekről vett mintákból tenyésztették (ez persze már egyből aránytalanságot is okoz, hiszen sok mikroorganizmus nem él túl mesterséges körülmények közt, ezért dolgoznak már az egy sejtből kiinduló szekvenálási technikákon). A szabadon elérhető adatbázisokban eddig 1300 mikroorganizmus teljes annotált szekvenciája volt elérhető, így ezek az új adatok több mint 10%-os növekedést jelentenek. Ráadásul eddig főleg a patogén törzsek voltak az érdeklődés középpontjában, a mostani törzsek meg jobbára békésen élnek bennünk és rajtunk.
Azt már az eddigi metagenomikai eredményekből is lehetett tudni, hogy a biológiai diverzitás a mikroorganizmusok szintjén sokkal nagyobb, mint eddig gondoltuk. A most annotált 178 törzsben 30 ezer új gént azonosítottak, amelyek még sok tudományos és gazdasági újdonsággal szolgálhatnak, és segíthetnek megérteni, hogy ezeknek a mikroorganizmusoknak mi a lehet a szerepük.
 

Szólj hozzá!

Napi hírek (1000 genom projekt)

2010.05.15. 21:36 :: ebarta

A GenomeWeb híre alapján:

A Cold Spring Harbor-ban lezajlott „The Biology of Genomes” konferencián Richard Durbin beszélt az 1000 genom projekt állapotáról. Mint ismert, az 1000 genom projektet 2008 januárjában indították abból a célból, hogy minden addiginál mélyebb ismereteket szerezzünk az emberi genom szerkezetéről, változatosságáról. Eddig a bevezető fázisban csak néhány kiválasztott genomot, genom triókat (anya, apa, leány) és exomokat (exon-capture sequencing) szekvenáltak. A mostani bejelentés szerint azonban az idén már majdnem 500, év végéig pedig 1900 mintát fognak megszekvenálni. Jövőre pedig elérik a 2500-as számot, és a mintákat az eddigi kaukázusi, afrikai és kelet-ázsiai minták mellett kiegészítik indiai és dél-ázsiaiakkal.


A projektről majd később, ha a közlemény megjelenik, részletesebben is tervezek írni, most csak néhány érdekesség, amit Richard Durbin elárult a konferencián:

  • Az európai populációban 19-20 millió SNP lehet (ebből 8 milliónál 1%-nál magasabb a minor allél frekvenciája). A populációk elemzése alapján azt valószínűsítik ugyanakkor, hogy mivel a 20 millióból kb. a fele európai specifikus, az összes humán SNP elérheti a 60 milliót.
  • Úgy tűnik a variabilitás kereséséhez elégséges az alacsony lefedettségű (3-6x) szekvenálás, míg a magas lefedettségű (30x) szekvenálás (a családi triókat szekvenálták így), betekintést nyújt a szubsztitúciós ráta alakulásába, például megmutatták az eddigi eredmények, hogy a sejtvonalakban történő szomatikus szubsztitúciók 7-12x gyakoribbak, mint a csíravonalakban történő de novo mutációk.
  • Ezek alapján már most látszik, hogy az 1000 genom projekt fantasztikus mennyiségű információt fog nyújtani (és az mind szabadon elérhető és elérhető lesz, kezdve a gépekből kijövő szekvenálási adatoktól, a feldolgozott variabilitási adatokig). Ez ismét hatalmas segítséget fog nyújtani például a genetikai betegségek kutatásához (még úgy is, hogy a minták anonimak, és semmi vagy csak minimális fenotípus tartozik hozzájuk). Ugyancsak izgalmas bioinformatikus szemmel, hogy hogyan lehet kezelni ezt az irdatlan adatmennyiséget, például látható, hogy számos új fájlformátumot kell definiálniuk a projekten dolgozó bioinformatikusoknak.

Szólj hozzá!

Címkék: snp ngs napihír 1000genomes

Neandervölgyi genom

2010.05.07. 00:27 :: ebarta

Minden azzal van tele, hogy egy lipcsei vezetésű tudós csapat meghatározta a neandervölgyi ősember genomját, amit a Science-ben publikáltak. Persze a "breaking news" nem ez, hanem hogy bebizonyították, azt hogy mégiscsak történt kereszteződés a mi közvetlen őseink és a neandervölgyiek között. Jobban mondva az eurázsiai ág és a neandervölgyiek között (tehát az afrikai népek mentesek maradtak a neandervölgyi "vérfrissítéstől"). A mai eurázsiai genomok így tartalmaznak 1-2 százaléknyi neandervölgyi allélt. Mondjuk az eddigi, ezzel ellentétes bizonyítékok ugye mitokondriális szekvenciákon alapultak, ami csak azt bizonyíthatja, hogy eleink nem raboltak szabin, akarom mondani neandervölgyi nőket. Azt nem, hogy a neandervölgyi férfiak nem jártak át eleinkhez ...

A részletekről majd később még szeretnék írni, most csak egy-két fontosabb tény a szenzáción kívül:

  • A csontokból kivont DNS nagy része mikrobiális eredetű, és van sok modern humán szennyeződés is, ezért speciális mintaelőkészítő módszereket dolgoztak ki.
  • 454 és Illumina gépekkel szekvenáltak, a leolvasott DNS-t a modern humán és a csimpánz genomra is illesztették.
  • Ha a humán csimpánz szétválás 6.5 millió évvel ezelőtt volt, akkor a humán neandervölgyi szétválás 850 ezer éve
  • Az eredmény az összehasonlító genomika szép példája, az összehasonlítás kedvéért  például "mellékesen" megszekvenáltak (igaz csak alacsony lefedettséggel) öt emberi genomot is.
  • Új tudományágat kell megszoknunk, a paleogenetikát, vagy paleogenomikát
  • A Science-ben megjelent cikkeket általában nagyon nehéz letölteni (az érdekesebb cikekket például először csak a ScienceExpress-re külön előfizetők olvashatják), de most nem csak hogy szabadon letölthető az anyag, hanem még külön oldalakat is létrehoztak, ahol összegzik az eredményeket (lásd a fenti linket)

 

Szólj hozzá!

Címkék: 454 napihír illumina paleogenomika

Genomikai Nemzeti Technológiai Platform (GNTP)

2010.05.01. 22:42 :: ebarta

Pénteken (2010. április 30.) taggyűlést tartott Pesten a Genomikai Nemzeti Technológiai Platform (GNTP). Mi az a GNTP? A részleteket el lehet olvasni a honlapon, az én szubjektív olvasatomban a GNTP-nek az lenne a feladata, hogy megfogalmazza, bizonyítsa a döntéshozók számára (bárkik is legyenek), hogy a genomika a jövő (és máshol már a jelen) tudománya, amibe érdemes lenne komoly K+F pénzeket fektetni.


Az ülésen a munkacsoportok ismertették a stratégiai kutatási terveiket. Öröm volt látni, hogy milyen nagy az egyetértés abban, hogy az újgenerációs szekvenálási technológiák térhódítása hihetetlen mértékben felpörgeti a genomikai kutatásokat, és az milyen fantasztikus eredményeket hoz. Jó volt látni azt is, hogy az ügy érdekében összefogott a magyar kutatói társadalom, talán csak a mezőgazdaság képviselete volt hiányos, semmilyen szinten nem képviseltette magát például a volt intézetem, a hasznosítható mezőgazdasági biotechnológiai kutatások élharcosa az MBK :-(.

A hangulat nagyon optimista és bizakodó volt, mindenki úgy látja, hogy olyan érveket gyűjtöttünk össze a genomika támogatása mellett, amelyeket nem lehet figyelmen kívül hagyni. Ezt erősítette, hogy jelen volt és pozitívan nyilatkozott az NKTH és a NEKIFUT egy-egy képviselője is. Ugyanakkor az is biztos, hogy már most nagyon el vagyunk késve.

Persze az is lehet, hogy csak szélmalomharcot folytatunk. Itt van például az Magyar Tudományos Akadémia. A jövő héten akadémiai hét lesz, amit természetesen üdvözlök. Megnéztem az akadémia honlapját ez alkalomból, és a következőt találtam a Biológiai Osztály honlapján:

 

Azt kellene írnom, hogy no comment, de nem állhatom meg szó nélkül. Tudom, hogy az alkalmazott dipterológia is fontos például, de hogy semmiféle omika (genomika, transzkriptomika, proteomika, metagenomika, metabolomika), és persze a bioinformatika sem szerepel a tudós testület által gondozott tudományágak között, az inkább csak pesszimizmusra ad okot.
 

Szólj hozzá!

Címkék: nkth tudománypolitika genomika nekifut

süti beállítások módosítása