- obiecte
- abstract
- Principalul
- Rezultatul
- Adunarea genomului
- Adnotarea genomului
- Analiza evolutivă
- Mecanismul potențial de determinare a genului
- Analiza transcripțională a tranziției la obiceiurile alimentare
- discuţie
- metode
- Pregătirea și secvențierea bibliotecii ADN.
- Asamblarea secvenței.
- Predicția proteinelor care codifică genele.
- Rescrierea secvențelor.
- Identificarea contigilor masculi localizați pe un potențial cromozom sexual.
- Pregătirea probelor și identificarea genelor exprimate diferențial în experimentele FHT.
- URL.
- Coduri de acces.
- Istoria schimbărilor
- trepte
- Aderări primare
- Bioproiect
- Arhiva secvenței secvențiale
- Informatii suplimentare
- Fișiere PDF
- Text și imagini suplimentare
- Fișiere Excel
- Tabelul suplimentar 16
- Tabelul suplimentar 17
- Tabelul suplimentar 18
- Set de date suplimentare
obiecte
- Secvențierea ADN-ului
- Rezumatul acestui articol a fost publicat la 29 iulie 2015
Acest articol a fost actualizat
abstract
Crapul de iarbă este un pește important de crescătorie, reprezentând aproximativ 16% din acvacultura de apă dulce din lume și are o dietă vegetariană. Aici vă prezentăm conceptul genomului de 0,9 Gb al unei femele adulte ginogenetice și genomului de 1,07 Gb al unui bărbat adult sălbatic. Adnotarea genomică a identificat 27.263 de modele genetice care codifică proteinele din genomul feminin. Un total de 114 schele constând din 573 Mb sunt ancorate în 24 de grupuri de legare. Se estimează că diferențele dintre crapul de iarbă și zebră au apărut în urmă cu 49 - 54 de milioane de ani. Identificăm fuziunea cromozomială în crapul de iarbă în raport cu zebra și înregistrăm tranziții frecvente între cromozomii de iarbă X și Y de iarbă. Am constatat că activarea transcripțională a căii mevalonate și biosinteza steroizilor în ficat este asociată cu adaptarea crapului de iarbă din dietele carnivore la cele erbivore. Credem că genomul ierbii crapului ar putea servi drept o platformă inițială pentru reproducerea peștilor de o calitate mai bună utilizând o abordare genomică.
Principalul
A ) Imagine a unui crap adult. b ) Distribuția frecvenței 55 de metri. Distribuția frecvenței K -mer în citiri a fost derivată din biblioteci cu o dimensiune scurtă a inserției (350 - 400 bp). Valorile pentru polimerii K sunt reprezentate grafic în funcție de frecvența (axa y) a apariției lor (axa x). Cel mai prost vârf trunchiat la apariția scăzută (1-2) s-a datorat în principal erorilor fundamentale aleatorii din secvențele inițiale. c ) Filogenia reconstituită a 13 genomi de vertebrate. Raportul dN/dS al fiecărei ramuri este indicat în albastru. Numerele în negru corespund valorilor suportului bootstrap. Lampa este folosită ca grup. Lungimea sucursalei este măsurată în substituțiile preconizate pe site. d ) Diagrama Venn a grupelor genetice pentru cinci genomi de vertebrate selectate. Fiecare număr reprezintă numărul de familii de gene ortologice împărțite de genomii menționați.
Imagine la dimensiune completă
- Descărcați datele sursă Excel
Rezultatul
Adunarea genomului
Genomul gazonului este compus din 24 de perechi de cromozomi 18, 19 (2 n = 48). După adoptarea unei strategii de secvențiere a puștii genomului total, am generat aproximativ 132 Gb de secvențe de secvențe Illumina pe ADN genomic izolate din sângele unui peluză adultă ginogenetică de crap și 136 Gb citește de la un bărbat adult sălbatic capturat cu apă (Tabelul suplimentar 1). și nota suplimentară). Am construit seturi finale de genomi feminin (0, 90-Gb) și masculin (1, 07-Gb) folosind un tub de asamblare modificat de novo Phusion-meta așa cum s-a descris anterior 20 (Figura 1 și Tabelul 2 suplimentar). Genomul de design feminin a fost complet adnotat la informațiile mele genomice (Fig. 1) și a fost folosit pentru a ancora schela la harta de legătură genetică, în timp ce genomul masculin a fost utilizat pentru a detecta variația secvenței între genomul masculin și cel feminin.
Ansamblul genomului feminin avea schele cu o lungime N50 mai mare de 6,4 Mb, iar 90% din ansambluri erau compuse din 301 schele, toate mai lungi de 179 kb (Tabelul 1). Estimarea dimensiunii genomului utilizând distribuția frecvenței K-mer a arătat că genomul feminin a fost de aproximativ 891 Mb în ceea ce privește dimensiunea fișierului (Figura 1b și nota suplimentară). Am evaluat acuratețea ansamblului genomic prin alinierea schelelor cu 3.027 publicate UniGene conține 5 și 11 BAC 21 (Figurile suplimentare 2 și 3 și Tabelele suplimentare 3), indicând faptul că acoperirea contigurilor originale și a schelelor a fost de aproximativ 95% și 97 %, respectiv. Erorile de secvență provin în principal din inserții sau ștergeri introduse de ansamblul de citire scurtă (Tabelul suplimentar 3a).
Tabel în dimensiune completă
În total, am identificat un total de 644.817 SNP heterozigoți și 66.101 indele scurte (10 nucleotide în lungime sau mai puțin) în genomul feminin. Am identificat 1.465.819 SNP-uri și 166.867 indoli scurți în genomul masculin. Rata generală estimată de heterozigoză a fost de aproximativ 0, 9 și 2, 5 polimorfisme pe kilobază în genomul feminin și masculin (Tabelul suplimentar 4). Este clar că genomul masculin sălbatic a avut un grad mult mai mare de heterozigoză, ceea ce a provocat bimodalitatea în distribuția frecvenței K -mer (Fig. 1b) și o lungime mai mică pentru schelele asamblate.
Adnotarea genomului
Am enumerat un total de 27.263 de gene care codifică proteina din genomul feminin. Dovezile utilizate în predicția genelor au inclus date de secvențiere a ARN-ului de 27 Gb (ARN-seq) din 6 țesuturi (embrion, ficat, splină, creier, rinichi și rinichi de cap), peste 3.000 de înregistrări cunoscute UniGene și informații despre genele omologe de pește zebră (eliberare Ensembl) 67, figura suplimentară 4, tabelul suplimentar 5 și setul de date suplimentare). În adnotarea noastră de gene ARN necodificatoare (tabelele suplimentare 6 și 7) și 467.783 secvențe unice (tabel suplimentar), am prezis 1.538 tARN, 24 rARN, 207 ARN nucleare mici (snoARN), 136 ARN nucleare mici (snARN) și 444 microARN. 8). Adnotarea repetată de novo indică un conținut total de repetare de 38% comparativ cu 43% în BAC (Tabelul suplimentar 9). Această proporție este mai mică de 52,2% din conținutul repetat observat la peștele zebră 3. Această diferență se poate datora excluderii secvențelor repetate situate în spații deschise și pe fragmente mici (3 .
Folosind harta de legare genetică a crapului 4 publicată, am ancorat 114 schele pe 24 de grupuri de legare (fig. 2a, tabelul suplimentar 10 și nota suplimentară), acoperind 573 Mb (64%) din grupul feminin cu 17.456 (64%). gene adnotate localizate. Sinteza genei prin schele ancorate a arătat că majoritatea grupurilor de legare a crapului de iarbă aveau o colinearitate extinsă cu cromozomii de pește zebră corespunzători (Fig. 2b). Alinierea genelor a arătat o sinteză ridicată pentru crapul de iarbă și pește zebră, iar până la 24.018 gene de crap de iarbă (88% din totalul de 27.263 de gene) au fost localizate pe blocuri sintetice (Figura 2c). Deși acest rezultat a fost similar cu raportul anterior 4, am găsit două aranjamente cromozomiale încrucișate pentru grupurile de legare 22 și 24. În mod remarcabil, grupul de legare 24 aliniat cu cromozomii peștelui zebră 22 și 10, dar nu cu nici un alt grup de legare a crapului. Analiza FISH a cromozomilor de crap de iarbă a arătat că cei doi markeri de crap de iarbă aliniați cu cromozomii de pește zebră 10 și 22 se aflau într-adevăr într-un singur grup de legare 24 (Fig. 2d), ceea ce explică de ce numărul cromozomului 25 este în zebră, dar 24 în crap.
A ) Schelele au fost ancorate pe o hartă de consens publicată 4. Liniile albastre indică lungimea fiecărui linker (LG) la care sunt mapate etichetele. Distanțele hărții dintre markeri sunt afișate pe scara KosMC cM. Barele portocalii reprezintă schelele ancorate. Liniile negre care leagă marcajele și schelele indică amplasarea marcajelor pe schele. Lungimea fiecărui schelă este prezentată în raport cu o coloană la scară de 5 Mb. b ) Relația sintetică dintre cromozomii zebră și grupurile de legare a crapului. Grupul de legare 22 este aliniat cu cromozomii 2 și 15 din peștele zebră, iar grupul de legare 24 este aliniat cu cromozomii 10 și 22 din peștele zebră. c ) Colinearitatea genelor dintre zebre și ierburi de crap. Cromozomii peștelui zebră sunt reprezentați de blocuri albastre (de exemplu, DR01). Schelele pentru crap (lungime> 50 kb) sunt prezentate în blocuri portocalii. Genele aliniate sunt conectate prin linii verzi. Lungimile cromozomilor și schelelor sunt prezentate în raport cu o coloană la scară de 10 Mb. d ) Studiul FISH linker 24. Marcatorul galben CID1435 este situat în regiunea aliniată cu cromozomul 10 al peștilor zebră, iar markerul roșu CID0538 este aliniat cu cromozomul 22 al peștelui zebră. Scală, 5 μm.
Imagine la dimensiune completă
- Descărcați datele sursă Excel
Analiza evolutivă
Pentru a studia evoluția crapului de iarbă, am grupat modelele genelor de crap de iarbă cu gene de la alți 12 genomi de vertebrate și am folosit 202 de copii singure ale genelor cu corespondență diferită în genomi diferiți pentru a reconstitui arborele filogenetic (Fig. 1c și suplimentar). Notă). Ca specie a familiei Cyprinidae, crapul de iarbă avea cea mai strânsă relație cu zebrele. Potrivit bazei de date TimeTree 22, timpul de divergență între zebre și crap de iarbă a fost estimat la aproximativ 49-54 milioane de ani (Tabelul suplimentar 11). Cele mai multe dintre genomii teleostei selectați au prezentat presiuni de selecție similare în funcție de valorile calculate dN/dS (raportul dintre rata de substituție non-sinonimă și rata de substituție sinonimă).
Toate genele au fost implicate în GCSD sau ZSD. Traseele au fost determinate prin căutarea în baza de date rutieră KEGG. Axa x arată numărul de gene implicate în fiecare cale. Căile marcate cu albastru evidențiază procesele metabolice care sunt potențial importante pentru dezvoltarea sau adaptarea dietei.
Imagine la dimensiune completă
- Descărcați datele sursă Excel
Mecanismul potențial de determinare a genului
Când am comparat seturile pentru crapul mascul și iarba femelă, am identificat 206 contiguri cu o lungime totală de 2,38 Mb purtate de un bărbat adult, dar nu o femelă ginogenetică (Figura suplimentară 11 și Tabelele suplimentare 16 și 17). Fiecare contig a fost confirmat prin secvențierea bazată pe PCR. De asemenea, am amplificat aceste regiuni prin PCR într-un grup extins de 24 de bărbați și 24 de femei, identificând frecvente încrucișări cromozomiale între cromozomii X și Y din crap (Figura suplimentară 12). Sexul din crap nu poate fi determinat de întregul cromozom, ci de mai multe gene critice. Evident, am identificat o sondă specifică genomului masculin care a fost mapată la unul dintre contiguri (sonda 184 din figura suplimentară 12). Nu am găsit o aliniere a secvenței acestei regiuni cu niciun alt genom al vertebratelor, sugerând originea sa unică în crap.
Analiza transcripțională a tranziției la obiceiurile alimentare
Ierburile de crap sunt de obicei erbivore, o proprietate care le face un tip popular de propagare. Modul în care crapul de iarbă absoarbe în mod eficient substanțele nutritive din plante pentru a susține creșterea rapidă a acestora este o întrebare de cercetare fără răspuns 37. Crapul de iarbă finalizează tranziția de la o dietă carnivoră la una erbivoră când atinge o lungime corporală de 3 până la 5,5 cm, aproximativ 1,5 luni după eclozare. Am analizat ARN-sequ. Derivat din intestin, ficat și creier pentru a caracteriza variațiile exprimării genelor înainte și după schimbare (Fig. 4a și metode online). Genele cu expresie diferențială s-au îmbogățit semnificativ în căile asociate cu ritmul circadian în intestin și cu biosinteza steroizilor, biosinteza coloanei vertebrale terpenoide și metabolismul glicerofosfolipidic hepatic (DAVID Bioinformatics Resources 38; P
A ) Proiectarea experimentelor FHT. La 46 de zile după eclozare, peștii care nu au fost supuși FHT (hrăniți cu larve de chironomide) au fost prelevați din „46 d”. Între 46 și 116 zile după eclozare, peștii au fost împărțiți în două grupuri - una hrănită cu branhii și cealaltă încă hrănită cu larve de chironomide - care au fost colectate la 116 zile după eclozare ca eșantion „116 d - FHT” și eșantion „116 d ". ( b ) Activarea căii mevalonat și biosinteza steroizilor. Săgețile albastre și portocalii indică pașii de reacție în moduri diferite. Numărul din fiecare dreptunghi indică codul CE al enzimei care catalizează acest transfer. Codurile roșii indică gene enzimatice cu o expresie semnificativ crescută după ce FHT (q 45) este prezentată în histograme. Numele compușilor sunt afișate lângă cercurile corespunzătoare.
Imagine la dimensiune completă
- Descărcați datele sursă Excel
După o schimbare a dietei, este esențial ca crapii de iarbă să mențină un ritm continuu de hrănire, astfel încât să poată obține suficienți nutrienți din dieta lor. Analizele datelor hepatice de ARN-seq au identificat activarea semnificativă a căii de biosinteză steroid-la-mevalonat în biosinteza coloanei vertebrale terpenoide, care se reflectă într-un nivel mediu de exprimare de 32 de ori mai mare decât înainte de modificarea dietei (valoarea q 39 40, 41) că crapii de iarbă hrăniți cu gândaci de purici au o creștere semnificativ mai mare decât varza hrănită cu larve chironomide (pești pre-trecere și pești fără trecere) în ceea ce privește lungimea corpului, lungimea intestinului, greutatea corporală și lungimea intestinului/viteza lungimii corpului neprezentat) Adaptarea metabolică a acestor căi promovează aparent utilizarea eficientă a nutrienților din plante din crap.
În plus, un raport anterior a afirmat că crapii cu iarbă hrăniți cu o dietă pe bază de plante petrec mai mult timp hrănind 37. De asemenea, am observat că crapul de iarbă, care a primit o dietă pe bază de plante, s-a hrănit aproape continuu pe parcursul perioadei de 24 de ore. Analizele datelor transcriptomului au arătat că genele implicate în calea ritmului circadian au fost activate după trecerea alimentelor (FHT), care a inclus heterodimerul ceasului - bmal1 și genele ror și ceas (Figura suplimentară 15a). Genele înrudite prezintă o asemănare mare cu genele peștilor zebră (cum ar fi genele rorca 42 și clocka 43), cu excepția unor regiuni promotoare ale genelor care poartă elemente diferite (Figura suplimentară 15b). Deși relația dintre genele implicate în ritmul circadian și hrănirea continuă nu este clară, această constatare ar putea sugera că frecvența hrănirii ar trebui investigată în timpul unei modificări a dietei crapului.
Am investigat citirile de crap non-ierburi pentru potențiali microbiotați intestinali prin eliminarea tuturor citirilor intestinale ARN-seq aliniate cu ansamblurile de crap de iarbă (tabelele suplimentare 20 și 21 și nota suplimentară). Această analiză nu a identificat nicio genă care codifică enzimele prezise care digeră celuloza din intestin, sugerând că intestinul crapului nu poate digera și absorbi celuloza, întărind noțiunea că celuloza se poate dezvolta ca un aditiv apos pentru a promova creșterea crapului. 44. Cu toate acestea, este probabil ca secvențierea biotei intestinale să fie mai puternică în înțelegerea modului în care digestia crapului materialele vegetale.
discuţie
Am creat două seturi ale genomului crapului de iarbă, mascul și femelă complet adnotată. Compararea unui număr mare de modele genetice și analiza sintezei au arătat că peștele zebră și crapul de iarbă au o istorie similară a genomului. Cu toate acestea, fuziunea cromozomială, care are ca rezultat legarea grupului 24 și apariția GCSD, poate fi responsabilă pentru diferențe semnificative în dezvoltare (de exemplu, dimensiunea corpului) și alte caracteristici (de exemplu, determinarea sexului) între crapul de iarbă și zebre. Caracterizarea transcrierilor asociate cu modificările dietetice a furnizat noi informații genomice cu privire la adaptarea metabolică a crapului la tranziția la o dietă vegetariană pe parcursul vieții sale. Aceste secvențe genomice determină, de asemenea, propagarea crapului de iarbă în faza genomică.
metode
Pregătirea și secvențierea bibliotecii ADN.
ADN-ul genomic a fost izolat din celulele sanguine ale crapilor adulți ginogenetici adulți și iarbă de crap adulți sălbatici captivi folosind kitul DNeasy Blood and Tissue (Qiagen). Abordarea 46 fără amplificare a fost utilizată pentru a pregăti biblioteci de secvențe cu inserții scurte de la 350 la 450 bp pentru citiri asociate în conformitate cu protocolul producătorului pentru Illumina. Protocoalele din Mate-Pair Library v2 Sample Preparation Manual (Illumina) și capătul asociat sunt utilizate pentru a construi biblioteci cu dimensiuni de inserare de 1, 3, 5 și 8-10 kb pentru citiri asociate (Figura suplimentară 16). Manualul de pregătire a bibliotecii (Roche) a fost combinat. Datele brute au fost generate de secvențierul Illumina HiSeq 2000 și de secvențierul Illumina Genome Analyzer IIx.
Asamblarea secvenței.
O conductă de asamblare de novo a fost dezvoltată pentru a compila valorile scurte (Figura 1 suplimentară), care a fost o versiune modificată a metodei Phusion-meta, așa cum s-a menționat anterior 20. Pe scurt, atunci când capetele pereche au fost citite pentru a elimina citirile slabe care conțin zece sau mai mulți polimeri K unici, aceștia au fost grupați în mii de grupuri folosind Phusion2 cu K -mer setat la 51 bp. Citirile grupate în fiecare cluster au fost aranjate în paralel în contigs ABYSS 47, fermi 48 și SOAPden's 49. Toate aceste contiguri au fost îmbinate pentru a crea un design contig inițial. Contigurile de consens au fost obținute prin alinierea tuturor citirilor înapoi la proiectele de contiguri folosind instrumentul de gestionare a ansamblului GAP5 (ref. 50). Perechile de perechi citite au fost apoi ierarhizate și iterativ unite în contiguri pentru a construi schele SOAPden preliminare (K -mer setat la 61 bp). Schela finală a fost realizată folosind Spinner.
Predicția proteinelor care codifică genele.
Rescrierea secvențelor.
Șase țesuturi (embrion, ficat, splină, creier, rinichi și cap) au fost colectate de la bărbați adulți, iar datele rezultate au fost utilizate pentru modelarea genelor. Toate aceste probe, precum și probele din experimentele FHT, au fost supuse izolării ARN utilizând reactiv SV TRIzol (Invitrogen). Poli (A) + mARN a fost purificat folosind trusa de purificare a ARNm DynaBeads (Life Technologies). Bibliotecile de ADNc împerecheate au fost construite folosind kitul de pregătire a bibliotecii complete ARN ARN Seq NGS ARN (Gnomegen). Bibliotecile de ADNc pereche rezultate au fost secvențiate utilizând un sistem Illumina HiSeq 2000.
Identificarea contigilor masculi localizați pe un potențial cromozom sexual.
Contigs bărbați (lungime> 500 bp) au fost aliniați cu contigs feminini (lungime> 500 bp) folosind un aliniator MUMmer 53 cu parametrii impliciți. Acoperirea fiecărui contig masculin de către femele a fost apoi estimată folosind un prag de identitate> 95% și necesitând orice decalaj dezechilibrat în regiunea aliniată pentru a fi lungă 54 a fost utilizată pentru a măsura digital expresia diferențială la loci adnotate. Când expresia genică a crescut sau a scăzut în 116 d - ficat FHT cu mai mult de două ori (valoarea q 39
- Uleiul de sunătoare și efectele sale
- Câine nou Cum să-și gestioneze primele zile într-o gospodărie nouă
- Obama vrea să înăsprească reglementarea armelor după masacru, lobby-ul și-a atacat copiii TREND
- Propunerea de măsuri menite să ajute economia în legătură cu răspândirea virusului COVID-19 - Mazars -
- Proiectarea sursei de alimentare este difuzată și DIPLOMA THESIS MILAN KARDO