- obiecte
- abstract
- introducere
- Subiecte și metode
- Selectarea probei
- Pregătirea și asamblarea ADN-ului
- Secvențierea exactă
- Secvențierea cartografierii citirii, a variantelor de apelare și a adnotărilor funcționale
- Variante de filtrare și îmbogățire pentru obezitate
- Validarea variantelor în funcție de genotipare
- Analiza statistică a asociației
- Rezultatul
- Descoperirea variantelor rare prin secvențierea exoma
- Validarea SNV și analiza asocierii
- discuţie
- Informatii suplimentare
- Documente Word
- Informatii suplimentare
obiecte
abstract
Obezitatea contribuie major la povara globală a bolilor cronice, cum ar fi diabetul de tip 2. 1 A fost demonstrat un impact genetic puternic asupra obezității. Cu toate acestea, identificarea genelor specifice implicate în forme comune de obezitate umană s-a dovedit de neegalat, în ciuda eforturilor mari depuse de diverse abordări, inclusiv studii de gene candidate, studii de legătură genomică și asociații de genom (GWA). 2, 3 Până în prezent, studiile GWA au identificat aproximativ 50 de loci genetici asociați cu obezitatea. Totuși, împreună, acești loci explică doar aproximativ 1-2% din variațiile indicelui de masă corporală (IMC) la populațiile studiate. 4 Prin urmare, principala întrebare este cum poate fi explicată așa-numita moștenire „lipsă” rămasă. 5 Există două preocupări principale cu privire la interpretarea rezultatelor GWA. În primul rând, abordarea se bazează pe o boală comună, o ipoteză variantă comună. Câmpurile comerciale de polimorfism cu nucleotide unice (SNP) utilizate în studiile GWA au fost concepute pentru a acoperi variante genetice comune (frecvența alelelor mai mici (MAF)> 5% în populații). Din acest motiv, nu a fost posibilă evaluarea directă a variantelor rare folosind astfel de câmpuri. În al doilea rând, au fost utilizate modele statistice imperfecte care nu iau în considerare interacțiunile genă-genă și genă-mediu pentru a analiza datele GWA. 6
Tehnologia dezvoltată recent de secvențiere de mare viteză completează câmpurile SNP și demonstrează capacitatea de a detecta variantele care cauzează boli rare prin secvențierea profundă a tuturor exonilor cunoscuți. 7, 8, 9 Această revoluție a tehnologiei promite să elucideze bolile complexe, permițând căutarea unor variante de frecvență joasă și rare și aparent funcționale în întregul genom. Secvențierea precisă poate fi cea mai eficientă atunci când se aplică pacienților cu forme mai extreme de boli comune, cum ar fi obezitatea morbidă; în primul rând, crește probabilitatea de a obține o asociere semnificativă pentru variantele rare cu penetrare ridicată; în al doilea rând, variantele genetice din secvența de codificare a proteinelor pot avea un efect mai mare asupra fenotipului decât variantele din regiunile intergenice.
În acest studiu, am folosit secvențierea exom pentru a detecta variante genice de frecvență scăzută și rare, îmbogățite în adulți obezi morbid și le-am confirmat împotriva adulților mai mari niciodată obezi. Am considerat că astfel vom îmbogăți genele obezității între cazuri și le vom filtra în controale. Aici prezentăm o variantă de frecvență joasă asociată cu obezitatea în regiunea codificatoare a genei 2 asemănătoare sinaptofizinei (SYPL2).
Subiecte și metode
Selectarea probei
Cohortele pentru studii genetice sunt descrise în Tabelul 1. Subiecții au fost recrutați prin publicitate locală pentru a studia genele care reglează greutatea sau în legătură cu vizitele planificate la obezitate morbidă sau scolioză în unitățile noastre medicale sau chirurgicale. Cele mai multe dintre ele au fost descrise. 10, 11 Din subgrupul de indivizi obezi, am selectat dintre 10% cu cel mai mare IMC 100 de indivizi cu obezitate extremă la secvențierea exomului (69 de femei, 31 de bărbați, cu vârsta de 41, 5 ± 11, 5 ani, IMC 52, 2 ± 3, 8 kg/m 2). Toți subiecții selectați au avut obezitate morbidă definită ca IMC> 40 kg/m2. Ca martori pentru secvențierea exomului, am utilizat subiecți deja colectați pentru studiul genetic în curs al scoliozei idiopatice (76 de femei, 24 de bărbați, vârstă 24,5 ± 12,8 ani, IMC 21,9 ± 4,3 kg/m2). Pentru prima validare a genotipului, am selectat 494 de indivizi obezi morbid cu cel mai mare IMC din colecția de probe mari descrisă mai sus, inclusiv 100 de indivizi care au fost utilizați pentru secvențierea exomului. Am folosit 496 de persoane care nu au niciodată obezitate cu vârsta> 40 de ani și IMC 2 ca martori. În cea de-a doua confirmare, am genotipat restul de 1425 de indivizi obezi morbid și 782 martori obezi niciodată cu vârsta> 40 de ani și IMC 2 .
Tabel în dimensiune completă
Controalele de secvențiere a exomei non-obezi au avut scolioză. În caz contrar, toți ceilalți subiecți de control au fost sănătoși conform raportului. A existat o supra-reprezentare a femeilor în cohortele studiate. Femeile obeze au mai multe șanse să solicite asistență medicală pentru obezitatea lor. Scolioza este mai frecventă la femei. Obiectele erau de origine europeană și trăiesc în Suedia. Studiul a fost aprobat de comitetele locale de etică și toate entitățile au acordat consimțământul informat pentru a participa.
Pregătirea și asamblarea ADN-ului
ADN-ul genomic a fost preparat din PBMC folosind trusa QiAmp ADN din sânge Maxi (nr. Cat. 51194, Qiagen, Hilden, Germania). Puritatea și calitatea ADN-ului au fost confirmate de un raport A260/280 de 1,8 pe un nanodrop (Thermo Fisher Scientific Inc., Waltham, MA, SUA) și electroforeza pe gel de agaroză. Concentrația ADN a fost măsurată utilizând Qubit (Life Technologies, Stockholm, Suedia). Ulterior, am luat 0,8 μg din fiecare probă de ADN și le-am împărțit aleatoriu în 10 grupuri, fiecare conținând 10 probe fie de cazuri obezi, fie de martori. Concentrațiile probelor de ADN colectate au fost măsurate folosind Qubit și probele au fost analizate pe un gel de agaroză.
Secvențierea exactă
Secvențierea precisă a fost efectuată la Laboratorul Science for Life (SciLifeLab), Stockholm, Suedia. Fiecare bibliotecă de ADN a fost preparată din 3 μg de ADN genomic grupat. ADN-ul a fost tăiat la 300 bp folosind un instrument Covaris S2 și îmbogățit folosind un kit SureSelectXT Human All Exon 50 Mb și o stație de lucru Agilent NGS conform instrucțiunilor producătorului (îmbogățire automată a obiectivului SureSelectXT pentru secvențierea multiplexă a perechii Illumina, versiunea A, Agilent Technologies, Santa Clara, CA, SUA).
Clusterizarea a fost efectuată pe un sistem de generare de clustere cBot utilizând un kit de generare de clustere asociat HiSeq conform instrucțiunilor producătorului (Illumina, San Diego, CA, SUA). Probele au fost secvențiate pe un Illumina HiSeq 2000 atunci când citirea pereche se termină până la 100 bp/citire (Illumina). Toate benzile au fost îmbogățite cu 1% bibliotecă de control phiX, cu excepția benzii 8, care avea 2% phiX. Ciclurile secvențiale au fost efectuate conform instrucțiunilor producătorului. Conversia de bază a fost efectuată folosind OLB v1.9 de la Illumina (Illumina).
Cartarea secvențierii citirii, a variantelor de apelare și a adnotărilor funcționale
Citirile secvenței au fost aliniate la secvența de referință umană curentă (ansamblul hg19, ansamblul NCBI 37) (//hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/) folosind un egalizator Burrows-Wheeler (versiunea BWA 0.6.1,// bio -bwa.sourceforge.net/, Li și Durbin 12) cu un parametru de trunchiere citită - q 20. Variantele de secvență au fost invocate folosind funcția de acumulare multiplă samtools-0.1.18 (//samtools.sourceforge). net /), cu o calitate minimă a cartografierii de 20 și o adâncime minimă de citire de 5 × pentru filtrare. Duplicatele PCR au fost eliminate folosind samtools înainte de a dezvolta varianta. Pentru adnotarea funcțională a variantelor de secvență, am folosit annovar (//www.openbioinformatics.org/annovar/, Wang și colab. 13) pentru a integra informații din diferite baze de date din domeniile publice, cum ar fi o referință la gene (//hgdownload.soe ). ucsc.edu/goldenPath/hg19/database/refGene.txt, 2013), dbSNPs (SNP135, //hgdownload.soe.ucsc.edu/goldenPath/hg19/database/snp137.txt.gz) și un proiect de 1000 de genomi (///www.1000genomes.org/).
Variante de filtrare și îmbogățire pentru obezitate
Am utilizat următoarele criterii de filtrare pentru a selecta variantele de nucleotidă de frecvență joasă și rare (SNV) din datele de secvențiere a exomului. Acele SNV îmbogățite pentru subiecții obezi morbid au fost supuși validării (Figura 1). În primul rând, am filtrat variantele cu o adâncime de 5 × și o calitate a cartografierii (MQ) ≥20. Am căutat apoi variante aparent funcționale, adică variante din regiuni exonice, site-uri de îmbinare sau regiuni opuse 5 '. În pasul următor, am comparat apariția variantei dintre grupurile obeze și cele de control. În următoarea etapă de filtrare, au fost utilizate doar variante numite în ≥ 2 fonduri obeze, dar fără apel sau apelate o dată în fonduri de control; acest pas a fost utilizat pentru a preveni potențialele variante fals pozitive. Ultima filtrare s-a bazat pe frecvența alelelor. Am căutat SNV-uri cu frecvență redusă și rare, adică variante care nu au fost găsite în bazele de date publice sau SNP-uri cunoscute cu MAF ≤ 5% în populația generală (proiectul 1000 Genomes 2011 poate fi publicat).
Prezentare generală a proceselor de lucru. SNV nepublicat: variante neincluse în SNP135.
Imagine la dimensiune completă
Validarea variantelor în funcție de genotipare
Validarea variantelor s-a concentrat pe SNV-uri îmbogățite cu etapele de filtrare de mai sus, care se încadrează într-un panou de genotipare gestionabil și au fost efectuate în doi pași. În primul rând, toate variantele selectate au fost genotipate la 494 de indivizi obezi și 496 de controale (Tabelul 1 și Figura 1) folosind testul Illumina GoldenGate efectuat pe platforma tehnologică SNP/SEQ de la Universitatea Uppsala, Suedia (//www.molmed.medsci.uu) . se/SNP + SEQ + Tehnologie + Platformă (Genotipare), Fan și colab. 14). În al doilea rând, variantele genotipate care prezintă o asociere nominală semnificativă cu obezitatea au fost genotipate în alte 1425 obezi și 782 martori. Genotiparea a fost efectuată prin spectrometrie de masă cu desorbție cu laser/ionizare cu un timp de zbor folosind o matrice (SEQUENOM, Agena Bioscience, San Diego, CA, SUA) la Laboratorul de mutații nucleare (MAF) de la Institutul Karolinska, Suedia. 15 teste multiplexate au fost proiectate utilizând software-ul MassARRAY Assay Design v4.0 (Agena Bioscience). Protocolul de extensie alelă specifică alelelor a fost realizat conform recomandărilor Agena Bioscience. Toate rezultatele asocierii genetice în cohortele de validare 1 și 2 au fost transmise către GWAS Central.
Analiza statistică a asociației
Subiecții au fost caracterizați de IMC și valorile sunt raportate ca medie ± SD pentru obezi și martori separat. Analiza asocierii genetice și calculul raportului de probabilitate au fost efectuate folosind PLINK (//pngu.mgh.harvard.edu/
purcell, Purcell și colab. 16). Echilibrul Hardy-Weinberg (HWE) al frecvențelor genotipului dintre cazuri și controale a fost verificat separat pentru fiecare ciclu de validare înainte de analiza asocierii. Valoarea nominală HWE P 0,01 pentru controale a fost utilizată ca valoare limită pentru a exclude variantele din analize ulterioare. IMC a fost analizat folosind o regresie liniară standard implementată în PLINK. Sexul și vârsta au fost utilizate ca covariabile pentru a evalua efectul lor asupra asocierii variantei cu IMC.
Rezultatul
Descoperirea variantelor rare prin secvențierea exoma
Pentru a identifica potențialele variante funcționale de frecvență joasă și rare asociate cu obezitatea extremă, am efectuat secvențierea exoma pe ADN comun de la 100 subiecți (10 grupuri) cu obezitate morbidă severă și 100 subiecți martor (10 grupuri). Astfel, a existat ADN de la 10 subiecți din fiecare grup. Caracteristicile subiecților pentru secvențierea exoma sunt prezentate în Tabelul 1. Subiecții obezi au fost mai vechi decât grupurile de control, în timp ce distribuția de gen a fost similară între cohorte, cu o supra-reprezentare a femeilor. În total, am primit> 100 de milioane de lecturi de la fiecare grup (tabelul suplimentar S1). După tăierea imaginilor de calitate scăzută și eliminarea duplicatelor PCR, 95% din imagini au fost mapate la referința actuală a genomului uman (ansamblu hg19, ansamblu NCBI 37), cu excepția unui grup de control, care avea o rată de mapare ușor mai mică. Marea majoritate a citirilor au fost cartografiate în mod unic pe același cromozom pentru ambele citiri asociate. Dezacordul dintre citirile asociate a fost rar. Citirile au fost asociate la o rată mai mare (97%) în grupurile obeze decât în grupurile martor (80-95%) (Tabel suplimentar S1). Peste 92% din regiunile țintă au fost acoperite de 5 lecturi și> 80% din regiunile țintă au fost acoperite de 30 de lecturi (tabelul suplimentar S2).
Tabel în dimensiune completă
Validarea SNV și analiza asocierii
Am exclus variantele de inserție sau ștergere din SNV 1032 pentru a evita posibilele probleme tehnice cu genotiparea. Apoi am filtrat SNV-urile partajate de cel puțin două dintre cele mai performante grupuri de obezi. După verificarea manuală a alinierii citirilor care conțin variante folosind software-ul IGV (//www.broadinstitute.org/igv/) pentru a exclude potențiale artefacte, am selectat 144 de SNV-uri pentru genotipare (142 dbSNP-uri și 2 SNV-uri necunoscute). Adâncimile secvențiale și numărul grupurilor de obezitate partajate 144 SNV sunt prezentate în tabelul suplimentar S3. Majoritatea SNV-urilor au fost găsite în două (83) sau trei (31) grupuri. Zece SNV-uri au avut dificultăți în proiectarea primerilor pentru genotipare și au fost înlocuiți cu SNV-uri singleton.
Tabel în dimensiune completă
Semnificația asocierilor a 5 SNV cu obezitate sau IMC în prima și ultima analiză nu a fost afectată atunci când am exclus 100 de subiecți utilizați în secvențierea exomului pentru analize (Tabelele suplimentare S6 și S7).
Pentru a evalua în continuare orice efect confuz de vârstă sau sex, am adăugat aceste variabile ca covariabile în modele de regresie și le-am testat separat efectele individuale. rs62623713 a menținut relații puternice cu IMC după ajustarea în funcție de vârstă sau sex (tabelul suplimentar S8). Asocierea dintre rs35923425 și IMC a dispărut după ajustarea vârstei. Mai mult, am efectuat și diferite teste pentru a modifica analiza mai multor variante genetice. Asocierea rs62623713 cu IMC a fost încă semnificativă în Pferaz modificat de Bonferroni 3.0 x 10-4 și în corecția genomului P controlat de 0,05. Tabelul suplimentar S9).
discuţie
Folosind secvențierea exoma, urmată de o genotipare extinsă, am identificat o variantă de codificare a frecvenței joase a rs62623713 (E99G) în exonul 4 al genei SYPL2, care este în mod constant asociată cu obezitatea morbidă. rs62623713 are un MAF de 2,9% pentru alela G la populațiile generale de 1.000 de genomi. Varianta este supra-reprezentată printre subiecții noștri obezi (MAF 8%). rs62623713 nu a fost inclus în câmpurile genotipice Illumina sau Affymetrix utilizate în studiile anterioare GWA și nici o altă variantă a acestor câmpuri nu era în asociere puternică cu rs62623713.
Din câte știm, există doar trei rapoarte de variante legate de obezitate detectate prin secvențierea exoma. 9, 17, 18 Albrechtsen și colab. 17 au analizat o cohortă cu sindrom metabolic și au examinat mai multe fenotipuri metabolice. Studiul lui Huang și colab. 18 au analizat în principal diabetul de tip 2. Gill și colab. 9 au identificat noi variante ale LEPR în obezitatea severă a copiilor prin secvențierea exomului.
Ipoteza pe care se bazează studiul nostru este că formele mai severe de obezitate pot fi cauzate de frecvențe joase sau de variante rare, cu un impact mai mare asupra fenotipului. S-a demonstrat că o proporție mică de cazuri de obezitate morbidă sunt cauzate de variante genetice cu penetrare ridicată. Variantele din gena receptorului melanocortinei 4 (MC4R) explică câteva procente din obezitatea infantilă, 19 și numărul de copii repetate pe cromozomul 16 20 au o penetrare ridicată la câteva procente dintre indivizii obezi morbid cu deficiență cognitivă. În datele secvenței noastre de exoma, nu am găsit nicio variantă în regiunile exonice sau apropiate anterioare ale MC4R, care ar putea fi cauzate de numărul scăzut de subiecți studiați. Rezultatele noastre, și anume, detectarea unui singur SNP în SYPL2, care rămâne semnificativ asociat cu obezitatea după ajustarea pentru teste multiple, susțin opinia că variantele de frecvență joasă și rare contribuie la obezitatea morbidă. Cu toate acestea, studiul actual nu are puterea de a estima măsura în care variantele genetice rare cauzează obezitate morbidă într-o populație.
În rapoartele anterioare, SYPL2 a fost asociat cu tulburări depresive majore la populația europeană. 24 Legătura dintre obezitate și depresie a fost stabilită în mod repetat. O meta-analiză a constatat că obezitatea crește riscul de depresie. În plus, s-a constatat că depresia prezice obezitatea. Un alt studiu a constatat că asocierea obezității cu depresia s-a limitat în principal la persoanele cu obezitate severă. 26
SYPL2 aparține familiei sinaptofizinei. Sinaptofizina reglează formarea de sinapsă dependentă de activitate în neuronii hipocampici cultivați 27 și este necesară pentru endocitoza eficientă cinetic a veziculelor sinaptice în neuronii hipocampici cultivați. 28 Aportul de alimente este supus unei reglementări complexe de către hipotalamus și alte centre cerebrale, inclusiv trunchiul cerebral și hipocampus. Prin urmare, s-ar putea presupune că SYPL2 este implicat în reglarea centrală a consumului de alimente, care poate afecta sistemele centrale de recompensă și efectele hedonice ale alimentelor.
În cele din urmă, am identificat o variantă de codificare cu frecvență scăzută asociată cu obezitatea în gena SYPL2 prin secvențierea exomului cu ADN comun de la 100 de indivizi obezi morbid și 100 de indivizi neobezi, urmată de validarea genotipului la 3197 subiecți martor de caz. Rezultatele noastre oferă dovezi ale existenței unei variante de codare asociate cu obezitatea, deși sunt încă necesare studii funcționale suplimentare ale acestei variante genetice.