- obiecte
- abstract
- Rezumatul metadatelor
- Context și rezumat
- metode
- Obținerea consimțământului informat
- Selecția cohortei OA
- Tumora și colecția normală
- Toată secvențierea exomei
- Pregătirea bibliotecii
- Captură Exome
- secvențierea
- Secvențierea genomului întreg
- Pregătirea bibliotecii
- secvențierea
- Citiți variante de mapare și apelare
- Disponibilitatea codului
- Înregistrări de date
- Validare tehnică
- Note privind utilizarea
- Mai multe detalii
- Citări de date
obiecte
- Genomica cancerului
- Secvențierea ADN-ului
- Cercetări genetice
- Genomică medicală
abstract
Partajarea datelor genomice despre cancer a fost limitată la inițiative de acces agregate sau gestionate pentru a proteja confidențialitatea participanților la cercetare. Restricționarea accesului la aceste date a susținut că autonomia persoanelor care aleg să participe la eforturile de partajare a datelor a fost abolită și că utilitatea datelor în instrumentele de cercetare și educație a fost redusă. Într-un proiect pilot finanțat de CPRIT, Texas Open Cancer Research Biobank (OA), mulți pacienți cu cancer din Texas au fost dispuși să împartă în mod deschis datele genomice de la tumori și cupluri normale. Pentru prima dată, datele genetice din șapte cazuri de cancer la persoanele cu un standard comparabil sunt disponibile gratuit, fără a fi nevoie de acorduri de utilizare a datelor sau restricții majore, cu excepția faptului că utilizatorii finali nu pot încerca să re-identifice participanții (//txcrb.org/open .html). ).
Rezumatul metadatelor
Descărcați fișierul de metadate
Fișier de metadate accesibil la mașină care descrie datele raportate (format card ISA)
Context și rezumat
Participanții au acordat acordul inițial pentru a participa la partajarea datelor OA. Cei care și-au dat consimțământul au fost informați cu privire la riscuri și beneficii și apoi au întrebat dacă testează înțelegerea și au întrebat dacă vor să împartă cu OA. Probele tumorale și de sânge normal au fost apoi obținute de la cei care au demonstrat înțelegere și au fost reconfirmate și au suferit toate secvențierea exomului.
Imagine la dimensiune completă
Eforturi precum Project Genome Personal din SUA, Canada, Marea Britanie și Austria împărtășesc public datele genomice și clinice de la participanți sănătoși 19. Din câte știm, setul de date TCRB OA este prima lansare de date genomice la nivel individual care vizează cancerele umane. Reducerea barierelor în calea accesului crește potențialul de utilizare incorectă a datelor, dar cu un consimțământ informat adecvat și pași adecvați pentru a proteja confidențialitatea pacientului, acest set de date confirmă faptul că mulți pacienți recunosc că beneficiile viitoare pozitive pot depăși aceste riscuri. Acest consimțământ, împreună cu accesul publicului la un corp mare de date ușor accesibile, este crucial pentru abordarea problemelor deosebit de provocatoare ale cancerului la om.
metode
Obținerea consimțământului informat
Selecția cohortei OA
Aproximativ 20% din cei 37 de participanți (n = 7) care au fost intervievați și au fost de acord să împărtășească datele OA au fost selectați pentru includerea în setul de date TCRB OA. Pentru a reduce în continuare riscul de reidentificare, niciunul dintre participanții la OA nu a avut tipuri etnice sau tumorale rare așa cum sunt definite în statisticile SEER (supravegherea programului, epidemiologia și rezultatele finale). Figura 1 prezintă procesul acestui proces și pașii ulteriori în crearea acestui set de date.
Tumora și colecția normală
Sângele a fost colectat de la participanții la tuburile de ADN din sânge PAXgene și ADN-ul a fost izolat folosind kitul de ADN din sânge PAXgene (PreAnalytiX, Qiagen, Valencia, CA). Probele de țesut tumoral pancreatic au fost prelevate la scurt timp după rezecție și plasate în soluție de inhibitor de protează (Roche Applied Science, Indianapolis, IN), RNAlater (Qiagen) sau congelate rapid și depozitate la -80 ° C. Eșantionul de sânge a fost utilizat ca normal corespunzător Control. ADN-ul a fost izolat de la 50 la 100 mg de fragmente de țesut folosind trusa GentraPuregene (Qiagen). Calitatea probelor de ADN a fost determinată prin electroforeză și determinată a fi de înaltă calitate (dimensiune> 23 kb) fără degradare vizibilă în probele de sânge sau tumori.
Pentru a implementa abordări de secvențiere genomică în probe „din lumea reală”, este necesar să se detecteze variante în probe clinice care au celularitate tumorală redusă, de exemplu datorită neoadjuvantului sau altui tratament anterior. Am dezvoltat metodologii pentru a depăși problemele asociate cu arborele desmoplastic extins care este caracteristic majorității tumorilor pancreatice, iar aceste strategii au facilitat descoperirea de noi mecanisme moleculare în fiziopatologia acestei boli. Celularitatea fiecărei probe primare a fost estimată prin analiza patologică, secvențierea profundă a exonilor 2 și 3 KRAS (adâncime medie 1000 ×) pe baza estimărilor ampliconului și a celularității bazate pe polimorfismul nucleotidic (SNP) utilizând noul algoritm qpure 20, Adnotări clinice și patologice pentru fiecare caz sunt enumerate în Tabelul 1.
Tabel în dimensiune completă
Toată secvențierea exomei
Pregătirea bibliotecii
Captură Exome
Pentru captarea exoma, cele patru biblioteci au fost reunite înainte de captare (
300 ng/probă, 1, 2 ug/piscină) și hibridizat în soluție utilizând VCRome 2.1 Design 21 furnizat de NimbleGen conform protocolului producătorului NimbleGen SeqCap EZ Exome Library SR Manual de utilizare. (Versiunea 2.2) cu modificări minore. ADN-ul COT1 uman și oligonucleotidele de blocare complete specifice pentru adaptorul Illumina au fost adăugate la hibridizare pentru a bloca secvențe genomice repetitive și secvențe adaptive. LM-PCR post-amplificare a fost efectuată utilizând un amestec master PCR Phusion de înaltă fidelitate cu 14 cicluri de amplificare. După purificarea finală a mărgelelor AMPure XP, cantitatea și dimensiunea bibliotecii de captură au fost analizate folosind un Agilent Bioanalyzer 2100 DNA Chip 7500. Eficiența captării a fost evaluată prin efectuarea unui control al calității bazat pe qPCR pe patru controale interne standard NimbleGen. S-a estimat că îmbogățirea cu succes a bibliotecilor de captare a variat între 6 și 9 ΔCt în comparație cu probele ne-îmbogățite.
secvențierea
Șabloanele de bibliotecă au fost pregătite pentru secvențializare utilizând sistemul de generare de cBot Illumina cu Kituri TruSeq PE Cluster Generation (Cat. Nr. PE-401-3001). Pe scurt, aceste biblioteci au fost denaturate cu hidroxid de sodiu și diluate la 6-9 pM în tampon de hibridizare pentru a atinge densitatea de încărcare.
Clustere de 800 K/mm2. Rulările secvențiale au fost efectuate în mod asociat folosind platforma Illumina HiSeq 2000. Fiecare set de biblioteci a fost încărcat într-o bandă a celulei de flux HiSeq 2000 și o bibliotecă de control 2% phiX a fost adăugată la fiecare bandă pentru a controla calitatea rulării. Bibliotecile de probe au fost apoi supuse unei amplificări de punte pentru a forma clustere clonale, urmată de hibridizare cu un primer de secvențiere. Folosind kituri TruSeq SBS (Nr. Cat. FC-401-3001), reacțiile de secvențiere de sinteză au fost extinse cu 101 cicluri de la fiecare capăt, scăzând încă 7 cicluri pentru index. Ciclurile secvențiale au generat aproximativ 300-400 de milioane de citiri reușite în fiecare bandă de celule de flux, rezultând 7 până la 13 Gb per probă. În cazul randamentelor excepționale de secvențiere, probele au atins o adâncime medie de acoperire de 200x în regiunile exonice.
Secvențierea genomului întreg
Pregătirea bibliotecii
În majoritatea cazurilor, nu a existat suficientă biospectivă disponibilă pentru a efectua secvențierea genomică întreagă (WGS). Pentru aceste cazuri, există doar date WEX. Cu toate acestea, în două cazuri a fost posibil să se efectueze WGS. Șabloanele de bibliotecă au fost pregătite pentru secvențializare utilizând sistemul de generare a clusterelor cBot de la Illumina cu Kituri TruSeq PE Cluster Generation (Cat. Nr. PE-401-3001). ADN (0,5 μg) într-un volum de 70 μl a fost tăiat în fragmente de aproximativ 500-700 perechi de baze utilizând sistemul Covaris S2 (Covaris, Inc. Woburn, MA). Pe scurt, aceste biblioteci au fost denaturate cu hidroxid de sodiu și diluate la 6-9 pM în tampon de hibridizare pentru a atinge densitatea de încărcare.
Clustere de 800 K/mm2. Adaptoare PE multiplexare Illumina cu secvențe de coduri de bare au fost adăugate probei în momentul ligării. Ligarea de pre-captare mediată de PCR (LM-PCR) a fost efectuată timp de 6-8 cicluri utilizând o bibliotecă Amplification Readymix conținând ADN polimerază Kapa HiFi (Kapa Biosystems, Inc., nr. Cat. KK2612) și IMUX-P1.0 universal pereche de grund. și IMUX-P3.0. 4) 0.8X AMPure XP (Beckman, nr. A63882) a fost utilizat pentru purificarea ADN-ului fragmentat, spre deosebire de utilizarea 1.8X pentru a pregăti biblioteci WES.
secvențierea
Bibliotecile tumorale au fost secvențiate în patru benzi și bibliotecile normale au fost secvențiate în două benzi ale celulei de flux HiSeq 2000, rezultând o acoperire de aproximativ 60 de ori și 30 de ori. Fiecare bandă a fost îmbogățită cu o bibliotecă de control phiX de 2% pentru controlul calității rulării. Bibliotecile de probe au fost apoi supuse unei amplificări de punte pentru a forma clustere clonale, urmată de hibridizare cu un primer de secvențiere. Cursele de secvențiere au fost efectuate în mod asociat folosind platforma Illumina HiSeq 2000. Folosind kituri TruSeq SBS (nr. Cat. FC-401-3001), reacțiile de secvențiere de sinteză au fost extinse cu 101 cicluri de la fiecare capăt, scăzând încă 7 cicluri suplimentare pentru index. Ciclurile secvențiale au generat aproximativ 300-400 milioane de citiri reușite în fiecare cale a celulei de flux, oferind
11 Gb pe probă.
Citiți variante de cartografiere și apelare
Disponibilitatea codului
Toate software-urile utilizate pentru a genera date de secvență și pentru a gestiona biospectivele și adnotările clinice sunt disponibile gratuit. Mai sus sunt furnizate versiuni specifice de software și linkuri de cod.
Înregistrări de date
Citirile FASTQ și înregistrările BAM pentru specimenele tumorale (T) și normale (N) din fiecare caz sunt disponibile gratuit împreună cu condițiile de utilizare a acestora și sunt disponibile gratuit pe site-ul web Texas Cancer Research Biobank, //txcrb.org/open.html (Date de citare 1: TCRB stocare cu acces deschis TCRBOA1). Adnotările clinice disponibile pentru aceste cazuri sunt definite în Tabelul 1. În afară de acordul click-through de recunoaștere a condițiilor de utilizare, cerința de a crea un cont de acces în scopuri de audit și de a include acești termeni în fiecare redistribuire, există nu există alte bariere de acces pe acest portal. Conturile de utilizator sunt valabile 30 de zile și pot fi reînnoite. Toate sau unele dintre aceste date pot fi descărcate, partajate și distribuite în scopuri de cercetare și educaționale, în conformitate cu condițiile de utilizare a acestora.
Pentru a asigura disponibilitatea durabilă a datelor, acestea sunt stocate și în cadrul SRA. Am creat Texas Cancer Research Biobank Open Data Sharing Umbrella Project (acces: PRJNA285925), care a creat două proiecte specifice platformei - Texas Biobank Open Access Data Sharing Data Sharing Data Sharing Project: Exome Project (Data Citation 2: NCBI Sequence Read Archive PRJNA284596), care conține toate cele șapte cazuri și un subproiect numit Texas Cancer Research Biobank Open Access Data Sharing: Genome Project (Data Citation 3: NCBI Sequence Reading Archive PRJNA284598), pentru care s-a efectuat suficient material genetic pentru secvențierea genomului întreg după exome Sequencing și include cazuri 6 și 7.
NCI și alții iau în considerare mecanisme care vor aduce capacități de calcul datelor pentru a evita problema transferului de fișiere mari pe rețele. Pentru utilizatorii finali care nu dispun de capacități de calcul și/sau stocare locale suficiente sau pentru care descărcarea datelor poate fi dificilă, o a treia copie a înregistrărilor de date, condițiile de utilizare a acestora și sistemul de conducte de mercur HGSC sunt disponibile în cloud-ul DNAnexus. Termenii de utilizare și datele privind clicurile sunt disponibile la //dnanexus.github.io/tcrb-data/.
Din aceste cazuri, pot fi generate înregistrări de date suplimentare, cum ar fi secvențe genomice întregi, pentru a fi adăugate la fiecare dintre aceste depozite.
Validare tehnică
TCRB utilizează o bază de date securizată, acceptată de aplicații web, numită Acquire 30, pentru a urmări eșantioanele și adnotările acestora (cod disponibil la //github.com/BCM-DLDCC/Acquire). Prin modulele sale, suportă întregul ciclu de viață al operațiunilor biobăncii, de la colecții până la testarea controlului calității. Cercetătorii publici pot utiliza modulul de solicitare a eșantionului pentru a căuta și a solicita în mod electronic eșantioane disponibile. Obțineți o donație TCRB foarte ușurată de la alți producători decât OGA TCGA și ICGC.
Coordonatorii cercetării au reexaminat fișele medicale ale fiecărui participant OA în raport cu datele introduse în programul Acquire pentru a se asigura că adnotările clinice au fost corecte. Coordonatorul achiziției a compilat adnotări clinice și patologice cu numere de acces HGSC și alte date pentru fiecare caz.
Pentru a verifica dacă fișierele BAM rezultate nu au fost corupte și puteau fi reprocesate din fișierele FASTQ într-un alt mediu, fișierele BCM au fost reprocesate folosind o instanță cloud a conductei Mercury 31 HGSC DNAnexus, cu algoritmii corespunzători descriși în secțiunea Metode. Toți au trecut prin această verificare de editare.
Tabel în dimensiune completă
Variantele au fost limitate la regiunea de codificare, astfel încât probele WEX și WGS să fie comparabile. Densitatea alelelor (raportul dintre variante și valoarea totală) este reprezentată grafic pentru fiecare probă.
Imagine la dimensiune completă
Tabel în dimensiune completă
Note privind utilizarea
Prin descărcarea sau utilizarea oricărei părți a acestui set de date, utilizatorii finali trebuie să fie de acord cu următorii termeni de utilizare:
Nu se va face nicio încercare de a identifica o anumită persoană reprezentată de astfel de date sau derivate ale acestor date.
Nu se va face nicio încercare de a compara și/sau lega parțial sau complet acest set de date publice sau derivate de informațiile de sănătate private.
Aceste date pot fi descărcate parțial sau complet liber, utilizate în analize și reambalate în baze de date.
Redistribuirea oricărei părți a acestor date sau a oricărui material derivat din date va include o copie a acestei notificări.
Datele sunt destinate utilizării doar ca instrumente educaționale și/sau de cercetare.
Acest set de date nu este destinat câștigului direct pentru oricine îl primește și nu poate fi revândut.
Utilizatorii pot folosi date în publicații științifice dacă furnizorii de date (Texas Cancer Research Biobank și Baylor College of Medicine Human Genom Sequencing Center) sunt recunoscuți în mod corespunzător.
Implementarea dicționarelor comune facilitează interoperabilitatea semantică și reutilizarea datelor. Adnotările pentru cazurile de OA includ terminologie controlată pentru rasă, sex și etnie de la NIH; diagnostic patologic din ICD-O-3 al Organizației Mondiale a Sănătății (Clasificarea internațională a bolilor-Oncologie versiunea 3); și datele privind stadiul și gradul tumorii de la Uniunea pentru Controlul Internațional al Cancerului (UICC/AJCC). Utilizarea metadatelor standard facilitează interoperabilitatea sintactică. TCRB a folosit elemente de date standard, formate de fișiere și metadate. Deoarece datele OA pot fi descărcate și redistribuite cu condiția ca termenii de utilizare să fie incluși și respectați, toate comentariile au fost incluse și ca comentarii în anteturile fișierului BAM cu referire la condițiile de utilizare. Aceste metadate au fost incluse pentru a se asigura că datele clinice și patologice nu pot fi separate de datele secvenței.
Mai multe detalii
Cum se citează acest articol: Becnel, LB și colab. Un pilot cu acces deschis care împărtășește în mod liber datele despre cancerul genomic de la participanții din Texas. Știință. Date 3: 160010 doi: 10, 1038/sdata.2016.10 (2016).
Citări de date
Becnel, I. TCRB depozit de acces deschis TCRBOA1 (2015)
Becnel, I. NCBI Secvența de lectură Arhivă PRJNA284596 (2015)
Becnel, I. NCBI Arhiva secvenței de lectură PRJNA284598 (2015)
- Date OTS ABOUND prezentate la Conferința mondială privind cancerul pulmonar - OTS
- Abordarea flagelilor în cancerul pancreatic este o nouă licărire de speranță pentru tratamentul cancerului inoperabil
- Să ne căsătorim cu recenziile spectatorilor și participanților, anul în care a fost creat programul, o descriere a complotului -
- Programare prenatală programare cardiacă nedorită prin exces de gestație testosteron științific
- Pregătiți ghimbirul în acest fel și preveniți cancerul, reumatismul și colesterolul ridicat - De casă