obiecte

abstract

Caracterizarea ierarhiei celulelor epiteliale mamare (MEC) și reglarea acestora în timpul dezvoltării adulților este importantă pentru înțelegerea dezvoltării cancerului mamar. Aici raportăm utilizarea secvențierii ARN cu celule unice pentru a determina profilul de expresie al genei MEC în patru etape de dezvoltare; nulipare, sarcină medie, lactație și post involutie. Analiza noastră a 23.184 celule identifică 15 clustere, dintre care mai multe ar putea fi pe deplin caracterizate de o singură genă marker. În schimb, susținem că celulele epiteliale - în special în compartimentul luminal - ar trebui conceptualizate mai degrabă decât parte dintr-un spectru de diferențiere continuă. În plus, datele noastre susțin existența unei celule progenitoare luminale comune care duce la progenitori alveolari și hormonali tranzitorii, restrânși. Acest compartiment progenitor luminal suferă modificări transcripționale ca răspuns la sarcina completă, lactație și involutie. Pe scurt, rezultatele noastre oferă o imagine globală, imparțială, asupra dezvoltării glandelor mamare adulte.

Aici, am folosit secvențierea ARN cu o singură celulă (scRNAseq) pentru a mapa dinamica celulară a celulelor epiteliale mamare în patru etape de dezvoltare a adulților; sarcina nulipară, moderată, lactație și înțărcare (involuție naturală completă). Datele noastre de la 23.184 de celule individuale identifică 15 populații de celule diferite din glandă și permit structura lor ierarhică pe parcursul timpului de dezvoltare.

Rezultatul

Secvențierea ARN cu o singură celulă identifică 15 grupuri de celule epiteliale mamare

celulelor

Secvențierea ARN cu o singură celulă identifică 15 grupuri de celule epiteliale mamare. Diagrama schematică care evidențiază configurația experimentală pentru izolarea ARN și secvențierea celulelor individuale utilizând un sistem de crom de 10x. b Graficul t-SNE de 23, 184 celule vizualizează structura generală din date. Celulele sunt colorate în conformitate cu patru puncte de timp de dezvoltare după cum urmează: roz = NP, verde închis = G, verde deschis = L, violet = PI. c La fel ca b, dar colorarea celulelor cu clustere. d t-SNE colorat cu expresie normalizată transformată în log a markerului bazal Krt5 și a markerului luminal Krt18

Imagine la dimensiune completă

Pentru caracterizarea ulterioară a clusterelor, am identificat gene exprimate diferențial și identități putative derivate pe baza markerilor cunoscuți (Fig. 2a, b). Așa cum se arată în Tabelul 1, mai multe grupuri de celule au fost atribuite aceluiași tip de celule supuse. Am constatat că, în aceste cazuri, celulele au prezentat o asemănare ridicată și au exprimat aceleași gene marker, dar au provenit din stadii de dezvoltare diferite (vezi sufixul NP, G, L sau PI din Fig. 2a), sugerând că stadiul glandei are efecte specifice asupra țării transcripționale. a anumitor tipuri de celule.

Identități putative ale clusterelor de celule epiteliale mamare. Dendrogramă cluster bazată pe valori de expresie medii transformate în jurnal de 15 clustere. Arborele a fost calculat pe baza corelației lui Spearman cu conexiunea lui Ward. b t-SNE cu expresie suprapusă a genelor specifice clusterului. c Harta de căldură care evidențiază genele markerilor cheie care au fost folosite pentru a obține identități putative. Scara de culoare reprezintă numere transformate logaritmic și numere normalizate reduse la maximum 1 pe linie. Coloanele superioare reprezintă atribuirea clusterului și gradul fiecărei celule. În scopul vizualizării, doar 100 de celule selectate aleatoriu au fost afișate pentru clustere mari

Imagine la dimensiune completă

Tabel în dimensiune completă

Am găsit două subgrupuri mai mari în spațiul luminal (Fig. 2a). C1 - C5 au arătat caracteristici ale celulelor cu sensibilitate hormonală (Hs), cum ar fi niveluri ridicate de expresie a receptorilor hormonali (Pgr, Esr1, Prlr) (Fig. 2b, c). Din celulele Hs putative, am constatat că C1/C2 au exprimat markeri progenitori (de exemplu, Aldh1a3, Cd14, Kit) 18, sugerând o funcție limitată a progenitorului (Hsp) (Fig. 2b, c), în timp ce C3/4/5 a arătat mai diferențiat (Hsd) (Fig. 2b, c; Tabelul 1). Al doilea subgrup din compartimentul luminal (C6 - C11) a exprimat doar niveluri scăzute de receptori hormonali. C6/7 a exprimat niveluri ridicate de markeri progenitori, în concordanță cu fenotipul progenitorului luminal (Lp) (Fig. 2b, c). În schimb, C8 - C11 au exprimat proteine ​​din lapte (de exemplu, Wap, Csn2) și au fost compuse exclusiv din celule din gestație și lactație, susținând ipoteza că acestea sunt celule alveolare secretoare (Av) (Fig. 2b, c; Tabelul 1). Din celulele alveolare putative, am constatat că C10/C11 exprima gene asociate cu funcția limitată a progenitorului alveolar (Avp), în timp ce C8/C9 părea a fi într-o stare alveolară mai diferențiată (Avd) (Fig. 2b, c).

În compartimentul bazal, am constatat că celulele C14 au prezentat caracteristici ale celulelor mioepiteliale, cum ar fi niveluri ridicate de Acta2, Oxtr și Krt15 (Fig. 2b, c). În plus, compartimentul bazal conținea și un grup de celule, C15, care exprima niveluri ridicate de Procr, Gng11 și Zeb2, sugerând că acestea reprezintă celule bazale Procr + identificate anterior, care s-au dovedit a fi îmbogățite pentru unitățile de repopulare a glandei mamare 19. (Fig. 2b, c).

Reconstrucția ierarhiei diferențierii luminale

Ne-am concentrat asupra celulelor din punctele de timp NP și G pentru a determina stările de diferențiere epitelială a sânilor. Aceste stări de diferențiere și tranzițiile dintre ele pot fi reconstituite calculal folosind hărți de difuzie 20. Pe scurt, această metodă conține date în spațiu cu dimensiuni reduse, unde distanțele dintre celule reprezintă un proces gradual, dar stocastic, cum ar fi diferențierea. În hărțile de difuzie generate de toate celulele epiteliale, am observat o segregare clară între grupurile luminale și bazale, practic fără tranzitori între cele două grupuri (Fig. 3a). Acest lucru susține ipoteza că, în timpul homoeostaziei țesuturilor normale, cele două linii sunt în mare parte auto-susținute, în concordanță cu majoritatea studiilor de urmărire a liniilor 21, 22, 23 În contrast, separarea luminală a arătat o structură diferită, cu o tranziție treptată între diferite grupuri și celule de origine comună (Fig. 3b). Am confirmat soliditatea acestei bifurcații prin verificarea faptului că a fost prezentă atunci când au fost utilizate diferite metode de selecție a proprietăților, derivarea traiectoriei și algoritmi de eșantionare descendentă (Figura suplimentară 5).

Reconstrucția computerizată a proceselor de diferențiere în glanda mamară. harta de difuzie a celulelor epiteliale din punctele de timp NP și G, prezentând primele trei componente de difuzie. b Traiectorii de diferențiere a compartimentului luminal pe baza primelor două componente de difuzie. c Același grafic ca în b, colorate cu niveluri de expresie normalizate și reduse ale diferitelor gene

Imagine la dimensiune completă

Am constatat că expresia markerului progenitor Aldh1a3 a scăzut treptat pe măsură ce celulele s-au îndepărtat de originea lor comună (Fig. 3c), care a fost în mare parte formată din celule C6 (Lp). Am remarcat în continuare că mâna stângă a traiectoriei de diferențiere se termină la C8 (Avd) și prezintă o expresie crescută a Csn2 și Glycam1 (Fig. 3c), în concordanță cu fenotipul secretor. Între C6 și C8 am găsit celule care au fost derivate în principal din C10 (Avp, Fig. 3b). Pe brațul drept al traiectoriei de diferențiere, celulele au trecut de la C6 la C2 și C4/5 (Hsp și Hsd), timp în care expresia Esr1 și Pgr a crescut, sugerând că această ramură reprezintă diferențierea către celulele luminale cu sensibilitate hormonală (Fig. 3c). ).

Aranjamentul pseudotimei identifică genele asociate cu diferențierea luminală. Definiția ramurii de detectare a hormonilor și diferențierea secretorie. Celulele sunt colorate prin progresia lor prin pseudotime, unde valorile mici reprezintă celule nediferențiate. b - d Exemple de factori de transcripție cu expresie dependentă de pseudotime cu aceeași tendință generală pe ambele ramuri ( b ) sau tendințe specifice sectorului ( c, d ). e, f Harta de căldură a tuturor genelor cu expresie dependentă de ramură, pseudotimă dependentă de linia de detectare hormonală ( e ) sau linia secretorie ( f ). Pseudotima și atribuirea clusterului sunt adnotate la căldură. Valorile din harta de căldură reprezintă valori reduse la scară z, ​​netezite la spline. Genele din hărțile de căldură au fost grupate folosind grupări ierarhice cu tăiere dinamică a arborelui

Imagine la dimensiune completă

Paritatea pregătește progenitorii luminali spre soarta alveolară

Influența parității asupra peisajului transcriptomic al compartimentului progenitor luminal. Compararea mai multor modificări de la C6 vs. compartimentul luminal și modificările pliurilor de la C7 față de celulele luminale Genele reprezintă primele 500 de gene exprimate diferențial între celulele C6 și celulele luminale. b Grafic vulcanic care ilustrează expresia diferențială între C6 și C7, punctele colorate reprezintă gene importante cu funcție cunoscută în alăptare și imunitate, liniile punctate evidențiază pragul P 0, 01 și modificarea jurnalului de 1. Valorile P sunt ajustate pentru testări multiple de Benjamini - Hochberg. c, d Vizualizarea diferenței de expresie pentru genele legate de alăptare ( c ) sau imunitate ( d ) pentru șase clustere luminale în NP și PI. Valorile expresiei corespund numărului normalizat de UMI-uri. e Celulele PI proiectate pe o hartă de difuzie din punctele de timp NP și G. Celulele NP și G sunt gri

Imagine la dimensiune completă

discuţie

Pe scurt, datele noastre oferă o imagine imparțială a dezvoltării glandei mamare. Această abordare ajută la susținerea unor ipoteze dezvoltate anterior în glanda mamară și descrie procesele de diferențiere la rezoluție mare a celulelor. Setul de date va fi o resursă utilă pentru studii viitoare pentru a înțelege relația dintre diferitele tipuri de celule din glandă și modul în care cancerul de sân se dezvoltă și progresează.

metode

Toate lucrările experimentale pe animale au fost efectuate în conformitate cu Animal Procedures Act 1986, Marea Britanie și aprobate de Comitetul de etică al Institutului Sanger. Șoarecii C57BL/6N au fost adăpostiți în cuști ventilate individual pe un ciclu de lumină-întuneric 12:12 h, cu apă și alimente disponibile ad libitum. Experimentul a fost creat pentru a permite colectarea tuturor punctelor de timp de dezvoltare și prelucrarea țesuturilor în același timp. Șoarecii au fost sacrificați prin anestezie terminală. Femelele s-au împerecheat cu știfturile și au fost aruncate. Țesuturile au fost apoi recoltate în ziua 14.5 (G) de sarcină, în ziua 6 de lactație (L) și în ziua 11 după înțărcare naturală (PI). Țesutul de la femelele NP a fost recoltat la vârsta de 8 săptămâni. Au fost folosiți doi șoareci individuali pe timp de dezvoltare în studiu. Stadiul ciclului estru al animalelor de la momentul NP și PI a fost determinat de frotiu vaginal (Figura suplimentară 8).

Disocierea glandei mamare la o suspensie de celule unicelulare

Ganglionii limfatici lipsiți de glande mamare (cu excepția perechii cervicale) au fost separați de șoareci și disociați mecanic. Țesutul fin măcinat a fost transferat într-un amestec de digestie format din DMEM/F12 (Gibco) + 10 mM HEPES (Gibco) + colagenază (Roche) + 200 U ml - 1 hialuronidază (Sigma) + gentamicină (Gibco) timp de 3 ore la 37 ° C. ° C și se învârte la fiecare 30 de minute. După liza celulelor roșii din sânge în NH4CI, celulele au fost scurt digerate cu 0,05% tripsină-EDTA caldă (Gibco), 5 mg ml-1 dispază (Sigma) și 1 mg ml-1 DNază (Sigma) și filtru celular (BD Biosciences) a fost filtrat.

Marcarea celulei urmată de citometrie în flux și sortare

Pregătirea și secvențierea bibliotecii

Pregătirea bibliotecii a fost efectuată conform instrucțiunilor dintr-un kit de 10x monocelule. Bibliotecile au fost apoi grupate și secvențiate pe șase benzi pe un HiSeq2500.

Prelucrarea datelor ARN-seq

Procesarea citirii a fost efectuată utilizând un flux de lucru 10X Genomics 17. Pe scurt, Suita de programe single-cell Cell Ranger (//software.10xgenomics.com/single-cell/overview/welcome) a fost utilizată pentru demultiplexare, atribuirea codurilor de bare și cuantificarea UMI. Citirile au fost aliniate cu genomul de referință mm10 folosind un pachet de adnotări pre-creat obținut de pe site-ul web 10X Genomics. Toate benzile de pe eșantion au fost prelucrate utilizând funcția „numărarea celulelor”. Rezultatul din diferite căi a fost apoi agregat folosind „cellranger aggr” cu -normalise setat la „none”.

Controlul calității și pre-procesarea

grupare

$ config [ads_text16] nu a fost găsit

Analiza expresiei diferențiale

Analiza diferențială a expresiei genelor a fost efectuată folosind edgeR 46. Pentru comparații perechi între grupuri, gene cu un nivel mediu de expresie sub 0,1 au fost eliminate din analiză. Un model log-liniar binomial negativ generalizat a fost adaptat genelor rămase cu atribuțiile cluster ca covariate. Funcția "glmTreat" a fost utilizată pentru a identifica genele care au o schimbare semnificativ mai mare a pliului de log decât 1 la un FDR de 0,01. Genele marker vizualizate în Fig. 2 au fost identificate folosind funcția „findMarkers” în scran cu setări implicite pe gene care aveau o expresie mediană de 1 în cel puțin un cluster 40 .

Hărți de difuzie și inferență pseudotimă

Pentru deducerea traiectoriei de diferențiere, am folosit hărți de difuzie. În primul rând, am selectat toate celulele din punctul de timp NP și G (Fig. 3a) și am detectat HVG-urile așa cum este descris mai sus. Numărul de gene transformate în log (log2 (număr + 1)) a fost apoi utilizat pentru a calcula componentele de difuzie utilizând funcția „DiffusionMap” (parametrii impliciți ca în destinul 47). În Fig. 3b, ne-am concentrat apoi pe compartimentul luminal și am recalculat harta de difuzie bazată doar pe celulele luminale, folosind procedura menționată anterior. În special, structura dedusă de algoritmul hărții de difuzie a fost robustă pentru alegerea caracteristicilor și eșantionarea în jos a celulelor (Fig. Suplimentară 5b). Structura unei origini comune și a celor două ramuri ar putea fi de asemenea dedusă folosind Monocle cu setări standard 48 (Fig. Suplimentară 5a). Pentru deducerea ramurilor și ordinea pseudotimei, am definit următoarele trei sfaturi, celula cu cea mai mare valoare pentru al doilea vector propriu (care a fost setat ca rădăcină) și celulele cu cele mai mari și mai mici valori pentru primul vector propriu (comparați Fig. 4a).

Expresie dependentă de pseudotime

Analiza îmbogățirii genelor

O analiză de îmbogățire a setului de gene bazată pe termenii de ontologie genică (GO) a fost efectuată pentru a caracteriza diverse gene în analiză. Genele de interes au fost comparate cu toate genele care au fost testate pentru exprimarea diferențială folosind topGO cu setări implicite 49 .

Disponibilitatea datelor

Autorii declară că toate datele care susțin rezultatele acestui studiu sunt disponibile în articol și în fișierele sale de informații suplimentare sau de la autorul corespunzător, la cerere rezonabilă. Datele de secvențiere ARN au fost depuse în baza de date Genn Expression Omnibus (GEO) sub codul de acces GSE106273. Datele pot fi, de asemenea, explorate la //marionilab.cruk.cam.ac.uk/mammaryGland. Toate analizele de calcul au fost efectuate în R (versiunea 3.4.1) utilizând funcții standard, cu excepția cazului în care se indică altfel. Codul este disponibil online la //github.com/MarioniLab/MammaryGland.

Mulțumiri

Mulțumim Institutului Sanger, Facilitatea Serviciului de Cercetare (RSF) pentru ajutorul acordat. Mulțumesc și Dr. Aaron T. Lun (CRUK CI) pentru discuții și comentarii utile asupra manuscrisului. KB este finanțat de Cambridge Cancer Center. DA finanțează CRUK și Wellcome Trust. SP este finanțat de CRUK. JCM finanțează CRUK și EMBL. WTK este finanțat de CRUK Career Award (C47525/A17348), Universitatea din Cambridge și Magdalene College, Cambridge.