Summary

ExCYT: En grafisk bruker grenseflate for effektivisering analyse av høy-dimensjonale cytometri Data

Published: January 16, 2019
doi:

Summary

ExCYT er en MATLAB-basert grafisk brukergrensesnitt (GUI) det innrømmer brukernes å analysere flyt cytometri data via vanlig ansatt analytiske teknikker for høy-dimensjonale data inkludert dimensionality reduksjon via t-SNE, en rekke automatiserte og manuelle klynging metoder, heatmaps og romanen høy-dimensjonale flyt i plotter.

Abstract

Med ankomsten av flyt cytometers stand til å måle et økende antall parametere, fortsette forskere å utvikle større paneler for å utforske svært egenskapene til deres cellular prøver. Men gir disse teknologiske fremskritt høy-dimensjonale datasett som har blitt stadig vanskeligere å analysere objektivt tradisjonell håndbok gating programmer. For å bedre analysere og presentere data, samarbeide forskere med bioinformaticians med kompetanse i å analysere høy-dimensjonale data for å analysere flyt cytometri data. Mens disse metodene har vist seg å være svært verdifull i å studere flowcytometri, har de likevel innarbeides i en enkel og lett-å-bruk pakke for forskere som mangler databehandlingsressurs eller programmering kompetanse. For å løse dette behovet, har vi utviklet ExCYT, en MATLAB-basert grafisk brukergrensesnitt (GUI) som forenkler analyse av høy-dimensjonale flyt cytometri data ved å implementere vanligvis ansatt analytiske teknikker for høy-dimensjonale data inkludert dimensionality reduksjon av t-SNE, en rekke automatiserte og manuelle klynging metoder, heatmaps og romanen høy-dimensjonale flyt tomter. I tillegg inneholder ExCYT tradisjonelle gating Alternativer Velg befolkninger rundt for ytterligere t-SNE og klynging analyse, samt muligheten til å bruke portene på t-SNE tomter. Programvaren gir den ekstra fordelen med å jobbe med enten kompensert eller uncompensated FCS-filer. Som etter oppkjøpet kompensasjon er nødvendig, kan brukeren velge å gi programmet en katalog av enkelt flekker og en unstained kvinne prøve. Programmet oppdager positive hendelser i alle kanaler og bruker denne merke data til å beregne mer objektivt kompensasjonsplanen. Oppsummert gir ExCYT en omfattende analyse rørledning å ta flyt cytometri data i form av FCS filer og gi noen person, uansett beregningsorientert opplæring, bruke de nyeste algoritmiske tilnærmingene forstå dataene.

Introduction

Fremskritt innen flowcytometri, samt bruk av masse cytometri har tillatt leger og forskere å raskt identifisere og karakterisere svært biologisk og klinisk interessant prøver med nye nivåer av oppløsning, skaper store høy-dimensjonale datasett som informasjon rik1,2,3. Mens konvensjonelle metoder for analyserer flyt cytometri som manuell gating har vært enklere for eksperimenter der det er få markører og disse markørene har visuelt synlig bestander, kan denne tilnærmingen ikke generere reproduserbar resultater når du analyserer høyere-dimensjonale datasett eller de med indikatorer flekker på et spektrum. For eksempel i en multi institusjonelle studie, ble der intra mobilnettet flekker (ICS) analyser utført for å vurdere reproduserbarhet av quantitating antigen-spesifikke T celle svar, til tross for gode inter-laboratory presisjon, analyse, spesielt gating, introduserte en betydelig kilde til variasjoner4. Videre er prosessen med manuelt gating befolkningen av interesser, foruten å være svært subjektive svært tidkrevende og arbeidsintensiv. Men er problemet med analysere høy-dimensjonale datasett i en robust, effektiv og rimelig måte ikke en ny forskning realfag. Gene expression studier generere ofte svært høy-dimensjonale datasett (ofte på hundrevis av gener) der manuell former for analyse skulle bare umulig. For å takle analyse av disse datasett, har det vært mye arbeid i å utvikle bioinformatic verktøy for å analysere gene expression data5. Disse algoritmisk tilnærminger har bare nylig vedtatt analyse av cytometri data som antall parametere har økt, og har vist seg for å være uvurderlig i analysen av disse høy dimensjonal datasett6,7.

Til tross for den generasjon og anvendelse av en rekke algoritmer og programvarepakker som tillater forskere å søke disse høy-dimensjonale bioinformatic tilnærminger til flyt cytometri dataene, fortsatt disse analytiske teknikker hovedsakelig ubrukt. Mens det kan være en rekke faktorer som har begrenset utbredt bruk av disse metodene til cytometri data8, den store hinder vi mistenker i bruk disse tilnærmingene av forskere, er mangel på beregningsorientert kunnskap. Faktisk er mange av disse programvarepakkene (dvs. flowCore, flowMeans og OpenCyto) skrevet implementeres i programmeringsspråk som R som fortsatt krever materielle programmering kunnskap. Programvarepakker som FlowJo har funnet favør blant forskere på grunn av enkelhet av bruk og “plug-n-play” natur, i tillegg til kompatibilitet med operativsystemet PC. For å gi en rekke akseptert og verdifulle analytiske teknikker forsker ukjent programmering, har vi utviklet ExCYT, en grafisk bruker grenseflate (GUI) som enkelt kan installeres på en PC/Mac som trekker mange av de nyeste teknikkene inkludert dimensionality reduksjon for intuitiv visualisering, en rekke klynging metoder i litteraturen, sammen med romanen funksjoner å utforske produksjon av disse klynging algoritmer med heatmaps og roman høy-dimensjonale flyt/boks tomter.

ExCYT er et grafisk brukergrensesnitt i MATLAB og derfor kan enten kjøres i MATLAB direkte eller installasjonsprogram finnes som kan brukes til å installere programvaren på en PC/Mac. Programvaren er tilgjengelig på https://github.com/sidhomj/ExCYT. Vi presenterer en detaljert protokoll å importere data, behandle det, gjennomføre t-SNE dimensionality reduksjon, klyngedata, sortere og filtrere klynger basert på brukerens preferanser og vise informasjon om i klynger av interesse via heatmaps og roman høy-dimensjonale flyt/boks tegnes ()figur 1). Akser i t-SNE tomter er vilkårlig og tilfeldig enheter og slik som ikke alltid vist i tallene for enkelhet av brukeren grenseflate. Farging av datapunktene i “t-SNE Heatmaps” er fra blå til gul basert på signalet fra den angitte markøren. I klynger løsninger er fargen på datapunktet basert vilkårlig klynge nummer. Alle deler av arbeidsflyten kan utføres i én panelet GUI ((figur 2 ) & tabell 1). Til slutt, viser vi bruk av ExCYT på tidligere publiserte data å utforske immun landskapet av Nyrecellekarsinom i litteraturen, også analysert med lignende metoder. Eksempel datasettet vi pleide å opprette tallene i dette manuskriptet med protokollen nedenfor kan finnes på https://premium.cytobank.org/cytobank/projects/875, ved å registrere en konto.

Protocol

1. samle og forberede cytometri Data Sett alle enkelt flekker i en mappe ved seg selv og etiketten av kanalnavnet (ved fluorophore, ikke markør). 2. data import og pre-prosessering For å stanse eller lagre hele denne analyse rørledningen, bruke knappen Lagre arbeidsområde nederst til venstre for programmet for å lagre arbeidsområdet som en “. MAT “fil som senere kan lastes via knappen Load arbeidsområde . Ikke Kjør flere forek…

Representative Results

For å teste brukbarheten av ExCYT, analysert vi en kuratert datasett publisert av Chevrier et al. tittelen “en immun Atlas av klare celle Renal karsinom’ der gruppen gjennomført CyTOF analyse med en omfattende immun panel på svulst prøver tatt fra 73 pasienter11. To separate paneler, en lymfoide og myeloide panel, ble brukt til svært karakterisere svulst microenvironment. Målet med vår studie var recapitulate resultatene av deres t-SNE og klynge ana…

Discussion

Her presenterer vi ExCYT, en ny grafisk bruker grenseflate kjører MATLAB-basert algoritmer for å effektivisere analyse av høy-dimensjonale cytometri data, slik at personer uten bakgrunn i programmering for å implementere nyest i høy-dimensjonale data analysealgoritmer. Tilgjengeligheten av denne programvare å det bredere vitenskapelige samfunnet vil tillate forskere å utforske flyt cytometri dataene i et intuitivt og enkelt arbeidsflyt. Gjennom gjennomføre t-SNE dimensionality reduksjon, bruke en klynging metode,…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Forfatterne har ingen takk.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video