Summary

ExCYT: En grafisk brugergrænseflade til at strømline analyse af høj-dimensionelle flowcytometri Data

Published: January 16, 2019
doi:

Summary

ExCYT er en MATLAB-baserede grafiske bruger Interface (GUI) at tillader brugernes hen til analysere deres flow flowcytometri data via almindeligt anvendte analyseteknikker for high-dimensionale data herunder dimensionalitet reduktion via t-SNE, en række automatiserede og manuelle klyngedannelse metoder, heatmaps og roman high-dimensionelle flow parceller.

Abstract

Med fremkomsten af flow cytometers stand til at måle et stigende antal parametre, fortsat forskere at udvikle større paneler fænotype udforske Karakteristik af deres cellulære prøver. Men disse teknologiske fremskridt give høj-dimensionelle datasæt, der er blevet stadig vanskeligere at analysere objektivt inden for traditionel manuel-baserede gating programmer. For at analysere og fremlægge data bedre partner forskere med bioinformaticians med ekspertise i at analysere høj-dimensionale data til at analysere deres flow flowcytometri data. Mens disse metoder har vist sig at være meget værdifulde i at studere flowcytometri, har de endnu at blive indarbejdet i en enkel og nem at bruge pakke for videnskabsfolk, der mangler beregningsressource eller programmering ekspertise. For at imødegå dette behov, har vi udviklet ExCYT, en MATLAB-baserede grafiske bruger Interface (GUI), strømliner analyse af høj-dimensionelle flow flowcytometri data ved at implementere almindeligvis ansat analytiske teknikker til høj-dimensionale data, herunder dimensionalitet reduktion af t-SNE, en række automatiserede og manuelle klyngedannelse metoder, heatmaps og roman high-dimensionelle flow parceller. ExCYT omfatter desuden traditionelle gating indstillinger af udvalgte populationer af interesse for yderligere t-SNE og clustering analyse samt mulighed for at anvende gates direkte på t-udstationerede parceller. Softwaren giver den ekstra fordel af at arbejde med enten kompenseret eller ukompenserede FCS filer. I tilfælde af, at efter købet kompensation er påkrævet, kan brugeren vælge at give programmet et bibliotek af enkelt pletter og en unstained prøve. Programmet registrerer positive begivenheder i alle kanaler og bruger denne vælge data til mere objektivt beregne kompensationsmatrix. I Resumé giver ExCYT en omfattende analyse rørledningen for at tage strømmen flowcytometri data i form af FCS filer og give enhver person, uanset beregningsmæssige uddannelse, for at bruge de nyeste algoritmiske tilgange i forståelsen af deres data.

Introduction

Fremskridt i flowcytometri samt fremkomsten af masse flowcytometri har tilladt klinikere og forskere til hurtigt at identificere og karakterisere fænotype biologisk og klinisk interessant prøver med nye niveauer af opløsning, skaber store høj-dimensionelle datasæt, der er information rige1,2,3. Mens konventionelle metoder til at analysere flow flowcytometri data såsom manuel gating har været mere ligetil for eksperimenter hvor der er få markører og disse markører har visuelt mærkbare populationer, kan denne tilgang undlade at generere reproducerbare resultater når du analyserer højere-dimensionelle datasæt eller dem med markører farvning på et spektrum. For eksempel, i en multi institutionelle undersøgelse, blev hvor intra cellulære farvning (ICS) assays der udføres for at vurdere reproducerbarhed quantitating antigen-specifikke T-celle svar, trods gode sammenlignende nøjagtighed, analyse, især gating, indført en betydelig kilde til variation4. Derudover er processen med manuelt gating befolkningens interesser, udover at være stærkt subjektive meget tidskrævende og labor intensiv. Men problemet med at analysere høj-dimensionelle datasæt i en robust, effektiv og rettidig måde er ikke en ny forskning videnskaber. Gen expression undersøgelser generere ofte ekstremt høj-dimensionelle datasæt (ofte om hundredvis af gener) hvor manuel former for analyse ville være simpelthen umuligt. For at tackle analyse af disse data sæt, har der været meget arbejde med at udvikle bioinformatic værktøjer til at analysere gen expression data5. Disse algoritmiske tilgange har netop for nylig vedtaget i analysen af flowcytometri data som antallet af parametre er steget og har vist sig for at være uvurderlig i analysen af disse høj dimensionel datasæt6,7.

Trods den generation og anvendelsen af en række algoritmer og software-pakker, der giver forskerne til at anvende disse høj-dimensionelle bioinformatic tilgange til deres flow flowcytometri data, er disse analytiske teknikker stadig stort set ubrugt. Selvom der kan være en række faktorer, der har begrænset udbredt vedtagelse af disse tilgange til flowcytometri data8, den store hindring vi formoder i brug af disse tilgange af forskere, er manglende beregningsmæssige viden. Faktisk er mange af disse softwarepakker (dvs., flowCore, flowMeans og OpenCyto) skrevet skal gennemføres i programmeringssprog såsom Rasmussen, der stadig kræver grundlæggende kendskab til programmering. Software-pakker, som FlowJo har fundet favor blandt videnskabsmænd på grund af enkelheden i brug og ‘plug-n-play’ natur, samt kompatibilitet med PC-operativsystem. For at give forskellige accepterede og værdifulde analytiske teknikker til videnskabsmand uvante programmering, har vi udviklet ExCYT, en anskuelighed bruger grænseflade (GUI), der nemt kan installeres på en PC/Mac, der trækker mange af de nyeste teknikker herunder dimensionalitet reduktion for intuitiv visualisering, en række klyngedannelse metoder nævnt i litteraturen, sammen med nye funktioner til at udforske output af disse klynger algoritmer med heatmaps og roman high-dimensionelle flow/boks parceller.

ExCYT er en anskuelighed brugergrænseflade bygget i MATLAB og derfor kan enten køres i MATLAB direkte eller et installeringsprogram er forudsat der kan bruges til at installere softwaren på enhver PC/Mac. Softwaren er tilgængelig på https://github.com/sidhomj/ExCYT. Vi præsenterer en detaljeret protokol for hvordan til at importere data, pre-behandle det, adfærd t-udstationerede dimensionalitet reduktion, klynge data, sortere og filtrere klynger baseret på brugerens præferencer og vise oplysninger om klynger af interesse via heatmaps og roman høj-dimensionelle flow/boks parceller ()figur 1). Akser i t-udstationerede parceller er vilkårlig og i arbitrære enheder og som sådan ikke altid vist i tallene for enkelheden i brugeren grænseflade. Farve af datapunkter i “T-udstationerede Heatmaps” er fra blå til gul baseret på signalet fra den angivne markør. I clustering løsninger, baseret farven på datapunktet vilkårlig på klyngenummer. Alle dele af arbejdsprocessen kan udføres i de enkelt panel GUI ()figur 2 & tabel 1). Endelig vil vi demonstrere brugen af ExCYT på tidligere offentliggjorte data at udforske den immun landskab af renalcellecarcinom i litteratur, også analyseres med lignende metoder. Prøven datasæt vi brugt til at oprette tallene i dette manuskript sammen med protokollen nedenfor kan findes på https://premium.cytobank.org/cytobank/projects/875, efter registrering af en konto.

Protocol

1. indsamling og forberede flowcytometri Data Placere alle enkelt pletter i en mappe af sig selv og mærke af kanalnavnet (ved fluorophore, ikke markør). 2. data import & forbehandling For at holde pause eller gemme hele denne analyse pipeline, brug knappen Gem arbejdsområde nederst til venstre af programmet til at gemme arbejdsområde som en ‘. MAT’ fil, der senere kan indlæses via knappen Load arbejdsområde . Kør ikke mere end …

Representative Results

For at teste anvendeligheden af ExCYT, analyseret vi en kurateret data, der er udgivet af Chevrier et al. med titlen «en immun Atlas af klart Renal karcinom’ hvor gruppen gennemførte CyTOF analyse med en omfattende immun panel på tumor prøver taget fra 73 patienter11. To separate paneler, en myeloid og lymfoide panel, blev brugt til fænotype karakterisere tumor mikromiljø. Formålet med vores undersøgelse var at sammenfatte resultaterne af deres t-u…

Discussion

Her præsenterer vi ExCYT, en roman anskuelighed brugergrænseflade køre MATLAB-baserede algoritmer for at strømline analyse af høj-dimensionelle flowcytometri data, hvilket giver enkeltpersoner med ingen baggrund i programmering til at gennemføre senest i high-dimensionale data analyse algoritmer. Tilgængeligheden af denne software til det bredere videnskabelige samfund vil tillade forskere til at udforske deres flow flowcytometri data i en intuitiv og enkel arbejdsgang. Gennem udførelse t-udstationerede dimension…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Forfatterne har ingen anerkendelser.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).
check_url/kr/57473?article_type=t

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video