Summary

ExCYT: Ett grafiskt användargränssnitt för att effektivisera analys av högdimensionella flödescytometri Data

Published: January 16, 2019
doi:

Summary

ExCYT är en MATLAB-baserat grafiskt användargränssnitt (GUI) som tillåter användare att analysera deras flöde flödescytometri data via vanligen anställd analystekniker för högdimensionella data inklusive dimensionalitet minskning via t-SNE, en mängd automatiserade och manuella klustring metoder, heatmaps och romanen högdimensionella flöde tomter.

Abstract

Med tillkomsten av flöde cytometers kan mäta ett ökande antal parametrar, fortsätta forskare att utveckla större paneler fenotypiskt utforska egenskaperna hos deras cellulära prover. Men, ge dessa tekniska framsteg högdimensionella datauppsättningar som har blivit allt svårare att analysera objektivt inom traditionell manuell-baserade Usenets program. För att bättre analysera och presentera data, samarbetar forskare med bioinformatiker med expertis inom analys av högdimensionella data för att tolka deras flödesdata flödescytometri. Medan dessa metoder har visat sig vara mycket värdefulla i att studera flödescytometri, har de ännu inte införlivas i en enkel och lätt-till-använda paketet för forskare som saknar computational eller programmering expertis. För att bemöta detta behov, har vi utvecklat ExCYT, en MATLAB-baserat grafiskt användargränssnitt (GUI) som effektiviserar analys av högdimensionella flödesdata flödescytometri av genomförandet vanligen anställd analysmetoder för högdimensionella data inklusive dimensionalitet minskning av t-SNE, en mängd automatiserade och manuella klustring metoder, heatmaps och romanen högdimensionella flöde tomter. Dessutom ger ExCYT traditionella Usenets alternativ av Välj populationer av intresse för ytterligare t-SNE och klustring analys samt förmåga att tillämpa grindar direkt på t-SNE tomter. Programvaran ger den ytterligare fördelen att arbeta med antingen kompenseras eller okompenserad FCS filer. I händelse av att efter förvärvet ersättning krävs, kan användaren välja att ge programmet en katalog av enstaka fläckar och en ofärgade provet. Programmet upptäcker positiva händelser i alla kanaler och använder detta Välj data att mer objektivt beräkna matrisen ersättning. Sammanfattningsvis ger ExCYT en omfattande analys rörledning för att ta flödescytometri flödesdata i form av FCS filer och låta varje enskild person, oavsett computational utbildning, att använda de senaste algoritmiska metoderna för att förstå deras data.

Introduction

Framsteg inom flödescytometri samt tillkomsten av massa flödescytometri har tillåtit kliniker och forskare för att snabbt identifiera och karaktärisera fenotypiskt biologiskt och kliniskt intressant prov med nya nivåer av upplösning, skapa stora högdimensionella datauppsättningar som är information rik1,2,3. Medan konventionella metoder för att analysera flödesdata flödescytometri såsom manuell gating har varit mer rättframt för experiment där det finns några markörer och dessa markörer har visuellt urskiljbara populationer, kan detta tillvägagångssätt misslyckas att generera reproducerbara resultat när man analyserar högre-dimensionell datauppsättningar eller de med markörer färgning på ett spektrum. Till exempel i en flera institutionella studie, som där inom cellulär färgning (ICS) analyser utfördes för att bedöma reproducerbarheten för quantitating antigen-specifika T-cell svar, trots god genomför mellan olika laboratorier precision, analys, särskilt gating, infört en betydande källa till variabilitet4. Dessutom är manuellt gating befolkningen av intressen, förutom att vara högst subjektiva mycket tidskrävande och labor intensiv. Problemet med analysera högdimensionella datauppsättningar i ett robust, effektiv och snabb sätt är dock inte en ny till forskning vetenskaperna. Gen uttryck studier genererar ofta extremt högdimensionella datauppsättningar (ofta på order av hundratals gener) där manuell former av analys är helt enkelt omöjligt. För att ta itu med analysen av dessa datamängder, har det varit mycket arbete med att utveckla bioinformatiska verktyg att parsa gen uttryck data5. Dessa algoritmiska metoder har bara nyligen antagits i analysen av flödescytometri data som antalet parametrar har ökat och har visat sig vara ovärderlig i analysen av dessa höga tredimensionella datauppsättningar6,7.

Trots den generation och tillämpning av olika algoritmer och programpaket som gör forskare att tillämpa dessa högdimensionella bioinformatiska metoder på deras flödesdata flödescytometri, fortfarande dessa analytiska tekniker till stor del outnyttjade. Det kan finnas en mängd faktorer som har begränsat den utbredda användningen av dessa metoder för flödescytometri data8, den stora hinder som vi misstänker i använda dessa metoder av forskare, saknar computational knowledge. I själva verket, skrivs många av dessa programvarupaket (dvs. flowCore, flowMeans och OpenCyto) ska genomföras i programmeringsspråk som R som fortfarande kräver materiella programmeringskunskaper. Programvarupaket som FlowJo har funnit nåd bland forskare på grund av enkelheten i användningen och ‘plug-n-play’ natur, samt kompatibilitet med PC operativsystem. För att ge olika accepterade och värdefulla analytiska tekniker till den vetenskapsman obekanta programmeringen, har vi utvecklat ExCYT, en grafiskt-användargränssnitt (GUI) som enkelt kan installeras på en dator som drar många av de senaste teknikerna inklusive dimensionalitet minskning för intuitiv visualisering, en mängd klustring metoder som nämns i litteraturen, tillsammans med nya funktioner att utforska produktionen av dessa kluster algoritmer med heatmaps och roman högdimensionella flöde/lådagram.

ExCYT är ett grafiskt användargränssnitt byggt i MATLAB och därför kan antingen köras inom MATLAB direkt eller ett installationsprogram tillhandahålls som kan användas för att installera programvara på varje dator. Programvaran finns på https://github.com/sidhomj/ExCYT. Vi presenterar ett detaljerat protokoll för hur du importerar data, förbehandla det, genomföra t-SNE dimensionalitet minskning, klusterdata, sortera och filtrera kluster baserat på användarinställningar och Visa information om kluster av intresse via heatmaps och roman högdimensionella flöde/lådagram ()figur 1). Yxor i t-SNE tomter är godtyckliga och i godtyckliga enheter och som sådan som inte alltid visas i siffrorna för enkelhet för användaren gränssnitt. Färgen av datapunkterna i den ”t-SNE Heatmaps” är från blått till gult baserat på signalen för den angivna markören. I klustring lösningar, utifrån färgen på datapunkten godtyckliga kluster nummer. Alla delar av arbetsflödet kan utföras i den enda panelen GUI ()figur 2 & tabell 1). Slutligen kommer vi att visa användning av ExCYT på tidigare publicerade uppgifter att utforska immun landskapet av njurcellscancer i litteraturen, också analyseras med liknande metoder. Prov datamängden vi används för att skapa siffror i detta manuskript tillsammans med protokollet nedan kan hittas på https://premium.cytobank.org/cytobank/projects/875, på att registrera ett konto.

Protocol

1. insamling och förbereda flödescytometri Data Placera alla enstaka fläckar i en mapp av sig själva och etikett av kanalnamnet (av fluorophore, inte markör). 2. data import & förbehandling För att pausa eller spara hela denna analys rörledning, Använd knappen Spara arbetsyta längst ner till vänster i programmet för att spara arbetsytan som en ‘. MATTA ‘ fil som senare kan läsas via knappen Load arbetsyta . Kör inte mer …

Representative Results

För att testa användbarheten av ExCYT, analyserade vi en kurator datauppsättning utgiven av Chevrier et al. med titeln ‘An immun Atlas för klart Cell njurcancer’ där gruppen genomfört CyTOF analys med en omfattande immun panel på tumörprover från 73 patienter11. Två separata paneler, en myeloiska och lymfoida panel, användes till fenotypiskt karakterisera den tumör mikromiljö. Syftet med vår studie var att sammanfatta resultaten av deras t-SN…

Discussion

Här presenterar vi ExCYT, ett nytt grafiskt användargränssnitt köra MATLAB-baserade algoritmer för att effektivisera analys av högdimensionella flödescytometri data, så att människor utan bakgrund i programmering för att genomföra senast i högdimensionella data algoritmer för analys. Tillgången till denna programvara till bredare vetenskapliga gemenskapen tillåter forskare att utforska deras flöde flödescytometri data i ett intuitivt och enkelt arbetsflöde. Genom genomför t-SNE dimensionalitet minsknin…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Författarna har inga bekräftelser.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).
check_url/kr/57473?article_type=t

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video