Summary

ExCYT: उच्च आयामी Cytometry डेटा के विश्लेषण को व्यवस्थित करने के लिए एक ग्राफिकल यूजर इंटरफेस

Published: January 16, 2019
doi:

Summary

ExCYT एक MATLAB आधारित ग्राफिकल यूजर इंटरफेस (GUI) है कि उपयोगकर्ताओं को उनके प्रवाह के माध्यम से cytometry डेटा का विश्लेषण करने की अनुमति देता है उच्च आयामी डेटा के लिए विश्लेषणात्मक तकनीक के माध्यम से टी-SNE, स्वचालित और मैनुअल की एक किस्म क्लस्टरिंग तरीके, heatmaps, और उपंयास उच्च आयामी प्रवाह भूखंडों ।

Abstract

पैरामीटर की बढ़ती संख्या को मापने में सक्षम प्रवाह cytometers के आगमन के साथ, वैज्ञानिकों को phenotypically अपने सेलुलर नमूनों की विशेषताओं का पता लगाने के लिए बड़ा पैनल विकसित करने के लिए जारी है । हालांकि, इन तकनीकी प्रगति उच्च आयामी डेटा सेट है कि तेजी से पारंपरिक मैनुअल आधारित गेटिंग कार्यक्रमों के भीतर होना चाहिए विश्लेषण मुश्किल हो उपज । आदेश में बेहतर विश्लेषण और वर्तमान डेटा, bioinformaticians के साथ वैज्ञानिकों साथी उच्च आयामी डेटा का विश्लेषण करने के लिए उनके प्रवाह cytometry डेटा पार्स में विशेषज्ञता के साथ । हालांकि इन तरीकों को प्रवाह cytometry अध्ययन में अत्यधिक मूल्यवान हो दिखाया गया है, वे अभी तक एक सरल और आसान करने के लिए वैज्ञानिकों, जो गणना या प्रोग्रामिंग विशेषज्ञता की कमी के लिए उपयोग पैकेज में शामिल किया जाना है । इस जरूरत को हल करने के लिए, हम ExCYT, एक MATLAB आधारित ग्राफिकल यूजर इंटरफेस (GUI) है कि उच्च आयामी सहित डेटा के लिए सामांयतः कार्यरत विश्लेषणात्मक तकनीक को लागू करने के द्वारा उच्च आयामी प्रवाह cytometry डेटा के विश्लेषण को कारगर बनाने का विकास किया है टी द्वारा आयामी कमी-SNE, स्वचालित और मैनुअल clustering तरीकों, heatmaps, और उपंयास उच्च आयामी प्रवाह भूखंडों की एक किस्म । इसके अतिरिक्त, ExCYT और टी-SNE और clustering विश्लेषण के लिए ब्याज की चुनिंदा आबादी के पारंपरिक गेटिंग विकल्प प्रदान करता है और साथ ही टी-SNE भूखंडों पर सीधे गेट्स लागू करने की क्षमता । सॉफ्टवेयर या तो मुआवजा या क्षतिपूर्ति FCS फ़ाइलों के साथ काम करने का अतिरिक्त लाभ प्रदान करता है । घटना में है कि बाद के अधिग्रहण मुआवजा की आवश्यकता है, उपयोगकर्ता के लिए कार्यक्रम के एकल दाग और एक दाग नमूना की एक निर्देशिका प्रदान चुन सकते हैं । कार्यक्रम सभी चैनलों में सकारात्मक घटनाओं का पता लगाता है और इस चयन डेटा का उपयोग करता है और अधिक निष्पक्ष मुआवजा मैट्रिक्स की गणना । संक्षेप में, ExCYT एक व्यापक विश्लेषण पाइपलाइन प्रदान करता है FCS फ़ाइलों के रूप में प्रवाह cytometry डेटा लेने के लिए और किसी भी व्यक्ति, गणना प्रशिक्षण की परवाह किए बिना अनुमति, अपने डेटा को समझने में नवीनतम एल्गोरिथम दृष्टिकोण का उपयोग करें ।

Introduction

प्रवाह cytometry में अग्रिम के रूप में के रूप में अच्छी तरह से जन cytometry के आगमन की अनुमति दी है चिकित्सकों और वैज्ञानिकों को तेजी से पहचान करने और phenotypically संकल्प के नए स्तर के साथ जैविक और चिकित्सकीय दिलचस्प नमूनों की विशेषताएं, बड़े बनाने उच्च आयामी डेटा सेट है कि जानकारी रिच1,2,3। जबकि ऐसे मैनुअल गेटिंग के रूप में प्रवाह cytometry डेटा का विश्लेषण करने के लिए पारंपरिक तरीके है प्रयोगों के लिए और अधिक सरल है जहां कुछ मार्करों और उन मार्करों नेत्रहीन समझदार आबादी है, इस दृष्टिकोण को उत्पंन विफल कर सकते है reproducible परिणाम जब उच्च आयामी डेटा सेट का विश्लेषण या एक स्पेक्ट्रम पर दाग मार्करों के साथ उन । उदाहरण के लिए, एक बहु-संस्थागत अध्ययन में, जहां अंतरराज्यीय सेलुलर धुंधला (आईसीएस) की परख की जा रही थी reproducibility का आकलन करने के लिए quantitating प्रतिजन-विशिष्ट टी सेल प्रतिक्रियाओं, अच्छी अंतर-प्रयोगशाला परिशुद्धता के बावजूद, विश्लेषण, विशेष रूप से गेटिंग,4परिवर्तनशीलता का एक महत्वपूर्ण स्रोत की शुरुआत की । इसके अलावा, गेटिंग की प्रक्रिया को मैंयुअल रूप से हितों की जनसंख्या, उच्च व्यक्तिपरक होने के अतिरिक्त अत्यधिक समय लगता है और गहन श्रम है । हालांकि, एक मजबूत, कुशल में उच्च आयामी डेटा सेट का विश्लेषण करने की समस्या है, और समय पर तरीके से अनुसंधान विज्ञान के लिए एक नया नहीं है । जीन अभिव्यक्ति अध्ययन अक्सर अत्यधिक उच्च आयामी डेटा सेट उत्पंन (अक्सर जीन के सैकड़ों के आदेश पर) जहां विश्लेषण के मैनुअल रूपों बस साध्य होगा । आदेश में इन डेटा सेट के विश्लेषण से निपटने के लिए, वहां bioinformatic उपकरण के विकास के लिए जीन अभिव्यक्ति डेटा5पार्स में बहुत काम किया गया है । इन एल्गोरिथम दृष्टिकोण अभी हाल ही में मानकों की संख्या के रूप में cytometry डेटा के विश्लेषण में अपनाया गया है वृद्धि हुई है और इन उच्च आयामी डेटा के विश्लेषण में अमूल्य साबित किया है6,7सेट ।

पीढ़ी और एल्गोरिदम और सॉफ्टवेयर संकुल की एक किस्म है कि वैज्ञानिकों को इन उच्च उनके प्रवाह cytometry डेटा के लिए आयामी bioinformatic दृष्टिकोण लागू करने की अनुमति के आवेदन के बावजूद, इन विश्लेषणात्मक तकनीक अभी भी मोटे तौर पर अप्रयुक्त रहते हैं । जबकि वहां कारकों की एक किस्म है कि cytometry8डेटा के लिए इन दृष्टिकोण के व्यापक अपनाने सीमित है हो सकता है, प्रमुख बाधा हम वैज्ञानिकों ने इन तरीकों के उपयोग में संदेह है, गणना ज्ञान की कमी है । वास्तव में, इन सॉफ्टवेयर संकुल के कई (यानी, flowCore, flowMeans, और OpenCyto) आर के रूप में प्रोग्रामिंग भाषाओं में लागू किया जा लिखा है कि अभी भी ठोस प्रोग्रामिंग ज्ञान की आवश्यकता है । इस तरह के FlowJo के रूप में सॉफ्टवेयर संकुल के उपयोग की सादगी और ‘ प्लग-एन-प्ले ‘ प्रकृति, साथ ही पीसी ऑपरेटिंग सिस्टम के साथ संगतता के कारण वैज्ञानिकों के बीच एहसान मिल गया है । आदेश में वैज्ञानिक अपरिचित प्रोग्रामिंग करने के लिए स्वीकार किए जाते है और मूल्यवान विश्लेषणात्मक तकनीक की विविधता प्रदान करने के लिए, हम ExCYT, एक ग्राफिक उपयोगकर्ता इंटरफ़ेस (जीयूआई) है कि आसानी से एक पीसी पर स्थापित किया जा सकता है विकसित की है/मैक कि नवीनतम तकनीकों के कई खींचती है सहज ज्ञान युक्त दृश्य, clustering तरीकों की एक किस्म के लिए आयामी कमी सहित साहित्य में उद्धृत, heatmaps और उपंयास उच्च आयामी प्रवाह के साथ इन clustering एल्गोरिदम के उत्पादन का पता लगाने के लिए उपंयास सुविधाओं के साथ साथ/

ExCYT एक ग्राफिकल यूजर MATLAB में निर्मित इंटरफेस है और इसलिए या तो MATLAB के भीतर सीधे चला जा सकता है या एक installer प्रदान की है कि किसी भी पीसी पर सॉफ्टवेयर स्थापित किया जा सकता है/ सॉफ्टवेयर https://github.com/sidhomj/ExCYT पर उपलब्ध है । हम कैसे डेटा आयात करने के लिए, पूर्व यह प्रक्रिया, टी SNE आयामी कमी, क्लस्टर डेटा, सॉर्ट & फ़िल्टर क्लस्टर उपयोगकर्ता वरीयताओं पर आधारित है, और heatmaps और उपंयास के माध्यम से ब्याज की समूहों के बारे में जानकारी प्रदर्शित करने के लिए एक विस्तृत प्रोटोकॉल प्रस्तुत उच्च-आयामी प्रवाह/बॉक्स भूखंडों (चित्रा 1)। टी-SNE भूखंडों में कुल्हाड़ियों मनमाने और मनमाने ढंग से इकाइयों में और जैसे हमेशा उपयोगकर्ता इंटरफ़ेस की सादगी के लिए आंकड़े में नहीं दिखाया गया है । “t-SNE Heatmaps” में डेटा बिंदुओं का रंग इंगित मार्कर के सिग्नल के आधार पर नीले से पीले रंग का होता है । clustering समाधान में, डेटा बिंदु का रंग क्लस्टर संख्या पर मनमाने तरीके से आधारित है । कार्यप्रवाह के सभी भागों में एक पैनल जीयूआई (चित्रा 2 & तालिका 1)में किया जा सकता है । अंत में, हम पहले से प्रकाशित साहित्य में गुर्दे सेल कार्सिनोमा की प्रतिरक्षा परिदृश्य की खोज डेटा पर ExCYT के उपयोग को प्रदर्शित करेगा, भी इसी तरह के तरीकों के साथ विश्लेषण किया । नमूना डेटासेट हम नीचे प्रोटोकॉल के साथ इस पांडुलिपि में आंकड़े बनाने के लिए इस्तेमाल किया https://premium.cytobank.org/cytobank/projects/875 पर पाया जा सकता है, एक खाता दर्ज करने पर ।

Protocol

1. Cytometry डेटा एकत्रित करना और तैयार करना एक फ़ोल्डर में सभी एकल दाग खुद के द्वारा और लेबल चैनल नाम द्वारा (fluorophore, नहीं मार्कर द्वारा) प्लेस । 2. पूर्व प्रसंस्करण & डेटा आयात इस विश्लेषण पाइप…

Representative Results

आदेश में ExCYT की उपयोगिता का परीक्षण करने के लिए, हम एक उपचारात्मक डेटा Chevrier एट अल द्वारा प्रकाशित सेट का विश्लेषण किया । ‘ शीर्षक से एक प्रतिरक्षा एटलस स्पष्ट सेल गुर्दे कार्सिनोमा ‘ जहां सम…

Discussion

यहां हम ExCYT, एक उपंयास ग्राफिकल यूजर इंटरफेस MATLAB-आधारित एल्गोरिदम चलाने के लिए उच्च आयामी cytometry डेटा के विश्लेषण को कारगर बनाने, प्रोग्रामिंग में कोई पृष्ठभूमि के साथ व्यक्तियों की अनुमति के लिए उच्च आयाम?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

लेखकों को कोई पावती नहीं है ।

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).
check_url/57473?article_type=t

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video