Summary

ExCYT: 높은 차원 Cytometry 데이터의 분석을 합리화 하기 위한 그래픽 사용자 인터페이스

Published: January 16, 2019
doi:

Summary

ExCYT는 MATLAB 기반의 그래픽 사용자 인터페이스 (GUI) 사용자가 일반적으로 통해 교류 cytometry 데이터 분석을 수 고용 t-SNE, 자동 및 수동의 다양 한 통해 차원 감소를 포함 하 여 높은 차원 데이터에 대 한 분석 기법 이다 클러스터링 메서드, heatmaps, 및 소설 높은 차원 흐름을 플롯 합니다.

Abstract

교류 cytometers 매개 변수의 증가 수를 측정의 도래와 함께 과학자 phenotypically 그들의 세포 샘플의 특성을 탐구 하는 더 큰 패널을 개발 하기 위해 계속 합니다. 그러나, 이러한 기술 발전 전통적인 수동 기반 제어 프로그램 내에서 객관적으로 분석 하는 점점 더 어렵게 되 고 차원 데이터 집합 생성. 더 분석 하 고 데이터 표시, 과학자와 그들의 흐름 cytometry 데이터를 구문 분석 하 고 차원 데이터 분석에 전문성을 갖춘 bioinformaticians 파트너. 동안 이러한 방법을 cytometry 공부에 매우 도움이 될 표시 되었습니다, 그들은 아직 과학자 들 계산 또는 프로그래밍 전문성 부족에 대 한 간단 하 고 사용 하기 쉬운 패키지에 통합 될 수 있다. 우리 ExCYT는 MATLAB 기반 그래픽 사용자 인터페이스 (GUI) 높은 차원 데이터를 포함 한 일반적으로 고용된 분석 기법을 구현 하 여 높은 차원 흐름 cytometry 데이터의 분석을 간소화 하는이 필요를 해결 하기 위해 개발 t-SNE 차원 감소, 자동 및 수동 클러스터링 메서드, heatmaps, 및 소설 높은 차원 흐름의 다양 한 플롯합니다. 또한, ExCYT 추가 t SNE 및 클러스터링 분석 뿐만 아니라 빌 게이츠 t SNE 플롯에 직접 적용 하는 기능에 대 한 관심의 선택 인구의 전통적인 제어 옵션을 제공 합니다. 소프트웨어 보상 중 하나를 사용 하는의 추가적인 장점을 또는 uncompensated FCS 파일을 제공 합니다. 사후 수집 보상은 필요한, 그 사용자 단일 얼룩의 디렉토리와 흠 없는 샘플 프로그램을 제공 하기 위해 선택할 수 있습니다. 프로그램은 모든 채널에서 긍정적인 이벤트를 감지 하 고 더 객관적으로 보상 매트릭스 계산를 선택이 데이터를 사용 하 여. 요약 하자면, ExCYT 교류 cytometry 데이터 FCS 파일의 형태로 이해 하는 그들의 데이터에 최신 알고리즘 접근을 사용 하 여 전산 교육에 어떤 개인을 허용 하는 포괄적인 분석 파이프라인을 제공 합니다.

Introduction

임상의 학자 및 과학자를 빠르게 식별 하 여 phenotypically 만드는 큰 해상도의 새로운 수준의 생물학 및 임상적으로 흥미로운 샘플을 특성화 cytometry 대량 cytometry의 출현에 있는 발전 수 있다 정보 풍부한1,2,3높은 차원 데이터 세트. 이 방법은 생성에 실패할 수 있습니다 동안 수동 게이팅 등 교류 cytometry 데이터를 분석 하기 위한 기존의 방법 실험 몇 마커 고 그 마커는 시각적으로 뚜렷한 인구에 대 한 더 간단한, 더 높은 차원의 데이터 세트 또는 스펙트럼에 얼룩 마커를 분석할 때 재현할 결과. 예를 들어, 다 기관 연구에서 어디 세포내 얼룩 (ICS) 분석 실험 되 고 수행한 좋은 inter-laboratory 정밀, 분석에 불구 하 고 항 원 특정 T 세포 응답, 특히 quantitating의 재현성을 평가 하기 위해 게이팅, 다양성4의 중요 한 소스를 소개 했다. 또한, 수동으로 매우 주관적 되 고 게다가 관심사의 인구 게이팅의 과정이 매우 시간이 소모 하 고 노동 집약입니다. 그러나, 강력한, 효율적이 고 시기 적절 한 방식으로 높은 차원 데이터 세트를 분석의 문제는 한 연구 과학에 새로운 하지. 유전자 표현 연구는 종종 수동 형태의 분석 어디 단순히 가능한 것 (종종 순서 유전자의 수백) 매우 높은 차원 데이터 세트를 생성 합니다. 이러한 데이터 세트의 분석, 대처 하기 위해 구문 분석 유전자 표현 데이터5bioinformatic 도구 개발에 많은 작업이 되었습니다. 이러한 알고리즘 접근가지고 그냥 최근 채택 cytometry 데이터의 분석에서 매개 변수 수가 증가 하 고 이러한 높은 차원 데이터 세트6,7의 분석에 유용한 것으로 입증 되었습니다.

생성 및 다양 한 알고리즘 및 과학자 들이 높은 차원 bioinformatic 접근 그들의 교류 cytometry 데이터에 적용할 수 있도록 하는 소프트웨어 패키지의 응용 프로그램에도 불구 하 고 이러한 분석 기법 아직도 크게 사용 되지 않는 남아 있습니다. Cytometry 데이터8이러한 접근법의 광범위 한 채용 제한 된 요인의 다양 한 있을 수 있습니다, 우리가 용의자에 주요 방해 과학자 들에 의해 이러한 방법의 사용, 전산 지식의 부족 이다. 사실, 이러한 소프트웨어 패키지 (즉, flowCore, flowMeans, 및 OpenCyto)의 많은 여전히 실질적인 프로그래밍 지식이 필요로 하는 연구 등 언어 프로그래밍 구현에 기록 됩니다. FlowJo 소프트웨어 패키지는 PC 운영 체제와의 호환성 뿐만 아니라 사용 및 ‘ 플러그 앤 플레이 ‘ 자연의 단순 과학자 중 호의 발견 했다. 과학자 생소 한 프로그래밍을 허용 하 고 가치 있는 분석 기술의 다양 한 제공, 우리는 ExCYT, 최신 기술의 많은 당기는 p C/맥에 쉽게 설치 될 수 있는 그래픽 사용자 인터페이스 (GUI) 개발 클러스터링 알고리즘 heatmaps 및 소설 높은 차원 흐름/상자 음모와 직관적인 시각화, 다양 한 문학, 이들의 출력을 탐험 소설 기능에 클러스터링 방법에 대 한 차원 감소에 포함 하 여.

ExCYT는 MATLAB에 내장 된 그래픽 사용자 인터페이스 및 따라서 수 있습니다 수 실행 MATLAB에서 직접 또는 설치 관리자는 어떤 PC/맥에 소프트웨어를 설치 하는 데 사용할 수 있는 제공 소프트웨어는 https://github.com/sidhomj/ExCYT에 있다. 데이터를 가져올, 사전 처리, t SNE 차원 감소, 클러스터 데이터 정렬을 수행할 및 클러스터 사용자 기본 설정, 및 heatmaps 및 소설을 통해 관심의 클러스터에 대 한 정보를 표시에 따라 필터링 하는 방법에 대 한 자세한 프로토콜 소개 높은 차원 흐름/상자 구획 (그림 1). T-SNE 플롯에 축 임의 및 임의 단위 이며 항상 사용자의 편의상 그림에 표시 된 같은 인터페이스. “T SNE Heatmaps”에 데이터 포인트의 색 노란색 표시 된 마커의 신호에 따라 파란색에서입니다. 클러스터링 솔루션에서 데이터 요소의 색상 기반으로 임의의 클러스터 번호 합니다. 워크플로의 모든 부분 GUI (그림 2 단일 패널에서 수행할 수 있습니다 & 표 1). 마지막으로, 우리는 이전 게시 된 데이터도 비슷한 방법으로 분석, 문학에서 신장 세포 암의 면역 풍경을 탐험에 ExCYT의 사용을 시연할 예정 이다. 우리 아래 프로토콜 함께이 원고에 그림을 만드는 데 사용 되는 샘플 데이터 집합은 계정 등록 시 https://premium.cytobank.org/cytobank/projects/875에서 찾을 수 있습니다.

Protocol

1. 수집 및 Cytometry 데이터 준비 삽입할 모든 단일 얼룩 폴더에 자신과 레이블 채널 이름 (fluorophore, 아니라 표식)에 의해. 2. 데이터 수입 및 사전 처리 를 일시 중지 하거나이 분석 파이프라인에 걸쳐 저장 하려면 단추 사용 하 여 작업 공간 저장 프로그램의 왼쪽 아래에 작업 영역으로 저장 하는 ‘. 매트 ‘ 나중 부하 작업 영역 단추를 …

Representative Results

우리 Chevrier 외. ‘는 면역 아틀라스의 명확한 세포 신장 암 ‘ 그룹 73에서 종양 샘플에 광범위 한 면역 패널 CyTOF 분석을 실시 라는 의해 큐레이터 데이터 세트를 분석 하는 ExCYT의 유용성을 테스트 하려면 환자11. 두 개의 별도 패널, 골수성과 림프 패널 phenotypically 종양 microenvironment 특성을 사용 했다. 우리의 연구의 목적은 그들의 t-SNE의 결과 정리 및 …

Discussion

여기에 우리가 ExCYT, 새로운 그래픽 사용자 인터페이스를 간소화 높은 차원 cytometry 데이터의 분석을 MATLAB 기반의 알고리즘을 실행 높은 차원 데이터에 최신을 구현 프로그래밍 백그라운드 없이 개인 수 있도록 제시 분석 알고리즘입니다. 광범위 한 과학 사회에이 소프트웨어의 가용성 과학자는 간단 하 고 직관적인 워크플로에 그들의 흐름 cytometry 데이터를 탐색할 수 있습니다. 통해 t SNE 차원 감?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

저자 아무 승인 있다.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video