Waiting
Elaborazione accesso...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: 높은 차원 Cytometry 데이터의 분석을 합리화 하기 위한 그래픽 사용자 인터페이스

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT는 MATLAB 기반의 그래픽 사용자 인터페이스 (GUI) 사용자가 일반적으로 통해 교류 cytometry 데이터 분석을 수 고용 t-SNE, 자동 및 수동의 다양 한 통해 차원 감소를 포함 하 여 높은 차원 데이터에 대 한 분석 기법 이다 클러스터링 메서드, heatmaps, 및 소설 높은 차원 흐름을 플롯 합니다.

Abstract

교류 cytometers 매개 변수의 증가 수를 측정의 도래와 함께 과학자 phenotypically 그들의 세포 샘플의 특성을 탐구 하는 더 큰 패널을 개발 하기 위해 계속 합니다. 그러나, 이러한 기술 발전 전통적인 수동 기반 제어 프로그램 내에서 객관적으로 분석 하는 점점 더 어렵게 되 고 차원 데이터 집합 생성. 더 분석 하 고 데이터 표시, 과학자와 그들의 흐름 cytometry 데이터를 구문 분석 하 고 차원 데이터 분석에 전문성을 갖춘 bioinformaticians 파트너. 동안 이러한 방법을 cytometry 공부에 매우 도움이 될 표시 되었습니다, 그들은 아직 과학자 들 계산 또는 프로그래밍 전문성 부족에 대 한 간단 하 고 사용 하기 쉬운 패키지에 통합 될 수 있다. 우리 ExCYT는 MATLAB 기반 그래픽 사용자 인터페이스 (GUI) 높은 차원 데이터를 포함 한 일반적으로 고용된 분석 기법을 구현 하 여 높은 차원 흐름 cytometry 데이터의 분석을 간소화 하는이 필요를 해결 하기 위해 개발 t-SNE 차원 감소, 자동 및 수동 클러스터링 메서드, heatmaps, 및 소설 높은 차원 흐름의 다양 한 플롯합니다. 또한, ExCYT 추가 t SNE 및 클러스터링 분석 뿐만 아니라 빌 게이츠 t SNE 플롯에 직접 적용 하는 기능에 대 한 관심의 선택 인구의 전통적인 제어 옵션을 제공 합니다. 소프트웨어 보상 중 하나를 사용 하는의 추가적인 장점을 또는 uncompensated FCS 파일을 제공 합니다. 사후 수집 보상은 필요한, 그 사용자 단일 얼룩의 디렉토리와 흠 없는 샘플 프로그램을 제공 하기 위해 선택할 수 있습니다. 프로그램은 모든 채널에서 긍정적인 이벤트를 감지 하 고 더 객관적으로 보상 매트릭스 계산를 선택이 데이터를 사용 하 여. 요약 하자면, ExCYT 교류 cytometry 데이터 FCS 파일의 형태로 이해 하는 그들의 데이터에 최신 알고리즘 접근을 사용 하 여 전산 교육에 어떤 개인을 허용 하는 포괄적인 분석 파이프라인을 제공 합니다.

Introduction

임상의 학자 및 과학자를 빠르게 식별 하 여 phenotypically 만드는 큰 해상도의 새로운 수준의 생물학 및 임상적으로 흥미로운 샘플을 특성화 cytometry 대량 cytometry의 출현에 있는 발전 수 있다 정보 풍부한1,2,3높은 차원 데이터 세트. 이 방법은 생성에 실패할 수 있습니다 동안 수동 게이팅 등 교류 cytometry 데이터를 분석 하기 위한 기존의 방법 실험 몇 마커 고 그 마커는 시각적으로 뚜렷한 인구에 대 한 더 간단한, 더 높은 차원의 데이터 세트 또는 스펙트럼에 얼룩 마커를 분석할 때 재현할 결과. 예를 들어, 다 기관 연구에서 어디 세포내 얼룩 (ICS) 분석 실험 되 고 수행한 좋은 inter-laboratory 정밀, 분석에 불구 하 고 항 원 특정 T 세포 응답, 특히 quantitating의 재현성을 평가 하기 위해 게이팅, 다양성4의 중요 한 소스를 소개 했다. 또한, 수동으로 매우 주관적 되 고 게다가 관심사의 인구 게이팅의 과정이 매우 시간이 소모 하 고 노동 집약입니다. 그러나, 강력한, 효율적이 고 시기 적절 한 방식으로 높은 차원 데이터 세트를 분석의 문제는 한 연구 과학에 새로운 하지. 유전자 표현 연구는 종종 수동 형태의 분석 어디 단순히 가능한 것 (종종 순서 유전자의 수백) 매우 높은 차원 데이터 세트를 생성 합니다. 이러한 데이터 세트의 분석, 대처 하기 위해 구문 분석 유전자 표현 데이터5bioinformatic 도구 개발에 많은 작업이 되었습니다. 이러한 알고리즘 접근가지고 그냥 최근 채택 cytometry 데이터의 분석에서 매개 변수 수가 증가 하 고 이러한 높은 차원 데이터 세트6,7의 분석에 유용한 것으로 입증 되었습니다.

생성 및 다양 한 알고리즘 및 과학자 들이 높은 차원 bioinformatic 접근 그들의 교류 cytometry 데이터에 적용할 수 있도록 하는 소프트웨어 패키지의 응용 프로그램에도 불구 하 고 이러한 분석 기법 아직도 크게 사용 되지 않는 남아 있습니다. Cytometry 데이터8이러한 접근법의 광범위 한 채용 제한 된 요인의 다양 한 있을 수 있습니다, 우리가 용의자에 주요 방해 과학자 들에 의해 이러한 방법의 사용, 전산 지식의 부족 이다. 사실, 이러한 소프트웨어 패키지 (즉, flowCore, flowMeans, 및 OpenCyto)의 많은 여전히 실질적인 프로그래밍 지식이 필요로 하는 연구 등 언어 프로그래밍 구현에 기록 됩니다. FlowJo 소프트웨어 패키지는 PC 운영 체제와의 호환성 뿐만 아니라 사용 및 ' 플러그 앤 플레이 ' 자연의 단순 과학자 중 호의 발견 했다. 과학자 생소 한 프로그래밍을 허용 하 고 가치 있는 분석 기술의 다양 한 제공, 우리는 ExCYT, 최신 기술의 많은 당기는 p C/맥에 쉽게 설치 될 수 있는 그래픽 사용자 인터페이스 (GUI) 개발 클러스터링 알고리즘 heatmaps 및 소설 높은 차원 흐름/상자 음모와 직관적인 시각화, 다양 한 문학, 이들의 출력을 탐험 소설 기능에 클러스터링 방법에 대 한 차원 감소에 포함 하 여.

ExCYT는 MATLAB에 내장 된 그래픽 사용자 인터페이스 및 따라서 수 있습니다 수 실행 MATLAB에서 직접 또는 설치 관리자는 어떤 PC/맥에 소프트웨어를 설치 하는 데 사용할 수 있는 제공 소프트웨어는 https://github.com/sidhomj/ExCYT에 있다. 데이터를 가져올, 사전 처리, t SNE 차원 감소, 클러스터 데이터 정렬을 수행할 및 클러스터 사용자 기본 설정, 및 heatmaps 및 소설을 통해 관심의 클러스터에 대 한 정보를 표시에 따라 필터링 하는 방법에 대 한 자세한 프로토콜 소개 높은 차원 흐름/상자 구획 (그림 1). T-SNE 플롯에 축 임의 및 임의 단위 이며 항상 사용자의 편의상 그림에 표시 된 같은 인터페이스. "T SNE Heatmaps"에 데이터 포인트의 색 노란색 표시 된 마커의 신호에 따라 파란색에서입니다. 클러스터링 솔루션에서 데이터 요소의 색상 기반으로 임의의 클러스터 번호 합니다. 워크플로의 모든 부분 GUI (그림 2 단일 패널에서 수행할 수 있습니다 & 표 1). 마지막으로, 우리는 이전 게시 된 데이터도 비슷한 방법으로 분석, 문학에서 신장 세포 암의 면역 풍경을 탐험에 ExCYT의 사용을 시연할 예정 이다. 우리 아래 프로토콜 함께이 원고에 그림을 만드는 데 사용 되는 샘플 데이터 집합은 계정 등록 시 https://premium.cytobank.org/cytobank/projects/875에서 찾을 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 수집 및 Cytometry 데이터 준비

  1. 삽입할 모든 단일 얼룩 폴더에 자신과 레이블 채널 이름 (fluorophore, 아니라 표식)에 의해.

2. 데이터 수입 및 사전 처리

  1. 를 일시 중지 하거나이 분석 파이프라인에 걸쳐 저장 하려면 단추 사용 하 여 작업 공간 저장 프로그램의 왼쪽 아래에 작업 영역으로 저장 하는 '. 매트 ' 나중 부하 작업 영역 단추를 통해 로드할 수 있는 파일. 한 번에 프로그램의 하나 이상의 인스턴스를 실행 하지 마십시오. 따라서, 새 작업 영역을 로드할 때 확인을 실행 하는 ExCYT의 다른 인스턴스가 있는지 확인 합니다.
  2. 분석 파이프라인을 시작 하려면 먼저 cytometry (Flow Cytometry 또는 질량 Cytometry-CYTOF), 이벤트 (이 예제에서는 2000)에 대 한 파일에서 샘플의 파일 선택 매개 변수 선택 번호의 유형을 선택 합니다. 일단 데이터는 성공적으로 가져온 대화 상자 데이터가 성공적으로 수입 되었음을 사용자에 게 알리는 팝업 됩니다.
  3. 배 그 웰 & 아담스9일 옵션 자동 보정 단계를 수행 하 자동 보정 단추를 누릅니다. 단일 얼룩을 포함 하는 디렉터리를 선택 합니다. 사용자 인터페이스 대화 내에서 흠 없는 샘플을 선택 합니다.
    1. 이벤트 보상 매트릭스 계산를 선택 하는 데 사용 됩니다이 디렉터리에 샘플에 앞 으로/측면-분산형 게이트를 놓습니다. 이 목적을 위해 흠 없는 샘플을 사용 하는 것이 좋습니다. 이 시점에서, 알고리즘 임계값을 설정 일관 된 보상 행렬을 계산 하는 단일 얼룩의 각 긍정적인 이벤트를 정의 하는 흠 없는 샘플의 99번째 백분위 수에서 구현 되었습니다. 이 완료 되 면 대화 상자는 보상 수행 되었습니다 사용자 알릴 것 이다.
  4. 다음, 문 인구 를 누르고 대회 흐름에서 cytometry 분석은 관심의 세포의 인구를 선택. 인구의 셀을 선택 하면 이벤트 다운스트림 분석 (이 10000 이벤트)의 비율의 번호를 입력 합니다.
  5. 다음 사전 처리 상자의 맨 오른쪽에 있는 목록 상자에서 분석에 사용할 번호 채널을 선택 (를 사용 하 여 예제에 표시 된 특정 채널).

3. t-SNE 분석

  1. 시작 시작 프로그램을가지고 t-SNE 버튼을 누르면 창 t SNE 버튼 아래에 시각화를 위한 감소 차원 데이터 세트를 계산 하. T-SNE의 이미지를 저장 하려면 TSNE 이미지 저장을 누릅니다. 8 시스템에서 CPU @ 3.4 g h z 각 및 8 GM RAM이이 단계 10, 000 건의 50000 이벤트, 10 분 및 100000 이벤트에 대 일 분 약 2 분 정도 소요 됩니다.
  2. ' T-SNE heatmap 만들려고 '에서 보듯이 여러 CYTOF 간행물10,11, 선택 마커 관련 t-SNE 팝업 메뉴에서 옵션 (예제와 같이 특정 마커 CD64 또는 CD3 사용). 그림 그림 생성 저장할 수 있는 t SNE 플롯의 heatmap 표현을 보여주는 팝업 됩니다.
  3. 게이트 t-SNE 버튼을 사용 하 여 추가 다운스트림 분석에 대 한 사용자 t SNE 플롯에 대 한 관심의 영역을 선택 합니다.

4. 클러스터 분석

  1. 클러스터링 분석을 시작 하려면 (이 예에서는 우리 대화에 5의 거리 계수와 DBSCAN listbox의 오른쪽에 있는 상자)에서 클러스터링 메서드 목록 상자에서 옵션을 선택 합니다. 클러스터 버튼을 누릅니다.
  2. 다음 옵션 중 하나를 사용 하 여 자동화 된 클러스터링 알고리즘 ' 자동화 된 클러스터링 매개 변수 ' 패널에서 발견.
    1. (T-SNE)에 하드 KMEANS: 알고리즘12제공 되는 클러스터 수를 k-평균 감소 2 차원 t SNE 데이터 클러스터링을 적용 하며.
    2. (HD 데이터)에 하드 KMEANS: k-평균 t SNE 알고리즘에 주어진 원래 높은 차원 데이터 클러스터링을 적용. 다시 한번, 클러스터 수 알고리즘을 제공 해야 합니다.
    3. DBSCAN: 응용 프로그램의 밀도 기반 공간 클러스터링 감소 2 차원 t SNE 데이터를 클러스터의 일반적인 크기를 결정 하는 차원 비 거리 요소를 필요로 하는 잡음13 라는 클러스터링, 클러스터링 메서드를 적용 합니다 클러스터입니다. 그것은 감소 된 t-SNE 표현에는 클러스터 비 구상 클러스터 수 이러한 유형의 클러스터링 알고리즘은 클러스터 t SNE 감소에 적합 합니다. 또한, 사실은 그것은 2 차원 데이터에서 작동, 그건 빠른 클러스터링 알고리즘 중 하나.
    4. 계층적 클러스터링: 기존 계층적 클러스터링 메서드 전체 유클리드 거리 행렬은 거리 요소는 클러스터의 크기를 설정 하는 알고리즘을 제공 하기 전에 모든 이벤트 사이 계산 하는 높은 차원 데이터에 적용 됩니다.
    5. 네트워크 그래프- 기반:11,14를 검색 하는 사용자가 드문 모집단 때 흐름 cytometry 데이터 분석에 가장 최근에 도입 되어 클러스터링 방법 적용. 이 메서드는 첫 번째 데이터에서 모든 이벤트 사이 연결을 결정 하는 그래프를 만드는 방법에 의존 합니다. 이 단계 k-가장 가까운 이웃 수 그래프를 만들려면 초기 매개 변수를 제공 구성 되어 있습니다. 이 매개 변수는 일반적으로 클러스터의 크기를 제어합니다. 이 시점에서, 또 다른 대화 상자는 그래프에 적용 되는 클러스터링 알고리즘 5 중 하나를 사용 하는 사용자 팝업. 그래프, 댄 메서드와는 스펙트럼 클러스터링 알고리즘14,15,16,,1718의 모듈화를 극대화 하기 위해 3 옵션 포함 됩니다. 하나 일반적으로 빠른 클러스터링 솔루션을 원하는 경우에 스펙트럼 클러스터링 또는 빠른 욕심 모듈화 극대화 하는 것이 좋습니다. 댄 메서드 함께 모듈화 극대화 방법을 최적의 클러스터 수를 결정, 스펙트럼 클러스터링 합니다 프로그램에 주어진 수를 클러스터 수를.
    6. 자체 지도 구성: 고 차원 데이터를 클러스터링 하는 인공 신경 네트워크를 사용 합니다.
    7. GMM-기대 극대화: 기대 극대화 (EM) 기법을 사용 하 여 높은 차원 데이터를 클러스터링 하는 가우스 혼합 모델을 만들기. 19 클러스터링 방법의이 종류는 또한 클러스터의 수를 입력 하는 사용자를 필요 합니다.
    8. GMM 위한 변 분 베이지안 추론: 가우스 혼합 모델 만들지만 그들와 달리 그것은 자동으로 확인할 수 혼합물 구성 요소 공화국20 수 프로그램 주어질 클러스터의 수를 필요로 합니까 (보다 큰에 클러스터 수가 예상), 알고리즘 자체에 최적의 수를 결정 합니다.
  3. T SNE 음모의 특정 영역 연구, 사용자 정의 클러스터 집합을 그리는 수동으로 클러스터 선택 단추를 누릅니다. 메모의 클러스터 구성원 (즉, 각 이벤트 1 클러스터에만 속할 수 있습니다)를 공유할 수 없습니다.

5. 클러스터 여과

  1. 클러스터의 집합 중 하나를 수동으로 식별 또는 위에서 설명한 자동 방법 중 하나를 통해 통해 다음과 같이 필터링 수 있습니다.
    1. 마커는 실험에서 측정에 의해 ( 클러스터 필터 패널)에서 클러스터를 정렬 하려면 정렬 팝업 메뉴에서 옵션을 선택 합니다. 순서 오름차순 또는 내림차순으로 여부를 설정 하려면 정렬 팝업 메뉴의 오른쪽에 오름차순/내림차순 버튼을 누릅니다. 이 '클러스터 (여과)' 목록 상자에서 클러스터의 목록을 업데이트 하 고 해당 표시의 평균 클러스터 표현의 내림차순 순서 그들. '클러스터 (여과)' 목록 상자에 표시 하는 백분율 인구가이 클러스터를 나타내는 비율을 나타냅니다.
    2. 특정 채널을 통해 특정된 클러스터에 대 한 최소 임계값 값을 설정 하려면 임계값 팝업 메뉴에서 옵션을 선택 (이 예에서는 우리 마커 CD65 및 0.75에서 임계값 설정). 그래프 아래의 숫자 상자에 값을 입력 하거나 슬라이드 막대를 사용 하 여 임계값을 설정 합니다. 임계값을 설정 임계값의 방향을 지정 하는 임계값 위에 추가 또는 임계값 아래 추가 누릅니다. 이 임계값을 설정 어디 마커, 임계값 값 및 방향 표시 됩니다 사용자가 알고 있는 임계값 현재 적용 되 고 그래서 ' 클러스터 필터 ' 패널 옆 임계값 상자에 나열 됩니다. 마지막으로, t-SNE 줄거리 여과의 요구 사항을 충족 하지 않는 클러스터 밖으로 흐리게 하 여 업데이 트 됩니다 그리고 '클러스터 (여과)' 목록 상자 여과 요구 사항을 충족 하는 클러스터를 표시 하려면 업데이트 됩니다.
    3. 클러스터의 주파수에 대 한 최소 임계값을 설정 하려면 입력 숫자 마감 클러스터 주파수 임계값 (%) (이 예제에서는 사용 하 여 1%)에서 클러스터 필터 패널에서 상자.

6. 클러스터 분석 및 시각화

  1. 추가 분석 및 시각화에 대 한 클러스터를 선택 하려면 클러스터 (여과) 목록 상자에서 클러스터를 선택 하 고 클러스터 분석 listbox 이동 선택 à 단추를 누릅니다.
  2. Heatmaps 클러스터를 만들려면 클러스터 분석 listbox의 클러스터를 선택 하 고 클러스터 HeatMap 단추를 누릅니다. 이 버튼을 누르면 그림 포함 하는 클러스터 및 매개 변수 축에 dendrograms 함께 열 지도 팝업 됩니다. 세로 축에서 dendrogram는 그 가로에 dendrogram 동안 밀접 하 게 관련 된 클러스터 그룹 축 마커 공동 연결을 그룹화 합니다. Heatmap 저장을 눌러 파일 | 설정 내보내기 | 수출.
  3. ' 높은 차원 상자 그림 ' 또는 ' 높은 차원 흐름 플롯 '을 만들려면 클러스터 분석 listbox의 클러스터를 선택 하 고 높은 차원 상자 그림 단추 또는 높은 차원 흐름 플롯 버튼을 누릅니다. 이 플롯 시각의 분포를 평가 하기 위해 사용할 수 있는 모든 차원에 걸쳐 다양 한 클러스터의 채널을 주어진.
  4. 전통적인 2D 흐름 플롯에 클러스터를 표시 하려면 변환 (선형, log10, arcsinh)을 선택 하 고 기존의 흐름 플롯 패널 및 보도 채널 기존의 흐름 플롯.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

우리 Chevrier 외. '는 면역 아틀라스의 명확한 세포 신장 암 ' 그룹 73에서 종양 샘플에 광범위 한 면역 패널 CyTOF 분석을 실시 라는 의해 큐레이터 데이터 세트를 분석 하는 ExCYT의 유용성을 테스트 하려면 환자11. 두 개의 별도 패널, 골수성과 림프 패널 phenotypically 종양 microenvironment 특성을 사용 했다. 우리의 연구의 목적은 그들의 t-SNE의 결과 정리 및 분석, ExCYT 동일한 결론에와 서 시각화 및 클러스터 분석의 추가 메서드를 표시 하는 데 사용 될 수 보여 주는 클러스터 했다.

원래 원고에서 그룹 22 T 셀 클러스터 림프 패널에 의해 식별 및 골수성 패널에 의해 식별 된 17 셀 클러스터 설명 합니다. 그림 3그림 4 간행물의, 그룹 표시 클러스터의 heatmaps t SNE 색된 클러스터링 솔루션, 및 t-SNE heatmaps 의존할 A, B, 및 c.에 플롯 분석을 수행 하기 위해 우리 Cytobank에서 수동으로 문이 데이터를 얻은 각 파일에서 2000 이벤트 샘플링 또는 원래 원고에서 분석 파이프라인 다음 미만 2000 이벤트, 만약에 전체 파일을 했다. 이 시점에서, 우리 우리의 포스트 제어 샘플링 매개 변수를 통해 100000 행사의 총 샘플, t SNE 분석을 실시 하 고 다양 한 방법으로 데이터를 탐색할 때 다양 한 클러스터링 방법 사용.

첫째, 우리는 t-SNE 분석을 완료 하 고 다양 한 마커 (그림 3A)의 heatmaps를 생성 하 여 원래 원고로 같은 분석 파이프라인에 따라 골수성 패널 조사. 원래 원고 정규화 t SNE heatmaps 각 마커의 99번째 백분위 수를, 하는 동안 ExCYT이이 유형의 그것의 heatmaps에 대 한 정규화를 수행 하지 않습니다. 그러나, 원래 원고에 설명 된 대로 마커 공동 식의 비슷한 배포판 관찰 되었다. 우리는 다음 100 k-인접 이웃과 그래프를 만들고 ExCYT, 우리가 발견 19 내 빠른 욕심 구현을 사용 하 여 그래프의 모듈화를 최적화를 통해 그래프를 클러스터링 하 여 데이터를 클러스터링 하는 네트워크 그래프 기반 방법 적용 셀 (그림 3B)의 부분 모집단 이러한 클러스터는 heatmap와 ExCYT에 의해 만들어진 heatmap 비교 출판 때 원래 원고에, 우리는 우리가 골수성 세포 (그림 3C)의 유사한 클러스터를 식별할 수 있었다 지적 했다. 노트의 원래 원고 식별 하 고 우리가 정의한 HLA-DRintCD68intCD64intCD36 우리의 분석에서 확인 된 골수성 세포의 두 하위 인구 대조+CD11b+ (클러스터 13)와 HLA-DR+ CD4+CD68+CD64+CD36-CD11b- (18 클러스터). 이 두 집단의 높은 차원 상자 그림으로 시각화 언급 한 6 개의 마커 (그림 1D)에서 통계적으로 유의 한 차이 (맨-휘트니) 밝혔다.

다음, 우리는 더 평범한 및 빨리 계층적 클러스터링 방식으로 림프 패널 분석. 이 방법은 t SNE heatmaps (그림 4A) 통해 비슷한 표식 배포판 나왔고. 또한 계층을 통해 데이터의 클러스터링 림프 세포 (그림 4C)의 유사한 클러스터 시연 클러스터링 (그림 4B). 주의 우리 또한 CD4로 정의 하는 원래 원고에서 독특한 규제 T 세포 인구를 식별+CD25+Foxp3+CTLA-4+CD127- (클러스터 17) 우리의 높은 차원 흐름 플롯 (그림 4D)를 통해.

마지막으로, 우리는 신속 하 고 양적 평가 마커 중 공동 연결을 ExCYT 내에서 메서드를 고용 싶 었 어 요. 우리는 2 차원 t-SNE 데이터 (그림 4E)에 5000 클러스터 누워 하드 k-means 클러스터링 알고리즘을 사용 하 여 시작 했다. 우리는 다음 이러한 클러스터 (그림 4 층)에서 한 heatmap 만드는 데 메디아 표현의 모든이 클러스터의 모든 마커를 사용. 클러스터의 좋은 메쉬를 적용 하 고 다음 있는 heatmap을 만들어 데이터 추상화의이 방법은 수 선택할 공동 연결을 쉽게, 팀 3의 공동 협회 등 PD-1, CD38, 때문에 이러한 heatmaps 클러스터와 유사한 열으로 서 행, 그리고 4-1BB입니다.

Figure 1
그림 1: ExCYT 파이프라인 및 기능. (A) ExCYT 적용 하 여 원시 FCS 데이터 가져오기, 선택적 보상, 게이팅, 다운스트림 분석 전에 임의의 서브 시작. 이렇게 하면 모든 이벤트 분석 되 고 분석 되 고 실험에 관련 된. t-SNE 차원 감소 다음 모든 이벤트 시각화를 수행 하 고 t SNE heatmaps phenotypic 배포판 시각화를 생성할 수 있습니다. 마지막으로, 클러스터링 알고리즘의 다양 한 t SNE 변환 또는 높은 차원 원시 데이터에 적용할 수 있습니다. (B) 새로운 정렬 및 임계 처리 기능 가능성이 관심의 것 들을 찾을 수 클러스터의 수백을 통해 신속 하 게 정렬 하는 사용자 수 있습니다. (C) Heatmaps 클러스터의 여러 클러스터는 마커 공동 연결 뿐만 아니라 서로를 비교 검사를 만들 수 있습니다. (D) 로 다시 게이팅의 형태는 데이터의 높은 차원 특성을 평가 하는 동안 원래 데이터에 클러스터 소설 높은 차원 흐름/상자 음모를 생성할 수 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 2
그림 2: ExCYT 그래픽 사용자 인터페이스: 그래픽 사용자 인터페이스는 약식 작업 흐름 작업 왼쪽에서 패널의 오른쪽에 사용자 자신의 데이터를 가져옵니다 수 있습니다 ExCYT t SNE 차원 감소, 클러스터링, 그리고 최종 클러스터 분석 및 시각화를 수행 합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 3
그림 3: 재현 부 Chevrier 에서 골수성 부분 모집단의 (A) (D) 비교 높은 네트워크 그래프 클러스터링 알고리즘 (C) Heatmap 골수성 패널에 클러스터링 솔루션으로 식별 하는 클러스터의 코딩 된 토큰 t SNE heatmaps 골수성 패널 색상의 골수성 패널 (B) t-SNE 줄거리의 원래 원고에서 참조 골수성 모집단 (클러스터 13 & 18) 대조 비교 차원 상자 그림 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 4
그림 4: 재현 부 Chevrier 에서 림프 부분 모집단의 (A) (C) Heatmap 림프 패널 (D) 높은 차원 흐름에 클러스터링 솔루션으로 식별 하는 클러스터의 계층적 클러스터링 알고리즘에 의해 코딩 된 토큰 t SNE heatmaps 림프 패널 색상의 림프 패널 (B) t-SNE 줄거리의 5000 클러스터 하드의 원래 원고 (E) 클러스터링 솔루션에서 확인 된 규제 T 세포 인구 (클러스터 17)의 k-평균 t SNE 데이터 (F) Heatmap 림프에 k-평균 클러스터링 솔루션으로 식별 하는 클러스터에 대 한 분석 패널 표시 마커 공동 협회입니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

설명 이름 (GUI)
1 Cytometry 유형의 선택 NA
2 원시 데이터의 임의의 서브 NA
3 분석을 위해 파일을 선택 파일 선택
4 소프트웨어를 제공 하는 단일 얼룩의 디렉토리에 따라 원시 데이터의 자동 보상 자동 보상
5 T-SNE 및 클러스터링 분석에 대 한 이벤트를 선택 게이팅 문 인구
6 임의의 서브 문이 데이터 (절대 번호) NA
7 임의의 서브 문이 데이터 (문이 인구의 %) NA
8 분석에 대 한 채널을 선택 NA
9 실행된 t-SNE 차원 감소 t-SNE
10 t-SNE 창 NA
11 작업 영역 저장 작업 영역 저장
12 작업 영역을 로드 작업 영역을 로드
13 T-SNE heatmap 선택 표식에 만들기 NA
14 T-SNE 게이트를 다시 선택 인구의 t SNE 분석을 할 게이트 t-SNE
15 T-SNE 창 이미지 저장 TSNE 이미지 저장
16 클러스터링 알고리즘 선택 클러스터링 메서드
17 주어진 클러스터링 매개 변수 입력 알고리즘 NA
18 클러스터 분석 클러스터
19 수동으로 클러스터를 그리기 클러스터를 수동으로 선택
20 모든 클러스터 클러스터 분석을 다시 취소 클러스터를 취소
21 현재 필터 조건 하에서 클러스터를 표시 클러스터 (여과)
22 클러스터 분석 listbox에서 선택 클러스터 제거 제거 <-
23 클러스터 분석 listbox에 클러스터 추가 선택->
24 모든 이벤트의 기존 히트 맵 분석 만들기 이벤트의 히트 맵
25 에 의해 정렬 클러스터 선택 마커 정렬
26 선택 마커로 설정된 임계값 임계값
27 클러스터 분석 listbox에서 선택한 클러스터의 기존 히트 맵 만들기 클러스터의 히트 맵
28 정렬 순서 뒤집기 오름차순/내림차순
29 지우기 모든 임계값 지우기 모든 임계값
30 클러스터에 대 한 임계값 설정된 주파수 클러스터 주파수 임계값 (%)
31 현재 임계값 '클러스터 (여과)' 목록 상자에서 활성 목록 임계값
32 높은 차원 상자 그림 높은 차원 상자 그림
33 높은 차원 흐름 플롯 높은 차원 흐름 플롯
34 기존의 흐름 음모에 대 한 수평 축 매개 변수 NA
35 기존의 흐름 음모에 대 한 수직 축 매개 변수 NA
36 수평 축에 기존의 흐름 플롯에 대 한 데이터 변환 NA
37 세로 축에서 기존의 흐름 플롯에 대 한 데이터 변환 NA
38 기존의 흐름 플롯 만들기 기존의 흐름 플롯
39 분석에 대 한 클러스터를 보여 NA

표 1: 개요의 모든 기능을 GUI ExCYT에

소프트웨어/패키지의 이름 ExCYT CYT FCS 익스프레스 flowCore openCyto FlowMeans
프로그램 유형 Matlab Matlab 독립 실행형 응용 프로그램 R R R
사용자에 게 가격 무료 무료 $ 1000 무료 무료 무료
그래픽 사용자 인터페이스 아니요 아니요 아니요
차원 감소 기법 t-SNE t-SNE, PCA t-SNE, PCA, 스페이드 없음 없음 없음
클러스터링 알고리즘 K-평균
DBSCAN
계층적 클러스터링
자기 조직된 지도
여러 네트워크 그래프 기반 방법
GMM-EM
GMM-변 분 베이지안 추론
K-평균
GMM-EM
단일 네트워크 그래프 기반 메서드 (Phenograph)
K-평균 없음 수동 제어 워크플로 자동화 K-평균
정렬/필터 클러스터 수 아니요 아니요 아니요 아니요 아니요
높은 차원 흐름 플롯 아니요 아니요 아니요 아니요 아니요

표 2: 소프트웨어 기반 흐름 Cytometry 분석 솔루션의 개요

Subscription Required. Please recommend JoVE to your librarian.

Discussion

여기에 우리가 ExCYT, 새로운 그래픽 사용자 인터페이스를 간소화 높은 차원 cytometry 데이터의 분석을 MATLAB 기반의 알고리즘을 실행 높은 차원 데이터에 최신을 구현 프로그래밍 백그라운드 없이 개인 수 있도록 제시 분석 알고리즘입니다. 광범위 한 과학 사회에이 소프트웨어의 가용성 과학자는 간단 하 고 직관적인 워크플로에 그들의 흐름 cytometry 데이터를 탐색할 수 있습니다. 통해 t SNE 차원 감소를 실시, 클러스터링 방법을 적용, 수 있는 정렬/필터가이 클러스터를 통해 신속 하 고 유연 하 고, 사용자 정의 heatmaps 및 높은 차원 흐름/상자 플롯, 과학자 수 뿐만 아니라 그들의 견본에서 고유 하 게 정의 된 모집단을 이해 하지만 직관적이 고 그들의 동료에 의해 쉽게 이해는 시각화를 만들 수 있을 것입니다.

프로그램은 다양 한 데이터 형식 (기존의 cytometry vs 대량 cytometry) 처리에 유연, 프로그램의 최적의 유틸리티에 대 한 몇 가지 고려 사항이 있습니다. 이들 중 첫 번째에는 특히 cytometry 데이터 흐름의 데이터 품질에 대해서는. 적절 한 보상 및 방출 스펙트럼 중복의 해상도 파라마운트 중요 합니다. 제대로 보상된 데이터 표식의 거짓 공동 협회와 진정한 생물학적 의미의 되지 않은 클러스터의 형성 실수로 발생할 수 있습니다. 따라서, 그것은 입력된 데이터 t SNE 분석 및 추가 다운스트림 분석을 진행 하기 전에 사운드 품질은 매우 좋습니다. 또한, ExCYT에 구현 된 자동 보정 알고리즘의 사용 보상 매개 변수를 정확 하 게 계산 하려면 모든 채널에 대 한 분명 한 얼룩을 요구 한다.

ExCYT의 사용에 대 한 또 다른 중요 한 고려 사항은 이다 (에서 같이이 원고) 한 분석에 여러 FCS 파일을 연결 하는 경우, 그들은 모든 채널에서 비교 되어야 합니다. 첫째, 같은 패널 모든 샘플 모든 채널에서 샘플 사이 아무 드리프트는 사용 해야 하는 것이 즉. 예를 들어 하나 별도 일 두 개의 샘플을 읽을 했다 일 하지만 cytometer의 전압에 FITC에서 스테인드 CD8 약간 이동한 CD8 인구에서 발생 하는 1 일에 다르게 설정 된 경우 하나는 다운스트림 분석에서 잘못 된 클러스터 생성 수 있습니다. 이 교대의 악기 유사 기능과 생물 학적 중요성 때문으로 생성 되었습니다. ExCYT의 미래 버전 샘플 그들의 단일 얼룩을 정상화 할 수 있습니다, 하는 동안이 시점에서, 신중한 고려 되어야 합니다 FCS 파일 ExCYT에 그들을 가져오기 전에 서로 비교 될 수 있다.

마지막으로, 클러스터링의 과정은 절대/까다로운 하나 하지. 다른 클러스터링 알고리즘 및 매개 변수는 다른 클러스터링 솔루션을 생성할 수 있습니다. 알고리즘의 솔루션 인지 적절 한 클러스터링 솔루션으로 생물학의 그들의 이해를 종합 하 여 결정 하는 사용자입니다. 예를 들어 종양의 면역 환경 이해 때 하나 관심이 있을 수 있습니다 거시적인 클러스터 (즉, T 세포 vs B 세포 vs 골수성 세포) 동안 다른 거시적인 클러스터의 부분 모집단에 관심이 있을 수 있습니다. 클러스터의 해상도 사용자 및 그러므로 아무 단일 결정 됩니다 '올바른'은 클러스터링 솔루션 이 ExCYT에서 사용할 수 있는 높은 차원 흐름 플롯을 사용 하 여의 주요 장점 중 하나입니다. 모든 채널에서 특정된 클러스터의 분포를 시각화 하는 기능 방법 하지만 과학적인 질문 되 고 실험에 관련 된 방법으로 그들은 뿐만 아니라 생물학 관련에 클러스터는 여부를 결정 하는 사용자를 도울 수 있다. 우리의 목표는 클러스터링의 추가 메서드를 제공 하는 동안 클러스터 높은 차원 흐름 cytometry 데이터에 문학에서 사용 되는 방법의 과다를 제공 하는, k-평균 및 DBSCAN와 같은 방법을 사용 하 여 통해 데이터를 신속 하 게 탐색할 것이 좋습니다. 클러스터 번호와 크기 및 네트워크 그래프와 더 강력 하지만 보다 접근에 대 한 접근 방식을 가우스 혼합 모델 쪽으로 이동 반복.

이러한 고려를 감안할 때, ExCYT는 여전히 높은 차원 cytometry 데이터 탐색을 위한 매우 유연 하 고 가치 있는 도구와 이러한 유형의 분석 (표 2)을 사용할 수 있는 다른 사용 가능한 패키지 보다 독특한/차별화 기능을 제공 . 첫째, ExCYT 차원 감소를 활용 하 여 및 클러스터링 알고리즘을 스크립팅/프로그래밍 지식 없이도 사용 하는 기능에 의해 대부분 흐름 cytometry 분석 접근을 통해 그 자체를 차별화 합니다. 또한, 문학을 통해 인용 많은 클러스터링 알고리즘을 집계 하 여 우리 우리가 클러스터링 데이터에 대 한 대부분의 옵션을 제공 믿습니다. 마지막으로, 우리의 고유한 클러스터 여과 및 새로운 높은 차원 흐름 플롯을 통해 디스플레이 함께 정렬의 기능은 사용자가 신속 하 고 효율적으로, 그들의 클러스터의 특징을 탐색할 수 희귀 '발견'의 과정을 만들기 부분 모집단 간단 하 고 효율적

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개 없다.

Acknowledgments

저자 아무 승인 있다.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

철회 문제점 143 Cytometry 교류 높은 차원 분석 t-SNE 클러스터링 지도 차원 감소 열
ExCYT: 높은 차원 Cytometry 데이터의 분석을 합리화 하기 위한 그래픽 사용자 인터페이스
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter