Waiting
Elaborazione accesso...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: Una interfaz gráfica de usuario para simplificar el análisis de datos multidimensional de citometría de

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT es una basada en MATLAB usuario interfaz gráfica (GUI) que permite a los usuarios analizar sus datos de citometría de flujo mediante comúnmente empleado técnicas de análisis de datos multidimensional, incluyendo la reducción de la dimensionalidad mediante t-SNE, una variedad de automatizados y manuales métodos de clustering, heatmaps, novela flujo multidimensional parcelas.

Abstract

Con el advenimiento de los citómetros de flujo capaz de medir un número cada vez mayor de parámetros, los científicos siguen a desarrollar paneles más grandes para explorar fenotípicamente las características de sus muestras celulares. Sin embargo, estos avances tecnológicos rendimiento multidimensional modems que se han vuelto cada vez más difíciles de analizar objetivamente dentro bloquea los programas tradicionales basados en el manual. Para mejor analizar y presentar datos, los científicos asocian bioinformáticos con experiencia en análisis de datos multidimensional para analizar los datos de la citometría de flujo. Mientras que estos métodos han demostrado ser muy valiosa en el estudio de citometría de flujo, tienen todavía que ser incorporado en un paquete sencillo y fácil de usar para los científicos que carecen de conocimientos de programación o computacional. Para abordar esta necesidad, hemos desarrollado ExCYT, una basada en MATLAB usuario interfaz gráfica (GUI) que optimiza el análisis de datos de citometría de flujo multidimensional mediante la aplicación de técnicas analíticas comúnmente empleadas para la inclusión de datos multidimensional reducción de la dimensionalidad por t-SNE, una variedad de métodos de agrupamiento automatizados y manuales, heatmaps y novela flujo multidimensional parcelas. Además, ExCYT ofrece tradicionales bloquea opciones de seleccionadas poblaciones de interés para más t-SNE y clustering análisis así como la capacidad de aplicar puertas directamente en parcelas t-SNE. El software proporciona la ventaja adicional de trabajar con ya sea compensado o archivos FCS no compensados. En caso de que después de la adquisición indemnización se requiere, el usuario puede elegir proporcionar el programa de un directorio de manchas únicos y una muestra sin manchas. El programa detecta eventos positivos en todos los canales y utiliza estos datos seleccionarlos objetivamente más calcular la matriz de compensación. En Resumen, ExCYT ofrece una tubería de análisis completo para tomar datos de citometría de flujo en forma de archivos de FCS y permitir que a cualquier persona, independientemente de la capacitación computacional, con los últimos enfoques algorítmicos en la comprensión de sus datos.

Introduction

Avances en citometría de flujo, así como el advenimiento de la citometría de masas ha permitido a los médicos y científicos para rápidamente identificar y caracterizar fenotípicamente las muestras biológica y clínicamente interesantes con nuevos niveles de resolución, creando grandes conjuntos de datos multidimensional que son información rica1,2,3. Mientras que los métodos convencionales para el análisis de datos de citometría de flujo como compuerta manual han sido más sencillos para los experimentos donde hay pocos marcadores y los marcadores tienen poblaciones visualmente discernibles, este enfoque puede no generar resultados reproducibles cuando se analizan conjuntos de datos de mayor dimensión o aquellos con marcadores de tinción en un espectro. Por ejemplo, en un estudio multi-institucional, donde intracelular tinción (ICS) ensayos se realizaron para evaluar la reproducibilidad de la cuantificación de las respuestas de células de T específicas de antígeno, a pesar de buena precisión entre laboratorios, análisis, particularmente sincronización, introdujo una importante fuente de variabilidad4. Además, el proceso de bloquear manualmente la población de interés, además de ser muy subjetivo es muy desperdiciador de tiempo y mano de obra intensiva. Sin embargo, el problema de analizar conjuntos de datos multidimensional de una manera robusta, eficiente y oportuna no es uno nuevo para la investigación en Ciencias. Estudios de expresión génica generan a menudo extremadamente multidimensional modems (a menudo del orden de cientos de genes) en formas manual de análisis sería simplemente imposible. Para abordar el análisis de estos datos, ha habido mucho trabajo en el desarrollo de herramientas bioinformáticas para analizar datos de expresión génica5. Estos enfoques algorítmicos se sólo han recientemente adoptados en el análisis de datos de citometría como el número de parámetros ha aumentado y ha demostrado para ser invaluables en el análisis de estos conjuntos de datos dimensional alta6,7.

A pesar de la generación y aplicación de una variedad de algoritmos y paquetes de software que permiten a los científicos a aplicar estos enfoques bioinformáticas multidimensional a los datos de la citometría de flujo, estas técnicas analíticas siguen siendo en gran parte inusitadas. Aunque puede haber una variedad de factores que han limitado la adopción generalizada de estos enfoques para citometría datos8, el obstáculo principal que sospechamos en el uso de estos enfoques por los científicos, es una falta de conocimiento computacional. De hecho, muchos de estos paquetes de software (es decir, flowCore, flowMeans y OpenCyto) están escritos en lenguajes como R que todavía requieren conocimientos de programación sustantiva de programación. Paquetes de software como FlowJo han encontrado favor entre los científicos por la sencillez de uso y naturaleza 'plug-n-play', así como compatibilidad con el sistema operativo de PC. Para proporcionar la variedad de técnicas analíticas aceptadas y valiosas para la programación desconocido científico, hemos desarrollado ExCYT, una interfaz gráfica de usuario (GUI) que puede ser fácilmente instalada en un PC/Mac que tira muchas de las técnicas más recientes incluyendo reducción de dimensionalidad para visualización intuitiva, una variedad de métodos de agrupamiento citado en la literatura, junto con características nuevas para explorar la producción de estos clústeres de algoritmos con diagramas de flujo/caja multidimensional heatmaps y novela.

ExCYT es una interfaz gráfica de usuario en MATLAB y por lo tanto puede tanto ejecutar dentro de MATLAB directamente o un instalador siempre puede utilizarse para instalar el software en cualquier PC/Mac. El software está disponible en https://github.com/sidhomj/ExCYT. Presentamos un protocolo detallado de cómo importar datos, pre-procesarlo, realizar reducción de dimensionalidad t-SNE, cluster de datos, tipo y filtro clusters basados en las preferencias del usuario y muestra información sobre los grupos de interés vía heatmaps y novela cuadro de flujo de alta dimensión parcelas ()figura 1). Los ejes en parcelas t-SNE son arbitrarias y en unidades arbitrarias y así como no siempre se muestra en las figuras para simplicidad del usuario interfaz. El color de los puntos de datos en el "t-SNE Heatmaps" es de azul a amarillo basado en la señal del marcador indicado. En soluciones de clustering, el color del punto de datos se basa arbitraria en número de clúster. Todas las partes del flujo de trabajo pueden llevarse a cabo en el panel solo GUI ()figura 2 y 1 mesa). Finalmente, demostraremos el uso de ExCYT en datos previamente publicados, explorando el paisaje inmune de carcinoma de células renales en la literatura, que también se analizaron con métodos similares. El conjunto de datos de muestra que se utilizó para crear las figuras en este manuscrito con el siguiente protocolo puede encontrarse en https://premium.cytobank.org/cytobank/projects/875, al registrar una cuenta.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. recolección y preparación de datos de citometría de

  1. Colocar todas las manchas solo en una carpeta propia y sello por el nombre del canal (fluoróforo, no de marcador).

2. los datos importación y pre-procesamiento

  1. Para pausar o guardar a lo largo de esta tubería de análisis, utilice el botón Guardar espacio de trabajo en la parte inferior izquierda del programa para guardar el espacio de trabajo como un '. ESTERA ' archivo que puede ser cargada más adelante mediante la tecla de Espacio de carga de trabajo . No ejecute más de una instancia del programa a la vez. Por lo tanto, al cargar un nuevo espacio de trabajo, asegúrese de que compruebe que no hay ninguna otra instancia de ExCYT funcionando.
  2. Para comenzar a tubería de análisis, en primer lugar Seleccione tipo de citometría citometría de flujo o citometría de masas – CYTOF, bajo el número seleccione Parámetros de selección de archivo de eventos a la muestra del archivo (para este ejemplo uso 2.000). Una vez que los datos se ha importado con éxito, aparecerá un cuadro de diálogo informándole al usuario que los datos han sido importados con éxito.
  3. Presione el botón de Compensación automática para llevar a cabo un paso de compensación automática opcional, como hecho por Bagwell & Adams9. Seleccione el directorio que contiene solo manchas. Seleccionar la muestra sin manchas en el diálogo de la interfaz de usuario.
    1. Colocar una puerta del lado/transhorizonte en cualquiera de las muestras en este directorio que se utilizará para seleccionar eventos para calcular la matriz de compensación. Se recomienda utilizar la muestra sin manchas para este propósito. En este punto, se ha implementado un algoritmo para establecer umbrales consistentes enel percentil 99 de la muestra sin mancha para definir sucesos positivos en cada una de las manchas solo para calcular la matriz de compensación . Cuando esto haya terminado, un cuadro de diálogo informará al usuario que la compensación se ha realizado.
  4. A continuación, presione La puerta población y seleccionar las poblaciones de células de interés, como es la Convención en el flujo cytometry análisis. Cuando se selecciona la población de células, introduzca número de porcentaje de análisis posteriores eventos (en este tipo de eventos 10.000).
  5. A continuación, seleccione el número canales que se utilizarán para el análisis en el cuadro de lista a la derecha de la caja de preprocesamiento (utilizar los canales específicos que se muestra en el ejemplo).

3. t-SNE análisis

  1. Pulse el botón t-SNE para tener el programa comenzar comienzo a calcular el conjunto de datos de dimensionalidad reducida para la visualización en la ventana debajo del botón t-SNE. Para guardar la imagen de t-SNE, pulsa Guardar imagen de TSNE. En una máquina con 8 CPU @ 3,4 GHz y 8 GM RAM este paso debe tomar aproximadamente 2 minutos para 10.000 eventos, 10 minutos para 50.000 eventos y a 20 minutos de 100.000 eventos.
  2. Para crear un heatmap de SNE ' t ', como se ve en varios CYTOF publicaciones10,11, seleccione una opción del menú Marcador específico t-SNE (usar los marcadores específicos CD64 o CD3 como se muestra en el ejemplo). Una figura se abrirá mostrando una representación de mapa de calor de la parcela t-SNE que puede guardarse para la generación de la figura.
  3. Seleccionar áreas de interés en las parcelas t-SNE por parte del usuario más abajo análisis utilizando el botón de la Puerta t-SNE .

4. cluster Analysis

  1. Para comenzar el análisis de clustering, seleccione una opción en el Método de Clustering listbox (en este ejemplo nos DBSCAN con un factor de la distancia de 5 en el diálogo de la caja a la derecha del cuadro de lista). Presione el botón de Cluster .
  2. Utilice uno de las siguientes opciones para algoritmos de clustering automatizados encontradas en el panel de 'Parámetros automatizado de Clustering':
    1. Duro KMEANS (en t-SNE): aplicar k-means clustering para los datos de 2 dimensiones reducido t-SNE y requiere el número de clusters para el algoritmo12.
    2. Duro KMEANS (sobre datos de HD): aplicar k-significa arracimar de los datos multidimensional originales que fue dado al algoritmo t-SNE. Una vez más, el número de clusters debe ser proporcionado para el algoritmo.
    3. DBSCAN: Aplicar el método de agrupamiento de clustering, llamado basado en densidad espacial Clustering de aplicaciones con ruido13 que grupos de los datos de 2 dimensiones reducido t-SNE y requiere un factor de distancia adimensional que determina el tamaño general de la racimos. Este tipo de algoritmo de agrupamiento es idóneo para cluster la reducción de la t-SNE como es capaz de cluster no esferoidales de cluster que a menudo están presentes en la representación de t reducido-SNE. Además, debido a que opera sobre los datos de 2 dimensiones, es uno de los algoritmos de agrupamiento más rápido.
    4. Clustering jerárquico: Aplicar el método de agrupamiento jerárquico convencional los datos multidimensional donde se calcula la matriz de distancia euclidiana entera entre todos los eventos antes de proporcionar el algoritmo de un factor de distancia que establece el tamaño del cluster.
    5. Gráfico de la red- Base: Aplicar un método de agrupamiento que se ha introducido recientemente en análisis de datos de citometría de flujo cuando hay subpoblaciones raras que el usuario quiere detectar11,14. Este método se basa en la primera creación de un gráfico que determina las conexiones entre todos los eventos en los datos. Este paso consiste en proporcionar un parámetro inicial para crear el gráfico, que es el número de vecinos k-más cercano. Este parámetro generalmente regula el tamaño de los clusters. En este punto, otro cuadro de diálogo aparece preguntando al usuario para emplear uno de 5 algoritmos de clustering que se aplica al gráfico. Estos incluyen 3 opciones para maximizar la modularidad de la gráfica, el método de Danon y un espectral clustering algoritmo14,15,16,17,18. Si uno desea una solución de clustering generalmente más rápidamente, recomendamos arracimar espectral o la maximización de modularidad codiciosos rápido. Mientras que los métodos de maximización de modularidad junto con el método de Danon determinan el número óptimo de clusters, agrupamiento espectral requiere el número de racimos que se dará al programa.
    6. Auto-organizados mapa: Emplear una red neuronal artificial para agrupar los datos multidimensional.
    7. MGM-maximización de la expectativa: crear un modelo gaussiano de mezcla usando técnica de maximización de la expectativa (EM) a los datos multidimensional. 19 este tipo de agrupamiento también requiere que el usuario introducir el número de racimos.
    8. Variacionales inferencia bayesiana para MGM: crear un modelo Gaussian de la mezcla, pero a diferencia de la EM, automáticamente puede determinar el número de la mezcla componentes k.20 mientras que el programa requiere un número de racimos que se dará (más grande que el se esperaba número de clusters), el algoritmo va a determinar el número óptimo.
  3. Para estudiar un área particular de la parcela t-SNE, pulse el botón Seleccionar Cluster manualmente para dibujar un conjunto de clusters definidos por el usuario. De nota, los racimos no pueden compartir a los miembros (es decir, cada evento sólo puede pertenecer al 1 cluster).

5. cluster de filtración

  1. Conjuntos de clusters identificaron ya sea manualmente o a través de uno de los métodos automáticos descritos anteriormente pueden filtrar a través de los siguientes.
    1. Para ordenar los grupos (en el panel Filtro ecualizador ) por cualquiera de los marcadores medidos en el experimento, seleccione una opción en el menú emergente tipo . Para establecer si el orden es ascendente o descendente, presione el botón Ascendente/descendente a la derecha del menú emergente tipo . Esto actualiza la lista de grupos en el listbox 'Racimos (filtración)' y volver a ordenarlos en orden descendente de expresión racimo mediano de ese marcador. El porcentaje que se indica en el cuadro de lista 'Racimos (filtración)' denota el porcentaje de la población que representa este grupo.
    2. Para establecer un umbral mínimo para un grupo dado en un determinado canal, seleccione una opción en el menú emergente de umbral (en este ejemplo nosotros el marcador CD65 y un umbral, a 0.75). Escriba un valor en el cuadro numérico a continuación el gráfico o utilice la barra deslizante para establecer un umbral. Una vez que se establece el umbral, pulse Añadir por encima de umbral o Añadir por debajo de umbral para especificar la dirección del umbral. Una vez que este umbral se ha establecido, se mostrará en el cuadro de umbrales junto al panel de 'Filtro ecualizador' en el marcador, el valor de umbral y la dirección se mostrará por lo que el usuario es consciente de que los umbrales se aplican actualmente. Por último, la parcela t-SNE se actualizará desenfocando racimos que no cumplen los requisitos de la filtración y el listbox 'Racimos (filtración)' se actualizará para mostrar los racimos que cumplan con los requisitos de filtración.
    3. Para establecer un umbral mínimo de frecuencia de un cluster, introduzca un límite numérico en el Grupo umbral de frecuencia (%) la caja en el panel filtro ecualizador (en este ejemplo uso 1%).

6. cluster análisis y visualización

  1. Para seleccionar los racimos para posterior análisis y visualización, seleccione grupos en el cuadro de lista de Clusters (filtración) y pulse el botón de à Seleccione mover al cuadro de lista Grupo analizar .
  2. Para crear heatmaps de racimos, seleccione los grupos de interés en el cuadro de lista Grupo analizar y pulse el botón de Mapa de calor de los racimos . Cuando se presiona este botón, aparecerá una figura que contiene un mapa de calor junto con los dendrogramas de los ejes del racimo y parámetro. El dendrograma en el eje vertical grupo de grupos por los que están estrechamente relacionados y el dendrograma en horizontal eje agrupará marcadores co asociados. Para guardar el mapa de calor, pulse archivo | Configuración de exportación | Exportación.
  3. Para crear un 'Alta trama Dimensional de la caja' o 'Alta dimensiones flujo parcela', seleccione los grupos de interés en el cuadro de lista Grupo analizar y pulse el botón Alta trama Dimensional de la caja o el botón de Alto flujo trama Dimensional . Estas parcelas se pueden utilizar para evaluar visualmente la distribución de dado canales de distintos clusters en todas las dimensiones.
  4. Para mostrar grupos de diagramas de flujo 2D tradicional, seleccione la transformación (lineal, log10, arcsinh) y del canal en el panel Diagrama de flujo convencional y prensa Diagrama de flujo convencional.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Para probar la usabilidad de los ExCYT, hemos analizado un conjunto de datos curado publicado por Chevrier et al. , titulado 'Un inmune Atlas de clara célula Carcinoma Renal' donde el grupo llevó a cabo análisis CyTOF con un amplio panel inmune en muestras tumorales de 73 pacientes11. Dos paneles separados, un panel mieloide y linfoide, se utilizaron para caracterizar fenotípicamente el microambiente tumoral. El objetivo de nuestro estudio fue recapitular los resultados de su t-SNE y cluster análisis, mostrando que ExCYT podría utilizarse para llegar a las mismas conclusiones así como mostrar métodos adicionales de análisis clúster y visualización.

En el manuscrito original, el grupo describió 22 racimos de célula de T, identificados por el panel linfoide y 17 racimos de célula identificados por el panel mieloide. En la figura 3 y figura 4 de la publicación, el grupo muestra heatmaps de racimos, t-SNE parcelas con soluciones de agrupamiento con códigos de colores y t-SNE heatmaps en subpaneles A, B y C. Para realizar el análisis, obtener los datos manualmente cerrados de Cytobank y muestreados 2.000 eventos de cada archivo o tomó el archivo completo si tenía menos de 2.000 eventos, siguiendo la tubería de análisis ilustrada el manuscrito original. En este punto, nos muestra un total de 100.000 eventos mediante nuestro parámetro subresolución posterior bloquea realizó análisis t-SNE y utiliza una variedad de métodos de agrupamiento para explorar los datos de varias maneras.

En primer lugar, examinamos el panel mieloide siguiendo la misma tubería de análisis como el manuscrito original completando el análisis t-SNE y crear heatmaps de los distintos marcadores (Figura 3A). Mientras que el manuscrito original normalizó los heatmaps t-SNE parael percentil 99 de cada marcador , ExCYT no hace este tipo de normalización para su heatmaps. Sin embargo, se observaron similares distribuciones de coexpresión de marcadores como se describe en el manuscrito original. Luego aplicamos un método basado en la red gráfico de agrupamiento de los datos creando el gráfico con 100 vecinos k-más cercano y agrupamiento el gráfico a través de la optimización de la modularidad del gráfico mediante la aplicación rápida-codicioso en ExCYT, donde encontramos 19 las subpoblaciones de células (figura 3B). Al comparar el mapa de calor de estos grupos creada por ExCYT con el mapa de calor publicado en el manuscrito original, observamos que hemos podido identificar grupos similares de células mieloides (figura 3). De nota, el manuscrito original identifica y contrasta dos las subpoblaciones de células mieloides que identificamos en nuestro análisis definida por HLA-DRintCD68intCD64intCD36+CD11b+ (grupo 13) y HLA-DR-+ CD4+CD68+CD64+CD36 CD11b (Cluster 18). Visualización por diagrama de caja multidimensional de estas dos poblaciones reveló diferencias estadísticamente significativas (Mann-Whitney) en los seis marcadores mencionados (figura 1).

A continuación, analizamos el panel linfoide con un enfoque de agrupamiento jerárquico más rápido y más convencional. Este enfoque produjo similares distribuciones marcador vía t-SNE heatmaps (Figura 4A). Además, la agrupación de los datos vía jerárquica clustering (Figura 4B), demostró racimos similares de células linfoides (figura 4). De nota, también se identificó la población de célula de T reguladora única del original manuscrito definida como CD4+CD25+Foxp3++CD127 CTLA-4 (grupo 17) a través de nuestro diagrama de flujo multidimensional (figura 4).

Por último, hemos querido emplear un método dentro de ExCYT rápida y cuantitativamente evaluar cooperación asociaciones entre marcadores. Empezamos utilizando un algoritmo de agrupamiento k-medio duro para colocar 5.000 racimos en los datos de dos dimensiones t-SNE (figura 4E). Luego utilizamos la expresión media de todos los marcadores de todos estos grupos para crear un heatmap de estos racimos (figura 4F). Puesto que estos heatmaps cluster tanto filas como columnas similares, este método de abstraer los datos aplicando una malla fina de clústeres y crear un heatmap nos permite coger co asociaciones fácilmente, tales como la asociación conjunta de Tim 3, PD-1, CD38, y 4-1BB.

Figure 1
Figura 1: tubería de ExCYT y características. (A) ExCYT comienza por importar datos FCS, aplicar compensación opcional, gating y submuestreo al azar antes del análisis aguas abajo. De esta manera se analiza todos los eventos son relevantes para el experimento analizado. reducción de dimensionalidad t-SNE se realiza para visualizar todos los eventos y se pueden generar t-SNE heatmaps para visualizar las distribuciones fenotípicas. Finalmente, una variedad de algoritmos de clustering puede ser aplicada en la transformación del SNE t o datos multidimensional. (B) clasificación y umbralización novedades permiten a los usuarios a rápidamente posiblemente cientos de grupos de interés encontrar. (C) Heatmaps de clusters puede crearse para examinar cómo múltiples clusters de comparar entre sí además de que los marcadores co asocian. (D) novela multidimensional flujo/caja parcelas pueden ser generadas como una forma de bloquear por la espalda los racimos en datos originales apreciando la naturaleza multidimensional de los datos. Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2: interfaz gráfica de usuario de ExCYT: ExCYT interfaz gráfica de usuario permite una optimizada trabajo flujo trabajando de izquierda a derecha del panel como el usuario importa sus datos, realiza la reducción de dimensionalidad t-SNE, agrupamiento y análisis de conglomerados final y visualización. Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3: Recapitulación de las subpoblaciones mieloides de Chevrier et al. (A) Token t-SNE heatmaps de trama mieloide panel (B) t-SNE de color del panel mieloide codificadas por algoritmo gráfico de la red (C) Heatmap de racimos identificados por solución de clustering en panel mieloide (D) comparativo alta diagrama de caja dimensional comparación contraste mieloides subpoblaciones (grupos 13 y 18) se hace referencia en el manuscrito original haga clic aquí para ver una versión más grande de esta figura.

Figure 4
Figura 4: Recapitulación de las subpoblaciones linfoides de Chevrier et al. (A) Token t-SNE heatmaps de trama panel linfoide (B) t-SNE de color del panel linfoide codificadas por algoritmo de agrupamiento jerárquico (C) Heatmap de racimos identificados por solución de clustering de alta dimensiones flujo de panel linfoide (D) parcela de población identificado células T reguladoras (grupo 17) en el manuscrito original (E) solución de Clustering dura 5.000 cluster k-significa Análisis de datos de t-SNE mapa de calor (F) de racimos identificados por la solución de clustering de k-means en linfoide panel que muestra marcador Co las asociaciones. Haga clic aquí para ver una versión más grande de esta figura.

Jajaja Descripción Nombre (en la interfaz gráfica de usuario)
1 Seleccione tipo de citometría de NA
2 Submuestreo aleatorio de datos brutos NA
3 Seleccionar los archivos para el análisis Seleccione los archivos
4 Compensación automática de datos en directorio de manchas solo para software de base Compensación automática
5 Compuerta para seleccionar eventos para SNE t y análisis de clustering Población de la puerta
6 Submuestreo aleatorio de gated datos (número absoluto) NA
7 Submuestreo aleatorio de gated datos (% de población cerrada) NA
8 Seleccionar canales para análisis NA
9 Reducción de dimensionalidad de correr t-SNE t-SNE
10 Ventana de t-SNE NA
11 Guardar espacio de trabajo Guardar espacio de trabajo
12 Espacio de carga de trabajo Espacio de carga de trabajo
13 Crear mapa de calor t-SNE en seleccionar marcador NA
14 Puerta t-SNE que volver a hacer análisis de t-SNE de seleccionar población Puerta t-SNE
15 Guardar la ventana t-SNE como imagen Guardar imagen TSNE
16 Seleccione el algoritmo de Clustering Método de agrupamiento
17 Ingrese el parámetro de agrupamiento para algoritmo NA
18 Análisis de conglomerados Cluster
19 Dibujar los racimos manualmente Seleccionar Cluster manualmente
20 Claro todos los clústeres para rehacer el análisis de conglomerados Claro los racimos
21 Mostrar los racimos en las actuales condiciones de filtro Racimos (filtración)
22 Quitar grupos selectos de listbox Cluster Análisis Eliminar <--
23 Añadir racimo a racimo analizar listbox Seleccione-->--
24 Crear mapa de calor convencional de todos los eventos en el análisis Mapa de calor de los acontecimientos
25 Racimos de ordenar por seleccionar marcador Tipo
26 Umbral establecido por seleccionar marcador Umbral de
27 Crear mapa de calor convencional de selección de los racimos de listbox Cluster Análisis HeatMap de racimos
28 Voltear orden de tipo Ascendente y descendente
29 Claro todos los umbrales Claro todos los umbrales
30 Umbral de frecuencia determinado para clústeres Grupo umbral de frecuencia (%)
31 Lista de los umbrales actuales en listbox 'Racimos (filtración)' Umbrales de
32 Diagrama de caja Dimensional alta Diagrama de caja Dimensional alta
33 Parcela de alto flujo Dimensional Parcela de alto flujo Dimensional
34 Parámetro de eje horizontal para el diagrama de flujo convencional NA
35 Parámetro de eje vertical para el diagrama de flujo convencional NA
36 Transformación de datos para diagrama de flujo convencional de eje horizontal NA
37 Transformación de datos para el diagrama de flujo convencional de eje vertical NA
38 Crear diagrama de flujo convencional Diagrama de flujo convencional
39 Mostrar grupos de análisis NA

Tabla 1: Resumen de todos las funciones presentes en el ExCYT GUI

Nombre del paquete de Software ExCYT CYT FCS Express flowCore openCyto FlowMeans
Tipo de programa MATLAB MATLAB Aplicación independiente R R R
Precio al usuario Gratis Gratis $1.000 Gratis Gratis Gratis
Interfaz gráfica de usuario No No No
Técnicas de reducción de la dimensionalidad t-SNE t-SNE, PCA t-SNE, PCA, espada ninguno ninguno ninguno
Algoritmos de clustering K-Means
DBSCAN
Clustering jerárquico
Mapa auto organizado
Métodos basados en gráfico de red múltiples
MGM - EM
MGM - variacional inferencia bayesiana
K-Means
MGM - EM
Gráfico de red único basado en método (Phenograph)
K-Means ninguno automatización de flujo de trabajo manual bloquea K-Means
Capacidad de filtro tipo Clusters No No No No No
Parcelas alto flujo Dimensional No No No No No

Tabla 2: Resumen de soluciones de análisis de citometría de flujo asistido por Software

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Aquí os presentamos ExCYT, una interfaz de usuario gráfica novela ejecutando algoritmos basados en MATLAB para simplificar el análisis de datos de citometría de alta dimensión, permitiendo que a las personas con ninguna experiencia en programación para implementar lo último en datos multidimensional algoritmos de análisis. La disponibilidad de este software a la comunidad científica permitirá a los científicos a explorar sus datos de citometría de flujo en un flujo de trabajo intuitivo y sencillo. A través de la realización de reducción de dimensionalidad t-SNE, aplicando un método de agrupamiento, siendo capaz de tipo filtro a través de estos grupos rápidamente y heatmaps flexible, personalizable y diagramas de flujo/caja multidimensional, los científicos podrán no sólo entender las subpoblaciones definidas únicamente en sus muestras pero serán capaces de crear visualizaciones que están intuitivo y fácil de entender por sus colegas.

Mientras que el programa es flexible en el manejo de una variedad de tipos de datos (flujo convencional citometría vs citometría de masas), hay algunas consideraciones de utilidad óptimo del programa. La primera de ellas es con respecto a la calidad de los datos, específicamente de datos de citometría de flujo. Compensación adecuada y resolución de superposición de espectros de emisión es de suma importancia. Datos mal compensados sin darse cuenta pueden conducir a falsas asociaciones Co de marcadores y la formación de grupos que no son de verdadera significación biológica. Por lo tanto, es altamente recomendable que los datos de entrada están de una calidad de sonido antes de continuar con el análisis de t-SNE y posteriores análisis. Además, el algoritmo de compensación automática en ExCYT requiere las manchas claro solos para todos los canales para calcular con precisión los parámetros de compensación.

Otra consideración importante para el uso de ExCYT es al concatenar varios archivos FCS en un análisis (como se demuestra en este manuscrito), deben ser comparables en todos los canales. En primer lugar, esto significa que el mismo panel tiene que usarse en todas las muestras y que no hay ninguna deriva entre muestras en todos los canales. Por ejemplo, si se fuera a leer dos muestras en días separados y CD8 manchada en FITC en días pero la tensión de la citometría fue diferente en un día, dando por resultado una población CD8 ligeramente desplazada, uno podría generar clusters falso en los análisis posteriores , como se generó este cambio como una función de la variación del instrumento y no debido a la importancia biológica. Mientras que las versiones futuras de ExCYT pueden ser capaces de normalizar las muestras a sus manchas sola, en este punto, cuidadosa debe hacerse que archivos FCS pueden compararse entre sí antes de importar en ExCYT.

Finalmente, el proceso de clustering no es uno que es absoluta/rígido. Parámetros y algoritmos de clustering pueden generar diferentes soluciones de clustering. Si la solución del algoritmo apropiada es para que el usuario determinar sintetizando su conocimiento de la biología con la solución de clustering. Por ejemplo, cuando la comprensión del entorno inmune de los tumores, uno puede estar interesado en racimos macroscópicos (es decir, T células vs B vs mieloide células) mientras que otros pueden estar interesados en subpoblaciones de agrupaciones macroscópicas. La resolución de los clusters está determinada por el usuario y por lo tanto, no solo solución de clustering es 'correcta'. Esta es una de las principales ventajas del uso de las parcelas de alto flujo dimensional disponible en ExCYT. La capacidad de visualizar la distribución de un determinado grupo a través de los canales puede ayudar al usuario a determinar si han agrupados en no sólo un biológicamente relevante propósito pero de una manera que es relevante a la pregunta científica en el experimento. Mientras que nuestro objetivo es proporcionar una amplia gama de métodos utilizados en la literatura datos de citometría de flujo multidimensional de racimo mientras que proporciona métodos adicionales de clustering, recomendamos el uso de métodos como medios k DBSCAN para explorar rápidamente los datos a través iterando en tamaño y número de cluster y hacia red gráfica y modelo gaussian-mezcla enfoques enfoques más robusto pero más desperdiciadores de tiempo.

Teniendo en cuenta estas consideraciones, ExCYT sigue siendo una herramienta altamente flexible y valiosa para explorar datos de citometría dimensional alta y ofrece características únicas, diferenciando de otros paquetes disponibles para llevar a cabo este tipo de análisis (tabla 2) . ExCYT se distingue en primer lugar, sobre enfoques de análisis de citometría de más flujo utilizando reducción de dimensionalidad y algoritmos de clustering por su capacidad para ser utilizado sin ningún conocimiento de programación/scripting. Además, agregando muchos algoritmos de clustering citados a lo largo de la literatura, creemos que ofrecemos la mayoría de las opciones de agrupamiento de datos. Por último, nuestra exclusiva función de clúster filtración y clasificación junto con la pantalla a través de diagramas de flujo dimensional alta novela, permite a los usuarios explorar las características de sus racimos de forma rápida y eficiente, haciendo el proceso de 'descubrir' rara subpoblaciones simples y eficientes.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

Los autores no tienen ninguna agradecimientos.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Retracción número 143 citometría de flujo análisis de la multidimensional t-SNE clustering mapas reducción de la dimensionalidad del calor
ExCYT: Una interfaz gráfica de usuario para simplificar el análisis de datos multidimensional de citometría de
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter