Summary

ExCYT: Uma Interface gráfica do usuário para racionalizar a análise de dados de alta dimensão Cytometry

Published: January 16, 2019
doi:

Summary

ExCYT é um baseado em MATLAB Graphical User Interface (GUI) que permite aos usuários analisar seus dados de citometria de fluxo via comumente empregadas técnicas de análise dos dados de alta dimensão incluindo redução de dimensionalidade através de t-PND, uma variedade de automático e manual fluxo de alta dimensão romance, heatmaps e métodos de clustering parcelas.

Abstract

Com o advento dos citômetros capazes de medir um número crescente de parâmetros, os cientistas continuam a desenvolver painéis maiores fenotipicamente explorar as características de suas amostras celulares. No entanto, estes avanços tecnológicos rendem elevado-dimensional conjuntos de dados que se tornaram cada vez mais difíceis de analisar objetivamente dentro tradicionais manual programas associados. A fim de melhor analisar e apresentar dados, cientistas parceiro com bioinformaticians com experiência em análise de dados de alta dimensão para analisar seus dados de citometria de fluxo. Enquanto esses métodos foram mostrados para ser altamente valiosa no estudo de citometria de fluxo, eles ainda têm a ser incorporados em um pacote simples e fácil de usar para os cientistas que não possuem conhecimentos computacionais ou programação. Para atender a essa necessidade, nós desenvolvemos ExCYT, uma baseada em MATLAB Graphical User Interface (GUI) que simplifica a análise dos dados de citometria de fluxo elevado-dimensional implementando técnicas analíticas comumente empregadas para a inclusão de dados de alta dimensão redução de dimensionalidade por t-PND, uma variedade de métodos de clusterização automáticos e manuais e heatmaps novo alta dimensão fluxo de parcelas. Além disso, ExCYT fornece opções associadas tradicionais de selecionadas populações de interesse para mais t-PND e análise, bem como a capacidade de aplicar gates diretamente na t-PND parcelas de clustering. O software fornece a vantagem adicional de trabalhar com qualquer compensada ou descompensados arquivos FCS. Caso a compensação pós aquisição é necessária, o usuário pode escolher fornecer o programa, um diretório único manchas e uma amostra de imaculado. O programa detecta eventos positivos em todos os canais e usa esses dados selecionados mais objetivamente, calcular a matriz de compensação. Em resumo, ExCYT fornece um pipeline de análise abrangente para pegar dados de citometria de fluxo na forma de arquivos FCS e permitir que qualquer indivíduo, independentemente de formação computacional, para usar as últimas abordagens algorítmicas na compreensão de seus dados.

Introduction

Avanços em citometria de fluxo, bem como o advento da citometria de massa permitiu que os médicos e cientistas para rapidamente identificar e caracterizar fenotipicamente biologicamente e clinicamente interessantes amostras com novos níveis de resolução, criando grandes conjuntos de dados altamente dimensionais que são informações ricas1,2,3. Enquanto os métodos convencionais para a análise de dados de citometria de fluxo como gating manual têm sido mais simples para experiências onde existem alguns marcadores e esses marcadores têm populações visualmente perceptíveis, esta abordagem pode falhar gerar Resultados reprodutíveis ao analisar conjuntos de dados de dimensão superior ou aqueles com marcadores em um espectro de coloração. Por exemplo, em um estudo multi-institucional, onde intra celular coloração (ICS) ensaios foram sendo realizados para avaliar a reprodutibilidade de dosar respostas de célula T de antígeno-específicas, apesar de boa precisão interlaboratorial, análise, particularmente gating, introduziu uma fonte significativa de variabilidade4. Além disso, o processo de retenção manualmente de população de interesses, além de ser altamente subjetivo é altamente consumindo tempo e mão de obra intensiva. No entanto, o problema de analisar conjuntos de dados de alta dimensão de maneira robusta, eficiente e oportuna não é um novo para as Ciências da pesquisa. Estudos de expressão do gene muitas vezes geram conjuntos de dados extremamente elevado-dimensional (muitas vezes na ordem de centenas de genes) onde formulários manuais de análise seria simplesmente inviável. Para obviar a análise desses conjuntos de dados, tem havido muito trabalho no desenvolvimento de ferramentas de bioinformatic para analisar a expressão de gene dados5. Essas abordagens algorítmicas só recentemente adoptaram-na análise dos dados de citometria como o número de parâmetros aumentou e têm provado para ser muito útil na análise destes conjuntos de dados dimensional elevada6,7.

Apesar da geração e aplicação de uma variedade de algoritmos e pacotes de software que permitem que os cientistas aplicar essas abordagens de bioinformatic alta dimensão aos seus dados de citometria de fluxo, estas técnicas analíticas ainda permanecem em grande parte não utilizadas. Embora possa haver uma variedade de fatores que têm limitado a adopção generalizada dessas abordagens para citometria dados8, o obstáculo principal suspeita no uso dessas abordagens pelos cientistas, é uma falta de conhecimento computacional. Na verdade, muitos destes pacotes de software (isto é, flowCore, flowMeans e OpenCyto) são escritos para ser implementado em linguagens de programação como R que ainda exigem conhecimento de programação substantivo. Pacotes de software, tais como FlowJo tem encontrado favor entre os cientistas, devido à simplicidade de uso e natureza ‘plug-n-play’, bem como a compatibilidade com o sistema operacional do PC. A fim de fornecer a variedade de técnicas analíticas aceitas e valiosas para a programação de cientista desconhecido, nós desenvolvemos ExCYT, uma interface de usuário gráfica (GUI) que pode ser facilmente instalada em um PC/Mac que puxa muitas das mais recentes técnicas incluindo a redução de dimensionalidade para visualização intuitiva, uma variedade de métodos de clusterização citado na literatura, juntamente com novos recursos para explorar a saída destes algoritmos com parcelas de fluxo/caixa alta dimensão heatmaps e romance de clustering.

ExCYT é uma interface de usuário gráfica criada em MATLAB e, portanto, pode também ser executado dentro MATLAB diretamente ou um instalador é fornecido que pode ser usado para instalar o software em qualquer PC/Mac. O software está disponível em https://github.com/sidhomj/ExCYT. Apresentamos um protocolo detalhado para saber como importar dados, pre-processá-lo, realizar redução de dimensionalidade de t-PND, dados do cluster, classificar & filtrar conjuntos com base em preferências do usuário e exibir informações sobre os clusters de interesse via heatmaps e romance fluxo/caixa alta dimensão parcelas (Figura 1). Eixos em parcelas t-PND são arbitrários e em unidades arbitrárias e como tal, como nem sempre mostrado nas figuras a simplicidade do usuário da interface. A coloração de pontos de dados no “t-PND Heatmaps” é do azul ao amarelo, com base no sinal do marcador indicado. Em soluções de cluster, a cor do ponto de dados se baseia arbitrário número de cluster. Todas as partes do fluxo de trabalho podem ser realizadas no painel único GUI (Figura 2 & tabela 1). Finalmente, vamos demonstrar o uso de ExCYT em dados publicados anteriormente, explorando a paisagem imune de carcinoma de células renais na literatura, também analisada com métodos similares. O conjunto de dados de exemplo que nós usamos para criar os números neste manuscrito juntamente com o protocolo abaixo pode ser encontrado em https://premium.cytobank.org/cytobank/projects/875, aquando do registo de uma conta.

Protocol

1. coletar e preparar dados Cytometry Coloca todas as manchas única em uma pasta por si mesmos e o rótulo com o nome de canal (por fluoróforo, não marcador). 2. pré-processamento & importação de dados Para pausar ou salvar em todo esse pipeline de análise, use o botão de Salvar espaço de trabalho no canto inferior esquerdo do programa para salvar o espaço de trabalho como um ‘. MAT’ arquivo que mais tarde pode ser carregado através do bot?…

Representative Results

A fim de testar a usabilidade de ExCYT, analisamos um conjunto de dados com curadoria, publicado por Chevrier et al . intitulada ‘An imune Atlas de claro Cell Carcinoma Renal’ onde o grupo realizou análises de CyTOF com um extenso painel imune em tumor amostras colhidas de 73 pacientes de11. Dois painéis separados, um painel de mieloide e linfoide, foram usados para caracterizar fenotipicamente o microambiente do tumor. O objetivo do nosso estudo foi rec…

Discussion

Aqui nós apresentamos ExCYT, interface gráfica do usuário do romance executando algoritmos baseados em MATLAB para simplificar a análise de dados de alta dimensão citometria, permitindo que os indivíduos com nenhuma experiência em programação para implementar o mais recente de dados de alta dimensão algoritmos de análise. A disponibilidade deste software para a comunidade científica mais ampla permitirá que os cientistas explorar seus dados de citometria de fluxo em um fluxo de trabalho intuitivo e simples. …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Os autores têm sem agradecimentos.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video