Summary

Optimización para la secuenciación y el análisis de muestras de FFPE-ARN degradadas

Published: June 08, 2020
doi:

Summary

Este método describe los pasos para mejorar la calidad y la cantidad de datos de secuencia que se pueden obtener a partir de muestras de ARN incrustadas de parafina fija de formalina (FFPE). Describimos la metodología para evaluar con mayor precisión la calidad de las muestras de FFPE-RNA, preparar bibliotecas de secuenciación y analizar los datos de muestras de ARN FFPE.

Abstract

El análisis de la expresión génica mediante la secuenciación de ARN (RNA-seq) permite obtener información única sobre muestras clínicas que pueden conducir potencialmente a una comprensión mecanicista de la base de diversas enfermedades, así como mecanismos de resistencia y/o susceptibilidad. Sin embargo, los tejidos FFPE, que representan el método más común para preservar la morfología tisular en muestras clínicas, no son las mejores fuentes para el análisis de perfiles de expresión génica. El ARN obtenido de tales muestras a menudo se degrada, fragmenta y se modifica químicamente, lo que conduce a bibliotecas de secuenciación subóptimas. A su vez, estos generan datos de secuencia de mala calidad que pueden no ser confiables para el análisis de expresión génica y el descubrimiento de mutaciones. Con el fin de aprovechar al máximo las muestras de FFPE y obtener los mejores datos posibles de muestras de baja calidad, es importante tomar ciertas precauciones mientras se planifica el diseño experimental, se preparan bibliotecas de secuenciación y durante el análisis de datos. Esto incluye el uso de métricas adecuadas para un control preciso de la calidad de la muestra (QC), la identificación de los mejores métodos para varios pasos durante la generación de la biblioteca de secuenciación y el control de calidad cuidadoso de la biblioteca. Además, la aplicación de herramientas y parámetros de software correctos para el análisis de datos de secuencia es fundamental para identificar artefactos en los datos de ARN-seq, filtrar la contaminación y lecturas de baja calidad, evaluar la uniformidad de la cobertura génica y medir la reproducibilidad de los perfiles de expresión génica entre réplicas biológicas. Estos pasos pueden garantizar una alta precisión y reproducibilidad para el perfilado de muestras de ARN muy heterogéneas. Aquí describimos los diversos pasos para el control de calidad de la muestra, la preparación de la biblioteca y el control de calidad, la secuenciación y el análisis de datos que pueden ayudar a aumentar la cantidad de datos útiles obtenidos de ARN de baja calidad, como el obtenido de los tejidos FFPE-RNA.

Introduction

El uso de enfoques de secuenciación de próxima generación nos ha permitido obtener una gran cantidad de información de varios tipos de muestras. Sin embargo, las muestras antiguas y mal conservadas siguen siendo inviables para los métodos de uso común para generar datos de secuencia y a menudo requieren modificaciones en protocolos bien establecidos. Los tejidos FFPE representan un tipo de muestra que ha sido ampliamente utilizado para muestras clínicas1,2,3. Mientras que la preservación de FFPE mantiene la morfología tisular, los ácidos nucleicos en los tejidos FFPE generalmente exhiben una amplia gama de daño y degradación, lo que dificulta la recuperación de la información genómica que puede conducir a información importante sobre los mecanismos moleculares subyacentes a diversos trastornos.

Los datos de expresión génica generados por la secuenciación de ARN a menudo son fundamentales para estudiar los mecanismos de enfermedad y resistencia y complementan el análisis de mutaciones del ADN. Sin embargo, el ARN es más susceptible a la degradación, lo que hace más difícil generar datos precisos de expresión génica a partir de tejidos FFPE. Además, debido a que la amplia disponibilidad y asequibilidad de la secuenciación es relativamente reciente, los especímenes más antiguos a menudo no se almacenaban en condiciones necesarias para preservar la integridad del ARN. Algunos de los problemas de las muestras de FFPE incluyen la degradación del ARN debido a la incrustación en la parafina, la modificación química del ARN que conduce a la fragmentación o refractoridad a los procesos enzimáticos necesarios para la secuenciación, y la pérdida de las colas de poli-A, limitando la aplicabilidad del oligo-dT como imprimación para la transcriptasa inversa4. Otro desafío es la manipulación/almacenamiento de muestras de FFPE en condiciones subóptimas, lo que puede conducir a una mayor degradación de moléculas lábiles como el ARN en los tejidos5. Esto es especialmente relevante para muestras más antiguas que pueden haber sido recogidas en un momento en que no se anticipó el análisis de expresión génica mediante secuenciación de ARN para las muestras. Todo esto conduce a una menor calidad y cantidad del ARN extraído disponible para generar datos de secuencia útiles. La baja probabilidad de éxito, combinada con el alto costo de secuenciación, ha disuadido a muchos investigadores de tratar de generar y analizar datos de expresión génica a partir de muestras de FFPE potencialmente útiles. Algunos estudios realizados en los últimos años han demostrado la usabilidad de los tejidos FFPE para el análisis de expresión génica2,6,7,8,9, aunque para menos y / o muestras más recientes.

Como estudio de viabilidad, utilizamos ARN extraído de muestras de tejido tumoral FFPE de tres repositorios de tejidos residuales de registros de cáncer de vigilancia, epidemiología y resultados finales (SEER) para la secuenciación de ARN y el análisis de expresión génica10. Adquiridos en laboratorios de patología clínica, los tejidos FFPE de adenocarcinomas monovariesos ováricos de alto grado se almacenaron de 7 a 32 años en condiciones variables antes de la extracción de ARN. Debido a que en la mayoría de los casos estos bloques se habían almacenado en diferentes sitios durante años sin la expectativa de ningún análisis genético sensible en el futuro, no se había tenido mucho cuidado para preservar los ácidos nucleicos. Por lo tanto, la mayoría de las muestras exhibieron ARN de mala calidad, con una gran proporción de muestras contaminadas con bacterias. Sin embargo, pudimos realizar la cuantificación genética, medir la uniformidad y continuidad de la cobertura génica, y realizar el análisis de correlación de Pearson entre réplicas biológicas para medir la reproducibilidad. Basándonos en un conjunto de paneles genéticos de firma clave, comparamos las muestras de nuestro estudio con los datos de The Cancer Genome Atlas (TCGA) y confirmamos que aproximadamente el 60% de las muestras tenían perfiles de expresión génicacomparables 11. Basándonos en la correlación entre varios resultados de control de calidad y metadatos de ejemplo, identificamos métricas clave de control de calidad que tienen un buen valor predictivo para identificar muestras que son más propensas a generar datos de secuencia utilizables11.

Aquí describimos la metodología utilizada para la evaluación de la calidad del FFPE-ARN, la generación de bibliotecas de secuenciación a partir de muestras de ARN extraídos y el análisis bioinformático de los datos de secuenciación.

Protocol

1. Evaluación de la cantidad y calidad del ARN Seleccione las muestras FFPE según criterios predefinidos y extraiga el ARN utilizando un método adecuado (por ejemplo, kit de extracción de ácido FFPE-nuclei, Tabla de materiales).NOTA: Hay varios métodos diferentes disponibles para la extracción de ARN FFPE, incluyendo los nuevos métodos de microdisección que pueden trabajar con muy poco tejido y extraer ARN12,13,,<sup class=…

Representative Results

La metodología descrita anteriormente se aplicó a 67 muestras de FFPE que se habían almacenado en una variedad de condiciones diferentes durante 7 a 32 años (la mediana de tiempo de almacenamiento de muestras fue de 17,5 años). Los resultados del conjunto de datos y el análisis presentados aquí fueron descritos y publicados previamente en Zhao et al.11. Al comprobar la calidad de la muestra como se describió anteriormente (es decir, los seguimientos de ejemplo en la Fi…

Discussion

El método descrito aquí describe los pasos principales necesarios para obtener buenos datos de secuencia de muestras de ARN FFPE. Los principales puntos a tener en cuenta con este método son: (1) Asegúrese de que el ARN se conserva lo mejor posible después de la extracción minimizando el manejo de la muestra y los ciclos de congelación y descongelación. Las alícuotas de control de calidad separadas son muy útiles. (2) Utilice una métrica de control de calidad que sea mejor para el conjunto de muestras dado. Lo…

Declarações

The authors have nothing to disclose.

Acknowledgements

Estamos agradecidos a la Dra. Danielle Carrick (División de Control del Cáncer y Ciencias de la Población, Instituto Nacional del Cáncer) por su ayuda continua, especialmente para iniciar este estudio, proporcionarnos las muestras, y por sugerencias útiles durante el análisis de datos. Agradecemos sinceramente a todos los miembros del Centro de Secuenciación de CCR en el Laboratorio Nacional Frederick para la Investigación del Cáncer por su ayuda durante la preparación y secuenciación de muestras, especialmente a Brenda Ho por su ayuda en la muestra de control de calidad, Oksana Alemán para la biblioteca QC, Tatyana Smirnova para ejecutar los secuenciadores. También nos gustaría agradecer a Tsai-wei Shen y Ashley Walton en Sequencing Facility Bioinformatics Group por ayudar con el análisis de datos y la implementación del oleoducto RNA-seq. También agradecemos a CCBR y NCBR por la asistencia con el desarrollo de la canalización de análisis de RNaseq y las mejores prácticas.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

Referências

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)
check_url/pt/61060?article_type=t

Play Video

Citar este artigo
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video