Summary

अवक्रमित एफएफपीई-आरएनए नमूनों के अनुक्रमण और विश्लेषण के लिए अनुकूलन

Published: June 08, 2020
doi:

Summary

यह विधि अनुक्रम डेटा की गुणवत्ता और मात्रा में सुधार करने के लिए कदमों का वर्णन करती है जिसे फॉर्मेलिन-फिक्स्ड पैराफिन-एम्बेडेड (एफएफपीई) आरएनए नमूनों से प्राप्त किया जा सकता है। हम एफएफपीई-आरएनए नमूनों की गुणवत्ता का अधिक सटीक आकलन करने, अनुक्रमण पुस्तकालयों को तैयार करने और एफएफपीई-आरएनए नमूनों के आंकड़ों का विश्लेषण करने की कार्यप्रणाली का वर्णन करते हैं।

Abstract

आरएनए अनुक्रमण (आरएनए-सीक्यू) द्वारा जीन अभिव्यक्ति विश्लेषण नैदानिक नमूनों में अद्वितीय अंतर्दृष्टि को सक्षम बनाता है जो संभावित रूप से विभिन्न रोगों के आधार के साथ-साथ प्रतिरोध और/या संवेदनशीलता तंत्र की मशीनी समझ का कारण बन सकता है। हालांकि, FFPE ऊतकों, जो नैदानिक नमूनों में ऊतक आकृति विज्ञान के संरक्षण के लिए सबसे आम विधि का प्रतिनिधित्व करते हैं, जीन अभिव्यक्ति प्रोफाइलिंग विश्लेषण के लिए सबसे अच्छा स्रोत नहीं हैं । ऐसे नमूनों से प्राप्त आरएनए को अक्सर अपमानित, खंडित और रासायनिक रूप से संशोधित किया जाता है, जिससे पुस्तकालयों को उप-इष्टतम अनुक्रमण होता है। बदले में, ये खराब गुणवत्ता अनुक्रम डेटा उत्पन्न करते हैं जो जीन अभिव्यक्ति विश्लेषण और उत्परिवर्तन खोज के लिए विश्वसनीय नहीं हो सकते हैं। एफएफपीई नमूनों का सबसे अधिक बनाने और कम गुणवत्ता वाले नमूनों से सर्वोत्तम संभव डेटा प्राप्त करने के लिए, प्रायोगिक डिजाइन की योजना बनाते समय, अनुक्रमण पुस्तकालयों की तैयारी करते समय और डेटा विश्लेषण के दौरान कुछ सावधानियां बरतना महत्वपूर्ण है। इसमें सटीक नमूना गुणवत्ता नियंत्रण (क्यूसी) के लिए उपयुक्त मैट्रिक्स का उपयोग, अनुक्रमण पुस्तकालय उत्पादन के दौरान विभिन्न चरणों के लिए सर्वोत्तम तरीकों की पहचान करना, और सावधान लाइब्रेरी क्यूसी शामिल है। इसके अलावा, आरएनए-सीक्यू डेटा में कलाकृतियों की पहचान करने, संदूषण और निम्न गुणवत्ता वाले पढ़ने, जीन कवरेज की एकरूपता का आकलन करने और जैविक प्रतिकृतियों के बीच जीन अभिव्यक्ति प्रोफाइल की प्रजनन क्षमता को मापने के लिए अनुक्रम डेटा विश्लेषण के लिए सही सॉफ्टवेयर उपकरण और मापदंडों को लागू करना महत्वपूर्ण है। ये कदम बहुत विषम आरएनए नमूनों की प्रोफाइलिंग के लिए उच्च सटीकता और प्रजनन क्षमता सुनिश्चित कर सकते हैं। यहां हम नमूना क्यूसी, लाइब्रेरी तैयार करने और क्यूसी, अनुक्रमण और डेटा विश्लेषण के लिए विभिन्न चरणों का वर्णन करते हैं जो कम गुणवत्ता वाले आरएनए से प्राप्त उपयोगी डेटा की मात्रा को बढ़ाने में मदद कर सकते हैं, जैसे कि एफएफपीई-आरएनए ऊतकों से प्राप्त।

Introduction

अगली पीढ़ी के अनुक्रमण दृष्टिकोणों के उपयोग ने हमें विभिन्न प्रकार के नमूनों से जानकारी का खजाना बीनने में सक्षम बनाया है । हालांकि, पुराने और खराब संरक्षित नमूने अनुक्रम डेटा उत्पन्न करने के आमतौर पर उपयोग किए जाने वाले तरीकों के लिए असाध्य रहते हैं और अक्सर अच्छी तरह से स्थापित प्रोटोकॉल में संशोधनों की आवश्यकता होती है। एफएफपीई ऊतक ऐसे नमूना प्रकार का प्रतिनिधित्व करते हैं जिनका नैदानिक नमूनों के लिए व्यापक रूप से उपयोग किया गया है1,2,,3. जबकि एफएफपीई संरक्षण ऊतक आकृति विज्ञान को बनाए रखता है, एफएफपीई ऊतकों में न्यूक्लिक एसिड आमतौर पर क्षति और क्षरण की एक विस्तृत श्रृंखला प्रदर्शित करते हैं, जिससे जीनोमिक जानकारी को पुनः प्राप्त करना मुश्किल हो जाता है जिससे विभिन्न विकारों में अंतर्निहित आणविक तंत्रके बारे में महत्वपूर्ण अंतर्दृष्टि हो सकती है।

आरएनए अनुक्रमण द्वारा उत्पन्न जीन अभिव्यक्ति डेटा अक्सर रोग और प्रतिरोध तंत्र का अध्ययन करने में महत्वपूर्ण भूमिका निभाता है और डीएनए उत्परिवर्तन विश्लेषण का पूरक होता है। हालांकि, आरएनए गिरावट के लिए अधिक संवेदनशील है, जिससे एफएफपीई ऊतकों से सटीक जीन अभिव्यक्ति डेटा उत्पन्न करना अधिक चुनौतीपूर्ण हो जाता है। इसके अलावा, क्योंकि अनुक्रमण की व्यापक उपलब्धता और सामर्थ्य अपेक्षाकृत हाल ही में है, पुराने नमूनों को अक्सर आरएनए अखंडता को संरक्षित करने के लिए आवश्यक शर्तों में संग्रहीत नहीं किया गया था। एफएफपीई नमूनों के लिए कुछ मुद्दों में पैराफिन में एम्बेड करने के कारण आरएनए का क्षरण, आरएनए का रासायनिक संशोधन अनुक्रमण के लिए आवश्यक एंजाइमैटिक प्रक्रियाओं के विखंडन या अपवर्तकता के लिए अग्रणी है, और पॉली-ए पूंछ का नुकसान, रिवर्स ट्रांसक्रिप्टेस4के लिए एक प्राइमर के रूप में ओलिगो-डीटी की प्रयोज्यता को सीमित करता है। एक अन्य चुनौती उप-इष्टतम परिस्थितियों में एफएफपीई नमूनों की हैंडलिंग/भंडारण है, जिससेऊतकोंमें आरएनए जैसे लेबिल अणुओं का और क्षरण हो सकता है । यह पुराने नमूनों के लिए विशेष रूप से प्रासंगिक है जो ऐसे समय में एकत्र किया गया हो सकता है जब आरएनए अनुक्रमण द्वारा जीन अभिव्यक्ति विश्लेषण नमूनों के लिए प्रत्याशित नहीं था। इन सभी के कारण उपयोगी अनुक्रम डेटा उत्पन्न करने के लिए उपलब्ध निकाले गए आरएनए की गुणवत्ता और मात्रा में कमी आई है। सफलता की कम संभावना, अनुक्रमण की उच्च लागत के साथ संयुक्त, संभावित उपयोगी FFPE नमूनों से जीन अभिव्यक्ति डेटा उत्पन्न करने और विश्लेषण करने की कोशिश कर रहा से कई शोधकर्ताओं परहेज किया है । हाल के वर्षों में कुछ अध्ययनों जीन अभिव्यक्ति विश्लेषण2,66,77,88,9के लिए FFPE ऊतकों की प्रयोज्यता का प्रदर्शन किया है, हालांकि कम और/या अधिक हाल के नमूनों के लिए ।,

एक व्यवहार्यता अध्ययन के रूप में, हमने एफएफपीई ट्यूमर ऊतक नमूनों से निगरानी, महामारी विज्ञान, और अंतिम परिणाम (SEER) आरएनए अनुक्रमण और जीन अभिव्यक्ति विश्लेषण10के लिए अंतिम परिणाम (SEER) कैंसर रजिस्ट्रियों से निकाले गए आरएनए का उपयोग किया। नैदानिक पैथोलॉजी प्रयोगशालाओं से खरीदा गया, उच्च ग्रेड ओवेरियन सीरस एडेनोकार्सिनोमा से एफएफपी ऊतकों को आरएनए निष्कर्षण से पहले अलग-अलग परिस्थितियों में 7-32 वर्षों से संग्रहित किया गया था। क्योंकि ज्यादातर मामलों में इन ब्लॉकों को भविष्य में किसी भी संवेदनशील आनुवंशिक विश्लेषण की उम्मीद के बिना वर्षों के लिए विभिन्न साइटों में संग्रहीत किया गया था, नाभिक एसिड को संरक्षित करने के लिए बहुत सावधानी नहीं बरती गई थी। इस प्रकार, अधिकांश नमूनों ने खराब गुणवत्ता वाले आरएनए का प्रदर्शन किया, जिसमें बैक्टीरिया से दूषित नमूनों का एक बड़ा हिस्सा था। फिर भी, हम जीन क्वांटिफिकेशन करने, जीन कवरेज की एकरूपता और निरंतरता को मापने और प्रजनन क्षमता को मापने के लिए जैविक प्रतिकृतियों के बीच पियर्सन सहसंबंध विश्लेषण करने में सक्षम थे। प्रमुख हस्ताक्षर जीन पैनल के एक सेट के आधार पर, हम कैंसर जीनोम एटलस (TCGA) डेटा के साथ हमारे अध्ययन में नमूनों की तुलना में और पुष्टि की है कि नमूनों के लगभग ६०% तुलनीय जीन अभिव्यक्ति प्रोफाइल11था । विभिन्न क्यूसी परिणामों और नमूना मेटाडेटा के बीच सहसंबंध के आधार पर, हमने प्रमुख क्यूसी मैट्रिक्स की पहचान की, जिनमें नमूनों की पहचान करने के लिए अच्छा भविष्य कहनेवाला मूल्य है जो उपयोग करने योग्य अनुक्रम डेटा11उत्पन्न करने की अधिक संभावना रखते हैं।

यहां हम एफएफपीई-आरएनए गुणवत्ता मूल्यांकन, निकाले गए आरएनए नमूनों से शुरू होने वाले अनुक्रमण पुस्तकालयों की पीढ़ी और अनुक्रमण डेटा के बायोइन्फॉर्मेटिक विश्लेषण के लिए उपयोग की जाने वाली पद्धति का वर्णन करते हैं।

Protocol

1. आरएनए मात्रा और गुणवत्ता मूल्यांकन पूर्व निर्धारित मानदंडों के अनुसार एफएफपीई नमूनों का चयन करें और एक उपयुक्त विधि (जैसे, एफएफपीई-नाभिक एसिड निष्कर्षण किट, सामग्री की तालिका)का उपयोग करक?…

Representative Results

ऊपर वर्णित पद्धति 67 एफएफपीई नमूनों पर लागू की गई थी जिन्हें 7-32 वर्षों के लिए विभिन्न स्थितियों के तहत संग्रहीत किया गया था (औसत नमूना भंडारण समय 17.5 साल था)। यहां प्रस्तुत डेटासेट और विश्लेषण परिणामपहले झ…

Discussion

यहां वर्णित विधि FFPE-RNA नमूनों से अच्छा अनुक्रम डेटा प्राप्त करने के लिए आवश्यक मुख्य चरणों को रेखांकित करती है । इस विधि के साथ विचार करने के लिए मुख्य बिंदु हैं: (1) यह सुनिश्चित करें कि आरएनए को नमूना हैंड…

Disclosures

The authors have nothing to disclose.

Acknowledgements

हम डॉ डेनिएल कैरिक (कैंसर नियंत्रण और जनसंख्या विज्ञान, राष्ट्रीय कैंसर संस्थान के प्रभाग) के लिए जारी मदद के लिए आभारी हैं, विशेष रूप से इस अध्ययन शुरू करने के लिए, हमें नमूनों के साथ प्रदान करने, और डेटा विश्लेषण के दौरान उपयोगी सुझावों के लिए । हम ईमानदारी से नमूना तैयारी और अनुक्रमण के दौरान उनकी मदद के लिए कैंसर अनुसंधान के लिए फ्रेडरिक राष्ट्रीय प्रयोगशाला में सीसीआर अनुक्रमण सुविधा के सभी सदस्यों को धन्यवाद, नमूना QC में सहायता के लिए विशेष रूप से Brenda हो, पुस्तकालय QC के लिए Oksana जर्मन, तात्याना Smirnova अनुक्रमक चलाने के लिए । हम डेटा विश्लेषण और आरएनए-सीक्यू पाइपलाइन कार्यान्वयन के साथ मदद करने के लिए अनुक्रमण सुविधा बायोइन्फॉर्मेटिक्स समूह में टीएसएआई-वेई शेन और एशले वाल्टन का भी शुक्रिया अदा करना चाहते हैं। हम RNaseq विश्लेषण पाइपलाइन और सर्वोत्तम प्रथाओं के विकास के साथ सहायता के लिए सीसीबीआर और एनसीबीआर को भी धन्यवाद देते हैं।

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)
check_url/61060?article_type=t

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video