Summary
यह विधि अनुक्रम डेटा की गुणवत्ता और मात्रा में सुधार करने के लिए कदमों का वर्णन करती है जिसे फॉर्मेलिन-फिक्स्ड पैराफिन-एम्बेडेड (एफएफपीई) आरएनए नमूनों से प्राप्त किया जा सकता है। हम एफएफपीई-आरएनए नमूनों की गुणवत्ता का अधिक सटीक आकलन करने, अनुक्रमण पुस्तकालयों को तैयार करने और एफएफपीई-आरएनए नमूनों के आंकड़ों का विश्लेषण करने की कार्यप्रणाली का वर्णन करते हैं।
Abstract
आरएनए अनुक्रमण (आरएनए-सीक्यू) द्वारा जीन अभिव्यक्ति विश्लेषण नैदानिक नमूनों में अद्वितीय अंतर्दृष्टि को सक्षम बनाता है जो संभावित रूप से विभिन्न रोगों के आधार के साथ-साथ प्रतिरोध और/या संवेदनशीलता तंत्र की मशीनी समझ का कारण बन सकता है। हालांकि, FFPE ऊतकों, जो नैदानिक नमूनों में ऊतक आकृति विज्ञान के संरक्षण के लिए सबसे आम विधि का प्रतिनिधित्व करते हैं, जीन अभिव्यक्ति प्रोफाइलिंग विश्लेषण के लिए सबसे अच्छा स्रोत नहीं हैं । ऐसे नमूनों से प्राप्त आरएनए को अक्सर अपमानित, खंडित और रासायनिक रूप से संशोधित किया जाता है, जिससे पुस्तकालयों को उप-इष्टतम अनुक्रमण होता है। बदले में, ये खराब गुणवत्ता अनुक्रम डेटा उत्पन्न करते हैं जो जीन अभिव्यक्ति विश्लेषण और उत्परिवर्तन खोज के लिए विश्वसनीय नहीं हो सकते हैं। एफएफपीई नमूनों का सबसे अधिक बनाने और कम गुणवत्ता वाले नमूनों से सर्वोत्तम संभव डेटा प्राप्त करने के लिए, प्रायोगिक डिजाइन की योजना बनाते समय, अनुक्रमण पुस्तकालयों की तैयारी करते समय और डेटा विश्लेषण के दौरान कुछ सावधानियां बरतना महत्वपूर्ण है। इसमें सटीक नमूना गुणवत्ता नियंत्रण (क्यूसी) के लिए उपयुक्त मैट्रिक्स का उपयोग, अनुक्रमण पुस्तकालय उत्पादन के दौरान विभिन्न चरणों के लिए सर्वोत्तम तरीकों की पहचान करना, और सावधान लाइब्रेरी क्यूसी शामिल है। इसके अलावा, आरएनए-सीक्यू डेटा में कलाकृतियों की पहचान करने, संदूषण और निम्न गुणवत्ता वाले पढ़ने, जीन कवरेज की एकरूपता का आकलन करने और जैविक प्रतिकृतियों के बीच जीन अभिव्यक्ति प्रोफाइल की प्रजनन क्षमता को मापने के लिए अनुक्रम डेटा विश्लेषण के लिए सही सॉफ्टवेयर उपकरण और मापदंडों को लागू करना महत्वपूर्ण है। ये कदम बहुत विषम आरएनए नमूनों की प्रोफाइलिंग के लिए उच्च सटीकता और प्रजनन क्षमता सुनिश्चित कर सकते हैं। यहां हम नमूना क्यूसी, लाइब्रेरी तैयार करने और क्यूसी, अनुक्रमण और डेटा विश्लेषण के लिए विभिन्न चरणों का वर्णन करते हैं जो कम गुणवत्ता वाले आरएनए से प्राप्त उपयोगी डेटा की मात्रा को बढ़ाने में मदद कर सकते हैं, जैसे कि एफएफपीई-आरएनए ऊतकों से प्राप्त।
Introduction
अगली पीढ़ी के अनुक्रमण दृष्टिकोणों के उपयोग ने हमें विभिन्न प्रकार के नमूनों से जानकारी का खजाना बीनने में सक्षम बनाया है । हालांकि, पुराने और खराब संरक्षित नमूने अनुक्रम डेटा उत्पन्न करने के आमतौर पर उपयोग किए जाने वाले तरीकों के लिए असाध्य रहते हैं और अक्सर अच्छी तरह से स्थापित प्रोटोकॉल में संशोधनों की आवश्यकता होती है। एफएफपीई ऊतक ऐसे नमूना प्रकार का प्रतिनिधित्व करते हैं जिनका नैदानिक नमूनों के लिए व्यापक रूप से उपयोग किया गया है1,2,,3. जबकि एफएफपीई संरक्षण ऊतक आकृति विज्ञान को बनाए रखता है, एफएफपीई ऊतकों में न्यूक्लिक एसिड आमतौर पर क्षति और क्षरण की एक विस्तृत श्रृंखला प्रदर्शित करते हैं, जिससे जीनोमिक जानकारी को पुनः प्राप्त करना मुश्किल हो जाता है जिससे विभिन्न विकारों में अंतर्निहित आणविक तंत्रके बारे में महत्वपूर्ण अंतर्दृष्टि हो सकती है।
आरएनए अनुक्रमण द्वारा उत्पन्न जीन अभिव्यक्ति डेटा अक्सर रोग और प्रतिरोध तंत्र का अध्ययन करने में महत्वपूर्ण भूमिका निभाता है और डीएनए उत्परिवर्तन विश्लेषण का पूरक होता है। हालांकि, आरएनए गिरावट के लिए अधिक संवेदनशील है, जिससे एफएफपीई ऊतकों से सटीक जीन अभिव्यक्ति डेटा उत्पन्न करना अधिक चुनौतीपूर्ण हो जाता है। इसके अलावा, क्योंकि अनुक्रमण की व्यापक उपलब्धता और सामर्थ्य अपेक्षाकृत हाल ही में है, पुराने नमूनों को अक्सर आरएनए अखंडता को संरक्षित करने के लिए आवश्यक शर्तों में संग्रहीत नहीं किया गया था। एफएफपीई नमूनों के लिए कुछ मुद्दों में पैराफिन में एम्बेड करने के कारण आरएनए का क्षरण, आरएनए का रासायनिक संशोधन अनुक्रमण के लिए आवश्यक एंजाइमैटिक प्रक्रियाओं के विखंडन या अपवर्तकता के लिए अग्रणी है, और पॉली-ए पूंछ का नुकसान, रिवर्स ट्रांसक्रिप्टेस4के लिए एक प्राइमर के रूप में ओलिगो-डीटी की प्रयोज्यता को सीमित करता है। एक अन्य चुनौती उप-इष्टतम परिस्थितियों में एफएफपीई नमूनों की हैंडलिंग/भंडारण है, जिससेऊतकोंमें आरएनए जैसे लेबिल अणुओं का और क्षरण हो सकता है । यह पुराने नमूनों के लिए विशेष रूप से प्रासंगिक है जो ऐसे समय में एकत्र किया गया हो सकता है जब आरएनए अनुक्रमण द्वारा जीन अभिव्यक्ति विश्लेषण नमूनों के लिए प्रत्याशित नहीं था। इन सभी के कारण उपयोगी अनुक्रम डेटा उत्पन्न करने के लिए उपलब्ध निकाले गए आरएनए की गुणवत्ता और मात्रा में कमी आई है। सफलता की कम संभावना, अनुक्रमण की उच्च लागत के साथ संयुक्त, संभावित उपयोगी FFPE नमूनों से जीन अभिव्यक्ति डेटा उत्पन्न करने और विश्लेषण करने की कोशिश कर रहा से कई शोधकर्ताओं परहेज किया है । हाल के वर्षों में कुछ अध्ययनों जीन अभिव्यक्ति विश्लेषण2,66,77,88,9के लिए FFPE ऊतकों की प्रयोज्यता का प्रदर्शन किया है, हालांकि कम और/या अधिक हाल के नमूनों के लिए ।,
एक व्यवहार्यता अध्ययन के रूप में, हमने एफएफपीई ट्यूमर ऊतक नमूनों से निगरानी, महामारी विज्ञान, और अंतिम परिणाम (SEER) आरएनए अनुक्रमण और जीन अभिव्यक्ति विश्लेषण10के लिए अंतिम परिणाम (SEER) कैंसर रजिस्ट्रियों से निकाले गए आरएनए का उपयोग किया। नैदानिक पैथोलॉजी प्रयोगशालाओं से खरीदा गया, उच्च ग्रेड ओवेरियन सीरस एडेनोकार्सिनोमा से एफएफपी ऊतकों को आरएनए निष्कर्षण से पहले अलग-अलग परिस्थितियों में 7-32 वर्षों से संग्रहित किया गया था। क्योंकि ज्यादातर मामलों में इन ब्लॉकों को भविष्य में किसी भी संवेदनशील आनुवंशिक विश्लेषण की उम्मीद के बिना वर्षों के लिए विभिन्न साइटों में संग्रहीत किया गया था, नाभिक एसिड को संरक्षित करने के लिए बहुत सावधानी नहीं बरती गई थी। इस प्रकार, अधिकांश नमूनों ने खराब गुणवत्ता वाले आरएनए का प्रदर्शन किया, जिसमें बैक्टीरिया से दूषित नमूनों का एक बड़ा हिस्सा था। फिर भी, हम जीन क्वांटिफिकेशन करने, जीन कवरेज की एकरूपता और निरंतरता को मापने और प्रजनन क्षमता को मापने के लिए जैविक प्रतिकृतियों के बीच पियर्सन सहसंबंध विश्लेषण करने में सक्षम थे। प्रमुख हस्ताक्षर जीन पैनल के एक सेट के आधार पर, हम कैंसर जीनोम एटलस (TCGA) डेटा के साथ हमारे अध्ययन में नमूनों की तुलना में और पुष्टि की है कि नमूनों के लगभग ६०% तुलनीय जीन अभिव्यक्ति प्रोफाइल11था । विभिन्न क्यूसी परिणामों और नमूना मेटाडेटा के बीच सहसंबंध के आधार पर, हमने प्रमुख क्यूसी मैट्रिक्स की पहचान की, जिनमें नमूनों की पहचान करने के लिए अच्छा भविष्य कहनेवाला मूल्य है जो उपयोग करने योग्य अनुक्रम डेटा11उत्पन्न करने की अधिक संभावना रखते हैं।
यहां हम एफएफपीई-आरएनए गुणवत्ता मूल्यांकन, निकाले गए आरएनए नमूनों से शुरू होने वाले अनुक्रमण पुस्तकालयों की पीढ़ी और अनुक्रमण डेटा के बायोइन्फॉर्मेटिक विश्लेषण के लिए उपयोग की जाने वाली पद्धति का वर्णन करते हैं।
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. आरएनए मात्रा और गुणवत्ता मूल्यांकन
- पूर्व निर्धारित मानदंडों के अनुसार एफएफपीई नमूनों का चयन करें और एक उपयुक्त विधि (जैसे, एफएफपीई-नाभिक एसिड निष्कर्षण किट, सामग्री की तालिका)का उपयोग करके आरएनए निकालें।
नोट: एफएफपीई-आरएनए निष्कर्षण के लिए कई अलग-अलग तरीके उपलब्ध हैं, जिनमें नए माइक्रोडिसेक्शन विधियां शामिल हैं जो बहुत कम ऊतक ों के साथ काम कर सकती हैं और अच्छी गुणवत्ता वाले आरएनए12,,13,,14निकाल सकती हैं। - सभी चरणों में आरएनए की अखंडता को संरक्षित करने के लिए अत्यंत सावधानी बरती जानी चाहिए। इसमें RNase मुक्त deionised पानी के साथ काम करना, RNase मुफ्त प्लास्टिकवेयर का उपयोग करना, और आरनाज़ विसंदूषण अभिकर्ताओं के साथ एफएफपीई ब्लॉकों के संपर्क में आने वाले सभी उपकरणों की सफाई शामिल है।
- आरएनए को हमेशा सावधानी से संभाला जाना चाहिए और बर्फ में रखा जाना चाहिए जब तक कि अन्यथा हैंडलिंग करते समय गिरावट को कम करने के लिए निर्दिष्ट न हो।
- यदि पर्याप्त सामग्री उपलब्ध है, तो एफएफपीई ब्लॉक में एक से अधिक क्षेत्रों से आरएनए निकालें ताकि यथासंभव अधिक से अधिक नमूनों से जैविक प्रतिकृति उत्पन्न की जा सके। पर्याप्त आरएनए उपज के साथ नमूनों में से कुछ के लिए, तकनीकी प्रतिकृति के रूप में प्रक्रिया के लिए निकाले गए आरएनए को दो में विभाजित करें।
- यदि संभव हो, तो क्यूसी (यानी, एक क्यूसी एलिकोट) के लिए निष्कर्षण के बाद अलग से नमूने की एक छोटी राशि एकत्र करें ताकि नमूने के बार-बार हैंडलिंग और फ्रीज-गल चक्रों से बचा जा सके जिससे आरएनए की गिरावट आएगी।
- निर्माता के निर्देशों के अनुसार आरएनए नैनो चिप, सामग्रीकी तालिका का उपयोग करके आरएनए क्यूसी सिस्टम (जैसे, एग्गुरेंट बायोएनालाइजर सिस्टम) पर इसे चलाकर आरएनए (अधिमानतः क्यूसी एलिकोट से) की गुणवत्ता की जांच करें।
- 200 एनटी (डीवी200) या 100 एनटी (डीवी100)आकार से बड़े टुकड़ों के प्रतिशत के रूप में डीवी 200200और डीवी100 मूल्यों की गणना करके नमूनों में आरएनए टुकड़ों के वितरण (उदाहरण के लिए, बायोएनालाइजर 2100 विशेषज्ञ सॉफ्टवेयर का उपयोग करके) का विश्लेषण करें।
- डीवी200 और डीवी100में, उस मीट्रिक की पहचान करें जिसमें दिए गए नमूने सेट के लिए मूल्यों का एक बड़ा प्रसार है, और यह कि नमूनों को उनकी डिग्री अक्षुण्णता के अनुसार समूहीकृत करने के लिए चुनें।
नोट: अधिक अक्षुण्ण आरएनए अणुओं (यानी, उच्च डीवी200 मूल्यों, डीवी200 और 40%) के साथ सभी या सबसे अधिक के साथ नमूना सेट के लिए, डीवी200 एक उपयोगी क्यूसी मीट्रिक होने की संभावना है। हालांकि, अधिक अवक्रमित प्रतिलिपियों (यानी, कम डीवी200 मूल्यों, डीवी200 और एलटी; 40%) के साथ सभी या सबसे अधिक के साथ नमूना सेट के लिए, डीवी100 उपयोगी होने की संभावना अधिक है। - क्यूसी मेट्रिक्स के आधार पर उन नमूनों की पहचान करें जिनमें डीवी100 और एलटी 40% है। क्योंकि गिरावट की इस डिग्री से उपयोगी अनुक्रमण डेटा11उत्पन्न नहीं होने की संभावना है, इसलिए ऐसे नमूनों को संसाधित करने से बचने की सलाह दी जाती है। यदि ऐसे नमूनों के प्रतिस्थापन उपलब्ध हैं, तो उनकी गुणवत्ता की जांच की जानी चाहिए ताकि केवल डीवी100 और 50% वाले नमूने शामिल किए जा सके।
2. अनुक्रमण पुस्तकालय तैयार
- धारा 1 में मूल्यांकन के रूप में नमूनों की गुणवत्ता के आधार पर, अनुक्रमण पुस्तकालयों के उत्पादन के लिए एक उपयुक्त विधि की पहचान ।
- बहुत कम गिरावट और उच्च डीवी200 मूल्यों के साथ नमूना सेट के लिए, एमआरएनए अनुक्रमण का उपयोग करें (यानी, पॉलीएडेनेटेड ट्रांसक्रिप्ट्स का कब्जा), लक्षित आरएनए अनुक्रमण (यानी, ब्याज के विशिष्ट जीन के लिए कैप्चर जांच का उपयोग), आरएनए एक्सोम अनुक्रमण (यानी, कोडिंग ट्रांसक्रिप्टोम के लिए समृद्ध करने के लिए कैप्चर प्रोब्स का उपयोग), या कुल आरएनए अनुक्रमण (यानी, रिबोसोमल नमूनों से पूरी आरएनए आबादी को अनुक्रम करने के लिए ट्रांसक्रिप्शन के लिए यादृच्छिक प्राइमर का उपयोग)। हालांकि, यह ध्यान रखना महत्वपूर्ण है कि निर्धारण प्रक्रिया निकाले गए आरएनए में पूर्वाग्रह पेश कर सकती है। इस प्रकार, उच्च डीवी200 मूल्यों के साथ भी, सभी मामलों में कैप्चर दृष्टिकोण अच्छी तरह से काम नहीं कर सकते हैं।
- यदि नमूना सेट में उच्च क्षरण (डीवी200 < 30%)के नमूने शामिल हैं, तो कुल आरएनए लाइब्रेरी तैयारकरने की विधि का उपयोग करें न कि एक जो टेप के विशिष्ट क्षेत्रों को पकड़ने पर निर्भर करता है, क्योंकि वे विशिष्ट क्षेत्र अवक्रमित नमूनों में गायब हो सकते हैं। सीडीएनए की पीढ़ी के लिए यादृच्छिक प्राइमर का उपयोग अंतिम पुस्तकालय में प्रयोग करने योग्य आरएनए का उच्च प्रतिनिधित्व करता है, और इसलिए, एफएफपीई-आरएनए नमूनों के लिए अधिक अनुकूल है।
- उच्च गिरावट के साथ नमूना सेट के लिए राइबोसोमल आरएनए कमी के लिए, RNaseH आधारित तरीकों का उपयोग करें। ये ऐसे तरीके हैं जहां आरएनए-विशिष्ट डीएनए जांच rRNA से बांधती है, डबल-फंसे अणुओं को RNaseH द्वारा पचाया जाता है, और बचे हुए जांच को DNase द्वारा साफ किया जाता है (उदाहरण के लिए, NEBNext rRNA कमी किट, सामग्री की तालिका)। ये तरीके कुछ अन्य तरीकों की तुलना में अवक्रमित नमूनों के लिए बेहतर कामकरते हैं।
- अनुक्रमण पुस्तकालयों को उत्पन्न करने के लिए, उन नमूनों के लिए उच्च इनपुट मात्रा (यदि संभव हो) का उपयोग करें जिनके पास अधिक अवक्रमित आरएनए (डीवी100 और एलटी; 60%) हैं। जबकि काफी अच्छी गुणवत्ता वाले आरएनए (डीवी100 और 60%) कम इनपुट राशि पर भी अच्छा अनुक्रम डेटा प्राप्त हो सकता है (एफएफपीई-आरएनए के साथ इस प्रोटोकॉल के लिए सबसे कम परीक्षण ~ 20 एनजी था), अधिक अवक्रमित आरएनए (डीवी100 और एलटी; 60%), उच्च इनपुट राशि (जैसे, और 100 एनजी) के साथ शुरू करना बेहतर है।
नोट: यदि पर्याप्त (जैसे, >500 एनजी) नमूना उपलब्ध है, तो आवश्यकता पड़ने पर पुस्तकालय की तैयारी को दोहराने के लिए कम से कम आधे नमूने को बचाने की सलाह दी जाती है। कम इनपुट नमूनों (जैसे, & 100 एनजी) के लिए, आमतौर पर पूरी राशि का उपयोग करना और पर्याप्त विविधता की लाइब्रेरी उत्पन्न करना बेहतर होता है। - उच्च गिरावट के साथ नमूनों से कुल आरएनए सेक्यू पुस्तकालयों को उत्पन्न करने के लिए एक उपयुक्त पुस्तकालय तैयारकरने किट का चयन करने के बाद (उदाहरण के लिए, इलुमिना के लिए एनईबीनेक्स्ट अल्ट्रा II आरएनए लाइब्रेरी प्रेप किट, सामग्री की तालिकादेखें), पुस्तकालयों को उत्पन्न करने के लिए निर्माता के निर्देशों का पालन करें।
नोट: पुस्तकालय की तैयारी के दौरान, अवक्रमित नमूनों के लिए आरएनए विखंडन कदम को छोड़ना और पहले स्ट्रैंड सीडीएनए संश्लेषण के लिए यादृच्छिक प्राइमर का उपयोग सुनिश्चित करना महत्वपूर्ण है। - दक्षता और गति में सुधार के लिए, विशेष रूप से कम इनपुट नमूनों के लिए, मनका आधारित शुद्धिकरण और आकार चयन चरणों के लिए मजबूत निश्चित मैग्नेट के साथ उपयुक्त चुंबकीय रैक का उपयोग करें (सामग्री की तालिकादेखें)।
- एडाप्टर लिगाटेड डीएनए के पीसीआर संवर्धन के लिए, पुस्तकालय के अणुओं के अनावश्यक दोहराव से बचते हुए अधिकतम प्रतिनिधित्व सुनिश्चित करने के लिए इनपुट डीएनए की मात्रा के आधार पर प्रवर्धन चक्रों की संख्या को समायोजित करें। कम इनपुट एफएफपीई-आरएनए नमूनों (<100 एनजी) के लिए, हम 16-18 प्रवर्धन चक्रों की सलाह देते हैं, जबकि उच्च इनपुट नमूने (1,000 एनजी) आमतौर पर प्रवर्धन के 12-14 दौर में पर्याप्त पुस्तकालय मात्रा उत्पन्न करते हैं।
- निर्माता के निर्देशों के अनुसार पीसीआर प्रवर्धन और सफाई के बाद, एक उपयुक्त मंच पर पुस्तकालय एकाग्रता और अणु वितरण का विश्लेषण करके पुस्तकालय की गुणवत्ता का आकलन करें (उदाहरण के लिए, फुर्तीला बायोएनालाइजर डीएनए चिप, सामग्री की तालिकादेखें)। प्राइमर चोटियों (~ 80 बीपी) या एडाप्टर-डिमर चोटियों (~ 128 बीपी) के साथ नमूनों के लिए, उन चोटियों को हटाने के लिए सफाई दोहराएं।
- प्रत्येक पुस्तकालय के लिए औसत पुस्तकालय आकार की गणना करें (उदाहरण के लिए, बायोएनालाइजर 2100 विशेषज्ञ सॉफ्टवेयर का उपयोग करके)।
3. अनुक्रमण पुस्तकालय QC
- एक बार यह पता लगालिया जाता है कि पुस्तकालय अतिरिक्त प्राइमर और एडाप्टर-डिमर से मुक्त हैं और बाद में अनुक्रमण के लिए पर्याप्त एकाग्रता रखते हैं, qPCR द्वारा आगे की मात्रा निर्धारित करते हैं।
नोट: पुस्तकालय एकाग्रता के प्रति क्लस्टर पीढ़ी की संवेदनशीलता के कारण, कम प्रदर्शन या ओवरलोडिंग से महंगे अनुक्रमण रन को रोकने के लिए सटीक मात्रा महत्वपूर्ण है। मात्रात्मक रीयल-टाइम पीसीआर (क्यूपीसीआर) विधियां इलुमिना प्लेटफार्मों पर क्लस्टर घनत्व में सुधार के लिए उपयोगी हैं, जिसके परिणामस्वरूप ओवरक्लस्टरिंग हो। क्यूपीसीआर विधि सभी पुस्तकालय अणुओं (जैसे, फुर्तीला बायोएनालाइजर) के गुणात्मक और/या मात्रात्मक विश्लेषण के आधार पर तरीकों की तुलना में अधिक सटीक और अधिक संवेदनशील है, क्योंकि यह टेम्पलेट्स को मापता है कि दोनों एडाप्टर दृश्य हैं जो फ्लोसेल पर क्लस्टर बनाएंगे । पुस्तकालय का आकार, हालांकि, पहले से जाना जाना चाहिए क्योंकि आकार सुधार को सभी नमूनों पर लागू किया जाना चाहिए ताकि परिणामों की तुलना मानक वक्र के खिलाफ की जा सके।
सावधानी: क्यूपीसीआर प्रदर्शन करते समय लैब कोट और दस्ताने हमेशा पहने जाने चाहिए, और निर्माता के निर्देशों के बाद एक जैव सुरक्षा कैबिनेट में प्रक्रिया की जानी चाहिए।- एक उपयुक्त किट (जैसे, इल्मिना पुस्तकालयों के लिए KAPA SYBR फास्ट qPCR मास्टर मिक्स, लाइब्रेरी क्वांटिफिकेशन किट का एक हिस्सा, सामग्री की तालिकादेखें), मानकों के साथ, एक सकारात्मक नियंत्रण (जैसे, PhiX नियंत्रण, सामग्री की तालिकादेखें), और एक टेम्पलेट नियंत्रण (एनटीसी) का उपयोग करके त्रुटि की रोकथाम के लिए प्रत्येक नमूने के लिए तीन प्रतिकृतिके साथ एक 96 अच्छी प्लेट स्थापित करें। एनटीसी डीएनए लाइब्रेरी के बिना क्यूपीसीआर मिक्स है। सकारात्मक नियंत्रण ज्ञात एकाग्रता और टुकड़ा आकार के साथ किसी भी पुस्तकालय हो सकता है।
- विक्रेता प्रोटोकॉल का पालन करते हुए मानकों के न्यूनतम छह कमजोरियां तैयार करें।
- सभी घटकों (यानी, qPCR मास्टर मिश्रण, पुस्तकालयों, मानकों) को जोड़ने के बाद, सीलिंग फिल्म के साथ प्लेट को कवर करें और यह सुनिश्चित करने के लिए एक चीख़ का उपयोग करें कि फिल्म प्लेट के साथ भी और सुरक्षित संपर्क बनाती है।
- भंवर और कम से कम 1 मिन के लिए 1,500 आरपीएम पर थाली नीचे स्पिन. नेत्रहीन प्लेट का निरीक्षण करने के लिए सुनिश्चित करें कि वहाँ कुओं के तल पर कोई हवा बुलबुले हैं.
- निर्माता की अनुशंसित सेटिंग्स का उपयोग करके थर्मल साइकिलर (जैसे .g. CFX96 टच सिस्टम, टेबल ऑफ मैटेरियलदेखें) पर प्लेट सेट करें।
- रन फ़ोल्डर को सहेजें जहां इसे डेटा विश्लेषण के लिए एक्सेस किया जा सकता है।
- डेटा विश्लेषण के दौरान, देखें कि ढलान -3.1 से -3.6 रेंज में है, दक्षता 90% से 110% तक और आर2 (मानक वक्र के लिए प्राप्त सहसंबंध का गुणांक) 0.98 से कम नहीं है।
- एक उपयुक्त किट (जैसे, इल्मिना पुस्तकालयों के लिए KAPA SYBR फास्ट qPCR मास्टर मिक्स, लाइब्रेरी क्वांटिफिकेशन किट का एक हिस्सा, सामग्री की तालिकादेखें), मानकों के साथ, एक सकारात्मक नियंत्रण (जैसे, PhiX नियंत्रण, सामग्री की तालिकादेखें), और एक टेम्पलेट नियंत्रण (एनटीसी) का उपयोग करके त्रुटि की रोकथाम के लिए प्रत्येक नमूने के लिए तीन प्रतिकृतिके साथ एक 96 अच्छी प्लेट स्थापित करें। एनटीसी डीएनए लाइब्रेरी के बिना क्यूपीसीआर मिक्स है। सकारात्मक नियंत्रण ज्ञात एकाग्रता और टुकड़ा आकार के साथ किसी भी पुस्तकालय हो सकता है।
- पूलिंग:एक बार अनुक्रमण तैयार पुस्तकालयों की क्यूपीसीआर एकाग्रता प्राप्त हो जाने के बाद, प्रत्येक पुस्तकालय की पूल समतुल्य मात्रा, प्रति नमूना आवश्यक अनुक्रमण पढ़ता है और उपकरण के अनुक्रमण उत्पादन के आधार पर।
- पूल के QC:एक ही प्रोटोकॉल के बाद qPCR द्वारा पुस्तकालय पूल फिर से quantitate के रूप में चरण 3.1 में वर्णित है।
4. अनुक्रमण
- रन पैरामीटरके आधार पर, अनुक्रमण अभिकर्मक किट खींचें और उपयोगकर्ता गाइड का पालन करते हुए उन्हें गल जाएं। कृपया इलुमिना उपकरणों पर अनुक्रमण के लिए सभी उपयोगकर्ता गाइड के नवीनतम संस्करणों के लिए Illumina वेबसाइट की जांच करें।
- सुनिश्चित करें कि अभिकर्मक पूरी तरह से गल रहे हैं और 4 डिग्री सेल्सियस पर अभिकर्मकट्रे रखें। रन 2 घंटे से बाद में शुरू किया जाना चाहिए के बाद अभिकर्मकों झड़ गया है । ऐसा नहीं करना जो रन परिणामों की गुणवत्ता को प्रभावित कर सकता है।
- रिएजेंट्स मिश्रण करने के लिए कारतूस 5x उलटा और धीरे से हवा बुलबुले को कम करने के लिए बेंच पर नल।
- 30 न्यूनतम के लिए कमरे के तापमान पर अलग से लिपटे प्रवाह सेल पैकेज सेट करें।
- प्रवाह सेल पैकेज को खोलें और प्रवाह कोशिका की कांच की सतह को लिंट-मुक्त अल्कोहल पोंछ के साथ साफ करें। कांच को कम लिंट प्रयोगशाला ऊतक के साथ सुखा लें।
- इलुमिना'प्रयोग प्रबंधक'एप्लिकेशन खोलें। 'सैंपलशीट बनाएं'चुनें, फिर सीक्वेंसर चुनें और क्लिक करें'नेक्स्ट'।
- इलुमिना सीक्वेंसर मापदंड (जैसे, इलुमिना प्रयोग प्रबंधक, सॉफ्टवेयर गाइड) के आधार पर नमूना शीट बनाएं और अपलोड करें।
- संकेतों पर, रिएजेंट किट बारकोड में स्कैन करें और रन सेट अप पैरामीटर (उदाहरण के लिए, एक अनुक्रमित पीई 75 चक्र रन के लिए, 76-8-76दर्ज करें)।
- अनुक्रमक उपयोगकर्ता गाइड सिफारिश के आधार पर पुस्तकालय पूल को विकृत और पतला करें (उदाहरण के लिए, इलुमिना से नेक्स्टसेक्यू 500 सिस्टम गाइड, सामग्री की तालिकादेखें)।
- नियंत्रण पुस्तकालय PhiX (सामग्री की तालिकादेखें) को उचित एकाग्रता (जैसे, NextSeq के लिए 1.8 पीएम) में विकृत और पतला करें।
- 1% PhiX कंट्रोल वॉल्यूम रेशियो के परिणामस्वरूप नमूना पुस्तकालय और PhiX नियंत्रण मिलाएं।
- निर्धारित जलाशय में अभिकर्मक कारतूस में लोड विकृत और पतला नमूना।
- फ्लोसेल, बफर कारतूस, और अभिकर्मक कारतूस लोड करें।
- यह सुनिश्चित करने के लिए एक स्वचालित जांच और समीक्षा करें कि रन पैरामीटर सिस्टम चेक पास करते हैं।
- जब स्वचालित जांच पूरी हो जाती है, तो अनुक्रमण रन शुरू करने के लिए शुरू का चयन करें।
5. डेटा विश्लेषण और गुणवत्ता मूल्यांकन
नोट: एक ठेठ आरएनए-सीक्यू डेटा विश्लेषण कार्यप्रवाह(चित्रा 1)में प्रीप्रोसेसिंग और क्यूसी, जीनोम और पोस्ट अलाइनमेंट क्यूसी, जीन और ट्रांसक्रिप्ट क्वांटिफिकेशन, नमूना सहसंबंध विश्लेषण, विभिन्न नमूना समूहों के बीच अंतर विश्लेषण, उपचार की स्थिति, और जीन सेट संवर्धन और मार्ग विश्लेषण शामिल हैं।
आरएनए-सीक्यू डेटा में गुणवत्ता वाले मुद्दे हो सकते हैं जो जीन प्रोफाइलिंग की सटीकता को प्रभावित कर सकते हैं और गलत निष्कर्ष ों का कारण बन सकते हैं। इसलिए, अनुक्रमण गुणवत्ता, संदूषण, अनुक्रमण कवरेज पूर्वाग्रह, और कलाकृतियों के अन्य स्रोतों के लिए प्रारंभिक क्यूसी जांच बहुत महत्वपूर्ण हैं। यहां वर्णित कार्यप्रवाह के समान आरएनए-एसईक्यू क्यूसी पाइपलाइन को लागू करने की सिफारिश कलाकृतियों का पता लगाने और डाउनस्ट्रीम विश्लेषण से पहले फ़िल्टरिंग या सुधार लागू करने की सिफारिश की जाती है।
- Preprocessing
नोट: इसमें डिमल्टीप्लेक्सिंग, सीक्वेंस रीड क्वालिटी का आकलन, जीसी कंटेंट, सीक्वेंसिंग एडाप्टर की मौजूदगी, ओवरप्रेस्ड कश्मीर-मर्सऔर पीसीआर डुप्लीकेट रीड्स शामिल हैं । यह जानकारी अनुक्रमण त्रुटियों, पीसीआर कलाकृतियों या संदूषण का पता लगाने में मदद करती है।- नमूना शीट में परिभाषित प्रत्येक नमूने के लिए कच्चे FASTQ फ़ाइलें उत्पन्न करने के लिए इलुमिना सॉफ्टवेयर टूल bcl2fastq2 का उपयोग करके डिमल्टीप्लेक्स इलुमिना अनुक्रमण चलता है। यदि बारकोड की टक्कर नहीं है तो अनुक्रमण त्रुटियों को सहन करने के लिए नमूना सूचकांक बारकोड में एक बेमेल की अनुमति दें।
- अनुक्रमण में किसी भी खराब गुणवत्ता या असामान्यताओं का पता लगाने के लिए कच्चे FASTQ फ़ाइलों पर गुणवत्ता की जांच करने के लिए FASTQC15 सॉफ्टवेयर टूल चलाएं।
- एडाप्टर और कम गुणवत्ता वाले ठिकानों ट्रिमिंग के लिए, कटअनुकूली16 या ट्रिममोमैटिक17 सॉफ्टवेयर टूल का उपयोग करके अनुक्रमण एडाप्टर और निम्न गुणवत्ता वाले ठिकानों को ट्रिम करें। छंटनी की जोड़ी अंत fastq फ़ाइलों में पढ़ता है बचाओ ।
- संदूषण स्क्रीन
- अन्य प्रजातियों केसाथ संभावित क्रॉस संदूषण का पता लगाने के लिए18 FASTQ_screen चलाएं।
- दूषित प्रजातियों के वर्गीकरण की पहचान करने के लिए क्राकेन 219 के मिनीक्राकेन चलाएं।
- संदर्भ जीनोम और पोस्ट अलाइनमेंट क्यूसी के लिए संरेखण
- छंटनी की गई रीड्स को स्टार एनलाइनर20का उपयोग करके संदर्भ जीनोम अनुक्रम (जीआरसीएच बिल्ड एचजी19 या एचजी38) से गठबंधन किया जा सकता है। स्पलिल्ड ट्रांसक्रिप्ट अलाइनमेंट का मार्गदर्शन करने के लिए जेनकोड एनोटेशन जीडीएफ फाइल लागू करें। उपन्यास स्प्लिस जंक्शनों के प्रति संवेदनशीलता बढ़ाने के लिए स्टार 2-पास चलाने की सिफारिश की जाती है। दूसरे पास में, सभी पढ़ता है एनोटेटेड जीन और टेप और पहले पास से उपंयास जंक्शनों का उपयोग कर remapped किया जाएगा ।
- पोस्ट-अलाइनमेंट क्यूसी करें।
- नमूनों में अद्वितीय या गैर-डुप्लीकेट पढ़ता है की राशि का निर्धारण करके पुस्तकालय जटिलता का मूल्यांकन करने के लिए पिकार्ड के21मार्कडुप्लीकेट चलाएं।
- कोडिंग, इनट्रॉनिक, इंटरजेनिक, यूटीआर क्षेत्रों और जीन बॉडी कवरेज पर मैपिंग प्रतिशत एकत्र करने के लिए पिकार्ड का CollectRnaSeqMetrics कार्यक्रम चलाएं।
- पढ़ें जोड़ी आंतरिक दूरी निर्धारित करने के लिए RSeQC22 भागो, सीडीएस exons, 5'UTR, 3'UTR, intron, TSS_up_1kb, TSS_up_5kb, TSS_up_10kb, TES_down_1kb, TES_down_5kb, TES_down_10kb, पढ़ें जीसी सामग्री, जंक्शन संतृप्ति, और पुस्तकालय कतरा जानकारी के बीच वितरण पढ़ें।
- एचटीएमएल प्रारूप में एक समग्र रिपोर्ट उत्पन्न करने के लिए मल्टी-क्यूसी23 चलाएं।
- जीन क्वांटिफिकेशन और सुधार विश्लेषण
- आरएसईएम RSEM24 चलाएं कच्चे गिनती के साथ-साथ सामान्यीकृत जीन और ट्रांसक्रिप्ट पर गिनती पढ़ने के लिए। पढ़ें गिनती माप जैसे RPKM (प्रति मिलियन पढ़ता है exon मॉडल के किलोबेस प्रति पढ़ता है), FPKM (प्रति मिलियन मैप ्ड पढ़ता है, और टीपीएम (प्रति मिलियन प्रति टेप) सबसे अधिक बार रिपोर्ट आरएनए-seq जीन अभिव्यक्ति मूल्यों रहे हैं । एक शोर सीमा से नीचे व्यक्त किए गए जीन (जैसे टीपीएम और एलटी; 1 या कच्चे गिनती & 5) को फ़िल्टर किया जा सकता है।
- मैप किए गए के कच्चे मामलों को कुल करने के लिए ट्रांसक्रिप्ट क्वाटिफिकेशन करें, जो एचटीएसईक्यू-काउंट या फीचरकाउंट जैसे कार्यक्रमों का उपयोग करके प्रत्येक ट्रांसक्रिप्ट दृश्यों में पढ़ता है।
- बैच प्रभाव निर्धारित करने और दिए गए डेटासेट25के गुणवत्ता मानचित्र का आकलन करने के लिए आर स्क्रिप्ट का उपयोग करके प्रमुख घटक विश्लेषण (पीसीए) चलाएं। नमूना सहसंबंध विश्लेषण विभिन्न मैट्रिक्स के बीच पियर्सन सहसंबंध का उपयोग करके किया जा सकता है।
- अंतर जीन अभिव्यक्ति विश्लेषण
- कार्यक्रम edgeR26,,27 और/या लिममा-Voom28 का उपयोग कर नमूना शर्तों के बीच जीन अंतर विश्लेषण करें और टीपीएम, टीएमएम, DESeq,या अपरक्वार्टाइलसहित सामान्यीकरण विधियों का उपयोग करें ।
- तुलना के लिए डीईजी सूचियों के दो सेट को कॉल करने और पता लगाने की संवेदनशीलता और सटीकता में सुधार करने के लिए अंतिम डीईजी प्राप्त करने के लिए कम से कम दो अंतर विश्लेषण सॉफ्टवेयर उपकरण चलाने की सिफारिश की जाती है।
- जीन सेट संवर्धन और मार्ग विश्लेषण
- जीन सेट संवर्धन विश्लेषण (GSEA)29,,30 अलग व्यक्त जीन (DEGs) सूची के एक माप के अनुसार टेप की रैंकिंग के आधार पर प्रदर्शन करने के लिए निर्धारित अगर DEGs जैविक स्थितियों के बीच सांख्यिकीय महत्वपूर्ण, concordant मतभेद दिखाते हैं ।
- जीन ओंटोलॉजी31, डेविड32,,33,या अन्य उपलब्ध सॉफ्टवेयर उपकरण जैसे संसाधनों का उपयोग करके फ़ंक्शन विश्लेषण करें।
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
ऊपर वर्णित पद्धति 67 एफएफपीई नमूनों पर लागू की गई थी जिन्हें 7-32 वर्षों के लिए विभिन्न स्थितियों के तहत संग्रहीत किया गया था (औसत नमूना भंडारण समय 17.5 साल था)। यहां प्रस्तुत डेटासेट और विश्लेषण परिणामपहले झाओ एट अल11में वर्णित और प्रकाशित किए गए थे । नमूना गुणवत्ता की जांच करने पर जैसा कि पहले वर्णित है (यानी, चित्रा 2में उदाहरण के निशान), डीवी100 डीवी200 की तुलना में अधिक उपयोगी पाया गया क्योंकि यह अत्यधिक अवक्रमित आरएनए नमूनों के लिए छोटे टुकड़े आकारों के अनुपात को सही ढंग से मापने के लिए अधिक संवेदनशील है।
दिए गए नमूने सेट में, नमूनों में से 10% से कम (67 में से 7) 30% की डीवी200 कट ऑफ से ऊपर थे, जैसा कि इलुमिना34द्वारा अनुशंसित है। लगभग 26% नमूनों (67 में से 19) में डीवी100 और जीटी था; 60% (यानी, अच्छा अनुक्रम डेटा उत्पन्न करने की अधिक संभावना), 40% (67 में से 27) डीवी100 (यानी, स्वीकार्य, लेकिन अच्छा अनुक्रम डेटा उत्पन्न करने की कम संभावना के साथ) के लिए 40%-60% रेंज में थे, और लगभग 10% (67 में से 7) में डीवी100 और एलटी; 40% (यानी, अच्छे अनुक्रम डेटा के परिणामस्वरूप होने की संभावना बहुत कम थी)। 67 नमूनों में से 14 के लिए, सॉफ्टवेयर डीवी मूल्यों का निर्धारण करने में असमर्थ था। तालिका 1 विभिन्न डीवी100 श्रेणियों में नमूनों के लिए क्यूसी मैट्रिक्स का सारांश दिखाती है। विस्तृत QC विश्लेषण और सभी ६७ नमूनों के लिए डेटा सहसंबंध के लिए, कृपया झाओ एट अल11देखें ।
नमूना सेट में गिरावट की उच्च डिग्री को देखते हुए, एक 'कुल आरएनए' पुस्तकालय तैयार करने की विधि चुनी गई थी, और अनुक्रमण पुस्तकालयों को एनईबीनेक्स्ट अल्ट्रा II आरएनए लाइब्रेरी प्रेप किट का उपयोग करके तैयार किया गया था।Table of Materials नमूना क्षरण की उच्च डिग्री के बावजूद अनुक्रमण पुस्तकालयों के प्रतिनिधित्व में सुधार करने के लिए, आरएनए की अधिकतम संभव राशि (उपलब्ध होने पर 1,000 एनजी) का उपयोग पुस्तकालय तैयार करने के इनपुट के रूप में किया गया था। इसके अतिरिक्त, एफएफपीई-आरएनए नमूनों के उच्च क्षरण के लिए rRNA कमी विधि की आवश्यकता थी, क्योंकि अवक्रमित प्रतिलिपियों में एमआरएनए कैप्चर के लिए पॉली-ए पूंछ नहीं होने की संभावना थी। RNaseH का उपयोग करके विशिष्ट जांच और संकरित टेप के पाचन के लिए संकरण द्वारा राइबोसोमल आरएनए की कमी के बाद, शेष प्रतिलिपियों को यादृच्छिक प्राइमर का उपयोग करके सीडीएनए में परिवर्तित कर दिया गया था। कम इनपुट नमूनों से तैयार पुस्तकालयों के लिए आकार चयन से भी बचा गया। अंतिम पुस्तकालयों के उदाहरण के निशान चित्र 3में दिखाए गए हैं ।
अत्यधिक अपमानित FFPE नमूने ट्यूमर के नमूनों में जीन अभिव्यक्ति प्रोफाइलिंग के लिए एक बड़ी चुनौती का प्रतिनिधित्व करते हैं । इस प्रकार, जीन क्वांटिफिकेशन की उच्च सटीकता और प्रजनन क्षमता सुनिश्चित करने के लिए डेटासेट में कलाकृतियों या असामान्यताओं का पता लगाने के लिए सही बायोइन्फॉर्मेटिक्स विश्लेषण विधियों और सॉफ्टवेयर उपकरणों को लागू करना महत्वपूर्ण है। इस अध्ययन में उपयोग किए जाने वाले सॉफ्टवेयर उपकरण अनुपूरक तालिकामें सूचीबद्ध हैं . दिए गए नमूने के सेट में, हमने अनुक्रमण और पुस्तकालय गुणवत्ता मूल्यांकन किया, जिसमें कुछ उदाहरण मैट्रिक्स चित्र4में दिखाए गए हैं। कच्चे फास्टक्यू फ़ाइल अनुक्रमण गुणवत्ता और नमूना एडाप्टर सामग्री का अवलोकन क्रमशः चित्र4A और चित्रा 4Bमें दिखाया गया है। फास्टक्यूसी स्क्रीन चित्र4 Cमें दिखाए गए नमूनों में बैक्टीरियल और माउस संदूषण जैसे संदूषण का पता लगाने में मदद कर सकती है। दिए गए सैंपल सेट में 67 नमूनों में से 41 में 5%-48% बैक्टीरियल संदूषण था, और छह नमूनों में 4%-11% माउस संदूषण(चित्रा 4C)था। स्टार संरेखण परिणाम(चित्रा 4D)संदर्भ जीनोम के लिए मैप पढ़ता है के अनुपात से पता चला, विशिष्ट संदर्भ जीनोम के लिए मैप पढ़ता है के प्रतिशत, और पढ़ता है कि मैप या कई loci को मैप नहीं थे के अनुपात । पिकार्ड CollectRNAStatistics प्रतिशत mRNA, इनट्रॉनिक, और संरेखण फ़ाइलों में मौजूद अंतरजनक ठिकानों(चित्रा 4E)निर्धारित करने के लिए इस्तेमाल किया गया था । जीन और टेप पर पढ़े गए कवरेज की एकरूपता का आकलन करने के लिए, हमने जीन बॉडी कवरेज प्लॉट उत्पन्न करने के लिए पिकार्ड सॉफ्टवेयर टूल का उपयोग किया, जो पढ़ता है कि सभी जीन के प्रत्येक न्यूक्लियोटाइड स्थिति को कवर के प्रतिशत को 5 ' यूटीआर से 3 ' यूटीआर तक डिब्बे में पहुंचा । चित्रा 4F से पता चलता है कि कुछ अपमानित पुस्तकालयों 3 ' पूर्वाग्रह था, जहां अधिक पढ़ता है 5 ' अंत की तुलना में 3 ' अंत के करीब मैप कर रहे हैं ।
एफएफपीई नमूनों में आमतौर पर जीन एक्सप्रेशन प्रोफाइल में बड़ी परिवर्तनशीलता होती है जो नमूना भंडारण, आरएनए निष्कर्षण या नमूना प्रसंस्करण के दौरान चर क्षरण के कारण उत्पन्न हो सकती है। अंतर्निहित पैटर्न को उजागर करने और नमूनों के बीच भिन्नता और सहसंबंध को मापने के लिए उचित सांख्यिकीय तरीकों का उपयोग करना महत्वपूर्ण है। हमने 67 एफएफपीई नमूनों के सबसेट से जैविक प्रतिकृति के छह जोड़े के लिए प्रमुख घटक विश्लेषण (पीसीए) लागू किया। पीसीए के एक भूखंड से पता चला है कि कुल भिन्नता का 26% पहले प्रमुख घटक द्वारा कब्जा कर लिया गया था और 19% दूसरे और तीसरे घटकों से संयुक्त(चित्रा 5)। प्रतिकृति के छह जोड़े में, प्रतिकृति के दो जोड़े पिछले चार नमूनों (0.7-0.8 के बीच सहसंबंध मूल्यों) की तुलना में उच्च विविधताओं (0.22 से नीचे सहसंबंध) था जब दोहराने जोड़े के बीच जीन अभिव्यक्ति मूल्यों की तुलना। क्योंकि प्रतिकृति एक ही एफएफपीई ब्लॉकों से काटे गए दो अलग-अलग ऊतक कर्ल से आरएनए निकालने से उत्पन्न हुई थी, ऊतक की उम्र यहां उच्च विचरण में एक कारक नहीं थी, और यह संभावना जीवाणु संदूषण (1%-55%) की विभिन्न मात्रा के कारण हुई थी साथ ही प्रतिकृति के बीच विभिन्न MRNA सामग्री (2-3 गुना अंतर)। निष्कर्षण के बाद एमआरएनए क्षरण की यादृच्छिकता भी इसी तरह की उत्पत्ति के नमूनों के बीच उच्च विचरण में योगदान दे सकती है।
चित्रा 1: RNaseq विश्लेषण कार्यप्रवाह। फ्लोचार्ट में प्रीप्रोसेसिंग, क्वालिटी असेसमेंट, मैपिंग टू रेफरेंस, जीन क्वांटिफिकेशन और विभिन्न नमूना समूहों के बीच अंतर विश्लेषण के लिए विश्लेषण चरणों का वर्णन किया गया है । कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।
चित्रा 2: उदाहरण बायोएनालाइजर छह अलग-अलग एफएफपीई-आरएनए नमूनों के निशान। क्षैतिज धुरी आणविक वजन (बीपी) और फ्लोरेसेंस इकाइयों (एफयू) को दर्शाती है और ऊर्ध्वाधर धुरी विभिन्न आकार के टुकड़ों की एकाग्रता को दर्शाती है। आरएनए इंटीग्रिटी नंबर (आरआईनए), डीवी200 (यानी, टुकड़ों का प्रतिशत और 200 बीपी), और डीवी100 (यानी, टुकड़ों का प्रतिशत और 100 बीपी) मान प्रत्येक प्रोफ़ाइल पर इंगित किए जाते हैं। प्रत्येक प्रोफ़ाइल में एक 25 बीपी पीक आणविक वजन मार्कर इंगित करता है । कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।
चित्रा 3: चार अलग-अलग नमूनों से तैयार अंतिम पुस्तकालयों के उदाहरण बायोएनालाइजर निशान। क्षैतिज धुरी ऊर्ध्वाधर धुरी पर आणविक वजन (बीपी) और फ्लोरेसेंस इकाइयों (एफयू) को दर्शाती है जो विभिन्न आकार के टुकड़ों की एकाग्रता को इंगित करती है। कम (३५ बीपी या ५० बीपी) और ऊपरी (१०,३८० बीपी) मार्कर चोटियों क्रमशः हरे और बैंगनी में लेबल कर रहे हैं । कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।
चित्रा 4: प्रीप्रोसेसिंग क्यूसी परिणामों के लिए उदाहरण मल्टी-क्यूसी रिपोर्ट। (क)लाइन चार्ट सभी अनुक्रमण के Q30 ठिकानों के प्रतिशत दिखा प्रत्येक नमूने में पढ़ता है । (ख)कच्ची फास्टक्यू फाइलों में अपाद सामग्री अनुक्रमण। (ग)बारीकी से मिलान प्रजातियों की जांच करने के लिए संदूषण स्क्रीन। (D)जीनोम मैपिंग आंकड़े । (ई) जेनकोड जीन एनोटेशन के आधार पर वितरण पढ़ें । (एफ)जीन बॉडी/ट्रांसक्रिप्ट कवरेज कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।
चित्रा 5: नमूना समूह सामंजस्य दिखाने के लिए उदाहरण पीसीए विश्लेषण। जैविक प्रतिकृति के लिए पीसीए विश्लेषण। पहले दो प्रमुख घटकों पर अपने अनुमानों का उपयोग कर दो आयामों में साजिश रची नमूनों के साथ पीसीए साजिश । जैविक प्रतिकृतिएक ही रंग में दिखाई जाती है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहां क्लिक करें ।
नमूनों की संख्या | लिब प्रस्तुत करने के लिए औसत इनपुट (एनजी) | मीडियन रिन | मीडियन डीवी200 | मीडियन डीवी100 | औसत उदारीकरण आकार (बीपी) | मीडियन लिब यील्ड (एनजी) | मीडियन लिब मोलारिटी (एनएम) | औसत नमूना भंडारण समय (वर्ष) | औसत% संदूषण | मीडियन जीन काउंट | |
डीवी100 और एलटी;40% | 7 | 237.6 | 2.5 | 6 | 34 | 445 | 24.5 | 7 | 22 | 27.4 | 14,759 |
डीवी100 40-60% | 27 | 1000 | 2.5 | 12 | 51 | 408 | 19.8 | 5.9 | 18 | 9.9 | 10,202 |
डीवी100 और 60% | 19 | 1000 | 2.3 | 26 | 73 | 355 | 84.9 | 24 | 13 | 3.2 | 9,993 |
तालिका 1: नमूना सेट क्यूसी मैट्रिक्स का सारांश। तालिका नमूनों के क्यूसी मैट्रिक्स दिखाती है, जो उनके डीवी100 मूल्यों के अनुसार समूहीकृत है। प्रत्येक समूह में नमूनों की संख्या सूचीबद्ध है, और प्रत्येक मीट्रिक के लिए औसत मूल्य दिखाए जाते हैं।
अनुपूरक तालिका: विश्लेषण सॉफ्टवेयर उपकरण, पैरामीटर और सॉफ्टवेयर संदर्भ। तालिका में आरएनए-एसईक्यू विश्लेषण के प्रत्येक चरण में उपयोग किए जाने वाले विश्लेषण सॉफ्टवेयर टूल और मापदंडों को सूचीबद्ध किया गया है। सॉफ्टवेयर टूल संदर्भ तालिका में सूचीबद्ध हैं। कृपया इस तालिका को डाउनलोड करने के लिए यहां क्लिक करें।
Subscription Required. Please recommend JoVE to your librarian.
Discussion
यहां वर्णित विधि FFPE-RNA नमूनों से अच्छा अनुक्रम डेटा प्राप्त करने के लिए आवश्यक मुख्य चरणों को रेखांकित करती है । इस विधि के साथ विचार करने के लिए मुख्य बिंदु हैं: (1) यह सुनिश्चित करें कि आरएनए को नमूना हैंडलिंग और ठंड और विगलन चक्रों को कम करके निष्कर्षण के बाद यथासंभव सर्वोत्तम रूप से संरक्षित किया जाए। अलग क्यूसी एलिकोट बहुत मददगार होते हैं। (2) दिए गए नमूना सेट के लिए सबसे अच्छा है कि एक QC मीट्रिक का उपयोग करें । आरआईएन मूल्य और डीवी200 अक्सर अवक्रमित नमूनों के लिए उपयोगी नहीं होते हैं, और डीवी100 किसी दिए गए नमूने सेट में गुणवत्ता का आकलन करने के लिए पसंद का मीट्रिक हो सकता है। (3) अधिक अवक्रमित नमूनों के लिए, उच्च नमूना इनपुट का उपयोग करना सबसे अच्छा है। उच्च इनपुट मात्रा बेहतर विविधता और अंतिम पुस्तकालय में कम दोहराव के लिए नेतृत्व, बेहतर डेटा की गुणवत्ता के लिए अग्रणी । क्योंकि एफएफपीई-आरएनए नमूनों में सभी आरएनए उच्च गिरावट और एंजाइमैटिक प्रक्रियाओं के लिए अपवर्तकता के कारण उपयोगी नहीं है, ये प्रभाव ताजा जमे हुए आरएनए की तुलना में एफएफपीई-आरएनए में अधिक स्पष्ट हैं। (4) ओलिगो-डीटी या प्राइमर्स के रूप में विशिष्ट दृश्यों के उपयोग के विपरीत रिवर्स ट्रांसक्रिप्शन चरण के लिए यादृच्छिक भड़काना का उपयोग करें। जब तक विशिष्ट जांच का सेट ब्याज के सभी टेप के लिए जितना संभव हो उतना अनुक्रम कवर करने में सक्षम नहीं है, यादृच्छिक प्राइमर सीडीएनए में अधिकतम संख्या में ट्रांसक्रिप्ट (या उसके टुकड़े) के रूपांतरण को सुनिश्चित करने के लिए एक सुरक्षित शर्त है। इस प्रकार, कुल आरएनए लाइब्रेरी तैयारी विधियां एमआरएनए विधियों की तुलना में अवक्रमित नमूनों के लिए अधिक उपयोगी हैं, जो पॉली-ए पूंछ की उपस्थिति पर भरोसा करते हैं। (5) अनुक्रमकों के अंडरपरफॉर्मेंस या ओवरलोडिंग से बचने के लिए मात्रात्मक रीयल-टाइम पीसीआर (क्यूपीसीआर) द्वारा पुस्तकालयों का सटीक मात्राकरण महत्वपूर्ण है । (6) आरएनए-सीक्यू क्यूसी प्रोटोकॉल को अनुक्रमित करने वाले मानक पोस्ट के हिस्से के रूप में आरएनए के संभावित संदूषण का आकलन करें । भंडारण की स्थिति और नमूना तैयारकरने की प्रक्रियाओं के कारण एफएफपीई नमूनों के लिए बैक्टीरियल संदूषण और जीनोमिक डीएनए संदूषण आम हैं। विदेशी प्रजातियों से दूषित नमूने संदूषण की सीमा के आधार पर अनुक्रमण कवरेज बर्बाद कर सकते हैं । इसके अलावा, आंतरिक संदूषण अधूरा rRNA कमी से उत्पन्न हो सकता है, जिससे rRNAs को मैपिंग पढ़ता है का एक उच्च प्रतिशत हो सकता है । DNase पाचन के दौरान अक्षम जीनोमिक डीएनए हटाने के टेप या टेप के गलत de novo विधानसभा की झूठी सकारात्मक अभिव्यक्ति का पता लगाने के लिए नेतृत्व कर सकते हैं । पुस्तकालय की तैयारी के दौरान शुरू किए गए एडाप्टर संदूषण भी बहुत कम आरएनए टुकड़ों के साथ अत्यधिक अवक्रमित आरएनए के लिए एक आम समस्या है। संदूषण जीन और ट्रांसक्रिप्ट प्रोफाइलिंग सटीकता को प्रभावित कर सकता है और झूठी खोज का कारण बन सकता है। इसलिए, नमूना या पुस्तकालय तैयार करने के चरणों के दौरान संदूषण स्रोतों की सही पहचान करना और यदि संभव हो तो संदूषण को हटाना महत्वपूर्ण है, या डेटा प्रसंस्करण चरण के दौरान दूषित पढ़ता है। (7) खराब गुणवत्ता और कम एमआरएनए सामग्री के नमूनों का पता लगाने के लिए प्रीप्रोसेसिंग और पोस्ट-अलाइनमेंट गुणवत्ता नियंत्रण महत्वपूर्ण है। उन नमूनों को आगे के विश्लेषण से समाप्त किया जाना चाहिए । कम जीन काउंट उत्पन्न करने वाले नमूनों से जीन अभिव्यक्ति डेटा, खराब कवरेज का उपयोग सावधानी के साथ किया जाना चाहिए । (8) डेटा प्रजनन क्षमता सुनिश्चित करने के लिए नमूनों के विचरण और सहसंबंध को मापने के लिए जैविक प्रतिकृतिको शामिल करना अच्छा अभ्यास है ।
एफएफपीई नमूने बड़ी संख्या में बीमारियों के लिए बहुत मूल्यवान संसाधन का प्रतिनिधित्व करते हैं। ऐसे नमूनों से विश्वसनीय अनुक्रम जानकारी प्राप्त करने की क्षमता विभिन्न विकारों, प्रतिरोध, और संवेदनशीलता के पीछे आणविक तंत्र को समझने के उद्देश्य से अध्ययन का एक बहुत सहायता होगी । हालांकि ऐसे नमूनों से निकाले गए आरएनए की अक्सर उप-इष्टतम गुणवत्ता द्वारा लगाई गई सीमाएं ऐसे प्रयासों में बाधा डालती हैं, लेकिन यहां वर्णित कदम उन सीमाओं को कुछ हद तक कम करने में मदद करते हैं और हमें विश्वसनीय जीन अभिव्यक्ति जानकारी प्राप्त करने के लिए एफएफपीई-आरएनए का अधिकतम उपयोग करने में सक्षम बनाते हैं।
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
इस काम को नेशनल कैंसर इंस्टीट्यूट (एनसीआई), नेशनल इंस्टीट्यूट्स ऑफ हेल्थ (एनआईएच) ने फंड दिया था । Leidos जैव चिकित्सा अनुसंधान, इंक कैंसर अनुसंधान के लिए फ्रेडरिक राष्ट्रीय प्रयोगशाला के लिए संचालन और तकनीकी सहायता ठेकेदार है जो पूरी तरह से NIH द्वारा वित्त पोषित है । कई लेखकों (YZ, एमएम, KT, YL, जेएस, बीटी) Leidos जैव चिकित्सा अनुसंधान, इंक के साथ संबद्ध हैं, लेकिन लेखकों के सभी पूरी तरह से लेखकों के वेतन और अनुसंधान सामग्री सहित राष्ट्रीय कैंसर संस्थान द्वारा वित्त पोषित कर रहे हैं । Leidos बायोमेडिकल रिसर्च, इंक ने अध्ययन के लिए लेखकों (वाईजेड, एमएम, केटी, वाईएल, जेएस, बीटी) या सामग्री के लिए वेतन प्रदान नहीं किया, न ही इसने अध्ययन डिजाइन, डेटा संग्रह, विश्लेषण, प्रकाशित करने या पांडुलिपि की तैयारी में कोई भूमिका नहीं निभाई।
Acknowledgments
हम डॉ डेनिएल कैरिक (कैंसर नियंत्रण और जनसंख्या विज्ञान, राष्ट्रीय कैंसर संस्थान के प्रभाग) के लिए जारी मदद के लिए आभारी हैं, विशेष रूप से इस अध्ययन शुरू करने के लिए, हमें नमूनों के साथ प्रदान करने, और डेटा विश्लेषण के दौरान उपयोगी सुझावों के लिए । हम ईमानदारी से नमूना तैयारी और अनुक्रमण के दौरान उनकी मदद के लिए कैंसर अनुसंधान के लिए फ्रेडरिक राष्ट्रीय प्रयोगशाला में सीसीआर अनुक्रमण सुविधा के सभी सदस्यों को धन्यवाद, नमूना QC में सहायता के लिए विशेष रूप से Brenda हो, पुस्तकालय QC के लिए Oksana जर्मन, तात्याना Smirnova अनुक्रमक चलाने के लिए । हम डेटा विश्लेषण और आरएनए-सीक्यू पाइपलाइन कार्यान्वयन के साथ मदद करने के लिए अनुक्रमण सुविधा बायोइन्फॉर्मेटिक्स समूह में टीएसएआई-वेई शेन और एशले वाल्टन का भी शुक्रिया अदा करना चाहते हैं। हम RNaseq विश्लेषण पाइपलाइन और सर्वोत्तम प्रथाओं के विकास के साथ सहायता के लिए सीसीबीआर और एनसीबीआर को भी धन्यवाद देते हैं।
Materials
Name | Company | Catalog Number | Comments |
2100 Bioanalyzer | Agilent | G2939BA | |
Agilent DNA 7500 Kit | Agilent | 5067-1506 | |
Agilent High Sensitivity DNA Kit | Agilent | 5067-4626 | |
Agilent RNA 6000 Nano Kit | Agilent | 5067-1511 | |
AllPrep DNA/RNA FFPE Kit | Qiagen | 80234 | |
CFX96 Touch System | Bio-Rad | 1855195 | |
Library Quantification kit v2-Illumina | KapaBiosystems | KK4824 | |
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina | New England Biolabs | E7765S | https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit |
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) | New England Biolabs | E6310L | |
NextSeq 500 Sequencing System | Illumina | SY-415-1001 | NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf |
NextSeq PhiX Control Kit | Illumina | FC-110-3002 | |
NSQ 500/550 Hi Output KT v2.5 (150 CYS) | Illumina | 20024907 | |
10X Genomics Magnetic Separator | 10X Genomics | 120250 | |
Rotator Multimixer | VWR | 13916-822 | |
C1000 Touch Thermal Cycler | Bio-Rad | 1851197 | |
Sequencing reagent kit | Illumina | 20024907 | |
Flow cell package | Illumina | 20024907 | |
Buffer cartridge and the reagent cartridge | Illumina | 20024907 | |
Sodium hydroxide solution (0.2N) | Millipore Sigma | SX0607D-6 | |
TRIS-HCL Buffer 1.0M, pH 7.0 | Fisher Scientific | 50-151-871 |
References
- Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
- Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
- Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
- Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
- von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
- Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
- Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
- Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
- Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
- Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
- Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
- Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
- Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
- Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
- Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019).
- Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
- Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
- Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019).
- Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
- Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
- Broad Institute. , Available from: http://broadinstitute.github.io/picard/ (2019).
- Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
- Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
- Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
- Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
- McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
- Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
- Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
- Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
- Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
- Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
- Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
- Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
- Evaluating RNA Quality from FFPE Samples. Illumina. , Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016).