अगली पीढ़ी के अनुक्रमण (NGS) जीनोमिक विशेषता है कि मंच के उच्च त्रुटि दर (~ 0.5-2.0%) द्वारा सीमित है के लिए एक शक्तिशाली उपकरण है । हम त्रुटि-सही sequencing है कि हमें NGS त्रुटि दर निराकरण और ०.०००१ के रूप में दुर्लभ रूप में संस्करण एलील अंश पर उत्परिवर्तनों का पता लगाने की अनुमति के हमारे तरीकों का वर्णन ।
पारंपरिक अगली पीढ़ी के अनुक्रमण तकनीक (NGS) एक दशक से अधिक के लिए अपार जीनोमिक लक्षण वर्णन के लिए अनुमति दी है । विशेष रूप से, NGS द्रोह में क्लोनल उत्परिवर्तनों के स्पेक्ट्रम का विश्लेषण करने के लिए इस्तेमाल किया गया है । हालांकि अभी तक पारंपरिक सैंज तरीकों की तुलना में अधिक कुशल, NGS अपने ~ 0.5-2.0% की उच्च त्रुटि दर के कारण दुर्लभ क्लोनिंग और उपक्लोन उत्परिवर्तनों की पहचान के साथ संघर्ष । इस प्रकार, मानक NGS है कि उत्परिवर्तनों के लिए पता लगाने की एक सीमा है > 0.02 संस्करण एलील अंश (VAF) । जबकि रोग ज्ञात बीमारी के बिना रोगियों में इस दुर्लभ उत्परिवर्तन के लिए नैदानिक महत्व स्पष्ट रहता है, ल्यूकेमिया के लिए इलाज रोगियों काफी परिणाम में सुधार हुआ है जब अवशिष्ट रोग < 0.0001 द्वारा प्रवाह cytometry है । आदेश में NGS के इस artefactual पृष्ठभूमि को कम करने के लिए, कई तरीकों को विकसित किया गया है । यहां हम त्रुटि के लिए एक विधि का वर्णन-सही डीएनए और आरएनए अनुक्रमण (ईसीएस), जो दोनों एक 16 बीपी यादृच्छिक सूचकांक के साथ टैगिंग व्यक्तिगत अणुओं शामिल है त्रुटि-सुधार और मल्टीप्लेक्स के लिए एक 8 बीपी रोगी-विशिष्ट सूचकांक । हमारे विधि का पता लगाने और संस्करण एलील भिन्न (VAFs) परिमाण के दो आदेश NGS का पता लगाने की सीमा से कम है और ०.०००१ VAF के रूप में दुर्लभ के रूप में विरल पर ट्रैक कर सकते हैं ।
जैसा कि हम उंर, सेल प्रभाग के दौरान mutagens और stochastic त्रुटियों के लिए जोखिम जीनोम में दैहिक विचलन के संचय में परिणाम है, और यह घातक परिवर्तन, न्यूरो विकासात्मक रोगों, बाल चिकित्सा के मौलिक रोगजनन पर निर्भर विकारों और सामांय उंर बढ़ने1,2। रोग के साथ दैहिक उत्परिवर्तनों-ड्राइविंग संभावित प्रारंभिक पता लगाने और जोखिम प्रबंधन3,4,5के लिए महत्वपूर्ण नैदानिक और शकुनी मार्क्स हैं । आदेश में बेहतर शारीरिक clonogenesis, जो नैदानिक और अनुसंधान फैसलों को सूचित करेंगे समझने के लिए, सटीक ठहराव और इन उत्परिवर्तनों के लक्षण वर्णन प्राथमिक महत्व का है । अगली पीढ़ी के अनुक्रमण (NGS) वर्तमान में विषम डीएनए नमूनों में क्लोनल उत्परिवर्तनों का अध्ययन करने के लिए प्रयोग किया जाता है; हालांकि, NGS पर उत्परिवर्तनों की पहचान करने के लिए सीमित है > 0.02 संस्करण एलील अंश (VAF)-के कारण अंतर्निहित त्रुटि-0.5 की दर-2.0% के अनुक्रमण प्लेटफार्मों6,7,8। नतीजतन, कम VAF में नैदानिक और prognostically महत्वपूर्ण दैहिक वेरिएंट ट्रैकिंग मानक NGS का उपयोग कर प्राप्त नहीं किया जा सकता है ।
हाल ही में, NGS8,9,10,11की त्रुटि दर को दरकिनार करने के लिए विभिन्न विधियों का विकास किया गया है । इन तरीकों आणविक टैगिंग, जो अनुक्रमण के बाद त्रुटि सुधार सक्षम बनाता है का उपयोग । अनुक्रमण लाइब्रेरी में प्रत्येक अणु या जीनोमिक टुकड़ा एक यादृच्छिक अद्वितीय आणविक पहचानकर्ता (UMI) है कि अणु के लिए विशिष्ट है के साथ टैग किया जाता है । UMIs यादृच्छिक न्यूक्लियोटाइड (8-16 एन) के एक स्ट्रिंग के परिवर्तन के द्वारा निर्माण कर रहे हैं । एक दूसरा नमूना-विशिष्ट बारकोड भी कार्यप्रवाह में एकीकृत है जो एक ही NGS अनुक्रमण चलाने में कई नमूने मल्टीप्लेक्सिंग सक्षम बनाता है । पीसीआर प्रवर्धन आणविक टैग पुस्तकालय पर किया जाता है, और बाद में पुस्तकालय अनुक्रमण के लिए भेजा जाता है । पुस्तकालय की तैयारी के दौरान, यह है कि त्रुटियों बेतरतीब ढंग से पीसीआर प्रवर्धन और अनुक्रमण8के दौरान जीनोमिक टुकड़ा करने के लिए पेश किया जाएगा उम्मीद है । यादृच्छिक sequencing त्रुटियों को निकालने के लिए, अपुष्ट sequencing पढ़ता UMI के अनुसार समूहीकृत होते हैं । sequencing से कलाकृतियों की उंमीद नहीं कर रहे है सभी में एक ही UMI के साथ एक ही जीनोमिक स्थिति में परिचय की stochastic प्रकृति के कारण पढ़ता है, जबकि एक सच्चे संस्करण ईमानदारी से परिलक्षित किया जाएगा और सभी पढ़ता है कि शेयर एक ही UMI में अनुक्रम । कलाकृतियों को bioinformatically निकाला जाता है । यहां, हम एक न्यूक्लियोटाइड वेरिएंट (SNVs) और छोटे सम्मिलन-विलोपन (Indels) की पहचान करने के लिए डीएनए के लिए प्रयोगशाला में अनुकूलित त्रुटि-सही sequencing (ईसीएस) की तीन विधियों का वर्णन है, और नीचे जीन अभिव्यक्ति की ठहराव की सुविधा के लिए आरएनए के लिए NGS त्रुटि थ्रेशोल्ड ।
पहली विधि का वर्णन एक तरह से दुर्लभ दैहिक जीन विशिष्ट शोधकर्ताओं द्वारा डिजाइन प्राइमरों का उपयोग कर घटना के लिए देखो । पुस्तकालय की तैयारी करने से पहले, शोधकर्ताओं डिजाइन प्राइमरों के लिए ब्याज के टुकड़े लक्ष्य चाहिए । हमने वेब-एप Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/) का इस्तेमाल किया था । Amplicons 200 – 250 bp पोलीमरेज़ श्रृंखला प्रतिक्रिया के लिए आदर्श होते हैं (पीसीआर) के रूप में ये होगा, एक बार UMIs शामिल किया गया है, उत्पन्न अतिव्यापी युग्मित-अंत १५० बीपी युग्मित अंत पढ़ता के साथ पढ़ता है. इष्टतम प्राइमर डिजाइन शर्तों के लिए इस्तेमाल किया जा रहे हैं: ंयूनतम प्राइमर आकार = 19; इष्टतम प्राइमर आकार = 25; अधिकतम प्राइमर आकार = 30; न्यूनतम Tm = ६४ ° c; इष्टतम Tm = ७० ° c; अधिकतम Tm = ७४ डिग्री सेल्सियस; अधिकतम Tm अंतर = 5 ° c; न्यूनतम GC सामग्री = ४५; अधिकतम GC सामग्री = ८०; वापसी के लिए संख्या = 20; अधिकतम 3 ‘ अंत स्थिरता = १०० ।
विधि 2 में, हम एक Illumina रसायन विज्ञान के साथ ईसीएस-डीएनए प्रोटोकॉल के संयोजन के रूप में ०.०००१ VAF व्यावसायिक रूप से उपलब्ध जीन पैनलों है कि amplicons के सैकड़ों शामिल का उपयोग दुर्लभ के रूप में कम से कम क्लोनल SNVs और छोटे Indels के लिए सर्वेक्षण विधि का वर्णन । हम हमारे प्रयोग के लिए TruSight माइलॉयड अनुक्रमण पैनल (Illumina) का इस्तेमाल किया है और बाल चिकित्सा माइलॉयड रोगों के लिए ब्याज की अतिरिक्त जीन शामिल करने के लिए एक विस्तारित पैनल डिजाइन किए हैं । इन पैनलों अद्वितीय आणविक पहचानकर्ता (UMIs) है कि त्रुटि सुधार की सुविधा होगी की पेशकश नहीं की है, तो हम इन पैनलों के लिए अपने स्वयं के अनुकूलक रणनीति जोड़ लिया है । ईसीएस को विभिन्न रोगों से जुड़े जीन के लिए समृद्ध करने के लिए बनाए गए अन्य पैनलों में से किसी के साथ समान रूप से अच्छी तरह काम करना चाहिए । डीएनए अलगाव और ऊतक या ब्याज के नमूने से बाद में ठहराव के बाद, यह नमूना प्रति शेयर डीएनए के कम से ५०० एनजी की सिफारिश की है । हम नियमित रूप से एक एकल sequencing पुस्तकालय डीएनए के २५० एनजी का उपयोग करने के लिए बहाव के लिए संभव के रूप में ज्यादा अद्वितीय जीनोमिक टुकड़ा पर कब्जा करने के लिए de-दोहराव और VAF गणना पढ़ता है । एक वैकल्पिक दोहराने अनुक्रमण पुस्तकालय डीएनए के शेष २५० एनजी के साथ किया जा सकता है । हम हमेशा दो नमूने के अनुसार नकल पुस्तकालयों बनाने के लिए, और हम केवल उन घटनाओं पर विचार दोनों में स्वतंत्र रूप से पता चला सच सकारात्मक रूप में प्रतिकृतियां । हम भी4,13फोन करने वाले संस्करण की सटीकता बढ़ाने के लिए एक जीनोमिक स्थिति-विशिष्ट द्विपद त्रुटि मॉडल लागू किया गया ।
अंत में, हम एक विधि का वर्णन करने के लिए ईसीएस अनुक्रमण करने के लिए प्रतिलिपि ठहराव के लिए एक युग्मन-शेल्फ QIAseq लक्षित आरएनए पैनलों (Qiagen) का उपयोग कर । de-दोहराव और त्रुटि सुधार के लिए आवश्यक UMIs को किट में शामिल किया गया है, और शोधकर्ताओं ने निर्माता की सिफारिशों के बाद पुस्तकालयों कर सकते हैं । Bioinformatically, शोधकर्ताओं ईसीएस-डीएनए, जो प्रोटोकॉल अनुभाग में विस्तार से समझाया जाएगा के लिए उल्लिखित पाइपलाइन का पालन कर सकते हैं ।
यहाँ, हम त्रुटि-सही अनुक्रमण प्रोटोकॉल है कि आसानी से विभिन्न रोगों में कम VAFs के साथ उत्परिवर्तनों का अध्ययन करने के लिए लागू किया जा सकता का एक सूट प्रदर्शित करता है । सबसे महत्वपूर्ण कारक अनुक्रमण से पहले प्रत्येक अणु के साथ UMIs के शामिल होने के रूप में वे रॉ पढ़ता के त्रुटि-सुधार सक्षम है । यहां वर्णित तरीकों शोधकर्ताओं दोनों व्यावसायिक रूप से उपलब्ध जीन पैनलों और स्वयं जीन विशिष्ट ओलिगोस्पर्मिया डिजाइन करने के लिए अनुकूलित UMIs शामिल करने के लिए अनुमति देते हैं ।
मानक NGS प्रोटोकॉल अनुक्रमण त्रुटि दर के कारण 2% से नीचे VAF के साथ उत्परिवर्तनों का पता लगाने precludes, और इस अध्ययन में NGS के आवेदन सीमा जहां दुर्लभ वेरिएंट का पता लगाने महत्वपूर्ण है । मानक NGS त्रुटि दर को दरकिनार करके, ईसीएस इन रॉ वेरिएंट के संवेदनशील पता लगाने में सक्षम बनाता है । उदाहरण के लिए, रोगजनक उत्परिवर्तनों का पता लगाने जब इन उत्परिवर्तनों पहले उठता (इसलिए कम VAF होने)14,15रोग के जल्दी हस्तक्षेप को सूचित करने के लिए आवश्यक है । ल्यूकेमिया अनुसंधान में, न्यूनतम अवशिष्ट रोग का पता लगाने (अवशिष्ट ल्यूकेमिया से प्रभावित कोशिकाओं के बाद उपचार) जोखिम स्तरीकरण को सूचित करता है और एक तरह से है कि बाइनरी फ्लो cytometric आकलन नहीं कर सकते में उपचार के विकल्पों को सूचना देने के लिए इस्तेमाल किया जा सकता है । इसके अलावा, ईसीएस परिचालित ट्यूमर न्यूक्लिक एसिड का पता लगाने के लिए और उपस्थिति के लिए आकलन द्वारा ठोस ट्यूमर रोगियों में मेटास्टेटिक क्षमता का मूल्यांकन करने के लिए लागू है/अनुपस्थिति के साथ ही कुछ उत्परिवर्तनों के संस्करण बोझ है कि प्राथमिक की विशेषताओं रहे हैं ट्यूमर16.
तालिका 1में प्रदर्शित किया गया के रूप में, वेरिएंट को कॉल करने के लिए द्विपद वितरण-आधारित स्थिति-विशिष्ट त्रुटि मॉडल का उपयोग करने की शक्ति काफी हद तक अनुक्रम पुस्तकालयों की संख्या के रूप में के रूप में अच्छी तरह से त्रुटि मॉडल बनाने के लिए इस्तेमाल अनुक्रमण की गहराई पर निर्भर करता है । नमूनों की अधिक संख्या और अधिक अनुक्रमण गहराई के साथ त्रुटि मॉडल की मजबूती बढ़ जाती है । यह प्रत्येक नमूने के लिए एक त्रुटि प्रोफ़ाइल बनाने के लिए प्रति नमूना 3000x की त्रुटि-सही पढ़ा कवरेज का एक औसत के साथ कम से कम 10 अनुक्रम नमूनों का उपयोग करने के लिए अनुशंसित है । स्थिति-विशिष्ट दृष्टिकोण MAGERI के समान है, लेकिन इसके बजाय सभी छह अलग प्रतिस्थापन प्रकार के लिए एक समग्र त्रुटि दर का उपयोग कर के (ए > सी/टी > जी, एक > जी/टी > सी, एक > टी/टी > ए, सी > ए/जी > टी, सी > जी/ , सी > टी/जी > एक)13, हम प्रत्येक प्रतिस्थापन स्वतंत्र रूप से हर स्थिति में मॉडल । उदाहरण के लिए, एक दिया जीनोमिक स्थिति में सी > टी की एक त्रुटि दर एक और स्थिति से अलग है । हमारे दृष्टिकोण भी खाते में एक sequencing बैच प्रभाव लेता है, के रूप में एक sequencing रन में मनाया आधार प्रतिस्थापन दर दूसरे रन से अलग हो सकता है । इसलिए यह मॉडल बनाने के लिए अलग sequencing रन से नमूने विशेष रूप से सभी प्रतिस्थापन प्रकार के लिए प्रत्येक स्थिति के लिए महत्वपूर्ण है.
एक महत्वपूर्ण विचार जब एक ईसीएस प्रयोग डिजाइनिंग वांछित पता लगाने सीमा है । NGS अध्ययनों की खूबसूरती है कि वे आसानी से जीन के मामले में स्केल किया जा सकता है/ब्याज के लक्ष्य, पता लगाने सीमा (अनुक्रमण की गहराई से तय), और व्यक्तियों की संख्या पूछे । उदाहरण के लिए, यदि शोधकर्ताओं ने ०.०००१ का पता लगाने की दहलीज के साथ दो amplicons में दुर्लभ उत्परिवर्तनों को खोजने के लिए रुचि रखते हैं, वे एक एकल sequencing MiSeq V2 रसायन विज्ञान जो १५,०००,००० तक outputs का उपयोग कर चलाने में अधिक से अधिक ७५ नमूनों पूल कर सकते हैं (2 amplicons * १०,००० अणु * 10 त्रुटि के लिए पढ़ता-सुधार * ७५ नमूने = १५,०००,००० अनुक्रमण पढ़ता). शोधकर्ताओं sequencing में जा रहे अणुओं की संख्या में भिन्न हो सकते हैं या पता लगाना थ्रेशोल्ड को समायोजित करने के लिए चलाएँ एक एकल sequencing में pooled नमूनों की संख्या. हमारे अध्ययन में, हम Illumina जीन पैनल का उपयोग ०.०००१ VAF (1:10000) का पता लगाने दहलीज के साथ उत्परिवर्तनों को खोजने के उद्देश्य से । हम नियमित रूप से डीएनए शुरू करने के लिए सुनिश्चित करें कि पर्याप्त अणुओं पर कब्जा कर लिया है क्रम में aforementioned पता लगाने की सीमा को प्राप्त करने के २५० एनजी का इस्तेमाल करते हैं । शोधकर्ताओं ने डीएनए की कम राशि के साथ शुरू करने के लिए विकल्प चुन सकते हैं (५० एनजी की सिफारिश की है) यदि वांछित पता लगाने की सीमा है > 0.001 VAF.
के रूप में UMIs i5 अनुक्रमित पर जोड़े जाते हैं, sequencing सेटिंग्स तदनुसार संशोधन किया जाना है । उदाहरण के लिए, हम 16 N UMIs उपयोग किया, और sequencing सेटिंग्स थे 2×144 युग्मित अंत पढ़ता, अनुक्रमणिका 2 के 8 चक्रों और अनुक्रमणिका 2 के 16 चक्र के रूप में सामांय 8 चक्रों के लिए विरोध किया है । सूचकांक 2 चक्र में वृद्धि के लिए आवंटित चक्रों की कुल संख्या में कमी से मुआवजा दिया है पढ़ता है । शोधकर्ताओं 12N UMIs10,17का उपयोग करने के लिए चुनते हैं, तो सेटिंग्स अनुक्रमणिका 2 के 12 चक्र के लिए परिवर्तित किया जाना चाहिए ।
यह UMI-आधारित sequencing विधि sequencing त्रुटियों के लिए सही करने के लिए ऑप्टिमाइज़ किया गया है । यह पीसीआर jackpotting, जो सभी प्रवर्धन के लिए एक मुद्दा है आधारित विधि से निपटने में इष्टतम रहता है । हम ddPCR का उपयोग कर के बाद अनुक्रमण और पोस्ट bioinformatics सत्यापन के दौर प्रदर्शन किया, और हम शायद ही पीसीआर jackpotting के कारण किसी भी झूठी सकारात्मक का पता लगाने । बहरहाल, यह अनुशंसा की जाती है कि शोधकर्ताओं उच्च निष्ठा पोलीमरेज़ का उपयोग करने के लिए कम प्रवर्धन त्रुटियों को सुनिश्चित प्रयोगों आचरण ।
The authors have nothing to disclose.
हम बच्चों के कैंसर विज्ञान समूह AAML1531 अध्ययन और रोगी नमूनों के रूप में उनके योगदान के लिए नर्सों के स्वास्थ्य अध्ययन में प्रतिभागियों को धन्यवाद । यह काम स्वास्थ्य के राष्ट्रीय संस्थानों द्वारा वित्त पोषित किया गया (UM1 CA186107, RO1 CA49449 और RO1 CA149445), बच्चों की खोज वाशिंगटन विश्वविद्यालय के संस्थान और सेंट लुइस बच्चों के अस्पताल (MC-II-2015-461), और एली सेठ मैथ्यू ल्यूकेमिया फाउंडेशन.
Q5 High Fidelity Hot Start Master Mix | New England BioLabs | M0492S | |
Agencourt AMPure XP | Beckman Coulter | A63880 | |
Qubit dsDNA HS Assay Kit | Thermo Fisher Scientific | Q32854 | |
SYBR Safe DNA Gel Stain | Thermo Fisher Scientific | S33102 | |
Truseq Custom Amplicon Index Kit | Illumina | FC-130-1003 | |
UMI i5 adapter sequences | Integrated DNA Technologies | – | |
NEBNext Ultra End Repair/dA-Tailing Module | New England BioLabs | E7442S | |
NEBNext Ultra II Ligation Module | New England BioLabs | E7595S | |
QX200 ddPCR EvaGreen Supermix | Bio-Rad | 1864034 | |
QX200 Droplet Generation Oil for EvaGreen | Bio-Rad | 1864005 | |
QX200 Droplet Digital PCR System | Bio-Rad | 1864001 | |
ddPCR 96-Well Plates | Bio-Rad | 12001925 | |
DG8 Cartridges for QX200/QX100 Droplet Generator | Bio-Rad | 1864008 | |
DG8 Gaskets for QX200/QX100 Droplet Generator | Bio-Rad | 1863009 | |
Bioanalyzer | Agilent Genomics | G2939BA | |
TapeStation | Agilent Genomics | G2991AA | |
TruSight Myeloid Sequencing Panel | Illumina | FC-130-1010 | |
Bowtie 2 | Johns Hopkins University | – | |
Customized QIAseq Targeted RNA Panel | Qiagen | – | |
Rneasy Plus Mini Kit (50) | Qiagen | 74134 |