Rare Event Detection Using Error-corrected DNA and RNA Sequencing

Wing H. Wong; R. Spencer Tong; Andrew L. Young; Todd E. Druley

doi:10.3791/57509

JoVE Journal > Genetics

Please note that all translations are automatically generated. Click here for the English version.

Genetics

त्रुटि-सही डीएनए और आरएनए अनुक्रमण का उपयोग कर दुर्लभ घटना का पता लगाने

Published: August 03, 2018

doi:

10.3791/57509

Wing H. Wong*^1,2, R. Spencer Tong*^1,2, Andrew L. Young², Todd E. Druley²

¹Department of Pediatrics, Division of Hematology and Oncology,Washington University School of Medicine, ²Center for Genome Sciences and Systems Biology,Washington University School of Medicine

Summary

अगली पीढ़ी के अनुक्रमण (NGS) जीनोमिक विशेषता है कि मंच के उच्च त्रुटि दर (~ 0.5-2.0%) द्वारा सीमित है के लिए एक शक्तिशाली उपकरण है । हम त्रुटि-सही sequencing है कि हमें NGS त्रुटि दर निराकरण और ०.०००१ के रूप में दुर्लभ रूप में संस्करण एलील अंश पर उत्परिवर्तनों का पता लगाने की अनुमति के हमारे तरीकों का वर्णन ।

Abstract

पारंपरिक अगली पीढ़ी के अनुक्रमण तकनीक (NGS) एक दशक से अधिक के लिए अपार जीनोमिक लक्षण वर्णन के लिए अनुमति दी है । विशेष रूप से, NGS द्रोह में क्लोनल उत्परिवर्तनों के स्पेक्ट्रम का विश्लेषण करने के लिए इस्तेमाल किया गया है । हालांकि अभी तक पारंपरिक सैंज तरीकों की तुलना में अधिक कुशल, NGS अपने ~ 0.5-2.0% की उच्च त्रुटि दर के कारण दुर्लभ क्लोनिंग और उपक्लोन उत्परिवर्तनों की पहचान के साथ संघर्ष । इस प्रकार, मानक NGS है कि उत्परिवर्तनों के लिए पता लगाने की एक सीमा है > 0.02 संस्करण एलील अंश (VAF) । जबकि रोग ज्ञात बीमारी के बिना रोगियों में इस दुर्लभ उत्परिवर्तन के लिए नैदानिक महत्व स्पष्ट रहता है, ल्यूकेमिया के लिए इलाज रोगियों काफी परिणाम में सुधार हुआ है जब अवशिष्ट रोग < 0.0001 द्वारा प्रवाह cytometry है । आदेश में NGS के इस artefactual पृष्ठभूमि को कम करने के लिए, कई तरीकों को विकसित किया गया है । यहां हम त्रुटि के लिए एक विधि का वर्णन-सही डीएनए और आरएनए अनुक्रमण (ईसीएस), जो दोनों एक 16 बीपी यादृच्छिक सूचकांक के साथ टैगिंग व्यक्तिगत अणुओं शामिल है त्रुटि-सुधार और मल्टीप्लेक्स के लिए एक 8 बीपी रोगी-विशिष्ट सूचकांक । हमारे विधि का पता लगाने और संस्करण एलील भिन्न (VAFs) परिमाण के दो आदेश NGS का पता लगाने की सीमा से कम है और ०.०००१ VAF के रूप में दुर्लभ के रूप में विरल पर ट्रैक कर सकते हैं ।

Introduction

जैसा कि हम उंर, सेल प्रभाग के दौरान mutagens और stochastic त्रुटियों के लिए जोखिम जीनोम में दैहिक विचलन के संचय में परिणाम है, और यह घातक परिवर्तन, न्यूरो विकासात्मक रोगों, बाल चिकित्सा के मौलिक रोगजनन पर निर्भर विकारों और सामांय उंर बढ़ने¹^,²। रोग के साथ दैहिक उत्परिवर्तनों-ड्राइविंग संभावित प्रारंभिक पता लगाने और जोखिम प्रबंधन³^,⁴^,⁵के लिए महत्वपूर्ण नैदानिक और शकुनी मार्क्स हैं । आदेश में बेहतर शारीरिक clonogenesis, जो नैदानिक और अनुसंधान फैसलों को सूचित करेंगे समझने के लिए, सटीक ठहराव और इन उत्परिवर्तनों के लक्षण वर्णन प्राथमिक महत्व का है । अगली पीढ़ी के अनुक्रमण (NGS) वर्तमान में विषम डीएनए नमूनों में क्लोनल उत्परिवर्तनों का अध्ययन करने के लिए प्रयोग किया जाता है; हालांकि, NGS पर उत्परिवर्तनों की पहचान करने के लिए सीमित है > 0.02 संस्करण एलील अंश (VAF)-के कारण अंतर्निहित त्रुटि-0.5 की दर-2.0% के अनुक्रमण प्लेटफार्मों⁶^,⁷^,⁸। नतीजतन, कम VAF में नैदानिक और prognostically महत्वपूर्ण दैहिक वेरिएंट ट्रैकिंग मानक NGS का उपयोग कर प्राप्त नहीं किया जा सकता है ।

हाल ही में, NGS⁸^,⁹^,¹⁰^,¹¹की त्रुटि दर को दरकिनार करने के लिए विभिन्न विधियों का विकास किया गया है । इन तरीकों आणविक टैगिंग, जो अनुक्रमण के बाद त्रुटि सुधार सक्षम बनाता है का उपयोग । अनुक्रमण लाइब्रेरी में प्रत्येक अणु या जीनोमिक टुकड़ा एक यादृच्छिक अद्वितीय आणविक पहचानकर्ता (UMI) है कि अणु के लिए विशिष्ट है के साथ टैग किया जाता है । UMIs यादृच्छिक न्यूक्लियोटाइड (8-16 एन) के एक स्ट्रिंग के परिवर्तन के द्वारा निर्माण कर रहे हैं । एक दूसरा नमूना-विशिष्ट बारकोड भी कार्यप्रवाह में एकीकृत है जो एक ही NGS अनुक्रमण चलाने में कई नमूने मल्टीप्लेक्सिंग सक्षम बनाता है । पीसीआर प्रवर्धन आणविक टैग पुस्तकालय पर किया जाता है, और बाद में पुस्तकालय अनुक्रमण के लिए भेजा जाता है । पुस्तकालय की तैयारी के दौरान, यह है कि त्रुटियों बेतरतीब ढंग से पीसीआर प्रवर्धन और अनुक्रमण⁸के दौरान जीनोमिक टुकड़ा करने के लिए पेश किया जाएगा उम्मीद है । यादृच्छिक sequencing त्रुटियों को निकालने के लिए, अपुष्ट sequencing पढ़ता UMI के अनुसार समूहीकृत होते हैं । sequencing से कलाकृतियों की उंमीद नहीं कर रहे है सभी में एक ही UMI के साथ एक ही जीनोमिक स्थिति में परिचय की stochastic प्रकृति के कारण पढ़ता है, जबकि एक सच्चे संस्करण ईमानदारी से परिलक्षित किया जाएगा और सभी पढ़ता है कि शेयर एक ही UMI में अनुक्रम । कलाकृतियों को bioinformatically निकाला जाता है । यहां, हम एक न्यूक्लियोटाइड वेरिएंट (SNVs) और छोटे सम्मिलन-विलोपन (Indels) की पहचान करने के लिए डीएनए के लिए प्रयोगशाला में अनुकूलित त्रुटि-सही sequencing (ईसीएस) की तीन विधियों का वर्णन है, और नीचे जीन अभिव्यक्ति की ठहराव की सुविधा के लिए आरएनए के लिए NGS त्रुटि थ्रेशोल्ड ।

पहली विधि का वर्णन एक तरह से दुर्लभ दैहिक जीन विशिष्ट शोधकर्ताओं द्वारा डिजाइन प्राइमरों का उपयोग कर घटना के लिए देखो । पुस्तकालय की तैयारी करने से पहले, शोधकर्ताओं डिजाइन प्राइमरों के लिए ब्याज के टुकड़े लक्ष्य चाहिए । हमने वेब-एप Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/) का इस्तेमाल किया था । Amplicons 200 – 250 bp पोलीमरेज़ श्रृंखला प्रतिक्रिया के लिए आदर्श होते हैं (पीसीआर) के रूप में ये होगा, एक बार UMIs शामिल किया गया है, उत्पन्न अतिव्यापी युग्मित-अंत १५० बीपी युग्मित अंत पढ़ता के साथ पढ़ता है. इष्टतम प्राइमर डिजाइन शर्तों के लिए इस्तेमाल किया जा रहे हैं: ंयूनतम प्राइमर आकार = 19; इष्टतम प्राइमर आकार = 25; अधिकतम प्राइमर आकार = 30; न्यूनतम Tm = ६४ ° c; इष्टतम Tm = ७० ° c; अधिकतम Tm = ७४ डिग्री सेल्सियस; अधिकतम Tm अंतर = 5 ° c; न्यूनतम GC सामग्री = ४५; अधिकतम GC सामग्री = ८०; वापसी के लिए संख्या = 20; अधिकतम 3 ‘ अंत स्थिरता = १०० ।

विधि 2 में, हम एक Illumina रसायन विज्ञान के साथ ईसीएस-डीएनए प्रोटोकॉल के संयोजन के रूप में ०.०००१ VAF व्यावसायिक रूप से उपलब्ध जीन पैनलों है कि amplicons के सैकड़ों शामिल का उपयोग दुर्लभ के रूप में कम से कम क्लोनल SNVs और छोटे Indels के लिए सर्वेक्षण विधि का वर्णन । हम हमारे प्रयोग के लिए TruSight माइलॉयड अनुक्रमण पैनल (Illumina) का इस्तेमाल किया है और बाल चिकित्सा माइलॉयड रोगों के लिए ब्याज की अतिरिक्त जीन शामिल करने के लिए एक विस्तारित पैनल डिजाइन किए हैं । इन पैनलों अद्वितीय आणविक पहचानकर्ता (UMIs) है कि त्रुटि सुधार की सुविधा होगी की पेशकश नहीं की है, तो हम इन पैनलों के लिए अपने स्वयं के अनुकूलक रणनीति जोड़ लिया है । ईसीएस को विभिन्न रोगों से जुड़े जीन के लिए समृद्ध करने के लिए बनाए गए अन्य पैनलों में से किसी के साथ समान रूप से अच्छी तरह काम करना चाहिए । डीएनए अलगाव और ऊतक या ब्याज के नमूने से बाद में ठहराव के बाद, यह नमूना प्रति शेयर डीएनए के कम से ५०० एनजी की सिफारिश की है । हम नियमित रूप से एक एकल sequencing पुस्तकालय डीएनए के २५० एनजी का उपयोग करने के लिए बहाव के लिए संभव के रूप में ज्यादा अद्वितीय जीनोमिक टुकड़ा पर कब्जा करने के लिए de-दोहराव और VAF गणना पढ़ता है । एक वैकल्पिक दोहराने अनुक्रमण पुस्तकालय डीएनए के शेष २५० एनजी के साथ किया जा सकता है । हम हमेशा दो नमूने के अनुसार नकल पुस्तकालयों बनाने के लिए, और हम केवल उन घटनाओं पर विचार दोनों में स्वतंत्र रूप से पता चला सच सकारात्मक रूप में प्रतिकृतियां । हम भी⁴^,¹³फोन करने वाले संस्करण की सटीकता बढ़ाने के लिए एक जीनोमिक स्थिति-विशिष्ट द्विपद त्रुटि मॉडल लागू किया गया ।

अंत में, हम एक विधि का वर्णन करने के लिए ईसीएस अनुक्रमण करने के लिए प्रतिलिपि ठहराव के लिए एक युग्मन-शेल्फ QIAseq लक्षित आरएनए पैनलों (Qiagen) का उपयोग कर । de-दोहराव और त्रुटि सुधार के लिए आवश्यक UMIs को किट में शामिल किया गया है, और शोधकर्ताओं ने निर्माता की सिफारिशों के बाद पुस्तकालयों कर सकते हैं । Bioinformatically, शोधकर्ताओं ईसीएस-डीएनए, जो प्रोटोकॉल अनुभाग में विस्तार से समझाया जाएगा के लिए उल्लिखित पाइपलाइन का पालन कर सकते हैं ।

Protocol

1. लक्षित त्रुटि-डीएनए के लिए सही अनुक्रमण पीसीआर ब्याज के जीनोमिक टुकड़े का प्रवर्धन । एक उच्च निष्ठा डीएनए पोलीमरेज़ का उपयोग करने के लिए amplicons बढ़ाना (सामग्री तालिका, आइटम 1) । एक थर्मल साइकिल चालक में निम्नलिखित स्थितियों के साथ पीसीआर प्रतिक्रिया बढ़ाना: ९८ डिग्री सेल्सियस पर 30 एस; 18 – 10 एस के 40 चक्र ९८ ° c, 30 s at ६६ ° c, और 30 s at ७२ ° c; ७२ डिग्री सेल्सियस पर 2 मिनट; 4 डिग्री सेल्सियस पर पकड़ो । paramagnetic मोतियों (सामग्री तालिका, आइटम 2) के साथ पीसीआर उत्पादों को शुद्ध । एक 1 में मोतियों की प्रतिक्रिया जोड़ें: १.८ अनुपात (पीसीआर रिएक्शन वॉल्यूम: मनका मात्रा) निर्माता के प्रोटोकॉल के अनुसार । ddH2ओ के 20 µ l के साथ Elute । डीएनए की एकाग्रता को बढ़ाता है (सामग्री तालिका, आइटम 3) डीएनए की अंतिम एकाग्रता निर्धारित करने के लिए । amplicons के आकार की पुष्टि करने के लिए 2% agarose जेल (सामग्री तालिका, आइटम 4) पर डीएनए का एक aliquot भागो ।नोट: वैकल्पिक रूप से, शोधकर्ताओं ने प्रवर्धित जीनोमिक अंशों के आकार का निर्धारण करने के साथ ही उत्पादों की एकाग्रता को निर्धारित करने के लिए पीसीआर उत्पादों पर विश्लेषक विश्लेषण करने का विकल्प चुन सकते हैं । sequencing एडेप्टर एनीलिंग i7 एडाप्टर (सामग्री तालिका, आइटम 5) प्राप्त करें । उंहें उपयोग के रूप में वे बाद के चरणों के लिए प्रदान की जाती हैं । खरीद 16N i5 एडेप्टर वाणिज्यिक रूप से निम्नलिखित oligo अनुक्रम के साथ (सामग्री तालिका आइटम 6): AATGATACGGCGACCACCGAGATCTACAC (N1:25252525) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) (N1) ACACTCTTTCCCTACACGACGCTCTTCCGATCTनोट: 16N i5 एडेप्टर मानक i5 एडेप्टर की जगह है और वे एडाप्टर 16 यादृच्छिक-न्यूक्लियोटाइड की एक स्ट्रिंग के साथ ईसीएस की सुविधा के लिए कर रहे हैं । बनाने 16N i5 अनुकूलक काम समाधान: ४० µ l की १०० µ m 16N i5 अनुकूलक स्टॉक, 10 µ l के ते बफर, और 10 µ l के ५०० µ m NaCl हल. Aliquot ७.५ µ एल के i5 काम समाधान में तैयार कदम 1.2.3 अलग पीसीआर कुओं में । इसी कुएं में नमूना विशिष्ट i7 एडाप्टर के 5 µ एल जोड़ें । 5 मिनट के लिए ९५ ° c पर मशीन तो 1 ° c द्वारा शांत एक थर्मल साइकिल चालक में 4 डिग्री सेल्सियस के लिए हर 30 एस । 4 डिग्री सेल्सियस पर पकड़ो । पुस्तकालयों की एंड-रिपेयर एंड दा-टेलनोट: एडेप्टर एनीलिंग के साथ समानांतर में, एक अंत मरंमत और १.१ कदम से पीसीआर amplicons पर दा-पूंछ प्रदर्शन कर सकते हैं । इन चरणों के पूरा होने के बाद, बंधाव annealed एडेप्टर से चरण १.२ पर सुधारा और दा-पुच्छ पीसीआर amplicons किया जाता है । निंनलिखित एडेप्टर बंधाव, ईसीएस पुस्तकालय निर्माण पूरा हो गया है । शुरू डीएनए (ंयूनतम ~ २०० एनजी) के सबसे 1 µ जी पर के साथ amplicons (सामग्री तालिका, आइटम 7) पर अंत-मरंमत और डीए-पूंछ प्रदर्शन । अंत तैयारी एंजाइम मिश्रण और ६.५ अंत की मरंमत बफर के µ एल के ३.० µ एल जोड़ें । 20 डिग्री सेल्सियस पर 30 मिनट के लिए मिश्रण की मशीन, तो ६५ डिग्री सेल्सियस पर 30 मिनट के लिए और 4 डिग्री सेल्सियस पर पकड़ । annealed एडेप्टर (सामग्री तालिका, आइटम 8) पर बंधाव निष्पादित करें । annealed एडेप्टर के चरण 2, 15 µ l की कुंदी/टा Ligase Mastermix, और µ बढ़ाने के 1 बंधाव l से जोड़ें २.५ µ l 20 डिग्री सेल्सियस पर 15 मिनट के लिए मिश्रण की मशीन, तो ३७ डिग्री सेल्सियस पर 15 मिनट के लिए । चुंबकीय मोती (सामग्री तालिका आइटम 2) के साथ पुस्तकालयों को साफ: एक संशोधित 1:०.७५ अनुपात में मोती की प्रतिक्रिया जोड़ें (पीसीआर प्रतिक्रिया मात्रा: चुंबकीय मनका मात्रा): पिपेट ६२.६ µ में चुंबकीय मनका समाधान के एल चरण 1.2.7 से पीसीआर उत्पादों के ८३.५ µ l में । मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण । pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण । मिश्रण को 5 मिनट के लिए कमरे के तापमान पर खड़े रहने के लिए छोड़ दें । एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर 2 मिनट के लिए या supernatant जब तक गर्मी साफ है । निकाल supernatant. धो ७०% इथेनॉल के २०० µ एल के साथ मोती । 30 एस के लिए मशीन इथेनॉल निकालें । एक बार इथेनॉल धोने कदम दोहराएं । हवा-मोतियों को सुखाएं । ddH2ओ के 20 µ l के साथ Elute ।नोट: चुंबकीय मनका अनुपात को पीसीआर प्रतिक्रिया में यह संशोधन तरजीही डीएनए टुकड़े कि २०० बीपी से छोटे है हटा देगा । छोटी बूंद डिजिटल पीसीआर द्वारा ठहरावनोट: सटीक उत्परिवर्तन ठहराव sequencer पर लोड कर रहे हैं कि प्रत्येक पुस्तकालय के अणुओं की संख्या के सख्त पालन की आवश्यकता है. इस लक्ष्य को प्राप्त करने के लिए, इकाई मात्रा प्रति व्यक्तिगत पुस्तकालयों के लिए अणुओं की संख्या को बढ़ाता QX200 छोटी बूंद डिजिटल पीसीआर (ddPCR) मंच का उपयोग किया जाता है-मात्रात्मक पीसीआर एक वैकल्पिक विकल्प है । ddPCR विश्लेषण के बाद, readout प्रति पुस्तकालय µ एल प्रति अणुओं की संख्या निर्दिष्ट करेगा । ईसीएस पुस्तकालयों को पतला 1:1000 से मक़सद कमजोर द्वारा पीसीआर स्ट्रिप-ट्यूब में 10 का एक पहलू है । १.५ एमएल ट्यूब में ddPCR के लिए निम्नलिखित mastermix तैयार करें: पीसीआर मिक्स की 10 µ l (सामग्री तालिका, मद 9), P5 प्राइमरी की ०.२ µ l, P7 प्राइमरी की ०.२ µ l, ईसीएस के 5 µ l को क्लीन-अप उत्पाद से स्टेप 1.4.1., और ४.५ µ l की ddH2हे. Aliquot 20 µ एल mastermix के प्रत्येक नमूने में अच्छी तरह से यकीन है कि वहां 8 के गुणकों कर रहे हैं । Aliquot ७० छोटी बूंद पीढ़ी के तेल के µ एल (सामग्री तालिका, आइटम 10) प्रत्येक तेल में अच्छी तरह से । कवर एक रबर गैसकेट के साथ कैसेट । छोटी बूंद जनरेटर (सामग्री तालिका, आइटम 11) का उपयोग कर बूंदें बनाओ । एक मल्टीचैनल पिपेट का उपयोग करना, चरण 1.4.4 में उत्पन्न बूंदों को एक पीसीआर प्लेट में लोड करना सुनिश्चित करना कि pipetting नमूने के डीएनए को बाल काटना से बचने के लिए 5 सेकंड की अवधि में धीरे से किया जाता है । निम्नलिखित स्थितियों का उपयोग कर एक थर्मल साइकिल चालक में ४० चक्र के लिए बूंदों में संकेत बढ़ाना: ९५ डिग्री सेल्सियस पर 5 मिनट; ९५ डिग्री सेल्सियस पर 30 एस के ४० चक्र, ६३ डिग्री सेल्सियस पर 1 मिनट; 4 डिग्री सेल्सियस पर 5 मिनट, ९० डिग्री सेल्सियस पर 5 मिनट; और फिर 4 डिग्री सेल्सियस पर पकड़ । ddPCR टेम्पलेट छोटी बूंद रीडर मशीन (सामग्री तालिका, आइटम 11) तैयार करें । पूर्ण ठहराव के लिए मानकों के लिए विनिर्देश सुनिश्चित करने और QX200 ddPCR ईवा ग्रीन Supermix का उपयोग कर. एक बार ddPCR विश्लेषण पूरा हो गया है, सभी नमूनों में एक ही विभाजनकारी थ्रेशोल्ड सेट करने के लिए सुनिश्चित करें । QX200 छोटी बूंद पाठक से एकाग्रता readout का उपयोग करना, aliquot उचित मात्रा में अणुओं के बाद के कदम में वांछित संख्या शुरू करने के लिए । अनुक्रमण के लिए पुस्तकालयों के पीसीआर प्रवर्धन चरण 1.4.9 से अणुओं की वांछित संख्या के लिए निम्नलिखित mastermix तैयार करें: Q5 mastermix के 25 µ l (सामग्री तालिका, मद 1), २.५ µ l की P5 प्राइमरी (10 µ मी), २.५ µ l की P7 प्राइमरी (10 µ मी), डीएनए की x µ l, 20-x µ l की ddH2हे. निम्न स्थितियों का उपयोग कर एक थर्मल साइकिल चालक में कदम 1.5.1 से पुस्तकालयों बढ़ाना: ९८ ° c पर 30 एस; ९८ डिग्री सेल्सियस पर 10 एस के 20 चक्र, ६३ डिग्री सेल्सियस पर 30 एस, ७२ डिग्री सेल्सियस पर 30 एस; ७२ डिग्री सेल्सियस पर 2 मिनट; और फिर 4 डिग्री सेल्सियस पर पकड़ । चुंबकीय मोती (सामग्री तालिका, आइटम 2) के साथ पुस्तकालयों को साफ: एक संशोधित 1 में एक चुंबकीय मोती के लिए पीसीआर प्रतिक्रिया जोड़ें: ०.७५ अनुपात (पीसीआर प्रतिक्रिया मात्रा: चुंबकीय मनका मात्रा) । कदम 1.5.2 से ५० µ एल पीसीआर उत्पादों में चुंबकीय मनका समाधान के पिपेट ३७.५ µ एल । मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण । pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण । मिश्रण छोड़ 5 मिनट के लिए कमरे के तापमान पर खड़े हो जाओ । एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर 2 मिनट के लिए या supernatant जब तक गर्मी साफ है । निकाल supernatant. धो ७०% इथेनॉल के २०० µ एल के साथ मोती । 30 एस के लिए मशीन इथेनॉल निकालें । एक बार इथेनॉल धोने कदम दोहराएं । हवा-मोतियों को सुखाएं । ddH2ओ के 20 µ l के साथ Elute । amplicons के आकार की पुष्टि करने के लिए 2% agarose जेल पर डीएनए की एक aliquot भागो । डीएनए की एकाग्रता यों तो (सामग्री तालिका, आइटम 3) अलग ईसीएस पुस्तकालयों की एकाग्रता निर्धारित करने के लिए । equimolar मात्रा में पुस्तकालयों पूल ।नोट: उदाहरण के लिए, शोधकर्ताओं ने एक equimolar समूह4 में आठ पुस्तकालयों के साथ एक अनुक्रमण मंच का उपयोग कर sequencing के लिए ४,०००,००० शुरू अणुओं पूल कर सकते हैं जो ४००,०००,००० तक outputs पढ़ता है. रूढ़िवादी, यह दस कच्चे के एक औसत का उपयोग करने के लिए सिफारिश की है त्रुटि के अणुओं के प्रति सुधार के लिए पढ़ता है । यह ऊपर ले जाएगा ३६०,०००,००० पुस्तकें (४,०००,००० अणु * 8 पुस्तकालयों * 10 त्रुटि सुधार के लिए पढ़ता है) । पुस्तकालय प्रति ४,०००,००० अद्वितीय अणुओं के साथ, शोधकर्ताओं के लिए एक सैद्धांतिक मतलब आम सहमति के प्रति amplicon (4 मिलियन/568 amplicons जीन पैनल से) 7042x की रीडिंग कवरेज पाने की उम्मीद कर सकते हैं । डीएनए की एकाग्रता यों तो (सामग्री तालिका, आइटम 3) परित ईसीएस पुस्तकालय की एकाग्रता निर्धारित करने के लिए । लगभग 4 एनएम में परित की ईसीएस लाइब्रेरी जमा करें । Illumina sequencing प्लेटफ़ॉर्म (MiSeq, HiSeq या NextSeq) के लिए निम्न sequencing सेटिंग्स प्रदान करें: 2×144 युग्मित-अंत पढ़ता, 8 चक्र अनुक्रमणिका 1 और 16 चक्र अनुक्रमणिका 2. 2. त्रुटि के साथ जीन पैनलों-डीएनए के अनुक्रमण सही जीन पैनलों से ओलिगोस्पर्मिया की संकरणनोट: इस चरण में, एक sequencing एक संशोधित Illumina TruSight या TruSeq प्रोटोकॉल UMIs (सामग्री तालिका, आइटम 17) को शामिल करने के लिए का उपयोग कर पुस्तकालयों का निर्माण होगा । संकरण ओलिगोस्पर्मिया पर जीनोमिक टुकड़ा निंनलिखित निर्माता के प्रोटोकॉल । का प्रयोग करें २५० डीएनए के एनजी (या शुरू सामग्री के किसी भी वांछित राशि) । अनबाउंड ओलिगोस्पर्मिया निम्न निर्माता के प्रोटोकॉल को निकालें । एक्सटेंशन-बंधाव निम्न निर्माता का प्रोटोकॉल निष्पादित करें ।नोट: निर्माता के प्रोटोकॉल में संशोधनों के नीचे शुरू करते हैं । पीसीआर के माध्यम से i5 और i7 एडेप्टर का निगमन उचित मात्रा आकार की एक ट्यूब में निम्नलिखित रिएजेंटों pipetting द्वारा पीसीआर mastermix तैयार: ३७.५ µ l के Q5 mastermix (सामग्री तालिका, मद 1), 6 µ l के 10 µ m 16N i5 एडेप्टर (विधि 1 में विस्तृत, चरण 1.2.2), i7 एडाप्टर के 6 µ l (विभिन्न i7 का उपयोग करें एडाप्टर मल्टीप्लेक्स के लिए अलग नमूनों के लिए), और 22 µ एल एक्सटेंशन-बंधाव चरण 2.1.3 से मोतियों के साथ समाधान ।नोट: Q5 Mastermix Illumina द्वारा प्रदान की पोलीमरेज़ Mastermix की जगह । Q5 पोलीमरेज़ उच्च निष्ठा और कम पेश त्रुटियों के साथ जीनोमिक टुकड़ा प्रवर्धक । एक थर्मल साइकिल चालक पर पीसीआर कार्यक्रम चलाने के लिए निंनलिखित मापदंडों का उपयोग: 30 एस ९८ ° c, 4-6 चक्रों पर 10 एस के ९८ ° c, 30 s पर ६६ ° c, 30 s पर ७२ ° c; ७२ डिग्री सेल्सियस पर 2 मिनट, और फिर 4 डिग्री सेल्सियस पर पकड़ ।नोट: चक्र की संख्या पैनल के आकार पर निर्भर करता है । हमारे अनुभव से, एक 4 चक्र पीसीआर पर्याप्त है अगर जीन पैनल जीन विशिष्ट ओलिगोस्पर्मिया के बारे में १,५०० विभिंन जोड़े हैं, जबकि 500 के साथ एक पैनल-600 ओलिगोस्पर्मिया के जोड़े को पीसीआर के 6 चक्र की आवश्यकता है । चुंबकीय मोतियों के साथ पीसीआर प्रतिक्रियाओं को साफ (सामग्री तालिका, आइटम 2): एक संशोधित 1 में पीसीआर प्रतिक्रिया चुंबकीय मोती जोड़ें पीसीआर रिएक्शन: ०.७५ चुंबकीय मनका अनुपात: पिपेट ५६.२५ µ में चुंबकीय मनका समाधान के एल चरण -8 से पीसीआर उत्पादों के ७५ µ l में । मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण । pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण । मिश्रण छोड़ 5 मिनट के लिए कमरे के तापमान पर खड़े हो जाओ । एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर या supernatant स्पष्ट है जब तक 2 मिनट के लिए मशीन । निकाल supernatant. धो ७०% इथेनॉल के २०० µ एल के साथ मोती । 30 एस के लिए मशीन इथेनॉल निकालें । एक बार इथेनॉल धोने कदम दोहराएं । हवा-मोतियों को सुखाएं । ddH2ओ के 20 µ l के साथ Elute । QX200 ddPCR प्लेटफ़ॉर्म का उपयोग करके लाइब्रेरीज़ को बढ़ाता है. विधि 1 में १.४ चरण का पालन करें ।नोट: ४,०००,००० अणुओं प्रतिनिधि परिणाम (चित्रा 2) में नमूना पुस्तकालय4 प्रति सामान्यीकृत थे क्रम में ७,०४२ विशिष्ट रूप से अनुक्रमित अणुओं (४,०००,००० ५६८ जीन विशेष ओलिगोस्पर्मिया द्वारा विभाजित) का एक सैद्धांतिक मतलब प्राप्त करने के लिए । बढ़ाना और अनुक्रमण के लिए पुस्तकालयों को सामान्य. अंतिम पीसीआर totaling ५० µ एल के लिए निंनलिखित mastermix का उपयोग कर अणुओं की वांछित संख्या बढ़ाना: 25 µ l के Q5 mastermix, 2 µ l के P5 प्राइमरी (1 µ m), µ प्राइमरी के 2 P7 l (1 µ m), और डीएनए अणुओं के 21 µ l. एक थर्मल साइकिल चालक पर चलाएं पीसीआर कार्यक्रम निंनलिखित पैरामीटर का उपयोग: 30 एस ९८ डिग्री सेल्सियस पर; ९८ डिग्री सेल्सियस पर 10 एस के 16 चक्र, ६६ डिग्री सेल्सियस पर 30 एस, ७२ डिग्री सेल्सियस पर 30 एस; ७२ डिग्री सेल्सियस पर 2 मिनट; और फिर 4 डिग्री सेल्सियस पर पकड़ । चुंबकीय मोतियों का उपयोग अनुक्रमण पुस्तकालयों को साफ (सामग्री तालिका, आइटम 2): एक संशोधित 1 में पीसीआर प्रतिक्रिया चुंबकीय मोती जोड़ें पीसीआर रिएक्शन: ०.७५ चुंबकीय मनका अनुपात: कदम 2.4.2 से ५० µ एल पीसीआर उत्पादों में चुंबकीय मनका समाधान के पिपेट ३७.५ µ एल । मिश्रण एक १.५ मिलीलीटर कम बाध्यकारी ट्यूब के लिए स्थानांतरण । pipetting द्वारा अच्छी तरह से ऊपर और नीचे से नीचे 10 बार मिश्रण । मिश्रण छोड़ 5 मिनट के लिए कमरे के तापमान पर खड़े हो जाओ । एक चुंबकीय धारक पर ट्यूब प्लेस । कमरे के तापमान पर या supernatant स्पष्ट है जब तक 2 मिनट के लिए मशीन । निकाल supernatant. धो ७०% इथेनॉल के २०० µ एल के साथ मोती । 30 एस के लिए मशीन इथेनॉल निकालें । एक बार इथेनॉल धोने कदम दोहराएं । हवा-मोतियों को सुखाएं । ddH2ओ के 20 µ l के साथ Elute । amplicons के आकार की पुष्टि करने के लिए एक 2% agarose जेल पर eluted डीएनए (~ 3 µ एल) के एक aliquot भागो । डीएनए की एकाग्रता यों तो (सामग्री तालिका, आइटम 3) अलग ईसीएस पुस्तकालयों की एकाग्रता निर्धारित करने के लिए । equimolar मात्रा में पुस्तकालयों पूल । विधि 1 चरण 1.5.6 का संदर्भ लें । और भी पूलिंग पर अधिक जानकारी के लिए चर्चा । लगभग 4 एनएम में परित की ईसीएस लाइब्रेरी जमा करें । Illumina sequencing प्लेटफ़ॉर्म (MiSeq, HiSeq या NextSeq) के लिए निम्न sequencing सेटिंग्स प्रदान करें: 2×144 युग्मित-अंत पढ़ता, 8 चक्र अनुक्रमणिका 1 और 16 चक्र अनुक्रमणिका 2. ईसीएस Bioinformatic प्रोसेसिंग और विश्लेषण नमूना प्राप्त करें-division से sequencer पढ़ता है या प्रदर्शन कच्चे अनुक्रम के division एक कस्टम स्क्रिप्ट के साथ bioinformatically i7 एडाप्टर अनुक्रम का उपयोग कर विभिन्न नमूनों में पढ़ता है । बंद ट्रिम कर दीजिए प्रत्येक के पहले 30 न्यूक्लियोटाइड का जीन पैनल से oligo जुगाड़ हटाने के लिए पढ़िए । पढ़ता है कि एक दूसरे के लिए एक ही UMIs साझा पढ़ें परिवारों के रूप में संरेखित करें ।नोट: शोधकर्ताओं का उपयोग कर सकते हैं UMI-वाकिफ सॉफ्टवेयर जैसे MAGERI13 पढ़ने परिवारों को निकालने के लिए. विधि की विशिष्टता को बढ़ाने के लिए इस प्रयोग में UMI अनुक्रम के भीतर कोई हैमिंग दूरी की अनुमति नहीं थी । निम्न अनुशंसित पैरामीटर्स का उपयोग करके de-डुप्लिकेशन और त्रुटि-सुधार निष्पादित करें । एक ही पढ़ा परिवार में ≥ 5 पढ़ें जोड़े का उपयोग करें । तीन पढ़ें जोड़े की एक ंयूनतम सिफारिश की है । सभी भर में हर स्थिति में न्यूक्लियोटाइड तुलना एक ही पढ़ा परिवार में पढ़ता है, और एक आम सहमति न्यूक्लियोटाइड उत्पंन अगर वहां है कम से ९०% के बीच सामंजस्य विशेष न्यूक्लियोटाइड के लिए पढ़ता है । न्यूक्लियोटाइड स्थिति के लिए ९०% से कम अनुबंध है, तो एक N कॉल करें । छोड़ें आम सहमति है कि > 10% है सहमति की कुल संख्या का न्यूक्लियोटाइड N के रूप में बुलाया जा रहा है । सभी बनाए रखने आम सहमति के लिए स्थानीय रूप से या तो hg19 या hg38 मानव संदर्भ जीनोम जैसे Bowtie2 और BWA के रूप में शोधकर्ता पसंदीदा संरेखण (ओं) का उपयोग कर पढ़ता है संरेखित करें । प्रक्रिया संरेखित Mpileup पैरामीटर का उपयोग कर के साथ पढ़ता है – BQ0 – d १०,०००,०००,०००,००० VAF की परवाह किए बिना एक उचित pileup आउटपुट सुनिश्चित करने के लिए कवरेज थ्रेशोल्ड को निकालने के लिए । से कम 1000x आम सहमति पढ़ें कवरेज के साथ पदों को फ़िल्टर ।ध्यान दें: शोधकर्ता प्रत्येक न्यूक्लियोटाइड स्थिति के लिए मनमाने ढंग से ंयूनतम कवरेज निर्धारित करता है, यह नीचे बहाव विश्लेषण के लिए कम से 500x आम सहमति पढ़ें कवरेज की सिफारिश की है । निंन पैरामीटर के साथ चरण 2.5.7 से बनाए गए डेटा में एकल न्यूक्लियोटाइड वेरिएंट (SNPs) को कॉल करने के लिए द्विपद वितरण का उपयोग करें । द्विपद सांख्यिकीय एक जीनोमिक स्थिति-विशिष्ट त्रुटि मॉडल पर आधारित होगा । प्रत्येक जीनोमिक स्थिति स्वतंत्र रूप से बाहर है कि विशेष रूप से स्थिति के लिए सभी नमूनों की त्रुटि दरों संक्षेप के बाद मॉडलिंग की है । उदाहरण के बाद:किसी दी जीनोमिक स्थिति में न्यूक्लियोटाइड प्रोफ़ाइल की प्रायिकता, p∑ वैरिएंट RF2 ∑ कुल RFs= 26/255505= ०.०००१०१७५९३५९११ कुल RFs, P(x ≥ x) का नमूना K में से बाहर 24 संस्करण RFs की द्विपद प्रायिकता= 1-द्विपद (24, ३५९११, ०.०००१०१७५९)= 2.26485 ई-13नोट: प्रत्येक जीनोमिक स्थिति के लिए पूछे, वहां तीन संभव उत्परिवर्तन परिवर्तन (यानी,एक > टी, एक > सी, एक > जी) होगा, और जिनमें से प्रत्येक पृष्ठभूमि विरूपण साक्ष्य के रूप में प्रतिनिधित्व किया जाएगा । दैहिक घटनाओं है कि Bonferroni सुधार के बाद पृष्ठभूमि से काफी अलग है बनाए रखा जाता है । 1 तालिकामें दिखाए गए उदाहरण में, निष्पादित परीक्षणों की संख्या 11 थी, इसलिए एक Bonferroni सही p-मान ≤ ०.००४५४५४५ (0.05/11) एक घटना सांख्यिकीय रूप से महत्वपूर्ण के रूप में कॉल करने के लिए आवश्यक था । दैहिक घटनाओं के लिए एक ही नमूना से दोनों प्रतिकृति में उपस्थित होने की आवश्यकता है; अंयथा, उंहें झूठी सकारात्मक के रूप में संबंध है । तालिका 1: उदाहरण एक स्थिति-विशिष्ट द्विपद त्रुटि मॉडल के निर्माण के लिए तरीके का प्रदर्शन । 3. आरएनए की त्रुटि-सही अनुक्रमण डीएनए स्तर पर उत्परिवर्तनों के लिए आकलन करने के अलावा, आरएनए स्तर पर दुर्लभ या कम बहुतायत प्रतिलिपि का पता लगाने के लिए विभिन्न लक्षित आरएनए अनुक्रमण पैनलों के साथ ईसीएस एकीकृत । बंद-the-शेल्फ Qiagen आरएनए अनुक्रमण पैनलों के साथ ईसीएस के संयोजन के द्वारा, हम एक गृह व्यवस्था जीन के खिलाफ सामान्य करने के लिए एक की आवश्यकता के बिना दस प्रतियां के रूप में के रूप में कुछ के साथ टेप के लिए जीन अभिव्यक्ति की डिजिटल ठहराव का प्रदर्शन किया । त्रुटि-सुधार के लिए आवश्यक UMIs को पैनल में एकीकृत कर दिया गया है । कुल आरएनए निष्कर्षण (सामग्री तालिका, आइटम 20) निष्पादित करें । निर्माता के प्रोटोकॉल (सामग्री तालिका, आइटम 19) के अनुसार ईसीएस-आरएनए पुस्तकालय तैयारी जारी है । चरण 2.5.1 के अनुसार bioinformatics पाइपलाइन प्रदर्शन – 2.5.6. पिछले अनुभाग में उल्लिखित विधि 2 के । कदम 2.5.6 के बाद, गठबंधन आम सहमति की संख्या जीन जीन की लंबाई सामान्यीकरण के लिए आवश्यकता के बिना जीन की अभिव्यक्ति के स्तर का प्रतिनिधित्व करता है पढ़ता है ।

Representative Results

डीएनए के लिए लक्षित त्रुटि-सही अनुक्रमण के साथ, हम वाणिज्यिक जीनोमिक डीएनए में सिद्धांत प्रयोग कमजोर उत्परिवर्ती रोगी डीएनए का सबूत प्रदर्शन किया है । रोगी ०.१९ के मूल VAF के साथ GATA1 (chrX: 48650264, सी > जी) में उत्परिवर्तन था । हम चित्र 1 कि ईसीएस एक न्यूक्लियोटाइड संस्करण के लिए 1:10000 के स्तर के लिए मात्रात्मक है में प्रदर्शित करते हैं । चित्रा 1: GATA1 SNV के कमजोर पड़ने श्रृंखला का प्रदर्शन है कि ईसीएस 1 के स्तर पर मात्रात्मक है: 10000। कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए । हम यह भी बताते है कि ईसीएस-डीएनए मज़बूती से स्वस्थ बुजुर्ग व्यक्तियों4में वयस्क तीव्र माइलॉयड ल्यूकेमिया (एएमएल) में आवर्तक जीन में दुर्लभ क्लोनल उत्परिवर्तनों का पता लगाता है । हम नर्स के स्वास्थ्य के अध्ययन में 20 स्वस्थ व्यक्तियों से buffy कोट नमूने प्राप्त लगभग ~ 10 साल के अलावा । हमने इन नमूनों पर ईसीएस-डीएनए पैनल प्रोटोकॉल लागू किया था । इस प्रयोग के लिए, हम Illumina TruSight माइलॉयड अनुक्रमण पैनल है कि ५६८ amplicons (https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html पर जीन सूची पर अधिक जानकारी) और अनुक्रम के होते है अनुकूलित 20 व्यक्तियों से ८० पुस्तकालयों (अलग समय अंक में 2 संग्रह, 2 प्रति समय बिंदु प्रति व्यक्ति प्रतिकृति) Illumina NextSeq मंच है, जो ४७,७००,००० के एक औसत उत्पंन-अंत पढ़ता है और ३,४००,००० त्रुटि का एक औसत-सही बनाया का उपयोग कर लाइब्रेरी के प्रति आम सहमति अनुक्रम4. पुस्तकालय प्रति मतलब न्यूक्लियोटाइड कवरेज लगभग 6, 000x (३.४ लाखों ५६८ द्वारा विभाजित) था । प्रत्येक नमूने के लिए, हम एक स्थिति-विशिष्ट त्रुटि प्रोफ़ाइल का उपयोग करते हुए एक ही नमूना से नहीं है sequenced लायब्रेरी का निर्माण किया । हमने पाया है १०९ क्लोनी दैहिक उत्परिवर्तनों कि दोनों में मौजूद थे कम से एक संग्रह समय बिंदु की प्रतिकृति । इन उत्परिवर्तनों 0.0003 से लेकर VAF है – 0.1451. हम ज्ञात लौकिक निरूपण के साथ 21 उत्परिवर्तनों का चयन किया है, और एक या दो संग्रह समय बिंदु (ओं) का उपयोग ddPCR (n = ३४, चित्रा 2, युवा एट अल. २०१६4से अनुकूलित) में सभी 21 उत्परिवर्तनों की पुष्टि की । चित्रा 2: ईसीएस द्वारा की पहचान उत्परिवर्तनों उच्च बेताल VAFs के साथ ddPCR के माध्यम से सत्यापित किया गया । (एन = 34, युवा एट अल. २०१६4से संशोधित) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए । के साथ त्रुटि-सही अभिव्यक्ति स्तर ईसीएस-आरएनए प्रोटोकॉल का उपयोग करने के संबंध में, हम एक जीन QIAseq रसायन विज्ञान है कि ४१६ विभिंन कैंसर (QIAseq मानव कैंसर Transcriptome पैनल से अनुकूलित) के साथ जुड़े होने के लिए जाना जाता जीन के होते है का उपयोग कर पैनल अनुकूलित, और हम प्रवर्धित सबसे अधिक एक दिया जीन के एक्सॉन व्यक्त ( अनुपूरक सामग्री 1में जीन सूची) । हम Illumina MiSeq प्लेटफ़ॉर्म का उपयोग करते हुए लाइब्रेरीज़ में युग्मित-अंत स्वरूप जो ८,३००,००० की एक औसत दिया लाइब्रेरी प्रति पढ़ता है, और हम ४१७,००० त्रुटि-सही आम सहमति दृश्यों की एक औसत पर कब्जा करने में कामयाब रहे । हमें पता चला है कि कम बहुतायत प्रतिलिपि की अभिव्यक्ति स्तर (< 1, 000 कुल आरएनए के एनजी ५० में गिनती) प्रतिकृति के बीच अत्यधिक reproducible है (डेटा बिंदु n = ३००, चित्रा 3) । ddPCR द्वारा मांयता (अभिव्यक्ति की डिग्री बदलती के छह चयनित जीन) का प्रदर्शन किया है कि जीन की अभिव्यक्ति स्तर सही ढंग से ईसीएस प्रोटोकॉल द्वारा सामांय की आवश्यकता के बिना कब्जा कर लिया गया था । चित्रा 3: ऊपर, प्रतिलिपि का सहसंबंध एक ही नमूना (n = ३००) की प्रतिकृति के बीच ईसीएस-आरएनए द्वारा गिना जाता है । नीचे, प्रतिलिपि ईसीएस द्वारा की पहचान की गिनती ddPCR द्वारा सत्यापित किया गया (n = 6) । कृपया यहां क्लिक करें इस आंकड़े का एक बड़ा संस्करण को देखने के लिए ।

Discussion

यहाँ, हम त्रुटि-सही अनुक्रमण प्रोटोकॉल है कि आसानी से विभिन्न रोगों में कम VAFs के साथ उत्परिवर्तनों का अध्ययन करने के लिए लागू किया जा सकता का एक सूट प्रदर्शित करता है । सबसे महत्वपूर्ण कारक अनुक्रमण से पहले प्रत्येक अणु के साथ UMIs के शामिल होने के रूप में वे रॉ पढ़ता के त्रुटि-सुधार सक्षम है । यहां वर्णित तरीकों शोधकर्ताओं दोनों व्यावसायिक रूप से उपलब्ध जीन पैनलों और स्वयं जीन विशिष्ट ओलिगोस्पर्मिया डिजाइन करने के लिए अनुकूलित UMIs शामिल करने के लिए अनुमति देते हैं ।

मानक NGS प्रोटोकॉल अनुक्रमण त्रुटि दर के कारण 2% से नीचे VAF के साथ उत्परिवर्तनों का पता लगाने precludes, और इस अध्ययन में NGS के आवेदन सीमा जहां दुर्लभ वेरिएंट का पता लगाने महत्वपूर्ण है । मानक NGS त्रुटि दर को दरकिनार करके, ईसीएस इन रॉ वेरिएंट के संवेदनशील पता लगाने में सक्षम बनाता है । उदाहरण के लिए, रोगजनक उत्परिवर्तनों का पता लगाने जब इन उत्परिवर्तनों पहले उठता (इसलिए कम VAF होने)¹⁴^,¹⁵रोग के जल्दी हस्तक्षेप को सूचित करने के लिए आवश्यक है । ल्यूकेमिया अनुसंधान में, न्यूनतम अवशिष्ट रोग का पता लगाने (अवशिष्ट ल्यूकेमिया से प्रभावित कोशिकाओं के बाद उपचार) जोखिम स्तरीकरण को सूचित करता है और एक तरह से है कि बाइनरी फ्लो cytometric आकलन नहीं कर सकते में उपचार के विकल्पों को सूचना देने के लिए इस्तेमाल किया जा सकता है । इसके अलावा, ईसीएस परिचालित ट्यूमर न्यूक्लिक एसिड का पता लगाने के लिए और उपस्थिति के लिए आकलन द्वारा ठोस ट्यूमर रोगियों में मेटास्टेटिक क्षमता का मूल्यांकन करने के लिए लागू है/अनुपस्थिति के साथ ही कुछ उत्परिवर्तनों के संस्करण बोझ है कि प्राथमिक की विशेषताओं रहे हैं ट्यूमर¹⁶.

तालिका 1में प्रदर्शित किया गया के रूप में, वेरिएंट को कॉल करने के लिए द्विपद वितरण-आधारित स्थिति-विशिष्ट त्रुटि मॉडल का उपयोग करने की शक्ति काफी हद तक अनुक्रम पुस्तकालयों की संख्या के रूप में के रूप में अच्छी तरह से त्रुटि मॉडल बनाने के लिए इस्तेमाल अनुक्रमण की गहराई पर निर्भर करता है । नमूनों की अधिक संख्या और अधिक अनुक्रमण गहराई के साथ त्रुटि मॉडल की मजबूती बढ़ जाती है । यह प्रत्येक नमूने के लिए एक त्रुटि प्रोफ़ाइल बनाने के लिए प्रति नमूना 3000x की त्रुटि-सही पढ़ा कवरेज का एक औसत के साथ कम से कम 10 अनुक्रम नमूनों का उपयोग करने के लिए अनुशंसित है । स्थिति-विशिष्ट दृष्टिकोण MAGERI के समान है, लेकिन इसके बजाय सभी छह अलग प्रतिस्थापन प्रकार के लिए एक समग्र त्रुटि दर का उपयोग कर के (ए > सी/टी > जी, एक > जी/टी > सी, एक > टी/टी > ए, सी > ए/जी > टी, सी > जी/ , सी > टी/जी > एक)¹³, हम प्रत्येक प्रतिस्थापन स्वतंत्र रूप से हर स्थिति में मॉडल । उदाहरण के लिए, एक दिया जीनोमिक स्थिति में सी > टी की एक त्रुटि दर एक और स्थिति से अलग है । हमारे दृष्टिकोण भी खाते में एक sequencing बैच प्रभाव लेता है, के रूप में एक sequencing रन में मनाया आधार प्रतिस्थापन दर दूसरे रन से अलग हो सकता है । इसलिए यह मॉडल बनाने के लिए अलग sequencing रन से नमूने विशेष रूप से सभी प्रतिस्थापन प्रकार के लिए प्रत्येक स्थिति के लिए महत्वपूर्ण है.

एक महत्वपूर्ण विचार जब एक ईसीएस प्रयोग डिजाइनिंग वांछित पता लगाने सीमा है । NGS अध्ययनों की खूबसूरती है कि वे आसानी से जीन के मामले में स्केल किया जा सकता है/ब्याज के लक्ष्य, पता लगाने सीमा (अनुक्रमण की गहराई से तय), और व्यक्तियों की संख्या पूछे । उदाहरण के लिए, यदि शोधकर्ताओं ने ०.०००१ का पता लगाने की दहलीज के साथ दो amplicons में दुर्लभ उत्परिवर्तनों को खोजने के लिए रुचि रखते हैं, वे एक एकल sequencing MiSeq V2 रसायन विज्ञान जो १५,०००,००० तक outputs का उपयोग कर चलाने में अधिक से अधिक ७५ नमूनों पूल कर सकते हैं (2 amplicons * १०,००० अणु * 10 त्रुटि के लिए पढ़ता-सुधार * ७५ नमूने = १५,०००,००० अनुक्रमण पढ़ता). शोधकर्ताओं sequencing में जा रहे अणुओं की संख्या में भिन्न हो सकते हैं या पता लगाना थ्रेशोल्ड को समायोजित करने के लिए चलाएँ एक एकल sequencing में pooled नमूनों की संख्या. हमारे अध्ययन में, हम Illumina जीन पैनल का उपयोग ०.०००१ VAF (1:10000) का पता लगाने दहलीज के साथ उत्परिवर्तनों को खोजने के उद्देश्य से । हम नियमित रूप से डीएनए शुरू करने के लिए सुनिश्चित करें कि पर्याप्त अणुओं पर कब्जा कर लिया है क्रम में aforementioned पता लगाने की सीमा को प्राप्त करने के २५० एनजी का इस्तेमाल करते हैं । शोधकर्ताओं ने डीएनए की कम राशि के साथ शुरू करने के लिए विकल्प चुन सकते हैं (५० एनजी की सिफारिश की है) यदि वांछित पता लगाने की सीमा है > 0.001 VAF.

के रूप में UMIs i5 अनुक्रमित पर जोड़े जाते हैं, sequencing सेटिंग्स तदनुसार संशोधन किया जाना है । उदाहरण के लिए, हम 16 N UMIs उपयोग किया, और sequencing सेटिंग्स थे 2×144 युग्मित अंत पढ़ता, अनुक्रमणिका 2 के 8 चक्रों और अनुक्रमणिका 2 के 16 चक्र के रूप में सामांय 8 चक्रों के लिए विरोध किया है । सूचकांक 2 चक्र में वृद्धि के लिए आवंटित चक्रों की कुल संख्या में कमी से मुआवजा दिया है पढ़ता है । शोधकर्ताओं 12N UMIs¹⁰^,¹⁷का उपयोग करने के लिए चुनते हैं, तो सेटिंग्स अनुक्रमणिका 2 के 12 चक्र के लिए परिवर्तित किया जाना चाहिए ।

यह UMI-आधारित sequencing विधि sequencing त्रुटियों के लिए सही करने के लिए ऑप्टिमाइज़ किया गया है । यह पीसीआर jackpotting, जो सभी प्रवर्धन के लिए एक मुद्दा है आधारित विधि से निपटने में इष्टतम रहता है । हम ddPCR का उपयोग कर के बाद अनुक्रमण और पोस्ट bioinformatics सत्यापन के दौर प्रदर्शन किया, और हम शायद ही पीसीआर jackpotting के कारण किसी भी झूठी सकारात्मक का पता लगाने । बहरहाल, यह अनुशंसा की जाती है कि शोधकर्ताओं उच्च निष्ठा पोलीमरेज़ का उपयोग करने के लिए कम प्रवर्धन त्रुटियों को सुनिश्चित प्रयोगों आचरण ।

Disclosures

The authors have nothing to disclose.

Acknowledgements

हम बच्चों के कैंसर विज्ञान समूह AAML1531 अध्ययन और रोगी नमूनों के रूप में उनके योगदान के लिए नर्सों के स्वास्थ्य अध्ययन में प्रतिभागियों को धन्यवाद । यह काम स्वास्थ्य के राष्ट्रीय संस्थानों द्वारा वित्त पोषित किया गया (UM1 CA186107, RO1 CA49449 और RO1 CA149445), बच्चों की खोज वाशिंगटन विश्वविद्यालय के संस्थान और सेंट लुइस बच्चों के अस्पताल (MC-II-2015-461), और एली सेठ मैथ्यू ल्यूकेमिया फाउंडेशन.

Materials

Q5 High Fidelity Hot Start Master Mix	New England BioLabs	M0492S
Agencourt AMPure XP	Beckman Coulter	A63880
Qubit dsDNA HS Assay Kit	Thermo Fisher Scientific	Q32854
SYBR Safe DNA Gel Stain	Thermo Fisher Scientific	S33102
Truseq Custom Amplicon Index Kit	Illumina	FC-130-1003
UMI i5 adapter sequences	Integrated DNA Technologies	–
NEBNext Ultra End Repair/dA-Tailing Module	New England BioLabs	E7442S
NEBNext Ultra II Ligation Module	New England BioLabs	E7595S
QX200 ddPCR EvaGreen Supermix	Bio-Rad	1864034
QX200 Droplet Generation Oil for EvaGreen	Bio-Rad	1864005
QX200 Droplet Digital PCR System	Bio-Rad	1864001
ddPCR 96-Well Plates	Bio-Rad	12001925
DG8 Cartridges for QX200/QX100 Droplet Generator	Bio-Rad	1864008
DG8 Gaskets for QX200/QX100 Droplet Generator	Bio-Rad	1863009
Bioanalyzer	Agilent Genomics	G2939BA
TapeStation	Agilent Genomics	G2991AA
TruSight Myeloid Sequencing Panel	Illumina	FC-130-1010
Bowtie 2	Johns Hopkins University	–
Customized QIAseq Targeted RNA Panel	Qiagen	–
Rneasy Plus Mini Kit (50)	Qiagen	74134

References

Hoang, M. L., et al. Genome-wide quantification of rare somatic mutations in normal tissues using massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 113, 9846-9851 (2016).
O’Roak, B. J., et al. Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations. Nature. 485, 246-250 (2012).
Young, A. L., et al. Quantifying ultra-rare pre-leukemic clones via targeted error-corrected sequencing. Leukemia. 29 (7), 1608-1611 (2015).
Young, A. L., Challen, G. A., Birmann, B. M., Druley, T. E. Clonal hematopoiesis harbouring AML-associated mutations is ubiquitous in healthy adults. NatureCommunications. 7, 12484 (2016).
Patel, J. P., et al. Prognostic relevance of integrated genetic profiling in acute myeloid leukemia. New England Journal of Medicine. 366, 1079-1089 (2012).
Shendure, J., Ji, H. Next-generation DNA sequencing. Nature Biotechnology. 26 (10), 1135-1145 (2008).
Kohlmann, A., et al. Monitoring of residual disease by next-generation deep-sequencing of RUNX1 mutations can identify acute myeloid leukemia patients with resistant disease. Leukemia. 28, 129-137 (2014).
Luthra, R., et al. Next-generation sequencing-based multigene mutational screening for acute myeloid leukemia using MiSeq: applicability for diagnostics and disease monitoring. Haematologica. 99, 465-473 (2014).
Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W., Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 108 (23), 9530-9535 (2011).
Schmitt, M., et al. Detection of ultra-rare mutations by next-generation sequencing. Proceedings of the National Academy of Sciences USA. 109 (36), 14508-14513 (2012).
Vander Heiden, J. A., et al. pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. Bioinformatics. 30 (13), 1930-1932 (2014).
Newman, A. M., et al. Integrated digital error suppression for improved detection of circulating tumor DNA. NatureBiotechnology. 34, 547-555 (2016).
Shugay, M., et al. MAGERI: Computational pipeline for molecular-barcoded targeted resequencing. PLOSComputationalBiology. 13 (5), e1005480 (2017).
Wong, T. N., et al. Role of TP53 mutations in the origin and evolution of therapy-related acute myeloid leukaemia. Nature. 518, 552-555 (2014).
Krimmel, J. D., et al. Ultra-deep sequencing detects ovarian cancer cells in peritoneal fluid and reveals somatic TP53 mutations in noncancerous tissues. Proceedings of the National Academy of Sciences USA. 113 (21), 6005-6010 (2016).
Phallen, J., et al. Direct detection of early-stage cancers using circulating tumor DNA. ScienceTranslationalMedicine. 9, eaan2415 (2017).
Egorov, E. S., et al. Quantitative profiling of immune repertoires for minor lymphocyte counts using unique molecular identifiers. The Journal of Immunology. 194 (12), 6155-6163 (2015).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Wong, W. H., Tong, R. S., Young, A. L., Druley, T. E. Rare Event Detection Using Error-corrected DNA and RNA Sequencing. J. Vis. Exp. (138), e57509, doi:10.3791/57509 (2018).

त्रुटि-सही डीएनए और आरएनए अनुक्रमण का उपयोग कर दुर्लभ घटना का पता लगाने

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

त्रुटि-सही डीएनए और आरएनए अनुक्रमण का उपयोग कर दुर्लभ घटना का पता लगाने

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below