הדור הבא רצפי (הגדרות) הוא כלי רב עוצמה עבור אפיון גנומית זה מוגבל על ידי שיעור שגיאה גבוהה של פלטפורמת (~0.5–2.0%). אנו מתארים את השיטות שלנו של רצף שגיאות המאפשרים לנו במחלקותיכם שיעור שגיאה המיתרים, לזהות מוטציות ב- variant אלל שברים כמו שנדיר למצוא 0.0001.
שיטות קונבנציונליות הדור הבא רצפי (הגדרות) אפשרו עבור אפיון גנומית עצום עבור למעלה מעשור. באופן ספציפי, המיתרים שימש כדי לנתח את הספקטרום של מוטציות המשובטים בממאירות. אבל הרבה יותר יעיל יותר שיטות מסורתיות סנגר, המיתרים מאבקים עם זיהוי מוטציות המשובטים, subclonal נדיר עקב שלה שגיאה גבוהה בשיעור של ~0.5–2.0%. לפיכך, המיתרים רגיל יש הגבלה של זיהוי מוטציות הן > אלל variant 0.02 נקודות שבר (VAF). בעוד משמעות קלינית מוטציות נדיר בחולים ללא מחלה ידועה עדיין לא ברור, חולים שטופלו ללוקמיה השתפרו באופן משמעותי את תוצאות כאשר מחלה שיורית < 0.0001 מאת cytometry זרימה. על מנת להמתיק את הרקע artefactual של המיתרים, פותחו שיטות רבות. כאן אנו מתארים שיטה עבור שגיאות ה-DNA ו- RNA רצף (ECS), אשר כרוך תיוג מולקולות בודדות של אינדקס 16 bp אקראי עבור תיקון שגיאות וגם אינדקס ספציפי לחולה bp 8 עבור ריבוב. השיטה שלנו יוכלו לזהות ולעקוב המשובטים מוטציות ב- variant אלל שברים (VAFs) בשני סדרי גודל נמוך יותר מהמגבלה זיהוי של המיתרים ונדירים כמו 0.0001 VAF.
כפי שאנו גיל, מחשיפה מוטגנים ושגיאות סטוכסטי במהלך חלוקת התא כתוצאה הצטברות של סטיות סומאטית הגנום, וזאת ביסוד בפתוגנזה מהותי של שינוי ממאיר, מחלות נוירו-התפתחותית, רפואת ילדים הפרעות והזדקנות נורמלית1,2. מוטציות סומאטית עם פוטנציאל נהיגה המחלה הם סמנים אבחון ו prognostic חשוב זיהוי מוקדם, הסיכון ניהול3,4,5. על מנת להבין טוב יותר את clonogenesis הפיזיולוגיות, אשר להודיע קליניים ומחקר החלטות, כימות מדויק ואפיון של מוטציות אלו ישנה חשיבות רבה. הדור הבא רצפי (הגדרות) הנמצא בשימוש כיום ללמוד מוטציות המשובטים בדגימות DNA הטרוגניות; עם זאת, המיתרים מוגבל לזיהוי מוטציות ב > אלל variant 0.02 נקודות שבר (VAF) — בשל שיעור השגיאה מובנית של 0.5 – 2.0% רצף פלטפורמות6,7,8. כתוצאה מכך, מעקב אבחונית, prognostically משמעותית גרסאות הסומטית-VAF התחתונה אינה יכולה להיות מושגת באמצעות הגדרות סטנדרטית.
לאחרונה, פותחו שיטות שונות כדי לעקוף את שיעור שגיאה של המיתרים8,9,10,11. שיטות אלה לנצל תיוג מולקולרית, המאפשר תיקון שגיאות לאחר רצף. כל מולקולה או מקטע גנומי בספריה רצף מתויג עם אקראי ייחודי מולקולרית המזהה (UMI) הייחודיים את המולקולה. UMIs נבנות על ידי צירופים של מחרוזת אקראי נוקלאוטידים (N 8-16). ברקוד מדגם ספציפי השני גם משולב שזרימת העבודה המאפשר ריבוב הדגימות מרובים לתוך הרצף המיתרים אותו לרוץ. PCR-הגברה מבוצעת על ספריית תגים מולקולרי, לאחר מכן נשלחת הספרייה עבור רצף. במהלך הכנת ספריה, צפוי כי שגיאות יהיה אקראי הציג את מקטע גנומי במהלך הגברה PCR ורצף8. להסרת רצף אקראי שגיאות, רצף raw קריאות מקובצות לפי אומי. ממצאים רצף אינן צפויות להיות נוכח קריאות כל עם UMI אותו במיקום גנומי זהה בשל אופיו סטוכסטי של מבוא, ואילו להיות מוגבר, וסודרו ב קריאות כל המשתפים את UMI אותו בנאמנות חלופה אמיתית. הממצאים הם bioinformatically הוסר. כאן, אנו מתארים שלוש שיטות של שגיאות רצף (ECS) ממוטבים במעבדה דנ א לזהות משתנים נוקלאוטיד יחיד (SNVs) ואת ההכנסה קטן-מחיקות (Indels), ולכל RNA להקל על כימות של ביטוי גנים להלן הגדרות הסף שגיאה.
השיטה הראשונה מתארת דרך לחפש אירוע נדיר סומאטית באמצעות גנים ספציפיים תחל עוצב על ידי החוקרים. לפני הכנת ספריה, חוקרים עליך לעצב תחל למקד את שברי ריבית. השתמשנו את Primer3 אפליקציה (http://bioinfo.ut.ee/primer3-0.4.0/). Amplicons של 200 – 250 bp הינם אידיאליים עבור תגובת שרשרת פולימראזית (PCR). כמו אלה, לאחר UMIs כבר שילבו, ליצור חופפים קריאות סוף-לזווג עם 150 bp לזווג-end קריאות. התנאים עיצוב פריימר אופטימלית כדי לשמש הם: גודל פריימר מזערי = 19; גודל אופטימלי פריימר = 25; גודל מרבי פריימר = 30; Tm מינימום = 64 ° C; Tm אופטימום = 70 מעלות צלזיוס; Tm מרבי = 74 מעלות צלזיוס; ההפרש המרבי Tm = 5 ° C; תוכן GC מינימום = 45; מרבית התוכן GC = 80; מספר כדי להחזיר = 20; סוף יציבות מירבית 3′ = 100.
שיטה 2, נתאר שיטת שילוב פרוטוקול ה-ECS-DNA עם כימיה אילומינה סקר SNVs המשובטים, כמו שנדיר למצוא 0.0001 VAF באמצעות לוחות הגן זמינים מסחרית הכוללים מאות amplicons קטן Indels. יש להשתמש TruSight מיאלואידית רצף הפאנל (אילומינה) עבור הניסוי שלנו ואנו עיצב לוח מורחבת לכלול גנים נוספים עניין למחלות מיאלואידית רפואת ילדים. הלוחות הללו לא הציעו מזהי מולקולרי ייחודי (UMIs) שתאפשר תיקון שגיאות, אז הוספנו משלנו אסטרטגיה מתאם הפאנלים. ECS אמור לעבוד באותה מידה טוב עם כל יתר החלוניות להעשרת עבור גנים הקשורים מחלות שונות. בעקבות הדי בידוד כימות עוקבות רקמות או דגימה של עניין, מומלץ לקיים לפחות 500 ng מלאי דנ א לכל דגימה. אנחנו עושים באופן שגרתי ספריה רצף יחיד באמצעות 250 ננוגרם של ה-DNA, כדי לתפוס כמו שבר גנומית ייחודי הרבה ככל האפשר עבור במורד הנהר קורא מניעת כפילויות וחישוב VAF. ספריה רצף שכפל אופציונלי יכול להתבצע עם ה-250 הנותרים ng של ה-DNA. . אנחנו תמיד עושים שתי ספריות שכפל לכל דגימות, שאנו מחשיבים רק את האירועים שזוהו באופן עצמאי בשני משכפל כמו תוצאות חיוביות נכון. אנחנו גם ליישם מודל גנומית שגיאה בינומי עמדה ספציפית כדי להגביר את הדיוק של variant מתקשר4,13.
לבסוף, אנו מתארים שיטה צימוד ECS כדי רצפי RNA על כימות התעתיק באמצעות לוחות QIAseq ממוקד RNA מדף (Qiagen). UMIs הדרוש עבור מניעת כפילויות תיקון שגיאות שילבו את ערכות ו חוקרים יכול להפוך ספריות בעקבות ההמלצות של היצרן. Bioinformatically, חוקרים אפשר לעקוב הצבר שתואר ECS-ה-dna אשר יוסברו בפירוט בסעיף פרוטוקול.
. הנה, נדגים מחבילת פרוטוקולים של רצף שגיאות ניתן ליישם בקלות ללמוד מוטציות עם VAFs נמוך במחלות שונות. הגורם החשוב ביותר הוא שילוב של UMIs עם כל מולקולה לפני רצף הם מאפשרות תיקון השגיאות הקריאות raw. השיטות המתוארות כאן מאפשרים לשלב UMIs מותאם אישית לוחות הגן זמינים מסחרית והן בעיצוב עצמי oligos גנים ספציפיים.
תקן הגדרות פרוטוקול מונע זיהוי מוטציות עם VAF מתחת 2% שיעור שגיאה רצף, זה מגביל את היישום של המיתרים במחקרים בו הגילוי של גרסאות נדיר הוא קריטי. על ידי עקיפת התעריף הסטנדרטי של שגיאה המיתרים, ECS מאפשר זיהוי רגיש גרסאות אלה raw. למשל, זיהוי של מוטציות פתוגניים כאשר מוטציות אלה נובעים קודם (ולכן יש VAF נמוך) הכרחי ליידע את התערבות מוקדמת של מחלת ה-14,15. במחקר לוקמיה, הגילוי של ממסר מינימלי (תאים לוקמיה שיורית שלאחר הטיפול) מודיע ריבוד סיכון ומחלות יכול לשמש כדי ליידע את אפשרויות הטיפול בצורה בינארית זרימת cytometric הערכות לא יכולה. בנוסף, ה-ECS ישימה לזהות חומצת גרעין הגידול במחזור, כדי להעריך את פוטנציאל גרורתי בחולים גידולים מוצקים על-ידי הערכת העדר/הנוכחות, כמו גם את הנטל וריאנט של מוטציות מסוימות הם מאפייני העיקרית הגידול16.
כפי שמתואר בטבלה1, הכוח של באמצעות מודל המבוסס על התפלגות בינומית שגיאה ספציפית עמדה להתקשר גרסאות תלויה במידה רבה מספר ספריות ברצף, כמו גם את העומק של רצף ששימשו לבניית המודל שגיאה. החוסן של המודל שגיאה עולה עם מספר גבוה יותר של דוגמאות ועומק רצף נוסף. מומלץ להשתמש לפחות 10 דגימות ברצף עם ממוצע של שגיאות קריאה סיקור x 3000 לדגימה לבנות פרופיל של שגיאה עבור כל דגימה. הגישה מיקום ספציפי היא דומה MAGERI, אך במקום להשתמש שיעור שגיאה צבירה עבור כל סוגי שונים החלפת 6 (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)13, אנחנו מודל כל החלפת באופן עצמאי בבית בכל תנוחה. למשל, שיעור שגיאה של C > T במיקום גנומית נתון שונה ממיקום אחר. הגישה שלנו גם לוקח בחשבון את אפקט רצפי אצווה, כמו קצב החלפת בסיס שנצפתה ריצה רצף אחת עשויים להיות שונים מאלה עוד ריצה. לכן חשוב ליצור מודל לכל תפקיד לכל סוגי החלפת במיוחד כאשר דגימות שונות רצף הרצפים הם איחדו לבנות את המודל.
שיקול חשוב בעת תכנון ניסוי ECS הוא הסף זיהוי הרצוי. היופי של מחקרים המיתרים היא כי הם ניתן בקלות לשנות מבחינת גנים/מטרות של הריבית, זיהוי סף (שמכתיבה עומק של רצף) ומספר של יחידים שאילתה. לדוגמה, אם החוקרים מעוניינים למצוא מוטציות נדירות amplicons שני עם סף גילוי של 0.0001, הם יכול בריכה מקסימאלית 75 דוגמאות רצף יחיד להפעיל אותו באמצעות הכימיה MiSeq V2 אשר פלטי עד 15 מיליון קריאות (2 amplicons * 10,000 מולקולות * 10 קורא עבור תיקון השגיאות * דוגמאות 75 = 15 מיליון רצף פעולות הקריאה). חוקרים יכולים להשתנות מספר מולקולות נכנס רצף או מספר דוגמאות במאגר רצף יחיד להפעיל כדי להתאים את סף גילוי. במחקרים שלנו, כיוונו למצוא מוטציות עם סף גילוי של 0.0001 VAF (1:10, 000) שימוש בלוח ג’ין אילומינה. אנו משתמשים באופן שגרתי 250 ng של הקמת ה-DNA על מנת להבטיח כי מספיקות מולקולות נלכדים על מנת להשיג את סף גילוי הנ ל. חוקרים יכולים לבחור להתחיל עם כמות נמוכה יותר של ה-DNA (50 ng מומלץ) אם המגבלה זיהוי הרצוי > 0.001 VAF.
כפי UMIs יצורפו אל האינדקסים i5, רצף הגדרות יש תועלת בהתאם. לדוגמה, השתמשנו 16 N UMIs, בהגדרות רצף היו סוף לזווג 2 x 144 קריאות, 8 מחזורים של אינדקס 1 ו- 16 מחזורים של אינדקס 2 לעומת המחזורים 8 הרגיל של אינדקס 2. הגידול במחזור אינדקס 2 יפוצה על ידי ירידה במספר הכולל של מחזורי המוקצים את הקריאות. אם החוקרים להשתמש 12N UMIs10,17, צריך לשנות את ההגדרות 12 מחזורים של אינדקס 2.
שיטה זו מבוססת-UMI רצף ממוטבת כדי לתקן שגיאות רצף. זה נשאר שיוצרת בהתמודדות עם ה-PCR jackpotting, וזו בעיה עבור כל שיטה המבוססת על הגברה. ביצענו סיבובים של רצף שלאחר ובדיקת פוסט-ביואינפורמטיקה באמצעות ddPCR, אנחנו בקושי לזהות מידע מוטעה עקב PCR jackpotting. למרות זאת, מומלץ כי החוקרים לערוך את הניסויים באמצעות פולימראז דיוק גבוה כדי להבטיח הגברה נמוכה שגיאות.
The authors have nothing to disclose.
אנו מודים משתתפי המחקר האונקולוגי קבוצה AAML1531 של הילדים, האחיות של בריאות עיון על תרומתם בצורה של דגימות החולה. עבודה זו מומן על ידי מכוני הבריאות הלאומיים (UM1 CA186107, RO1 CA49449, RO1 CA149445), גילוי מכון וושינגטון אוניברסיטת של הילדים ו סנט לואיס לילדים חולים (MC-II-2015-461), וקרן אלי סת מתיוס לוקמיה.
Q5 High Fidelity Hot Start Master Mix | New England BioLabs | M0492S | |
Agencourt AMPure XP | Beckman Coulter | A63880 | |
Qubit dsDNA HS Assay Kit | Thermo Fisher Scientific | Q32854 | |
SYBR Safe DNA Gel Stain | Thermo Fisher Scientific | S33102 | |
Truseq Custom Amplicon Index Kit | Illumina | FC-130-1003 | |
UMI i5 adapter sequences | Integrated DNA Technologies | – | |
NEBNext Ultra End Repair/dA-Tailing Module | New England BioLabs | E7442S | |
NEBNext Ultra II Ligation Module | New England BioLabs | E7595S | |
QX200 ddPCR EvaGreen Supermix | Bio-Rad | 1864034 | |
QX200 Droplet Generation Oil for EvaGreen | Bio-Rad | 1864005 | |
QX200 Droplet Digital PCR System | Bio-Rad | 1864001 | |
ddPCR 96-Well Plates | Bio-Rad | 12001925 | |
DG8 Cartridges for QX200/QX100 Droplet Generator | Bio-Rad | 1864008 | |
DG8 Gaskets for QX200/QX100 Droplet Generator | Bio-Rad | 1863009 | |
Bioanalyzer | Agilent Genomics | G2939BA | |
TapeStation | Agilent Genomics | G2991AA | |
TruSight Myeloid Sequencing Panel | Illumina | FC-130-1010 | |
Bowtie 2 | Johns Hopkins University | – | |
Customized QIAseq Targeted RNA Panel | Qiagen | – | |
Rneasy Plus Mini Kit (50) | Qiagen | 74134 |