Long-Læs sekvenser i høj grad lette samling af komplekse genomer og karakterisering af strukturel variation. Vi beskriver en metode til at generere ultra-lange sekvenser af nanopore-baseret sekventering platforme. Fremgangsmåde vedtager en optimeret DNA-ekstraktion efterfulgt af modificerede bibliotek forberedelser til at generere hundredvis af kilobase læser med moderat dækning fra menneskeceller.
Tredje generation enkelt-molekyle DNA-sekventering teknologier tilbyder væsentligt længere læse længde, der kan lette forsamlingen af komplekse genomer og analyse af komplekse strukturelle varianter. Nanopore platforme udfører enkelt-molekyle sekventering ved direkte måling af de aktuelle ændringer medieret af DNA passage gennem porerne og kan generere hundredvis af kilobase (kb) læser med minimal kapitalomkostninger. Denne platform er blevet vedtaget af mange forskere for en bred vifte af applikationer. At opnå længere sekventering Læs længder er den mest kritiske faktor at udnytte værdien af nanopore sekventering platforme. For at generere ultralang læser, skal særligt hensyn undgå DNA beskadigelser og få effektivitet for at generere produktive sekventering skabeloner. Her, leverer vi detaljerede protokollen af ultra-lange DNA-sekventering herunder høj molekylvægt (HMW) DNA-ekstraktion fra friske eller frosne celler, bibliotek opførelse af mekaniske klipning eller transposase fragmentering, og sekventering på en nanopore enhed. Fra 20-25 µg HMW DNA, metoden kan opnå N50 læse længde på 50-70 kb med mekanisk klipning og N50 på 90-100 kb læst længde med transposase medieret fragmentering. Protokollen kan anvendes til DNA ekstraheret fra mammale celler til at udføre hele genome sequencing til påvisning af strukturelle varianter og genom forsamling. Yderligere forbedringer på DNA-ekstraktion og enzymatiske reaktioner vil yderligere øge Læs længden og udvide dens nytte.
I det sidste årti, parallel massivt og meget præcise andengenerations høj overførselshastighed sekventering teknologier har drevet en eksplosion af biomedicinske opdagelse og teknologisk innovation1,2,3. Trods de tekniske fremskridt, de korte-læsning af data genereret af andengenerations-platforme er ineffektive i løsning af komplekse genomisk regioner og er begrænset til paavisning af genomisk strukturel varianter (SVs), som spiller en vigtig rolle i menneskelige Evolution og sygdomme4,5. Desuden kort-læse data er ikke i stand til at løse gentage variation og er uegnede til kræsne haplotype udfasning af genetiske varianter6.
De seneste fremskridt i enkelt-molekyle sekventering tilbyder væsentligt længere læse længde, som kan lette afsløringen af det fulde spektrum af SVs7,8,9, og tilbyder præcise og komplette samling af komplekse mikrobiel og pattedyr genomer6,10. Nanopore platform udfører enkelt-molekyle sekventering ved direkte måling af de aktuelle ændringer medieret af DNA passage gennem porerne11,12,13. I modsætning til eventuelle eksisterende DNA-sekventering kemi, nanopore sekvensering kan generere lange (TEN til tusindvis af kilobases) læser i realtid uden at påberåbe polymerase kinetik eller kunstige forstærkning af DNA-prøven. Derfor nanopore long-Læs sekventering (NLR-seq) holder meget lovende for at skabe ultra-lang Læs længder langt ud over 100 kb, som ønsker høj grad fremme genomisk og biomedicinske analyser14, især i lav kompleksitet eller repeat-rige regioner af genomer15.
Den enestående indslag i nanopore sekventering er dets potentiale til at generere lang læser uden en teoretisk længde begrænsning. Derfor, Læs længden er afhængige af den fysiske længde af DNA, der er direkte berørt af DNA integritet og sekventering skabelon kvaliteten. Desuden, afhængigt af omfanget af manipulation og antallet af trin involveret, såsom pipettering styrker og udvinding betingelser, kvaliteten af DNA er meget varierende. Derfor er det udfordrende at give lange læsninger af bare anvende DNA udvinding standardprotokoller og producentens medfølgende bibliotek byggemetoder. Mod dette formål har vi udviklet en robust metode til at generere ultra-lang læse (hundredvis af kilobases) sequencing data fra høstede celle pellets. Vi vedtog flere forbedringer i procedurerne for DNA udvinding og bibliotek forberedelse. Vi strømlinede protokol for at udelukke unødvendige procedurer, der forårsager DNA nedbrydning og skader. Denne protokol er sammensat af høj molekylvægt (HMW) DNA-ekstraktion, ultra-lang DNA bibliotek opbygning og sekventering på en nanopore platform. For en veluddannet molekylærbiolog tager det typisk 6 h fra celle høst til færdiggørelsen af HMW DNA udvinding, 90 min eller 8 h for biblioteket konstruktion afhængigt af metoden klipning, og op til en yderligere 48 h for DNA-sekventering. Brug af protokollen vil give genomforskning Fællesskabet til at forbedre vores forståelse af genom kompleksitet og få ny indsigt i genom variation i menneskelige sygdomme.
I princippet er nanopore sekventering i stand til at generere 100 kb til megabase læser i længde11,12,13. Fire vigtigste faktorer vil påvirke ydeevnen af sekventering run og data kvalitet: 1) aktive pore numre og aktivitet af porer; 2) motor protein, som styrer hastigheden af DNA passerer gennem nanopore; 3) DNA skabelon (længde, renhed, kvalitet, masse); 4) sekventering adapter ligatur effektivitet, som bestemmer det brugbart DNA fra input prøven. De første to faktorer afhænger af versionen af cellen flow og sekventering kit fra producenten. De næste to faktorer er vigtige skridt i denne protokol (HMW DNA-ekstraktion, klipning og ligatur).
Denne protokol kræver tålmodighed og praksis. Kvaliteten af HMW DNA er vigtigt for ultra-lang DNA biblioteker6. Protokollen starter med celler, der opsamlet med høj rentabilitet (> 85% levedygtige celle foretrækkes), begrænse den forringede DNA fra døde celler. Enhver barske proces, som kan indføre skader DNA (fx, stærkt foruroligende, ryster, vortex, flere pipettering, gentagen nedfrysning og optøning) bør undgås. I udformningen af protokollen udelader vi pipettering i hele processen med DNA-ekstraktion. Bred bore tips skal bruges, når pipettering er nødvendigt efter mekanisk klipning under bibliotek opbygning og sekventering. Som nanoporer er følsomme overfor kemi i salen buffer12, bør der være så få resterende forurenende stoffer (fx vaske-og rengøringsmidler, overfladeaktive stoffer, phenol, ethanol, proteiner RNA’er, osv) som muligt i DNA. I betragtning af længden og udbytte viser phenol ekstraktion metode de bedste og mest reproducerbare resultater sammenlignet med flere forskellige udvindingsmetoder testet indtil videre.
Trods denne protokol evne til at producere lange-Læs sekvenser, stadig flere begrænsninger. Første, denne protokol blev optimeret baseret på nanopore sekventering enheden tilgængelig på tidspunktet for offentliggørelse; således, det er begrænset til den selektive nanopore-baserede sekventering kemi og kunne være suboptimal når de udføres i andre typer af lang-Læs sekventering enheder. Andet, resultatet er meget afhængig af kvaliteten af DNA ekstraheret fra råvare (væv eller celler). Læs længde vil blive kompromitteret, hvis start DNA er allerede nedbrudt eller beskadiget. Tredje, selv om flere QC trin indgår i protokollen at kontrollere DNA-kvaliteten, endelige udbytte og længden af læst kan blive påvirket af cellen flow og pore aktivitet, som kunne være variabel på dette tidlige stadium af nanopore sekventering platform udvikling.
Protokollen beskrevet bruger her menneskelige suspension celle linje prøver til DNA-ekstraktion. Vi har optimeret passerer gange i nål klipning, forholdet mellem HMW DNA til transposase og ligatur tid at opnå de beskrevne resultater. Protokollen kan udvides på fire måder. Først, brugere kan starte med andre kulturperler pattedyrceller og med forskellige mængde af celler, væv, kliniske prøver eller andre organismer. Yderligere optimering på lysis inkubationstiden, reaktion volumen og centrifugering vil være nødvendig. For det andet, det er svært at forudsige Målstørrelse til ultra-lang Læs sekvensering. Hvis de Læs længder er kortere end forventet, kan brugerne justere passerer gange i den mekaniske klipning-baseret metode eller ændre forholdet mellem HMW DNA til transposase i transposase fragmentering-baserede metode. Længere bindende og eluering tid under oprydning trin er nyttigt, fordi HMW DNA er meget tyktflydende. Tredje, med forskellige nanopore sekventering enheder, kan man justere mængden og omfanget af DNA til at opfylde kriterierne i sequencer. For det fjerde vil kun disse DNA forbundet til sekvensering adaptere blive sekventeret. Yderligere at forbedre ligatur effektivitet, kan man forsøge at titrere adapter og ligase koncentrationerne. Modificerede ligatur tid og molekylær crowding agenter såsom PLØK18 kan anvendes i fremtiden. Ultra-lang DNA-sekventering protokollen kombineret med CRISPR19,20 kan tilbyde et effektivt redskab til target berigelse sekvensering.
The authors have nothing to disclose.
Forfatterne takke Y. Zhu for hendes kommentarer til manuskriptet. Forskning rapporteret i denne publikation blev delvist støttet af National Cancer Institute af National Institutes of Health under Award nummer P30CA034196. Indholdet er udelukkende ansvarlig for forfattere og repræsenterer ikke nødvendigvis de officielle synspunkter af National Institutes of Health.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |