Protokollen giver instruktion til modificering af RNA med dimethylsulfat til mutationsprofileringseksperimenter. Det omfatter in vitro og in vivo sondering med to alternative biblioteksforberedelsesmetoder.
RNA-strukturens rolle i stort set enhver biologisk proces er blevet mere og mere tydelig, især i det sidste årti. Imidlertid har klassiske tilgange til løsning af RNA-struktur, såsom RNA-krystallografi eller cryo-EM, ikke kunnet følge med det hurtigt udviklende felt og behovet for løsninger med høj kapacitet. Mutationsprofilering med sekventering ved hjælp af dimethylsulfat (DMS) MaPseq er en sekventeringsbaseret tilgang til at udlede RNA-strukturen fra en bases reaktivitet med DMS. DMS methylerer N1-nitrogenet i adenosiner og N3 i cytosiner ved deres Watson-Crick-ansigt, når basen er uparret. Omvendt transskribering af det modificerede RNA med den termostabile gruppe II intron reverse transcriptase (TGIRT-III) fører til, at de methylerede baser inkorporeres som mutationer i cDNA. Når man sekventerer det resulterende cDNA og kortlægger det tilbage til et referencetranskription, er de relative mutationshastigheder for hver base vejledende for basens “status” som parret eller uparret. Selvom DMS-reaktiviteter har et højt signal-støj-forhold både in vitro og i celler, er denne metode følsom over for bias i håndteringsprocedurerne. For at reducere denne bias giver dette papir en protokol til RNA-behandling med DMS i celler og med in vitro transskriberet RNA.
Siden opdagelsen af, at RNA har både strukturelle1,2 og katalytiske3 egenskaber, er betydningen af RNA og dets regulatoriske funktion i en overflod af biologiske processer gradvist blevet afdækket. Faktisk har effekten af RNA-struktur på genregulering fået stigende opmærksomhed4. Ligesom proteiner har RNA primære, sekundære og tertiære strukturer, der henviser til sekvensen af nukleotider, 2D-kortlægningen af baseparringsinteraktioner og 3D-foldningen af disse baseparrede strukturer. Mens bestemmelse af den tertiære struktur er nøglen til at forstå de nøjagtige mekanismer bag RNA-afhængige processer, er den sekundære struktur også meget informativ med hensyn til RNA-funktion og er grundlaget for yderligere 3D-foldning5.
Imidlertid har bestemmelse af RNA-strukturen været iboende udfordrende med konventionelle tilgange. Mens krystallografi, kernemagnetisk resonans (NMR) og kryogen elektronmikroskopi (cryo-EM) for proteiner har gjort det muligt at bestemme mangfoldigheden af strukturelle motiver, hvilket giver mulighed for strukturforudsigelse fra sekvensen alene6, er disse tilgange ikke bredt anvendelige for RNA’er. Faktisk er RNA’er fleksible molekyler med byggesten (nukleotider), der har meget mere konformations- og rotationsfrihed i forhold til deres aminosyremodstykker. Desuden er interaktionerne gennem baseparring mere dynamiske og alsidige end aminosyrerester. Som følge heraf har klassiske tilgange kun været vellykkede for relativt små RNA’er med veldefinerede, meget kompakte strukturer7.
En anden tilgang til bestemmelse af RNA-strukturen er gennem kemisk sondering kombineret med næste generations sekventering (NGS). Denne strategi genererer information om bindingsstatus for hver base i en RNA-sekvens (dvs. dens sekundære struktur). Kort sagt er baserne i et RNA-molekyle, der ikke deltager i baseparring, differentielt modificeret af små kemiske forbindelser. Omvendt transskribering af disse RNA’er med specialiserede reverse transkriptaser (RT’er) inkorporerer modifikationerne i komplementær deoxyribonukleinsyre (cDNA) som mutationer. Disse cDNA-molekyler amplificeres derefter af polymerasekædereaktionen (PCR) og sekventeres. For at få oplysninger om deres “status” som bundet eller ubundet beregnes mutationsfrekvenserne ved hver base i et RNA af interesse og indgår i strukturforudsigelsessoftware som begrænsninger8. Baseret på nærmeste nabos regler9 og minimum gratis energiberegninger10 genererer denne software strukturmodeller, der bedst passer til de opnåede eksperimentelle data11,12.
DMS-MaPseq bruger DMS, som methylerer N1-nitrogenet i adenosiner og N3-nitrogen i cytosiner ved deres Watson-Crick-ansigt på en meget specifik måde13. Brug af termostabil gruppe II intron reverse transkriptase (TGIRT-III) i omvendt transkription skaber mutationsprofiler med hidtil usete signal-støj-forhold, hvilket endda giver mulighed for dekonvolution af overlappende profiler genereret af to eller flere alternative konformationer14,15. Desuden kan DMS trænge ind i cellemembraner og hele væv, hvilket muliggør sondering inden for fysiologiske sammenhænge. Genereringen af data af god kvalitet er imidlertid udfordrende, da variationer i håndteringsproceduren kan påvirke resultaterne. Derfor leverer vi en detaljeret protokol til både in vitro og in-cell DMS-MaPseq for at reducere bias og guide nybegyndere til metoden gennem de vanskeligheder, de måtte støde på. Især i lyset af den nylige SARS-CoV2-pandemi er data af høj kvalitet om RNA-vira et vigtigt redskab til at studere genekspression og finde mulige terapier.
Protokollen her beskriver, hvordan man sonderer RNA in vitro og i celler ved hjælp af DMS-mutationsprofileringseksperimenter. Desuden giver den instruktioner om, hvordan man forbereder biblioteker til Illumina-sekventering for at generere genspecifikke data og analysere de opnåede .fastq-filer. Derudover kan genom-dækkende biblioteksmetoder bruges. Genspecifik RT-PCR producerer dog den højeste kvalitet og mest robuste data. Hvis man sammenligner mellem prøver, er det derfor vigtigt at sikre, at de er forberedt med identiske sekventeringsstrategier, da biblioteksgenereringen forårsager en vis bias. Reproducerbarheden bør altid måles ved hjælp af replikater.
Flere forholdsregler
RNA er et ustabilt molekyle, der er følsomt over for nedbrydning både gennem forhøjede temperaturer og af RNaser. Derfor anbefales særlige foranstaltninger – brug af personlige værnemidler (PPE), RNAse-frit materiale og RNAse-hæmmere. Vigtigst er det, at RNA holdes på is, når det er muligt. Dette gælder især methyleret RNA, som er endnu mere følsomt over for høje temperaturer.
Det er vigtigt at bekræfte, at RNA-strukturen af interesse ikke er følsom over for DMS-koncentrations- og bufferbetingelserne. Buffere såsom 100 mM Tris, 100 mM MOP og 100 mM HEPES ved pH 7-7,5 giver et højt signal, men er muligvis ikke tilstrækkeligt til at opretholde pH under reaktionen21. Da DMS hydrolyserer i vand, hvilket reducerer pH, er en stærk buffer afgørende for at opretholde en neutral pH under modifikationsreaktionen. Tilsætningen af bicin har vist sig at hjælpe med at opretholde pH som lidt grundlæggende21 , men resulterer i lav DMS-modifikation på Gs og Us, hvilket kunne være informativt, men bør analyseres separat på grund af produktionen af et meget lavere signal end As og Cs og diskuteres ikke yderligere i denne protokol.
I genspecifik RT-PCR transkriberes det modificerede RNA omvendt til DNA’et og amplificeres i fragmenter af PCR. Mens størrelsen af RNA’et teoretisk kan være ubegrænset, bør disse PCR-fragmenter ikke overstige en længde på 400-500 basepar (bp) for at forhindre bias under den omvendte transkriptionsreaktion. Ideelt set bør fragmenterne være inden for rammerne af sekventeringskørslen (dvs. hvis sekventering udføres ved hjælp af et 150 x 150 cyklusparret sekventeringsprogram, bør et enkelt fragment ikke overstige 300 bp). Når du bruger sekventeringsprogrammer med færre cyklusser, kan PCR-produkterne fragmenteres ved hjælp af en dsDNase. Da sekvenser inden for primersekvenserne ikke indeholder nogen strukturel information, skal fragmenterne desuden overlappe hinanden, når det undersøgte RNA omfatter >1 fragment. RT-reaktioner kan indeholde flere RT-primere til forskellige fragmenter (op til 10 forskellige RT-primere). Afhængigt af sekvenserne kan pooling af RT-primere gøre den omvendte transkription mindre effektiv, men fungerer typisk godt. Hver PCR-reaktion skal udføres separat.
Ved sondering af RNA med DMS spiller de eksperimentelle forhold en yderligere rolle, da mange RNA’er er termodynamisk ustabile og ændrer deres konformation baseret på miljøfaktorer som temperatur. For at undgå uregelmæssigheder bør forsøgsbetingelserne holdes så konstante som muligt, også med hensyn til reaktionstider. Bufferbetingelserne synes at kunne udskiftes til en vis grad 17,20,22,23, når de grundlæggende betingelser opretholdes – bufferkapaciteten og tilstedeværelsen af monovalente (Na) og divalente ioner (Mg) – for at sikre korrekt foldning af RNA 24.
Med hensyn til biblioteksforberedelse af modificerede RNA’er skal flere aspekter tages i betragtning. For det første er modificerede RNA’er som nævnt mindre stabile end deres umodificerede modstykker, hvilket betyder, at de muligvis kræver optimering af fragmenteringstiderne for optimal fragmentstørrelsesfordeling. Desuden bruger visse RNA-biblioteksforberedelsessæt såvel som mange andre RNAseq-tilgange tilfældige primere i det omvendte transkriptionssæt. Dette kan føre til lavere dækning af referencen, især i 3’et gen, og i sidste ende til utilstrækkelig dækningsdybde. Hvis dækningen af en bestemt region er for lav, kan det være nødvendigt at fjerne disse baser fra strukturforudsigelsen. Bortset fra RT-PCR og helgenom RNAseq-sæt kan andre biblioteksforberedelsesmetoder anvendes. Protokoller, der inkluderer ligering af 3′ og/eller 5′ adaptere til RNA’et, er fordelagtige, når der anvendes små fragmenter af RNA, eller når tab af sonderende information i primerregionerne skal undgås.
Endelig skal analysen af de kemiske sondeforsøg altid fortolkes omhyggeligt. I øjeblikket er der ingen software, der forudsiger RNA-strukturen af noget RNA fra sekvensen alene med høj nøjagtighed. Selvom kemiske sonderingsbegrænsninger i høj grad forbedrer nøjagtigheden, er det stadig udfordrende at generere gode modeller til lange RNA’er (>500 nt). Disse modeller bør testes yderligere ved andre tilgange og/eller mutagenese. RNA-forudsigelsessoftware optimerer til det maksimale antal basepar, hvilket straffer åbne konformationer betydeligt, hvilket muligvis ikke nøjagtigt repræsenterer RNA-foldning5. Således bør den opnåede strukturmodel testes ved at kvantificere forudsigelsesaftalen med de underliggende kemiske sonderingsdata (f.eks. af AUROC) og mellem replikater (f.eks. ved mFMI), som eksemplificeret ved Lan et al.20.
Ideelt set bør flere eksperimenter i forskellige systemer for at udfordre den opnåede strukturmodel bruges til at styrke ens hypotese. Disse kan omfatte brugen af in vitro – og in-cell-tilgange, kompenserende mutationer og forskellige cellelinjer og arter. Desuden er rå reaktiviteter ofte lige så eller endda mere informative end strukturforudsigelser, da de registrerer “ground truth” -øjebliksbilledet af RNA-foldensemblet. Som sådan er rå reaktiviteter meget velegnede og informative til sammenligning af strukturændringer mellem forskellige forhold. Det er vigtigt, at de laveste frie energistrukturer beregnet ved hjælp af kemiske sonderingsbegrænsninger med beregningsforudsigelse kun bør bruges som en starthypotese mod en komplet strukturmodel.
The authors have nothing to disclose.
Ingen
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |