Protokollet ger instruktioner för modifiering av RNA med dimetylsulfat för mutationsprofileringsexperiment. Den inkluderar in vitro – och in vivo-sondering med två alternativa biblioteksberedningsmetoder.
RNA-strukturens roll i praktiskt taget alla biologiska processer har blivit allt tydligare, särskilt under det senaste decenniet. Klassiska metoder för att lösa RNA-struktur, såsom RNA-kristallografi eller kryo-EM, har dock misslyckats med att hålla jämna steg med det snabbt utvecklande fältet och behovet av lösningar med hög genomströmning. Mutationsprofilering med sekvensering med dimetylsulfat (DMS) MaPseq är ett sekvenseringsbaserat tillvägagångssätt för att härleda RNA-strukturen från en bas reaktivitet med DMS. DMS-metylerar N1-kvävet i adenosiner och N3 i cytosiner vid deras Watson-Crick-ansikte när basen är oparad. Omvänd transkribering av det modifierade RNA med det termostabila grupp II-intron-omvända transkriptaset (TGIRT-III) leder till att de metylerade baserna införlivas som mutationer i cDNA. När du sekvenserar det resulterande cDNA och mappar det tillbaka till ett referenstranskript, är de relativa mutationshastigheterna för varje bas en indikation på basens “status” som parad eller oparad. Även om DMS-reaktivitet har ett högt signal-brusförhållande både in vitro och i celler, är denna metod känslig för bias i hanteringsprocedurerna. För att minska denna bias tillhandahåller detta papper ett protokoll för RNA-behandling med DMS i celler och med in vitro-transkriberat RNA.
Sedan upptäckten att RNA har både strukturella 1,2 ochkatalytiska 3 egenskaper har betydelsen av RNA och dess reglerande funktion i en uppsjö av biologiska processer gradvis upptäckts. Faktum är att effekten av RNA-struktur på genreglering har fått ökad uppmärksamhet4. Liksom proteiner har RNA primära, sekundära och tertiära strukturer, med hänvisning till sekvensen av nukleotider, 2D-kartläggningen av basparningsinteraktioner respektive 3D-vikningen av dessa basparade strukturer. Även om bestämning av den tertiära strukturen är nyckeln till att förstå de exakta mekanismerna bakom RNA-beroende processer, är den sekundära strukturen också mycket informativ när det gäller RNA-funktion och ligger till grund för ytterligare 3D-vikning5.
Att bestämma RNA-strukturen har dock varit i sig utmanande med konventionella tillvägagångssätt. Medan för proteiner har kristallografi, kärnmagnetisk resonans (NMR) och kryogen elektronmikroskopi (kryo-EM) gjort det möjligt att bestämma mångfalden av strukturella motiv, vilket möjliggör strukturförutsägelse från sekvensen ensam6, är dessa tillvägagångssätt inte allmänt tillämpliga på RNA. Faktum är att RNA är flexibla molekyler med byggstenar (nukleotider) som har mycket mer konformations- och rotationsfrihet jämfört med deras aminosyrakomponenter. Dessutom är interaktionerna genom basparning mer dynamiska och mångsidiga än aminosyrarester. Som ett resultat har klassiska tillvägagångssätt varit framgångsrika endast för relativt små RNA med väldefinierade, mycket kompakta strukturer7.
Ett annat tillvägagångssätt för att bestämma RNA-strukturen är genom kemisk sondering i kombination med nästa generations sekvensering (NGS). Denna strategi genererar information om bindningsstatusen för varje bas i en RNA-sekvens (dvs. dess sekundära struktur). I korthet modifieras baserna i en RNA-molekyl som inte ägnar sig åt basparning differentiellt av små kemiska föreningar. Omvänd transkribering av dessa RNA med specialiserade omvända transkriptaser (RT) införlivar modifieringarna i komplementär deoxiribonukleinsyra (cDNA) som mutationer. Dessa cDNA-molekyler förstärks sedan av polymeraskedjereaktionen (PCR) och sekvenseras. För att få information om deras “status” som bunden eller obunden beräknas mutationsfrekvenserna vid varje bas i ett RNA av intresse och matas in i strukturförutsägelseprogramvara som begränsningar8. Baserat på närmaste granne regler9 och minsta fria energiberäkningar 10, genererar denna programvara strukturmodeller som bäst passar de erhållna experimentella data11,12.
DMS-MaPseq använder DMS, som metylerar N1-kvävet i adenosiner och N3-kväve i cytosiner vid deras Watson-Crick-ansikte på ett mycket specifikt sätt13. Genom att använda termostabilt grupp II-intron-omvänd transkriptas (TGIRT-III) i omvänd transkription skapas mutationsprofiler med oöverträffade signal-brusförhållanden, vilket till och med möjliggör dekonvolution av överlappande profiler som genereras av två eller flera alternativa konformationer14,15. Dessutom kan DMS penetrera cellmembran och hela vävnader, vilket möjliggör sondering inom fysiologiska sammanhang. Det är dock en utmaning att generera data av god kvalitet, eftersom variationer i hanteringsproceduren kan påverka resultaten. Därför tillhandahåller vi ett detaljerat protokoll för både in vitro och in-cell DMS-MaPseq för att minska bias och vägleda nykomlingar till metoden genom de svårigheter de kan stöta på. Särskilt mot bakgrund av den senaste SARS-CoV2-pandemin är högkvalitativa data om RNA-virus ett viktigt verktyg för att studera genuttryck och hitta möjliga terapier.
Protokollet beskriver här hur man undersöker RNA in vitro och i celler med hjälp av DMS-mutationsprofileringsexperiment. Dessutom ger den instruktioner om hur man förbereder bibliotek för Illumina-sekvensering för att generera genspecifika data och analysera de erhållna .fastq-filerna. Dessutom kan genomomfattande biblioteksmetoder användas. Genspecifik RT-PCR producerar dock högsta kvalitet och mest robusta data. Därför, om man jämför mellan prover, är det viktigt att se till att de är förberedda med identiska sekvenseringsstrategier, eftersom biblioteksgenereringen orsakar viss bias. Reproducerbarheten bör alltid mätas med hjälp av replikat.
Flera försiktighetsåtgärder
RNA är en instabil molekyl som är känslig för nedbrytning både genom förhöjda temperaturer och av RNaser. Därför rekommenderas särskilda åtgärder – användning av personlig skyddsutrustning (PPE), RNAse-fritt material och RNAse-hämmare. Viktigast av allt bör RNA hållas på is när det är möjligt. Detta gäller särskilt metylerat RNA, vilket är ännu känsligare för höga temperaturer.
Det är viktigt att bekräfta att RNA-strukturen av intresse inte är känslig för DMS-koncentrationen och buffertförhållandena. Buffertar som 100 mM Tris, 100 mM MOPS och 100 mM HEPES vid pH 7-7,5 ger en hög signal men kanske inte är tillräckliga för att bibehålla pH under reaktionen21. Eftersom DMS hydrolyserar i vatten, vilket minskar pH, är en stark buffert avgörande för att upprätthålla ett neutralt pH under modifieringsreaktionen. Tillsatsen av bicine har visat sig hjälpa till att upprätthålla pH som något grundläggande21 men resulterar i låg DMS-modifiering på Gs och Us, vilket kan vara informativt men bör analyseras separat på grund av produktionen av en mycket lägre signal än As och Cs och diskuteras inte vidare i detta protokoll.
I genspecifik RT-PCR transkriberas det modifierade RNA omvänt till DNA och förstärks i fragment av PCR. Medan storleken på RNA teoretiskt kan vara obegränsad, bör dessa PCR-fragment inte överstiga en längd av 400-500 baspar (bp) för att förhindra bias under omvänd transkriptionsreaktion. Helst bör fragmenten ligga inom ramen för sekvenseringskörningen (dvs. om sekvensering utförs med hjälp av ett 150 x 150 cykelparat sekvenseringsprogram, bör ett enda fragment inte överstiga 300 bp). När du använder sekvenseringsprogram med färre cykler kan PCR-produkterna fragmenteras med hjälp av en dsDNase. Eftersom sekvenser inom primersekvenserna inte innehåller någon strukturell information måste fragmenten dessutom överlappa varandra när det sonderade RNA består av >1 fragment. RT-reaktioner kan innehålla flera RT-primers för olika fragment (upp till 10 olika RT-primers). Beroende på sekvenserna kan sammanslagning av RT-primers göra omvänd transkription mindre effektiv men fungerar vanligtvis bra. Varje PCR-reaktion bör utföras separat.
Vid sondering av RNA med DMS spelar de experimentella förhållandena en ytterligare roll, eftersom många RNA är termodynamiskt instabila och ändrar deras konformation baserat på miljöfaktorer som temperatur. För att undvika oegentligheter bör de experimentella betingelserna hållas så konstanta som möjligt, även med avseende på reaktionstider. Buffertförhållandena verkar vara utbytbara till en viss grad 17,20,22,23 när de grundläggande förhållandena upprätthålls – buffringskapaciteten och närvaron av monovalenta (Na) och tvåvärda joner (Mg) – för att säkerställa korrekt vikning av RNA 24.
När det gäller biblioteksberedningen av modifierade RNA måste flera aspekter beaktas. För det första, som nämnts tidigare, är modifierade RNA mindre stabila än deras omodifierade motsvarigheter, vilket innebär att de kan kräva optimering av fragmenteringstiderna för optimal fragmentstorleksfördelning. Dessutom använder vissa RNA-biblioteksberedningssatser, liksom många andra RNAseq-metoder, slumpmässiga primers i omvänd transkriptionssats. Detta kan leda till lägre täckning av referensen, särskilt i 3 ‘av en gen, och i slutändan till otillräckligt täckningsdjup. Om täckningen för en viss region är för låg kan det vara nödvändigt att ta bort dessa baser från strukturförutsägelsen. Förutom RT-PCR och RNAseq-kit med hela genomet kan andra biblioteksberedningsmetoder användas. Protokoll som inkluderar ligering av 3′- och/eller 5’-adaptrar till RNA är fördelaktiga vid användning av små fragment av RNA eller när förlust av sonderingsinformation i primerregionerna måste undvikas.
Slutligen måste analysen av de kemiska sonderingsexperimenten alltid tolkas noggrant. För närvarande finns det ingen programvara som förutsäger RNA-strukturen för något RNA från sekvensen ensam med hög noggrannhet. Även om kemiska sondbegränsningar förbättrar noggrannheten avsevärt, är det fortfarande utmanande att generera bra modeller för långa RNA (> 500 nt). Dessa modeller bör testas ytterligare med andra metoder och/eller mutagenes. RNA-förutsägelseprogramvara optimerar för det maximala antalet baspar, vilket avsevärt straffar öppna konformationer, vilket kanske inte exakt representerar RNA-vikning5. Således bör den erhållna strukturmodellen testas genom att kvantifiera prediktionsavtalet med underliggande kemiska sonderingsdata (t.ex. av AUROC) och mellan replikat (t.ex. av mFMI), vilket exemplifieras av Lan et al.20.
Helst bör flera experiment i olika system för att utmana den erhållna strukturmodellen användas för att stärka sin hypotes. Dessa kan inkludera användning av in vitro – och in-cell-metoder, kompensationsmutationer och olika cellinjer och arter. Dessutom är råa reaktiviteter ofta lika eller till och med mer informativa än strukturförutsägelser, eftersom de registrerar ögonblicksbilden av “grundsanningen” av RNA-vikningsensemblen. Som sådan är råa reaktiviteter mycket lämpliga och informativa för att jämföra strukturförändringar mellan olika förhållanden. Viktigt är att de lägsta fria energistrukturerna beräknade med hjälp av kemiska sonderingsbegränsningar med beräkningsförutsägelse endast bör användas som en starthypotes mot en komplett strukturmodell.
The authors have nothing to disclose.
Ingen
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |