Summary
Detta protokoll utgör en fullständig och detaljerad procedur för att tillämpa RNA-seq, en kraftfull nästa generations DNA-sekvensering teknik, profil transcriptomes i humana pulmonära mikrovaskulära endotelceller med eller utan trombin behandling. Detta protokoll är generaliserbara till olika celler eller vävnader som påverkas av olika reagenser eller sjukdomstillstånd.
Abstract
Karakteriseringen av genuttryck i celler via mätning av mRNA-nivåer är ett användbart verktyg för att bestämma hur den transkriptionella maskineriet cellen påverkas av externa signaler (t.ex. läkemedelsbehandling), eller hur celler skiljer mellan ett hälsosamt tillstånd och ett sjukdomstillstånd. Med tillkomsten och kontinuerlig förfining av nästa generations DNA-sekvensering teknik, har RNA-sekvensering (RNA-seq) blivit en alltmer populär metod för transkriptom analys att katalogisera alla arter av transkript, för att bestämma den transkriptionella strukturen för alla uttryckta gener och att kvantifiera de förändrade uttrycksnivåer av den totala uppsättningen av transkript i en given cell, vävnad eller organism 1,2. RNA-seq successivt ersätta DNA microarrays som en föredragen metod för Transkriptomanalys eftersom det har fördelarna med profilering en komplett transkriptom, vilket ger en digital typ nollpunkt (kopia på alla transkript) och inte förlita sig på någon känd genomisk sekventielltce 3.
Här presenterar vi en komplett och detaljerat protokoll tillämpa RNA-seq att profilera transcriptomes i mänskliga lung mikrovaskulära endotelceller med eller utan trombin behandling. Detta protokoll är baserad på vår publicerade nyligen med titeln studien "RNA-seq avslöjar Novel Transcriptome av gener och deras isoformer i mänskliga pulmonell mikrovaskulära endotelceller behandlas med trombin," 4 där vi framgångsrikt utfört den första kompletta transkriptom analys av humana pulmonära mikrovaskulära endotelceller behandlades med trombin med användning av RNA-seq. Det gav oerhörda resurser för ytterligare experiment för att få insikt i molekylära mekanismerna bakom trombinmedierad endoteldysfunktion i patogenesen av inflammatoriska tillstånd, cancer, diabetes och hjärt-kärlsjukdomar, och ger potentiella nya ledare för terapeutiska mål för dessa sjukdomar.
Den beskrivande texten av detta protokollär uppdelad i fyra delar. Den första delen beskriver behandlingen av humana pulmonella mikrovaskulära endotelceller med trombin och RNA-isolering, kvalitet analys och kvantifiering. Den andra delen beskriver bibliotek konstruktion och sekvensering. Den tredje delen beskriver dataanalys. Den fjärde delen beskriver en RT-PCR validering analys. Representativa resultat av flera viktiga steg visas. Användbara tips eller försiktighetsåtgärder för att öka framgång i viktiga steg finns i diskussionsavsnittet. Även detta protokoll använder humana pulmonära mikrovaskulära endotelceller behandlade med trombin, kan det vara generaliseras till profilen transcriptomes i både däggdjurs-och icke-däggdjursceller och i vävnader behandlade med olika stimuli eller inhibitorer, eller att jämföra transcriptomes i celler eller vävnader mellan ett hälsosamt tillstånd och ett sjukdomstillstånd.
Protocol
Ett flödesschema som beskriver detta protokoll visas i figur 1.
1. Behandling av celler med trombin, RNA-isolering, kvalitetsbedömning och kvantifiering av RNA
- Kultur Human Lung mikrovaskulära endotelceller (HMVEC-LBL) till 90-100% konfluens i 6-brunnsplattor i EGM-2-medium med 5% FBS, tillväxtfaktorer och antibiotika (Lonza, cat # CC-3202).
- Byta media till svält mediet (0% FBS) 30 minuter före behandling med trombin.
- Behandla cellerna med 0,05 U / ml trombin eller lämna obehandlat som en kontroll under 6 h vid 37 ° C och 5% COj 2.
- Isolera total-RNA från de behandlade och kontroll-celler med användning av Ambion mir Vana kit enligt tillverkarens instruktioner.
- Bedöma kvaliteten av RNA med en Experion StdSense Eukaryotic RNA-chip enligt standarden protokollet om Experion Automated Electrophoresis Station (= "_blank"> Www.bio-rad.com).
- Kvantifiera RNA med hjälp av en vanlig spektrofotometrisk metod.
2. Bibliotek Konstruktion och sekvensering
- Använd 1 pg av hög kvalitet totalt RNA per prov som utgångsmaterial.
- För att konstruera biblioteket, följ standardförfarandet från Illumina (protokoll # 15.008.136 Rev A). I detta protokoll innehåller mRNA val två omgångar av poly (A) utförs för att avlägsna rRNA för att minimera rRNA-sekvensering.
- Bedöma kvaliteten på de bibliotek som använder en Experion DNA 1K-chip enligt standarden protokollet om Experion Automated Electrophoresis Station ( www.bio-rad.com ).
- Kvantifiera biblioteket med qPCR: Använd ett bibliotek som tidigare har sekvenserats som en standardkurva och primers specifika för de ligerade adaptrar. Använda en rad utspädningar av de okända biblioteken (dvs. 1:100, 1:500 och 1:1000). Kör qPCR according till SyberGreen MM-protokollet och beräkna den ursprungliga beståndet koncentrationen av varje bibliotek.
- Späd bibliotekets bestånd 10 nM och förvara vid -20 ° C tills den ska klustret en flödescell.
- När du är redo att kluster en flödescell, tina CBOT reagens plattan i ett vattenbad. CBOT är ett Illumina instrument som används för att effektivisera processen klustret generationen.
- Tvätta CBOT instrumentet.
- Denaturera biblioteken: Kombinera 13 il 1x TE och 6 pl 10 pM bibliotek och, vid sidan av röret, tillsätt 1 pl 1 N NaOH (tillhandahållen av Illumina). Vortex, centrifugera ner, inkubera vid rumstemperatur under 5 minuter och placera de denaturerade biblioteken på is.
- Späd biblioteken: Späd de denaturerade bibliotek med i förväg kyld hybridiseringsbuffert (HT1, tillhandahålls av Illumina) genom att kombinera 996 pl HT1 och 4 il denaturerat bibliotek för en slutlig koncentration av 12 pM. Placera denaturerade och utspädda bibliotek på is.
- Vänd varje rad av rör i CBOT plattan,säkerställa att alla reagens tinas. Spinn ner plattan, ta bort / punktera folien tätningar och ladda upp på CBOT.
- Alikvotera 120 ul av de utspädda, denaturerade bibliotek till en remsa rör märkta 1-8. Lägg 1,2 pl utspätt, denaturerad PhiX kontroll bibliotek (från Illumina) i varje rör som spik-kontroll. Vortex och spinn ner rören och ladda dem på CBOT i rätt riktning (rör # 1 till höger).
- Ladda en flödescell och grenrör på CBOT.
- Fyll i flödet kontrollera och börja klustring sikt.
- Efter körningen är klar, se reagens leverans i alla körfält. Anteckna eventuella avvikelser. Antingen startar sekvensering körningen omedelbart eller lagra flödescellen i medföljande röret vid 4 ° C.
- Tina sekvensering genom syntes (SBS, Illumina) reagens.
- Ladda reagenser till rätt fläckar på reagens brickor, se till att inte röra de andra reagensen efter beröring av klyvning mix.
- Använda en nejn-sekvensering flödescell (dvs en som sekvenserades tidigare), prime raderna reagens två gånger.
- Rengör sekvensering flödescellen med 70% EtOH och Kimwipes, följt av 70% EtOH och linspapper. Inspektera flödescellen för alla ränder. Re-rengör den vid behov.
- Ladda flödescellen på sekvenseraren och utföra ett flöde kontrollera att tätningen mellan grenrören och flödescellen är tät.
- Starta sekvensering sikt.
- Bedöma kvaliteten mått (t.ex. kluster densitet, kluster passerar filtret, Q30, intensitet) när de blir tillgängliga under körningen.
- Övervaka intensitet hela körningen.
- Efter 101 cykler slutförts utför vändningen kemi för att slutföra den andra läser: Tina de parade slut reagenser och den andra läsning Införlivande Buffer (ICB, en komponent i SBS reagenser, Illumina) och ladda reagensen.
- Fortsätt sekvensering sikt bedömer 2: a läsa intensitet, Q30 ennd andra kvalitetsmått som kör fortskrider.
3. Dataanalys
- Använd den senaste versionen av CASAVA (Illumina, för närvarande 1.8.2) för att konvertera filerna bas samtal (. BCL)-filer till. Fastq filer, inställning fastq-cluster-räkna till 0 för att säkerställa skapandet av en gemensam fastq fil för varje prov . Packa upp fastq filer för nedströms analys.
- Utför parade slut inriktning med de senaste versionerna av TopHat (1.4.1) 5, som riktar RNA-seq läser till däggdjur storlek genomet med hjälp av ultra high-throughput kort läsning Aligner (Bowtie, 0.12.7) 6 och SAMtools (0,1. 17) 7. SAMtools genomför olika verktyg för efterbehandling anpassningar i SAM-format. Hänvisningen mänskliga transkriptom kan laddas ner från iGenomes ( www.illumina.com ). I löpande TopHat använde vi alla standardinställningarna parameterinställningar inklusive bibliotekets typ alternativet som fr-unstranded (standard).
- Ossning av programmet CuffDiff, en del av manschettknappar (1.3.0) 8 programpaket, jämföra trombin-behandlade celler med kontrollerna cellerna att sålla ut de differentiellt uttryckta gentranskript i fd bygger på den mänskliga referens transkriptom. Denna jämförelse detekterar det differentiella uttrycket av kända transkript. Använd Microsoft Excel för att visualisera resultatet i tabellform. I löpande Manschettknappar program använde vi alla standardinställningar parametrar. Dessa gentranskript med FPKM <0,05 och p> 0,05 filtreras ut.
- För att upptäcka nya isoformer, köra manschettknappar utan en referens transkriptom. Jämför filerna prov avskrift med referensläkemedlet genomet med Cuffcompare och testa differentiella uttrycket med Cuffdiff med de kombinerade filer trombin avskrift som referens genomet för en analys och de kombinerade styrfiler avskrift som referens genomet för en andra analys. Använd Microsoft Excel för att visualisera resultatet i tabellform. Återigen, those gentranskript med FPKM <0,05 och p> 0,05 filtreras ut. Efter detta steg kan utredarna välja att ladda upp en lista över nyanmälda avskrifter till UCSC Genome Browser webbplats ( http://genome.ucsc.edu/ ) för att verifiera deras giltighet genom en manuell inspektion.
- Överlämna förteckningar över differentiellt uttryckta gener till Uppfinningsrikedom Pathway Analysis (IPA, www.ingenuity.com ) för karakterisering av generna och vägar som påverkas av trombin behandling. I detta steg kan utredarna välja att använda bältet ( http://compbio.mit.edu/cummeRbund/ ), en R paket som är utformat för att hjälpa och förenkla uppgiften att analysera Manschettknappar RNA-seq utgång, för att hantera, visualisera och integrera alla data som produceras av en Cuffdiff analys.
4. Validering av RNA-seq Resultat från kvantitativ realtids--Polymerase Chain Reaction (QRT-PCR)
- Utför totalt RNA isolering från kontroll och trombin-behandlade HMVEC-Lbl celler, RNA-utvärdering och RNA-kvantifiering beskrivs i steg från 1,4 till 1,6.
- Generera kompletterande DNA från 1 ng totalt RNA för varje prov med Superscript III Första strängsyntes System RT Kit, efter tillverkarens instruktioner (Invitrogen, 18.080-051).
- Utför QRT-PCR-analys på en Applied Biosystems VIIa 7 Real-Time PCR System med TaqMan-analysen-on-Demand utformade oligonukleotider för detektion av CUGBP, Elav-likefamilymember1 (CELF1, Hs00198069_m1), Fanconianemia, complementationgroupD2 (FANDCD2, Hs00276992_m1), TNFreceptor -associerad faktor 1 (TRAF1, Hs01090170_m1), och β-aktin (ACTB, Hs99999903_m1). Varje prov hade en mall motsvarande 5 ng av totalt RNA. Mät kvantifiering med DDCt metoden och normalisera till β-aktin. Varje analys utfördes över åtminstone tre biologiska replikat.
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
För Steg 1: 28S: 18s förhållande traditionellt används som en indikator på RNA-nedbrytning. Helst ska 28S toppen har ungefär dubbelt området av 18s bandet (ett förhållande av 2), är emellertid denna ideala förhållandet ofta inte ses i praktiken. Vidare, 28s: kan 18s förhållanden erhållna från spektrofotometriska metoder underskattar mängden nedbrytning av RNA. För att mer exakt kvantifiera nedbrytningen, och därför kvaliteten på RNA-provet, beräknar Experion systemet en RNA-kvalitetsindikator (RQI) nummer. Den RQI algoritmen jämför elektroferogram av RNA-prover till data från en serie av standardiserade, nedbrutna RNA-prover och automatiskt returnerar ett tal mellan 10 (intakt RNA) och 1 (skadad RNA). RNA kvalitet bör ha en RQI av minst 7, helst högre än 8. Figur 2 visar Experion resultat med en hög kvalitet RNA-prov med en RQI av 8,4.
FörSteg 2: Biblioteken bör ha ett brett band vid ca 250-300 bp Figur 3 visar Experion resultat av en hög kvalitet bibliotek Figur 4 visar qPCR resultaten av standardkurva prover och ett okänt prov (visas i mörkblått)... Framsteg och kvalitet sekvensering körningen bör kontinuerligt observeras under hela körningen Figur 5 visar lämplig kluster densitet under den första cykeln avbildning steg,. Detta är den första indikationen på körningen kvalitet. Kluster bör vara ljusa och fokuserad. Figur 6 visar First Base rapporten genereras efter den första cykeln är klar. Det är viktigt att utvärdera den beräknade kluster densitet, intensitetsnivåer och fokus kvalitet på denna punkt. Nästa kvalitet kontrollpunkt efter cykel 4, visas i figur 7. Detta visar den absoluta klustret densitet för varje bana. Klustret densitet bör inte vara över 850 k / mm 2. Efter cykel 13,fasa (när en bas inte tillsätts under en cykel) och prephasing (när två baser tillsättas under en cykel) statistik beräknas, såsom visas i fig. 8. Typiska siffror är mellan 0,1 och 0,25. Den stora kvalitetsbedömning är möjlig efter cykel 24, när flera kvalitetsmått beräknas. Den procent av läser över Q30, som visas i figur 9, är ett mått på förtroendet för basen ringer. En läsning med en Q poäng på 30 innebär att det finns en 1 i 1.000 chans att bas samtal är fel. Q poäng kommer att minska när körningen fortskrider, men bör börja med mer än 95% av den läser uppfylla eller överträffa Q30. Kluster som passerar filtret (PF), som visas i figur 10, är de kluster som de faktiska sekvensdata kommer att vidtas. Helst bör det vara över 85%. Klustret PF baseras på många faktorer, bland annat utfasning, prephasing, intensitet och Q30. Det kommer inte att förändras i takt med körningen fortskrider. Den procentuella linje ( För Steg 3: Tabell 1 visar uttryckta gener och isoformer i både kontroll-och trombin-behandlade humana pulmonära mikrovaskulära endotelceller. Särskilt finns det cirka 26.000 nya upptäckta isoformer, vilket illustrerar styrkan i RNA-seq-det kan identifiera okända RNA, alternativt splitsade utskrifter och alternativa promotor användning som inte är detekterbar med microarray teknik 3. RNA-seq kan också mäta mindre rikliga avskrifter som felaktigt har kvantifierade eller inte upptäckts av mikroarrayer. Figur 12 och Tabell 2 visas differentially uttryckte gener i trombin-signaleringsvägen. Detta är ett exempel på den tredje generationens kunskapsbas driven vägen analys 9: pathway topologi strategier, med Uppfinningsrikedom programvara Pathway Analysis. Det visar att en sex timmar trombin behandling signifikant upp-reglerar trombinreceptom Par 4 och nedreglerar trombinreceptom Par 3 medan det inte finns någon förändring i uttrycket av trombinreceptom Par 1. Uttryck av NFkB1, NF KB2 och Src är också avsevärt uppregleras. Några av Rho family gener (Rho B, C, F och G) är uppregleras medan andra (Rho J, Q, T1, U och V) är nedreglerade (tabell 4). Myosin lätt kedja-gen 9 (MYL9) uppregleras medan MYL12B är nedregleras. Expression av andra gener är antingen ned-reglerad eller ej påverkas. För Steg 4: För att validera RNA-seq resultat med en alternativ metod, genomförde vi en QRT-PCR experiment för att analysera tre diffehyra gener (figur 13). I RNA-seq data var TRAF1 uppregleras av 7,96 faldigt; CELF1 var nedregleras av 1,16-faldigt, och FANCD2 var nedregleras av 1,70 gånger. I QRT-PCR-data, dessa motsvarande tal är 7,25 gånger, -1,15 gånger och -2,07 faldigt. Resultaten av dessa tre gener analyserades genom RNA-artiklar och QRT-PCR är i god överensstämmelse, vilket bekräftar de RNA-seq resultat. Tabell 1. Gene / Isoform Expression Sammanfattning *. Tabellen listar gener, kända isoformer och isoformer nya uttryck i kontroll-och trombin-behandlade HMVEC-Lbl celler. Den faldig förändring är förhållandet mellan trombin FragmentsPerKilobase av fragment avskrift perMillion mappas (FPKM) för att kontrollera FPKM. Dessa gener, kända isoformer och nya isoformer med 2-faldig eller större skillnad mellan två grupper har statistiskt olika expressionsnivåer (bestämt efter Benjamini-Hochberg korrigering). * Denna tabell återges från tabell 2 i referens 4. Tabell 2. Differentiellt uttryckta gener och isoformer i trombin signalvägen *. *, Denna tabell återges i tabell S4 i referens 4 med en mindre modifiering. **, Q-värde, en falsk upptäckt justerad p-värde. 93/4393fig1.jpg "alt =" Bild 1 "/> Gener Kontroll Trombin Totala gener som uttrycks 16.636 16.357 Kontroll bara 783 Trombin Endast 504 Uppreglerad (2-faldig eller större skillnad) 152 Nedregleras (2-faldigt eller greater skillnad) 2.190 Kända Isoformer Kontroll Trombin Totalt kända isoformer Uttryckt 26.807 26.300 Kontroll bara 1.492 Trombin Endast 985 Uppreglerad (2-faldig eller större skillnad) 480 Nedregleras (2-faldig eller större skillnad) 3.574 Nya Isoformer Kontroll Trombin Totalt Nya Isoformer uttryckt 25.880 25.886 Kontroll bara 418 Trombin Endast 424 Uppreglerad (2-faldig eller större skillnad) 1.775 Nedregleras (2-faldig eller större skillnad) 12.202 Ned-reglerade gener Gene Symbol Övergripande faldig förändring Medlemmar Individuell faldig förändring q_value ** FPKM Kontroll FPKM Trombin PLC -2,49 PLCB1 -2,97 0 6,75585 2,27611 PLCB2 -1,32 0.00183634 1,80892 1,36957 PLCB4 -10,04 6.28386E-14 0.682668 0,0679.837 PLCL1 -2,53 5.26728E-09 0.602879 0.238017 Gaq -1,87 GNAQ -1,87 0 24,0907 12,8996 Gai -1,56 GNAI1 -1,86 0 9,88417 5,31795 GNAI3 -1,49 0 35,7592 24,0198 PKC -2,15 PRKCE -1,65 0 9,36364 5,67305 PRKCI -2,14 0 6,63566 3,09818 PRKD3 -2,61 0 16,0215 6,12878 IP3R -2,60 ITPR1 -1,39 0,000018734 1,51592 1,09009 ITPR2 -3,19 0 7,23283 2,26944 CREB -2,36 CREB1 -2,36 0 5,19117 2,2004 GATA -2,33 GATA3 -2,33 0.0228108 0.716773 0.307131 TBP -1,35 TBP -1,35 2.66E-05 8,48689 6,30476 G-protein-alfa -1,64 GNA14 -1,49 0,000122496 2,78076 1,86573 GNAI1 -1,86 0 9,88417 5,31795 GNAI3 -1,49 0 35,7592 24,0198 GNAQ -1,87 0 24,0907 12,8996 PAR3 -1,87 F2RL2 -1,87 1.02474E-06 1,51286 0.810286 SOS1 SOS1 -2,27 0 8,94353 3,94679 Ras -1,69 KRAS -2,03 0 11,2766 5,5659 NRAS -1,61 0 38,0874 23,6491 AKT -1,77 AKT3 -1,77 0 15,8228 8,94223 MLCP -2,38 PPP1CB -2,10 0 39,585 18,8199 PPP1R12A -3,56 0 15,2274 4,27516 PPP1R12B -2,66 5.28466E-13 1,92123 0.722188 FAK -1,31 PTK2 -1,31 4.3856E-10 39,7935 30,3044 p70 S6K RPS6KB1 -1,99 0 8,46312 VAGGA -3,68 ROCK1 -3,54 0 19,5921 5,53112 ROCK2 -3,86 0 16,0054 4,14759 CAMK -1,17 CAMK1 1,30 0,000255587 7,90794 10,296 CAMK2D -1,74 2.22911E-12 11,4497 6,56804 CAMK4 -2,58 0,000619045 0,62714 0.243277 Upp-reglerade gener Symbol Övergripande faldig förändring Medlemmar Individuell faldig förändring q_value ** FPKM Kontroll FPKM Trombin PAR4 1,59 F2RL3 1,59 9.19043E-13 4,99867 7,9253 Src 1,47 Src 1,47 0 14,1085 20,675 NF-kB 1,65 NFKB1 1,66 0 19,5113 32,3457 NFKB2 2,02 0 28,7563 58,1293 RELA 1,45 0 55,3482 80,28 Partiella Up-/Partial nedregleras gener Symbol Övergripande faldig förändring Medlemmar Individuell faldig förändring q_value ** FPKM Kontroll FPKM Trombin G-protein-gamMA 1,22 GNG10 -1,34 2.17216E-08 27,192 20,2206 GNG11 1,31 5.66209E-05 770,922 1011,05 GNG12 -1,44 5.11591E-13 112,397 78,3023 GNG2 2,43 6.38453E-09 0.465705 1,13132 G-protein-beta 1,27 GNB2 1,36 1.91268E-10 137,786 187,43 GNB3 -2,69 4.71259E-11 2,58703 0.962504 GNB4 -1,61 0 15,8275 9,85484 Rho GEF -1,16 ARHGEF12 -1,67 0 30,6424 18,3015 ARHGEF2 1,33 5.80478E-08 27,6288 36,758 ARHGEF3 -1,48 0 20,3279 13,7813 ARHGEF6 -2,08 0 2,67944 1,28635 ARHGEF9 -1,54 0.00469498 1,56367 1,0159 PI3K -1,80 Bankomat -6,84 0 4,98972 0.729483 PIK3C2A -5,09 0 17,7894 3,49234 PIK3C3 -1,49 4.66294E-15 12,6504 8,50852 PIK3CA -3,14 0 16,8398 5,36228 PIK3CB -1,36 8.4357E-09 9,68516 7,12129 PIK3CD 1,86 0 5,6579 10,5507 PIK3CG -1,76 2.32945E-10 1,86962 1,06419 PIK3R1 -1,79 0 5,48118 3,06256 PIK3R3 -1,59 1.50915E-05 5,24549 3,30763 PIK3R4 -1,40 7.18425E-12 8,34176 5,97942 Rho 1,19 RHOB 1,31 9.48429E-06 232,232 304,587 RHOC 1,38 458,267 630,235 RHOF 1,65 0 8,29676 13,7268 RHOG 1,40 1.02141E-14 58,6003 82,0172 RHOJ -1,57 0 127,446 80,9317 RHOQ -1,52 0 16,4802 10,8122 RHOT1 -1,96 3.00071E-12 8,48834 4,33755 RHOU -1,54 0.00184367 0.900141 0.586092 RHOV -3,32 0.0056467 1 0.413912 0.124591 RND3 -1,95 0 58,0564 29,7075 MLC -1,06 MYL12B -1,43 4.87832E-11 872,075 608,472 MYL9 1,48 0 202,636 299,559
Figur 1. Flödesschema av protokollet för RNA-seq profilering av trombin-medierad transkriptom i mänskliga lung mikrovaskulära endotelceller. Först behandla celler och isolera och kvantifiera RNA. Förbered bibliotek från de högkvalitativa RNA och bedöma deras koncentration (via qPCR) och kvalitet (via en bioanalyzer), sedan kluster på en flödescell. Starta sekvensering kör och analysera kvaliteten på körningen hela. De stora kvalitet kontrollpunkter är cyklerna 1, 4, 13 och 24. Med hjälp av CASAVA, konvertera bcl filer till fastq filer och sedan rikta dem till genomet med TopHat. Identifiera kända och okända isoformer med Manschettknappar och bestämma differentiellt uttryck med CuffDiff. Visa utdatafiler i Excel och filtrera bort gener som har ett uttryck nivå mindre än 0,05 FPKM eller ett p-värde större än 0,05. Skicka resterande gener till Uppfinningsrikedom Pathway Analys för ytterligare information om genfunktioner och vägar enffected av trombin behandling. Vanligtvis utvalda uppsättningen differentiellt uttryckta gener valideras av en alternativ metod som QRT-PCR.
Figur 2. Ett representativt RNA-prov med en RQI av 8,4 såsom analyseras av Experion Automatiserad Electrophoresis station A) individuella spår av hög kvalitet RNA -.. X-axeln visar tid och y-axeln visar fluorescenssignal B) Den virtuella bilden gelén av hög kvalitet RNA-prov. Intensiteten i 28S toppen är större än 18S topp och att ingen kontaminering ses. Båda banden är skarpa och definierade. Klicka här för att se större bild .
Figur 3. Hög kvalitet bibliotek framställt från RNA analyseras genom Experion Automatiserad Electrophoresis Station En bred topp mellan 250 och 300 bp detekteras och ingen DNA med hög molekylvikt (kontaminerande DNA) observeras) En Den individuella spår av en hög kvalitet bibliotek.. - x-axeln visar tid och y-axeln visar fluorescenssignal B) Den virtuella gelén bilden av hög kvalitet bibliotek. En bred topp mellan 250 och 300 bp upptäcks och ingen hög molekylvikt DNA (kontaminerande DNA) observeras. Klicka här för att se större bild .
<strong> Figur 4. qPCR resultat med SyberGreen och primrar specifika för Illumina ligerade adaptrar. En tidigare samlade biblioteket används som standardkurva för att bestämma den optimala koncentrationen klustring för den nyligen beredda biblioteket. Utspädningen av den okända biblioteket omfattas standardkurvan koncentrationerna. Standardkurvan Proverna åtalats av pilarna och det okända provet är mörkblå och även indikeras med en pil.
Figur 5. . Lämplig kluster densitet under den första cykeln imaging steget Grupperna är tydliga, fokuserad och ljus A) Bas A,. B) Bas C, C) Bas G, D) Bas T.
Metric | Bana 1 | Bana 3 | Bana 4 | Bana 5 | Bana 6 | Bana 7 | Spår 8 | |
Kluster Densitet (k / mm 2) | 420,94 | 412,95 | 410,81 | 408,54 | 416,71 | 416,56 | 410,02 | 411,84 |
En Intensitet | 25870,5 | 23.886 | 23891,38 | 23735,83 | 23949,38 | 24933,08 | 24305,79 | 23950,29 |
C Intensitet | 21559,62 | 19822,33 | 19759,33 | 19.472 | 19954,21 | 20611,75 | <td> 19.89219438,29 | |
G Intensitet | 13619,46 | 11756,67 | 11486,44 | 10498,38 | 12186,62 | 12195,5 | 11826,88 | 11010,5 |
T Intensitet | 19402,67 | 17663,79 | 17854,42 | 17353,75 | 17545,54 | 18060,67 | 18457,92 | 17397,12 |
En fokusmåttet | 68,2 | 67,46 | 67,67 | 67,75 | 67,41 | 67,43 | 67,63 | 67,05 |
C fokusmått | 67,93 | 67,33 | 67,56 | 67,66 | 67,33 | 67,39 | 67,46 | 66,9 |
G fokusmått | 65,4 | 64,14 | 63,98 | 63,92 | 63,29 | 63,41 | 63,47 | 63,74 |
T fokusmått | 66,45 | 65,57 | 65,5 | 65,49 | 65,03 | 65,23 | 65,57 | 65,59 |
Figur 6. Första Base rapporten genereras efter den första cykeln är klar. Klustret densitet (även underskattas i detta skede) är lämplig. Intensiteterna ser bra (10,000-26,000, med G har den lägsta intensitet). De fokusmått är också lämpligt, faller omkring 65-70, även om högre värden är också lämpligt.
g7.jpg "alt =" Bild 7 "/>
Figur 7. Klustret densitet beräknad efter cykel 4 Klustret densitet är lägre än 850 K / mm 2 och även i alla spår A) tabellform,... B) diagramform Klicka här för att se större bild .
Figur 8. Utfasning (inte tillsätta en bas under en cykel) och Pre-fasa (lägga två baser under en cykel). Båda värdena på 0,25 eller lägre, vilket indikerar lämpliga fasa / före fasa nivåer. A) fasa och före avveckling numeriska värden . B) att fasa värden i grafisk form. C) före fasa värden i grafisk form. Clic k här för att visa större bild.
Figur 9. De olika representationer av Q30 poäng efter cykel 24. En poäng på 30 eller högre indikerar en 1 i 1.000 chans att bas samtal är fel. Omkring 90% av Q poäng är över 30 A) tabellform (Q30 poäng här är från hela körningen genom cykel 24),. B) Q30 poäng genom cykel. Varje stapel representerar fördelningen av läser faller på Q30 eller högre för just cykel. C) Q30 poäng distributioner genom cykel 24. Fördelningen av Q poäng på kumulativ basis genom cykel 24. Q poäng är på x-axeln och miljontals läsningar är på y-axeln. Läser med Q30 över 30 representeras i grönt.oad/4393/4393fig9large.jpg "target =" _blank "> Klicka här för att se större bild.
Figur 10. De olika representationer av kluster passerar filtret. Kluster passerar filtret baseras på flera parametrar, bland annat Q30, intensitet och gradvis / pre-utfasning. Minst 85% av kluster passerar filtret i varje bana A) tabellform,. B) grafisk form, blå rutor representerar det totala antalet kluster, gröna rutor representerar kluster passerar filter. Klicka här för att se större bild .
Figur 11. . Den procent av de kluster anpassas till PhiX genomet Cirka 0,5% av kluster anpassa till PhiX genomet, lämplig för den mängd PhiX spetsades proverna A) tabellform,.. B) diagramform Klicka här för att se större bild .
Figur 12. Gener differentiellt uttryckta genom trombin behandling av HMVEC-Lbl i Trombin signaleringsvägen. Trombin signalväg konstruerades genom uppfinningsrikedom. I vägen anger röd färg upp-reglerade gener (3 1,3 gånger) och gröna ned-reglerade gener (
Figur 13. QRT-PCR validering av tre differentiellt uttryckta gener från trombin-behandlade HMVEC-LBL-RNA-seq data. QRT-PCR utfördes enligt beskrivningen i protokollet. Vik förändringar bestäms av de relativa Ct-värdena för TaqMan Gene Expression analys för CUGBP, Elav-liknande familjemedlem 1 (CELF1), Fanconis anemi, komplementering grupp D2 (FANCD2) och TNF receptor-associerat faktor 1 (TRAF1)jämfördes med de som detekteras av RNA-seq. Replikat (n = 4) i varje prov kördes och Ct-värdena beräknas. Samtliga Ct-värdena normaliserades till β-aktin. Felet staplarna visar spännvidden av vecket förändring bestäms av data Assist programvara. p <0,05 ansågs statistiskt signifikant i relativa faldiga förändringar mellan trombin-treat-och kontrollgrupp av både RNA-artiklar samt QRT-PCR-analyser. MRNA-nivån i kontrollgrupper av varje analys godtyckligt satt som en, som inte visas. *, P <0,05; **, p <0,01. Denna siffra reproduceras från figur 6 i referens 4.
Subscription Required. Please recommend JoVE to your librarian.
Discussion
Viktiga steg
RNA Hantering: RNaser försämras även de mest högkvalitativa RNA, därför måste man vara försiktig under isoleringen, lagring och användning av RNA 10. Handskar är alltid användas för att undvika kontaminering av RNaser finns på mänskliga händer. Handskar ska bytas ofta, särskilt efter att röra hud, dörrhandtag och andra gemensamma ytor. En uppsättning pipetter bör ägnas enbart till RNA arbete och alla tips och rör bör RNas-fri. RNA-isolering och nedströms ansökan skall utföras i lågtrafikerade områden som rutinmässigt saneras med en produkt som RNas-Zap. Nedbrytning kan också ske med upprepade frysnings-upptiningscykler. Dessa kan minimeras genom alikvotering RNA för nedströmstillämpningar omedelbart efter isolering. Alternativt kan cDNA göras för efterföljande program som QRT-PCR direkt efter isolering. RNA ska förvaras vid -80 ° C och hölls på is under användning. Det är också important att grundligt tina och vortexblanda RNA-prov före och under användning.
Utgångspunkten kvalitet RNA är avgörande för framgången av detta protokoll. Användning av skadade eller på annat sätt låg kvalitet RNA kan orsaka biblioteket förberedelse misslyckas eller leda till låg avkastning som kommer att vara otillräckliga för sekvensering. Även om tillräckligt bibliotek kan göras från nedbrutna eller låg kvalitet RNA, kommer det inte korrekt representera transkripten närvarande i provet, vilket resulterar i felaktiga kvantifiering av uttryck. Dessutom kan alla unremoved genomisk DNA under RNA-isolering orsaka en överskattning av mängden RNA som används i protokollet, men om ett belopp (t.ex. 1-2 g) i mitten av det föreslagna området (0,1-4 g) används, kommer den faktiska mängden RNA vara tillräckligt för protokollet. Dessutom är varje genomiskt DNA inte troligt att plockas upp av oligo (DT) primer baserat bibliotek konstruktion i standard Illumina protokollet och därför inte kommer att orsaka efterföljande ISSderingar med uttryckta nivåer mRNA-transkript. Kvantifiering av utgångs-RNA med vanliga spektrofotometriska avläsningar bör vara tillräckligt och det finns inget behov av att använda mycket noggranna kvantitativa metoder såsom RiboGreen eftersom biblioteken kommer noggrant kvantifieras efter beredning av qPCR och Gene nivåer uttryck normaliseras i förhållande till det totala antalet läser under dataanalysen steg.
Bibliotek Kvantifiering. Noggrann kvantifiering av bibliotek är avgörande för rätt generationen kluster. Endast DNA-molekyler med framgång ligerade adaptrar kommer att bilda kluster. Spektrofotometriska avläsningar kommer inte att skilja mellan DNA med adaptrar och DNA utan, vilket kommer att resultera i en överskattning av koncentrationen av biblioteket och i slutändan leda till under-gruppering av flödescellen. Mängden DNA utan ligerade adaptrar skiljer sig från biblioteket till biblioteket, även om samma RNA användes som startning material, så kan man inte exakt anta att en vanlig del av den spektrofotometriska behandlingen är DNA med ligerade adaptrar. Utföra qPCR med primrar specifika för adaptrarna kommer att detektera endast de DNA-molekyler med adaptrar framgångsrikt ligerade till båda ändarna av molekylen. Detta möjliggör en absolut kvantifiering av biblioteken och i sin tur en korrekt kluster densitet. Bedömning av bibliotek med ett Experion instrument eller en bioanalyzer är också viktigt. Detta möjliggör en visualisering av storleksordningen av biblioteket, vilket är viktigt under stegen dataanalys och säkerställer att det inte finns någon förorening som kan störa kluster generation.
Dataanalys. På detta protokoll tillämpade vi TopHat att anpassa RNA-seq läser människors referens transkriptom och manschettknappar att montera avskrifter, uppskatta sina abundances och test för differentiellt uttryck i trombin-behandlade HMVEC-Lbl celler. TopHat och Manschettknappar är two populära verktyg, och de är gratis, öppen källkod 11. En nyligen genomförd studie visade att Manschettknappar hade en hög sensitivitet och specificitet för att upptäcka tidigare kommenterade introner 12. Däremot itu TopHat och Manschettknappar inte alla tillämpningar av RNA-seq inte heller de enda verktyg för RNA-seq-analys 11. TopHat och Manschettknappar kräver sekvenserade referens transkriptom eller genom. De är särskilt lämpliga för analys av RNA-seq data som genererats från antingen Illumina eller fast sekvensering maskiner men inte 454 eller den klassiska kapillära elektrofores sekvensering plattform. Användare som arbetar utan sekvenserade referens genomet kan överväga att utföra de novo transkriptom montering med en av flera verktyg som Trinity ( http://trinityrnaseq.sourceforge.net/ ), Trans-Abyss ( http://www.bcgsc.ca/platform/bioinfo/software/trans-abyss/releases/0.2) eller Oaser ( http://www.ebi.ac.uk/ ~ zerbino / oaser / ). Många alternativa Transkriptomanalys program finns nu. För en genomgång av olika program, kan läsarna vill läsa studien av Garber et al. 13 och översynen av Martin och Wang 14, som beskriver de komparativa fördelar och nackdelar och de teoretiska överväganden de flesta närvarande och vanliga program. Valet av Transkriptomanalys strategier (referens-baserade strategi de novo strategi och kombinerad strategi) och program beror på många faktorer, inklusive förekomsten eller fullständigheten av en referens genom, tillgången på sekvensering och datorresurser vilken typ av uppgifter som genereras och, viktigast av allt, det övergripande målet för sekvensering projektet 14.
En annan punkt bör göras: computer program för transkriptom analys kan inte ge en 100% noggrannhet av alla transkript rapportering. Sekvensering fel är en annan fråga. Det är alltid klokt att varje differentiellt uttryckta transkript identifieras med RNA-seq godkännas av realtids-PCR. TaqMan sond-baserad kemi anses vara den gyllene standarden för realtids-PCR. Dessutom bör nyligen identifierade avskrifter skall godkännas av Sånger-metoden för DNA-sekvensering innan ytterligare experiment.
Felsökning
Bibliotek Förberedelser: En utstryk av hög molekylvikt genomisk DNA efter bibliotekets framställningsstegen kan orsakas av en överföring från det slutliga pärlan reningssteget under bibliotekets beredningen. Återvänder biblioteken till den magnetiska monter i hela fem minuter kan lösa problemet. Om inte, kan frågan bero på ofullständig fragmentering av RNA under de första stegen av biblioteket beredningen. Detta kan inträffa om låg-kvalitet RNA används eller om protokollet inte följs exakt. Till exempel, ändra inkubationstiderna eller temperatur, tillsätta reagens i fel ordning eller pausa mellan fragmentering och syntesen av den första strängen av cDNA. Om återvänder biblioteken till den magnetiska monter inte bort den höga MW-DNA, är det lämpligt att upprepa biblioteket förberedelse med färska RNA-prover.
Låg intensitet: Om den första cykeln intensitet är lägre än förväntat, är det möjligt att primrarna inte hybridiserar till kluster ordentligt under det sista steget i kluster generation eller flödescellen lagrades för länge mellan kluster och början av sekvensering springa. I detta fall bör en primer återhybridisering utföras med hjälp av ett kit primer rehyb från Illumina. Oftast löser detta rehyb de intensitet frågor och körningen kan startas över utan problem. Om det efter en rehyb, intensiteterna är fortfarande låg, kan frågan varamed biblioteken eller sekvensen genom syntes (SBS) reagenser och Illumina teknisk service bör kontaktas för vidare felsökning. Om den första läs s intensiteter är bra, men intensiteterna är låga efter vändning kan en primer rehyb av den andra läsning primern vara nödvändig. Detta utförs på sekvensering instrumentet och Illumina teknisk service bör kontaktas för förfarandet.
Hög fasa / prephasing: Om högre än normalt utfasning eller prephasing observeras, är en möjlig orsak till förorening av andra SBS reagensen med klyvning buffert. Under SBS framställningsstegen, är det viktigt att hantera klyvning bufferten sist och byta handskar mellan hanteringen av klyvning bufferten och andra reagens. Om klyvning buffert förorening misstänks, bör en primer rehyb av flödescellen utföras och nya SBS reagenser bör utarbetas. Alternativt kan det finnas föroreningar i linje med den inst RUMENT. Om detta misstänks bör instrumentet genomgå en underhållstvätt (en vattenskrubber följt av en NaOH tvätt, följt av en slutlig vattentvätt) bör en primer rehyb utföras på flödescellen och nya SBS reagenser bör utarbetas. Om fasa / prephasing värden är måttligt hög (~ 0,5), kan körningen fortsättas tills Q30 poäng och kluster som passerar filtret beräknas. Dessa nivåer kan fortfarande vara i acceptabla gränser även med hög utfasning och / eller prephasing.
Generaliserbarhet av detta protokoll
Även om det är specifikt för Illumina HiScanSQ är detta protokoll tillämpas på något av de HiSeq familjen eller Genome Analyzer II Illumina instrument ( www.illumina.com ) med mindre modifieringar av stegen kluster generation och sekvensering reagenser. Andra nästa generations DNA-sekvensering plattformar som den fasta serien ("_blank"> Www.lifetechnologies.com), GS-system ( www.454.com är) samt några nya nyare system också används för att RNA-seq 11. Även om deras bibliotek konstruktion och sekvensering förfaranden kan skilja sig något, de RNA Hantering dataanalysen delar (nedströms CASAVA stegen) och validering av RT-PCR som presenteras i detta protokoll kan vara av referensvärdet till deras RNA-seq program .
Det bör också påpekas att detta protokoll är specifik för RNA-seq vid en tidpunkt av trombin-behandlade HMVEC-Lbl celler, men det kunde lätt anpassas till en multi-tidpunkten eller de undersökningar i andra celler, vävnader som behandlats med olika stimuli eller hämmare, eller jämförelser av transcriptomes i celler eller vävnader mellan ett hälsosamt tillstånd och ett sjukdomstillstånd.
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
Inga intressekonflikter deklareras.
Acknowledgments
Författarna vill tacka Dr Stephen Kingsmore och Pediatric Genome Medicine Center på Barnens Mercy sjukhus och kliniker för användningen av deras datorer kluster för våra dataanalys, Illumina s fältservice team (Elizabeth Boyer, Scott Cook och Mark Cook) och tekniska konsultteam för sina snabba svar och användbara förslag på driften av nästa generations DNA-sekvensering instrument, HiScanSQ och datakvalitet analys. Detta arbete stöddes delvis av National Institutes of Health Grant HL080042 (till SQY) och startfond och begåvning av barns Mercy sjukhus och kliniker, University of Missouri i Kansas City (till SQY).
Materials
Name | Company | Catalog Number | Comments |
Human Lung Microvascular Endothelial Cells | Lonza | CC-2815 | |
Lonza, Bullet Kit | Lonza | CC-3202 | Contains EGM-2, FBS, growth factors and antibiotics |
Thrombin | Sigma | T4393 | |
Ambion mirVana Kit | Life Technologies | AM 1560 | |
RNase-Zap | Life Technologies | AM9782 | |
Experion StdSens RNA | Bio-Rad | 700-7103 | |
TruSeq RNA Preparation Kit | Illumina | FC-122-1001 | |
AMPureXP Beads | Beckman Coulter | A63881 | |
Superscript Reverse Transcriptase II | Life Technologies | 18064-014 | |
Experion DNA 1K | Bio-Rad | 700-7107 | |
QuantiTect SyberGreen | Qiagen | 204163 | |
PE Cluster Generation Kit | Illumina | PE-401-3001 | |
PhiX Control Kit | Illumina | FC110-301 | |
200 Cycle SBS Kit | Illumina | FC-401-3001 | |
HiScanSQ* | Illumina | SY-103-2001 | |
cBot | Illumina | SY-301-2002 | |
qPCR machine - Viia7 | Life Technologies | Model #VIIA7 / Equipment #10631261 | Or equivalent |
Experion System | Bio Rad | 7007001 | Bioanalyzer is an alternative system |
Spectrophotometer | Bio-Tek | Epoch Microplate Spectrophotometer | Or equivalent |
Centrifuge - Sorvall Legend XTR | Thermo Scientific | 75004521 | Or equivalent |
Magnetic stand | Life Technologies | AM10027 | |
96-well thermocycler | General Lab Supplier | ||
Table 3. List of Key Reagents and Major Equipment. *, In the video, HiSeq1000 instead of HiScanSQ was demonstrated. |
References
- Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet. 10, 57-63 (2009).
- Shendure, J., Ji, H.
Next-generation DNA sequencing. Nat. Biotechnol. 26, 1135-1145 (2008). - Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome Res. 18, 1509-1517 (2008).
- Zhang, L. Q., et al. RNA-seq Reveals Novel Transcriptome of Genes and Their Isoforms in Human Pulmonary Microvascular Endothelial Cells Treated with Thrombin. PLoS One. 7, e31229 (2012).
- Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
- Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10, R25 (2009).
- Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25, 2078-2079 (2009).
- Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat. Biotechnol. 28, 511-515 (2010).
- Khatri, P., Sirota, M., Butte, A. J. Ten years of pathway analysis: current approaches and outstanding challenges. PLoS Comput. Biol. 8, e1002375 (2012).
- Nielsen, H.
Working with RNA. Methods. Mol. Biol. 703, 15-28 (2011). - Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat. Protoc. 7, 562-578 (2012).
- Robertson, G., et al. De novo assembly and analysis of RNA-seq data. Nat. Methods. 7, 909-912 (2010).
- Garber, M., Grabherr, M. G., Guttman, M., Trapnell, C. Computational methods for transcriptome annotation and quantification using RNA-seq. Nat. Methods. 8, 469-477 (2011).
- Martin, J. A., Wang, Z.
Next-generation transcriptome assembly. Nat. Rev. Genet. 12, 671-682 (2011).