Summary
Denne protokol udgør en komplet og detaljeret procedure at anvende RNA-seq, en kraftfuld næste generations DNA-sekventering teknologi, til at profilere transcriptomes i humane pulmonale mikrovaskulære endotelceller med eller uden thrombin behandling. Denne protokol er generalisere til forskellige celler eller væv ramt af forskellige reagenser eller sygdomstilstande.
Abstract
Karakteriseringen af genekspression i celler via måling af mRNA-niveauer er et nyttigt redskab til at bestemme, hvordan den transkriptionelle maskineri af cellen påvirkes af eksterne signaler (f.eks narkotikabehandling), eller hvordan celler variere mellem en sund tilstand og en syg tilstand. Med fremkomsten og kontinuerlig finjustering af næste generation af DNA-sekventering teknologi, har RNA-sekventering (RNA-seq) blevet en stadig mere populær metode til transkriptomet analyse katalogisere alle arter af transkripter, til bestemmelse af transkriptionel struktur af alle udtrykte gener og kvantificere de ændrede ekspressionsniveauer af det samlede sæt af transkripter i en given celle, væv eller organisme 1,2. RNA-seq erstatter gradvist DNA microarrays som en foretrukken fremgangsmåde til transkriptomet analyse, fordi det har fordelene ved profilering af en komplet transkriptom, tilvejebringelse af en digital type datum (kopiantallet af et transkript) og ikke afhængig af nogen kendt genomisk fortløbendece 3.
Her præsenterer vi en komplet og detaljeret protokol til at anvende RNA-seq til profil transcriptomes i humane pulmonale mikrovaskulære endotelceller med eller uden thrombin behandling. Denne protokol er baseret på vores seneste offentliggjorte undersøgelse med titlen "RNA-seq afslører Novel transkriptom af gener og deres isoformer i Human Pulmonal mikrovaskulære endotelceller behandlet med thrombin," 4, hvor vi med succes gennemført første komplette transkriptomet analyse af humane pulmonale mikrovaskulære endotelceller behandlet med thrombin ved hjælp af RNA-seq. Det gav hidtil usete ressourcer til yderligere eksperimenter at få indblik i molekylære mekanismer bag trombinmedieret endotel dysfunktion i patogenesen af inflammatoriske tilstande, kræft, diabetes og hjerte-kar-sygdom, og giver potentielle nye leads til terapeutiske mål til disse sygdomme.
Den beskrivende tekst til denne protokoler opdelt i fire dele. Den første del beskriver behandlingen af humane pulmonale mikrovaskulære endotelceller med thrombin og RNA isolation, kvalitet analyse og kvantificering. Den anden del beskriver bibliotek konstruktion og sekventering. Den tredje del beskriver dataanalyse. Den fjerde del beskriver en RT-PCR-validering assay. Repræsentative resultater af flere vigtige skridt vises. Nyttige tips eller forholdsregler for at øge succes i de vigtigste trin er tilvejebragt i Diskussion sektion. Skønt denne protokol anvender humane pulmonære mikrovaskulære endotelceller behandlet med thrombin, kan det være generaliseres til profil transcriptomes i både pattedyr-og ikke-pattedyr-celler og i væv, der er behandlet med forskellige stimuli eller inhibitorer eller til sammenligningen transcriptomes i celler eller væv mellem en sund tilstand og en sygdomstilstand.
Protocol
Et rutediagram der beskriver denne protokol er vist i figur 1..
1. Behandling af celler med thrombin, RNA Isolation, kvalitetsvurdering og Kvantificering af RNA
- Kultur humane lunge mikrovaskulære endotelceller (HMVEC-LBL) til 90-100% konfluens i plader med 6 brønde i EGM-2 medium med 5% FBS, vækstfaktorer og antibiotika (Lonza, cat # CC-3202).
- Skifte medie til udsultningsmedier (0% FBS) 30 min før behandling med thrombin.
- Behandle cellerne med 0,05 U / ml thrombin eller forlade ubehandlet som en kontrol i 6 timer ved 37 ° C og 5% CO2.
- Isolere total RNA fra de behandlede og kontrol-celler under anvendelse af Ambion mir Vana Kit ifølge producentens instruktioner.
- Vurdere kvaliteten af RNA med en Experion StdSense eukaryot RNA chip ifølge standarden protokol om Experion Automated Electrophoresis Station (= "_blank"> Www.bio-rad.com).
- Kvantificere RNA ved hjælp af en standard spektrofotometrisk metode.
2. Bibliotek Byggeri og Sequencing
- Anvende 1 ug af høj kvalitet total RNA per prøve som udgangsmateriale.
- For at konstruere biblioteket, skal du følge den normale procedure fra Illumina (protokol # 15.008.136 Rev A). I denne protokol, der indeholder mRNA markeringer to runder af poly (A) er udført for at fjerne rRNA at minimere rRNA sekvensering.
- Vurdere kvaliteten af de biblioteker, ved hjælp af en Experion DNA 1K chip ifølge standarden protokol om Experion Automated Electrophoresis Station ( www.bio-rad.com ).
- Kvantificere biblioteket ved hjælp qPCR: Brug et bibliotek, der tidligere er blevet sekventeret som en standardkurve og primere specifikke for de ligerede adaptere. Anvender en række fortyndinger af de ukendte biblioteker (dvs. 1:100, 1:500 og 1:1000). Kør qPCR according til SyberGreen MM-protokollen og beregne den oprindelige bestand koncentration af hvert bibliotek.
- Fortynde Biblioteksbeholdninger til 10 nM og opbevares ved -20 ° C indtil klar til klynge en flow-celle.
- Når klar til at klynge en gennemstrømningscelle, optø CBOT reagens pladen i et vandbad. CBOT er et Illumina instrument, der anvendes til at strømline klynge generation proces.
- Vask CBOT instrument.
- Denaturere biblioteker: Kombiner 13 pi 1x TE og 6 pi 10 pM bibliotek og til siden af røret, tilsættes 1 ul 1 N NaOH (leveret af Illumina). Vortex, centrifuger, inkuber ved stuetemperatur i 5 minutter og placere de denaturerede biblioteker på is.
- Fortynd bibliotekerne: Fortynd de denaturerede biblioteker med præ-kølet hybridiseringsbuffer (HT1, leveret af Illumina) ved at kombinere 996 pi HT1 og 4 gl denatureret bibliotek til en slutkoncentration på 12 pM. Placer de denaturerede og fortyndede biblioteker på is.
- Invertere hver række af rør i CBOT plade,sikre, at alle reagenserne er optøet. Spin ned pladen, fjerne / punktere folie sæler og indlæse på CBOT.
- Alikvot 120 ul af de fortyndede, denatureret biblioteker til en stribe rør, mærket 1-8. Tilsæt 1,2 ul fortyndet, denatureret PhiX kontrol bibliotek (fra Illumina) i hvert rør som en pig-i kontrol. Vortex og spin ned rør og læg dem på CBOT i den rigtige retning (rør nr. 1 til højre).
- Læg et flow-celle og manifold på CBOT.
- Udfyld flow kontrollere og begynde clustering løb.
- Efter kørslen er færdig, tjek reagens levering på tværs af alle baner. Notér eventuelle afvigelser. Enten begynde sekventeringen udføres med det samme eller opbevares i flowcellen i det billede røret ved 4 ° C.
- Optø sekventerings-ved-syntese (SBS, Illumina) reagenser.
- Læg de reagenser til de relevante pletter på reagens bakkerne, og sørg for ikke at røre de andre reagenser efter berøring spaltningen mix.
- Ved anvendelse af en ikken-sekventering flowcelle (dvs. en, der blev sekventeret tidligere), prime reagensbeholderne linjer to gange.
- Rengør sekventering flowcellen med 70% EtOH og Kimwipes, efterfulgt af 70% EtOH og linse papir. Inspicere flowcellen for nogen striber. Re-rens det om nødvendigt.
- Indlæse flowcellen på sequencer og udføre en strøm kontrollere, at forseglingen mellem manifolderne og flowcellen er stram.
- Start sekventering run.
- Vurdere kvaliteten målinger (f.eks klynge tæthed, klynger passerer filter, Q30, intensitet), som de bliver tilgængelige under kørslen.
- Overvåg intensitet under hele kørslen.
- Efter 101 cykler er afsluttet, udfører turnaround kemi at færdiggøre den anden læses: optøs de parrede ende reagenser og det andet read Inkorporering Buffer (ICB, en komponent af SBS reagenser, Illumina) og indlæse reagenserne.
- Fortsæt sekventering løb, vurderer 2 nd læse intensitet, Q30 and andre kvalitets målinger som run skrider frem.
3. Dataanalyse
- Brug den nyeste version af CASAVA (Illumina, i øjeblikket 1.8.2) til at konvertere basen call-filer (. Bcl) filer til. Fastq filer, indstilling fastq-cluster-count til 0 for at sikre, at oprettelsen af et fælles fastq fil for hver prøve . Unzip de fastq filer til downstream analyse.
- Udfør parret ende tilpasning ved hjælp af de nyeste versioner af Tophat (1.4.1) 5, som justerer RNA-seq læser til pattedyr mellemstore genomer ved hjælp af ultra high-throughput short read Aligner (Bowtie, 0.12.7) 6 og SAMtools (0,1. 17) 7. SAMtools implementerer forskellige hjælpeprogrammer til efterbehandling alignments i SAM-format. Referencen menneskelig transkriptom kan downloades fra iGenomes ( www.illumina.com ). I køreklar Tophat, brugte vi alle standard parameterindstillinger, herunder biblioteket typen option som fr-unstranded (standard).
- OsING programmet CuffDiff, en del af manchetknapper (1.3.0) 8 softwarepakke, sammenligne de thrombin-behandlede celler til kontrol-celler til at frasortere de differentielt udtrykte gentranskripter i førstnævnte er baseret på den humane reference transkriptomet. Denne sammenligning finder den differentielle ekspression af kendte transkripter. Brug Microsoft Excel til at visualisere resultatet i tabelform. Ved at køre Manchetknapper program, brugte vi alle standardindstillinger parameterindstillinger. Disse gentranskripter med FPKM <0,05 og p> 0,05 bortfiltreres.
- For at opdage nye isoformer, køre Manchetknapper uden en henvisning transkriptom. Sammenlign prøven transkript filerne til reference genom ved hjælp Cuffcompare og teste forskellen udtryk med Cuffdiff ved hjælp af de kombinerede thrombin transkript filer som reference genomet for én analyse, og de kombinerede kontrol transkript filer som reference genom for en anden analyse. Brug Microsoft Excel til at visualisere resultatet i tabelform. Igen, Those gentranskripter med FPKM <0,05 og p> 0,05 bortfiltreres. Efter dette trin, kan efterforskerne vælge at uploade en liste af nyanmeldte udskrifter til den UCSC Genome Browser hjemmeside ( http://genome.ucsc.edu/ ) for at kontrollere deres gyldighed ved en manuel inspektion.
- Indgive lister af differentielt udtrykte gener til Ingenuity Pathway Analysis (IPA, www.ingenuity.com ) til karakterisering af generne og veje ramt af thrombin behandling. I dette trin kan efterforskerne vælge at bruge cummerbund ( http://compbio.mit.edu/cummeRbund/ ), en R-pakke, som er designet til at hjælpe og forenkle opgaven med at analysere Manchetknapper RNA-seq output, at hjælpe med at administrere, visualisere og integrere alle data produceret af en Cuffdiff analyse.
4. Validering af RNA-seq Results by kvantitativ real-time-Polymerase Chain Reaction (qRT-PCR)
- Udfør total RNA isoleret fra kontrol-og thrombin-behandlede HMVEC-LBL celler, RNA kvalitetsvurdering og RNA kvantificering beskrevet i trin fra 1,4 til 1,6.
- Generere komplementært DNA fra 1 ug totalt RNA fra hver prøve med Superscript III First-Strand Synthesis System RT Kits, efter producentens instruktioner (Invitrogen, 18080-051).
- Udfør QRT-PCR-analyse på en Applied Biosystems VIIa 7 Real-Time PCR System ved hjælp af TaqMan Assay-on-Demand designet oligonukleotider til påvisning af CUGBP, Elav-likefamilymember1 (CELF1, Hs00198069_m1), Fanconianemia, complementationgroupD2 (FANDCD2, Hs00276992_m1), TNFreceptor -associeret faktor 1 (TRAF1, Hs01090170_m1), og β-actin (ACTB, Hs99999903_m1). Hver prøve havde en skabelon svarende til 5 ng totalt RNA. Mål mængdebestemmelse ved hjælp af DDCt fremgangsmåde og omsætter til β-actin. Hvert assay blev udført på tværs af mindst tre biologiske replikater.
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
For Trin 1: The 28s: 18s forholdet er traditionelt brugt som en indikator for RNA-nedbrydning. Ideelt set bør 28s top er omtrent dobbelt det område, som 18s båndet (et forhold på 2), men denne ideelle forhold ofte ikke ses i praksis. Endvidere 28S: kan 18s forhold opnået ved spektrofotometriske metoder undervurderer mængden af nedbrydning af RNA'et. For mere nøjagtigt at kvantificere den nedbrydning, og derfor kvaliteten af RNA-prøve, at Experion systemet beregner en RNA kvalitetsindikator (RQI) nummer. Den RQI algoritmen sammenligner elektroferogram af RNA-prøver til data fra en række standardiserede, nedbrudte RNA-prøver og automatisk returnerer et tal mellem 10 (intakt RNA) og 1 (nedbrudt RNA). RNA kvalitet bør have en RQI på mindst 7, ideelt større end 8. Figur 2 viser Experion resultater under anvendelse af en høj kvalitet RNA-prøve med en RQI på 8,4.
ForTrin 2: Bibliotekerne bør have et bredt bånd ved ca 250 til 300 bp 3 viser Experion resultater af høj kvalitet bibliotek Figur 4 viser qPCR resultaterne af standardkurve prøver og en ukendt prøve (vist i mørkeblå)... De fremskridt og kvalitet sekventering run skal konstant observeres under hele kørslen Figur 5 viser passende klynge tæthed under den første cyklus imaging skridt;. Dette er den første indikation af run kvalitet. Klynger skal være lyst og fokuseret. Figur 6 viser den første base rapport genereret efter den første cyklus er færdig. Det er vigtigt at vurdere den anslåede klynge tæthed, intensitet niveauer, og fokus kvalitet på dette punkt. Den næste kvalitet checkpoint efter cyklus 4, er vist i figur 7. Det viser den absolutte klynge tæthed for hver bane. Klyngen tæthed bør ikke være over 850 k / mm 2. Efter cyklus 13,phasing (når en base er ikke tilføjet under en cyklus) og prephasing (når to baser tilsættes under en cyklus) statistik beregnes, som vist i figur 8. Typiske tal er mellem 0,1 og 0,25. Den største kvalitetsvurdering er muligt efter cyklus 24, når flere kvalitets målinger beregnes. Procentdelen af læser over Q30, vist i figur 9, er et mål for tillid til basen ringer. En læses med en Q-score på 30 betyder, at der er et 1 i 1000 chance for, at basen opkald er forkert. Q-score vil falde i takt med kørslen skrider frem, men bør starte ud med mere end 95% af det lyder møde eller over Q30. Klyngerne passerer filter (PF), vist i figur 10, er de klynger, hvorfra de faktiske sekvensdata vil blive truffet. Ideelt set bør denne være højere end 85%. Klyngen PF er baseret på mange faktorer, herunder indfasning, prephasing, intensitet og Q30. Det vil ikke ændre sig som tiden skrider frem. Den procentvise linie ( For Trin 3: Tabel 1 viser udtrykte gener og isoformer i både kontrol-og trombin-behandlede humane pulmonale mikrovaskulære endotelceller. Især er der omkring 26000 nye detekterede isoformer, hvilket illustrerer styrken af RNA-seq-den kan identificere ukendte RNA'er, alternativt splejsede transkripter og alternative promotor brug, som ikke detekteres ved microarray teknikker 3. RNA-seq kan også måle de mindre rigelige udskrifter, der er ukorrekt kvantificerede eller ej opdaget af microarrays. Figur 12 og Tabel 2 display differentially udtrykte gener i thrombin-signalvejen. Dette er et eksempel på den tredje generation videnbase-driven pathway analyse 9: pathway topologi tilgange, ved hjælp Ingenuity Pathway Analysis software. Det viser, at en seks timer thrombin signifikant opregulerer thrombin-receptoren Par 4 og nedregulerer thrombin-receptoren Par 3, mens der ikke er nogen ændring i ekspressionen af thrombin-receptoren Par 1. Ekspression af NFkB1, NF KB2 og Src er også markant opreguleret. Nogle af Rho familie gener (Rho B, C, F og G) er opreguleret mens andre (Rho J, Q, T1, U og V) er nedreguleret (tabel 4). Myosin let kæde-gen 9 (MYL9) opreguleres, mens MYL12B er nedreguleret. Ekspressionen af andre gener enten er nedreguleret eller ikke berøres. For Trin 4: For at validere RNA-ff resultater ved hjælp af en alternativ fremgangsmåde, udførte vi en qRT-PCR eksperiment til assay tre forskelligeleje-gener (figur 13). I RNA-seq data, var TRAF1 opreguleres ved 7,96 gange, CELF1 var nedreguleret af 1,16 gange, og FANCD2 blev nedreguleret af 1,70 gange. I qRT-PCR data, er disse tilsvarende tal 7,25 gange, -1,15 gange og -2,07 gange. Resultaterne af disse tre gener analyseret ved RNA-seq og qRT-PCR er i god overensstemmelse, hvilket bekræfter de RNA-ff resultater. Tabel 1. Gene / Isoform Expression Summary *. Denne tabel viser gener, kendte isoformer og nye isoformer udtrykt i kontrol og trombin-behandlede HMVEC-LBL celler. The fold-ændring er forholdet mellem thrombin FragmentsPerKilobase af transkript perMillion fragmenter kortlagt (FPKM) til at styre FPKM. De gener, kendte isoformer og nye isoformer med 2-fold eller større forskel mellem to grupper er statistisk forskellige ekspressionsniveauer (bestemt efter Benjamini-Hochberg korrektion). * Denne tabel er gengivet fra tabel 2 i reference 4. Tabel 2. Differentielt udtrykte gener og isoformer i Thrombin signalvejen *. *, Denne tabel er gengivet i Tabel S4 i Reference 4 med en mindre modifikation. **, Q-værdi, en falsk opdagelse justeres p-værdi. 93/4393fig1.jpg "alt =" Figur 1 "/> Gener Kontrol Thrombin Samlede gener, der udtrykkes 16.636 16.357 Kun styre 783 Thrombin Only 504 Opreguleret (2-fold eller større forskel) 152 Nedregulerede (2-fold eller greater forskel) 2.190 Kendte isoformer Kontrol Thrombin Samlede kendte isoformer Udtrykt 26.807 26.300 Kun styre 1.492 Thrombin Only 985 Opreguleret (2-fold eller større forskel) 480 Nedregulerede (2-fold eller større forskel) 3.574 Nye Isoformer Kontrol Thrombin Total Nye Isoformer Udtrykt 25.880 25.886 Kun styre 418 Thrombin Only 424 Opreguleret (2-fold eller større forskel) 1.775 Nedregulerede (2-fold eller større forskel) 12.202 Down-regulerede gener Gene Symbol Samlet Fold Change Medlemmer Individuel Fold Change q_value ** FPKM Kontrol FPKM Thrombin PLC -2,49 PLCB1 -2,97 0 6,75585 2,27611 PLCB2 -1,32 0.00183634 1,80892 1,36957 PLCB4 -10,04 6.28386E-14 0.682668 0,0679.837 PLCL1 -2,53 5.26728E-09 0.602879 0.238017 Gaq -1,87 GNAQ -1,87 0 24,0907 12,8996 Gai -1,56 GNAI1 -1,86 0 9,88417 5,31795 GNAI3 -1,49 0 35,7592 24,0198 PKC -2,15 PRKCE -1,65 0 9,36364 5,67305 PRKCI -2,14 0 6,63566 3,09818 PRKD3 -2,61 0 16,0215 6,12878 IP3R -2,60 ITPR1 -1,39 0,000018734 1,51592 1,09009 ITPR2 -3,19 0 7,23283 2,26944 CREB -2,36 CREB1 -2,36 0 5,19117 2,2004 GATA -2,33 GATA3 -2,33 0.0228108 0.716773 0.307131 TBP -1,35 TBP -1,35 2.66E-05 8,48689 6,30476 G-protein Alpha -1,64 GNA14 -1,49 0,000122496 2,78076 1,86573 GNAI1 -1,86 0 9,88417 5,31795 GNAI3 -1,49 0 35,7592 24,0198 GNAQ -1,87 0 24,0907 12,8996 PAR3 -1,87 F2RL2 -1,87 1.02474E-06 1,51286 0.810286 SOS1 SOS1 -2,27 0 8,94353 3,94679 Ras -1,69 KRAS -2,03 0 11,2766 5,5659 Nationale tilsynsmyndigheder -1,61 0 38,0874 23,6491 AKT -1,77 AKT3 -1,77 0 15,8228 8,94223 MLCP -2,38 PPP1CB -2,10 0 39,585 18,8199 PPP1R12A -3,56 0 15,2274 4,27516 PPP1R12B -2,66 5.28466E-13 1,92123 0.722188 FAK -1,31 PTK2 -1,31 4.3856E-10 39,7935 30,3044 P70 S6K RPS6KB1 -1,99 0 8,46312 ROCK -3,68 ROCK1 -3,54 0 19,5921 5,53112 ROCK2 -3,86 0 16,0054 4,14759 CAMK -1,17 CAMK1 1,30 0,000255587 7,90794 10,296 CAMK2D -1,74 2.22911E-12 11,4497 6,56804 CAMK4 -2,58 0,000619045 0,62714 0.243277 Op-regulerede gener Symbol Samlet Fold Change Medlemmer Individuel Fold Change q_value ** FPKM Kontrol FPKM Thrombin PAR4 1,59 F2RL3 1,59 9.19043E-13 4,99867 7,9253 Src 1,47 Src 1,47 0 14,1085 20,675 NF-kB 1,65 NFKB1 1,66 0 19,5113 32,3457 NFKB2 2,02 0 28,7563 58,1293 RELA 1,45 0 55,3482 80,28 Partielle Up-/Partial Down-regulerede gener Symbol Samlet Fold Change Medlemmer Individuel Fold Change q_value ** FPKM Kontrol FPKM Thrombin G-protein-GAMma 1,22 GNG10 -1,34 2.17216E-08 27,192 20,2206 GNG11 1,31 5.66209E-05 770,922 1011,05 GNG12 -1,44 5.11591E-13 112,397 78,3023 GNG2 2,43 6.38453E-09 0.465705 1,13132 G-protein-beta 1,27 GNB2 1,36 1.91268E-10 137,786 187,43 GNB3 -2,69 4.71259E-11 2,58703 0.962504 GNB4 -1,61 0 15,8275 9,85484 Rho GEF -1,16 ARHGEF12 -1,67 0 30,6424 18,3015 ARHGEF2 1,33 5.80478E-08 27,6288 36,758 ARHGEF3 -1,48 0 20,3279 13,7813 ARHGEF6 -2,08 0 2,67944 1,28635 ARHGEF9 -1,54 0.00469498 1,56367 1,0159 PI3K -1,80 Pengeautomat -6,84 0 4,98972 0.729483 PIK3C2A -5,09 0 17,7894 3,49234 PIK3C3 -1,49 4.66294E-15 12,6504 8,50852 PIK3CA -3,14 0 16,8398 5,36228 PIK3CB -1,36 8.4357E-09 9,68516 7,12129 PIK3CD 1,86 0 5,6579 10,5507 PIK3CG -1,76 2.32945E-10 1,86962 1,06419 PIK3R1 -1,79 0 5,48118 3,06256 PIK3R3 -1,59 1.50915E-05 5,24549 3,30763 PIK3R4 -1,40 7.18425E-12 8,34176 5,97942 Rho 1,19 RHOB 1,31 9.48429E-06 232,232 304,587 RHOC 1,38 458,267 630,235 RHOF 1,65 0 8,29676 13,7268 RHOG 1,40 1.02141E-14 58,6003 82,0172 RHOJ -1,57 0 127,446 80,9317 RHOQ -1,52 0 16,4802 10,8122 RHOT1 -1,96 3.00071E-12 8,48834 4,33755 RHOU -1,54 0.00184367 0.900141 0.586092 RHOV -3,32 0.0056467 1 0.413912 0.124591 RND3 -1,95 0 58,0564 29,7075 MLC -1,06 MYL12B -1,43 4.87832E-11 872,075 608,472 MYL9 1,48 0 202,636 299,559
Figur 1. Flowchart af protokollen for RNA-seq profilering af trombinmedieret transkriptom i humane pulmonale mikrovaskulære endotelceller. Først behandle celler og isolere og kvantificere RNA. Forbered biblioteker fra den høje kvalitet RNA og vurdere deres koncentration (via qPCR) og kvalitet (via en bioanalyzer), derefter klynge på en flow-celle. Start sekventeringen køre og analysere kvaliteten af kørslen igennem. De store kvalitet checkpoints er cyklusser 1, 4, 13 og 24. Brug CASAVA, konvertere BCL filer til fastq filer og derefter justere dem til genomet med tophat. Detect kendte og ukendte isoformer hjælp Manchetknapper og bestemme forskellen udtryk med CuffDiff. Se output filer i Excel og filtrere gener, der har et ekspressionsniveau mindre end 0,05 FPKM eller en p-værdi større end 0,05. Indsend de resterende gener til Ingenuity Pathway Analyse for yderligere oplysninger om de genfunktioner og stier enffected af thrombin behandling. Normalt udvalgt sæt af differentielt udtrykte gener er valideret af en alternativ tilgang som QRT-PCR.
Figur 2. En repræsentativ RNA-prøve med en RQI på 8,4 som analyseret af Experion Automated Electrophoresis Station A) Den individuelle spor af høj kvalitet RNA -.. X-aksen viser tiden, og y-aksen viser fluorescenssignalet B) Den virtuelle gel billede af høj kvalitet RNA-prøve. Intensiteten af 28S top er større end 18S top og ingen forurening ses. Begge bands er skarpe og afgrænsede. Klik her for at se større figur .
Figur 3. Højkvalitets bibliotek fremstillet ud fra RNA, som analyseret af Experion Automated Electrophoresis Station En bred top mellem 250 og 300 bp påvises og ingen DNA med høj molekylvægt (kontaminerende DNA) observeres A) Den individuelle spor af høj kvalitet bibliotek.. - x-aksen viser tiden, og y-aksen viser fluorescenssignalet B) Den virtuelle gel billede af høj kvalitet bibliotek. En bred top mellem 250 og 300 bp påvises og ingen DNA med høj molekylvægt (kontaminerende DNA) overholdes. Klik her for at se større figur .
<strong> Figur 4. qPCR resultater under anvendelse SyberGreen og primere specifikke for Illumina ligerede adaptere. En tidligere samlet bibliotek anvendes som standardkurve for at bestemme den optimale clustering koncentration for den nyligt forberedt bibliotek. Fortyndingen af den ukendte biblioteket falder inden standardkurven koncentrationer. Standardkurven prøver er sigtet med pilene, og den ukendte prøve er mørkeblå og også angivet med en pil.
Figur 5. . Passende klynge tæthed under den første cyklus imaging skridt Klyngerne er klar, fokuseret og lyse A) Base A,. B) Base C, C) Base G, D) Base T.
Metric | Bane 1 | Bane 3 | Bane 4 | Bane 5 | Bane 6 | Bane 7 | Bane 8 | |
Cluster Density (k / mm 2) | 420,94 | 412,95 | 410,81 | 408,54 | 416,71 | 416,56 | 410,02 | 411,84 |
En Intensitet | 25870,5 | 23.886 | 23891,38 | 23735,83 | 23949,38 | 24933,08 | 24305,79 | 23950,29 |
C Intensitet | 21559,62 | 19822,33 | 19759,33 | 19.472 | 19954,21 | 20611,75 | <td> 19.89219438,29 | |
G Intensitet | 13619,46 | 11756,67 | 11486,44 | 10498,38 | 12186,62 | 12195,5 | 11826,88 | 11010,5 |
T Intensitet | 19402,67 | 17663,79 | 17854,42 | 17353,75 | 17545,54 | 18060,67 | 18457,92 | 17397,12 |
En Focus Score | 68,2 | 67,46 | 67,67 | 67,75 | 67,41 | 67,43 | 67,63 | 67,05 |
C Focus Score | 67,93 | 67,33 | 67,56 | 67,66 | 67,33 | 67,39 | 67,46 | 66,9 |
G Focus Score | 65,4 | 64,14 | 63,98 | 63,92 | 63,29 | 63,41 | 63,47 | 63,74 |
T Focus Score | 66,45 | 65,57 | 65,5 | 65,49 | 65,03 | 65,23 | 65,57 | 65,59 |
Figur 6. Den første base rapport genereret efter den første cyklus er færdig. Klyngen tæthed (selvom undervurderet på nuværende tidspunkt), er passende. Styrkerne ser godt (10,000-26,000, med G har den laveste intensitet). De fokusværdier er også passende, falder omkring 65-70, selv om højere værdier er også passende.
g7.jpg "alt =" Figur 7 "/>
Figur 7. Klyngen massefylde, der beregnes efter cyklus 4 Klyngen massefylde er lavere end 850 k / mm 2 og endda på tværs af alle baner A) tabelform... B) Graph formular Klik her for at se større figur .
Figur 8. Indfasning (ikke at tilsætte en base under en cyklus) og Pre-udfasning (tilføje to baser i løbet af en cyklus). Begge værdier på 0,25 eller derunder, hvilket indikerer passende udfasning / pre-udfasning niveauer. A) den gradvise og præ-udfasning numeriske værdier . B) den gradvise værdier i grafisk form. C) Den præ-indfasning værdier i grafisk form. Clic K her for at se større figur.
Figur 9. De forskellige repræsentationer af Q30 scorer efter cyklus 24. En score på 30 eller højere indikerer en 1 ud af 1.000 chance for, at basen opkald er forkert. Omkring 90% af Q score er over 30 A) tabelform (Q30 scoringer her er fra hele den løb gennem cyklus 24). B) Q30 scoringer efter cyklus. Hver søjle repræsenterer fordelingen af læser falder på Q30 eller over for den pågældende cyklus. C) Q30 score distributioner ved cyklus 24. Fordelingen af Q scorer på akkumuleret basis gennem cyklus 24. Q score er på x-aksen og millioner af læsninger er på y-aksen. Læser med et Q30 over 30 er repræsenteret i grønt.oad/4393/4393fig9large.jpg "target =" _blank "> Klik her for at se større figur.
Figur 10. De forskellige repræsentationer af klynger passerer filter. Clusters passerer filter er baseret på flere parametre, herunder Q30, intensitet og udfasning / pre-udfasning. Mindst 85% af klyngerne passerer filter i hver bane A) tabelform. B) Graph form, blå kasser repræsenterer det samlede antal klynger, grønne kasser repræsenterer de klynger passerer filtrene. Klik her for at se større figur .
Figur 11.. . Den procent af klynger tilpasset til PhiX genomet Ca. 0,5% af klyngerne tilpasse sig til det PhiX genomet, passende for mængden af PhiX tilsat i prøverne A) tabelform.. B) Graph formular Klik her for at se større figur .
Figur 12. Gener differentielt udtrykt af thrombin behandling af HMVEC-LBL i Thrombin signalvej. Thrombin signalvejen blev konstrueret ved Ingenuity. I reaktionsvejen, indikerer rød farve op-regulerede gener (3 1,3 gange) og grønne down-regulerede gener (
Figur 13. qRT-PCR-validering af tre differentielt udtrykte gener fra thrombin-behandlede HMVEC-LBL RNA-ff data. qRT-PCR blev udført som beskrevet i protokollen. Fold ændringer bestemt ud fra de relative Ct-værdier på TaqMan Gene Expression assay for CUGBP, Elav-lignende familiemedlem 1 (CELF1), Fanconi anæmi, komplementering gruppe D2 (FANCD2) og TNF receptor-associeret faktor 1 (TRAF1)blev sammenlignet med dem, der detekteres af RNA-seq. Gentagelser (n = 4) af hver prøve blev kørt, og Ct-værdierne beregnes. Alle Ct-værdier blev normaliseret til β-actin. Fejlsøjlerne repræsenterer området af den fold-ændring som bestemt ved de data Assist software. p <0,05 blev betragtet som statistisk signifikant i relative fold ændringer mellem thrombin-behandling og kontrolgruppen af både RNA-seq og qRT-PCR-assays. MRNA-niveauet i kontrolgrupperne fra hvert assay blev arbitrært sat som en, der ikke er vist. *, P <0,05; **, p <0,01. Dette tal er gengivet fra figur 6 i reference 4.
Subscription Required. Please recommend JoVE to your librarian.
Discussion
Vigtige skridt
RNA Håndtering: RNaser vil forringe selv de mest høj kvalitet RNA, derfor skal man være omhyggelig under isoleringen, opbevaring og anvendelse af RNA 10. Handsker er altid slidt for at forhindre forurening af RNaser fundet på menneskehænder. Handsker skal udskiftes ofte, især efter at røre huden, dørhåndtag eller andre almindelige overflader. Et sæt af pipetter bør være dedikeret udelukkende til RNA arbejde og alle tips og rør skal være RNase-fri. RNA isolation og nedstrøms anvendelse skal udføres i mindre befærdede områder, der rutinemæssigt dekontamineres med et produkt som RNase-Zap. Nedbrydning kan også forekomme ved gentagne fryse-tø cykler. Disse kan minimeres ved udportionering RNA for downstream applikationer umiddelbart efter isolation. Alternativt kan cDNA være til nedstrøms anvendelse, såsom qRT-PCR umiddelbart efter isolering. RNA opbevares ved -80 ° C og holdt på is under brug. Det er også important til grundigt at tø og vortex RNA-prøver før og under brug.
Udgangspunktet Kvaliteten af RNA er afgørende for succes i denne protokol. Anvendelse af nedbrudte eller på anden vis lav kvalitet RNA kan forårsage biblioteket præparat til at fejle eller resultere i lavt udbytte, som vil være utilstrækkelig til sekventering. Selv om tilstrækkeligt bibliotek kan fremstilles af nedbrudte eller dårlig RNA, vil det ikke nøjagtigt repræsentere transkripter til stede i prøven, hvilket resulterer i unøjagtig kvantificering af ekspression. Også kan enhver ikke-fjernede genomisk DNA under RNA isolation forårsage en overvurdering af mængden af RNA, der anvendes i protokollen, men hvis et beløb (fx 1-2 ug) i midten af det foreslåede område (0,1-4 ug) anvendes, vil den faktiske mængde RNA være tilstrækkelig til protokollen. Desuden er enhver genomisk DNA sandsynligvis ikke blive opfanget af oligo (dT)-primer baseret bibliotekskonstruktion i standard Illumina protokollen og det vil således ikke forårsage downstream issdier med udtrykte mRNA transcript niveauer. Kvantificeringen af udgangsforbindelserne RNA under anvendelse regelmæssige spektrofotometriske aflæsninger bør være tilstrækkelig, og der er ingen behov for at anvende meget nøjagtige kvantitative metoder, såsom RiboGreen eftersom bibliotekerne vil blive nøjagtigt kvantificeret efter fremstilling af qPCR og genekspressionsniveauer er normaliseret i forhold til det samlede antal læser under dataanalyse trin.
Bibliotek Kvantificering. Præcis kvantificering af bibliotekerne er afgørende for den rette generation af klynger. Kun DNA-molekyler med held ligerede adaptere vil danne klynger. Spektrofotometriske aflæsninger vil ikke skelne mellem DNA med adaptere og DNA uden, som vil resultere i en overvurdering af koncentrationen af biblioteket og til sidst det medføre klynger af flowcellen. Mængden af DNA uden ligerede adaptere vil variere fra biblioteket til biblioteket, selv om de samme RNA blev anvendt som starterING materiale, så man kan ikke præcist antage, at en standard procentdel af den spektrofotometriske aflæsning er DNA med ligerede adaptere. Udførelse af qPCR med primere specifikke for adapterne vil detektere kun de DNA-molekyler med adaptere held ligeret til begge ender af molekylet. Dette giver en absolut kvantificering af bibliotekerne og til gengæld en nøjagtig klynge tæthed. Vurdering af biblioteker med en Experion instrument eller en bioanalyzer er også vigtig. Dette muliggør en visualisering af størrelsesområdet af biblioteket, hvilket er vigtigt under dataanalyse trin, og sikrer, at der ikke er nogen forurening, der kan forstyrre klynge generation.
Dataanalyse. I denne protokol, gælder vi Tophat at tilpasse RNA-seq læser til menneskelig henvisning transkriptom og Manchetknapper at samle udskrifter, vurdere deres overflod, og test for differentiel ekspression i thrombin-behandlede HMVEC-LBL celler. Tophat og Manchetknapper er two populære værktøjer, og de er gratis, open-source software 11. En nylig undersøgelse viste, at Manchetknapper havde en høj sensitivitet og specificitet til afsløring af tidligere kommenterede introns 12. Men Tophat og Manchetknapper ikke behandle alle anvendelser af RNA-seq de er heller ikke de eneste værktøjer til RNA-seq-analyse 11. Tophat og Manchetknapper kræver en sekventeret henvisning transkriptom eller genom. De er særlig egnede til analyse af RNA-ff data genereret fra enten Illumina eller faste sekventering maskiner, men ikke 454 eller den klassiske kapillarelektroforese sekventering platform. Brugere, der arbejder uden en sekventeret henvisning genom kan overveje at udføre de novo transkriptom samling ved hjælp af en af flere værktøjer såsom Trinity ( http://trinityrnaseq.sourceforge.net/ ), Trans-Abyss ( http://www.bcgsc.ca/platform/bioinfo/software/trans-abyss/releases/0.2) eller Oaser ( http://www.ebi.ac.uk/ ~ zerbino / oaser / ). Mange alternative transkriptomet analyseprogrammer findes nu. For en oversigt over de forskellige programmer, kan læserne ønsker at læse den undersøgelse, som Garber et al. 13 og gennemgangen af Martin og Wang 14, der beskriver de komparative fordele og ulemper, og de teoretiske overvejelser mest i øjeblikket og almindeligt brugte programmer. Valget af transkriptomet analysestrategier (reference-baseret strategi, de novo strategi, og kombineret strategi) og programmer afhænger af mange faktorer, herunder eksistensen eller fuldstændigheden af en reference genom, tilgængeligheden af sekventering og computing ressourcer, den type oplysninger, der genereret og, vigtigst af alt, det overordnede mål af forløbet projektet 14.
Et andet punkt bør gøres: computer programmer for transkriptomet analyse kan ikke give en 100% nøjagtighed af al udskrift rapportering. Sekventering fejl er en anden bekymring. Det er altid tilrådeligt, at ethvert differentielt udtrykt transcript identificeret ved RNA-seq valideres ved real-time PCR. TaqMan probe-baseret kemi betragtes som den gyldne standard for real time PCR. Desuden bør nyligt identificerede transskripter valideres ved Sanger metoden til DNA-sekventering inden yderligere eksperimenter.
Fejlfinding
Library Preparation: En udstrygning med høj molekylvægt genomisk DNA efter biblioteket præparationstrin kan være forårsaget af en fremførsel af den endelige kugle rensningstrin i biblioteket præparatet. Returnering bibliotekerne til den magnetiske stativ til en fuld fem minutter kan løse problemet. Hvis ikke, kan problemet skyldes ufuldstændig opsplitning af RNA i de første trin af biblioteket forberedelse. Dette kan forekomme, hvis lav-kvalitet RNA anvendes eller hvis protokollen ikke følges nøjagtigt. For eksempel ændring af inkubationstider eller temperatur, tilsætning af reagenser i forkert rækkefølge eller standse mellem fragmentering og syntesen af den første streng af cDNA. Hvis vender tilbage bibliotekerne til det magnetiske stativ ikke fjerner den høje MW-DNA, er det tilrådeligt at gentage biblioteket præparat med friske RNA-prøver.
Lav intensitet: Hvis den første cyklus intensitet er lavere end forventet, er det muligt, at primerne ikke hybridiserer til klyngerne korrekt under det sidste trin af klynge generation eller strømningscellen blev opbevaret for længe mellem klyngedannelse og starten af sekventering kører. I dette tilfælde bør en primer rehybridisering udføres under anvendelse af en primer rehyb kit fra Illumina. Oftest denne rehyb løser intensitet spørgsmål og kørslen kan påbegyndes i løbet af uden problemer. Hvis der efter et rehyb af intensiteten stadig er lav, kan problemet væremed bibliotekerne eller sekvensen ved syntese (SBS) reagenser og Illumina teknisk service bør kontaktes for yderligere fejlfinding. Hvis den første Reads intensiteter er gode, men intensiteterne er lave efter turn rundt, kan en primer rehyb af den anden læste primer være nødvendig. Dette udføres på sekventering instrument og Illumina tekniske tjeneste skal kontaktes for proceduren.
Høj udfasning / prephasing: Hvis højere end normalt udfasning eller prephasing observeres, en mulig årsag er forurening af andre SBS reagenser med spaltning buffer. Under de SBS fremstillingstrin, er det vigtigt at håndtere spaltning buffer sidste og skifte handsker mellem håndteringen af spaltning buffer, og alle andre reagenser. Hvis spaltning buffer er mistanke om kontaminering, bør en primer rehyb af flowcellen skal udføres, og nye SBS reagenser skal være forberedt. Alternativt kunne der være forurening i de strækninger i det inst RUMENT. Hvis dette er mistanke bør instrumentet underkastes en vedligeholdelses vask (en vask med vand efterfulgt af en vask NaOH, efterfulgt af en endelig vask med vand), bør en primer rehyb udføres på flowcellen og nye SBS reagenser skal fremstilles. Hvis udfasning / prephasing værdier er moderat høj (-0,5), kan kørslen fortsættes indtil de Q30 scoringer og klynger passerer filter beregnes. Disse niveauer kan stadig være i acceptable grænser, selv med høj udfasning og / eller prephasing.
Generaliseres af denne protokol
Selv om det er specifik for Illumina HiScanSQ, denne protokol finder anvendelse på nogen af HiSeq familien eller Genome Analyzer II af Illumina instrumenter ( www.illumina.com ) med mindre modifikationer af klyngen generation trin og sekventering reagenser. Andre næste generation DNA-sekventering platforme såsom den faste serie ("_blank"> Www.lifetechnologies.com), GS-systemer ( www.454.com er) samt nogle nye nyere systemer også anvendes i forbindelse med RNA-seq 11. Selv om deres bibliotek konstruktion og sequencing procedurer kan være en smule anderledes, RNA-håndtering tips, dataanalysen dele (nedstrøms for de CASAVA trin) og validering af RT-PCR præsenteret i denne protokol kan være af referenceværdi til deres RNA-seq applikationer .
Det skal også understreges, at denne protokol er specifik for RNA-seq på et tidspunkt af thrombin-behandlede HMVEC-LBL-celler, men kunne let tilpasses til en multi-tidspunkt eller de undersøgelser i andre celler, væv behandlet med forskellige stimuli eller hæmmere eller sammenligninger af transcriptomes i celler eller væv mellem en sund tilstand og en sygdomstilstand.
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
Ingen interessekonflikter erklæret.
Acknowledgments
Forfatterne vil gerne takke Dr. Stephen Kingsmore og Pediatric Genome Medicine Center på Børns Mercy Hospitaler og klinikker for brugen af deres computing klynger for vores dataanalyse, Illumina mark service team (Elizabeth Boyer, Scott Cook og Mark Cook) og teknisk konsulent team for deres hurtige svar og nyttige forslag om driften af den næste generation DNA-sekventering instrument, HiScanSQ, og datakvalitet analyse. Dette arbejde blev støttet delvist af National Institutes of Health Grant HL080042 (til SQY) og opstart fond og begavelse af Børns Mercy Hospitaler og klinikker, University of Missouri i Kansas City (til SQY).
Materials
Name | Company | Catalog Number | Comments |
Human Lung Microvascular Endothelial Cells | Lonza | CC-2815 | |
Lonza, Bullet Kit | Lonza | CC-3202 | Contains EGM-2, FBS, growth factors and antibiotics |
Thrombin | Sigma | T4393 | |
Ambion mirVana Kit | Life Technologies | AM 1560 | |
RNase-Zap | Life Technologies | AM9782 | |
Experion StdSens RNA | Bio-Rad | 700-7103 | |
TruSeq RNA Preparation Kit | Illumina | FC-122-1001 | |
AMPureXP Beads | Beckman Coulter | A63881 | |
Superscript Reverse Transcriptase II | Life Technologies | 18064-014 | |
Experion DNA 1K | Bio-Rad | 700-7107 | |
QuantiTect SyberGreen | Qiagen | 204163 | |
PE Cluster Generation Kit | Illumina | PE-401-3001 | |
PhiX Control Kit | Illumina | FC110-301 | |
200 Cycle SBS Kit | Illumina | FC-401-3001 | |
HiScanSQ* | Illumina | SY-103-2001 | |
cBot | Illumina | SY-301-2002 | |
qPCR machine - Viia7 | Life Technologies | Model #VIIA7 / Equipment #10631261 | Or equivalent |
Experion System | Bio Rad | 7007001 | Bioanalyzer is an alternative system |
Spectrophotometer | Bio-Tek | Epoch Microplate Spectrophotometer | Or equivalent |
Centrifuge - Sorvall Legend XTR | Thermo Scientific | 75004521 | Or equivalent |
Magnetic stand | Life Technologies | AM10027 | |
96-well thermocycler | General Lab Supplier | ||
Table 3. List of Key Reagents and Major Equipment. *, In the video, HiSeq1000 instead of HiScanSQ was demonstrated. |
References
- Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet. 10, 57-63 (2009).
- Shendure, J., Ji, H.
Next-generation DNA sequencing. Nat. Biotechnol. 26, 1135-1145 (2008). - Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome Res. 18, 1509-1517 (2008).
- Zhang, L. Q., et al. RNA-seq Reveals Novel Transcriptome of Genes and Their Isoforms in Human Pulmonary Microvascular Endothelial Cells Treated with Thrombin. PLoS One. 7, e31229 (2012).
- Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
- Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10, R25 (2009).
- Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25, 2078-2079 (2009).
- Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat. Biotechnol. 28, 511-515 (2010).
- Khatri, P., Sirota, M., Butte, A. J. Ten years of pathway analysis: current approaches and outstanding challenges. PLoS Comput. Biol. 8, e1002375 (2012).
- Nielsen, H.
Working with RNA. Methods. Mol. Biol. 703, 15-28 (2011). - Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat. Protoc. 7, 562-578 (2012).
- Robertson, G., et al. De novo assembly and analysis of RNA-seq data. Nat. Methods. 7, 909-912 (2010).
- Garber, M., Grabherr, M. G., Guttman, M., Trapnell, C. Computational methods for transcriptome annotation and quantification using RNA-seq. Nat. Methods. 8, 469-477 (2011).
- Martin, J. A., Wang, Z.
Next-generation transcriptome assembly. Nat. Rev. Genet. 12, 671-682 (2011).