Biology

RNA-seq Analyse af Transcriptomes i behandlet Thrombin-og humant kontrol Pulmonal mikrovaskulære endotelceller

Published: February 13, 2013 doi: 10.3791/4393

Dilyara Cheranova¹, Margaret Gibson¹, Suman Chaudhary¹, Li Qin Zhang¹, Daniel P. Heruth¹, Dmitry N. Grigoryev¹, Shui Qing Ye¹

¹Children's Mercy Hospital and Clinics, School of Medicine, University of Missouri-Kansas City

Summary

Denne protokol udgør en komplet og detaljeret procedure at anvende RNA-seq, en kraftfuld næste generations DNA-sekventering teknologi, til at profilere transcriptomes i humane pulmonale mikrovaskulære endotelceller med eller uden thrombin behandling. Denne protokol er generalisere til forskellige celler eller væv ramt af forskellige reagenser eller sygdomstilstande.

Abstract

Karakteriseringen af genekspression i celler via måling af mRNA-niveauer er et nyttigt redskab til at bestemme, hvordan den transkriptionelle maskineri af cellen påvirkes af eksterne signaler (f.eks narkotikabehandling), eller hvordan celler variere mellem en sund tilstand og en syg tilstand. Med fremkomsten og kontinuerlig finjustering af næste generation af DNA-sekventering teknologi, har RNA-sekventering (RNA-seq) blevet en stadig mere populær metode til transkriptomet analyse katalogisere alle arter af transkripter, til bestemmelse af transkriptionel struktur af alle udtrykte gener og kvantificere de ændrede ekspressionsniveauer af det samlede sæt af transkripter i en given celle, væv eller organisme ^1,2. RNA-seq erstatter gradvist DNA microarrays som en foretrukken fremgangsmåde til transkriptomet analyse, fordi det har fordelene ved profilering af en komplet transkriptom, tilvejebringelse af en digital type datum (kopiantallet af et transkript) og ikke afhængig af nogen kendt genomisk fortløbendece ^3.

Her præsenterer vi en komplet og detaljeret protokol til at anvende RNA-seq til profil transcriptomes i humane pulmonale mikrovaskulære endotelceller med eller uden thrombin behandling. Denne protokol er baseret på vores seneste offentliggjorte undersøgelse med titlen "RNA-seq afslører Novel transkriptom af gener og deres isoformer i Human Pulmonal mikrovaskulære endotelceller behandlet med thrombin," ^4, hvor vi med succes gennemført første komplette transkriptomet analyse af humane pulmonale mikrovaskulære endotelceller behandlet med thrombin ved hjælp af RNA-seq. Det gav hidtil usete ressourcer til yderligere eksperimenter at få indblik i molekylære mekanismer bag trombinmedieret endotel dysfunktion i patogenesen af inflammatoriske tilstande, kræft, diabetes og hjerte-kar-sygdom, og giver potentielle nye leads til terapeutiske mål til disse sygdomme.

Den beskrivende tekst til denne protokoler opdelt i fire dele. Den første del beskriver behandlingen af humane pulmonale mikrovaskulære endotelceller med thrombin og RNA isolation, kvalitet analyse og kvantificering. Den anden del beskriver bibliotek konstruktion og sekventering. Den tredje del beskriver dataanalyse. Den fjerde del beskriver en RT-PCR-validering assay. Repræsentative resultater af flere vigtige skridt vises. Nyttige tips eller forholdsregler for at øge succes i de vigtigste trin er tilvejebragt i Diskussion sektion. Skønt denne protokol anvender humane pulmonære mikrovaskulære endotelceller behandlet med thrombin, kan det være generaliseres til profil transcriptomes i både pattedyr-og ikke-pattedyr-celler og i væv, der er behandlet med forskellige stimuli eller inhibitorer eller til sammenligningen transcriptomes i celler eller væv mellem en sund tilstand og en sygdomstilstand.

Protocol

Et rutediagram der beskriver denne protokol er vist i figur 1..

1. Behandling af celler med thrombin, RNA Isolation, kvalitetsvurdering og Kvantificering af RNA

Kultur humane lunge mikrovaskulære endotelceller (HMVEC-LBL) til 90-100% konfluens i plader med 6 brønde i EGM-2 medium med 5% FBS, vækstfaktorer og antibiotika (Lonza, cat # CC-3202).
Skifte medie til udsultningsmedier (0% FBS) 30 min før behandling med thrombin.
Behandle cellerne med 0,05 U / ml thrombin eller forlade ubehandlet som en kontrol i 6 timer ved 37 ° C og _5% CO2.
Isolere total RNA fra de behandlede og kontrol-celler under anvendelse af Ambion mir Vana Kit ifølge producentens instruktioner.
Vurdere kvaliteten af RNA med en Experion StdSense eukaryot RNA chip ifølge standarden protokol om Experion Automated Electrophoresis Station (= "_blank"> Www.bio-rad.com).
Kvantificere RNA ved hjælp af en standard spektrofotometrisk metode.

2. Bibliotek Byggeri og Sequencing

Anvende 1 ug af høj kvalitet total RNA per prøve som udgangsmateriale.
For at konstruere biblioteket, skal du følge den normale procedure fra Illumina (protokol # 15.008.136 Rev A). I denne protokol, der indeholder mRNA markeringer to runder af poly (A) er udført for at fjerne rRNA at minimere rRNA sekvensering.
Vurdere kvaliteten af de biblioteker, ved hjælp af en Experion DNA 1K chip ifølge standarden protokol om Experion Automated Electrophoresis Station ( www.bio-rad.com ).
Kvantificere biblioteket ved hjælp qPCR: Brug et bibliotek, der tidligere er blevet sekventeret som en standardkurve og primere specifikke for de ligerede adaptere. Anvender en række fortyndinger af de ukendte biblioteker (dvs. 1:100, 1:500 og 1:1000). Kør qPCR according til SyberGreen MM-protokollen og beregne den oprindelige bestand koncentration af hvert bibliotek.
Fortynde Biblioteksbeholdninger til 10 nM og opbevares ved -20 ° C indtil klar til klynge en flow-celle.
Når klar til at klynge en gennemstrømningscelle, optø CBOT reagens pladen i et vandbad. CBOT er et Illumina instrument, der anvendes til at strømline klynge generation proces.
Vask CBOT instrument.
Denaturere biblioteker: Kombiner 13 pi 1x TE og 6 pi 10 pM bibliotek og til siden af røret, tilsættes 1 ul 1 N NaOH (leveret af Illumina). Vortex, centrifuger, inkuber ved stuetemperatur i 5 minutter og placere de denaturerede biblioteker på is.
Fortynd bibliotekerne: Fortynd de denaturerede biblioteker med præ-kølet hybridiseringsbuffer (HT1, leveret af Illumina) ved at kombinere 996 pi HT1 og 4 gl denatureret bibliotek til en slutkoncentration på 12 pM. Placer de denaturerede og fortyndede biblioteker på is.
Invertere hver række af rør i CBOT plade,sikre, at alle reagenserne er optøet. Spin ned pladen, fjerne / punktere folie sæler og indlæse på CBOT.
Alikvot 120 ul af de fortyndede, denatureret biblioteker til en stribe rør, mærket 1-8. Tilsæt 1,2 ul fortyndet, denatureret PhiX kontrol bibliotek (fra Illumina) i hvert rør som en pig-i kontrol. Vortex og spin ned rør og læg dem på CBOT i den rigtige retning (rør nr. 1 til højre).
Læg et flow-celle og manifold på CBOT.
Udfyld flow kontrollere og begynde clustering løb.
Efter kørslen er færdig, tjek reagens levering på tværs af alle baner. Notér eventuelle afvigelser. Enten begynde sekventeringen udføres med det samme eller opbevares i flowcellen i det billede røret ved 4 ° C.
Optø sekventerings-ved-syntese (SBS, Illumina) reagenser.
Læg de reagenser til de relevante pletter på reagens bakkerne, og sørg for ikke at røre de andre reagenser efter berøring spaltningen mix.
Ved anvendelse af en ikken-sekventering flowcelle (dvs. en, der blev sekventeret tidligere), prime reagensbeholderne linjer to gange.
Rengør sekventering flowcellen med 70% EtOH og Kimwipes, efterfulgt af 70% EtOH og linse papir. Inspicere flowcellen for nogen striber. Re-rens det om nødvendigt.
Indlæse flowcellen på sequencer og udføre en strøm kontrollere, at forseglingen mellem manifolderne og flowcellen er stram.
Start sekventering run.
Vurdere kvaliteten målinger (f.eks klynge tæthed, klynger passerer filter, Q30, intensitet), som de bliver tilgængelige under kørslen.
Overvåg intensitet under hele kørslen.
Efter 101 cykler er afsluttet, udfører turnaround kemi at færdiggøre den anden læses: optøs de parrede ende reagenser og det andet read Inkorporering Buffer (ICB, en komponent af SBS reagenser, Illumina) og indlæse reagenserne.
Fortsæt sekventering løb, vurderer 2 ^nd læse intensitet, Q30 and andre kvalitets målinger som run skrider frem.

3. Dataanalyse

Brug den nyeste version af CASAVA (Illumina, i øjeblikket 1.8.2) til at konvertere basen call-filer (. Bcl) filer til. Fastq filer, indstilling fastq-cluster-count til 0 for at sikre, at oprettelsen af et fælles fastq fil for hver prøve . Unzip de fastq filer til downstream analyse.
Udfør parret ende tilpasning ved hjælp af de nyeste versioner af Tophat (1.4.1) ^5, som justerer RNA-seq læser til pattedyr mellemstore genomer ved hjælp af ultra high-throughput short read Aligner (Bowtie, 0.12.7) ⁶ og SAMtools (0,1. 17) ^7. SAMtools implementerer forskellige hjælpeprogrammer til efterbehandling alignments i SAM-format. Referencen menneskelig transkriptom kan downloades fra iGenomes ( www.illumina.com ). I køreklar Tophat, brugte vi alle standard parameterindstillinger, herunder biblioteket typen option som fr-unstranded (standard).
OsING programmet CuffDiff, en del af manchetknapper (1.3.0) ⁸ softwarepakke, sammenligne de thrombin-behandlede celler til kontrol-celler til at frasortere de differentielt udtrykte gentranskripter i førstnævnte er baseret på den humane reference transkriptomet. Denne sammenligning finder den differentielle ekspression af kendte transkripter. Brug Microsoft Excel til at visualisere resultatet i tabelform. Ved at køre Manchetknapper program, brugte vi alle standardindstillinger parameterindstillinger. Disse gentranskripter med FPKM <0,05 og p> 0,05 bortfiltreres.
For at opdage nye isoformer, køre Manchetknapper uden en henvisning transkriptom. Sammenlign prøven transkript filerne til reference genom ved hjælp Cuffcompare og teste forskellen udtryk med Cuffdiff ved hjælp af de kombinerede thrombin transkript filer som reference genomet for én analyse, og de kombinerede kontrol transkript filer som reference genom for en anden analyse. Brug Microsoft Excel til at visualisere resultatet i tabelform. Igen, Those gentranskripter med FPKM <0,05 og p> 0,05 bortfiltreres. Efter dette trin, kan efterforskerne vælge at uploade en liste af nyanmeldte udskrifter til den UCSC Genome Browser hjemmeside ( http://genome.ucsc.edu/ ) for at kontrollere deres gyldighed ved en manuel inspektion.
Indgive lister af differentielt udtrykte gener til Ingenuity Pathway Analysis (IPA, www.ingenuity.com ) til karakterisering af generne og veje ramt af thrombin behandling. I dette trin kan efterforskerne vælge at bruge cummerbund ( http://compbio.mit.edu/cummeRbund/ ), en R-pakke, som er designet til at hjælpe og forenkle opgaven med at analysere Manchetknapper RNA-seq output, at hjælpe med at administrere, visualisere og integrere alle data produceret af en Cuffdiff analyse.

4. Validering af RNA-seq Results by kvantitativ real-time-Polymerase Chain Reaction (qRT-PCR)

Udfør total RNA isoleret fra kontrol-og thrombin-behandlede HMVEC-LBL celler, RNA kvalitetsvurdering og RNA kvantificering beskrevet i trin fra 1,4 til 1,6.
Generere komplementært DNA fra 1 ug totalt RNA fra hver prøve med Superscript III First-Strand Synthesis System RT Kits, efter producentens instruktioner (Invitrogen, 18080-051).
Udfør QRT-PCR-analyse på en Applied Biosystems VIIa 7 Real-Time PCR System ved hjælp af TaqMan Assay-on-Demand designet oligonukleotider til påvisning af CUGBP, Elav-likefamilymember1 (CELF1, Hs00198069_m1), Fanconianemia, complementationgroupD2 (FANDCD2, Hs00276992_m1), TNFreceptor -associeret faktor 1 (TRAF1, Hs01090170_m1), og β-actin (ACTB, Hs99999903_m1). Hver prøve havde en skabelon svarende til 5 ng totalt RNA. Mål mængdebestemmelse ved hjælp af DDCt fremgangsmåde og omsætter til β-actin. Hvert assay blev udført på tværs af mindst tre biologiske replikater.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

For Trin 1: The 28s: 18s forholdet er traditionelt brugt som en indikator for RNA-nedbrydning. Ideelt set bør 28s top er omtrent dobbelt det område, som 18s båndet (et forhold på 2), men denne ideelle forhold ofte ikke ses i praksis. Endvidere 28S: kan 18s forhold opnået ved spektrofotometriske metoder undervurderer mængden af nedbrydning af RNA'et. For mere nøjagtigt at kvantificere den nedbrydning, og derfor kvaliteten af RNA-prøve, at Experion systemet beregner en RNA kvalitetsindikator (RQI) nummer. Den RQI algoritmen sammenligner elektroferogram af RNA-prøver til data fra en række standardiserede, nedbrudte RNA-prøver og automatisk returnerer et tal mellem 10 (intakt RNA) og 1 (nedbrudt RNA). RNA kvalitet bør have en RQI på mindst 7, ideelt større end 8. Figur 2 viser Experion resultater under anvendelse af en høj kvalitet RNA-prøve med en RQI på 8,4.

ForTrin 2: Bibliotekerne bør have et bredt bånd ved ca 250 til 300 bp 3 viser Experion resultater af høj kvalitet bibliotek Figur 4 viser qPCR resultaterne af standardkurve prøver og en ukendt prøve (vist i mørkeblå)... De fremskridt og kvalitet sekventering run skal konstant observeres under hele kørslen Figur 5 viser passende klynge tæthed under den første cyklus imaging skridt;. Dette er den første indikation af run kvalitet. Klynger skal være lyst og fokuseret. Figur 6 viser den første base rapport genereret efter den første cyklus er færdig. Det er vigtigt at vurdere den anslåede klynge tæthed, intensitet niveauer, og fokus kvalitet på dette punkt. Den næste kvalitet checkpoint efter cyklus 4, er vist i figur 7. Det viser den absolutte klynge tæthed for hver bane. Klyngen tæthed bør ikke være over 850 k / mm ^2. Efter cyklus 13,phasing (når en base er ikke tilføjet under en cyklus) og prephasing (når to baser tilsættes under en cyklus) statistik beregnes, som vist i figur 8. Typiske tal er mellem 0,1 og 0,25. Den største kvalitetsvurdering er muligt efter cyklus 24, når flere kvalitets målinger beregnes. Procentdelen af læser over Q30, vist i figur 9, er et mål for tillid til basen ringer. En læses med en Q-score på 30 betyder, at der er et 1 i 1000 chance for, at basen opkald er forkert. Q-score vil falde i takt med kørslen skrider frem, men bør starte ud med mere end 95% af det lyder møde eller over Q30. Klyngerne passerer filter (PF), vist i figur 10, er de klynger, hvorfra de faktiske sekvensdata vil blive truffet. Ideelt set bør denne være højere end 85%. Klyngen PF er baseret på mange faktorer, herunder indfasning, prephasing, intensitet og Q30. Det vil ikke ændre sig som tiden skrider frem. Den procentvise linie (

For Trin 3: Tabel 1 viser udtrykte gener og isoformer i både kontrol-og trombin-behandlede humane pulmonale mikrovaskulære endotelceller. Især er der omkring 26000 nye detekterede isoformer, hvilket illustrerer styrken af RNA-seq-den kan identificere ukendte RNA'er, alternativt splejsede transkripter og alternative promotor brug, som ikke detekteres ved microarray teknikker ^3. RNA-seq kan også måle de mindre rigelige udskrifter, der er ukorrekt kvantificerede eller ej opdaget af microarrays. Figur 12 og Tabel 2 display differentially udtrykte gener i thrombin-signalvejen. Dette er et eksempel på den tredje generation videnbase-driven pathway analyse ^9: pathway topologi tilgange, ved hjælp Ingenuity Pathway Analysis software. Det viser, at en seks timer thrombin signifikant opregulerer thrombin-receptoren Par 4 og nedregulerer thrombin-receptoren Par 3, mens der ikke er nogen ændring i ekspressionen af thrombin-receptoren Par 1. Ekspression af NFkB1, NF KB2 og Src er også markant opreguleret. Nogle af Rho familie gener (Rho B, C, F og G) er opreguleret mens andre (Rho J, Q, T1, U og V) er nedreguleret (tabel 4). Myosin let kæde-gen 9 (MYL9) opreguleres, mens MYL12B er nedreguleret. Ekspressionen af andre gener enten er nedreguleret eller ikke berøres.

For Trin 4: For at validere RNA-ff resultater ved hjælp af en alternativ fremgangsmåde, udførte vi en qRT-PCR eksperiment til assay tre forskelligeleje-gener (figur 13). I RNA-seq data, var TRAF1 opreguleres ved 7,96 gange, CELF1 var nedreguleret af 1,16 gange, og FANCD2 blev nedreguleret af 1,70 gange. I qRT-PCR data, er disse tilsvarende tal 7,25 gange, -1,15 gange og -2,07 gange. Resultaterne af disse tre gener analyseret ved RNA-seq og qRT-PCR er i god overensstemmelse, hvilket bekræfter de RNA-ff resultater.

Gener
	Kontrol	Thrombin
Samlede gener, der udtrykkes	16.636	16.357
Kun styre	783
Thrombin Only		504
Opreguleret (2-fold eller større forskel)		152
Nedregulerede (2-fold eller greater forskel)		2.190
Kendte isoformer
	Kontrol	Thrombin
Samlede kendte isoformer Udtrykt	26.807	26.300
Kun styre	1.492
Thrombin Only		985
Opreguleret (2-fold eller større forskel)		480
Nedregulerede (2-fold eller større forskel)		3.574
Nye Isoformer
	Kontrol	Thrombin
Total Nye Isoformer Udtrykt	25.880	25.886
Kun styre	418
Thrombin Only		424
Opreguleret (2-fold eller større forskel)		1.775
Nedregulerede (2-fold eller større forskel)		12.202

Tabel 1. Gene / Isoform Expression Summary *. Denne tabel viser gener, kendte isoformer og nye isoformer udtrykt i kontrol og trombin-behandlede HMVEC-LBL celler. The fold-ændring er forholdet mellem thrombin FragmentsPerKilobase af transkript perMillion fragmenter kortlagt (FPKM) til at styre FPKM. De gener, kendte isoformer og nye isoformer med 2-fold eller større forskel mellem to grupper er statistisk forskellige ekspressionsniveauer (bestemt efter Benjamini-Hochberg korrektion). * Denne tabel er gengivet fra tabel 2 i reference 4.

Down-regulerede gener
Gene Symbol	Samlet Fold Change	Medlemmer	Individuel Fold Change	q_value **	FPKM Kontrol	FPKM Thrombin
PLC	-2,49
		PLCB1	-2,97	0	6,75585	2,27611
		PLCB2	-1,32	0.00183634	1,80892	1,36957
		PLCB4	-10,04	6.28386E-14	0.682668	0,0679.837
		PLCL1	-2,53	5.26728E-09	0.602879	0.238017
Gaq	-1,87
		GNAQ	-1,87	0	24,0907	12,8996
Gai	-1,56
		GNAI1	-1,86	0	9,88417	5,31795
		GNAI3	-1,49	0	35,7592	24,0198
PKC			-2,15
		PRKCE	-1,65	0	9,36364	5,67305
		PRKCI	-2,14	0	6,63566	3,09818
		PRKD3	-2,61	0	16,0215	6,12878
IP3R	-2,60
		ITPR1	-1,39	0,000018734	1,51592	1,09009
		ITPR2	-3,19	0	7,23283	2,26944
CREB	-2,36
		CREB1	-2,36	0	5,19117	2,2004
GATA	-2,33
		GATA3	-2,33	0.0228108	0.716773	0.307131
TBP	-1,35
		TBP	-1,35	2.66E-05	8,48689	6,30476
G-protein Alpha	-1,64
		GNA14	-1,49	0,000122496	2,78076	1,86573
		GNAI1	-1,86	0	9,88417	5,31795
		GNAI3	-1,49	0	35,7592	24,0198
		GNAQ	-1,87	0	24,0907	12,8996
PAR3	-1,87
		F2RL2	-1,87	1.02474E-06	1,51286	0.810286
SOS1
	SOS1	-2,27	0	8,94353	3,94679
Ras	-1,69
		KRAS	-2,03	0	11,2766	5,5659
		Nationale tilsynsmyndigheder	-1,61	0	38,0874	23,6491
AKT	-1,77
		AKT3	-1,77	0	15,8228	8,94223
MLCP	-2,38
		PPP1CB	-2,10	0	39,585	18,8199
		PPP1R12A	-3,56	0	15,2274	4,27516
		PPP1R12B	-2,66	5.28466E-13	1,92123	0.722188
FAK	-1,31
		PTK2	-1,31	4.3856E-10	39,7935	30,3044
P70 S6K
		RPS6KB1	-1,99	0	8,46312
ROCK	-3,68
		ROCK1	-3,54	0	19,5921	5,53112
		ROCK2	-3,86	0	16,0054	4,14759
CAMK	-1,17
		CAMK1	1,30	0,000255587	7,90794	10,296
		CAMK2D	-1,74	2.22911E-12	11,4497	6,56804
		CAMK4	-2,58	0,000619045	0,62714	0.243277
Op-regulerede gener
Symbol	Samlet Fold Change	Medlemmer	Individuel Fold Change	q_value **	FPKM Kontrol	FPKM Thrombin
PAR4	1,59
		F2RL3	1,59	9.19043E-13	4,99867	7,9253
Src	1,47
		Src	1,47	0	14,1085	20,675
NF-kB	1,65
		NFKB1	1,66	0	19,5113	32,3457
		NFKB2	2,02	0	28,7563	58,1293
		RELA	1,45	0	55,3482	80,28
Partielle Up-/Partial Down-regulerede gener
Symbol	Samlet Fold Change	Medlemmer	Individuel Fold Change	q_value **	FPKM Kontrol	FPKM Thrombin
G-protein-GAMma	1,22
		GNG10	-1,34	2.17216E-08	27,192	20,2206
		GNG11	1,31	5.66209E-05	770,922	1011,05
		GNG12	-1,44	5.11591E-13	112,397	78,3023
		GNG2	2,43	6.38453E-09	0.465705	1,13132
G-protein-beta	1,27
		GNB2	1,36	1.91268E-10	137,786	187,43
	GNB3	-2,69	4.71259E-11	2,58703	0.962504
		GNB4	-1,61	0	15,8275	9,85484
Rho GEF	-1,16
		ARHGEF12	-1,67	0	30,6424	18,3015
		ARHGEF2	1,33	5.80478E-08	27,6288	36,758
		ARHGEF3	-1,48	0	20,3279	13,7813
		ARHGEF6	-2,08	0	2,67944	1,28635
		ARHGEF9	-1,54	0.00469498	1,56367	1,0159
PI3K	-1,80
		Pengeautomat	-6,84	0	4,98972	0.729483
		PIK3C2A	-5,09	0	17,7894	3,49234
		PIK3C3	-1,49	4.66294E-15	12,6504	8,50852
		PIK3CA	-3,14	0	16,8398	5,36228
		PIK3CB	-1,36	8.4357E-09	9,68516	7,12129
		PIK3CD	1,86	0	5,6579	10,5507
		PIK3CG	-1,76	2.32945E-10	1,86962	1,06419
		PIK3R1	-1,79	0	5,48118	3,06256
		PIK3R3	-1,59	1.50915E-05	5,24549	3,30763
		PIK3R4	-1,40	7.18425E-12	8,34176	5,97942
Rho	1,19
		RHOB	1,31	9.48429E-06	232,232	304,587
		RHOC	1,38	458,267	630,235
		RHOF	1,65	0	8,29676	13,7268
		RHOG	1,40	1.02141E-14	58,6003	82,0172
		RHOJ	-1,57	0	127,446	80,9317
		RHOQ	-1,52	0	16,4802	10,8122
		RHOT1	-1,96	3.00071E-12	8,48834	4,33755
		RHOU	-1,54	0.00184367	0.900141	0.586092
		RHOV	-3,32	0.0056467 1	0.413912	0.124591
		RND3	-1,95	0	58,0564	29,7075
MLC	-1,06
		MYL12B	-1,43	4.87832E-11	872,075	608,472
		MYL9	1,48	0	202,636	299,559

Tabel 2. Differentielt udtrykte gener og isoformer i Thrombin signalvejen *. *, Denne tabel er gengivet i Tabel S4 i Reference 4 med en mindre modifikation. **, Q-værdi, en falsk opdagelse justeres p-værdi.

93/4393fig1.jpg "alt =" Figur 1 "/>
Figur 1. Flowchart af protokollen for RNA-seq profilering af trombinmedieret transkriptom i humane pulmonale mikrovaskulære endotelceller. Først behandle celler og isolere og kvantificere RNA. Forbered biblioteker fra den høje kvalitet RNA og vurdere deres koncentration (via qPCR) og kvalitet (via en bioanalyzer), derefter klynge på en flow-celle. Start sekventeringen køre og analysere kvaliteten af kørslen igennem. De store kvalitet checkpoints er cyklusser 1, 4, 13 og 24. Brug CASAVA, konvertere BCL filer til fastq filer og derefter justere dem til genomet med tophat. Detect kendte og ukendte isoformer hjælp Manchetknapper og bestemme forskellen udtryk med CuffDiff. Se output filer i Excel og filtrere gener, der har et ekspressionsniveau mindre end 0,05 FPKM eller en p-værdi større end 0,05. Indsend de resterende gener til Ingenuity Pathway Analyse for yderligere oplysninger om de genfunktioner og stier enffected af thrombin behandling. Normalt udvalgt sæt af differentielt udtrykte gener er valideret af en alternativ tilgang som QRT-PCR.

Figur 2
Figur 2. En repræsentativ RNA-prøve med en RQI på 8,4 som analyseret af Experion Automated Electrophoresis Station A) Den individuelle spor af høj kvalitet RNA -.. X-aksen viser tiden, og y-aksen viser fluorescenssignalet B) Den virtuelle gel billede af høj kvalitet RNA-prøve. Intensiteten af 28S top er større end 18S top og ingen forurening ses. Begge bands er skarpe og afgrænsede. Klik her for at se større figur .

Figur 3. Højkvalitets bibliotek fremstillet ud fra RNA, som analyseret af Experion Automated Electrophoresis Station En bred top mellem 250 og 300 bp påvises og ingen DNA med høj molekylvægt (kontaminerende DNA) observeres A) Den individuelle spor af høj kvalitet bibliotek.. - x-aksen viser tiden, og y-aksen viser fluorescenssignalet B) Den virtuelle gel billede af høj kvalitet bibliotek. En bred top mellem 250 og 300 bp påvises og ingen DNA med høj molekylvægt (kontaminerende DNA) overholdes. Klik her for at se større figur .

Figur 4
<strong> Figur 4. qPCR resultater under anvendelse SyberGreen og primere specifikke for Illumina ligerede adaptere. En tidligere samlet bibliotek anvendes som standardkurve for at bestemme den optimale clustering koncentration for den nyligt forberedt bibliotek. Fortyndingen af den ukendte biblioteket falder inden standardkurven koncentrationer. Standardkurven prøver er sigtet med pilene, og den ukendte prøve er mørkeblå og også angivet med en pil.

Figur 5
Figur 5. . Passende klynge tæthed under den første cyklus imaging skridt Klyngerne er klar, fokuseret og lyse A) Base A,. B) Base C, C) Base G, D) Base T.

<td> 19.892

Metric	Bane 1		Bane 3	Bane 4	Bane 5	Bane 6	Bane 7	Bane 8
Cluster Density (k / mm ²⁾	420,94	412,95	410,81	408,54	416,71	416,56	410,02	411,84
En Intensitet	25870,5	23.886	23891,38	23735,83	23949,38	24933,08	24305,79	23950,29
C Intensitet	21559,62	19822,33	19759,33	19.472	19954,21	20611,75	19438,29
G Intensitet	13619,46	11756,67	11486,44	10498,38	12186,62	12195,5	11826,88	11010,5
T Intensitet	19402,67	17663,79	17854,42	17353,75	17545,54	18060,67	18457,92	17397,12
En Focus Score	68,2	67,46	67,67	67,75	67,41	67,43	67,63	67,05
C Focus Score	67,93	67,33	67,56	67,66	67,33	67,39	67,46	66,9
G Focus Score	65,4	64,14	63,98	63,92	63,29	63,41	63,47	63,74
T Focus Score	66,45	65,57	65,5	65,49	65,03	65,23	65,57	65,59

Figur 6. Den første base rapport genereret efter den første cyklus er færdig. Klyngen tæthed (selvom undervurderet på nuværende tidspunkt), er passende. Styrkerne ser godt (10,000-26,000, med G har den laveste intensitet). De fokusværdier er også passende, falder omkring 65-70, selv om højere værdier er også passende.

g7.jpg "alt =" Figur 7 "/>
Figur 7. Klyngen massefylde, der beregnes efter cyklus 4 Klyngen massefylde er lavere end 850 k / mm ² og endda på tværs af alle baner A) tabelform... B) Graph formular Klik her for at se større figur .

Figur 8
Figur 8. Indfasning (ikke at tilsætte en base under en cyklus) og Pre-udfasning (tilføje to baser i løbet af en cyklus). Begge værdier på 0,25 eller derunder, hvilket indikerer passende udfasning / pre-udfasning niveauer. A) den gradvise og præ-udfasning numeriske værdier . B) den gradvise værdier i grafisk form. C) Den præ-indfasning værdier i grafisk form. Clic K her for at se større figur.

Figur 9
Figur 9. De forskellige repræsentationer af Q30 scorer efter cyklus 24. En score på 30 eller højere indikerer en 1 ud af 1.000 chance for, at basen opkald er forkert. Omkring 90% af Q score er over 30 A) tabelform (Q30 scoringer her er fra hele den løb gennem cyklus 24). B) Q30 scoringer efter cyklus. Hver søjle repræsenterer fordelingen af læser falder på Q30 eller over for den pågældende cyklus. C) Q30 score distributioner ved cyklus 24. Fordelingen af Q scorer på akkumuleret basis gennem cyklus 24. Q score er på x-aksen og millioner af læsninger er på y-aksen. Læser med et Q30 over 30 er repræsenteret i grønt.oad/4393/4393fig9large.jpg "target =" _blank "> Klik her for at se større figur.

Figur 10. De forskellige repræsentationer af klynger passerer filter. Clusters passerer filter er baseret på flere parametre, herunder Q30, intensitet og udfasning / pre-udfasning. Mindst 85% af klyngerne passerer filter i hver bane A) tabelform. B) Graph form, blå kasser repræsenterer det samlede antal klynger, grønne kasser repræsenterer de klynger passerer filtrene. Klik her for at se større figur .

Figur 11.. . Den procent af klynger tilpasset til PhiX genomet Ca. 0,5% af klyngerne tilpasse sig til det PhiX genomet, passende for mængden af PhiX tilsat i prøverne A) tabelform.. B) Graph formular Klik her for at se større figur .

Figur 12. Gener differentielt udtrykt af thrombin behandling af HMVEC-LBL i Thrombin signalvej. Thrombin signalvejen blev konstrueret ved Ingenuity. I reaktionsvejen, indikerer rød farve op-regulerede gener ⁽³ 1,3 gange) og grønne down-regulerede gener ( tabel 2. Dette tal er gengivet fra figur 4 i reference 4. Klik her for at se større figur

Figur 13. qRT-PCR-validering af tre differentielt udtrykte gener fra thrombin-behandlede HMVEC-LBL RNA-ff data. qRT-PCR blev udført som beskrevet i protokollen. Fold ændringer bestemt ud fra de relative Ct-værdier på TaqMan Gene Expression assay for CUGBP, Elav-lignende familiemedlem 1 (CELF1), Fanconi anæmi, komplementering gruppe D2 (FANCD2) og TNF receptor-associeret faktor 1 (TRAF1)blev sammenlignet med dem, der detekteres af RNA-seq. Gentagelser (n = 4) af hver prøve blev kørt, og Ct-værdierne beregnes. Alle Ct-værdier blev normaliseret til β-actin. Fejlsøjlerne repræsenterer området af den fold-ændring som bestemt ved de data Assist software. p <0,05 blev betragtet som statistisk signifikant i relative fold ændringer mellem thrombin-behandling og kontrolgruppen af både RNA-seq og qRT-PCR-assays. MRNA-niveauet i kontrolgrupperne fra hvert assay blev arbitrært sat som en, der ikke er vist. *, P <0,05; **, p <0,01. Dette tal er gengivet fra figur 6 i reference 4.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Vigtige skridt

RNA Håndtering: RNaser vil forringe selv de mest høj kvalitet RNA, derfor skal man være omhyggelig under isoleringen, opbevaring og anvendelse af RNA ^10. Handsker er altid slidt for at forhindre forurening af RNaser fundet på menneskehænder. Handsker skal udskiftes ofte, især efter at røre huden, dørhåndtag eller andre almindelige overflader. Et sæt af pipetter bør være dedikeret udelukkende til RNA arbejde og alle tips og rør skal være RNase-fri. RNA isolation og nedstrøms anvendelse skal udføres i mindre befærdede områder, der rutinemæssigt dekontamineres med et produkt som RNase-Zap. Nedbrydning kan også forekomme ved gentagne fryse-tø cykler. Disse kan minimeres ved udportionering RNA for downstream applikationer umiddelbart efter isolation. Alternativt kan cDNA være til nedstrøms anvendelse, såsom qRT-PCR umiddelbart efter isolering. RNA opbevares ved -80 ° C og holdt på is under brug. Det er også important til grundigt at tø og vortex RNA-prøver før og under brug.

Udgangspunktet Kvaliteten af RNA er afgørende for succes i denne protokol. Anvendelse af nedbrudte eller på anden vis lav kvalitet RNA kan forårsage biblioteket præparat til at fejle eller resultere i lavt udbytte, som vil være utilstrækkelig til sekventering. Selv om tilstrækkeligt bibliotek kan fremstilles af nedbrudte eller dårlig RNA, vil det ikke nøjagtigt repræsentere transkripter til stede i prøven, hvilket resulterer i unøjagtig kvantificering af ekspression. Også kan enhver ikke-fjernede genomisk DNA under RNA isolation forårsage en overvurdering af mængden af RNA, der anvendes i protokollen, men hvis et beløb (fx 1-2 ug) i midten af det foreslåede område (0,1-4 ug) anvendes, vil den faktiske mængde RNA være tilstrækkelig til protokollen. Desuden er enhver genomisk DNA sandsynligvis ikke blive opfanget af oligo (dT)-primer baseret bibliotekskonstruktion i standard Illumina protokollen og det vil således ikke forårsage downstream issdier med udtrykte mRNA transcript niveauer. Kvantificeringen af udgangsforbindelserne RNA under anvendelse regelmæssige spektrofotometriske aflæsninger bør være tilstrækkelig, og der er ingen behov for at anvende meget nøjagtige kvantitative metoder, såsom RiboGreen eftersom bibliotekerne vil blive nøjagtigt kvantificeret efter fremstilling af qPCR og genekspressionsniveauer er normaliseret i forhold til det samlede antal læser under dataanalyse trin.

Bibliotek Kvantificering. Præcis kvantificering af bibliotekerne er afgørende for den rette generation af klynger. Kun DNA-molekyler med held ligerede adaptere vil danne klynger. Spektrofotometriske aflæsninger vil ikke skelne mellem DNA med adaptere og DNA uden, som vil resultere i en overvurdering af koncentrationen af biblioteket og til sidst det medføre klynger af flowcellen. Mængden af DNA uden ligerede adaptere vil variere fra biblioteket til biblioteket, selv om de samme RNA blev anvendt som starterING materiale, så man kan ikke præcist antage, at en standard procentdel af den spektrofotometriske aflæsning er DNA med ligerede adaptere. Udførelse af qPCR med primere specifikke for adapterne vil detektere kun de DNA-molekyler med adaptere held ligeret til begge ender af molekylet. Dette giver en absolut kvantificering af bibliotekerne og til gengæld en nøjagtig klynge tæthed. Vurdering af biblioteker med en Experion instrument eller en bioanalyzer er også vigtig. Dette muliggør en visualisering af størrelsesområdet af biblioteket, hvilket er vigtigt under dataanalyse trin, og sikrer, at der ikke er nogen forurening, der kan forstyrre klynge generation.

Dataanalyse. I denne protokol, gælder vi Tophat at tilpasse RNA-seq læser til menneskelig henvisning transkriptom og Manchetknapper at samle udskrifter, vurdere deres overflod, og test for differentiel ekspression i thrombin-behandlede HMVEC-LBL celler. Tophat og Manchetknapper er two populære værktøjer, og de er gratis, open-source software ^11. En nylig undersøgelse viste, at Manchetknapper havde en høj sensitivitet og specificitet til afsløring af tidligere kommenterede introns ^12. Men Tophat og Manchetknapper ikke behandle alle anvendelser af RNA-seq de er heller ikke de eneste værktøjer til RNA-seq-analyse ^11. Tophat og Manchetknapper kræver en sekventeret henvisning transkriptom eller genom. De er særlig egnede til analyse af RNA-ff data genereret fra enten Illumina eller faste sekventering maskiner, men ikke 454 eller den klassiske kapillarelektroforese sekventering platform. Brugere, der arbejder uden en sekventeret henvisning genom kan overveje at udføre de novo transkriptom samling ved hjælp af en af flere værktøjer såsom Trinity ( http://trinityrnaseq.sourceforge.net/ ), Trans-Abyss ( http://www.bcgsc.ca/platform/bioinfo/software/trans-abyss/releases/0.2) eller Oaser ( http://www.ebi.ac.uk/ ~ zerbino / oaser / ). Mange alternative transkriptomet analyseprogrammer findes nu. For en oversigt over de forskellige programmer, kan læserne ønsker at læse den undersøgelse, som Garber et al. ¹³ og gennemgangen af Martin og Wang ^14, der beskriver de komparative fordele og ulemper, og de teoretiske overvejelser mest i øjeblikket og almindeligt brugte programmer. Valget af transkriptomet analysestrategier (reference-baseret strategi, de novo strategi, og kombineret strategi) og programmer afhænger af mange faktorer, herunder eksistensen eller fuldstændigheden af en reference genom, tilgængeligheden af sekventering og computing ressourcer, den type oplysninger, der genereret og, vigtigst af alt, det overordnede mål af forløbet projektet ^14.

Et andet punkt bør gøres: computer programmer for transkriptomet analyse kan ikke give en 100% nøjagtighed af al udskrift rapportering. Sekventering fejl er en anden bekymring. Det er altid tilrådeligt, at ethvert differentielt udtrykt transcript identificeret ved RNA-seq valideres ved real-time PCR. TaqMan probe-baseret kemi betragtes som den gyldne standard for real time PCR. Desuden bør nyligt identificerede transskripter valideres ved Sanger metoden til DNA-sekventering inden yderligere eksperimenter.

Fejlfinding

Library Preparation: En udstrygning med høj molekylvægt genomisk DNA efter biblioteket præparationstrin kan være forårsaget af en fremførsel af den endelige kugle rensningstrin i biblioteket præparatet. Returnering bibliotekerne til den magnetiske stativ til en fuld fem minutter kan løse problemet. Hvis ikke, kan problemet skyldes ufuldstændig opsplitning af RNA i de første trin af biblioteket forberedelse. Dette kan forekomme, hvis lav-kvalitet RNA anvendes eller hvis protokollen ikke følges nøjagtigt. For eksempel ændring af inkubationstider eller temperatur, tilsætning af reagenser i forkert rækkefølge eller standse mellem fragmentering og syntesen af den første streng af cDNA. Hvis vender tilbage bibliotekerne til det magnetiske stativ ikke fjerner den høje MW-DNA, er det tilrådeligt at gentage biblioteket præparat med friske RNA-prøver.

Lav intensitet: Hvis den første cyklus intensitet er lavere end forventet, er det muligt, at primerne ikke hybridiserer til klyngerne korrekt under det sidste trin af klynge generation eller strømningscellen blev opbevaret for længe mellem klyngedannelse og starten af sekventering kører. I dette tilfælde bør en primer rehybridisering udføres under anvendelse af en primer rehyb kit fra Illumina. Oftest denne rehyb løser intensitet spørgsmål og kørslen kan påbegyndes i løbet af uden problemer. Hvis der efter et rehyb af intensiteten stadig er lav, kan problemet væremed bibliotekerne eller sekvensen ved syntese (SBS) reagenser og Illumina teknisk service bør kontaktes for yderligere fejlfinding. Hvis den første Reads intensiteter er gode, men intensiteterne er lave efter turn rundt, kan en primer rehyb af den anden læste primer være nødvendig. Dette udføres på sekventering instrument og Illumina tekniske tjeneste skal kontaktes for proceduren.

Høj udfasning / prephasing: Hvis højere end normalt udfasning eller prephasing observeres, en mulig årsag er forurening af andre SBS reagenser med spaltning buffer. Under de SBS fremstillingstrin, er det vigtigt at håndtere spaltning buffer sidste og skifte handsker mellem håndteringen af spaltning buffer, og alle andre reagenser. Hvis spaltning buffer er mistanke om kontaminering, bør en primer rehyb af flowcellen skal udføres, og nye SBS reagenser skal være forberedt. Alternativt kunne der være forurening i de strækninger i det inst RUMENT. Hvis dette er mistanke bør instrumentet underkastes en vedligeholdelses vask (en vask med vand efterfulgt af en vask NaOH, efterfulgt af en endelig vask med vand), bør en primer rehyb udføres på flowcellen og nye SBS reagenser skal fremstilles. Hvis udfasning / prephasing værdier er moderat høj (-0,5), kan kørslen fortsættes indtil de Q30 scoringer og klynger passerer filter beregnes. Disse niveauer kan stadig være i acceptable grænser, selv med høj udfasning og / eller prephasing.

Generaliseres af denne protokol

Selv om det er specifik for Illumina HiScanSQ, denne protokol finder anvendelse på nogen af HiSeq familien eller Genome Analyzer II af Illumina instrumenter ( www.illumina.com ) med mindre modifikationer af klyngen generation trin og sekventering reagenser. Andre næste generation DNA-sekventering platforme såsom den faste serie ("_blank"> Www.lifetechnologies.com), GS-systemer ( www.454.com er) samt nogle nye nyere systemer også anvendes i forbindelse med RNA-seq ^11. Selv om deres bibliotek konstruktion og sequencing procedurer kan være en smule anderledes, RNA-håndtering tips, dataanalysen dele (nedstrøms for de CASAVA trin) og validering af RT-PCR præsenteret i denne protokol kan være af referenceværdi til deres RNA-seq applikationer .

Det skal også understreges, at denne protokol er specifik for RNA-seq på et tidspunkt af thrombin-behandlede HMVEC-LBL-celler, men kunne let tilpasses til en multi-tidspunkt eller de undersøgelser i andre celler, væv behandlet med forskellige stimuli eller hæmmere eller sammenligninger af transcriptomes i celler eller væv mellem en sund tilstand og en sygdomstilstand.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Ingen interessekonflikter erklæret.

Acknowledgments

Forfatterne vil gerne takke Dr. Stephen Kingsmore og Pediatric Genome Medicine Center på Børns Mercy Hospitaler og klinikker for brugen af deres computing klynger for vores dataanalyse, Illumina mark service team (Elizabeth Boyer, Scott Cook og Mark Cook) og teknisk konsulent team for deres hurtige svar og nyttige forslag om driften af den næste generation DNA-sekventering instrument, HiScanSQ, og datakvalitet analyse. Dette arbejde blev støttet delvist af National Institutes of Health Grant HL080042 (til SQY) og opstart fond og begavelse af Børns Mercy Hospitaler og klinikker, University of Missouri i Kansas City (til SQY).

Materials

Name	Company	Catalog Number	Comments
Human Lung Microvascular Endothelial Cells	Lonza	CC-2815
Lonza, Bullet Kit	Lonza	CC-3202	Contains EGM-2, FBS, growth factors and antibiotics
Thrombin	Sigma	T4393
Ambion mirVana Kit	Life Technologies	AM 1560
RNase-Zap	Life Technologies	AM9782
Experion StdSens RNA	Bio-Rad	700-7103
TruSeq RNA Preparation Kit	Illumina	FC-122-1001
AMPureXP Beads	Beckman Coulter	A63881
Superscript Reverse Transcriptase II	Life Technologies	18064-014
Experion DNA 1K	Bio-Rad	700-7107
QuantiTect SyberGreen	Qiagen	204163
PE Cluster Generation Kit	Illumina	PE-401-3001
PhiX Control Kit	Illumina	FC110-301
200 Cycle SBS Kit	Illumina	FC-401-3001
HiScanSQ*	Illumina	SY-103-2001
cBot	Illumina	SY-301-2002
qPCR machine - Viia7	Life Technologies	Model #VIIA7 / Equipment #10631261	Or equivalent
Experion System	Bio Rad	7007001	Bioanalyzer is an alternative system
Spectrophotometer	Bio-Tek	Epoch Microplate Spectrophotometer	Or equivalent
Centrifuge - Sorvall Legend XTR	Thermo Scientific	75004521	Or equivalent
Magnetic stand	Life Technologies	AM10027
96-well thermocycler	General Lab Supplier
Table 3. List of Key Reagents and Major Equipment. *, In the video, HiSeq1000 instead of HiScanSQ was demonstrated.

DOWNLOAD MATERIALS LIST

References

Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet. 10, 57-63 (2009).
Shendure, J., Ji, H. Next-generation DNA sequencing. Nat. Biotechnol. 26, 1135-1145 (2008).
Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome Res. 18, 1509-1517 (2008).
Zhang, L. Q., et al. RNA-seq Reveals Novel Transcriptome of Genes and Their Isoforms in Human Pulmonary Microvascular Endothelial Cells Treated with Thrombin. PLoS One. 7, e31229 (2012).
Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10, R25 (2009).
Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25, 2078-2079 (2009).
Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat. Biotechnol. 28, 511-515 (2010).
Khatri, P., Sirota, M., Butte, A. J. Ten years of pathway analysis: current approaches and outstanding challenges. PLoS Comput. Biol. 8, e1002375 (2012).
Nielsen, H. Working with RNA. Methods. Mol. Biol. 703, 15-28 (2011).
Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat. Protoc. 7, 562-578 (2012).
Robertson, G., et al. De novo assembly and analysis of RNA-seq data. Nat. Methods. 7, 909-912 (2010).
Garber, M., Grabherr, M. G., Guttman, M., Trapnell, C. Computational methods for transcriptome annotation and quantification using RNA-seq. Nat. Methods. 8, 469-477 (2011).
Martin, J. A., Wang, Z. Next-generation transcriptome assembly. Nat. Rev. Genet. 12, 671-682 (2011).

Biology

RNA-seq Analyse af Transcriptomes i behandlet Thrombin-og humant kontrol Pulmonal mikrovaskulære endotelceller

Summary

Abstract

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.