Biology

RNA-seq Analys av Transcriptomes i trombin behandlade och kontroll Human pulmonell mikrovaskulära endotelceller

Published: February 13, 2013 doi: 10.3791/4393

Dilyara Cheranova¹, Margaret Gibson¹, Suman Chaudhary¹, Li Qin Zhang¹, Daniel P. Heruth¹, Dmitry N. Grigoryev¹, Shui Qing Ye¹

¹Children's Mercy Hospital and Clinics, School of Medicine, University of Missouri-Kansas City

Summary

Detta protokoll utgör en fullständig och detaljerad procedur för att tillämpa RNA-seq, en kraftfull nästa generations DNA-sekvensering teknik, profil transcriptomes i humana pulmonära mikrovaskulära endotelceller med eller utan trombin behandling. Detta protokoll är generaliserbara till olika celler eller vävnader som påverkas av olika reagenser eller sjukdomstillstånd.

Abstract

Karakteriseringen av genuttryck i celler via mätning av mRNA-nivåer är ett användbart verktyg för att bestämma hur den transkriptionella maskineriet cellen påverkas av externa signaler (t.ex. läkemedelsbehandling), eller hur celler skiljer mellan ett hälsosamt tillstånd och ett sjukdomstillstånd. Med tillkomsten och kontinuerlig förfining av nästa generations DNA-sekvensering teknik, har RNA-sekvensering (RNA-seq) blivit en alltmer populär metod för transkriptom analys att katalogisera alla arter av transkript, för att bestämma den transkriptionella strukturen för alla uttryckta gener och att kvantifiera de förändrade uttrycksnivåer av den totala uppsättningen av transkript i en given cell, vävnad eller organism ^1,2. RNA-seq successivt ersätta DNA microarrays som en föredragen metod för Transkriptomanalys eftersom det har fördelarna med profilering en komplett transkriptom, vilket ger en digital typ nollpunkt (kopia på alla transkript) och inte förlita sig på någon känd genomisk sekventielltce ^3.

Här presenterar vi en komplett och detaljerat protokoll tillämpa RNA-seq att profilera transcriptomes i mänskliga lung mikrovaskulära endotelceller med eller utan trombin behandling. Detta protokoll är baserad på vår publicerade nyligen med titeln studien "RNA-seq avslöjar Novel Transcriptome av gener och deras isoformer i mänskliga pulmonell mikrovaskulära endotelceller behandlas med trombin," ⁴ där vi framgångsrikt utfört den första kompletta transkriptom analys av humana pulmonära mikrovaskulära endotelceller behandlades med trombin med användning av RNA-seq. Det gav oerhörda resurser för ytterligare experiment för att få insikt i molekylära mekanismerna bakom trombinmedierad endoteldysfunktion i patogenesen av inflammatoriska tillstånd, cancer, diabetes och hjärt-kärlsjukdomar, och ger potentiella nya ledare för terapeutiska mål för dessa sjukdomar.

Den beskrivande texten av detta protokollär uppdelad i fyra delar. Den första delen beskriver behandlingen av humana pulmonella mikrovaskulära endotelceller med trombin och RNA-isolering, kvalitet analys och kvantifiering. Den andra delen beskriver bibliotek konstruktion och sekvensering. Den tredje delen beskriver dataanalys. Den fjärde delen beskriver en RT-PCR validering analys. Representativa resultat av flera viktiga steg visas. Användbara tips eller försiktighetsåtgärder för att öka framgång i viktiga steg finns i diskussionsavsnittet. Även detta protokoll använder humana pulmonära mikrovaskulära endotelceller behandlade med trombin, kan det vara generaliseras till profilen transcriptomes i både däggdjurs-och icke-däggdjursceller och i vävnader behandlade med olika stimuli eller inhibitorer, eller att jämföra transcriptomes i celler eller vävnader mellan ett hälsosamt tillstånd och ett sjukdomstillstånd.

Protocol

Ett flödesschema som beskriver detta protokoll visas i figur 1.

1. Behandling av celler med trombin, RNA-isolering, kvalitetsbedömning och kvantifiering av RNA

Kultur Human Lung mikrovaskulära endotelceller (HMVEC-LBL) till 90-100% konfluens i 6-brunnsplattor i EGM-2-medium med 5% FBS, tillväxtfaktorer och antibiotika (Lonza, cat # CC-3202).
Byta media till svält mediet (0% FBS) 30 minuter före behandling med trombin.
Behandla cellerna med 0,05 U / ml trombin eller lämna obehandlat som en kontroll under 6 h vid 37 ° C och 5% COj _2.
Isolera total-RNA från de behandlade och kontroll-celler med användning av Ambion mir Vana kit enligt tillverkarens instruktioner.
Bedöma kvaliteten av RNA med en Experion StdSense Eukaryotic RNA-chip enligt standarden protokollet om Experion Automated Electrophoresis Station (= "_blank"> Www.bio-rad.com).
Kvantifiera RNA med hjälp av en vanlig spektrofotometrisk metod.

2. Bibliotek Konstruktion och sekvensering

Använd 1 pg av hög kvalitet totalt RNA per prov som utgångsmaterial.
För att konstruera biblioteket, följ standardförfarandet från Illumina (protokoll # 15.008.136 Rev A). I detta protokoll innehåller mRNA val två omgångar av poly (A) utförs för att avlägsna rRNA för att minimera rRNA-sekvensering.
Bedöma kvaliteten på de bibliotek som använder en Experion DNA 1K-chip enligt standarden protokollet om Experion Automated Electrophoresis Station ( www.bio-rad.com ).
Kvantifiera biblioteket med qPCR: Använd ett bibliotek som tidigare har sekvenserats som en standardkurva och primers specifika för de ligerade adaptrar. Använda en rad utspädningar av de okända biblioteken (dvs. 1:100, 1:500 och 1:1000). Kör qPCR according till SyberGreen MM-protokollet och beräkna den ursprungliga beståndet koncentrationen av varje bibliotek.
Späd bibliotekets bestånd 10 nM och förvara vid -20 ° C tills den ska klustret en flödescell.
När du är redo att kluster en flödescell, tina CBOT reagens plattan i ett vattenbad. CBOT är ett Illumina instrument som används för att effektivisera processen klustret generationen.
Tvätta CBOT instrumentet.
Denaturera biblioteken: Kombinera 13 il 1x TE och 6 pl 10 pM bibliotek och, vid sidan av röret, tillsätt 1 pl 1 N NaOH (tillhandahållen av Illumina). Vortex, centrifugera ner, inkubera vid rumstemperatur under 5 minuter och placera de denaturerade biblioteken på is.
Späd biblioteken: Späd de denaturerade bibliotek med i förväg kyld hybridiseringsbuffert (HT1, tillhandahålls av Illumina) genom att kombinera 996 pl HT1 och 4 il denaturerat bibliotek för en slutlig koncentration av 12 pM. Placera denaturerade och utspädda bibliotek på is.
Vänd varje rad av rör i CBOT plattan,säkerställa att alla reagens tinas. Spinn ner plattan, ta bort / punktera folien tätningar och ladda upp på CBOT.
Alikvotera 120 ul av de utspädda, denaturerade bibliotek till en remsa rör märkta 1-8. Lägg 1,2 pl utspätt, denaturerad PhiX kontroll bibliotek (från Illumina) i varje rör som spik-kontroll. Vortex och spinn ner rören och ladda dem på CBOT i rätt riktning (rör # 1 till höger).
Ladda en flödescell och grenrör på CBOT.
Fyll i flödet kontrollera och börja klustring sikt.
Efter körningen är klar, se reagens leverans i alla körfält. Anteckna eventuella avvikelser. Antingen startar sekvensering körningen omedelbart eller lagra flödescellen i medföljande röret vid 4 ° C.
Tina sekvensering genom syntes (SBS, Illumina) reagens.
Ladda reagenser till rätt fläckar på reagens brickor, se till att inte röra de andra reagensen efter beröring av klyvning mix.
Använda en nejn-sekvensering flödescell (dvs en som sekvenserades tidigare), prime raderna reagens två gånger.
Rengör sekvensering flödescellen med 70% EtOH och Kimwipes, följt av 70% EtOH och linspapper. Inspektera flödescellen för alla ränder. Re-rengör den vid behov.
Ladda flödescellen på sekvenseraren och utföra ett flöde kontrollera att tätningen mellan grenrören och flödescellen är tät.
Starta sekvensering sikt.
Bedöma kvaliteten mått (t.ex. kluster densitet, kluster passerar filtret, Q30, intensitet) när de blir tillgängliga under körningen.
Övervaka intensitet hela körningen.
Efter 101 cykler slutförts utför vändningen kemi för att slutföra den andra läser: Tina de parade slut reagenser och den andra läsning Införlivande Buffer (ICB, en komponent i SBS reagenser, Illumina) och ladda reagensen.
Fortsätt sekvensering sikt bedömer ^{2: a} läsa intensitet, Q30 ennd andra kvalitetsmått som kör fortskrider.

3. Dataanalys

Använd den senaste versionen av CASAVA (Illumina, för närvarande 1.8.2) för att konvertera filerna bas samtal (. BCL)-filer till. Fastq filer, inställning fastq-cluster-räkna till 0 för att säkerställa skapandet av en gemensam fastq fil för varje prov . Packa upp fastq filer för nedströms analys.
Utför parade slut inriktning med de senaste versionerna av TopHat (1.4.1) ^5, som riktar RNA-seq läser till däggdjur storlek genomet med hjälp av ultra high-throughput kort läsning Aligner (Bowtie, 0.12.7) ⁶ och SAMtools (0,1. 17) ^7. SAMtools genomför olika verktyg för efterbehandling anpassningar i SAM-format. Hänvisningen mänskliga transkriptom kan laddas ner från iGenomes ( www.illumina.com ). I löpande TopHat använde vi alla standardinställningarna parameterinställningar inklusive bibliotekets typ alternativet som fr-unstranded (standard).
Ossning av programmet CuffDiff, en del av manschettknappar (1.3.0) ⁸ programpaket, jämföra trombin-behandlade celler med kontrollerna cellerna att sålla ut de differentiellt uttryckta gentranskript i fd bygger på den mänskliga referens transkriptom. Denna jämförelse detekterar det differentiella uttrycket av kända transkript. Använd Microsoft Excel för att visualisera resultatet i tabellform. I löpande Manschettknappar program använde vi alla standardinställningar parametrar. Dessa gentranskript med FPKM <0,05 och p> 0,05 filtreras ut.
För att upptäcka nya isoformer, köra manschettknappar utan en referens transkriptom. Jämför filerna prov avskrift med referensläkemedlet genomet med Cuffcompare och testa differentiella uttrycket med Cuffdiff med de kombinerade filer trombin avskrift som referens genomet för en analys och de kombinerade styrfiler avskrift som referens genomet för en andra analys. Använd Microsoft Excel för att visualisera resultatet i tabellform. Återigen, those gentranskript med FPKM <0,05 och p> 0,05 filtreras ut. Efter detta steg kan utredarna välja att ladda upp en lista över nyanmälda avskrifter till UCSC Genome Browser webbplats ( http://genome.ucsc.edu/ ) för att verifiera deras giltighet genom en manuell inspektion.
Överlämna förteckningar över differentiellt uttryckta gener till Uppfinningsrikedom Pathway Analysis (IPA, www.ingenuity.com ) för karakterisering av generna och vägar som påverkas av trombin behandling. I detta steg kan utredarna välja att använda bältet ( http://compbio.mit.edu/cummeRbund/ ), en R paket som är utformat för att hjälpa och förenkla uppgiften att analysera Manschettknappar RNA-seq utgång, för att hantera, visualisera och integrera alla data som produceras av en Cuffdiff analys.

4. Validering av RNA-seq Resultat från kvantitativ realtids--Polymerase Chain Reaction (QRT-PCR)

Utför totalt RNA isolering från kontroll och trombin-behandlade HMVEC-Lbl celler, RNA-utvärdering och RNA-kvantifiering beskrivs i steg från 1,4 till 1,6.
Generera kompletterande DNA från 1 ng totalt RNA för varje prov med Superscript III Första strängsyntes System RT Kit, efter tillverkarens instruktioner (Invitrogen, 18.080-051).
Utför QRT-PCR-analys på en Applied Biosystems VIIa 7 Real-Time PCR System med TaqMan-analysen-on-Demand utformade oligonukleotider för detektion av CUGBP, Elav-likefamilymember1 (CELF1, Hs00198069_m1), Fanconianemia, complementationgroupD2 (FANDCD2, Hs00276992_m1), TNFreceptor -associerad faktor 1 (TRAF1, Hs01090170_m1), och β-aktin (ACTB, Hs99999903_m1). Varje prov hade en mall motsvarande 5 ng av totalt RNA. Mät kvantifiering med DDCt metoden och normalisera till β-aktin. Varje analys utfördes över åtminstone tre biologiska replikat.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

För Steg 1: 28S: 18s förhållande traditionellt används som en indikator på RNA-nedbrytning. Helst ska 28S toppen har ungefär dubbelt området av 18s bandet (ett förhållande av 2), är emellertid denna ideala förhållandet ofta inte ses i praktiken. Vidare, 28s: kan 18s förhållanden erhållna från spektrofotometriska metoder underskattar mängden nedbrytning av RNA. För att mer exakt kvantifiera nedbrytningen, och därför kvaliteten på RNA-provet, beräknar Experion systemet en RNA-kvalitetsindikator (RQI) nummer. Den RQI algoritmen jämför elektroferogram av RNA-prover till data från en serie av standardiserade, nedbrutna RNA-prover och automatiskt returnerar ett tal mellan 10 (intakt RNA) och 1 (skadad RNA). RNA kvalitet bör ha en RQI av minst 7, helst högre än 8. Figur 2 visar Experion resultat med en hög kvalitet RNA-prov med en RQI av 8,4.

FörSteg 2: Biblioteken bör ha ett brett band vid ca 250-300 bp Figur 3 visar Experion resultat av en hög kvalitet bibliotek Figur 4 visar qPCR resultaten av standardkurva prover och ett okänt prov (visas i mörkblått)... Framsteg och kvalitet sekvensering körningen bör kontinuerligt observeras under hela körningen Figur 5 visar lämplig kluster densitet under den första cykeln avbildning steg,. Detta är den första indikationen på körningen kvalitet. Kluster bör vara ljusa och fokuserad. Figur 6 visar First Base rapporten genereras efter den första cykeln är klar. Det är viktigt att utvärdera den beräknade kluster densitet, intensitetsnivåer och fokus kvalitet på denna punkt. Nästa kvalitet kontrollpunkt efter cykel 4, visas i figur 7. Detta visar den absoluta klustret densitet för varje bana. Klustret densitet bör inte vara över 850 k / mm ^2. Efter cykel 13,fasa (när en bas inte tillsätts under en cykel) och prephasing (när två baser tillsättas under en cykel) statistik beräknas, såsom visas i fig. 8. Typiska siffror är mellan 0,1 och 0,25. Den stora kvalitetsbedömning är möjlig efter cykel 24, när flera kvalitetsmått beräknas. Den procent av läser över Q30, som visas i figur 9, är ett mått på förtroendet för basen ringer. En läsning med en Q poäng på 30 innebär att det finns en 1 i 1.000 chans att bas samtal är fel. Q poäng kommer att minska när körningen fortskrider, men bör börja med mer än 95% av den läser uppfylla eller överträffa Q30. Kluster som passerar filtret (PF), som visas i figur 10, är de kluster som de faktiska sekvensdata kommer att vidtas. Helst bör det vara över 85%. Klustret PF baseras på många faktorer, bland annat utfasning, prephasing, intensitet och Q30. Det kommer inte att förändras i takt med körningen fortskrider. Den procentuella linje (

För Steg 3: Tabell 1 visar uttryckta gener och isoformer i både kontroll-och trombin-behandlade humana pulmonära mikrovaskulära endotelceller. Särskilt finns det cirka 26.000 nya upptäckta isoformer, vilket illustrerar styrkan i RNA-seq-det kan identifiera okända RNA, alternativt splitsade utskrifter och alternativa promotor användning som inte är detekterbar med microarray teknik ^3. RNA-seq kan också mäta mindre rikliga avskrifter som felaktigt har kvantifierade eller inte upptäckts av mikroarrayer. Figur 12 och Tabell 2 visas differentially uttryckte gener i trombin-signaleringsvägen. Detta är ett exempel på den tredje generationens kunskapsbas driven vägen analys ^9: pathway topologi strategier, med Uppfinningsrikedom programvara Pathway Analysis. Det visar att en sex timmar trombin behandling signifikant upp-reglerar trombinreceptom Par 4 och nedreglerar trombinreceptom Par 3 medan det inte finns någon förändring i uttrycket av trombinreceptom Par 1. Uttryck av NFkB1, NF KB2 och Src är också avsevärt uppregleras. Några av Rho family gener (Rho B, C, F och G) är uppregleras medan andra (Rho J, Q, T1, U och V) är nedreglerade (tabell 4). Myosin lätt kedja-gen 9 (MYL9) uppregleras medan MYL12B är nedregleras. Expression av andra gener är antingen ned-reglerad eller ej påverkas.

För Steg 4: För att validera RNA-seq resultat med en alternativ metod, genomförde vi en QRT-PCR experiment för att analysera tre diffehyra gener (figur 13). I RNA-seq data var TRAF1 uppregleras av 7,96 faldigt; CELF1 var nedregleras av 1,16-faldigt, och FANCD2 var nedregleras av 1,70 gånger. I QRT-PCR-data, dessa motsvarande tal är 7,25 gånger, -1,15 gånger och -2,07 faldigt. Resultaten av dessa tre gener analyserades genom RNA-artiklar och QRT-PCR är i god överensstämmelse, vilket bekräftar de RNA-seq resultat.

Gener
	Kontroll	Trombin
Totala gener som uttrycks	16.636	16.357
Kontroll bara	783
Trombin Endast		504
Uppreglerad (2-faldig eller större skillnad)		152
Nedregleras (2-faldigt eller greater skillnad)		2.190
Kända Isoformer
	Kontroll	Trombin
Totalt kända isoformer Uttryckt	26.807	26.300
Kontroll bara	1.492
Trombin Endast		985
Uppreglerad (2-faldig eller större skillnad)		480
Nedregleras (2-faldig eller större skillnad)		3.574
Nya Isoformer
	Kontroll	Trombin
Totalt Nya Isoformer uttryckt	25.880	25.886
Kontroll bara	418
Trombin Endast		424
Uppreglerad (2-faldig eller större skillnad)		1.775
Nedregleras (2-faldig eller större skillnad)		12.202

Tabell 1. Gene / Isoform Expression Sammanfattning *. Tabellen listar gener, kända isoformer och isoformer nya uttryck i kontroll-och trombin-behandlade HMVEC-Lbl celler. Den faldig förändring är förhållandet mellan trombin FragmentsPerKilobase av fragment avskrift perMillion mappas (FPKM) för att kontrollera FPKM. Dessa gener, kända isoformer och nya isoformer med 2-faldig eller större skillnad mellan två grupper har statistiskt olika expressionsnivåer (bestämt efter Benjamini-Hochberg korrigering). * Denna tabell återges från tabell 2 i referens 4.

Ned-reglerade gener
Gene Symbol	Övergripande faldig förändring	Medlemmar	Individuell faldig förändring	q_value **	FPKM Kontroll	FPKM Trombin
PLC	-2,49
		PLCB1	-2,97	0	6,75585	2,27611
		PLCB2	-1,32	0.00183634	1,80892	1,36957
		PLCB4	-10,04	6.28386E-14	0.682668	0,0679.837
		PLCL1	-2,53	5.26728E-09	0.602879	0.238017
Gaq	-1,87
		GNAQ	-1,87	0	24,0907	12,8996
Gai	-1,56
		GNAI1	-1,86	0	9,88417	5,31795
		GNAI3	-1,49	0	35,7592	24,0198
PKC			-2,15
		PRKCE	-1,65	0	9,36364	5,67305
		PRKCI	-2,14	0	6,63566	3,09818
		PRKD3	-2,61	0	16,0215	6,12878
IP3R	-2,60
		ITPR1	-1,39	0,000018734	1,51592	1,09009
		ITPR2	-3,19	0	7,23283	2,26944
CREB	-2,36
		CREB1	-2,36	0	5,19117	2,2004
GATA	-2,33
		GATA3	-2,33	0.0228108	0.716773	0.307131
TBP	-1,35
		TBP	-1,35	2.66E-05	8,48689	6,30476
G-protein-alfa	-1,64
		GNA14	-1,49	0,000122496	2,78076	1,86573
		GNAI1	-1,86	0	9,88417	5,31795
		GNAI3	-1,49	0	35,7592	24,0198
		GNAQ	-1,87	0	24,0907	12,8996
PAR3	-1,87
		F2RL2	-1,87	1.02474E-06	1,51286	0.810286
SOS1
	SOS1	-2,27	0	8,94353	3,94679
Ras	-1,69
		KRAS	-2,03	0	11,2766	5,5659
		NRAS	-1,61	0	38,0874	23,6491
AKT	-1,77
		AKT3	-1,77	0	15,8228	8,94223
MLCP	-2,38
		PPP1CB	-2,10	0	39,585	18,8199
		PPP1R12A	-3,56	0	15,2274	4,27516
		PPP1R12B	-2,66	5.28466E-13	1,92123	0.722188
FAK	-1,31
		PTK2	-1,31	4.3856E-10	39,7935	30,3044
p70 S6K
		RPS6KB1	-1,99	0	8,46312
VAGGA	-3,68
		ROCK1	-3,54	0	19,5921	5,53112
		ROCK2	-3,86	0	16,0054	4,14759
CAMK	-1,17
		CAMK1	1,30	0,000255587	7,90794	10,296
		CAMK2D	-1,74	2.22911E-12	11,4497	6,56804
		CAMK4	-2,58	0,000619045	0,62714	0.243277
Upp-reglerade gener
Symbol	Övergripande faldig förändring	Medlemmar	Individuell faldig förändring	q_value **	FPKM Kontroll	FPKM Trombin
PAR4	1,59
		F2RL3	1,59	9.19043E-13	4,99867	7,9253
Src	1,47
		Src	1,47	0	14,1085	20,675
NF-kB	1,65
		NFKB1	1,66	0	19,5113	32,3457
		NFKB2	2,02	0	28,7563	58,1293
		RELA	1,45	0	55,3482	80,28
Partiella Up-/Partial nedregleras gener
Symbol	Övergripande faldig förändring	Medlemmar	Individuell faldig förändring	q_value **	FPKM Kontroll	FPKM Trombin
G-protein-gamMA	1,22
		GNG10	-1,34	2.17216E-08	27,192	20,2206
		GNG11	1,31	5.66209E-05	770,922	1011,05
		GNG12	-1,44	5.11591E-13	112,397	78,3023
		GNG2	2,43	6.38453E-09	0.465705	1,13132
G-protein-beta	1,27
		GNB2	1,36	1.91268E-10	137,786	187,43
	GNB3	-2,69	4.71259E-11	2,58703	0.962504
		GNB4	-1,61	0	15,8275	9,85484
Rho GEF	-1,16
		ARHGEF12	-1,67	0	30,6424	18,3015
		ARHGEF2	1,33	5.80478E-08	27,6288	36,758
		ARHGEF3	-1,48	0	20,3279	13,7813
		ARHGEF6	-2,08	0	2,67944	1,28635
		ARHGEF9	-1,54	0.00469498	1,56367	1,0159
PI3K	-1,80
		Bankomat	-6,84	0	4,98972	0.729483
		PIK3C2A	-5,09	0	17,7894	3,49234
		PIK3C3	-1,49	4.66294E-15	12,6504	8,50852
		PIK3CA	-3,14	0	16,8398	5,36228
		PIK3CB	-1,36	8.4357E-09	9,68516	7,12129
		PIK3CD	1,86	0	5,6579	10,5507
		PIK3CG	-1,76	2.32945E-10	1,86962	1,06419
		PIK3R1	-1,79	0	5,48118	3,06256
		PIK3R3	-1,59	1.50915E-05	5,24549	3,30763
		PIK3R4	-1,40	7.18425E-12	8,34176	5,97942
Rho	1,19
		RHOB	1,31	9.48429E-06	232,232	304,587
		RHOC	1,38	458,267	630,235
		RHOF	1,65	0	8,29676	13,7268
		RHOG	1,40	1.02141E-14	58,6003	82,0172
		RHOJ	-1,57	0	127,446	80,9317
		RHOQ	-1,52	0	16,4802	10,8122
		RHOT1	-1,96	3.00071E-12	8,48834	4,33755
		RHOU	-1,54	0.00184367	0.900141	0.586092
		RHOV	-3,32	0.0056467 1	0.413912	0.124591
		RND3	-1,95	0	58,0564	29,7075
MLC	-1,06
		MYL12B	-1,43	4.87832E-11	872,075	608,472
		MYL9	1,48	0	202,636	299,559

Tabell 2. Differentiellt uttryckta gener och isoformer i trombin signalvägen *. *, Denna tabell återges i tabell S4 i referens 4 med en mindre modifiering. **, Q-värde, en falsk upptäckt justerad p-värde.

93/4393fig1.jpg "alt =" Bild 1 "/>
Figur 1. Flödesschema av protokollet för RNA-seq profilering av trombin-medierad transkriptom i mänskliga lung mikrovaskulära endotelceller. Först behandla celler och isolera och kvantifiera RNA. Förbered bibliotek från de högkvalitativa RNA och bedöma deras koncentration (via qPCR) och kvalitet (via en bioanalyzer), sedan kluster på en flödescell. Starta sekvensering kör och analysera kvaliteten på körningen hela. De stora kvalitet kontrollpunkter är cyklerna 1, 4, 13 och 24. Med hjälp av CASAVA, konvertera bcl filer till fastq filer och sedan rikta dem till genomet med TopHat. Identifiera kända och okända isoformer med Manschettknappar och bestämma differentiellt uttryck med CuffDiff. Visa utdatafiler i Excel och filtrera bort gener som har ett uttryck nivå mindre än 0,05 FPKM eller ett p-värde större än 0,05. Skicka resterande gener till Uppfinningsrikedom Pathway Analys för ytterligare information om genfunktioner och vägar enffected av trombin behandling. Vanligtvis utvalda uppsättningen differentiellt uttryckta gener valideras av en alternativ metod som QRT-PCR.

Figur 2
Figur 2. Ett representativt RNA-prov med en RQI av 8,4 såsom analyseras av Experion Automatiserad Electrophoresis station A) individuella spår av hög kvalitet RNA -.. X-axeln visar tid och y-axeln visar fluorescenssignal B) Den virtuella bilden gelén av hög kvalitet RNA-prov. Intensiteten i 28S toppen är större än 18S topp och att ingen kontaminering ses. Båda banden är skarpa och definierade. Klicka här för att se större bild .

Figur 3. Hög kvalitet bibliotek framställt från RNA analyseras genom Experion Automatiserad Electrophoresis Station En bred topp mellan 250 och 300 bp detekteras och ingen DNA med hög molekylvikt (kontaminerande DNA) observeras) En Den individuella spår av en hög kvalitet bibliotek.. - x-axeln visar tid och y-axeln visar fluorescenssignal B) Den virtuella gelén bilden av hög kvalitet bibliotek. En bred topp mellan 250 och 300 bp upptäcks och ingen hög molekylvikt DNA (kontaminerande DNA) observeras. Klicka här för att se större bild .

Figur 4
<strong> Figur 4. qPCR resultat med SyberGreen och primrar specifika för Illumina ligerade adaptrar. En tidigare samlade biblioteket används som standardkurva för att bestämma den optimala koncentrationen klustring för den nyligen beredda biblioteket. Utspädningen av den okända biblioteket omfattas standardkurvan koncentrationerna. Standardkurvan Proverna åtalats av pilarna och det okända provet är mörkblå och även indikeras med en pil.

Figur 5
Figur 5. . Lämplig kluster densitet under den första cykeln imaging steget Grupperna är tydliga, fokuserad och ljus A) Bas A,. B) Bas C, C) Bas G, D) Bas T.

<td> 19.892

Metric	Bana 1		Bana 3	Bana 4	Bana 5	Bana 6	Bana 7	Spår 8
Kluster Densitet (k / mm ²⁾	420,94	412,95	410,81	408,54	416,71	416,56	410,02	411,84
En Intensitet	25870,5	23.886	23891,38	23735,83	23949,38	24933,08	24305,79	23950,29
C Intensitet	21559,62	19822,33	19759,33	19.472	19954,21	20611,75	19438,29
G Intensitet	13619,46	11756,67	11486,44	10498,38	12186,62	12195,5	11826,88	11010,5
T Intensitet	19402,67	17663,79	17854,42	17353,75	17545,54	18060,67	18457,92	17397,12
En fokusmåttet	68,2	67,46	67,67	67,75	67,41	67,43	67,63	67,05
C fokusmått	67,93	67,33	67,56	67,66	67,33	67,39	67,46	66,9
G fokusmått	65,4	64,14	63,98	63,92	63,29	63,41	63,47	63,74
T fokusmått	66,45	65,57	65,5	65,49	65,03	65,23	65,57	65,59

Figur 6. Första Base rapporten genereras efter den första cykeln är klar. Klustret densitet (även underskattas i detta skede) är lämplig. Intensiteterna ser bra (10,000-26,000, med G har den lägsta intensitet). De fokusmått är också lämpligt, faller omkring 65-70, även om högre värden är också lämpligt.

g7.jpg "alt =" Bild 7 "/>
Figur 7. Klustret densitet beräknad efter cykel 4 Klustret densitet är lägre än 850 K / mm ² och även i alla spår A) tabellform,... B) diagramform Klicka här för att se större bild .

Figur 8
Figur 8. Utfasning (inte tillsätta en bas under en cykel) och Pre-fasa (lägga två baser under en cykel). Båda värdena på 0,25 eller lägre, vilket indikerar lämpliga fasa / före fasa nivåer. A) fasa och före avveckling numeriska värden . B) att fasa värden i grafisk form. C) före fasa värden i grafisk form. Clic k här för att visa större bild.

Figur 9
Figur 9. De olika representationer av Q30 poäng efter cykel 24. En poäng på 30 eller högre indikerar en 1 i 1.000 chans att bas samtal är fel. Omkring 90% av Q poäng är över 30 A) tabellform (Q30 poäng här är från hela körningen genom cykel 24),. B) Q30 poäng genom cykel. Varje stapel representerar fördelningen av läser faller på Q30 eller högre för just cykel. C) Q30 poäng distributioner genom cykel 24. Fördelningen av Q poäng på kumulativ basis genom cykel 24. Q poäng är på x-axeln och miljontals läsningar är på y-axeln. Läser med Q30 över 30 representeras i grönt.oad/4393/4393fig9large.jpg "target =" _blank "> Klicka här för att se större bild.

Figur 10. De olika representationer av kluster passerar filtret. Kluster passerar filtret baseras på flera parametrar, bland annat Q30, intensitet och gradvis / pre-utfasning. Minst 85% av kluster passerar filtret i varje bana A) tabellform,. B) grafisk form, blå rutor representerar det totala antalet kluster, gröna rutor representerar kluster passerar filter. Klicka här för att se större bild .

Figur 11. . Den procent av de kluster anpassas till PhiX genomet Cirka 0,5% av kluster anpassa till PhiX genomet, lämplig för den mängd PhiX spetsades proverna A) tabellform,.. B) diagramform Klicka här för att se större bild .

Figur 12. Gener differentiellt uttryckta genom trombin behandling av HMVEC-Lbl i Trombin signaleringsvägen. Trombin signalväg konstruerades genom uppfinningsrikedom. I vägen anger röd färg upp-reglerade gener ⁽³ 1,3 gånger) och gröna ned-reglerade gener ( tabell 2. Denna siffra återges i figur 4 i referens 4. Klicka här för att se större bild

Figur 13. QRT-PCR validering av tre differentiellt uttryckta gener från trombin-behandlade HMVEC-LBL-RNA-seq data. QRT-PCR utfördes enligt beskrivningen i protokollet. Vik förändringar bestäms av de relativa Ct-värdena för TaqMan Gene Expression analys för CUGBP, Elav-liknande familjemedlem 1 (CELF1), Fanconis anemi, komplementering grupp D2 (FANCD2) och TNF receptor-associerat faktor 1 (TRAF1)jämfördes med de som detekteras av RNA-seq. Replikat (n = 4) i varje prov kördes och Ct-värdena beräknas. Samtliga Ct-värdena normaliserades till β-aktin. Felet staplarna visar spännvidden av vecket förändring bestäms av data Assist programvara. p <0,05 ansågs statistiskt signifikant i relativa faldiga förändringar mellan trombin-treat-och kontrollgrupp av både RNA-artiklar samt QRT-PCR-analyser. MRNA-nivån i kontrollgrupper av varje analys godtyckligt satt som en, som inte visas. *, P <0,05; **, p <0,01. Denna siffra reproduceras från figur 6 i referens 4.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Viktiga steg

RNA Hantering: RNaser försämras även de mest högkvalitativa RNA, därför måste man vara försiktig under isoleringen, lagring och användning av RNA ^10. Handskar är alltid användas för att undvika kontaminering av RNaser finns på mänskliga händer. Handskar ska bytas ofta, särskilt efter att röra hud, dörrhandtag och andra gemensamma ytor. En uppsättning pipetter bör ägnas enbart till RNA arbete och alla tips och rör bör RNas-fri. RNA-isolering och nedströms ansökan skall utföras i lågtrafikerade områden som rutinmässigt saneras med en produkt som RNas-Zap. Nedbrytning kan också ske med upprepade frysnings-upptiningscykler. Dessa kan minimeras genom alikvotering RNA för nedströmstillämpningar omedelbart efter isolering. Alternativt kan cDNA göras för efterföljande program som QRT-PCR direkt efter isolering. RNA ska förvaras vid -80 ° C och hölls på is under användning. Det är också important att grundligt tina och vortexblanda RNA-prov före och under användning.

Utgångspunkten kvalitet RNA är avgörande för framgången av detta protokoll. Användning av skadade eller på annat sätt låg kvalitet RNA kan orsaka biblioteket förberedelse misslyckas eller leda till låg avkastning som kommer att vara otillräckliga för sekvensering. Även om tillräckligt bibliotek kan göras från nedbrutna eller låg kvalitet RNA, kommer det inte korrekt representera transkripten närvarande i provet, vilket resulterar i felaktiga kvantifiering av uttryck. Dessutom kan alla unremoved genomisk DNA under RNA-isolering orsaka en överskattning av mängden RNA som används i protokollet, men om ett belopp (t.ex. 1-2 g) i mitten av det föreslagna området (0,1-4 g) används, kommer den faktiska mängden RNA vara tillräckligt för protokollet. Dessutom är varje genomiskt DNA inte troligt att plockas upp av oligo (DT) primer baserat bibliotek konstruktion i standard Illumina protokollet och därför inte kommer att orsaka efterföljande ISSderingar med uttryckta nivåer mRNA-transkript. Kvantifiering av utgångs-RNA med vanliga spektrofotometriska avläsningar bör vara tillräckligt och det finns inget behov av att använda mycket noggranna kvantitativa metoder såsom RiboGreen eftersom biblioteken kommer noggrant kvantifieras efter beredning av qPCR och Gene nivåer uttryck normaliseras i förhållande till det totala antalet läser under dataanalysen steg.

Bibliotek Kvantifiering. Noggrann kvantifiering av bibliotek är avgörande för rätt generationen kluster. Endast DNA-molekyler med framgång ligerade adaptrar kommer att bilda kluster. Spektrofotometriska avläsningar kommer inte att skilja mellan DNA med adaptrar och DNA utan, vilket kommer att resultera i en överskattning av koncentrationen av biblioteket och i slutändan leda till under-gruppering av flödescellen. Mängden DNA utan ligerade adaptrar skiljer sig från biblioteket till biblioteket, även om samma RNA användes som startning material, så kan man inte exakt anta att en vanlig del av den spektrofotometriska behandlingen är DNA med ligerade adaptrar. Utföra qPCR med primrar specifika för adaptrarna kommer att detektera endast de DNA-molekyler med adaptrar framgångsrikt ligerade till båda ändarna av molekylen. Detta möjliggör en absolut kvantifiering av biblioteken och i sin tur en korrekt kluster densitet. Bedömning av bibliotek med ett Experion instrument eller en bioanalyzer är också viktigt. Detta möjliggör en visualisering av storleksordningen av biblioteket, vilket är viktigt under stegen dataanalys och säkerställer att det inte finns någon förorening som kan störa kluster generation.

Dataanalys. På detta protokoll tillämpade vi TopHat att anpassa RNA-seq läser människors referens transkriptom och manschettknappar att montera avskrifter, uppskatta sina abundances och test för differentiellt uttryck i trombin-behandlade HMVEC-Lbl celler. TopHat och Manschettknappar är two populära verktyg, och de är gratis, öppen källkod ^11. En nyligen genomförd studie visade att Manschettknappar hade en hög sensitivitet och specificitet för att upptäcka tidigare kommenterade introner ^12. Däremot itu TopHat och Manschettknappar inte alla tillämpningar av RNA-seq inte heller de enda verktyg för RNA-seq-analys ^11. TopHat och Manschettknappar kräver sekvenserade referens transkriptom eller genom. De är särskilt lämpliga för analys av RNA-seq data som genererats från antingen Illumina eller fast sekvensering maskiner men inte 454 eller den klassiska kapillära elektrofores sekvensering plattform. Användare som arbetar utan sekvenserade referens genomet kan överväga att utföra de novo transkriptom montering med en av flera verktyg som Trinity ( http://trinityrnaseq.sourceforge.net/ ), Trans-Abyss ( http://www.bcgsc.ca/platform/bioinfo/software/trans-abyss/releases/0.2) eller Oaser ( http://www.ebi.ac.uk/ ~ zerbino / oaser / ). Många alternativa Transkriptomanalys program finns nu. För en genomgång av olika program, kan läsarna vill läsa studien av Garber et al. ¹³ och översynen av Martin och Wang ^14, som beskriver de komparativa fördelar och nackdelar och de teoretiska överväganden de flesta närvarande och vanliga program. Valet av Transkriptomanalys strategier (referens-baserade strategi de novo strategi och kombinerad strategi) och program beror på många faktorer, inklusive förekomsten eller fullständigheten av en referens genom, tillgången på sekvensering och datorresurser vilken typ av uppgifter som genereras och, viktigast av allt, det övergripande målet för sekvensering projektet ^14.

En annan punkt bör göras: computer program för transkriptom analys kan inte ge en 100% noggrannhet av alla transkript rapportering. Sekvensering fel är en annan fråga. Det är alltid klokt att varje differentiellt uttryckta transkript identifieras med RNA-seq godkännas av realtids-PCR. TaqMan sond-baserad kemi anses vara den gyllene standarden för realtids-PCR. Dessutom bör nyligen identifierade avskrifter skall godkännas av Sånger-metoden för DNA-sekvensering innan ytterligare experiment.

Felsökning

Bibliotek Förberedelser: En utstryk av hög molekylvikt genomisk DNA efter bibliotekets framställningsstegen kan orsakas av en överföring från det slutliga pärlan reningssteget under bibliotekets beredningen. Återvänder biblioteken till den magnetiska monter i hela fem minuter kan lösa problemet. Om inte, kan frågan bero på ofullständig fragmentering av RNA under de första stegen av biblioteket beredningen. Detta kan inträffa om låg-kvalitet RNA används eller om protokollet inte följs exakt. Till exempel, ändra inkubationstiderna eller temperatur, tillsätta reagens i fel ordning eller pausa mellan fragmentering och syntesen av den första strängen av cDNA. Om återvänder biblioteken till den magnetiska monter inte bort den höga MW-DNA, är det lämpligt att upprepa biblioteket förberedelse med färska RNA-prover.

Låg intensitet: Om den första cykeln intensitet är lägre än förväntat, är det möjligt att primrarna inte hybridiserar till kluster ordentligt under det sista steget i kluster generation eller flödescellen lagrades för länge mellan kluster och början av sekvensering springa. I detta fall bör en primer återhybridisering utföras med hjälp av ett kit primer rehyb från Illumina. Oftast löser detta rehyb de intensitet frågor och körningen kan startas över utan problem. Om det efter en rehyb, intensiteterna är fortfarande låg, kan frågan varamed biblioteken eller sekvensen genom syntes (SBS) reagenser och Illumina teknisk service bör kontaktas för vidare felsökning. Om den första läs s intensiteter är bra, men intensiteterna är låga efter vändning kan en primer rehyb av den andra läsning primern vara nödvändig. Detta utförs på sekvensering instrumentet och Illumina teknisk service bör kontaktas för förfarandet.

Hög fasa / prephasing: Om högre än normalt utfasning eller prephasing observeras, är en möjlig orsak till förorening av andra SBS reagensen med klyvning buffert. Under SBS framställningsstegen, är det viktigt att hantera klyvning bufferten sist och byta handskar mellan hanteringen av klyvning bufferten och andra reagens. Om klyvning buffert förorening misstänks, bör en primer rehyb av flödescellen utföras och nya SBS reagenser bör utarbetas. Alternativt kan det finnas föroreningar i linje med den inst RUMENT. Om detta misstänks bör instrumentet genomgå en underhållstvätt (en vattenskrubber följt av en NaOH tvätt, följt av en slutlig vattentvätt) bör en primer rehyb utföras på flödescellen och nya SBS reagenser bör utarbetas. Om fasa / prephasing värden är måttligt hög (~ 0,5), kan körningen fortsättas tills Q30 poäng och kluster som passerar filtret beräknas. Dessa nivåer kan fortfarande vara i acceptabla gränser även med hög utfasning och / eller prephasing.

Generaliserbarhet av detta protokoll

Även om det är specifikt för Illumina HiScanSQ är detta protokoll tillämpas på något av de HiSeq familjen eller Genome Analyzer II Illumina instrument ( www.illumina.com ) med mindre modifieringar av stegen kluster generation och sekvensering reagenser. Andra nästa generations DNA-sekvensering plattformar som den fasta serien ("_blank"> Www.lifetechnologies.com), GS-system ( www.454.com är) samt några nya nyare system också används för att RNA-seq ^11. Även om deras bibliotek konstruktion och sekvensering förfaranden kan skilja sig något, de RNA Hantering dataanalysen delar (nedströms CASAVA stegen) och validering av RT-PCR som presenteras i detta protokoll kan vara av referensvärdet till deras RNA-seq program .

Det bör också påpekas att detta protokoll är specifik för RNA-seq vid en tidpunkt av trombin-behandlade HMVEC-Lbl celler, men det kunde lätt anpassas till en multi-tidpunkten eller de undersökningar i andra celler, vävnader som behandlats med olika stimuli eller hämmare, eller jämförelser av transcriptomes i celler eller vävnader mellan ett hälsosamt tillstånd och ett sjukdomstillstånd.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Inga intressekonflikter deklareras.

Acknowledgments

Författarna vill tacka Dr Stephen Kingsmore och Pediatric Genome Medicine Center på Barnens Mercy sjukhus och kliniker för användningen av deras datorer kluster för våra dataanalys, Illumina s fältservice team (Elizabeth Boyer, Scott Cook och Mark Cook) och tekniska konsultteam för sina snabba svar och användbara förslag på driften av nästa generations DNA-sekvensering instrument, HiScanSQ och datakvalitet analys. Detta arbete stöddes delvis av National Institutes of Health Grant HL080042 (till SQY) och startfond och begåvning av barns Mercy sjukhus och kliniker, University of Missouri i Kansas City (till SQY).

Materials

Name	Company	Catalog Number	Comments
Human Lung Microvascular Endothelial Cells	Lonza	CC-2815
Lonza, Bullet Kit	Lonza	CC-3202	Contains EGM-2, FBS, growth factors and antibiotics
Thrombin	Sigma	T4393
Ambion mirVana Kit	Life Technologies	AM 1560
RNase-Zap	Life Technologies	AM9782
Experion StdSens RNA	Bio-Rad	700-7103
TruSeq RNA Preparation Kit	Illumina	FC-122-1001
AMPureXP Beads	Beckman Coulter	A63881
Superscript Reverse Transcriptase II	Life Technologies	18064-014
Experion DNA 1K	Bio-Rad	700-7107
QuantiTect SyberGreen	Qiagen	204163
PE Cluster Generation Kit	Illumina	PE-401-3001
PhiX Control Kit	Illumina	FC110-301
200 Cycle SBS Kit	Illumina	FC-401-3001
HiScanSQ*	Illumina	SY-103-2001
cBot	Illumina	SY-301-2002
qPCR machine - Viia7	Life Technologies	Model #VIIA7 / Equipment #10631261	Or equivalent
Experion System	Bio Rad	7007001	Bioanalyzer is an alternative system
Spectrophotometer	Bio-Tek	Epoch Microplate Spectrophotometer	Or equivalent
Centrifuge - Sorvall Legend XTR	Thermo Scientific	75004521	Or equivalent
Magnetic stand	Life Technologies	AM10027
96-well thermocycler	General Lab Supplier
Table 3. List of Key Reagents and Major Equipment. *, In the video, HiSeq1000 instead of HiScanSQ was demonstrated.

DOWNLOAD MATERIALS LIST

References

Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet. 10, 57-63 (2009).
Shendure, J., Ji, H. Next-generation DNA sequencing. Nat. Biotechnol. 26, 1135-1145 (2008).
Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome Res. 18, 1509-1517 (2008).
Zhang, L. Q., et al. RNA-seq Reveals Novel Transcriptome of Genes and Their Isoforms in Human Pulmonary Microvascular Endothelial Cells Treated with Thrombin. PLoS One. 7, e31229 (2012).
Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10, R25 (2009).
Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25, 2078-2079 (2009).
Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat. Biotechnol. 28, 511-515 (2010).
Khatri, P., Sirota, M., Butte, A. J. Ten years of pathway analysis: current approaches and outstanding challenges. PLoS Comput. Biol. 8, e1002375 (2012).
Nielsen, H. Working with RNA. Methods. Mol. Biol. 703, 15-28 (2011).
Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat. Protoc. 7, 562-578 (2012).
Robertson, G., et al. De novo assembly and analysis of RNA-seq data. Nat. Methods. 7, 909-912 (2010).
Garber, M., Grabherr, M. G., Guttman, M., Trapnell, C. Computational methods for transcriptome annotation and quantification using RNA-seq. Nat. Methods. 8, 469-477 (2011).
Martin, J. A., Wang, Z. Next-generation transcriptome assembly. Nat. Rev. Genet. 12, 671-682 (2011).

Biology

RNA-seq Analys av Transcriptomes i trombin behandlade och kontroll Human pulmonell mikrovaskulära endotelceller

Summary

Abstract

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.