Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Kartläggning av strukturfunktionsrelationer för oordnade onkogena transkriptionsfaktorer med transkriptomisk analys

Published: June 27, 2020 doi: 10.3791/61564

Summary

Inneboende oordnade domäner är viktiga för onkogen fusion transkription faktor funktion. För att terapeutiskt rikta in sig på dessa proteiner krävs en mer detaljerad förståelse av de regleringsmekanismer som används av dessa domäner. Här använder vi transkriptomik för att kartlägga viktiga strukturella funktioner i den inneboende oordnade EWS-domänen i Ewing sarkom.

Abstract

Många cancerformer kännetecknas av kromosomala flyttningar som resulterar i uttryck av onkogena fusion transkription faktorer. Vanligtvis innehåller dessa proteiner en inneboende oordnad domän (IDD) smält med DNA-bindande domänen (DBD) av ett annat protein och orkestrera utbredda transkriptionella förändringar för att främja malignitet. Dessa fusioner är ofta den enda återkommande genomiska avvikelsen i de cancerformer de orsakar, vilket gör dem attraktiva terapeutiska mål. Att rikta in sig på onkogena transkriptionsfaktorer kräver dock en bättre förståelse för den mekanistiska roll som lågkomplexitet, IDD spelar i sin funktion. N-terminaldomänen för EWSR1 är en IDD som är involverad i en mängd olika onkogena fusions transkriptionsfaktorer, inklusive EWS/FLI, EWS/ATF och EWS/WT1. Här använder vi RNA-sekvensering för att undersöka de strukturella egenskaperna hos EWS-domänen som är viktiga för transkriptionsfunktion av EWS/FLI i Ewing sarkom. Första shRNA-medierade utarmning av endogen fusion från Ewing sarkom celler parat med ektopiska uttryck av en mängd olika EWS-mutant konstruktioner utförs. Sedan används RNA-sekvensering för att analysera transkriptomer av celler som uttrycker dessa konstruktioner för att karakterisera de funktionella underskott som är associerade med mutationer i EWS-domänen. Genom att integrera transkriptomiska analyser med tidigare publicerad information om EWS/FLI DNA-bindningsmotiv och genomisk lokalisering, samt funktionella analyser för transformeringsförmåga, kunde vi identifiera strukturella egenskaper hos EWS/FLI som är viktiga för onkogenes och definiera en ny uppsättning EWS/FLI-målgener som är kritiska för Ewing sarkom. Detta dokument visar användningen av RNA-sekvensering som en metod för att kartlägga struktur-funktion förhållandet mellan den inneboende oordnade domänen av onkogena transkription faktorer.

Introduction

En delmängd av cancer, inklusive många maligniteter i barndomen och tonåren, kännetecknas av kromosomala flyttningar som genererar nya fusion onkogener1,2,3,4,5,6. De resulterande fusionsproteinerna fungerar ofta som onkogena transkriptionsfaktorer, orkestrerar utbredda förändringar i transkriptionsreglering för att främja tumorigenesis7,8. Cancer med dessa flyttningar har vanligtvis ett annars tyst mutationslandskap, med få återkommande genomiska avvikelser bortsett från den patognomoniska fusionen4,9. Som sådan är direkt inriktning på fusionsproteinet en attraktiv terapeutisk strategi vid dessa sjukdomar. Dessa onkogena transkriptionsfaktorer består dock ofta av en lågkomplexitet, i sig oordnad, transkriptionellt aktiverande domän smält med en DNA-bindande domän (DBD)10,11,12,13,14. Både de inneboende oordnade domänerna (IDDs) och DBDs av dessa proteiner har visat sig vara svåra att rikta med konventionella farmakologiska metoder. Utveckling av nya terapeutiska metoder kräver därför en mer detaljerad molekylär förståelse av de mekanismer som används av dessa fusioner för att avvikande reglera genuttryck.

N-terminal IDD-delen av EWSR1 är vanligtvis smält till en DBD vid cancer, inklusive EWS/FLI i Ewing sarkom, EWS/WT1 i diffus liten rund cell tumör och EWS/ATF1 i klar cell sarkom av mjuka delar10. Den mekanistiska rollen av EWS-IDD i var och en av dessa fusioner är ofullständigt förstådd. EWS/ETS-familjen av fusioner, särskilt EWS/FLI, är den mest funktionellt karakteriserade hittills. EWS/FLI samordnar genomomfattande epigenetiska och transkriptionsförändringar som leder till aktivering och förtryck av tusentals gener7,11,15,16. Studier har visat att IDD är viktigt för rekrytering av både transkriptionsmedaktivatorer (såsom p300, WDR5 och BAF-komplexet), liksom medpressorer (såsom NuRD-komplexet)11,15,17. Fusionen av EWS-IDD till C-terminaldelen av FLI1 ger ny DNA-bindande specificitet till ETS DBD av FLI1, så att fusion onkoprotein (EWS/FLI) binder till repetitiva GGAA-mikrosatellitregioner i genomet utöver konsensus ETS-motivet18,19,20. I kombination med rekryteringsfunktionen med medaktivatorn främjar denna framväxande DNA-bindande aktivitet hos EWS/FLI de novo enhancer-bildning vid GGAA-mikrosatelliter distala till transkriptionsstartplatser (TSS) ("förstärkareliknande" mikrosatelliter) och rekryterar RNA-polymeras II för att främja transkription vid GGAA-mikrosatelliter som är proximala för TSS ("promotorliknande" mikrosatelliter)11,11 , 15 ,11.

Sammantaget ledde dessa data oss till hypotesen att diskreta element inom EWS-domänen bidrar till rekrytering av distinkta medreglerare till olika typer av EWS / FLI-bindningsplatser. Att urskilja dessa element inom EWS-delen av EWS/FLI, och hur de fungerar, har dock hindrats av domänens mycket repetitiva och oordnade natur. Här använder vi ett tidigare publicerat knockdown-rescue system i Ewing sarkomceller för att funktionellt kartlägga dessa element i EWS IDD. I detta system utarmas EWS/FLI med hjälp av ett shRNA som riktar sig mot 3'UTR av FLI1-genen, och uttrycket räddas med varierande EWS/FLI mutant cDNA-konstruktioner som saknar 3'UTR7,17,22. Dessa experiment fokuserade på konstruktioner med olika borttagningar för att kartlägga struktur-funktionsförhållandet mellan EWS-IDD och viktiga onkogena fenotyper, inklusive aktivering av en GGAA-mikrosatellit reporter konstruktion, kolonibildningsanalyser och riktad validering av EWS / FLI-aktiverade och -undertryckta gener7,17,22 . Dessa studier kunde dock inte hitta diskreta underdomäner inom EWS-IDD i EWS/FLI som är unikt viktiga för antingen aktivering eller förtryck. Alla testade konstruktioner kunde antingen både aktivera och undertrycka specifika målgener, vilket ledde till effektiv kolonibildning, eller oförmögen att reglera någon av EWS / FLI-målgenerna, vilket ledde till förlust av kolonibildning7,17,22.

Transkriptomiska analyser som möjliggörs av den utbredda antagandet av nästa generations sekvensering används ofta för att jämföra genuttryckssignaturer i två villkor, ofta i samband med screening eller beskrivande studier. Vi ville istället utnyttja förmågan att fånga genomomfattande uttrycksdata med hjälp av RNA-sekvensering (RNA-seq) för att karakterisera IDD:s bidrag till transkriptionsfaktorfunktionen. I detta fall paras RNA-seq ihop med knockdown-rescue-systemet för att utforska struktur-funktionsförhållandet för EWS-domänen. Detta tillvägagångssätt är tillämpligt på andra fusion transkription faktorer, inklusive andra EWS fusioner eller wildtype transkription faktorer med dåligt förstådd funktion, och har flera fördelar jämfört med andra analyser som används för funktionella mappningsstudier, såsom reporter analyser eller riktade qRT-PCR. Dessa inkluderar testning av strukturella bestämningsfaktorer för funktionen i relevant kromatinsammanhang, förmågan att testa flera typer av responselement i en analys (dvs. aktiverad och undertryckt, GGAA-mikrosatellit och icke-mikrosatellit, etc.) och den resulterande förmågan att bättre upptäcka partiell funktion.

Framgångsrik implementering av denna metod beror på ett cellbaserat system som fångar fenotyper av intresse (i detta fall A673 celler med shRNA-medierad EWS/FLI utarmning), och en panel av mutanta konstruktioner i ett uttryck vektor lämplig för cellbaserade systemet (i detta fall pMSCV-hygro med olika 3x-FLAG-taggade EWS/mutanta FLIs som ska levereras av retroviral transduktion). Viral transduktion av antingen CRISPR-baserade utarmningskonstruktioner, shRNA-baserade utarmningskonstruktioner och cDNA-uttryckskonstruktioner med lämpligt urval för att generera stabila cellinjer rekommenderas över övergående transfektion. Nedströms tolkningen av resultaten förstärks när transkriptomiska data kan paras ihop med andra data relaterade till lokalisering av transkriptionsfaktorn och andra fenotypiska avläsningar där det finns tillgängliga.

I detta dokument tillämpar vi denna metod för att karakterisera aktiviteten hos DAF-mutanten av EWS/FLI14. DAF mutant har 17 tyrosin till alanin mutationer i de repetitiva regionerna i EWS IDD av EWS/FLI14. Denna specifika EWS mutant hade tidigare rapporterats och kan inte aktivera reporter genuttryck när den smälts till ATF1 DBD14. Preliminära qRT-PCR-data tyder dock på att denna mutant kunde aktivera transkription av EWS/FLI-målet NR0B123. Den transkriptomiska metoden beskrivs här möjliggjorde framgångsrik detektion av partiell funktion av DAF mutant. Genom att para ihop dessa transkriptomiska data med information om EWS/FLI bindning och erkännande motiv visar vi ytterligare att DAF mutant behåller funktionen vid GGAA-microsatellite repetitioner. Dessa resultat identifierar DAF som den första delvis funktionella EWS/FLI mutant och höjdpunkt funktion vid icke-microsatellite gener som viktigt för onkogenes (som rapporterats23). Detta visar kraften i denna transkriptomiska struktur-funktion mappning strategi att ge insikt i funktionen av onkogen transkription faktorer.

Protocol

1. Ställ in in vitro-panel av konstruktioner

OBS: Detta steg varierar beroende på vilket specifikt protein som ska analyseras.

  1. Förbered alikvoter av virus för utarmning och uttryckskonstruktioner vid behov.
    1. Frö en 10 cm vävnadsodlingsfat med 3-5 x 106 HEK293-EBNA- eller HEK293T-celler för varje konstruktion som behövs för viral transduktion. Låt cellerna fastna över natten i Dulbeccos Modified Eagle Media (DMEM) kompletterat med 10% fetalt bovint serum (FBS), penicillin/streptomycin/glutamin (P/S/Q) och 0,3 mg/mL G418.
      OBS: HEK293-EBNA och HEK293T celler rekommenderas för viral produktion eftersom de är lätta att växa, har hög transfektion effektivitet och effektivt uttrycka rekombinanta proteiner från episomala plasmider. Cellerna ska vara mellan 50-70% sammanflöde dagen för transfektion.
    2. Förbered en transfektblandning för varje viral transduktionskonstruktion. Kombinera 2 ml reducerat serummedium med 90 μL transfektreagens.
      OBS: Förvärmning av reducerade serummedier rekommenderas.
    3. Tillsätt 10 μg vardera av en viral förpackningsplasmid (t.ex. gag-pol), viral kuvertplasmid (t.ex. VSV-G) och en av antingen CRISPR-baserad utarmning, shRNA-baserad utarmning eller cDNA-uttryckskonstruktion (t.ex. pMKO eller pMSCV) till transfektionsblandningen. Blanda väl genom skonsam pipettering.
    4. Låt transfektblandningen sitta i 20 min vid rumstemperatur. Ta bort HEK293-EBNA tillväxtmedia från vävnadsodlingsrätter och tillsätt 3 ml DMEM kompletterat med 10% FBS, P/S/Q och 10 mM natrium pyruvat. Tillsätt 2 ml transfektblandning på varje skål. Låt cellerna sitta i transfektmedier över natten i en inkubator vid 37 °C och 5% CO2.
    5. Följande morgon lägga till 20 ml DMEM media med 10% FBS, P/S/Q tillskott, och 10 mM natrium pyruvat. Inkubera cellerna i den vid 37 °C och 5% CO2 för över natten.
    6. Nästa morgon, ersätt media med 5 mL viral samlingsmedia (VCM) (DMEM kompletterad med 10% värme inaktiverad FBS, P / S / Q och 20 mM HEPES).
    7. Efter 4 h, samla VCM från plattor och förvara i ett 50 ml koniskt rör på is vid 4 °C. Byt ut med 5 ml färsk VCM.
    8. Efter 4 h, samla VCM från plattor i samma 50 ml koniska rör och lagra på is vid 4 °C. Byt ut med 8 ml färsk VCM för upphämtning över natten.
    9. På morgonen samla VCM från plattor och lagra i 50 ml konisk rör på is vid 4 °C. Byt ut med 5 ml färsk VCM.
    10. Efter 4 h, samla VCM från plattor och förvara i 50 ml konisk rör på is vid 4 °C. Byt ut med 5 ml färsk VCM. Efter 4 h, samla VCM från plattor och lägg till 50 ml koniskt rör.
    11. Aliquot samlingar från 50 mL rör i cryotubes (2 mL per aliquot) efter filtrering genom ett 0,45 μm filter. Förvara virala alikvoter vid -80 °C tills de används.
      OBS: Protokollet kan pausas här, och de virala alikvoterna kan lagras tills de är klara för användning.
  2. Fröceller med lämplig densitet i en 10 cm vävnadskulturskål. Målet är 50% sammanflöde. Låt cellerna klibba över natten genom att placera i inkubatorn vid 37 °C som innehåller 5% CO2.
    OBS: För A673 celler är detta 5 x 106 celler i 10 ml DMEM media med 10% FBS, P/S/Q tillskott, och 10 mM natrium pyruvat. Dessa tillstånd kan variera beroende på tillväxttakten för de celler som används.
  3. Utarma endogen faktor av intresse. Om cellerna inte behöver ha det endogena proteinet av intresse uttömt, hoppa framåt till steg 1,4.
    1. Tina viral alikvot för transduktion av shRNA eller CRISPR konstruktion riktad mot proteinet av intresse. Tina frysta alikvoter snabbt i ett vattenbad på 37 °C.
    2. Tillsätt 2,5 μL 8 mg/ml polybren till varje viral alikvot och blanda genom skonsam pipettering. Ta bort media från cellplattor och tillsätt försiktigt viral alikvot till 10 cm tallrik genom pipettering längs sidan av plattan. Rocka plattan för att sprida 2 ml viral alikvot.
    3. Inkubera vid 37 °C i vävnadsodlingskuvuvösen i 2 timmar. Gunga plattan var 30:e minut för att förhindra att några delar av plattan torkar ut.
    4. Tillsätt 5 ml DMEM-media med 10% FBS, P/S/Q tillskott och 10 mM natrium pyruvat, med 5 μL 8 mg/ml polybrene. Låt cellerna inkubera över natten.
    5. På morgonen ta bort media från celler och passage celler till media kompletteras med en urval reagens. När du passar celler, så dem på ett sätt så att de kan växa i 48-72 h och nå 50% confluency.
      OBS: För A673-celler med pSRP-iEF-2 sås cellerna i en 1:5 split och väljs för 72 h med 2 μg/mL puromycin.
  4. Transduce cDNA uttryck konstruktioner.
    1. Kontrollera celler för att bekräfta 50-70% sammanflöde.
    2. Tina viral alikvoter för flyttning av cDNA-konstruktioner av intresse. Tina frysta alikvoter snabbt i ett vattenbad på 37 °C. Tillsätt 2,5 μL 8 mg/ml polybren till varje viral alikvot och blanda genom att försiktigt pipettera.
    3. Ta bort media från pläterade celler och tillsätt försiktigt viral alikvot till 10 cm tallrik genom pipettering längs sidan av plattan. Rocka plattan för att sprida 2 ml viral alikvot.
    4. Inkubera vid 37 °C i vävnadsodlingskuvuvösen i 2 timmar. Gunga plattan var 30:e minut för att förhindra att några delar av plattan torkar ut.
    5. Tillsätt 5 ml DMEM-media med 10% FBS, P/S/Q tillskott och 10 mM natrium pyruvat, med 5 μL 8 mg/ml polybrene. Låt cellerna inkubera över natten.
    6. På morgonen tar du bort media från celler och passageceller till dubbla markeringsmedier. Växa och passageceller efter behov i 7-10 dagar för att möjliggöra dubbel markering och uttryck av cDNA-konstruktionen.
      OBS: Denna delning av den här passagen kan kräva optimering för olika cellinjer. För A673-celler med pSRP-iEF-2 och en pMSCV-hygrokonstruktion överförs cellerna utan att delas upp i 2 μg/mL puromycin och 100 μg/mL hygromycin.

2. Samla in celler, validera uttryck för konstruktioner och ställa in korrelativa fenotypiska analyser

  1. Efter 7-10 dagar av dubbel urval samla celler i ett 15 ml koniskt rör. Räkna insamlade celler med en hemocytometer. Aliquot samlade celler för RNA-sekvensering och för att validera uttryck för cDNA-konstruktioner.
    OBS: Ställ in eventuella korrelativa fenotypiska analyser som krävs enligt den undersökta forskningsfrågan. Kolonibildande analyser är ett exempel på en korrelativ fenotypisk analys som används här.
    1. Samla mellan 5 x 105 och 1 x 106 celler för RNA-sekvensering och 2 x 106 celler för proteinutvinning. Pelletceller genom centrifugering vid 1 000 x g vid 4 °C i 5 minuter och avlägsna supernatanten.
    2. Tvätta pelleten med 1 ml kall PBS. Pellet genom centrifugering vid 1 000 x g vid 4 °C i 5 minuter och avlägsna supernatant. Blixtfrys pellets i flytande kväve och förvara vid -80 °C.
    3. Ställ in eventuella korrelativa analyser med de återstående cellerna.
      OBS: Protokollet kan pausas här med insamlade prover lagrade i frysen -80 °C.
  2. Validera knockdown av protein av intresse (om det används) och uttryck för panelen av konstruktioner.
    1. Tina cellpellets för proteinutvinning på is. Resuspend celler i iskall 500 μL kärnutvinning buffert (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glycerol, 1,5 mM MgCl2,1 mM EDTA, 1 mM DTT, 1% IGEPAL) med proteashämmare. Låt det sitta i 5 min på is.
    2. Pelletkärnor genom centrifugering vid 1 000 x g vid 4 °C i 5 minuter och avlägsna supernatant. Tvätta kärnor i 500 μL iskall kärnutvinningsbuffert (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glycerol, 1,5 mM MgCl2,1 mM EDTA, 1 mM DTT, 1% IGEPAL) med proteashämmare.
    3. Pelletkärnor genom centrifugering vid 1 000 x g vid 4 °C i 5 minuter och avlägsna supernatanten. Resuspendkärnor i 200 μL kall RIPA-buffert med proteashämmare (justera volymen ripabuffert efter pelletsstorlek.) Låt den sitta på is i 45-60 min med kraftig virvel var 15:e minut.
    4. Pelletcellsskräp genom centrifugering vid 16 000 x g vid 4 °C i 45-60 min. Behåll supernatanten och överför till ett nytt kallt rör
    5. Förbered prover för SDS-PAGE elektrofores genom att koka 5-10 μg protein med 1x laddningsbuffert i 5 min. Kör en SDS-PAGE gel efter behov för proteinet av intresse.
    6. Överför till ett nitrocellulosa- eller PVDF-membran efter behov för det protein som är av intresse. Blockera och fläcka med lämpliga primära och sekundära antikroppar för att bekräfta knockdown av det endogena proteinet (om det används) och ektopiskt uttryck för cDNA-konstruktionen.
      PROTOKOLLET kan pausas här.
  3. Extrahera RNA. Utvärdera RNA:s kvalitet och kvantitet.
    1. Tina cellpellets på is. Extrahera totalt RNA med hjälp av en kiselspinnkolonnbaserad extraktionssats enligt tillverkarens instruktioner.
    2. Lyse kort cellerna med hjälp av lysbufferten från satsen. Applicera antingen lysat på en kiseldioxidspinnkolonn med en kort snurr vid >13000 rpm i 30-60 sekunder eller ta bort gDNA genom att applicera lysat på en gDNA-borttagningskolonn med en kort snurr vid >13000 rpm i 30-60 sekunder.
    3. Utför en DNA-matsmältning på kolonnen om lysate applicerades direkt på en kiselspinnkolonn. Om du använder en gDNA-borttagningskolonn, applicera eluatet på en kiselspinnkolonn med en kort snurr vid >13000 rpm i 30-60 s.
    4. Tvätta RNA på kolonnen enligt tillverkarens instruktioner. Elute RNA i 30 μL elutionbuffert.
    5. Utvärdera RNA:s kvalitet och kvantitet med hjälp av en fluorometer eller något annat jämförbart instrument. Se till att förhållandet 260/280 är nära 2 och att det finns minst 2,5 μg RNA att skicka in för sekvensering.
      OBS: När replikat samlas in måste varje replikat bearbetas med samma RNA-extraktionsprotokoll.
    6. Använd en liten alikvot RNA för att bekräfta den stabila knockdown av proteinet av intresse, om det behövs, av qRT-PCR. Förvara det återstående RNA-provet vid -80 °C.
    7. Samla biologiska replikat genom att upprepa steg 1-2 tills 3-4 kompletta uppsättningar RNA har samlats in. Se till att varje replikat visar adekvat uttryck för cDNA-konstruktioner och stabil knockdown av det endogena proteinet (om det används).

3. Nästa generations sekvensering

  1. Skicka extraherat RNA för att sekvenseras med en nästa generations sekvenseringsplattform med ett mål på 50 miljoner 150 baspar (bp) parade ändläsningar. Följ instruktionerna från anläggningen som bearbetar proverna. Välj för polydenylerade RNAs och strandspecifik sekvensering.

4. Pipeline för justering och transkriptionsräkning

DET här protokollet förutsätter att efter exempelöverföring och bearbetning returneras en uppsättning parkopplade FASTQ-filer för varje exempel. Dessa filer komprimeras ofta med suffixet "fastq.gz". Ytterligare analys av dessa FASTQ-filer kommer att kräva tillgång till en HPC-anläggning (High-Performance Computing) som kör ett Linux-operativsystem.

  1. Överföra filer
    1. Öppna en terminal till HPC-miljön med PuTTY. Skapa en katalog för analysen som kallas "projekt".
    2. Navigera till katalogen "path_to/project" och skapa en ny katalog för den komprimerade råa fastq.gz-filerna som kallas "fastq". Gör också en katalog som heter "trimmad". Detta visas i figur S1A-C.
    3. Överför de komprimerade råa fastq.gz-filerna från lokal lagring till katalogen "path_to/project/fastq/" med WinSCP eller ett liknande program. Kontrollera att det finns en "R1" och en "R2" fil för varje prov som visas i figur S1B.
    4. Valfritt: Installera TrimGalore om det behövs. Ange katalogen som innehåller den trim_galore körbara filen i PATH-miljövariabeln i Linux.
      OBS: Avläsningar av låg kvalitet och adaptrar trimmas med TrimGalore. TrimGalore finns på https://github.com/FelixKrueger/TrimGalore.
    5. Valfritt: Navigera till katalogen för nedladdade programvarupaket (dvs.path_to/programvara"). Ladda ned det senaste TrimGalore-paketet med kommandot "curl -fsSL https://github.com/FelixKrueger/TrimGalore/archive/[version].tar.gz -o trim_galore-[version].tar.gz.".
    6. Valfritt: Packa upp tjära.gz-filen. Använd kommandot "tar -xvzf trim_galore-[version_number].tar.gz".
    7. Valfritt: Gör TrimGalore körbar. Använd kommandot "chmod a+x path_to/software/TrimGalore-[version]/trim_galore". Kontrollera att den nya katalogen finns i PATH. Använd kommandot "exportera PATH=path_to/software/TrimGalore-[version]:$PATH".
    8. Navigera till path_to/project/fastq/. Använd TrimGalore för att trimma läsningarna av låg kvalitet från fastq.gz-filerna med kommandot som visas i figur S1C.
      OBS: Ytterligare flaggor för det här kommandot kan vara relevanta och finns här: https://github.com/FelixKrueger/TrimGalore/blob/master/Docs/
      Trim_Galore_User_Guide.md
    9. Sök efter de trimmade fastq.gz-filerna i katalogen path_to/project/trimmade. Se till att de kallas sample1_R1_val_1.fq.gz och sample1_R2_val_2.fq.gz
  2. Justera trimmade FASTQ-filer med STAR och generera antalet transkriptioner.
    OBS: STAR finns på https://github.com/alexdobin/STAR)
    1. Valfritt: Installera STAR version 2.6 eller senare. Ange den körbara STAR-körningen i sökvägen.
    2. Valfritt: Navigera till katalogen för nedladdade programvarupaket (dvs.path_to/programvara").
    3. Valfritt: Ladda ner STAR-paketet med kommandot "curl -SLO https://github.com/alexdobin/STAR/archive/[version].tar.gz". Packa upp tjära.gz fil.
    4. Valfritt: Använd kommandot "tar -xzf [version].tar.gz". Gör STAR körbar. Använd kommandot "chmod a+x path_to/software/STAR-[version]/bin".
    5. Valfritt: Kontrollera att den nya katalogen finns i sökvägen. Använd kommandot "exportera PATH=path_to/software/STAR-[version_number]/bin/linux_x86_64_static:$PATH".
      OBS: STAR-handboken finns på: (https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf).
    6. Se till att det finns genomindex att använda med STAR. Placera detta i en katalog som är skild från katalogen path_to/projekt/. Om ett index tidigare genererades för tidigare experiment använder du det. Alternativt kan du använda ett lämpligt förgenererat index om det finns tillgängligt här: http://refgenomes.databio.org/. Annars skapar du ett nytt index med kommandot "STAR--runMode genomGenerera" med hjälp av anvisningarna i STAR-handboken.
      OBS: För återstoden av detta protokoll kommer sökvägen till STAR-indexet att kallas "path_to/STAR_index".
    7. Navigera till katalogen path_to/projekt/. Skapa en ny katalog som heter "STAR_output" som visas i figur S1D.
    8. Navigera till katalogen path_to/project/trimmade/. Använd kommandot som visas i figur S1D för att köra STAR för att justera de trimmade fastq.gz-filerna.
      OBS: Det här steget är det mest beräkningsintensiva och vi rekommenderar att du utför detta på ett HPC-kluster med flera trådar (dvs. >16) som är avsedda för justeringsuppgiften. Beroende på antalet exempel och tillgängliga beräkningsresurser kan det här steget ta många timmar till dagar.
    9. Hitta den utdata som krävs för nästa steg som innehåller antalet per transkription på följande plats: path_to/project/STAR_output/sampleN_ReadsPerGene.out.tab.
      I filen ReadsPerGene.out.tab innehåller kolumn 1 information om funktionen som räknas. Kolumn 2 innehåller de osträngade läsantalen, kolumn 3 innehåller de framåtriktade strandade läsantalen och kolumn 4 innehåller de omvända strandade läsantalen. De första fyra raderna i den här filen kommer att ha information om de justerade läsningarna som inte anpassade sig till en enda gen. Detta protokoll kräver att den ostrandade läsräkningen.
    10. Använd RStudio (helst) eller R i HPC-miljön för att kompilera data från rad 5 och lägre för kolumnerna 1 och 2 för varje exempel. Ställ in arbetskatalogen på "projekt" i R.
    11. Läs i varje ReadsPerGene.out.tab-fil med kommandot i figur S2A. För den första kolumnen tar du bara tecknen före kolumnen "." i kolumnen "Ensembl-gen-ID" för att underlätta nedströms bearbetning.
    12. Kompilera räkningar från alla exempel till en dataram som kallas "totcts" med hjälp av kommandona i figur S2B. Spara den här nya tabellen med rådräkningsdata som en flik avgränsad .txt fil, dvs. sample_counts.txt, om så önskas, med kommandot "write.table".
      Obs: Ordningen på Ensembl-gen-ID:t är densamma för varje ReadsPerGene.out.tab-fil i alla exempel.

5. Differentiell uttryck och nedströmsanalys

  1. Normalisera för batcheffekter mellan exempel med ComBat.
    OBS: Det finns två möjliga variabler som förklarar förändringar i genuttrycket, den första är den konstruktion som används (dvs. provet) och den andra är yttre faktorer i samband med cellernas passage genom tiden (dvs. batchen). Ett steg för att normalisera exempel för batch-till-batch-variation med R-paketet ComBat rekommenderas.
    1. Installera om det behövs och ladda biblioteken för sva, DESeq2, AnnotationDBI, org. Hs.eg.db, pheatmap, RColorBrewer, genefilter, Kairo, ggplot2, ggbiplot, rgl och reshape2 som visas i figur S2C. För installation använder du kommandot "install.packages" eller Bioconductor enligt dokumentationen för varje paket.
    2. Filtrera först data till endast de gener som har minst ett antal per läsning. Spara den nya tabellen för att ange filtrering enligt figur S2D.
      OBS: Ofta kommer många gener att ha mycket låga eller inga läsantal.
    3. Förbered en andra tabell för batchnormalisering som kallas "vars" som visas i figur S2E. Ange radnamnen på de unika namnen på varje exempel. Ange kolumnnamnen på "exempel", "batch" och "construct".
    4. Tilldela alla exempel ett unikt nummer i kolumnen "exempel" från 1 till n, där n är antalet exempel. Tilldela batchnummer till alla exempel i kolumnen "batch" så att a_1 och b_1 båda tilldelas 1 och villkors-a_2 och b_2 båda tilldelas 2. Tilldela alla villkorsbeteckningar till alla prover i kolumnen "konstruktion" så att alla provexemplar är "A" och villkor-b-prov är alla "B".
    5. Definiera även batchvariabeln och en specifik null-modellmatris för ComBat enligt bild S2F. Kör ComBat med kommandot definierat i figur S2F.
  2. Kurera data ytterligare genom att avrunda till närmaste heltal. Ta också bort gener med ett negativt värde. Använd kommandona i figur S3A.
    OBS: Utdata från batchnormalisering kommer att ha icke-heltalsavläsningsantal och vissa gener med negativa värden. Det här steget krävs eftersom analysen av nedströms differentiella uttryck inte stöder negativa läs antal.
  3. Definiera differentialuttrycksprofilen för varje konstruktion med DESeq2.
    1. Ange experimentdesignen för DESeq2 enligt figur S3B. Konstruera en DESeqDataSet (dds) med funktionen DESeqDataSetFromMatrix, uppskatta storleksfaktorerna och kör DESEq2 enligt figur S3B.
      OBS: Det är absolut nödvändigt att kolumndata som anges för "villkor" är i samma ordning som kolumnen i räkningsmatrisen.
    2. För att utvärdera analysens kvalitet, extrahera de rlognormaliserade räkningar som används av DESeq2 enligt figur S3B.
      OBS: Under analysen omvandlar DESeq2 antalet med en "legaliserad logg", rlog, omvandling för att krympa prov-till-prov-skillnaderna för gener med lågt antal (låg information) för att bevara skillnader i gener med högre antal över prover (hög information).
    3. När du extraherar resultaten för varje transkriptionsprofil från resultaten av DESeq2 ska du utföra parvis jämförelser med hänvisning till antingen knockdown-villkoret eller den tomma originalurra vektorn enligt figur S3C. Ytterligare ändra dessa resultat med HGNC gensymboler som visas i figur S3D.
    4. Som framgår av figur S3E, extrahera data från DESeq2 resultat. Exportera som en enda fil med Ensembl gen-ID, HGNC-symbol, basmedeluttryck och differentiella uttrycksdata för alla konstruktioner med log2FoldChange och råa och justerade p-värden.
      OBS: Att använda ett justerat p-värde < 0,05 är den rekommenderade brytningen för differentiellt uttryck.
    5. Utvärdera lyckad batchnormalisering och likhet inom exempel. Kontrollera exempelkluster med PCA och avståndsdiagram från exempel till exempel med hjälp av rlog normaliserade antal med hjälp av koden som visas i figurerna S4A-B.
  4. Använd differentialuttrycksprofilerna för att generera vulkandiagram med koden i figur S4C. Utvärdera förändringar i genuttryck mellan konstruktioner.
  5. Använd rlog normaliserade antal och hierarkisk klustring för att identifiera gensigna signaturer som är unika för de olika konstruktionerna. Använd koden som visas i figur S4D.
    1. Extrahera de 1000 mest variabla generna över alla konstruktioner i en matris. Använd pheatmap för att utföra oövervakad hierarkisk klustring av dina exempel baserat på dessa gener.
    2. Extrahera kluster av intresse från dendrogrammet genom att bestämma på vilken nivå av dendrogramkluster av intresse visas. Ange "k" som motsvarar antalet kluster på den nivån. Måla om värmekartan som beställts efter klustret för att avgöra vilka kluster som är av intresse enligt figur S5.
    3. Exportera listan över gener som är associerade med varje kluster enligt tabell S1. Använd den här informationen för att bestämma generna i kluster av intresse.
  6. Identifiera de biologiska rollerna för olika kluster av gener som identifierats och jämför mellan klasserna. Detta kan utföras med hjälp av en mängd olika bioinformatikverktyg. ToppGene24 används här och är fritt tillgänglig online.
    OBS: Det finns många gratisverktyg som bara kräver en lista över gener för att kopiera och klistra in i ett fält på en webbplats. Välj de analysverktyg som är lämpligast för de forskningsfrågor som undersöks.
  7. Om det finns data tillgängliga om genomisk bindning som driver transkriptionsutmatning för transkriptionsfaktor av intresse, jämför transkriptionssvaret vid gener associerade med olika bindande element för att ytterligare utvärdera mutantfunktionen.

6. Jämförelse med relevanta fenotyper

  1. Jämför de korrelativa fenotyperna med de transkriptomiska profildata som genereras och tolka vid behov.

Representative Results

Preliminära qRT-PCR-data föreslog att en EWS/FLI mutant som kallas DAF, med specifika tyrosin till alanin mutationer i den repetitiva och oordnade regionen EWS, bibehöll förmågan att aktivera EWS/FLI mål gener, men misslyckades med att undertrycka kritiska mål gener23. För att bättre förstå sambandet mellan dessa rester i EWS-domänen och EWS/FLI-funktionen användes protokollet som beskrivs ovan och beskrivs i figur 1. A673 Ewing sarkom celler var viralt transduced med en shRNA som riktar sig till 3'UTR av FLI1, vilket resulterar i utarmning av endogena EWS/FLI. Efter fyra dagars urval räddades EWS/FLI funktion med viral flyttning av olika 3XFLAG-taggade EWS/FLI mutant konstruktioner, med tom vektor som en kontroll för ingen räddning. En icke-funktionell mutant som saknade EWS-domänen, kallad Δ22, användes som en negativ kontroll och wild-type EWS/FLI, kallad wtEF, användes som en positiv kontroll (figur 2A). DAF användes som testkonstruktion, men mer än en testkonstruktion kan användas om så önskas. Celler valdes för ytterligare 10 dagar för att tillåta konstruktionsuttryck att stabiliseras och sedan samlas in för RNA (med ett gDNA borttagningssteg), protein och kolonibildande analyser. Fyra replikat samlades in och representativa qRT-PCR och västra fläckar som visar effektiv knockdown och räddning visas i figur 2B-D. Det bör noteras att DAF-räddade celler inte kunde bilda kolonier som visas i figur 2E, vilket tyder på nedsatt onkogen omvandling.

Efter slutförandet av replikat validering och fenotypiska analyser, RNA överlämnades till Institutet för genomisk medicin vid Rikstäckande barnsjukhus för biblioteksberedning och nästa generations sekvensering med ~ 50 miljoner 150-bp parade läsningar samlade. Data returnerades som fastq.gz filer. Lågkvalitativa läsningar trimmades från dessa filer med TrimGalore och STAR användes för att justera läsningar till det mänskliga genomet hg19 och räkna avläsningarna per gen. hg19 användes för kompatibilitet med de andra utvalda datamängderna för EWS/FLI som används i senare analyser. Dessa läsantal kombinerades till en matris med ett enda antal för alla prover, varav de första 6 raderna visas i figur 3.

Räkningar kördes ursprungligen genom DESeq2 utan batchnormalisering, men visuell inspektion av prov-till-prov-avståndet visade potentiella förvirrande batcheffekter som visas markerade med röda pilar i figur 4A. Detta uppstod sannolikt på grund av biologisk variabilitet som infördes genom passage av celler i kultur och skillnader i bearbetningen av varje parti. Normalisering för batcheffekter utfördes med ComBat och rekommenderas i allmänhet. Provavstånden för de batchnormaliserade uppgifterna visas i figur 4B. Efter batch normalisering användes DESeq2 för att generera transkriptionsprofiler för de tre konstruktionerna (wtEF, Δ22 och DAF) i förhållande till baslinjen. Observera att medan "föräldra" A673-celler (mock knockdown och mock rescue, kallad "iLuc" här) inkluderades i differentialanalysen, är referensen för detta experiment cellerna med EWS / FLI-utarmade, så kallade iEF-celler. Transkriptionsprofilen kan genereras för det endogena proteinet här genom att jämföra iLuc-provet med iEF, och detta kan vara av intresse för att förstå hur räddningssystemet fungerar, men det är inte målet med just denna analys. De transkriptionsprofiler som genereras för mutanterna inkluderar positiva (wtEF) och negativa (Δ22) kontroller, med avseende på iEF, så att dessa bör fungera som riktmärken för andra mutanter. Detta är viktigt, eftersom den positiva kontrollen i detta exempel inte helt sammanfattade funktionen hos endogen EWS/FLI som diskuterats någon annanstans7,23.

Den huvudsakliga komponentanalysen (PCA) i figur 5 tyder på att DAF:s transkriptionsprofil är mellanliggande mellan wtEF och Δ22, vilket bekräftar partiell funktion. Dessutom visade hierarkisk klustring av de 1000 mest variabla generna över proverna att DAF inte lyckades undertrycka EWS/FLI-målgener och endast delvis behållen genaktiveringsaktivitet som visas i figur 6A och figur S5. ToppGene-analys föreslog att klasserna av gener som DAF aktiverar är funktionellt åtskilda från de EWS/ FLI-aktiverade mål där DAF är icke-funktionell (figur 6B). Intressant nog verkar funktionen hos aktiverade gener som räddas av wtEF, men inte av DAF, vara relaterad till transkriptionell kontroll och kromatinreglering. Baserat på resultaten av kolonibildandet analyser, gener från denna kärn gen signatur bör analyseras ytterligare för sin roll i EWS/FLI-medierad onkogenes. Betydelsen av EWS/FLI-medierat genförtryck har tidigare beskrivits17.

Det är känt att EWS/FLI har en unik bindningstillhörighet för GGAA-microsatellite upprepande element19,22, och att bindning vid dessa element driver nedströms genreglering11,15,18,20,22. Dessa mikrosatelliter har karaktäriserats som antingen associerade med aktivering eller förtryck, och antingen proximala till (< 5 kb) TSS eller distala till (> 5 kb) TSS25. Dessutom finns det EWS/FLI-reglerade gener med hög affinitet (HA) ETS motiv proximal till TSS23. För att ytterligare analysera egenskaperna hos DAF funktion och vilka typer av EWS/FLI-aktiverade gener DAF kunde rädda, differentiell uttryck av gener associerade med dessa olika klasser analyserades. Intressant nog var DAF mest kapabel att rädda GGAA-mikrosatellitaktiverade gener, men kunde inte rädda aktiverade gener nära en HA-plats som ses i figur 7. Som ses med hierarkisk klustring misslyckas DAF med att rädda EWS/FLI-medierat förtryck över motivklasser. Dessa uppgifter tyder på att DAF behåller tillräckliga strukturella egenskaper hos EWS för att binda till och aktivera från GGAA-microsatellites, både proximal och distala till TSS. Detta beror sannolikt på den intakta SYGQ-domänen som tros vara viktig för EWS/FLI-aktivitet vid GGAA upprepar11. Dessa uppgifter tyder också på att de specifika tyrosiner som muteras i DAF spelar viktiga, men dåligt förstådda, roller i EWS/FLI-medierad genreglering från HA-platser, liksom i genförtryck, vilket belyser ett viktigt område för ytterligare undersökning.

Figure 1
Bild 1: Arbetsflöde. Avbildning av steg-för-steg-proceduren för att utföra strukturfunktionsmappning av transkriptomik. Cellerna förbereddes först för att uttrycka den uppsättning konstruktioner som krävs för struktur-funktion mappning. Efter uttryck skördades celler för RNA och protein och analyseras för korrelativa fenotyper. Uttryck av konstruktionerna validerades, och denna process upprepades 3-4 gånger för att samla oberoende biologiska replikat. RNA lämnades sedan in för nästa generations sekvensering (NGS). När data togs emot trimmades data för kvalitet, justerades och antal per transkription beräknades. Batch effekter kontrollerades för och transkriptomic signaturer och differentiell uttryck fastställdes med hjälp av DESeq2. Hierarkisk kluster- och nedströms analys som integrerar andra omics-datamängder och olika utbildnings-eller funktions analys kan införlivas. Klicka här för att se en större version av den här figuren.

Figure 2
Figur 2: Validering av konstruktionsuttryck och korrelativa analyser. (A) Schematisk som visar de konstruktioner som testas i det här exemplet. (B) Validering av knockdown av endogen EWS/FLI och uttryck för 3X-FLAG-märkta konstruktioner med immunoblot. (C,D) Validering av konstruktionsaktivitet vid en EWS/FLI(C) aktiverad målgen, NR0B1och (D) undertryckt målgen, TGFBR2,av qRT-PCR. Data presenteras som medelvärde +/- standardavvikelse. P-värden beräknades med en Tukeys ärliga signifikanstest. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Koloni räknas från mjuka agaranalyser som utförs för att bedöma transformeringsaktiviteten hos konstruktioner. P-värden beräknades med en Tukeys ärliga signifikanstest. * p < 0,05, ** p < 0,01, *** p < 0,005. Denna siffra är anpassad från Theisen, et al.23Klicka här för att se en större version av denna figur.

Figure 3
Figur 3: Slutliga insamlade räkningsdata för analys. Skärmbild av de första 6 raderna i räkningsfilen med gen räknas för att alla prover ska normaliseras och analyseras. Klicka här för att se en större version av den här figuren.

Figure 4
Bild 4: Prov-till-prov avstånd värmekartor. ( A)Avståndsdiagram från prov till prov som visar provklustering av rådata. Exempel som klumpas både per batch och efter exempel betecknas med röda pilar. b)Prov-till-prov-avståndsdiagram efter batchnormalisering med ComBat. Här replikerar exempel från alla kluster tillsammans, oberoende av batch. Klicka här för att se en större version av den här figuren.

Figure 5
Figur 5: Resultat av differentialuttrycksanalys. (A) Pca-diagram (Principle Component Analysis) av de transkriptomiska signaturer som genereras för alla prover visar på en stark klustring inom urvalet och visar att DAF är mellanliggande mellan de positiva (wtEF) och negativa (Δ22) kontrollerna. b)Vulkandiagram som visar -log(p-värde) ritade mot log2FoldChange för gener i varje konstruktion. Gener med justerat p-värde < 0,05 och en |log2(FoldChange)| > 1 anses vara signifikanta och visas i rött. Panel 5B är anpassad från Theisen, et al.23Klicka här för att se en större version av denna figur.

Figure 6
Figur 6: Hierarkisk klustring för att identifiera genklasser. (A) Hierarkisk klustring av de 1000 mest varierande generna i alla konstruktioner och baslinjen, iEF, visar att DAF delvis räddar EWS/FLI-medierad genaktivering. (B) Gen ontologi (molekylär funktion) resultat från ToppGene visar funktionell berikning av EWS/FLI-aktiverade gener som antingen räddas eller inte räddas av DAF. Panel 6B är anpassad från Theisen, et al.23Klicka här för att se en större version av denna figur.

Figure 7
Figur 7: Detaljerad analys av olika transkriptionsfaktorsvarselement till olika konstruktioner: (A) Schematisk som visar den databehandling som används för att generera paneler (B) och (C) genom att införliva andra tillgängliga datamängder med transkriptomiska profiler här. (B,C) Sammanställning som visar räddning av olika klasser av direkta EWS/FLI- (B) aktiverade och (C) undertryckta mål. Gener som ingick var endast de gener med detekterbara differentialuttryck av endogena EWS/FLI. I varje cirkeldiagram visar grått den del av gener som inte räddas av konstruktionen. Rött avbildar den del av gener som är differentiellt aktiverade, och blått visar den del av gener som är differentiellt undertryckta. Denna siffra är anpassad från Theisen, et al.23Klicka här för att se en större version av denna figur.

Bild S1: Ladda fastq.gz-filerna till HPC-miljön, trimma och trimma. Klicka här för att ladda ner den här siffran.

Bild S2: Sortera läsantal över exempel och köra batch normalisering med ComBat. Klicka här för att ladda ner den här siffran.

Figur S3: Köra DESeq2 och extrahera resultat av differentialuttrycksanalys. Klicka här för att ladda ner den här siffran.

Bild S4: Analysera utdata. Klicka här för att ladda ner den här siffran.

Figur S5: Hierarkisk klustring för att identifiera genklasser: Hierarkisk klustring av de 1000 mest variabla generna i alla konstruktioner och baslinjen, iEF, sorterad i k-kluster. I det här fallet k=7, men den här parametern anges av användaren enligt bild S4D. Klicka här för att ladda ner den här siffran.

Tabell S1: Lista över gener (Ensembl-gen-ID) med klusteranteckning. Klicka här för att ladda ner den här tabellen.

Discussion

Att studera de biokemiska mekanismerna hos onkogena transkriptionsfaktorer är av avgörande betydelse för att förstå de sjukdomar de orsakar och för att utforma nya terapeutiska strategier. Detta gäller särskilt i maligniteter som kännetecknas av kromosomal flyttningar som resulterar i fusion transkription faktorer. De domäner som ingår i dessa chimerproteiner kan sakna meningsfulla interaktioner med regleringsområden som finns i proteinerna av vild typ, vilket komplicerar förmågan att tolka strukturfunktionsinformation i samband medfusionen 26,27,28. Dessutom kännetecknas många av dessa onkogena fusioner av lågkomplexitet i sig oordnade domäner10,13,29,30.

EWS-domänen är ett exempel på en sådan inneboende oordnad domän som är involverad i en mängd olika onkogena fusioner10. Den inneboende oordnade och repetitiva naturen har hindrat ansträngningarna att förstå de molekylära mekanismer som används av EWS-domänen. Tidigare ansträngningar för att undersöka strukturfunktionen har till stor del tillgripit att använda olika mutanter i samband med reportergenanalyser eller i cellbakgrunder som inte rekapitulerar det relevanta cellulära sammanhanget, eller saknar strukturella variationer som ger meningsfull partiell funktion11,17,25. Metoden som presenteras här tar upp dessa problem. Strukturfunktionsmappning utförs i en sjukdomsrelevant cellkontext och nästa generations sekvensering gör det möjligt för transkriptomisk profilering att utvärdera transkriptionsfaktorfunktionen i inställningen av inbyggt kromatin. I det specifika fallet av DAF mutant av EWS/FLI, DAF rapporterades att visa liten aktivitet i reporter analyser med hjälp av isolerade svar element, men att visa aktivitet i samband med den fullständiga gen promotorn, antingen i en reporter analys eller i infödda kromatin, tyder på en intressant fenotyp23. Genom att använda metoden som beskrivs här löser mer direkt frågan om vilken typ av regulatoriska element över genomet som är mest lyhörda i sjukdomsinställningen. Genom att testa alla kandidatmålgener i deras ursprungliga kromatinkontext samtidigt är det mer sannolikt att ett transkriptomiskt tillvägagångssätt identifierar konstruktioner med partiell funktion.

Den inneboende styrkan i att använda en sjukdomsrelevant cellbakgrund är kanske den största begränsningen av denna teknik. En av de viktigaste faktorerna är att välja lämpligt cellsystem för dessa experiment. Många cellinjer som härrör från maligniteter med patognomoniska transkriptionsfaktorer tolererar inte lätt knockdown av den transkriptionsfaktorn, och i många fall, särskilt för pediatrisk cancer, är den sanna ursprungscellen fortfarande kontroversiell och uttrycket av onkogen i andra cellbakgrunder är oöverkomligt giftigt31,32 . I dessa fall kan det vara bra att utföra experiment i en annan cellbakgrund, så länge forskaren är försiktig vid tolkningen av resultaten och på lämpligt sätt validerar relevanta fynd i en mer sjukdomsrelevant celltyp.

Det är av avgörande betydelse att noggrant validera stabilitet och fenotypiska konsekvenser av uttrycket av onkogenen och att endast lämna prover för sekvensering som uppfyller strikta kriterier. Här inkluderade detta västra fläck för att bekräfta knockdown och räddning, och qRT-PCR av ett litet antal kända målgener för att validera den positiva kontrollen (figur 2). Det är också viktigt att minska så mycket batchvariation som möjligt genom att noggrant utföra cell- och RNA-preparaten så på samma sätt som möjligt genom varje sats.

Metoden som beskrivs här blir särskilt kraftfull när den paras ihop med andra typer av genomiska data som talar till genom-wide funktionen av transkriptionsfaktorn som studeras. Framtida anvisningar för denna typ av struktur-funktion analys skulle utvidgas till att omfatta ChIP-seq och ATAC-seq för att bestämma bindningen av transkriptionsfaktorn och eventuella inducerade förändringar i kromatin tillgänglighet. Som en svit kan denna typ av data peka på var olika strukturella komponenter i en onkogen transkriptionsfaktor bidrar till olika aspekter av funktionen (dvs. DNA-bindning kontra kromatinmodifiering kontra rekrytering av medregulator). Sammantaget kan användning av NGS-baserade metoder för att kartlägga struktur-funktionsrelationerna för fusions transkriptionsfaktorer avslöja nya insikter i de biokemiska bestämningsfaktorerna för dessa proteiners onkogena funktion. Detta är viktigt för att främja vår förståelse av de sjukdomar de orsakar och för att möjliggöra utvecklingen av nya terapeutiska strategier.

Disclosures

SLL förklarar en intressekonflikt som medlem i den rådgivande nämnden för och aktieägare i Salarius Pharmaceuticals. SLL är också en listad uppfinnare på United States Patents No. US 7.393.253 B2, "Metoder och sammansättningar för diagnos och behandling av Ewings Sarcoma," och US 8.557.532, "Diagnos och behandling av läkemedelsresistent Ewings sarkom." Detta ändrar inte vår efterlevnad av JoVE:s policyer för delning av data och material.

Acknowledgments

Denna forskning stöddes av High Performance Computing Facility vid Abigail Wexner Research Institute vid Nationwide Children's Hospital. Detta arbete stöddes av National Institutes of Health National Cancer Institute [U54 CA231641 till SLL, R01 CA183776 till SLL]; Alex's Lemonade Stand Foundation [Young Investigator Award to ERT]; Pelotonia [Stipendium till ERT]; och National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 till KIP].

Materials

Name Company Catalog Number Comments
Wet Lab Reagents
anti-FLI rabbit pAb Abcam ab15289 1:500
anti-lamin B1 rabbit pAb Abcam ab16048 1:2000
Cell-based system for introduction of mutant constructs Determined by cell system used
Cryotubes For viral aliquots
DMEM Corning Cellgro 10-013-CV For viral production
Fetal bovine serum Gibco 16000-044 For viral production
G418 ThermoFisher 10131027 For viral production
HEK293-EBNAs ATCC CRL-10852 For viral production
HEPES Gibco 15630106
Hygromycin B ThermoFisher 10687010
M2 anti-FLAG mouse mAb Sigma F3165 1:2000
Near IR-secondary antibodies Li-Cor
Optimem Gibco 31985062 For viral production
Penicillin/Streptomycin/Glutamine Gibco 10378-016 For viral production
Polybrene Sigma TR-1003-G For viral transduction
Puromycin Sigma P8833 Stored at 2 mg/mL stock
RNeasy Plus kit Qiagen 74136 Has gDNA removal columns
Selection reagents As dictated by cell system used
Sodium Pyruvate Gibco 11360-070 For viral production
Tissue culture media Determined by cell system used
TransIT-LT1 Mirus MIR 2304 For viral production
Software
Access to HPC environment
AnnotationDbi 1.38.2
Cairo 1.5-10
DESeq2 1.16.1
genefilter 1.58.1
ggbiplot 0.55
ggplot2 3.1.1
org.Hs.eg.db 3.4.1
pheatmap 1.0.12
PuTTY
R 3.4.0
RColorBrewer 1.1-2
reshape2 1.4.3
rgl 0.100.19
R-studio
STAR Version 2.6 or later
sva 3.24.4
TrimGalore!
WinSCP

DOWNLOAD MATERIALS LIST

References

  1. Miettinen, M., et al. New fusion sarcomas: histopathology and clinical significance of selected entities. Human Pathology. 86, 57-65 (2019).
  2. Knott, M. M. L., et al. Targeting the undruggable: exploiting neomorphic features of fusion oncoproteins in childhood sarcomas for innovative therapies. Cancer and Metastasis Reviews. 38, 625-642 (2019).
  3. Yoshihara, K., et al. The landscape and therapeutic relevance of cancer-associated transcript fusions. Oncogene. 34, 4845-4854 (2015).
  4. Duesberg, P. H. Cancer genes generated by rare chromosomal rearrangements rather than activation of oncogenes. Medical Oncology and Tumor Pharmacotherapy. 4, 163-175 (1987).
  5. Dupain, C., Harttrampf, A. C., Urbinati, G., Geoerger, B., Massaad-Massade, L. Relevance of Fusion Genes in Pediatric Cancers: Toward Precision Medicine. Molecular Therapy - Nucleic Acids. 6, 315-326 (2017).
  6. Mitelman, F., Johansson, B., Mertens, F. The impact of translocations and gene fusions on cancer causation. Nature Reviews Cancer. 7, 233-245 (2007).
  7. Smith, R., et al. Expression profiling of EWS/FLI identifies NKX2.2 as a critical target gene in Ewing's sarcoma. Cancer Cell. 9, 405-416 (2006).
  8. Davicioni, E., et al. Identification of a PAX-FKHR gene expression signature that defines molecular classes and determines the prognosis of alveolar rhabdomyosarcomas. Cancer Research. 66, 6936-6946 (2006).
  9. Gröbner, S. N., et al. The landscape of genomic alterations across childhood cancers. Nature. 555, 321-327 (2018).
  10. Kim, J., Pelletier, J. Molecular genetics of chromosome translocations involving EWS and related family members. Physiological Genomics. 1, 127-138 (1999).
  11. Boulay, G., et al. Cancer-Specific Retargeting of BAF Complexes by a Prion-like Domain. Cell. 171, 163-178 (2017).
  12. Lessnick, S. L., Braun, B. S., Denny, C. T., May, W. A. Multiple domains mediate transformation by the Ewing’s sarcoma EWS/FLI-1 fusion gene. Oncogene. 10, 423-431 (1995).
  13. Leach, B. I., et al. Leukemia fusion target AF9 is an intrinsically disordered transcriptional regulator that recruits multiple partners via coupled folding and binding. Structure. 21, 176-183 (2013).
  14. Ng, K. P., et al. Multiple aromatic side chains within a disordered structure are critical for transcription and transforming activity of EWS family oncoproteins. Proceedings of the National Academy of Sciences U.S.A. 104, 479-484 (2007).
  15. Riggi, N., et al. EWS-FLI1 Divergent Chromatin Remodeling Mechanisms to Directly Activate or Repress Enhancer Elements in Ewing Sarcoma. Cancer Cell. 26, 668-681 (2014).
  16. Tomazou, E. M., et al. Epigenome Mapping Reveals Distinct Modes of Gene Regulation and Widespread Enhancer Reprogramming by the Oncogenic Fusion Protein EWS-FLI1. Cell Reports. 10, 1082-1095 (2015).
  17. Sankar, S., et al. Mechanism and relevance of EWS/FLI-mediated transcriptional repression in Ewing sarcoma. Oncogene. 32, 5089-5100 (2013).
  18. Gangwal, K., et al. Microsatellites as EWS/FLI response elements in Ewing's sarcoma. Proceedings of the National Academy of Sciences U.S.A. 105, 10149-10154 (2008).
  19. Gangwal, K., Close, D., Enriquez, C. A., Hill, C. P., Lessnick, S. L. Emergent Properties of EWS/FLI Regulation via GGAA Microsatellites in Ewing's Sarcoma. Genes & Cancer. 1, 177-187 (2010).
  20. Guillon, N., et al. The Oncogenic EWS-FLI1 Protein Binds In Vivo GGAA Microsatellite Sequences with Potential Transcriptional Activation Function. PLoS One. 4, 4932 (2009).
  21. Chong, S., et al. Imaging dynamic and selective low-complexity domain interactions that control gene transcription. Science. 361, (2018).
  22. Johnson, K. M., et al. Role for the EWS domain of EWS/FLI in binding GGAA-microsatellites required for Ewing sarcoma anchorage independent growth. Proceedings of the National Academy of Sciences U.S.A. 114, 9870-9875 (2017).
  23. Theisen, E. R., et al. Transcriptomic analysis functionally maps the intrinsically disordered domain of EWS/FLI and reveals novel transcriptional dependencies for oncogenesis. Genes & Cancer. 10, 21-38 (2019).
  24. Chen, J., Bardes, E. E., Aronow, B. J., Jegga, A. G. ToppGene Suite for gene list enrichment analysis and candidate gene prioritization. Nucleic Acids Research. 37, 305-311 (2009).
  25. Johnson, K. M., Taslim, C., Saund, R. S., Lessnick, S. L. Identification of two types of GGAA-microsatellites and their roles in EWS/FLI binding and gene regulation in Ewing sarcoma. PLOS One. 12, 0186275 (2017).
  26. Kim, P., Ballester, L. Y., Zhao, Z. Domain retention in transcription factor fusion genes and its biological and clinical implications: a pan-cancer study. Oncotarget. 8, 110103-110117 (2017).
  27. de Mendíbil, I. O., Vizmanos, J. L., Novo, F. J. Signatures of Selection in Fusion Transcripts Resulting from Chromosomal Translocations in Human Cancer. PLOS One. 4, 4805 (2009).
  28. Frenkel-Morgenstern, M., Valencia, A. Novel domain combinations in proteins encoded by chimeric transcripts. Bioinformatics. 28, 67-74 (2012).
  29. Hegyi, H., Buday, L., Tompa, P. Intrinsic Structural Disorder Confers Cellular Viability on Oncogenic Fusion Proteins. PLoS Computational Biology. 5, 1000552 (2009).
  30. Latysheva, N. S., Babu, M. M. Discovering and understanding oncogenic gene fusions through data intensive computational approaches. Nucleic Acids Research. 44, 4487-4503 (2016).
  31. Deneen, B., Denny, C. T. Loss of p16 pathways stabilizes EWS/FLI1 expression and complements EWS/FLI1 mediated transformation. Oncogene. 20, 6731-6741 (2001).
  32. Kendall, G. C., et al. PAX3-FOXO1 transgenic zebrafish models identify HES3 as a mediator of rhabdomyosarcoma tumorigenesis. eLife. 7, 33800 (2018).

Tags

Cancerforskning nummer 160 transkriptomik RNA-seq strukturfunktion transkriptionsfaktorer inneboende oordnade domäner EWS/FLI Ewing sarkom genreglering
Kartläggning av strukturfunktionsrelationer för oordnade onkogena transkriptionsfaktorer med transkriptomisk analys
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Showpnil, I. A., Miller, K. R.,More

Showpnil, I. A., Miller, K. R., Taslim, C., Pishas, K. I., Lessnick, S. L., Theisen, E. R. Mapping the Structure-Function Relationships of Disordered Oncogenic Transcription Factors Using Transcriptomic Analysis. J. Vis. Exp. (160), e61564, doi:10.3791/61564 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter