Cancer Research

Kartlegging av strukturfunksjonsrelasjoner av uordnede onkogene transkripsjonsfaktorer ved hjelp av transkripsjonsanalyse

Published: June 27, 2020 doi: 10.3791/61564

Iftekhar A. Showpnil^1,2, Kyle R. Miller¹, Cenny Taslim¹, Kathleen I. Pishas¹, Stephen L. Lessnick^1,3, Emily R. Theisen^1,4

¹Center for Childhood Cancer and Blood Diseases, Abigail Wexner Research Institute at Nationwide Children's Hospital, ²Molecular, Cellular, and Developmental Biology Program, The Ohio State University, ³Division of Pediatric Hematology/Oncology/Blood & Marrow Transplant, The Ohio State University, ⁴Department of Pediatrics, The Ohio State University

Summary

Iboende uordnede domener er viktige for onkogen fusjonstranskripsjonsfaktorfunksjon. For å terapeutisk målrette disse proteinene, er det nødvendig med en mer detaljert forståelse av reguleringsmekanismene som brukes av disse domenene. Her bruker vi transkripsjon for å kartlegge viktige strukturelle egenskaper ved det iboende uordnede EWS-domenet i Ewing sarkom.

Abstract

Mange kreftformer er preget av kromosomale translokasjoner som resulterer i uttrykk for onkogene fusjonstranskripsjonsfaktorer. Vanligvis inneholder disse proteinene et iboende uorden domene (IDD) smeltet sammen med DNA-bindende domene (DBD) av et annet protein og orkestrerer utbredte transkripsjonsendringer for å fremme malignitet. Disse fusjonene er ofte den eneste tilbakevendende genomiske avviket i kreften de forårsaker, noe som gjør dem attraktive terapeutiske mål. Imidlertid krever målretting av onkogen transkripsjonsfaktorer en bedre forståelse av den mekanistiske rollen som lav kompleksitet, IDD-er spiller i deres funksjon. N-terminaldomenet til EWSR1 er en IDD involvert i en rekke onkogene fusjonstranskripsjonsfaktorer, inkludert EWS / FLI, EWS / ATF og EWS / WT1. Her bruker vi RNA-sekvensering for å undersøke de strukturelle egenskapene til EWS-domenet som er viktig for transkripsjonsfunksjonen til EWS / FLI i Ewing sarkom. Første shRNA-medierte uttømming av den endogene fusjonen fra Ewing sarkomceller sammen med ektopisk uttrykk for en rekke EWS-mutantkonstruksjoner utføres. Deretter brukes RNA-sekvensering til å analysere transkripsjonen av celler som uttrykker disse konstruksjonene for å karakterisere de funksjonelle underskuddene forbundet med mutasjoner i EWS-domenet. Ved å integrere de transkripsjonsanalysene med tidligere publisert informasjon om EWS/FLI DNA-bindende motiver, og genomisk lokalisering, samt funksjonelle analyser for transformeringsevne, kunne vi identifisere strukturelle trekk ved EWS/FLI som er viktige for onkogenese og definere et nytt sett med EWS/FLI-målgener som er kritiske for Ewing sarkom. Dette dokumentet demonstrerer bruken av RNA-sekvensering som en metode for å kartlegge strukturfunksjonsforholdet til det iboende uordnede domenet til onkogene transkripsjonsfaktorer.

Introduction

En undergruppe av kreft, inkludert mange maligniteter i barndommen og ungdomsårene, er preget av kromosomale translokasjoner som genererer ny^fusjononcogenes 1^,²^,³^,⁴^,⁵^,⁶. De resulterende fusjonsproteinene fungerer ofte som onkogene transkripsjonsfaktorer, og orkestrerer utbredte endringer i transkripsjonsregulering for å fremme tumorigenesis⁷^,⁸. Kreft med disse translokasjonene har vanligvis et ellers stille mutasjonslandskap, med få tilbakevendende genomiske avvik bortsett fra den patognomiske^{fusjonen 4}^,⁹. Som sådan er direkte målretting av fusjonsproteinet en attraktiv terapeutisk strategi i disse sykdommene. Imidlertid består disse onkogene transkripsjonsfaktorene vanligvis av en lav kompleksitet, iboende uorden, transkripsjonelt aktiverende domene smeltet sammen med et DNA-bindende domene (DBD)^10,^11,^12,¹³^,¹⁴. Både de iboende uordnede domenene (IDDene) og DBDene til disse proteinene har vist seg vanskelig å målrette mot konvensjonelle farmakologiske tilnærminger. Utvikling av nye terapeutiske tilnærminger krever derfor en mer detaljert molekylær forståelse av mekanismene som brukes av disse fusjonene for å regulere genuttrykket.

Den N-terminale IDD-delen av EWSR1 smeltes vanligvis sammen til en DBD i kreft, inkludert EWS/FLI i Ewing sarkom, EWS/WT1 i diffus liten rundcelletumor og EWS/ATF1 i klarcellet sarkom av myke deler¹⁰. Den mekanistiske rollen til EWS IDD i hver av disse fusjonene er ufullstendig forstått. EWS/ETS-familien av fusjoner, spesielt EWS/FLI, er den mest funksjonelt karakteriserte til dags dato. EWS/FLI koordinerer genomomfattende epigenetiske og transkripsjonelle endringer som fører til aktivering og undertrykkelse av tusenvis av gener^7,^11,¹⁵^,¹⁶. Studier har vist at IDD er viktig for rekruttering av både transkripsjonelle medaktivatorer (som p300, WDR5 og BAF-komplekset), samt medundertrykkere (for eksempel NuRD-komplekset)¹¹^,¹⁵^,¹⁷. Sammensmeltingen av EWS IDD til C-terminaldelen av FLI1 gir ny DNA-bindende spesifisitet til ETS DBD av FLI1, slik at fusjons-onkoproteinet (EWS/FLI) binder seg til repeterende GGAA-mikrosalittregioner av genomet i tillegg til konsensus ETS-motivet¹⁸^,¹⁹^,²⁰. Kombinert med rekrutteringsfunksjonen for medaktivator, denne nye DNA-bindende aktiviteten til EWS/FLI fremmer de novo enhancerformasjon ved GGAA-mikrosatellitter som er distale for transkripsjonsstartsteder (TSS) ("enhancer-lignende" mikrosatellitter) og rekrutterer RNA polymerase II for å fremme transkripsjon ved GGAA-mikrosatellitter proksimalt til TSS ("promotorlignende" mikrosatellitter)^11,¹⁵^,¹⁶^,²¹.

Samlet sett førte disse dataene oss til å hypotese at diskrete elementer i EWS-domenet bidrar til rekruttering av distinkte medregulatorer til forskjellige typer EWS / FLI-bindingssteder. Imidlertid har det å skjelne disse elementene i EWS-delen av EWS / FLI, og hvordan de fungerer, blitt hindret av domenets svært repeterende og uordnede natur. Her bruker vi et tidligere publisert knockdown-redningssystem i Ewing sarkomceller for å kartlegge disse elementene i EWS IDD funksjonelt. I dette systemet EWS/FLI er utarmet ved hjelp av en shRNA rettet mot 3'UTR av FLI1 genet, og uttrykket er reddet med varierende EWS / FLI mutant cDNA konstruksjoner mangler 3'UTR⁷^,¹⁷^,²². Disse eksperimentene fokuserte på konstruksjoner med ulike slettinger for å kartlegge strukturfunksjonsforholdet mellom EWS IDD og viktige onkogene fenotyper, inkludert aktivering av en GGAA-mikrosalittreporterkonstruksjon, koloniformasjonsanalyser og målrettet validering av EWS / FLI-aktiverte og -undertrykte gener⁷^,¹⁷^,²² . Disse studiene fant imidlertid ikke atskilte underdomener i EWS IDD i EWS/FLI som er unikt viktige for enten aktivering eller undertrykkelse. Alle testede konstruksjoner var enten i stand til både å aktivere og undertrykke spesifikke målgener, noe som førte til effektiv kolonidannelse, eller ute av stand til å regulere noen av EWS / FLI-målgenene, noe som førte til tap av kolonidannelse^7,¹⁷^,²².

Transkripsjonsanalyser som aktiveres av den utbredte adopsjonen av neste generasjons sekvensering, brukes ofte til å sammenligne genuttrykkssignaturer under to forhold, ofte i sammenheng med screening eller beskrivende studier. Vi ønsket i stedet å utnytte evnen til å fange opp genomomfattende uttrykksdata ved hjelp av RNA-sekvensering (RNA-seq) for å karakterisere bidragene fra IDD-er til transkripsjonsfaktorfunksjon. I dette tilfellet er RNA-seq forbundet med knockdown-redningssystemet for å utforske strukturfunksjonsforholdet til EWS-domenet. Denne tilnærmingen gjelder for andre fusjonstranskripsjonsfaktorer, inkludert andre EWS-fusjoner eller wildtype transkripsjonsfaktorer med dårlig forstått funksjon, og har flere fordeler i forhold til de andre analysene som brukes til funksjonelle kartstudier, for eksempel reporteranalyser eller målrettet qRT-PCR. Disse inkluderer testing av strukturelle determinanter av funksjon i relevant kromatinkontekst, evnen til å teste flere typer responselementer i en analyse (dvs. aktivert og undertrykt, GGAA-mikrosalat og ikke-mikrosalat, etc.), og den resulterende evnen til bedre å oppdage delvis funksjon.

Vellykket implementering av denne tilnærmingen avhenger av et cellebasert system som fanger opp fenotypene av interesse (i dette tilfellet A673-celler med shRNA-mediert EWS / FLI-uttømming), og et panel av mutantkonstruksjoner i en uttrykksvektor som passer for det cellebaserte systemet (i dette tilfellet pMSCV-hygro med forskjellige 3x-FLAG-taggede EWS / FLI-mutanter som skal leveres av retroviral transduksjon). Viral transduksjon av enten CRISPR-baserte uttømmingskonstruksjoner, shRNA-baserte uttømmingskonstruksjoner og cDNA-uttrykkskonstruksjoner med passende valg for å generere stabile cellelinjer anbefales over forbigående transfeksjon. Nedstrøms tolkningen av resultatene styrkes når de transkripsjonsmessige dataene kan kobles sammen med andre data relatert til lokalisering av transkripsjonsfaktoren og andre fenotypiske avlesninger der det er tilgjengelig.

I dette dokumentet bruker vi denne tilnærmingen til å karakterisere aktiviteten til DAF-mutanten til EWS / FLI¹⁴. DAF-mutanten har 17 tyrosin til alaninmutasjoner i de repeterende områdene i EWS IDD for EWS/FLI¹⁴. Denne spesielle EWS-mutanten hadde tidligere blitt rapportert og kan ikke aktivere reportergenuttrykk når den ble smeltet sammen til ATF1 DBD¹⁴. Foreløpige qRT-PCR-data antydet imidlertid at denne mutanten var i stand til å aktivere transkripsjon av EWS / FLI-målet NR0B1²³. Den transkripsjonsomiske tilnærmingen som er beskrevet her, gjorde det mulig å oppdage delvis funksjon av DAF-mutanten. Ved å parre disse transkripsjonsdataene med informasjon om EWS/FLI-bindings- og anerkjennelsesmotiver viser vi videre at DAF-mutanten beholder funksjonen ved GGAA-mikrosalat repetisjoner. Disse resultatene identifiserer DAF som den første delvis funksjonelle EWS/FLI mutant og fremhever funksjon ved ikke-mikrosatellittgener som viktige for onkogenese (som rapportert²³). Dette viser kraften i denne transkripsjonsstrukturfunksjonskartleggingsmetoden for å gi innsikt i funksjonen til onkogene transkripsjonsfaktorer.

Protocol

1. Sett opp in vitro-panel av konstruksjoner

MERK: Dette trinnet vil variere avhengig av det spesifikke proteinet som skal analyseres.

Forbered aliquots av virus for uttømming og uttrykk konstruksjoner etter behov.
1. Frø en 10 cm vev kulturrett med 3-5 x 10⁶ HEK293-EBNA eller HEK293T celler for hver konstruksjon som trengs for viral transduksjon. La cellene holde seg over natten i Dulbecco's Modified Eagle Media (DMEM) supplert med 10% foster bovint serum (FBS), penicillin/streptomycin/glutamin (P/S/Q) og 0,3 mg/ml G418.
  MERK: HEK293-EBNA- og HEK293T-celler anbefales for virusproduksjon fordi de er enkle å vokse, har høy transfeksjonseffektivitet og effektivt uttrykker rekombinante proteiner fra episomale plasmider. Cellene skal være mellom 50-70% sammenfallende dagen for transfeksjon.
2. Forbered en transfeksjonsblanding for hver virale transduksjonskonstruksjon. Kombiner 2 ml redusert serummedie med 90 μL transfeksjonsreagens.
  MERK: Forvarming av reduserte serummedier anbefales.
3. Tilsett 10 μg hver av en viral emballasjeplasmid (f.eks. gag-pol), viral konvoluttplasmid (f.eks. VSV-G), og en av enten CRISPR-basert uttømming, shRNA-basert uttømming eller cDNA-uttrykkskonstruksjon (f.eks. pMKO eller pMSCV) i transfeksjonsblandingen. Bland godt ved skånsom pipettering.
4. La transfeksjonsblandingen sitte i 20 min ved romtemperatur. Fjern HEK293-EBNA vekstmedier fra vevskulturretter og tilsett 3 ml DMEM supplert med 10% FBS, P / S / Q og 10 mM natriumpyronat. Til hver tallerken, tilsett 2 ml transfeksjonsblanding dråpevis. La cellene sitte i transfeksjonsmedier over natten i en inkubator ved 37 °C og 5 % CO₂.
5. Neste morgen legger du til 20 ml DMEM-medier med 10% FBS, P / S / Q-tilskudd og 10 mM natriumpyuvatt. Inkuber cellene i den ved 37 °C og 5 % CO₂ for natten.
6. Neste morgen erstatter du medier med 5 ml virale innsamlingsmedier (VCM) (DMEM supplert med 10 % varmeinaktivert FBS, P/S/Q og 20 mM HEPES).
7. Etter 4 timer, samle VCM fra plater og lagre i en 50 ml konisk rør på is ved 4 °C. Bytt ut med 5 ml fersk VCM.
8. Etter 4 timer, samle VCM fra plater i samme 50 ml koniske rør og oppbevar på is ved 4 °C. Bytt ut med 8 ml fersk VCM for henting over natten.
9. Om morgenen samle VCM fra tallerkener og lagre i 50 ml konisk rør på is ved 4 °C. Bytt ut med 5 ml fersk VCM.
10. Etter 4 timer, samle VCM fra plater og lagre i 50 ml konisk rør på is ved 4°C. Bytt ut med 5 ml fersk VCM. Etter 4 timer, samle VCM fra plater og legg til 50 ml konisk rør.
11. Aliquot-kolleksjoner fra 50 ml rør til kryorør (2 ml per aliquot) etter filtrering gjennom et 0,45 μm filter. Oppbevar virale aliquots ved -80 °C til bruk.
  MERK: Protokollen kan settes på pause her, og de virale aliquots kan lagres til de er klare til bruk.
Frøceller med riktig tetthet i en 10 cm vevskulturrett. Mål 50% samløp. La cellene holde seg over natten ved å plassere i inkubatoren ved 37 °C som inneholder 5 % CO₂.
MERK: For A673-celler er dette 5 x 10⁶ celler i 10 ml DMEM-medier med 10% FBS, P / S / Q tilskudd og 10 mM natriumpyuvatt. Disse forholdene kan variere avhengig av vekstraten til cellene som brukes.
Tøm endogen interessefaktor. Hvis celler ikke trenger å ha det endogene proteinet av interesse utarmet, hopp fremover til trinn 1.4.
1. Tine viral aliquot for transduksjon av shRNA eller CRISPR konstruksjon rettet mot proteinet av interesse. Tin frosne aliquots raskt i et 37 °C vannbad.
2. Tilsett 2,5 μL 8 mg/ml polybren til hver virale aliquot og bland ved skånsom pipettering. Fjern medier fra plater av celler og legg forsiktig viral aliquot til 10 cm plate ved å pipetter langs siden av platen. Rock platen for å spre 2 ml viral aliquot.
3. Inkuber ved 37 °C i vevskulturinkubatoren i 2 timer. Gyng platen hver 30.
4. Tilsett 5 ml DMEM-medier med 10 % FBS-, P/S/Q-tilskudd og 10 mM natriumpyuvatt, med 5 μL 8 mg/ml polybren. La cellene inkubere over natten.
5. Om morgenen fjerner du medier fra celler og passasjeceller i medier supplert med et utvalgsreagens. Når du passerer celler, så dem på en måte som gjør at de kan vokse i 48-72 timer og nå 50% samløp.
  MERK: For A673-celler med pSRP-iEF-2 blir cellene sådd i en 1:5-splitt og valgt i 72 timer med 2 μg/ml puromycin.
Transduce cDNA-uttrykkskonstruksjoner.
1. Kontroller cellene for å bekrefte 50-70% samløp.
2. Tine virale aliquot(er) for transduksjon av cDNA konstruksjon(er) av interesse. Tin frosne aliquots raskt i et 37 °C vannbad. Tilsett 2,5 μL 8 mg/ml polybren til hver virale aliquot og bland ved forsiktig pipettering.
3. Fjern medier fra belagte celler og tilsett forsiktig viral aliquot til 10 cm plate ved å pipetter langs siden av platen. Rock platen for å spre 2 ml viral aliquot.
4. Inkuber ved 37 °C i vevskulturinkubatoren i 2 timer. Gyng platen hver 30.
5. Tilsett 5 ml DMEM-medier med 10 % FBS-, P/S/Q-tilskudd og 10 mM natriumpyuvatt, med 5 μL 8 mg/ml polybren. La cellene inkubere over natten.
6. Om morgenen fjerner du medier fra celler og passasjeceller i doble utvalgsmedier. Voks og passasje celler etter behov i 7-10 dager for å tillate dobbelt merking og uttrykk for cDNA-konstruksjonen.
  MERK: Denne delingen av dette avsnittet kan kreve optimalisering for forskjellige cellelinjer. For A673-celler med pSRP-iEF-2 og en pMSCV-hygrokonstruksjon overføres cellene uten å deles inn i 2 μg/ml puromycin og 100 μg/ml hygromycin.

2. Samle celler, valider uttrykk for konstruksjoner og sett opp korrelative fenotypiske analyser

Etter 7-10 dager med dobbelt utvalg samle celler i en 15 ml konisk rør. Tell innsamlede celler med et hemocytometer. Aliquot samlet celler for RNA-sekvensering og for å validere uttrykk for cDNA-konstruksjoner.
MERK: Sett opp eventuelle korrelative fenotypiske analyser som kreves av forskningsspørsmålet som undersøkes. Kolonidannende analyser er et eksempel på en korrelativ fenotypisk analyse som brukes her.
1. Samle mellom 5 x 10⁵ og 1 x 10⁶ celler for RNA-sekvensering og 2 x 10⁶ celler for proteinutvinning. Pelletsceller ved sentrifugering ved 1000 x g ved 4 °C i 5 minutter og fjern supernatanten.
2. Vask pelletsen med 1 ml kald PBS. Pellet ved sentrifugering ved 1000 x g ved 4 °C i 5 minutter og fjern supernatant. Flash frysepellets i flytende nitrogen og lagre ved -80 °C.
3. Definer eventuelle korrelative analyser med de gjenværende cellene.
  MERK: Protokollen kan settes på pause her med innsamlede prøver lagret i -80 °C fryseren.
Valider knockdown av protein av interesse (hvis brukt) og uttrykk for panelet av konstruksjoner.
1. Tine cellepellets for proteinutvinning på is. Resuspendceller i iskald 500 μL kjernefysisk ekstraksjonsbuffer (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glyserol, 1,5 mM MgCl₂, 1 mM EDTA, 1 mM DTT, 1% IGEPAL) med proteasehemmer. La den sitte i 5 min på is.
2. Pelletskjerner ved sentrifugering ved 1000 x g ved 4 °C i 5 minutter og fjern supernatant. Vask kjerner i 500 μL iskald kjernefysisk ekstraksjonsbuffer (20 mM HEPES pH 7,9, 140 mM NaCl, 10% glyserol, 1,5 mM MgCl₂, 1 mM EDTA, 1 mM DTT, 1% IGEPAL) med proteasehemmer.
3. Pelletskjerner ved sentrifugering ved 1000 x g ved 4 °C i 5 minutter og fjern supernatanten. Resuspendkjerner i 200 μL kald RIPA-buffer med proteasehemmer (juster volumet av RIPA-buffer i henhold til pelletsstørrelse.) La den sitte på is i 45-60 min med kraftig virvel hver 15 min.
4. Pelletscelleavfall ved sentrifugering ved 16.000 x g ved 4 °C i 45-60 min. Hold supernatanten og overfør til et friskt kaldt rør
5. Forbered prøver for SDS-PAGE elektroforese ved å koke 5-10 μg protein med 1x lastebuffer i 5 min. Kjør en SDS-PAGE gel etter behov for proteinet av interesse.
6. Overfør til en nitrocellulose eller PVDF membran etter behov for protein av interesse. Blokker, og flekkete med de riktige primære og sekundære antistoffene for å bekrefte nedslag av det endogene proteinet (hvis brukt) og ektopisk uttrykk for cDNA-konstruksjonen.
  MERK: Protokollen kan settes på pause her.
Trekk ut RNA. Vurder RNA kvalitet og kvantitet.
1. Tine cellepellets på is. Trekk ut total RNA ved hjelp av et silikaspinkolonnebasert ekstraksjonssett i henhold til produsentens instruksjoner.
2. Kort sagt, lyse cellene ved hjelp av lysis bufferen fra settet. Enten bruke lysate på en silika spin-kolonne med et kort spinn på >13000 rpm i 30-60 sekunder eller fjerne gDNA ved å bruke lysate på en gDNA fjerning kolonne med et kort spinn på >13000 rpm i 30-60 sekunder.
3. Utfør en DNA-fordøyelse på kolonnen hvis lysat ble direkte påført en silikaspinsøyle. Hvis du bruker en gDNA-fjerningskolonne, bruker du eluate på en silika-spinnkolonne med et kort spinn ved >13000 rpm i 30-60 s.
4. Vask RNA på kolonnen i henhold til produsentens instruksjoner. Elute RNA i 30 μL elutionbuffer.
5. Vurder RNA-kvalitet og kvantitet ved hjelp av et fluorometer eller et annet sammenlignbart instrument. Kontroller at 260/280-forholdet er nær 2 og at det er minst 2,5 μg RNA å sende inn for sekvensering.
  MERK: Etter hvert som replikeringer samles inn, må hver replikering behandles med samme RNA-ekstraksjonsprotokoll.
6. Bruk en liten aliquot av RNA for å bekrefte den stabile nedslag av proteinet av interesse, om nødvendig, av qRT-PCR. Oppbevar den gjenværende RNA-prøven ved -80 °C.
7. Samle biologiske repliker ved å gjenta trinn 1-2 til 3-4 komplette sett med RNA er samlet inn. Forsikre deg om at hver replikering viser tilstrekkelig uttrykk for cDNA-konstruksjoner og stabil nedslag av det endogene proteinet (hvis det brukes).

3. Neste generasjons sekvensering

Send ut utvunnet RNA som skal sekvenseres ved hjelp av en neste generasjons sekvenseringsplattform med et mål på 50 millioner 150 basispar (bp) parvise sluttlesninger. Følg instruksjonene fra anlegget som behandler prøvene. Velg for poly-adenylerte RNAer og strandspesifikk sekvensering.

4. Rørledning for justering og transkripsjonstelling

MERK: Denne protokollen forutsetter at etter eksempelsending og -behandling returneres et sett med sammenkoblede FASTQ-filer for hvert eksempel. Disse filene komprimeres ofte med et suffiks av "fastq.gz". Videre analyse av disse FASTQ filer vil kreve tilgang til en høy ytelse databehandling (HPC) anlegget kjører en Linux operativsystem.

Overføre filer
1. Åpne en terminal til HPC-miljøet med PuTTY. Lag en katalog for analysen kalt "prosjekt".
2. Naviger til "path_to / prosjekt" -katalogen og lag en ny katalog for de komprimerte raw fastq.gz filene som heter "fastq". Lag også en katalog som heter "trimmet". Dette vises i figur S1A-C.
3. Overfør de komprimerte raw fastq.gz-filene fra lokal lagring til mappen "path_to/project/fastq/" ved hjelp av WinSCP eller et lignende program. Kontroller at det finnes en R1- og R2-fil for hvert eksempel, som vist i figur S1B.
4. Valgfritt: Installer om nødvendig TrimGalore. Angi mappen som inneholder den trim_galore kjørbare filen i miljøvariabelen PATH i Linux.
  MERK: Leseoperasjoner av lav kvalitet og adaptere er trimmet med TrimGalore. TrimGalore er tilgjengelig på https://github.com/FelixKrueger/TrimGalore.
5. Valgfritt: Naviger til katalogen for nedlastede programvarepakker (dvs. "path_to/programvare"). Last ned den nyeste TrimGalore-pakken ved hjelp av kommandoen "curl -fsSL https://github.com/FelixKrueger/TrimGalore/archive/[versjon].tar.gz -o trim_galore-[versjon].tar.gz."
6. Valgfritt: Pakk ut filen tar.gz. Bruk kommandoen "tar -xvzf trim_galore-[version_number].tar.gz".
7. Valgfritt: Gjør TrimGalore kjørbar. Bruk kommandoen "chmod a+x path_to/software/TrimGalore-[version]/trim_galore". Kontroller at denne nye mappen er i PATH. Bruk kommandoen "export PATH=path_to/software/TrimGalore-[version]:$PATH".
8. Gå til path_to/prosjekt/fastq/. Bruk TrimGalore til å trimme leseoperasjoner av lav kvalitet fra fastq.gz filer ved hjelp av kommandoen som vises i Figur S1C.
  MERK: Flere flagg for denne kommandoen kan være relevante og finnes her: https://github.com/FelixKrueger/TrimGalore/blob/master/Docs/
  Trim_Galore_User_Guide.md
9. Se etter de trimmede fastq.gz filene i path_to/project/trimmet katalog. Kontroller at de kalles sample1_R1_val_1.fq.gz og sample1_R2_val_2.fq.gz
Juster trimmede FASTQ-filer med STAR og generer transkripsjonstall.
MERK: STAR er tilgjengelig på https://github.com/alexdobin/STAR)
1. Valgfritt: Installer STAR versjon 2.6 eller nyere. Angi den kjørbare STAR-filen i banen.
2. Valgfritt: Naviger til katalogen for nedlastede programvarepakker (dvs. "path_to/programvare").
3. Valgfritt: Last ned STAR-pakken ved hjelp av kommandoen "curl -SLO https://github.com/alexdobin/STAR/archive/[version].tar.gz". Pakk ut filen tar.gz.
4. Valgfritt: Bruk kommandoen "tar -xzf [versjon].tar.gz". Gjør STAR kjørbar. Bruk kommandoen "chmod a+x path_to/software/STAR-[version]/bin".
5. Valgfritt: Kontroller at denne nye katalogen er i banen. Bruk kommandoen "export PATH=path_to/software/STAR-[version_number]/bin/linux_x86_64_static:$PATH".
  MERK: STAR-håndboken er tilgjengelig på: (https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf).
6. Forsikre deg om at det er genomindeks å bruke med STAR. Plasser dette i en mappe atskilt fra katalogen path_to/project/. Hvis en indeks tidligere ble generert for tidligere eksperimenter, bruker du den. Du kan også bruke en passende forhåndsgenerert indeks hvis tilgjengelig her: http://refgenomes.databio.org/. Ellers konstruerer du en ny indeks ved hjelp av kommandoen "STAR-runMode genomeGenerate" ved hjelp av instruksjonene i STAR-håndboken.
  MERK: For resten av denne protokollen vil banen til STAR-indeksen bli referert til som "path_to/STAR_index".
7. Gå til mappen path_to/prosjekt/. Lag en ny mappe kalt "STAR_output" som vist i Figur S1D.
8. Naviger til katalogen path_to/prosjekt/trimmet/. Bruk kommandoen som vises i Figur S1D, til å kjøre STAR for å justere de trimmede fastq.gz filene.
  MERK: Dette trinnet er det mest beregningsintensive, og det anbefales å utføre dette på en HPC-klynge med flere tråder (dvs. >16) som er utpekt for justeringsoppgaven. Avhengig av antall utvalg og tilgjengelige beregningsressurser kan dette trinnet ta mange timer til dager.
9. Finn de nødvendige utdataene for de neste trinnene som inneholder antall per transkripsjon på følgende sted: path_to/project/STAR_output/sampleN_ReadsPerGene.out.tab.
  MERK: I kolonnen ReadsPerGene.out.tab har filkolonne 1 informasjon om funksjonen som telles. Kolonne 2 inneholder de ustrandede lesetallene, kolonne 3 inneholder de fremre strandede lesetallene, og kolonne 4 inneholder omvendte strandede lesetall. De første fire radene i denne filen vil ha informasjon om de justerte lesningene som ikke stemte overens med et enkelt gen. Denne protokollen krever ustrandede lesetall.
10. Bruk RStudio (foretrukket) eller R i HPC-miljøet til å kompilere dataene fra rad 5 og under for kolonne 1 og 2 for hvert utvalg. Sett arbeidskatalogen til "prosjekt" i R.
11. Les i hver ReadsPerGene.out.tab -fil ved hjelp av kommandoen i Figur S2A. For den første kolonnen tar du bare tegnene før "." i kolonnen "Ensembl gene ID" for enkel nedstrøms behandling.
12. Kompilering teller fra alle eksempler til en dataramme kalt "totcts" ved hjelp av kommandoene i Figur S2B. Lagre denne nye tabellen med råtellingsdata som en tabulatordelt .txt fil, det vil si sample_counts.txt, om ønskelig, ved hjelp av kommandoen "write.table".
  MERK: Rekkefølgen på Ensembl-gen-ID-en er den samme for hver ReadsPerGene.out.tab-fil på tvers av prøver.

5. Differensialuttrykk og nedstrømsanalyse

Normaliser for satsvise effekter mellom prøver med ComBat.
MERK: Det er to mulige variabler som forklarer endringer i genuttrykk, den første er konstruksjonen som brukes (dvs. prøven) og den andre er eksterne faktorer knyttet til passasje av celler gjennom tidene (dvs. batchen). Et trinn for å normalisere prøver for batch-til-batch-variasjon med R-pakken ComBat anbefales.
1. Installer om nødvendig og last inn bibliotekene for sva, DESeq2, AnnotationDBI, org. Hs.f.eks.db, pheatmap, RColorBrewer, genefilter, Kairo, ggplot2, ggbiplot, rgl og reshape2 som vist i Figur S2C. For installasjon, bruk kommandoen install.packages eller Bioconductor i henhold til dokumentasjonen for hver pakke.
2. Filtrer først dataene til bare de genene som har minst ett antall per lesing. Lagre denne nye tabellen for å angi filtrering som vist i Figur S2D.
  MERK: Ofte vil mange gener ha svært lave eller ingen lesetall.
3. Klargjør en ny tabell for batchnormalisering kalt "vars" som vist i Figur S2E. Sett radnavnene til de unike navnene på hvert eksempel. Sett kolonnenavnene til "sample", "batch" og "construct".
4. Tilordne alle eksemplene et unikt nummer i eksempelkolonnen fra 1 til n, der n er antall eksempler. Tilordne partinumre til alle prøver i "batch"-kolonnen slik at både betingelses-a_1 og betingelses-b_1 er tilordnet 1, og betingelses- a_2 og betingelses-b_2 tilordnes begge 2. Tilordne alle betingelsesbetegnelser til alle prøver i "konstruere"-kolonnen slik at betingelses-a-prøver er alle "A" og betingelse-b-prøver er alle "B".
5. Definer også batchvariabelen, og en bestemt nullmodellmatrise for ComBat, som vist i Figur S2F. Kjør ComBat med kommandoen definert i Figur S2F.
Kurater dataene ytterligere ved å runde av til nærmeste heltall. Fjern også gener med en negativ verdi. Bruk kommandoene som vises i Figur S3A.
MERK: Utgangen av batch normalisering vil ha ikke-heltall lesetall og noen gener med negative verdier. Dette trinnet er nødvendig fordi nedstrøms differensialuttrykksanalysen ikke støtter negative leseantall.
Definer differensialuttrykksprofilen for hver konstruksjon ved hjelp av DESeq2.
1. Skriv inn eksperimentdesignet for DESeq2 som vist i Figur S3B. Konstruer et DESeqDataSet (dds) ved hjelp av DESeqDataSetFromMatrix -funksjonen, beregn størrelsesfaktorene og kjør DESEq2, som vist i Figur S3B.
  MERK: Det er viktig at kolonnedataene som er angitt for "betingelse", er i samme rekkefølge som kolonnen i tellematrisen.
2. For å evaluere kvaliteten på analysen trekker du ut de rlog-normaliserte tellingene som brukes av DESeq2, som vist i Figur S3B.
  MERK: Under analysen forvandler DESeq2 tellinger med en "regularisert logg", rlog, transformasjon for å krympe utvalg-til-prøve-forskjellene for gener med lave tellinger (lav informasjon) for å bevare forskjeller i gener med høyere antall på tvers av prøver (høy informasjon).
3. Når du trekker ut resultatene for hver transkripsjonsprofil fra resultatene av DESeq2, må du utføre parvise sammenligninger med referanse til enten nedslagsbetingelsen eller den tomme vektoren for grunnlinje, som vist i figur S3C. Ytterligere endre disse resultatene med HGNC gensymboler som vist i Figur S3D.
4. Som vist i Figur S3Etrekker du ut data fra DESeq2-resultater. Eksporter som en enkelt fil med ensembl gen-ID, HGNC-symbol, basisgjennomsnittsuttrykk og differensialuttrykksdata for alle konstruksjoner med log2FoldChange og rå og justerte p-verdier.
  MERK: Bruk av en justert p-verdi < 0,05 er anbefalt avskjæring for differensialuttrykk.
5. Vurder vellykket batch normalisering og intra-sample likhet. Kontroller eksempelklynger med PCA- og utvalg-til-prøve-avstandsplott ved hjelp av rlog-normaliserte antall ved hjelp av at koden som vises i Figur S4A-B.
Bruk differensialuttrykksprofilene til å generere vulkanplott ved hjelp av koden i figur S4C. Vurdere endringer i genuttrykk på tvers av konstruksjoner.
Bruk rlog normaliserte tellinger og hierarkiske klynger for å identifisere gensignaturer som er unike for de forskjellige konstruksjonene. Bruk koden som vises i Figur S4D.
1. Trekk ut de 1000 mest variable genene på tvers av alle konstruksjoner i en matrise. Bruk pheatmap til å utføre uovervåket hierarkisk klynge av prøvene dine basert på disse genene.
2. Trekk ut klyngene av interesse fra dendrogrammet ved å bestemme hvilket nivå av dendrogramklyngene av interesse som vises. Sett "k" lik antall klynger på dette nivået. Gjenta varmekartet sortert etter klynge for å finne ut hvilke klynger som er av interesse, som vist i Figur S5.
3. Eksporter listen over gener som er knyttet til hver klynge, som vist i Tabell S1. Bruk denne informasjonen til å bestemme genene i klynger av interesse.
Identifisere de biologiske rollene for ulike genklynger identifisert og sammenligne mellom klassene. Dette kan utføres ved hjelp av en rekke bioinformatikkverktøy. ToppGene²⁴ brukes her og er fritt tilgjengelig online.
MERK: Det er mange gratis verktøy som krever bare en liste over gener for å kopiere og lime inn i et felt på et nettsted. Velg de analytiske verktøyene som passer best for forskningsspørsmålene som undersøkes.
Hvis det er data tilgjengelig om genomisk binding som driver transkripsjonsutgang for transkripsjonsfaktor av interesse, kan du eventuelt sammenligne transkripsjonsresponsen ved gener forbundet med forskjellige bindende elementer for å evaluere mutantfunksjonen ytterligere.

6. Sammenligning med relevante fenotyper

Sammenlign de korrelative fenotypene med de transkripsjonsprofildataene som genereres og tolkes etter behov.

Representative Results

Foreløpige qRT-PCR-data antydet at en EWS/FLI-mutant kalt DAF, med spesifikk tyrosin til alaninmutasjoner i den repeterende og uordnede regionen EWS, opprettholdt evnen til å aktivere EWS/FLI-målgener, men klarte ikke å undertrykke kritiske målgener²³. For bedre å forstå forholdet mellom disse rester i EWS-domenet og EWS/FLI-funksjonen, ble protokollen beskrevet ovenfor og skissert i figur 1 brukt. A673 Ewing sarkomceller ble viralt transdusert med en shRNA rettet mot 3'UTR av FLI1, noe som resulterte i uttømming av endogen EWS / FLI. Etter fire dagers utvelgelse ble EWS/FLI-funksjonen reddet med viral transduksjon av forskjellige 3XFLAG-merkede EWS/FLI mutantkonstruksjoner, med tom vektor som kontroll for ingen redning. En ikke-funksjonell mutant som mangler EWS-domenet, kalt Δ22, ble brukt som en negativ kontroll, og wild-type EWS/FLI, kalt wtEF, ble brukt som en positiv kontroll (Figur 2A). DAF ble brukt som testkonstruksjon, selv om mer enn én testkonstruksjon kan brukes om ønskelig. Celler ble valgt i ytterligere 10 dager for å tillate konstruksjonsuttrykk å stabilisere seg og deretter samlet inn for RNA (med et gDNA-fjerningstrinn), protein- og kolonidannende analyser. Fire replikeringer ble samlet inn og representative qRT-PCR og vestlige flekker som viser effektiv knockdown og redning er vist i figur 2B-D. Det skal bemerkes at DAF-reddet celler ikke klarte å danne kolonier som vist i figur 2E, noe som tyder på nedsatt onkogen transformasjon.

Etter å ha fullført replikeringsvalideringen og fenotypiske analyser, ble RNA sendt til Institute for Genomic Medicine ved Nationwide Children's Hospital for bibliotekforberedelse og neste generasjons sekvensering med ~ 50 millioner 150-bp parede leseoperasjoner samlet inn. Dataene ble returnert som fastq.gz filer. Leseoperasjoner av lav kvalitet ble trimmet fra disse filene med TrimGalore og STAR ble brukt til å justere lesninger til det menneskelige genomet hg19 og telle lesningene per gen. hg19 ble brukt til kompatibilitet med de andre kuraterte datasettene for EWS/FLI som brukes i nedstrømsanalyse. Disse lesetallene ble kombinert til én matrise for ett antall for alle utvalg, hvorav de første 6 radene vises i figur 3.

Antall ble opprinnelig kjørt gjennom DESeq2 uten batch-normalisering, men visuell inspeksjon av utvalg-til-prøve-avstanden viste potensielle forvirrende batcheffekter som vist uthevet med røde piler i figur 4A. Dette oppsto sannsynligvis på grunn av biologisk variasjon introdusert ved passasje av celler i kultur og forskjeller i behandlingen av hvert parti. Normalisering for satsvise effekter ble utført med ComBat og anbefales vanligvis. Utvalg-til-prøve-avstandene for de satsvise normaliserte dataene vises i Figur 4B. Etter batch-normalisering ble DESeq2 brukt til å generere transkripsjonsprofiler for de tre konstruksjonene (wtEF, Δ22 og DAF) i forhold til grunnlinjen. Merk at mens "foreldre" A673-celler (mock knockdown og mock rescue, kalt "iLuc" her) ble inkludert i differensialanalysen, er referansen for dette eksperimentet cellene med EWS / FLI-utarmede, kalt iEF-celler. Transkripsjonsprofilen kan genereres for det endogene proteinet her ved å sammenligne iLuc-prøven med iEF, og dette kan være av interesse for å forstå hvordan redningssystemet fungerer, men det er ikke målet med denne analysen. Transkripsjonsprofilene som genereres for mutantene inkluderer positive (wtEF) og negative (Δ22) kontroller, med hensyn til iEF, slik at disse skal fungere som målestokker for andre mutanter. Dette er viktig, da den positive kontrollen i dette eksemplet ikke fullstendig rekapitulerte funksjonen til endogen EWS / FLI som diskutert andre steder⁷^,²³.

Hovedkomponentanalysen (PCA) i figur 5 antyder at transkripsjonsprofilen til DAF er mellomliggende mellom wtEF og Δ22, noe som bekrefter delvis funksjon. Videre viste hierarkisk klynge av de 1000 mest variable genene på tvers av prøver at DAF ikke klarte å undertrykke EWS / FLI-målgener, og bare delvis beholdt genaktiveringsaktivitet som vist i figur 6A og figur S5. ToppGene-analysen antydet at genklassene som DAF aktiverer, er funksjonelt forskjellige fra de EWS/FLI-aktiverte målene der DAF ikke er funksjonelle (figur 6B). Interessant nok synes funksjonen til aktiverte gener reddet av wtEF, men ikke av DAF, å være relatert til transkripsjonskontroll og kromatinregulering. Basert på resultatene fra koloniformasjonsanalysene bør genene fra denne kjernegensignaturen analyseres nærmere for sin rolle i EWS/FLI-mediert onkogenese. Betydningen av EWS/FLI-mediert genundertrykkelse har tidligere blitt beskrevet¹⁷.

Det er kjent at EWS/FLI har en unik bindingsaffinitet for GGAA-mikrosaatellittre gjentatte elementer¹⁹^,²², og at binding ved disse elementene driver nedstrøms genregulering^11,^15,¹⁸^,²⁰^,²². Disse mikrosatellittene har blitt karakterisert som enten forbundet med aktivering eller undertrykkelse, og enten proksimal til (< 5 kb) TSS eller distal til (> 5 kb) TSS²⁵. I tillegg er det EWS / FLI-regulerte gener med høy affinitet (HA) ETS motiver proksimalt til TSS²³. For å analysere egenskapene til DAF-funksjonen ytterligere og hvilke typer EWS/FLI-aktiverte gener DAF var i stand til å redde, ble differensialuttrykk av gener forbundet med disse forskjellige klassene analysert. Interessant nok var DAF mest i stand til å redde GGAA-mikrosalataktiverte gener, men ute av stand til å redde aktiverte gener nær et HA-sted som vist i figur 7. Sett med hierarkisk klynger klarer ikke DAF å redde EWS/FLI-mediert undertrykkelse på tvers av motivklasser. Disse dataene antyder at DAF beholder tilstrekkelige strukturelle egenskaper ved EWS til å binde seg til og aktivere fra GGAA-mikrosatellitter, både proksimale og distale til TSS. Dette oppstår sannsynligvis fra det intakte SYGQ-domenet som antas å være viktig for EWS / FLI-aktivitet ved GGAA gjentar¹¹. Disse dataene tyder også på at de spesifikke tyrosinene mutert i DAF spiller viktige, men dårlig forståtte, roller i EWS /FLI-mediert genregulering fra HA-nettsteder, samt i genundertrykkelse, og fremhever et viktig område for videre undersøkelser.

Figur 1: Arbeidsflyt. Skildring av den trinnvise prosedyren for å utføre strukturfunksjonskartlegging ved hjelp av transkripsjon. Celler ble først forberedt på å uttrykke pakken med konstruksjoner som kreves for strukturfunksjonskartlegging. Etter uttrykk ble celler høstet for RNA og protein og analysert for korrelative fenotyper. Uttrykk for konstruksjonene ble validert, og denne prosessen ble gjentatt 3-4 ganger for å samle uavhengige biologiske replikeringer. RNA ble deretter sendt inn til neste generasjons sekvensering (NGS). Da data ble mottatt, ble data trimmet for kvalitet, justert og antall per transkripsjon ble beregnet. Batcheffekter ble kontrollert for og transkripsjonssignaturer og differensialuttrykk ble bestemt ved hjelp av DESeq2. Hierarkisk klynge- og nedstrømsanalyse som integrerer andre -omics-datasett og ulike bane- eller funksjonsanalyser kan innlemmes. Klikk her for å se en større versjon av denne figuren.

Figur 2: Validering av konstruksjonsuttrykk og korrelative analyser. (A) Skjematisk som viser konstruksjonene som er testet i dette eksemplet. (B) Validering av nedslag av endogen EWS/FLI og uttrykk for 3X-FLAGG-merkede konstruksjoner av immunoblot. (C,D) Validering av konstruksjonsaktivitet ved et EWS/FLI(C) aktivert målgen, NR0B1og (D) undertrykt målgen, TGFBR2, av qRT-PCR. Data presenteres som gjennomsnittlig +/- standardavvik. P-verdier ble beregnet med en Tukeys ærlige signifikanstest. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Koloni teller fra myke agaranalyser utført for å vurdere transformerende konstruksjonsaktivitet. P-verdier ble beregnet med en Tukeys ærlige signifikanstest. * p < 0,05, ** p < 0,01, *** p < 0,005. Dette tallet er tilpasset fra Theisen, et al.²³Klikk her for å se en større versjon av denne figuren.

Figur 3: Endelige sorterte telledata for analyse. Skjermbilde av de første 6 radene i tellefilen med genantall for alle prøvene som skal batch normaliseres og analyseres. Klikk her for å se en større versjon av denne figuren.

Figur 4: Varmekart for avstand fra prøve til prøve. (A) Eksempel-til-eksempel-avstandstegning som viser eksempelklyngen for råtellingsdataene. Eksempler som grupperes både etter bunke og etter prøve, er merket med røde piler. (B) Eksempel-til-prøve avstandsplott etter batch normalisering med ComBat. Her replikerer prøver fra alle klynger sammen, uavhengig av batch. Klikk her for å se en større versjon av denne figuren.

Figur 5: Resultater av differensialuttrykksanalyse. (A) PCA-plott (Principle Component Analysis) for de transkripsjonssignaturene som genereres for alle prøvene, viser sterk intra-sample-klynge og viser at DAF er mellomliggende mellom de positive (wtEF) og negative (Δ22) kontrollene. (B) Vulkanplott som viser -log(p-verdien) plottet mot log2FoldChange for gener i hver konstruksjon. Gener med justert p-verdi < 0,05 og en |log2(FoldChange)-| > 1 anses som signifikante og vises i rødt. Panel 5B er tilpasset fra Theisen, et al.²³Klikk her for å se en større versjon av denne figuren.

Figur 6: Hierarkisk klynging for å identifisere genklasser. (A) Hierarkisk klynging av de 1000 mest variable genene på tvers av alle konstruksjoner, og grunnlinjen, iEF, viser at DAF delvis redder EWS/FLI-mediert genaktivering. (B) Gen ontologi (molekylær funksjon) resultater fra ToppGene viser funksjonell berikelse av EWS / FLI-aktiverte gener som enten reddes eller ikke reddes av DAF. Panel 6B er tilpasset fra Theisen, et al.²³Klikk her for å se en større versjon av denne figuren.

Figur 7: Detaljert analyse av ulike transkripsjonsfaktorresponselementer til forskjellige konstruksjoner: (A) Skjematisk som viser databehandlingen som brukes til å generere paneler (B) og (C) ved å inkorporere andre tilgjengelige datasett med de transomiske profilene her. (B,C) Kompilering som viser redning av forskjellige klasser av direkte EWS/ FLI- (B) aktivert og (C) undertrykte mål. Gener inkludert var bare de genene med påviselig differensialuttrykk av endogen EWS / FLI. I hvert sektordiagram viser grått den delen av gener som ikke reddes av konstruksjonen. Rød skildrer den delen av gener som er differensialaktivert, og blå skildrer den delen av gener som er differensialt undertrykt. Dette tallet er tilpasset fra Theisen, et al.²³Klikk her for å se en større versjon av denne figuren.

Figur S1: Laste inn fastq.gz-filene i HPC-miljøet, trimming og justering. Klikk her for å laste ned denne figuren.

Figur S2: Sortering av leseantall på tvers av prøver og kjøring av batchnormalisering med ComBat. Klikk her for å laste ned denne figuren.

Figur S3: Kjøre DESeq2 og trekke ut resultater fra differensialuttrykksanalyse. Klikk her for å laste ned denne figuren.

Figur S4: Analysere utdata. Klikk her for å laste ned denne figuren.

Figur S5: Hierarkisk klynging for å identifisere genklasser: Hierarkisk klynging av de 1000 mest variable genene på tvers av alle konstruksjoner og grunnlinjen, iEF, sortert i k-klynger. I dette tilfellet k=7, men denne parameteren angis av brukeren som vist i Figur S4D. Klikk her for å laste ned denne figuren.

Tabell S1: Liste over gener (Ensembl gen-ID) med klyngemerknad. Klikk her for å laste ned denne tabellen.

Discussion

Å studere de biokjemiske mekanismene til onkogene transkripsjonsfaktorer er kritisk viktig for å forstå sykdommene de forårsaker og å designe nye terapeutiske strategier. Dette gjelder spesielt i maligniteter preget av kromosomale translokasjoner som resulterer i fusjonstranskripsjonsfaktorer. Domenene som inngår i disse chimeriske proteinene kan mangle meningsfulle interaksjoner med regulatoriske domener som finnes i de ville proteinene, noe som kompliserer evnen til å tolke strukturfunksjonsinformasjon i sammenheng med^{fusjonen 26}^,²⁷^,²⁸. Videre er mange av disse onkogene fusjoner preget av lav kompleksitet i iboende uordnede domener¹⁰^,¹³^,²⁹^,³⁰.

EWS-domenet er et eksempel på et slikt iboende uorden domene som er involvert i en rekke onkogene fusjoner¹⁰. Den iboende uordnede og repeterende naturen har hindret arbeidet med å forstå molekylære mekanismer som brukes av EWS-domenet. Tidligere forsøk på å undersøke strukturfunksjonen har i stor grad tydd til å bruke forskjellige mutanter i sammenheng med reportergenanalyser eller i cellebakgrunner som ikke klarer å rekapitulere den relevante cellulære konteksten, eller mangler strukturelle variasjoner som gir meningsfull delvis funksjon¹¹^,¹⁷^,²⁵. Metoden som presenteres her, løser disse problemene. Strukturfunksjonskartlegging utføres i en sykdoms-relevant cellekontekst, og neste generasjons sekvensering gjør det mulig for transkripsjonsprofilering å evaluere transkripsjonsfaktorfunksjon i innstillingen av innfødt kromatin. I det spesifikke tilfellet av DAF-mutanten til EWS / FLI ble DAF rapportert å vise liten aktivitet i reporteranalyser ved hjelp av isolerte responselementer, men for å vise aktivitet i sammenheng med full genpromotor, enten i en reporteranalyse eller i innfødt kromatin, noe som tyder på en interessant fenotype²³. Ved hjelp av metoden som er beskrevet her, løser mer direkte spørsmålet om hvilken type regulatoriske elementer på tvers av genomet som er mest responsive i sykdomsinnstillingen. Ved å teste alle kandidatmålgener i sin opprinnelige kromatinkontekst samtidig, er det mer sannsynlig at en transkripsjonsmetode identifiserer konstruksjoner med delvis funksjon.

Den iboende styrken ved å bruke en sykdoms-relevant cellebakgrunn er kanskje den største begrensningen i denne teknikken. En av de viktigste faktorene er å velge riktig cellesystem for disse eksperimentene. Mange cellelinjer avledet fra maligniteter med patognomiske transkripsjonsfaktorer tolererer ikke lett knockdown av den transkripsjonsfaktoren, og i mange tilfeller, spesielt for barnekreft, forblir den sanne opprinnelsescellen kontroversiell og uttrykket av oncogene i andre cellebakgrunner er uoverkommelig giftig³¹^,³² . I disse tilfellene kan det være nyttig å utføre eksperimenter i en annen cellebakgrunn, så lenge forskeren utviser forsiktighet i tolkningen av resultatene og validerer relevante funn i en mer sykdomsrelevant celletype.

Det er kritisk viktig å nøye validere stabiliteten og fenotypiske konsekvenser av uttrykk for oncogene og bare sende inn prøver for sekvensering som oppfyller strenge kriterier. Her inkluderte dette vestlig blott for å bekrefte knockdown og redning, og qRT-PCR av et lite antall kjente målgener for å validere den positive kontrollen (Figur 2). Det er også viktig å redusere så mye batchvariabilitet som mulig ved å nøye utføre cellen og RNA-preparatene så likt som mulig gjennom hver batch.

Metoden beskrevet her blir spesielt kraftig når den er parret med andre typer genomiske data som snakker til den genomomfattende funksjonen til transkripsjonsfaktoren som studeres. Fremtidige retninger for denne typen strukturfunksjonsanalyse vil utvides til å omfatte ChIP-seq og ATAC-seq for å bestemme bindingen av transkripsjonsfaktoren og eventuelle induserte endringer i kromatintilgjengelighet. Som en pakke kan denne typen data peke på hvor forskjellige strukturelle komponenter i en onkogen transkripsjonsfaktor bidrar til ulike aspekter av funksjonen (dvs. DNA-binding vs. kromatinmodifisering vs. co-regulator rekruttering). Totalt sett kan bruk av NGS-baserte tilnærminger for å kartlegge strukturfunksjonsrelasjonene til fusjonstranskripsjonsfaktorer avsløre ny innsikt i de biokjemiske determinantene til den onkogene funksjonen til disse proteinene. Dette er viktig for å fremme vår forståelse av sykdommene de forårsaker og for å muliggjøre utvikling av nye terapeutiske strategier.

Disclosures

SLL erklærer en interessekonflikt som medlem av rådgivende styre for og en aksjeeier av Salarius Pharmaceuticals. SLL er også en børsnotert oppfinner på United States Patents No. US 7,393,253 B2, "Metoder og komposisjoner for diagnostisering og behandling av Ewings Sarcoma," og US 8,557,532, "Diagnose og behandling av legemiddelresistent Ewings sarkom." Dette endrer ikke vår overholdelse av JoVE sine retningslinjer for deling av data og materialer.

Acknowledgments

Denne forskningen ble støttet av High Performance Computing Facility ved Abigail Wexner Research Institute ved Nationwide Children's Hospital. Dette arbeidet ble støttet av National Institutes of Health National Cancer Institute [U54 CA231641 til SLL, R01 CA183776 til SLL]; Alex's Lemonade Stand Foundation [Young Investigator Award til ERT]; Pelotonia [Fellesskap til ERT]; og National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 til KIP].

Materials

Name	Company	Catalog Number	Comments
Wet Lab Reagents
anti-FLI rabbit pAb	Abcam	ab15289	1:500
anti-lamin B1 rabbit pAb	Abcam	ab16048	1:2000
Cell-based system for introduction of mutant constructs			Determined by cell system used
Cryotubes			For viral aliquots
DMEM	Corning Cellgro	10-013-CV	For viral production
Fetal bovine serum	Gibco	16000-044	For viral production
G418	ThermoFisher	10131027	For viral production
HEK293-EBNAs	ATCC	CRL-10852	For viral production
HEPES	Gibco	15630106
Hygromycin B	ThermoFisher	10687010
M2 anti-FLAG mouse mAb	Sigma	F3165	1:2000
Near IR-secondary antibodies	Li-Cor
Optimem	Gibco	31985062	For viral production
Penicillin/Streptomycin/Glutamine	Gibco	10378-016	For viral production
Polybrene	Sigma	TR-1003-G	For viral transduction
Puromycin	Sigma	P8833	Stored at 2 mg/mL stock
RNeasy Plus kit	Qiagen	74136	Has gDNA removal columns
Selection reagents			As dictated by cell system used
Sodium Pyruvate	Gibco	11360-070	For viral production
Tissue culture media			Determined by cell system used
TransIT-LT1	Mirus	MIR 2304	For viral production

Software
Access to HPC environment
AnnotationDbi			1.38.2
Cairo			1.5-10
DESeq2			1.16.1
genefilter			1.58.1
ggbiplot			0.55
ggplot2			3.1.1
org.Hs.eg.db			3.4.1
pheatmap			1.0.12
PuTTY
R			3.4.0
RColorBrewer			1.1-2
reshape2			1.4.3
rgl			0.100.19
R-studio
STAR			Version 2.6 or later
sva			3.24.4
TrimGalore!
WinSCP