Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

전사 분석을 사용하여 무질서한 온코겐 전사 요인의 구조 기능 관계 매핑

Published: June 27, 2020 doi: 10.3791/61564

Summary

본질적으로 무질서한 도메인은 온코겐융합 전사 인자 기능에 중요합니다. 이러한 단백질을 치료적으로 표적으로 하기 위해서는 이러한 도메인에 의해 사용되는 규제 메커니즘에 대한 보다 상세한 이해가 필요합니다. 여기서는 전사학을 사용하여 유잉 육종에서 본질적으로 무질서한 EWS 도메인의 중요한 구조적 특징을 매핑합니다.

Abstract

많은 암은 종양 발생 융합 전사 인자의 발현을 초래하는 염색체 전좌를 특징으로합니다. 전형적으로, 이들 단백질은 다른 단백질의 DNA 결합 도메인(DBD)과 융합된 본질적으로 무질서한 도메인(IDD)을 포함하고 악성종양을 촉진하기 위해 광범위한 전사 변화를 조율한다. 이 융합은 수시로 그(것)들이 일으키는 원인이 되는 암에 있는 유일한 반복하는 게놈 수차, 그(것)들을 매력적인 치료 표적을 만드는. 그러나 종양 유발 전사 요인을 대상으로하려면 복잡성이 낮고 IDD가 함수에서 재생하는 기계론적 역할에 대한 더 나은 이해가 필요합니다. EWSR1의 N 단말 도메인은 EWS/FLI, EWS/ATF 및 EWS/WT1을 포함한 다양한 온코겐 융합 전사 인자에 관여하는 IDD입니다. 여기서, 우리는 유잉 육종에서 EWS/FLI의 전사 기능에 중요한 EWS 도메인의 구조적 특징을 조사하기 위해 RNA-시퀀싱을 사용합니다. 다양한 EWS 돌연변이 구조의 자궁 발현과 결합된 유잉 육종 세포로부터내생 융합의 첫 번째 shRNA 매개 고갈이 수행된다. 그런 다음 RNA-시퀀싱은 EWS 도메인내의 돌연변이와 관련된 기능적 적자를 특성화하기 위해 이러한 구조를 발현하는 세포의 전사를 분석하는 데 사용된다. 전사 분석을 EWS/FLI DNA 결합 모티프 및 게놈 국소화에 대한 이전에 발표된 정보와 통합하여, 기능적 특성화를 위한 기능적 분석뿐만 아니라, 온우주발생에 중요한 EWS/FLI의 구조적 특징을 파악하고 유동 육종에 중요한 EWS/FLI 표적 유전자의 새로운 세트를 정의할 수 있었습니다. 본 논문은 RNA-시퀀싱을 본질적으로 무질서한 온코겐 전사 인자의 구조 기능 관계를 매핑하는 방법으로 서열화하는 방법을 보여줍니다.

Introduction

유년기와 사춘기의 많은 악성을 포함하는 암의 하위 집합은 새로운 융합 온코진1,2,3,4,5,6을생성하는 염색체 전좌를 특징으로 합니다. 결과 융합 단백질은 종양발생7,8을촉진하기 위해 전사 조절의 광범위한 변화를 조율하면서 종양 발생 요인으로 자주기능한다. 이러한 전좌를 가진 암은 일반적으로 병상 융합4,9를제외하고 몇몇 반복되는 게놈 수차와 함께, 그렇지 않으면 조용한 돌연변이 풍경을 가지고 있습니다. 따라서 융합 단백질을 직접 표적으로 하는 것은 이러한 질환에서 매력적인 치료 전략이다. 그러나, 이러한 온코인성 전사 인자는 일반적으로 낮은 복잡성, 본질적으로 무질서한, DNA 결합 도메인(DBD)과 융합된 전사활성 도메인(DBD)10,11,12,13,14로구성된다. 이 단백질의 본질적으로 무질서한 도메인 (IDDs) 및 DBDs 는 전통적인 약리학적 접근을 표적으로 하기 어려운 입증되었습니다. 새로운 치료 접근법의 개발은, 그러므로, 유전자 발현을 비정상적으로 조절하기 위하여 이 융합에 의해 채택된 기계장치의 더 상세한 분자 이해가 필요합니다.

EWSR1의 N-말단 IDD 부분은 일반적으로 유잉 육종의 EWS/FLI, 확산 소둥근 세포 종양의 EWS/WT1, 그리고 소프트파트(10)의명확한 세포 육종에서 EWS/ATF1을 포함한 암에서 DBD에 일반적으로 융합된다. 이러한 융합의 각각에서 EWS IDD의 기계적인 역할은 불완전하게 이해된다. EWS/ETS 융합 제품군, 특히 EWS/FLI는 현재까지 가장 기능적으로 특징적입니다. EWS/FLI는 게놈 전체 후생유전학 및 전사적 변화를 조정하여 수천 개의유전자7,11,15,16의활성화 및 억압으로 이어진다. 연구 결과에 따르면 IDD는 전사 공동 활성화제(예: p300, WDR5 및 BAF 단지)와 공동 억압자(예: NuRD 복합체)11,15, 17의모집에중요하다는 것을보여주었습니다. FLI1의 C-말단 부분에 EWS IDD의 융합은 FLI1의 ETS DBD에 새로운 DNA 결합 특이성을 부여하며, 융합 온코단백질(EWS/FLI)은 합의 ETS 모티프18,19,20에추가하여 게놈의 반복적인 GGAA-마이크로위성 영역에 결합한다. 공동 활성화자 모집 기능과 결합, EWS/FLI의 이러한 새로운 DNA 결합 활동은 GGAA-마이크로위성에서 드 노보 증강을 촉진하여 전사 시작 사이트(TSS)(TSS)("증강제 유사" 마이크로위성)에 불경하게 작용하고, RNA 폴리머라제 II를 모집하여 GGAA-마이크로위성에서 TSS("프로모터와 같은"11,111)마이크로위성에서 전사를 촉진합니다.

종합하면, 이러한 데이터는 EWS 도메인 내의 개별 요소가 EWS/FLI 바인딩 사이트의 다른 유형에 대한 고유한 공동 규제 기관의 모집에 기여한다는 가설을 주도했습니다. 그러나 EWS/FLI의 EWS 부분 내에서 이러한 요소를 분별하고 어떻게 작동하는지 파악하는 것은 도메인의 매우 반복적이고 무질서한 특성에 의해 방해되었습니다. 여기서 우리는 EwS IDD에서 이러한 요소를 기능적으로 매핑하기 위해 Ewing 육종 세포에서 이전에 출판 된 녹다운 구조 시스템을 활용합니다. 본 시스템에서 EWS/FLI는 FLI1 유전자의 3'UTR을 표적으로 하는 shRNA를 이용하여 고갈되고, 발현은 3'UTR7,17,22가부족한 다양한 EWS/FLI 돌연변이 cDNA 구조로 구출된다. 이러한 실험은 GGAA-마이크로위성 기자 구성, 식민지 형성 분석, EWS/FLI 활성화 및 억압유전자7,17,22의 표적 검증을 포함하여 EWS IDD와 중요한 종양발생 표현형 사이의 구조 기능 관계를 매핑하는 다양한 삭제를 가진 구조에 초점을 맞춘실험입니다. . 그러나 이러한 연구는 EWS/FLI의 EWS IDD 내에서 이산 하위 도메인을 찾지 못해 활성화 또는 억압에 매우 중요합니다. 모든 시험된 구조물은 특정 표적 유전자를 활성화하고 억압할 수 있었고, 효율적인 식민지 형성으로 이어지거나, EWS/FLI 표적 유전자중 하나를 조절할 수 없었으며, 식민지 형성7,17,22의손실로 이어졌다.

차세대 시퀀싱의 광범위한 채택에 의해 활성화된 전사 분석은 일반적으로 스크리닝 또는 설명 연구의 맥락에서, 두 가지 조건에서 유전자 발현 서명을 비교하는 데 사용됩니다. 대신 RNA 시퀀싱(RNA-seq)을 사용하여 게놈 전체 발현 데이터를 캡처하여 전사 인자 기능에 IDD의 기여를 특성화하고자 했습니다. 이 경우 RNA-seq는 녹다운 구조 시스템과 결합되어 EWS 도메인의 구조 기능 관계를 탐구합니다. 이 접근법은 다른 EWS 융합 또는 제대로 이해되지 않은 기능을 가진 야생 형 전사 인자를 포함한 다른 융합 전사 인자에 적용되며 기자 소사 또는 표적 qRT-PCR과 같은 기능 매핑 연구에 사용되는 다른 저술보다 여러 가지 장점이 있습니다. 여기에는 관련 크로마틴 컨텍스트에서 함수의 구조적 결정요인 테스트, 하나의 분석법(예: 활성화 및 억압, GGAA-마이크로위성 및 비마이크로위성 등)에서 여러 유형의 반응 요소를 테스트하는 기능, 부분 기능을 더 잘 검출할 수 있는 능력이 포함됩니다.

이 접근법의 성공적인 구현은 관심표현형을 포착하는 세포 기반 시스템(이 경우 shRNA 매개 EWS/FLI 고갈을 가진 A673 세포) 및 세포 기반 시스템에 적합한 발현 벡터에서 돌연변이 구조패널(이 경우, 다양한 3x-FLAG 태그-EWS/FLI 돌연변이를 가진 pMSCV-hygro)에 의존한다. CRISPR 기반 고갈 구문, shRNA 기반 고갈 구조 및 안정적인 세포주를 생성하는 적절한 선택으로 cDNA 발현 구문 중 하나의 바이러스 성 변환은 과도 의 과도 연산에 권장됩니다. 전사 데이터의 다운스트림 해석은 전사 계수및 사용 가능한 다른 현상제 판독기의 국소화와 관련된 다른 데이터와 결합될 수 있을 때 강화됩니다.

이 문서에서는 EWS/FLI14의DAF 돌연변이의 활성을 특성화하기 위해 이 방법을 적용합니다. DAF 돌연변이체는 EWS/FLI14의EWS IDD의 반복적인 영역에서 알라닌 돌연변이에 17개의 티로신을 갖는다. 이러한 특정 EWS 돌연변이는 이전에 보고되었으며 ATF1 DBD14에융합될 때 기자 유전자 발현을 활성화할 수 없다. 그러나, 예비 qRT-PCR 데이터는 이 돌연변이가 EWS/FLI 표적 NR0B123의전사를 활성화할 수 있었다는 것을 건의했다. 여기에 설명된 전사적 접근 법은 DAF 돌연변이의 부분 기능을 성공적으로 검출할 수 있게 해 주었다. 이러한 전사 데이터를 EWS/FLI 바인딩 및 인식 모티프에 대한 정보와 페어링함으로써 DAF 돌연변이가 GGAA 마이크로위성 반복에서 기능을 유지한다는 것을 더욱 보여줍니다. 이러한 결과는 DAF를 첫 번째 부분 기능 EWS/FLI 돌연변이체로 식별하고 비마이크로위성 유전자에서 의 기능을 종양 발생에 중요하게 식별합니다(보고된23). 이것은 온코겐 전사 요인의 기능에 대한 통찰력을 제공하기 위해이 전사 구조 기능 매핑 접근 방식의 힘을 보여줍니다.

Protocol

1. 컨스트럭터의 체외 패널 설정

참고: 이 단계는 분석할 특정 단백질에 따라 달라집니다.

  1. 필요에 따라 고갈 및 식 구문에 대한 바이러스의 알리쿼트를 준비합니다.
    1. 바이러스 성 트랜스포메이션에 필요한 각 구조에 대해 3-5 x 106 HEK293-EBNA 또는 HEK293T 세포를 가진 10cm 조직 배양 접시를 시드한다. 세포를 Dulbecco의 수정 된 독수리 미디어 (DMEM)에서 하룻밤 동안 부착하자 10% 태아 소 혈청으로 보충 (FBS), 페니실린 / 연쇄 절제술 / 글루타민 (P / S / Q), 및 0.3 mg / mL G418.
      참고: HEK293-EBNA 및 HEK293T 세포는 성장하기 쉽고, 높은 트랜스페션 효율을 가지며, episomal 플라스미드에서 재조합 단백질을 효율적으로 발현하기 때문에 바이러스 성 생산에 권장됩니다. 세포는 50-70% 사이 일경질의 날이어야 합니다.
    2. 각 바이러스 성 트랜스듀션 구조에 대한 형질 전환 믹스를 준비합니다. 감소된 혈청 매체2mL과 90μL의 경질 시약을 결합합니다.
      참고: 사전 온난화 감소혈청 미디어를 권장합니다.
    3. 각각 10μg의 바이러스 포장 플라스미드(예: 개그폴), 바이러스 봉투 플라스미드(예를 들어, VSV-G), CRISPR 기반 고갈, shRNA 기반 고갈 또는 cDNA 발현 구조(예: pMKO 또는 pMSCV)를 배환 믹스에 추가한다. 부드러운 파이펫팅으로 잘 섞으세요.
    4. 실온에서 20분 동안 트랜스페션 믹스를 준비하십시오. 조직 배양 접시에서 HEK293-EBNA 성장 매체를 제거하고 10 % FBS, P / S / Q 및 10 mM 나트륨 피루바테로 보충 3 mL DMEM을 추가합니다. 각 접시에 2mL의 트랜스펙트 믹스를 드롭와이즈로 추가합니다. 세포가 37°C 및 5% CO2의인큐베이터에서 하룻밤 사이에 형질 전환 매체에 앉게 한다.
    5. 다음 날 아침 에는 10%의 FBS, P/S/Q 보충제, 10mM 나트륨 피루바테가 있는 DMEM 미디어 20mL를 추가합니다. 하룻밤 동안 37 °C 및 5 % CO2에서 세포를 배양하십시오.
    6. 다음 날 아침, 5mL 바이러스 성 수집 미디어 (VCM)로 미디어를 교체 (DMEM 10% 열 비활성화 FBS, P / S / Q, 20 mM HEPES로 보충).
    7. 4 시간 후, 접시에서 VCM을 수집하고 4 ° C에서 얼음에 50 mL 원피스 튜브에 저장합니다. 신선한 VCM의 5mL로 교체하십시오.
    8. 4 시간 후, 동일한 50mL 원판 튜브의 플레이트에서 VCM을 수집하고 4 ° C에서 얼음에 저장합니다. 하룻밤 컬렉션을 위해 신선한 VCM 8mL로 교체하십시오.
    9. 아침에 는 접시에서 VCM을 수집하고 4 °C에서 얼음에 50 mL 원피스 튜브에 저장합니다. 신선한 VCM의 5mL로 교체하십시오.
    10. 4 시간 후, 접시에서 VCM을 수집하고 4 ° C에서 얼음에 50 mL 원판 튜브에 저장합니다. 신선한 VCM의 5mL로 교체하십시오. 4 시간 후, 플레이트에서 VCM을 수집하고 50 mL 원판 튜브에 추가합니다.
    11. 0.45 μm 필터를 통해 여과 후 50mL 튜브에서 냉동 튜브 (알리쿼트 당 2 mL)로 Aliquot 컬렉션. 사용 전까지 -80°C에 바이러스 성 알리코를 보관하십시오.
      참고: 프로토콜은 여기에서 일시 중지할 수 있으며 바이러스 성 알리코는 사용할 준비가 될 때까지 저장할 수 있습니다.
  2. 10cm 조직 배양 접시에 적절한 밀도로 세포를 종자 세포. 목표 50% 합류. 5%CO2를함유한 37°C의 인큐베이터에 배치하여 세포를 밤새 부착하게 한다.
    참고: A673 세포의 경우 이는 10% FBS, P/S/Q 보충제, 10mM 나트륨 피루바테를 가진 DMEM 매체의 10mL에서 5 x 106 세포입니다. 이러한 조건은 사용되는 세포의 성장 속도에 따라 달라질 수 있습니다.
  3. 내인성 관심 요인을 고갈시다. 세포가 관심의 내인성 단백질이 고갈될 필요가 없다면, 1.4단계로 건너뛰세요.
    1. 관심있는 단백질을 대상으로 shRNA 또는 CRISPR 구조의 트랜스듀팅을 위한 바이러스 성 알리쿼트를 해동한다. 37°C 의 수조에서 냉동 알리코를 빠르게 해동합니다.
    2. 각 바이러스 성 알리쿼트에 8 mg / mL 폴리브레네의 2.5 μL을 추가하고 부드러운 파이펫팅으로 혼합합니다. 세포의 접시에서 미디어를 제거하고 부드럽게 접시의 측면을 따라 파이펫하여 10cm 접시에 바이러스 성 알리쿼트를 추가합니다. 2mL의 바이러스 성 알리쿼트를 퍼뜨리기 위해 접시를 흔들어 놓습니다.
    3. 조직 배양 인큐베이터에서 37°C에서 2h의 배양. 플레이트의 모든 영역이 건조되는 것을 방지하기 위해 30 분마다 접시를 흔들어.
    4. 10% FBS, P/S/Q 보충제, 10mM 나트륨 피루바테를 갖춘 DMEM 미디어 5mL을 8 mg/mL 폴리브레네 5μL로 추가합니다. 세포가 하룻밤 동안 배양하도록 하십시오.
    5. 아침에 셀과 통로 세포에서 미디어를 선택 시약으로 보충 된 미디어로 제거합니다. 세포를 통과할 때, 그(것)들이 48-72 시간 동안 성장하고 50% 합류에 도달할 수 있도록 하는 방식으로 그(것)들을 종자합니다.
      참고: pSRP-iEF-2를 가진 A673 세포의 경우, 세포는 1:5 분할에서 시드되고 2 μg/mL puromycin로 72h로 선택됩니다.
  4. cDNA 발현 구조를 변환합니다.
    1. 50-70% 수렴성을 확인하기 위해 세포를 확인합니다.
    2. cDNA 구조의 전도를 위해 바이러스 성 알리쿼트(들)를 해동합니다. 37°C 의 수조에서 냉동 알리코를 빠르게 해동합니다. 각 바이러스 성 알리쿼트에 8 mg /mL 폴리브레네의 2.5 μL을 추가하고 부드럽게 파이펫팅하여 혼합합니다.
    3. 도금 된 세포에서 미디어를 제거하고 부드럽게 접시의 측면을 따라 파이펫하여 10cm 접시에 바이러스 성 알리쿼트를 추가합니다. 2mL의 바이러스 성 알리쿼트를 퍼뜨리기 위해 접시를 흔들어 놓습니다.
    4. 조직 배양 인큐베이터에서 37°C에서 2h의 배양. 플레이트의 모든 영역이 건조되는 것을 방지하기 위해 30 분마다 접시를 흔들어.
    5. 10% FBS, P/S/Q 보충제, 10mM 나트륨 피루바테를 갖춘 DMEM 미디어 5mL을 8 mg/mL 폴리브레네 5μL로 추가합니다. 세포가 하룻밤 동안 배양하도록 하십시오.
    6. 아침에 세포와 통로 세포에서 미디어를 이중 선택 매체로 제거합니다. cDNA 구조의 이중 선택 및 발현을 허용하기 위해 7-10 일 동안 필요에 따라 세포를 성장시키고 통과시키게한다.
      참고: 이 구절의 분할은 다른 세포주에 대한 최적화를 요구할 수 있습니다. pSRP-iEF-2 및 pMSCV-hygro 구조가 있는 A673 세포의 경우, 세포는 2 μg/mL 푸오마이신과 100 μg/mL hygromycin으로 분할하지 않고 전달됩니다.

2. 셀 수집, 구문 의 표현 유효성 검사, 비상대적 표현표 표약

  1. 7-10일의 이중 선택 후 15mL 원문 관에서 세포를 수집한다. 혈종계를 사용하여 수집된 세포를 계산합니다. Aliquot는 RNA 시퀀싱을 위해 세포를 수집하고 cDNA 구조의 발현을 검증하였다.
    참고: 조사 중인 연구 질문에 필요한 상관 관계 없는 표피 현미경 에세이를 설정합니다. 콜로니 형성 분석은 여기에 사용되는 상관 상대적 현상 분석의 예입니다.
    1. RNA 시퀀싱을 위해 5 x 105 및 1 x 106 세포와 단백질 추출을 위한 2 x 106 세포 사이를 수집합니다. 펠릿 세포는 4°C에서 1,000 x g에서 5분 동안 원심분리에 의해 서퍼나탄을 제거한다.
    2. 1 mL 차가운 PBS로 펠릿을 씻으십시오. 4°C에서 1,000 x g에서 원심분리로 5분 동안 펠릿을 제거하고 상류체를 제거합니다. 액체 질소에 펠릿을 플래시 동결하고 -80 °C에 저장합니다.
    3. 나머지 셀과 모든 상관 관계 적 에세이를 설정합니다.
      참고: 프로토콜은 -80°C 냉동고에 저장된 수집된 샘플로 여기에서 일시 중지할 수 있습니다.
  2. 관심 있는 단백질(사용 되는 경우)의 녹다운 과 구성 패널의 발현을 검증합니다.
    1. 얼음에 단백질 추출을 위한 해동 세포 펠릿. 얼음 감기 500 μL 핵 추출 버퍼 (20mM HEPES pH 7.9, 140 mM NaCl, 10 % 글리세롤, 1.5 mM MgCl2,1 mM EDTA, 1 mM DTT, 1 % IGEPAL)에서 세포를 재중단합니다. 얼음 위에 5분 동안 앉아 보자.
    2. 펠릿 핵에 의한 원심분리기는 4°C에서 1,000 x g에서 5분 동안 상류체를 제거합니다. 500 μL 얼음 차가운 핵 추출 버퍼 (20mM HEPES pH 7.9, 140 mM NaCl, 10 % 글리세롤, 1.5 mM MgCl2,1 mM EDTA, 1 mM DTT, 1 % IGEPAL)에서 핵을 프로테아제 억제제로 세척하십시오.
    3. 펠릿 핵에 의한 원심분리기는 4°C에서 1,000 x g에서 5분 동안 상류체를 제거한다. 프로테아제 억제제로 200 μL 콜드 RIPA 버퍼에서 핵을 재중단합니다(펠릿 크기에 따라 RIPA 버퍼의 부피를 조정합니다.) 15분마다 격렬한 소용돌이로 45-60분 동안 얼음 위에 앉게 하십시오.
    4. 45-60 분 동안 4 °C에서 16,000 x g에서 원심 분리에 의한 펠릿 세포 파편. 상체를 유지하고 신선한 차가운 튜브로 전송
    5. 5분 동안 1배 적재 버퍼로 5-10 μg의 단백질을 끓여 SDS-PAGE 전기전경에 대한 샘플을 준비한다. 관심 있는 단백질에 필요한 대로 SDS-PAGE 젤을 실행합니다.
    6. 관심 있는 단백질에 필요한 니트로셀룰로오스 또는 PVDF 멤브레인으로 이송합니다. 블록, 및 cDNA 구조의 내인성 단백질 (사용 하는 경우) 및 ectopic 발현의 녹다운을 확인 하는 적절 한 1 차 및 이차 항체와 블롯.
      참고: 프로토콜은 여기에서 일시 중지할 수 있습니다.
  3. RNA를 추출합니다. RNA 품질과 양을 평가합니다.
    1. 얼음에 세포 펠릿을 해동. 제조업체의 지침에 따라 실리카 스핀 컬럼 기반 추출 키트를 사용하여 총 RNA를 추출합니다.
    2. 간단히, 키트에서 용해 버퍼를 사용하여 셀을 lyse. 30-60초 동안 >13000 rpm에서 짧은 스핀으로 실리카 스핀 컬럼에 용액을 적용하거나 30-60초 동안 >13000 rpm에서 짧은 스핀으로 gDNA 제거 컬럼에 용액을 적용하여 gDNA를 제거합니다.
    3. 실리카 스핀 컬럼에 직접 라이세이트를 적용한 경우 온컬럼 DNA 소화를 수행한다. gDNA 제거 컬럼을 사용하는 경우, 30-60s의 경우 >13000 rpm에서 짧은 스핀으로 실리카 스핀 컬럼에 용출을 적용하십시오.
    4. 제조업체의 지침에 따라 컬럼에 RNA를 세척합니다. 용출 완충제의 30 μL에서 엘ute RNA.
    5. 불소계 또는 기타 유사한 계측기를 사용하여 RNA 품질과 양을 평가합니다. 260/280 비율이 2에 가깝고 시퀀싱을 위해 제출하는 RNA의 적어도 2.5 μg가 있는지 확인하십시오.
      참고: 복제가 수집될 때 각 복제는 동일한 RNA 추출 프로토콜로 처리되어야 합니다.
    6. QRT-PCR에 의해 관심 있는 단백질의 안정적인 녹다운을 확인하기 위해 RNA의 작은 알리쿼트를 사용한다. 나머지 RNA 샘플을 -80°C에 저장합니다.
    7. 3-4개의 완전한 RNA 세트가 수집될 때까지 1-2단계를 반복하여 생물학적 복제를 수집합니다. 각 복제가 cDNA 구조의 적절한 발현과 내인성 단백질의 안정적인 녹다운(사용되는 경우)을 표시하도록 합니다.

3. 차세대 시퀀싱

  1. 5천만 150개의 염기쌍(bp)을 목표로 차세대 시퀀싱 플랫폼을 사용하여 서열되는 추출된 RNA를 제출한다. 샘플을 처리하는 시설의 지침을 따르십시오. 폴리 아데니어란드 된 RNA 및 가닥 별 시퀀싱을 선택합니다.

4. 정렬 및 성적 증명서 계산 파이프 라인

참고: 이 프로토콜은 샘플 제출 및 처리 에 따라 각 샘플에 대해 페어링된 FASTQ 파일 집합이 반환된다고 가정합니다. 이러한 파일은 종종 "fastq.gz"의 접미사로 압축됩니다. 이러한 FASTQ 파일을 추가로 분석하려면 Linux 운영 체제를 실행하는 고성능 컴퓨팅(HPC) 시설에 액세스해야 합니다.

  1. 파일 전송
    1. PuTTY를 사용하여 HPC 환경에 터미널을 엽니다. "프로젝트"라는 분석에 대한 디렉토리를 만듭니다.
    2. "path_to/프로젝트" 디렉토리로 이동하여 압축된 원시 패스트크.gz 파일인 "fastq"에 대한 새 디렉토리를 만듭니다. 또한 "트리밍"이라는 디렉토리를 만듭니다. 이는 도면 S1A-C에표시됩니다.
    3. 압축 된 원시 fastq.gz 파일을 로컬 스토리지에서 WinSCP 또는 유사한 프로그램을 사용하여 "path_to/프로젝트 / fastq /" 디렉토리로 전송합니다. 그림 S1B에표시된 대로 각 샘플에 대해 "R1"과 "R2" 파일이 있는지 확인합니다.
    4. 선택 사항: 필요한 경우 TrimGalore를 설치합니다. Linux의 PATH 환경 변수에 trim_galore 실행 파일이 포함된 디렉토리를 설정합니다.
      참고: 품질이 낮은 판독및 어댑터는 TrimGalore로 트리밍됩니다. 트림갈로어는 https://github.com/FelixKrueger/TrimGalore 이용하실 수 있습니다.
    5. 선택 사항: 다운로드한 소프트웨어 패키지(예: "path_to/소프트웨어")의 디렉터리로 이동합니다. "컬 -fsSL https://github.com/FelixKrueger/TrimGalore/archive/[버전].tar.gz -o trim_galore-[버전].tar.gz"을 사용하여 최신 TrimGalore 패키지를 다운로드하십시오.
    6. 선택 사항: 타르.gz 파일 의 압축을 풀수 있습니다. "타르 -xvzf trim_galore-[version_number].tar.gz"을 사용합니다.
    7. 선택 사항: 트림갈로어 실행 가능을 확인합니다. "chmod a+x path_to/소프트웨어/TrimGalore-[버전]/trim_galore"를 사용합니다. 이 새 디렉토리가 PATH에 있는지 확인합니다. "PATH=path_to/소프트웨어/TrimGalore-[버전]:$PATH"라는 명령을 사용합니다.
    8. path_to/프로젝트/fastq/로 이동합니다. TrimGalore를 사용하여 도면 S1C에표시된 명령을 사용하여 패스트q.gz 파일에서 낮은 품질 읽기를 트리밍합니다.
      참고: 이 명령에 대한 추가 플래그는 관련이 있을 수 있으며 여기에서 찾을 수 있습니다 https://github.com/FelixKrueger/TrimGalore/blob/master/Docs/.
      Trim_Galore_User_Guide.md
    9. path_to/프로젝트/트리밍 디렉토리에서 트리밍된 fastq.gz 파일을 확인합니다. sample1_R1_val_1.fq.gz 및 sample1_R2_val_2.fq라고 불리우는지 확인합니다.gz
  2. 트리밍된 FASTQ 파일을 STAR와 정렬하고 성적증명서 수를 생성합니다.
    참고: star는 https://github.com/alexdobin/STAR)에서 사용할 수 있습니다.
    1. 선택 사항: STAR 버전 2.6 이상 설치합니다. 경로에서 STAR 실행 가능한 STAR를 설정합니다.
    2. 선택 사항: 다운로드한 소프트웨어 패키지(예: "path_to/소프트웨어")의 디렉터리로 이동합니다.
    3. 선택 사항: "컬 -SLO https://github.com/alexdobin/STAR/archive/[버전].tar.gz"라는 명령을 사용하여 STAR 패키지를 다운로드합니다. 타르 .gz 파일의 압축을 풀수 있습니다.
    4. 선택 사항: "타르 -xzf [버전] .tar.gz"라는 명령을 사용합니다. STAR 실행 가능을 만드십시오. "chmod a+x path_to/소프트웨어/STAR-[버전]/빈"을 사용합니다.
    5. 선택 사항: 이 새 디렉터리가 경로에 있는지 확인합니다. "PATH=path_to/소프트웨어/STAR-[version_number]/bin/linux_x86_64_static:$PATH"라는 명령을 사용합니다.
      참고: STAR 매뉴얼은 (https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf)에서 사용할 수 있습니다.
    6. STAR와 함께 사용할 게놈 지수가 있는지 확인합니다. path_to/프로젝트/디렉터리와 는 별도로 디렉터리에 배치합니다. 이전 실험에 대해 인덱스가 이전에 생성된 경우 이를 사용합니다. 또는 여기에서 사용할 수 있는 경우 적절한 미리 생성된 인덱스를 사용합니다: http://refgenomes.databio.org/. 그렇지 않으면 STAR 설명서의 지침을 사용하여 "STAR-runMode 게놈 생성" 명령을 사용하여 새 인덱스를 생성합니다.
      참고: 이 프로토콜의 나머지 부분에서 STAR 인덱스로 가는 경로를 "path_to/STAR_index"이라고 합니다.
    7. path_to/프로젝트/디렉토리로 이동합니다. 그림 S1D에표시된 대로 "STAR_output"라는 새 디렉토리를 만듭니다.
    8. path_to/프로젝트/트리밍/디렉터리로 이동합니다. 그림 S1D에 표시된 명령을 사용하여 STAR를 실행하여 트리밍된 fastq.gz 파일을 정렬합니다.
      참고: 이 단계는 계산 집약적이며 정렬 작업에 대해 지정된 여러 스레드(예: >16)가 있는 HPC 클러스터에서 이 작업을 수행하는 것이 좋습니다. 샘플 수와 사용 가능한 계산 리소스에 따라 이 단계는 며칠동안 많은 시간이 걸릴 수 있습니다.
    9. 다음 위치에서 성적증명서당 카운트가 포함된 다음 단계에 필요한 출력을 찾습니다: path_to/project/STAR_output/sampleN_ReadsPerGene.out.tab.
      참고: ReadsPerGene.out.tab 파일 열 1에서 계산중인 기능에 대한 정보가 있습니다. 열 2에는 좌초되지 않은 읽기 수가 있고, 3열은 앞으로 좌초된 읽기 수를 보유하고 있으며, 열 4는 역방향 가닥 읽기 수를 보유합니다. 이 파일의 처음 네 행에는 단일 유전자에 정렬되지 않은 정렬된 판독에 대한 정보가 있습니다. 이 프로토콜에는 좌초되지 않은 읽기 수가 필요합니다.
    10. HPC 환경에서 RStudio(바람직) 또는 R을 사용하여 각 샘플에 대해 열 1과 2에 대해 행 5 이하의 데이터를 컴파일합니다. 작업 디렉토리를 R에서 "프로젝트"로 설정합니다.
    11. 그림 S2A의명령을 사용하여 각 ReadsPerGene.out.tab 파일에서 읽기. 첫 번째 열의 경우 다운스트림 처리의 용이성을 위해 "Ensembl 유전자 ID" 열에서 "" 문자만 가져가십시오.
    12. 그림 S2B의명령을 사용하여 모든 샘플에서 "totcts"라는 데이터 프레임으로 계산합니다. "write.table" 명령을 사용하여 원하는 경우 sample_counts.txt .txt 파일(예: sample_counts.txt)으로 원시 카운트 데이터의 새 테이블을저장합니다.
      참고: Ensembl 유전자 ID의 순서는 샘플 전반에 걸친 모든 ReadsPerGene.out.tab 파일에 대해 동일합니다.

5. 차동식 및 다운스트림 분석

  1. 샘플과 ComBat 간의 일괄 처리 효과를 정규화합니다.
    참고: 유전자 발현의 변화를 설명하는 두 가지 가능한 변수가 있는데, 첫 번째는 사용되는 구조(즉, 샘플)와 시간을 통한 세포의 통과와 관련된 두 번째 외부 인자(즉 일괄 처리)가 있다. R 패키지 ComBat을 사용하여 일괄 처리 간 변화에 대한 샘플을 정규화하는 단계를 권장합니다.
    1. 필요한 경우 설치하고 스바, DESeq2, AnnotationDBI, 조직에 대한 라이브러리를로드합니다. Hs.eg.db, pheatmap, RColorBrewer, 유전자 필터, 카이로, ggplot2, ggbiplot, rgl 및 reshape2 그림 S2C에도시된 바와 같이. 설치를 위해 각 패키지에 대한 설명서에 따라 "install.packages" 명령 또는 바이오 컨덕터를 사용합니다.
    2. 먼저 읽기 당 적어도 하나의 카운트가있는 유전자에 데이터를 필터링합니다. 이 새 테이블을 저장하여 그림 S2D에서볼 수 있는 필터링을 나타냅니다.
      참고 : 자주, 많은 유전자는 매우 낮은 또는 읽기 카운트가없을 것이다.
    3. 그림 S2E에표시된 대로 "vars"라고 하는 일괄 처리 정규화를 위한 두 번째 테이블을 준비합니다. 행 이름을 각 샘플의 고유한 이름으로 설정합니다. 열 이름을 "샘플", "배치"및 "구성"으로 설정합니다.
    4. 모든 샘플을 1에서 n까지 "샘플" 열의 고유 번호를 할당하고 n은 샘플 수입니다. 조건 a_1 및 조건 b_1 모두 1이 할당되고 조건 a_2 및 조건 b_2 모두 2가 할당되는 "일괄 처리" 열의 모든 샘플에 일괄 처리 번호를 할당합니다. 조건-샘플이 모두 "A"이고 조건 b 샘플이 모두 "B"인 것과 같은 "구조" 컬럼의 모든 샘플에 모든 조건 지정을 할당합니다.
    5. 도면 S2F에표시된 대로 일괄 처리 변수와 ComBat의 특정 null 모델 행렬을 정의합니다. 그림 S2F에정의된 명령으로 ComBat을 실행합니다.
  2. 가장 가까운 정수로 반올림하여 데이터를 더 큐레이트합니다. 또한 부정적인 값을 가진 유전자를 제거합니다. 그림 S3A에표시된 명령을 사용합니다.
    참고: 일괄 처리 정규화의 출력에는 정수 판독 횟수와 부정적인 값을 가진 일부 유전자가 있습니다. 다운스트림 차동 식 해석이 음수 읽기 수를 지원하지 않으므로 이 단계가 필요합니다.
  3. DESeq2를 사용하여 각 구문에 대한 차동 식 프로파일을 정의합니다.
    1. 도 S3B에도시된 바와 같이 DESeq2에 대한 실험 설계를 입력합니다. DESeqDataSetFromMatrix 함수를 사용하여 DESeqDataSetSet(dds)을 구성하고, 크기 요인을 추정하고, 도면 S3B에도시된 바와 같이 DESEq2를 실행한다.
      참고: "조건"에 대해 입력된 열 데이터가 카운트 행렬의 열과 동일한 순서입니다.
    2. 분석품질을 평가하기 위해 도S3B에도시된 바와 같이 DESeq2에서 사용하는 로그 정규화된 카운트를 추출한다.
      참고: 분석 중 DESeq2는 샘플(높은 정보)에 걸쳐 더 높은 수의 유전자의 차이를 보존하기 위해 "정규화된 로그", 로그, 낮은 수(낮은 정보)를 가진 유전자에 대한 샘플 간 차이를 축소하는 변환으로 수를 변환합니다.
    3. DESeq2의 결과로부터 각 전사 프로파일에 대한 결과를 추출할 때, 도 S3C에도시된 바와 같이 녹다운 상태 또는 기준선 빈 벡터를 참조하여 쌍방향으로 비교를 수행한다. 도 S3D에도시된 바와 같이 HGNC 유전자 기호로 이러한 결과를 추가로 수정한다.
    4. 그림 S3E에서볼 수 있듯이 DESeq2 결과에서 데이터를 추출합니다. Ensembl 유전자 ID, HGNC 기호, 기본 평균 발현 및 log2FoldChange 및 원시 및 조정된 p-값을 가진 모든 구문에 대한 차동 발현 데이터가 있는 단일 파일로 내보냅니다.
      참고: 조정된 p-값 < 0.05를 사용하는 것은 차동 식에 권장되는 컷오프입니다.
    5. 성공적인 배치 정규화 및 샘플 내 유사성을 평가합니다. 그림 S4A-B에표시된 athe 코드를 사용하여 Rlog 정규화 된 카운트를 사용하여 PCA 및 샘플 간 거리 플롯을 사용하여 샘플 클러스터링을 확인하십시오.
  4. 차동 식 프로파일을 사용하여 그림 S4C의 코드를 사용하여 화산 플롯을 생성합니다. 구조 전반에 걸쳐 유전자 발현의 변화를 평가합니다.
  5. 로그 정규화된 카운트 및 계층 적 클러스터링을 사용하여 다른 구조에 고유한 유전자 서명을 식별합니다. 그림 S4D에표시된 코드를 사용합니다.
    1. 매트릭스의 모든 구문에 걸쳐 1000 개의 가장 가변성 유전자를 추출하십시오. 이러한 유전자를 기반으로 시료의 감독되지 않은 계층 적 군집을 수행하기 위해 내열도를 사용합니다.
    2. 관심의 덴드로그램 클러스터의 어느 수준에서 결정하여 덴드로그램에서 관심의 클러스터를 추출합니다. "k"를 해당 레벨의 클러스터 수와 동일하게 설정합니다. 그림 S5에표시된 대로 관심 있는 클러스터를 결정하기 위해 클러스터에서 정렬된 히트맵을 다시 플롯합니다.
    3. 표 S1에서설명한 바와 같이 각 클러스터와 관련된 유전자 목록을 내보냅니다. 이 정보를 사용하여 관심 군집에 있는 유전자를 결정하십시오.
  6. 확인된 유전자의 다른 군집에 대한 생물학적 역할을 확인하고 클래스 사이 비교합니다. 이것은 생물 정보학 도구의 다양한 사용하여 수행 될 수있다. ToppGene24는 여기에서 사용되며 온라인에서 자유롭게 사용할 수 있습니다.
    참고: 웹 사이트의 필드에 복사하여 붙여 넣기 위해 유전자 목록을 필요로하는 많은 무료 도구가 있습니다. 조사 중인 연구 질문에 가장 적합한 분석 도구를 선택합니다.
  7. 선택적으로, 관심있는 전사 인자에 대한 전사 출력을 구동하는 게놈 결합에 대한 데이터가 있는 경우, 돌연변이 기능을 더 평가하기 위해 상이한 결합 요소와 관련된 유전자의 전사 반응을 비교한다.

6. 관련 표현형과의 비교

  1. 생성된 전사 프로파일 데이터와 상관 상대적 표현형을 비교하고 적절히 해석합니다.

Representative Results

예비 qRT-PCR 데이터는 EWS의 반복적이고 무질서한 지역에서 알라닌 돌연변이에 특정 티로신을 가진 DAF에게 불린 EWS/FLI 돌연변이가, EWS/FLI 표적 유전자를 활성화하는 기능을 유지한다는 것을 건의했습니다, 그러나 중요한 표적 유전자를 억압하는 것을 실패했습니다23. EWS 도메인과 EWS/FLI 기능에서 이러한 잔류물의 관계를 더 잘 이해하기 위해 그림 1에 설명되고 설명된 프로토콜이 사용되었습니다. A673 유잉 육종 세포는 FLI1의3'UTR을 표적으로 하는 shRNA로 바이러스적으로 변형되어 내인성 EWS/FLI의 고갈을 초래하였다. 4일간의 선택 후, EWS/FLI 기능은 구조 없이 빈 벡터를 통해 다양한 3XFLAG 태그EWS/FLI 돌연변이 구조물의 바이러스 성 전염으로 구조되었습니다. Δ22라고 불리는 EWS 도메인이 결여된 비기능 돌연변이는 음의 제어로 사용되었고 wtEF라고 불리는 야생형 EWS/FLI가 양수제어(도 2A)로사용되었다. DAF는 테스트 구문으로 사용되었지만 원하는 경우 두 개 이상의 테스트 구인을 사용할 수 있습니다. 세포는 추가로 10일 동안 선택되어 생성 발현이 안정화된 다음 RNA(gDNA 제거 단계), 단백질 및 식민지 형성 에세이를 수집하였다. 4개의 복제가 수집되었고, 효과적인 녹다운 및 구조가 보이는 대표적인 qRT-PCR 및 서부 얼룩이 도 2B-D에표시된다. DAF가 구조한 세포가 도 2E에도시된 바와 같이 식민지를 형성하지 못해 손상된 온코겐성 변화를 시사한다는 점에 유의해야 한다.

복제 검증 및 현상 분석의 완료에 따라, RNA는 도서관 준비 및 다음 세대 시퀀싱을 위한 전국 아동 병원에 게놈 의학 연구소에 제출되었습니다 ~5천만 bp 쌍단 읽기 수집. 데이터는 fastq.gz 파일로 반환되었습니다. 낮은 품질의 읽기는 TrimGalore와 이 파일에서 손질되었고 STAR는 인간 게놈 hg19에 판독을 정렬하고 유전자 당 읽기를 계산하는 데 사용되었다. hg19는 다운스트림 분석에 사용되는 EWS/FLI에 대한 다른 선별된 데이터 집합과의 호환성을 목적으로 사용되었습니다. 이러한 읽기 수는 모든 샘플에 대한 단일 카운트 행렬로 결합되었으며, 그 중 첫 6행은 그림 3에표시됩니다.

카운트는 처음에 배치 정규화 없이 DESeq2를 통해 실행되었지만, 샘플 간 거리의 육안으로 검사는 그림 4A에서빨간색 화살표로 강조 표시된 바와 같이 잠재적인 혼동 배치 효과를 보였다. 이것은 가능성이 각 배치의 처리에 있는 배양및 다름에 있는 세포의 통과에 의해 소개된 생물학 가변성 때문에 생겼습니다. 일괄 처리 효과에 대한 정규화는 ComBat에서 수행되었으며 일반적으로 권장됩니다. 배치 정규화된 데이터의 샘플 간 거리는 그림 4B에표시됩니다. 배치 정규화 에 이어 DESeq2는 기준선을 기준으로 3개의 구문(wtEF, Δ22 및 DAF)에 대한 전사 프로파일을 생성하는 데 사용되었습니다. "부모" A673 세포(여기에 "iLuc"라고 불리는 모의 녹다운 및 모의 구조)가 차동 분석에 포함되었지만,이 실험에 대한 참조는 iEF 세포라고 불리는 EWS / FLI 고갈된 세포입니다. 전사 프로파일은 iEF에 iLuc 샘플을 비교하여 여기에서 내인성 단백질을 생성할 수 있으며, 이는 구조 시스템이 어떻게 작동하는지 이해하는 데 관심이 있을 수 있지만, 이는 이 특정 분석의 목표가 아니다. 돌연변이에 대해 생성된 전사 프로파일에는 iEF와 관련하여 양성(wtEF) 및 음수(Δ22) 컨트롤이 포함되며, 이러한 프로파일은 다른 돌연변이체에 대한 벤치마크로 작동되어야 한다. 이 예에서 긍정적 인 제어가 다른 곳에서 논의 된 내인성 EWS / FLI의 기능을 완전히 재구성하지 않았기 때문에7,23이중요합니다.

도 5의 주 성분 분석(PCA)은 DAF의 전사 프로파일이 wtEF와 Δ22 사이의 중간이며 부분 기능을 확인하는 것을 시사한다. 더욱이, 샘플 전반에 걸친 1000개의 가장 가변적인 유전자의 계층적 클러스터링은 DAF가 EWS/FLI 표적 유전자를 억압하지 못했고, 도 6A 및 도S5에도시된 바와 같이 부분적으로 유지된 유전자 활성화 활성만을 보였다. ToppGene 분석은 DAF가 활성화하는 유전자의 종류가 DAF가 작동하지 않는 그 EWS/FLI 활성화 표적과 기능적으로 구별된다는 것을 건의했습니다(그림 6B). 흥미롭게도, WtEF에 의해 구출된 활성화된 유전자의 기능은 DAF에 의해서는, 전사 통제 및 크로마틴 규정과 관련이 있는 것처럼 보입니다. 식민지 형성 분석의 결과에 기초하여, 이 핵심 유전자 서명에서 유전자는 EWS/FLI 매개 종양 발생에 있는 그들의 역할을 위해 추가 분석되어야 합니다. EWS/FLI 매개 유전자 억압의 중요성은 이전에17에기술되었다.

EWS/FLI는 GGAA-마이크로위성 반복원소(19,22)에대한 고유한 결합친화성을가지고 있으며, 이들 원소에서 결합은 다운스트림 유전자 조절11,15,18,20,22를구동한다. 이들 마이크로위성은 활성화 또는 억압과 연관된 것으로 특징지어지며, (< 5kb) TSS또는 (> 5kb)TSS(25)에대한 실증(< 5kb)의 근접성 중 하나를 특징으로 한다. 또한, TSS23에근접성이 높은 EWS/FLI 조절 유전자(HA) ETS 모티프가 있다. DAF 기능의 특성과 어떤 유형의 EWS/FLI 활성화 유전자DAF를 추가로 분석하기 위해, 이들 상이한 클래스와 관련된 유전자의 차동발현을 분석하였다. 흥미롭게도, DAF는 GGAA-마이크로위성 활성화 유전자를 가장 많이 구출할 수 있었지만, 도 7에서볼 수 있듯이 HA 사이트 근처에서 활성화된 유전자를 구출할 수 없었다. 계층 적 클러스터링에서 볼 수 있듯이 DAF는 모티프 클래스에서 EWS / FLI 매개 억압을 구출하지 못합니다. 이러한 데이터는 DAF가 GGAA 마이크로위성에 결합하고 활성화하기 위해 EWS의 충분한 구조적 특징을 유지한다는 것을 시사합니다. 이는 GGAA에서 EWS/FLI 활동에 중요하다고 생각되는 그대로 SYGQ 도메인에서 발생할 가능성이있다 11. 이 데이터는 또한 DAF에서 돌연변이된 특정 티로신이 HA 사이트에서 EWS/FLI 매개 유전자 조절뿐만 아니라 유전자 억압에서 중요한 역할을 중요하지만 제대로 이해하지 못하는 것을 제안하며, 추가 조사의 중요한 영역을 강조합니다.

Figure 1
그림 1: 워크플로. 전사학에 의한 구조 기능 매핑을 수행하는 단계별 절차의 묘사. 셀은 먼저 구조 기능 매핑에 필요한 구조 제품군을 표현할 준비가 되었습니다. 발현에 따라, 세포는 RNA와 단백질을 위해 수확되고 상관 관계 표현형을 위해 분석되었습니다. 구문의 발현이 검증되었고, 이 과정은 독립적인 생물학적 복제를 수집하기 위해 3-4회 반복되었다. RNA는 그 때 차세대 염기서열분석 (NGS)를 위해 제출되었다. 데이터가 수신되면 데이터를 품질에 맞게 트리밍하고 정렬되고 성적증명서당 카운트가 계산되었습니다. 배치 효과는 제어되었고 전사적 서명 및 차동 식은 DESeq2를 사용하여 결정되었다. 다른 -omics 데이터 집합및 다른 경로 또는 기능 분석을 통합하는 계층적 클러스터링 및 다운스트림 분석을 통합할 수 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2: 구조 표현식 및 상관 관계 적 표의 유효성 검사입니다. (A)이 예제에서 테스트된 구체를 묘사한 회로도. (B)내인성 EWS/FLI의 녹다운 및 면역블롯에 의한 3X-FLAG 태그 구조의 발현의 검증. (C,D) EWS/FLI(C) 활성화대상유전자, NR0B1(D)억압대상 유전자, TGFBR2,qRT-PCR에 의한 시공 활성의 유효성을 검증한다. 데이터는 평균 +/- 표준 편차로 표시됩니다. P-값은 투키의 정직한 중요성 테스트로 계산되었습니다. * p < 0.05, ** p < 0.01, *** p < 0.005 (E) 콜로니 카운트는 연한 천서 의 변형 활동을 평가하기 위해 수행. P-값은 투키의 정직한 중요성 테스트로 계산되었습니다. * p < 0.05, ** p < 0.01, *** p < 0.005. 이 그림은 Theisen에서 적응,외. 23이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 3
그림 3: 분석을 위한 최종 집계 된 카운트 데이터. 모든 시료가 정규화되고 분석될 유전자 카운트 파일의 처음 6행의 스크린샷. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 4
그림 4: 샘플 간 거리 히트맵입니다. (A)원시 개수 데이터의 샘플 클러스터링을 보여주는 샘플 대 샘플 거리 플롯. 일괄 처리 및 샘플별로 클러스터링되는 샘플은 빨간색 화살표로 표시됩니다. (B)ComBat을 사용하여 배치 정규화 한 다음 샘플 간 거리 플롯. 여기서 모든 샘플은 일괄 처리와 는 별개로 클러스터를 함께 복제합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 5
그림 5: 차동 식 분석 결과. (A)모든 샘플에 대해 생성된 전사적 시그니처의 원리 성분 분석(PCA) 플롯은 강력한 샘플 내 클러스터링을 나타내며 DAF가 양수(wtEF) 및 음수(Δ22) 컨트롤 사이에서 중간화되어 있음을 입증한다. (B)각 구문에 있는 유전자에 대해 log2FoldChange에 대해 플롯된 -log(p-값)를 나타내는 화산 플롯. 조정 된 p-값 < 0.05및 |log2 (FoldChange)| > 1은 중요한 것으로 간주되며 빨간색으로 표시됩니다. 패널 5B는 Theisen에서 적응,외. 23이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 6
그림 6: 유전자 클래스를 식별하기 위한 계층적 클러스터링. (A)모든 구문과 기준선, iEF에 걸쳐 상위 1000개 가변 유전자의 계층적 클러스터링은 DAF가 EWS/FLI 매개 유전자 활성화를 부분적으로 구출하는 것을 보여준다. (B)DAF에 의해 구조되거나 구조되지 않은 EWS/FLI 활성화 유전자의 기능적 농축을 보여주는 ToppGene의 유전자 온톨로지(분자 기능) 결과. 패널 6B는 Theisen에서 적응,외. 23이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 7
그림 7: 상이한 구문에 대한 상이한 전사 인자 반응 요소에 대한 상세한 분석: (A)패널(B) 및 (C)를 생성하는 데 사용되는 데이터 처리를 묘사하는 회로도는 여기에 전사 프로파일과 함께 다른 사용 가능한 데이터 집합을 통합한다. (B,C) 직접 EWS/FLI-(B) 활성화 및(C)억압 된 표적의 상이한 클래스의 구조를 보여주는 편집. 유전자포함된 유전자는 내인성 EWS/FLI에 의한 검출 가능한 차동 발현을 가진 그 유전자만이었습니다. 각 원형 차트에서 회색은 구조에 의해 구조되지 않은 유전자의 부분을 묘사합니다. 빨간색은 분화되는 유전자의 부분을 묘사하고, 파란색은 분화되는 유전자의 부분을 묘사합니다. 이 그림은 Theisen에서 적응,외. 23이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 S1: 패스트q.gz 파일을 HPC 환경에 로드하고 트리밍 및 정렬합니다. 이 그림을 다운로드하려면 여기를 클릭하십시오.

그림 S2: 샘플 간에 읽기 수를 정렬하고 ComBat을 사용하여 일괄 처리 정규화를 실행합니다. 이 그림을 다운로드하려면 여기를 클릭하십시오.

그림 S3: DESeq2 실행 및 차동 식 분석의 결과를 추출합니다. 이 그림을 다운로드하려면 여기를 클릭하십시오.

그림 S4: 출력 분석. 이 그림을 다운로드하려면 여기를 클릭하십시오.

그림 S5: 유전자 클래스를 식별하기 위한 계층적 클러스터링: 모든 구문과 기준선 iEF에 걸쳐 상위 1000개 가변 유전자의 계층적 클러스터링이 k 클러스터로 분류됩니다. 이 경우 k=7이지만 이 매개 변수는 그림 S4D에표시된 대로 사용자가 설정합니다. 이 그림을 다운로드하려면 여기를 클릭하십시오.

표 S1: 클러스터 성서를 가진 유전자 목록 (Ensembl 유전자 ID). 이 테이블을 다운로드하려면 여기를 클릭하십시오.

Discussion

온코겐 전사 요인의 생화학 적 메커니즘을 연구하는 것은 그들이 일으키는 질병을 이해하고 새로운 치료 전략을 설계하는 데 매우 중요합니다. 이것은 융합 전사 인자 결과로 염색체 전좌를 특징으로 하는 악성에서 특히 사실이다. 이러한 키메라 단백질에 포함된 도메인은 야생형 단백질에 존재하는 조절 도메인과 의미 있는 상호 작용이 부족할 수 있으며,융합(26,27,28)의맥락에서 구조 기능 정보를 해석하는 능력을 복잡하게 만든다. 더욱이, 이러한 온코겐성 융합의 대부분은 본질적으로 무질서한 도메인10,13,29,30의낮은 복잡성을 특징으로 한다.

EWS 도메인은 다양한 온코겐성융합(10)에관여하는 본질적으로 무질서한 도메인의 예입니다. 본질적으로 무질서하고 반복적인 성격은 EWS 도메인에 의해 채택된 분자 기계장치를 이해하는 노력을 방해했습니다. 구조 기능을 조사하기 위한 사전 노력은 주로 관련 세포 맥락을 재구성하지 못하는 기자 유전자 해석의 맥락이나 세포 배경에서 상이한 돌연변이를 사용하거나 의미 있는 부분기능(11,17,25)을생성하는 구조적 변이가 결여되어 있다. 여기에 제시된 메서드는 이러한 문제를 해결합니다. 구조 기능 매핑은 질병 관련 세포 컨텍스트에서 수행되며 차세대 시퀀싱을 통해 전사 프로파일링을 통해 네이티브 크로마틴 설정에서 전사 인자 기능을 평가할 수 있습니다. EWS/FLI의 DAF 돌연변이의 특정 사례에서, DAF는 분리된 반응 요소를 사용하여 리포터 분석에서 거의 활성을 보여주지 만, 기자 분석또는 네이티브 크로마틴에서 전체 유전자 프로모터의 맥락에서 활성을 나타내기 위해 흥미로운표현형(23)을시사한다. 여기에 설명된 방법을 사용하면 게놈 전반에 걸쳐 어떤 유형의 조절 요소가 질병 환경에서 가장 반응성이 있는지에 대한 질문을 보다 직접적으로 해결합니다. 네이티브 크로마틴 컨텍스트에서 모든 후보 대상 유전자를 동시에 테스트함으로써 전사적 접근법은 부분 기능을 가진 구조를 식별할 가능성이 더 높습니다.

질병 관련 세포 배경을 사용하는 내재된 강점은 아마도 이 기술의 가장 큰 한계일 것입니다. 가장 중요한 요인 중 하나는 이러한 실험에 적합한 세포 시스템을 선택하는 것입니다. 병상 전사 인자를 가진 악성에서 파생된 많은 세포주는 그 전사 인자의 녹다운을 쉽게 용납하지 않으며, 많은 경우에, 특히 소아암의 경우, 기원의 진정한 세포는 논란의 여지가 있으며 다른 세포 배경에서 종양유전자의 발현은 엄청나게독성이 31,32입니다. . 이러한 경우에, 연구원이 결과의 해석에 주의를 기울이고 보다 질병 관련 세포 모형에 있는 어떤 관련 사실 인정든지 적절하게 유효성을 검사하는 한, 다른 세포 배경에서 실험을 수행하는 것이 유용할 수 있습니다.

종양 유전자의 발현의 안정성과 표현성 결과를 신중하게 검증하고 엄격한 기준을 충족하는 시퀀싱을 위한 시료만 제출하는 것이 매우 중요합니다. 여기서, 여기에는 소수의 알려진 표적 유전자의 녹다운 및 구조, qRT-PCR을 확인하기 위해 서체 블롯을 포함하여 양성 대조군(도2)을검증하였다. 각 배치를 통해 가능한 한 세포 및 RNA 제제를 가능한 한 유사하게 수행함으로써 가능한 한 많은 배치 가변성을 감소하는 것이 중요합니다.

여기에서 기술된 방법은 연구 중인 전사 인자의 게놈 전체 기능에 말하는 다른 유형의 게놈 데이터와 결합될 때 특히 강력해집니다. 이러한 유형의 구조 기능 분석에 대한 향후 방향은 ChIP-seq 및 ATAC-seq를 포함하도록 확장되어 전사 계수의 결합과 크로마틴 접근성의 유도된 변화를 결정할 것입니다. 제품군으로서 이러한 유형의 데이터는 온코겐 전사 요인의 다른 구조 구성 요소가 기능의 다양한 측면(즉, DNA 바인딩 대 크로마틴 수정 대 공동 레귤레이터 모집)에 기여하는 위치를 가리킬 수 있습니다. 전반적으로, NGS 기반 접근법을 사용하여 융합 전사 인자의 구조 기능 관계를 매핑하면 이러한 단백질의 온코겐 성 기능의 생화학 적 결정요인에 새로운 통찰력을 얻을 수 있습니다. 이것은 그들이 일으키는 질병에 대한 우리의 이해를 높이고 새로운 치료 전략의 개발을 가능하게하는 데 중요합니다.

Disclosures

SLL은 샐러리우스 제약의 자문 위원회 위원이자 지분 보유자로서 이해 상충을 선언합니다. SLL은 또한 미국 특허 번호에 상장 된 발명가입니다. 미국 7,393,253 B2, "유잉 육종의 진단 및 치료를 위한 방법과 조성물", 그리고 미국 8,557,532, "약물 내성 유잉육종의 진단 및 치료" 이는 데이터 및 자료 공유에 대한 JoVE 정책을 준수하는 것은 아닙니다.

Acknowledgments

이 연구는 전국 아동 병원의 아비가일 벡스너 연구소의 고성능 컴퓨팅 시설에 의해 지원되었습니다. 이 작품은 건강 국립 암 연구소의 국립 연구소 [U54 CA231641 SLL, R01 CA183776에]에 의해 지원되었다; 알렉스의 레모네이드 스탠드 재단 [ERT에 젊은 조사관 상]; 펠로토니아 [ERT에 대한 펠로우십]; 및 국민건강의학연구위원회 CJ마틴 해외생물의학펠로우십[APP1111032 to KIP].

Materials

Name Company Catalog Number Comments
Wet Lab Reagents
anti-FLI rabbit pAb Abcam ab15289 1:500
anti-lamin B1 rabbit pAb Abcam ab16048 1:2000
Cell-based system for introduction of mutant constructs Determined by cell system used
Cryotubes For viral aliquots
DMEM Corning Cellgro 10-013-CV For viral production
Fetal bovine serum Gibco 16000-044 For viral production
G418 ThermoFisher 10131027 For viral production
HEK293-EBNAs ATCC CRL-10852 For viral production
HEPES Gibco 15630106
Hygromycin B ThermoFisher 10687010
M2 anti-FLAG mouse mAb Sigma F3165 1:2000
Near IR-secondary antibodies Li-Cor
Optimem Gibco 31985062 For viral production
Penicillin/Streptomycin/Glutamine Gibco 10378-016 For viral production
Polybrene Sigma TR-1003-G For viral transduction
Puromycin Sigma P8833 Stored at 2 mg/mL stock
RNeasy Plus kit Qiagen 74136 Has gDNA removal columns
Selection reagents As dictated by cell system used
Sodium Pyruvate Gibco 11360-070 For viral production
Tissue culture media Determined by cell system used
TransIT-LT1 Mirus MIR 2304 For viral production
Software
Access to HPC environment
AnnotationDbi 1.38.2
Cairo 1.5-10
DESeq2 1.16.1
genefilter 1.58.1
ggbiplot 0.55
ggplot2 3.1.1
org.Hs.eg.db 3.4.1
pheatmap 1.0.12
PuTTY
R 3.4.0
RColorBrewer 1.1-2
reshape2 1.4.3
rgl 0.100.19
R-studio
STAR Version 2.6 or later
sva 3.24.4
TrimGalore!
WinSCP

DOWNLOAD MATERIALS LIST

References

  1. Miettinen, M., et al. New fusion sarcomas: histopathology and clinical significance of selected entities. Human Pathology. 86, 57-65 (2019).
  2. Knott, M. M. L., et al. Targeting the undruggable: exploiting neomorphic features of fusion oncoproteins in childhood sarcomas for innovative therapies. Cancer and Metastasis Reviews. 38, 625-642 (2019).
  3. Yoshihara, K., et al. The landscape and therapeutic relevance of cancer-associated transcript fusions. Oncogene. 34, 4845-4854 (2015).
  4. Duesberg, P. H. Cancer genes generated by rare chromosomal rearrangements rather than activation of oncogenes. Medical Oncology and Tumor Pharmacotherapy. 4, 163-175 (1987).
  5. Dupain, C., Harttrampf, A. C., Urbinati, G., Geoerger, B., Massaad-Massade, L. Relevance of Fusion Genes in Pediatric Cancers: Toward Precision Medicine. Molecular Therapy - Nucleic Acids. 6, 315-326 (2017).
  6. Mitelman, F., Johansson, B., Mertens, F. The impact of translocations and gene fusions on cancer causation. Nature Reviews Cancer. 7, 233-245 (2007).
  7. Smith, R., et al. Expression profiling of EWS/FLI identifies NKX2.2 as a critical target gene in Ewing's sarcoma. Cancer Cell. 9, 405-416 (2006).
  8. Davicioni, E., et al. Identification of a PAX-FKHR gene expression signature that defines molecular classes and determines the prognosis of alveolar rhabdomyosarcomas. Cancer Research. 66, 6936-6946 (2006).
  9. Gröbner, S. N., et al. The landscape of genomic alterations across childhood cancers. Nature. 555, 321-327 (2018).
  10. Kim, J., Pelletier, J. Molecular genetics of chromosome translocations involving EWS and related family members. Physiological Genomics. 1, 127-138 (1999).
  11. Boulay, G., et al. Cancer-Specific Retargeting of BAF Complexes by a Prion-like Domain. Cell. 171, 163-178 (2017).
  12. Lessnick, S. L., Braun, B. S., Denny, C. T., May, W. A. Multiple domains mediate transformation by the Ewing’s sarcoma EWS/FLI-1 fusion gene. Oncogene. 10, 423-431 (1995).
  13. Leach, B. I., et al. Leukemia fusion target AF9 is an intrinsically disordered transcriptional regulator that recruits multiple partners via coupled folding and binding. Structure. 21, 176-183 (2013).
  14. Ng, K. P., et al. Multiple aromatic side chains within a disordered structure are critical for transcription and transforming activity of EWS family oncoproteins. Proceedings of the National Academy of Sciences U.S.A. 104, 479-484 (2007).
  15. Riggi, N., et al. EWS-FLI1 Divergent Chromatin Remodeling Mechanisms to Directly Activate or Repress Enhancer Elements in Ewing Sarcoma. Cancer Cell. 26, 668-681 (2014).
  16. Tomazou, E. M., et al. Epigenome Mapping Reveals Distinct Modes of Gene Regulation and Widespread Enhancer Reprogramming by the Oncogenic Fusion Protein EWS-FLI1. Cell Reports. 10, 1082-1095 (2015).
  17. Sankar, S., et al. Mechanism and relevance of EWS/FLI-mediated transcriptional repression in Ewing sarcoma. Oncogene. 32, 5089-5100 (2013).
  18. Gangwal, K., et al. Microsatellites as EWS/FLI response elements in Ewing's sarcoma. Proceedings of the National Academy of Sciences U.S.A. 105, 10149-10154 (2008).
  19. Gangwal, K., Close, D., Enriquez, C. A., Hill, C. P., Lessnick, S. L. Emergent Properties of EWS/FLI Regulation via GGAA Microsatellites in Ewing's Sarcoma. Genes & Cancer. 1, 177-187 (2010).
  20. Guillon, N., et al. The Oncogenic EWS-FLI1 Protein Binds In Vivo GGAA Microsatellite Sequences with Potential Transcriptional Activation Function. PLoS One. 4, 4932 (2009).
  21. Chong, S., et al. Imaging dynamic and selective low-complexity domain interactions that control gene transcription. Science. 361, (2018).
  22. Johnson, K. M., et al. Role for the EWS domain of EWS/FLI in binding GGAA-microsatellites required for Ewing sarcoma anchorage independent growth. Proceedings of the National Academy of Sciences U.S.A. 114, 9870-9875 (2017).
  23. Theisen, E. R., et al. Transcriptomic analysis functionally maps the intrinsically disordered domain of EWS/FLI and reveals novel transcriptional dependencies for oncogenesis. Genes & Cancer. 10, 21-38 (2019).
  24. Chen, J., Bardes, E. E., Aronow, B. J., Jegga, A. G. ToppGene Suite for gene list enrichment analysis and candidate gene prioritization. Nucleic Acids Research. 37, 305-311 (2009).
  25. Johnson, K. M., Taslim, C., Saund, R. S., Lessnick, S. L. Identification of two types of GGAA-microsatellites and their roles in EWS/FLI binding and gene regulation in Ewing sarcoma. PLOS One. 12, 0186275 (2017).
  26. Kim, P., Ballester, L. Y., Zhao, Z. Domain retention in transcription factor fusion genes and its biological and clinical implications: a pan-cancer study. Oncotarget. 8, 110103-110117 (2017).
  27. de Mendíbil, I. O., Vizmanos, J. L., Novo, F. J. Signatures of Selection in Fusion Transcripts Resulting from Chromosomal Translocations in Human Cancer. PLOS One. 4, 4805 (2009).
  28. Frenkel-Morgenstern, M., Valencia, A. Novel domain combinations in proteins encoded by chimeric transcripts. Bioinformatics. 28, 67-74 (2012).
  29. Hegyi, H., Buday, L., Tompa, P. Intrinsic Structural Disorder Confers Cellular Viability on Oncogenic Fusion Proteins. PLoS Computational Biology. 5, 1000552 (2009).
  30. Latysheva, N. S., Babu, M. M. Discovering and understanding oncogenic gene fusions through data intensive computational approaches. Nucleic Acids Research. 44, 4487-4503 (2016).
  31. Deneen, B., Denny, C. T. Loss of p16 pathways stabilizes EWS/FLI1 expression and complements EWS/FLI1 mediated transformation. Oncogene. 20, 6731-6741 (2001).
  32. Kendall, G. C., et al. PAX3-FOXO1 transgenic zebrafish models identify HES3 as a mediator of rhabdomyosarcoma tumorigenesis. eLife. 7, 33800 (2018).

Tags

암 연구 문제 160 전사학 RNA-seq 구조 기능 전사 요인 본질적으로 무질서한 도메인 EWS/FLI 유잉 육종 유전자 조절
전사 분석을 사용하여 무질서한 온코겐 전사 요인의 구조 기능 관계 매핑
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Showpnil, I. A., Miller, K. R.,More

Showpnil, I. A., Miller, K. R., Taslim, C., Pishas, K. I., Lessnick, S. L., Theisen, E. R. Mapping the Structure-Function Relationships of Disordered Oncogenic Transcription Factors Using Transcriptomic Analysis. J. Vis. Exp. (160), e61564, doi:10.3791/61564 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter