Biochemistry

대규모 다중 오믹스 게놈 전체 연관 연구 (Mo-GWAS) : 샘플 준비 및 정상화에 대한 지침

Published: July 27, 2021 doi: 10.3791/62732

Mustafa Bulut¹, Alisdair R. Fernie^1,2, Saleh Alseekh^1,2

¹Max-Planck-Institute of Molecular Plant Physiology, ²Center of Plant Systems Biology and Biotechnology

Summary

이 프로토콜에서는 많은 샘플의 효율적이고 빠른 샘플 준비를 결합한 최적화된 워크플로를 제시합니다. 또한, 대사 GWAS 연구의 고처리량 평가를 위한 분석 변형을 줄이기 위한 단계별 가이드를 제공합니다.

Abstract

가스 크로마토그래피-질량 분광법(GC-MS) 및 액체 크로마토그래피-질량 분광법(LC-MS)은 수십만 개의 대사산물 특징을 검출하고 정량화하기 위해 널리 사용되는 대사체학 접근법입니다. 그러나, 다수의 샘플에 이러한 기술을 적용하는 것은 특히 게놈 전체 연관 연구 (GWAS)에 대해보다 복잡한 상호 작용의 대상이됩니다. 이 프로토콜은 효율적이고 빠른 샘플 준비와 콩과 식물 작물 종에 대한 많은 수의 샘플 분석을 결합하는 최적화 된 대사 워크 플로우를 설명합니다. 이 약간 변형 된 추출 방법은 처음에는 식물 및 동물 조직의 분석을 위해 개발되었으며 극성 및 지질 대사 산물의 포획을 허용하는 메틸 tert-butyl 에테르 : 메탄올 용매에서의 추출을 기반으로합니다. 또한 GWAS의 대사 분산에 대한 고처리량 평가에 필수적인 분석 변형을 줄이기위한 단계별 가이드를 제공합니다.

Introduction

대규모 "omics" 접근법 은 복잡한 생물학적 시스템(1,2,3)의 분석과 유전자형과 결과적인 표현형⁽⁴) 사이의 연관성에 대한 더 깊은 이해를 가능하게 하였다. 초고성능 액체 크로마토그래피-질량 분광분석법(UHPLC-MS) 및 GC-MS를 사용한 대사체학은 과다한 대사산물 특징의 검출을 가능하게 하였으며, 그 중 일부만이 어느 정도 주석이 첨부되어 알려지지 않은 대사산물의 비율이 높아졌다. 복잡한 상호 작용은 대규모 대사체학을 다양한 집단의 근본적인 유전자형 변이와 결합하여 탐구 할 수 있습니다⁵. 그러나 대규모 샘플 세트를 처리하는 것은 본질적으로 분석 변형과 관련이 있으며, 추가 하류 공정에 대한 대사 분산 평가를 왜곡합니다. 특히, 분석 변동으로 이어지는 주요 문제는 시간 경과에 따른 기계 성능 및 기기 드리프트를 기반으로^합니다6. 배치 간 변동의 통합은 어렵고 대규모 구조화 된 식물 개체군을 분석 할 때 특히 문제가됩니다. 분석 오류를 수정하기 위해 내부, 외부 및 동위원소 표지 된 내부 표준의 사용과 같은 비 생물학적 변이를 수정하기 위해 여러 정규화 절차가 제안되었으며, 그 중 각각은 본질적으로 알려진 문제 및 함정 7,8,9,10과 관련이 있습니다.

분석 변형 외에도 추출 프로토콜의 선택은 일반적으로 분석 방법에 따라 다릅니다. 궁극적으로, 재료 및 인건비를 절감할 뿐만 아니라 상 분리 기반 추출 방법을 수행하여 다양한 분석 공정에 동일한 샘플의 여러 분취량을 사용할 필요성을 줄이는 것이 바람직합니다. 이러한 방법은 극성 및 소수성 화합물¹¹을 분별하기 위해 클로로포름: 메탄올/물 용매를 사용하여 처음 도입되었다.

이 프로토콜은 콩과 식물 종의 극성 대사 산물과 지질을 프로파일 링하는 다중 오믹스 플랫폼을위한 빠른 고 처리량 파이프 라인을 설명합니다. 또한, GWAS를 수행하여 대사산물 정량적 형질 유전자좌(QTL)를 검출하기 위해 유전자형 정보를 통합하기 전에 분석 변이에 대해 이러한 데이터 세트를 적절하게 보정하고 정규화할 수 있는 방법을 보여줍니다.

Protocol

1. 실험 설계 및 식물 재배

참고: 실험 가설에 따라 실험을 설정하십시오(예: 대규모 GWAS 모집단을 사용하면 수탁 대신 모든 개별 SNP의 일배체형에 따라 통계 테스트가 수행되므로 다중 반복실험의 필요성이 줄어듭니다. 대조적으로, 다중 반복실험은 다른 실험 접근법에서 필수적이다. 실험을 준비하는 동안 다음 사항을 고려해야합니다.

실험 가설에 따라 충분한 생물학적 반복실험을 포함시킨다.
생물학적 복제물을 블록-와이즈로 무작위화하여 재배 동안 지역적 환경 편향, 예를 들어, 온실, 밭을 감소시킨다.
성장하는 동안 식물의 적절한 유지 보수를 보장하십시오. 편견을 줄이기 위해 식물을 균질하게 처리하십시오.

2. 생물학적 식물소재의 제조

수확 준비
1. 균질화를 위한 두 개의 5mm 및 두 개의 직경 8mm 금속 비드를 함유하는 라벨 수확 튜브(20 mL). 액체 질소로 탈전을 채 웁니다.
  참고 : 식물은 신선한 잎과 뿌리 조직 수확을위한 식물 단계에 있어야합니다.
액체 질소에서 플래시 냉동하여 생물학적 샘플을 수확하십시오. 장기간 수확 기간 동안 신진 대사에 대한 일주기 진동의 영향을 배제하기 위해 가능한 한 빨리 수확^12,13. 추가로 가공하기 위해 수확된 신선한 잎 및 뿌리 조직을 -80°C에서 저장한다.
참고 : 잎 절단에서 플래시 동결로 절단하는 것은 잎이 절단 된 후 활성 생물학적 과정이 상처로 인한 신진 대사 프로파일을 변경하므로 몇 초 이상 걸리지 않아야합니다. 뿌리의 경우, 액체 질소에서 플래시 동결하기 전에 물로 씻어 뿌리를 미리 닦으십시오. 뿌리 표면의 과도한 물은 종이 조직으로 흡수되어야합니다. 건조된 종자는 실온에서 저장될 수 있다; 액체 질소에서 동결이 필요하지 않습니다.
조직 믹서 밀을 사용하여 조직을 분쇄하십시오.
1. 튜브 홀더를 액체 질소에서 몇 분 동안 예냉하여 조직을 분쇄하는 동안 저온을 유지하십시오.
2. 생물학적 샘플을 -80°C 냉동고에서 꺼내어 제거한 후 질소 함유 탈전으로 운반한다.
3. 조직을 분쇄하여 균질 분말을 얻는 단계; 1 분 동안 25Hz를 사용하고 조직이 균질하게 접지되지 않은 경우 액체 질소에서 동결 한 후 반복하십시오.
말린 씨앗을 분쇄하려면 직경 15mm 금속 비드가있는 분쇄 용기에 씨앗을 넣으십시오. 2.3.3에서 언급한 것과 동일한 빈도와 시간을 사용하십시오.
참고: 티슈 믹서 밀을 사용할 수 없는 경우 깨끗하고 사전 냉각된 모르타르 및 유모차를 사용할 수 있습니다.
프리쿨 라벨이 붙은 2 mL 세이프-락 마이크로원심분리 튜브. 분석 척도를 사용하여 신선한 식물 재료의 ±5mg의 오차로 50mg의 무게를 측정하십시오. 식물 재료를 액체 질소로 옮기는 데 사용되는 도구를 미리 냉각하십시오. 칭량 공정 중에 식물 재료가 냉동 상태로 유지되는지 확인하십시오.
참고: 생물학적 과정이 온도 증가에 의해 활성화되고 대사 프로파일⁽¹⁴)이 변경되므로 신선한 식물 재료를 실온에 너무 오래 노출시키지 마십시오.
각 샘플의 비율과 풀링된 신선한 식물 재료 ±5mg의 오차가 있는 50mg의 무게를 미리 냉각된 2mL 세이프록(safe-lock) 마이크로 원심분리 튜브에 풀링하여 추가적인 품질 관리(QC) 샘플을 생성합니다.
참고 : 적어도 세 개의 QC 샘플은 60 샘플마다 권장됩니다. QC 샘플은 다운스트림 보정, 정규화 및 분석에 필수적입니다.

3. 추출 시약

신선한 조직, 예를 들어, 잎과 뿌리
참고: 샘플 추출은 앞서 설명한 프로토콜¹⁵를 기반으로 합니다. 이 프로토콜은 현재의 요구, 예를 들어, 다수의 조직, 상이한 내부 표준, 및 대규모 실험에 기초하여 수정되었다. 또한 아래에 언급된 모든 볼륨 및 계측기 설정은 사내 분석 장치에 맞게 조정됩니다. 프로토콜 사용자는 테스트 샘플을 기반으로 분석 단위 및 생물학적 샘플에 따라 이를 조정해야 합니다.
1. 추출 혼합물 1 (EM1) : 메틸 3 급 부틸 에테르 (MTBE) / 메탄올 (MeOH) (3 : 1 v / v)
  1. MTBE/MeOH의 혼합물을 3:1 비율로 준비한다. 추출 용매 100mL의 경우, MTBE 75mL와 MeOH 25mL를 깨끗한 유리 병에 섞는다.
    참고 : 용제는 적절한 안전 장비로 흄 후드에서 조심스럽게 다루어야합니다.
  2. UHPLC-MS 기반 지질 분석을 위한 내부 표준으로 1,2-디헵타데카노일-sn-글리세로-3-포스포콜린(클로로포름 중 1mg/mL) 45μL를, GC-MS 기반 분석을 위한 내부 표준으로 리비톨 400μL(물 중 1mg/mL), UHPLC-MS 기반 대사산물 분석을 위한 이소비텍신 125μL(MeOH/물에서 1mg/mL(1:1 v/v))를 추가합니다.
    참고: 내부 표준의 추가는 분석 요구에 따라 사후 분석 정규화에 필요합니다. 각 샘플에 1 mL의 EM1이 필요하므로 전체 실험에 사용해야하는 실험 샘플 크기에 따라 원액을 준비하십시오. EM1은 -20°C에서 보관해야 합니다. 사용된 내부 표준이 없고 조사된 종의 다른 화합물과 겹치는지 확인하십시오. 몇 가지 표준을 사용할 수 있습니다. 이 프로토콜에서 내부 표준의 선택은 공통 콩 추출물⁽¹⁶)을 사용한 이전 테스트에 기초했다.
2. 추출 혼합물 2 (EM2) 물 / 메탄올 (MeOH) (3:1 v / v)
  1. EM2 100mL의 경우, 깨끗한 유리병에 이중 증류수 75mL와 MeOH 25mL를 넣는다.
  2. 샘플 당 500 μL의 EM2를 첨가하고, 전체 실험에 사용되어야 하는 실험 샘플 크기에 따라 원액을 제조하였다. EM2를 4°C에서 보관합니다.
말린 씨앗
1. 추출 혼합물 3 (EM3) 메탄올 (MeOH) / 물 (7:3 v / v)
  1. EM3 100mL의 경우, 깨끗한 유리병에 MeOH 70mL와 이중 증류수 30mL를 넣습니다. 각 샘플에 대해 1 mL의 EM3를 준비하십시오.
  2. GC-MS 기반 분석을 위한 내부 표준으로 리비톨 400μL(물 1mg/mL)를 추가하고 UHPLC-MS 기반 대사산물 분석을 위해 이소비텍신 125μL(MeOH/물에서 1mg/mL(1:1 v/v))를 추가합니다.
    참고: 실험 샘플 크기에 따라 원액을 준비하고 전체 실험에 사용하십시오. EM3를 4°C에 보관합니다.

4. 시료 추출

신선한 조직, 예를 들어, 잎과 뿌리
1. 각 샘플에 대해 세 개의 1.5 mL 세이프 락 마이크로 원심분리 튜브를 준비하십시오. EM1을 -20°C 액체 냉각 시스템에 보관하십시오. 신선한 샘플을 -80°C 냉동고에서 수송을 위해 드라이 아이스 또는 액체 질소로 옮긴다. 얼음 위에 보관하기 전에 예비냉각된 EM1 1mL를 각 50mg 분취량에 넣고 간단히 와류합니다.
2. 샘플을 4°C에서 10분 동안 800 × g 의 오비탈 진탕기 상에서 인큐베이션한다.
3. 샘플을 빙냉식 초음파 처리 욕조에서 10 분 동안 초음파 처리하십시오.
4. 다중 채널 피펫을 사용하여 500μL의 EM2를 추가하여 추가 부피의 변동을 방지합니다.
5. 샘플을 간단히 볼텍스하여 4°C에서 5분 동안 11,200 × g 에서 원심분리하기 전에 추출 혼합물을 혼합한다.
6. 상 분리가 발생한 후, 500 μL의 상부 지질 함유 상을 예비표지된 1.5 mL 세이프록(safe-lock) 마이크로원심분리 튜브로 옮긴다. 나머지 상위 단계를 제거합니다.
  참고: 이 상부 상층은 증기압이 높고 피펫에서 누출되는 경향이 있으므로 이송하는 동안 주의하십시오.
7. GC-MS 및 UHPLC-MS 분석에 사용된 두 개의 세이프록(safe-lock) 마이크로원심분리 튜브에 150 μL 및 300 μL의 저극성 및 반극성 대사산물 함유 상을 각각 전사하였다.
8. 추출된 모든 분획을 진공 농축기를 이용하여 가열하지 않고 용매가 증발되게 하여 농축하고 -80°C에서 보관한다.
말린 씨앗
1. 각 샘플에 대해 두 개의 1.5 mL 세이프록(safe-lock) 마이크로원심분리 튜브를 준비합니다. EM3를 얼음 위에 보관하십시오. 직경 5 mm 금속 비드를 샘플 분취량에 넣는다.
2. 각 50mg 분취량에 EM3 1mL를 첨가하고 샘플을 얼음 위에 놓기 전에 25Hz에서 2-3분 동안 균질화합니다.
3. 샘플을 빙냉식 초음파 처리 욕조에서 10 분 동안 초음파 처리하십시오.
4. 샘플을 4°C에서 5분 동안 11,200 × g 에서 원심분리하기 전에 간단히 볼텍스한다.
5. 150 μL 및 300 μL의 상청액을 GC-MS 및 UHPLC-MS 분석에 각각 사용된 두 개의 1.5 mL 세이프록형 마이크로원심분리 튜브에 옮긴다.
6. 추출된 모든 분획을 진공 농축기를 이용하여 가열하지 않고 용매가 증발되게 하여 농축하고 -80°C에서 보관한다.
  참고 : 경험을 바탕으로 사용자는 반극성 대사 산물 및 건조 된 종자에서 유도체화 된 대사 산물 분석을위한 4.2 단계를 수행하는 것이 좋습니다. 건조된 종자 지질 분석을 위한 추출 단계 4.1을 수행한다.

5. UHPLC-MS를 이용한 지질 분석

건조된 지질 분획을 250 μL의 아세토니트릴:2-프로판올(7:3, vol/vol)에 재현탁시킨다.
지질 상을 5분 동안 초음파 처리하고, 11,200 × g 에서 1분 동안 원심분리한다.
90 μL의 상청액을 LC-MS용 유리 바이알로 옮긴다.
추출물 2 μL를 LC-MS에 주입한다.
표 1에 나타낸 바와 같이 용리액 A 및 B의 점진적인 변화와 함께 400 μL/min의 흐름으로 실행되는 60°C에서 유지된 역상_C8 컬럼에서 지질 분획화를 수행한다. 150-1,500 m/z의 질량 범위로 포지티브 이온화 모드에서 질량 스펙트럼을 획득하십시오.
모든 일일 배치에 여러 QC 샘플을 포함하고 분석 변동에 대한 보정을 보장하기 위해 블랭크를 포함하십시오. 샘플을 순차적으로 블록 단위로 무작위화합니다.

6. UHPLC-MS를 이용한 극성 및 반극성 대사산물 분석

건조된 극성 상을 UHPLC 등급 메탄올 180 μL에 재현탁시킨다: 물(1:1 v/v).
극성상을 2분 동안 초음파 처리하고, 11,200 × g 에서 1분 동안 원심분리한다.
90 μL의 상청액을 LC-MS용 유리 바이알로 옮긴다.
추출물 3 μL를 LC-MS에 주입한다.
표 1에 나타낸 바와 같이 용리액 A 및 B의 점진적_인 변화와 함께 400 μL/min의 흐름으로 실행되는 40°C에서 유지된 역상 C 18 컬럼에서 대사산물 분획화를 수행한다. 전체 MS 스캔에서 100-1,500m /z 의 질량 범위에서 질량 스펙트럼을 획득하고 40keV의 고에너지 충돌 해리(HCD)에 의해 유도되는 모든 이온 단편화(AIF)를 획득합니다.
참고: 두 이온화 모드를 모두 사용하십시오. 그러나 많은 수의 샘플을 실행하는 동안 제한된 용량으로 인해 두 이온화 모드에서 테스트 샘플을 실행하여 선호하는 이온화 모드를 결정합니다.
모든 일일 배치에 여러 QC 샘플을 포함하고 분석 변동에 대한 보정을 보장하기 위해 블랭크를 포함하십시오. 샘플을 순차적으로 블록 단위로 무작위화합니다.
네거티브 및 포지티브 이온화 모드 모두에서 데이터 종속 MS 2에서 풀링된^QC를 실행합니다. 주석을 위해 이후 단계 (8.5)에서 얻은 질량 스펙트럼을 사용하십시오.

7. GC-MS를 이용한 유도체화된 대사산물 분석^17,18

참고: 유도체화된 대사산물의 분석은 앞서 기술된 프로토콜¹⁷에 기초한다. 흄 후드에서 모든 유도체화 시약을 처리하십시오. N-메틸-N-(트리메틸실릴)트리플루오르아세트아미드(MSTFA)가 물 및 습도와 접촉하지 않도록 하십시오.

유도체화 시약 1 (DR1)
1. 피리딘에 메톡시아민 염산염을 녹여 DR1의 농도 30mg/mL를 얻는다. 각 샘플에 대해 40μL의 DR1을 사용합니다. 시료 크기에 따라 원액을 준비하고, 실온에서 보관한다.
유도체화 시약 2 (DR2)
1. MSTFA를 MSTFA 1 mL 당 20 μL의 지방산 메틸 에스테르 (FAMEs)로 용해시킨다. 각 샘플에 대해 70μL의 DR2를 사용합니다. 시료 크기에 따라 원액을 준비한다. MSTFA를 4°C에, FAME를 -20°C에 보관합니다.
  참고: FAME에는 메틸 카프릴레이트, 메틸 펠라고네이트, 메틸 카프레이트, 메틸라우레이트, 메틸 미리스테이트, 메틸 팔미테이트, 메틸 스테아레이트, 메틸 에이코사노에이트, 메틸 도코사노에이트, 리그노세르산 메틸 에스테르, 메틸헥사코사노에이트, 메틸옥타코사노에이트 및 트리아콘탄산 메틸에스테르가 포함되며, 이들은 액체 또는 고체 표준의 경우 각각 0.8 μL/mL 또는 0.4 mg/mL의 농도로 CHCl3에 용해된다.
펠릿을 극성상(-80°C에서 저장)으로부터 30분 동안 진공 농축기를 사용하여 재건조시켜 하류 유도체화에 사용되는 용매와 함께 보관하는 동안 발생하는_H2O의 임의의 간섭을 피한다.
40 μL의 DR1을 첨가한다.
샘플을 오비탈 쉐이커를 사용하여 37°C에서 2시간 동안 950 × g 에서 흔들고, 이어서 액체를 짧은 스핀 다운하였다.
DR2 70μL를 첨가한다.
오비탈 쉐이커를 사용하여 37°C에서 30분 동안 950 × g 에서 다시 흔들어 주십시오.
GC-MS 분석을 위해 90 μL를 유리 바이알로 옮기기 전에 실온에서 간단히 원심분리한다.
대사 산물 농도에 따라 GC-MS 스플릿리스 모드에 1μL를 주입하고 2mL/min의 일정한 헬륨 캐리어 가스 흐름을 제공합니다. 주입 온도는 30-m MDN-35 모세관 컬럼을 사용하여 230°C로 설정한다.
참고: 추가 정보(예: 온도 구배)는 표 1에서 찾을 수 있습니다. 질량 범위는 70-600 m/z로 설정되며 스캔/분은 20개입니다. 추정적 과부하 화합물의 정량화를 가능하게 하는 분할 모드를 포함하여, 이러한 경우에 추출물 재유도체화를 위한 비용과 시간을 절약한다.
모든 일일 배치에 여러 QC 샘플을 포함하고 분석 변동에 대한 보정을 보장하기 위해 블랭크를 포함하십시오. 샘플을 순차적으로 블록 단위로 적절하게 무작위화합니다.

8. 크로마토그램 처리 및 화합물 주석

강도 임계값을 정의하여 화학 소음을 필터링합니다. 크로마토그램을 처리하는 동안 모든 QC 샘플을 포함하십시오.
참고: 대규모 데이터의 경우 노이즈 필터링은 컴퓨팅 시간과 처리 능력을 줄이는 데 매우 중요합니다.
보존 시간 이동 창을 정의하여 크로마토그램을 정렬합니다. 각 배치로부터의 크로마토그램을 확인하여 배치내 및 배치간 변동을 평가한다.
피크 형상, 예를 들어 반최대(FWHM) 계산에서 전체 너비에 대한 높이 및 폭에 따라 피크 검출을 수행합니다.
중복 신호를 줄이고 싱글 톤을 필터링하기 위해 클러스터 동위원소.
참고: 크로마토그램 처리에 사용되는 소프트웨어에 대한 자세한 내용은 재료 표를 참조하십시오. MS-DIAL, MetAlign, MzMin, Xcalibur^19,20,21과 같이 자유롭게 사용 가능한 다양한 소프트웨어 도구를 사용하여 크로마토그램을 처리하는 방법에 대한 심층적인 프로토콜이 제공됩니다.
복합 주석에 대해 풀링된 QC 샘플의 ddMS² 데이터를 사용하십시오. 단동위원소 질량을 결정하고 일반적인 중성 손실, 공지된 하전된 아글리콘, 및 상이한 유형의 절단, 예를 들어, 동위원소 또는 이질용해성^16,22를 관찰함으로써 분자 구조를 평가한다.
대사 산물 데이터를보고하려면 Fernie et al. 2011²³에 설명 된 권장 사항을 따르십시오.
참고: 다른 전산 대사체학 접근법을 사용하여 대사체학 데이터^(24,25,26)를 분석할 수 있다.

9. 대규모 대사체학 데이터 세트의 정규화

내부 표준의 분포를 확인하고 단일 또는 다중 내부 표준의 응답을 수정하여 정규화합니다.
크로마토그램으로부터 수득된 피크 강도를 단계 2.5로부터 분취된 균질화된 샘플 중량으로 나누어 정확한 샘플 중량에 걸쳐 보정한다.
다중 배치 시리즈에서 강도 드리프트에 대해 정확합니다. R을 사용하여 국부적으로 추정된 산점도 평활화(LOESS)²⁷과 같은 QC 기반 보정 방법을 수행합니다.
참고: 전체 배치^(28,29)를 획득하는 동안 MS 성능의 드리프트를 해결하기 위해 여러 도구 및 패키지를 사용할 수 있습니다.
데이터 변환에 의한 특성의 정상적인 분포를 보장한다, 예를 들어, GWAS를 수행하기 위해 R 패키지 MASS로부터의 boxcox() 함수를 사용하는 박스-콕스 변환(³⁰).
다변량 분석을 위해 데이터 스케일링(예: Pareto 스케일링)을 수행하여 저풍부 화합물⁽³¹)의 적절한 칭량을 보장한다.
참고: 가능하다면, 매트릭스 효과, 예를 들어, 이온 억제(¹⁴)를 피하기 위해 회수 분석을 수행한다.

10. 게놈 전체 연관 연구 (GWAS)³²

시퀀싱 데이터^33,34로부터 단일 뉴클레오티드 다형성 (SNP) 또는 구조 변이체 (SV)를 호출한다.
Tassel³⁵를 사용하여 저주파 바이어스를 피하기 위해 5 %< 마이너 대립 유전자 주파수 (MAF) 및 누락 비율 >10 %에 대한 유전자형 데이터를 필터링하십시오.
R 패키지 Ime4³⁶을 사용하여 환경 요인(무작위 효과)에서 기인하는 편향을 제거하기 위해 실험 반복을 통해 정규화된 각 피쳐에 대한 최상의 선형 비편향 예측(BLUP)을 계산합니다.
각 기능의 BLUP을 개별적으로 사용하여 R³⁷의 rMVP 패키지를 사용하여 GIS를 수행합니다.
참고: 각 대사체학 기능은 여기에서 개별 독립형 표현형으로 간주됩니다.
GWAS를 수행하는 동안 주성분 분석 (PCA) 및 주 별 정체성 (IBS) 또는 vanRaden을 사용하여 교란 효과를 최소화하는 인구 구조에 대해 정확합니다. 또한 혼합 모델에는 고정 및 무작위 효과가 포함되어 있으므로 혼합 선형 모델 (MLM) 또는 다중 유전자좌 혼합 모델 (MLMM)을 사용하는 것이 좋습니다.

11. QTL 감지

맨해튼 플롯을 고려하여 중요한 연관성을 보이는 SNP를 확인하여 근본적인 유전 영역을 결정하기위한 연결 불균형 (LD) 계산을 확인하십시오. R 패키지 LD 히트맵 또는 Tassel 5를 사용하여 LD 계산을 수행합니다.
일배체형 사이의 통계적 변화에 대한 형질 수준을 조사함으로써 형질에 걸친 효과 크기에 대한 연관된 SNPs를 확인하여, 잠재적인 인과적 SNPs, 예를 들어, 단백질 코딩 서열의 아미노산 변화를 유도하는 SNPs를 발견하고, 이는 표현형 변이를 설명할 수 있다.
참고: SNP-형질 연관성이 반드시 인과관계를 산출하는 것은 아니므로, 게놈 영역을 결정하는 것이 중요하다. 특징 주석에 의한 화합물 동일성은 특정 게놈 영역에서 적합한 후보 유전자를 찾는 데 대단히 도움이 될 수 있다. 우리는 도 4에 도시된 바와 같이, 특정 화합물과 관련된 모든 검출된 QTL을 흉막성 지도에서 결합시켜 유전 영역(³⁸)에 밑줄을 긋는 것이 제안된다. 후보 유전자의 검증을 위해, 몇몇 접근법이 수행될 수 있다(토론 참조).

Representative Results

성공적인 대사체학 GWAS 실험은 그림 1에 예시된 바와 같이 적절한 실험 설계로 시작하여 샘플 수집, 추출, 데이터 수집 및 처리로 시작해야 합니다. 이 프로토콜에서, MTBE 방법^15는 여러 화합물 클래스에 속하는 수백 개의 대사 산물을 추출하고 분석하는 데 사용되었습니다. 크로마토그래피는 용출 완충액 혼합물뿐만 아니라 활용된 컬럼의 특성에 크게 의존한다. 도 2는 QC 샘플의 크로마토그램을 보여주며, 이는 이 분석 시스템에서 일부 주요 지질 부류의 용출 패턴을 나타낸다. 각 플랫폼에 적용된 그라디언트는 표 1에 제시되어 있다. 대규모 실험에서 체계적인 오류를 처리하는 데 중점을 두었습니다. 대규모 대사체학을 수행하는 것은 본질적으로 전신 오류와 관련이 있습니다. 시연을 위해, 우리는 몇몇 일반적인 콩 종에 걸친 지질학 데이터를 분석했다. 보충 표 1은 물질의 표에 표시된 소프트웨어를 사용하여 크로마토그램 처리 후에 수득된 추출된 미가공 지질 데이터를 제공한다. 이 프로토콜을 따라 우리는 특히 큰 샘플 세트를 처리하는 동안 오믹스 데이터를 처리 할 때 주요 문제를 피할 수있었습니다. 정규화 절차는 그림 3에 나와 있는 것처럼 배치 단위 분석 오류를 정확하게 수정할 수 있습니다. QC 샘플의 수를 늘리면 정규화의 검정력이 증가하지만 비용 및 시간 제약으로 인해 항상 실현 가능한 것은 아닙니다. 비표적 대사 특징을 갖는 고처리량 대사체학 GIS의 경우, 더 많은 수의 형질-마커 연관성을 적절하게 설명하는 것이 필수적이다. 다수의 GWAS 결과를 결합한 플레오트로픽 맵(³⁸)은 몇몇 형질이 연결된 게놈 영역을 강조하는데 사용될 수 있다(도 4).

도 1: 식물에서 대사체학 기반 GIS의 흐름도. 실험 설계부터 QTL 검출까지 몇 가지 단계가 왼쪽 패널에 표시됩니다. 오른쪽 패널에는 왼쪽 패널에 언급 된 몇 가지 단계를 지원하는 여러 그림이 표시됩니다. 오른쪽 상단부터 시작하여 (1) LC-MS에 대해 제안된 샘플 시퀀스가 표시되고, (2) QC 샘플 강도를 나타내는 빨간색이 있는 대표적인 특징 분포를 포함하는 PCA의 사전 및 사후 정규화된 점수 플롯, (3) LD 및 일배체형 분포가 생성되는 유의한 연관성을 갖는 맨해튼 플롯이 표시됩니다. 약어: GWAS = 게놈 전체 연관 연구; QTL = 정량적 형질 유전자좌; PCA = 주성분 분석; QC = 품질 관리; LD = 연결 불균형; MS = 질량 분광법; LC-MS = 액체 크로마토그래피-질량 분광법; GC-MS = 가스 크로마토그래피-질량 분광법; LOESS = 국부적으로 추정된 산점도 평활화; MLM/MLMM = 혼합 선형 모델/다중 유전자좌 혼합 모델. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 2: 크로마토그램 처리. 상이한 배치로부터의 두 개의 QC 크로마토그램 (염기 피크; 지질 데이터)은 풀링된 QC 샘플에서 특정 지질 클래스에 대한 배치-방향 변이를 입증한다. 네 개의 주요 지질 부류는 사내 LC-MS 시스템에서 각각의 용출창으로 표시된다. 크로마토그램은 MzMine²¹에서 수출되었다. 약어 : QC = 품질 관리; LC-MS = 액체 크로마토그래피-질량 분광법. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 3: 체계적인 오류 수정. 획득 된 지질 데이터의 주성분 분석, 전신 오류 (왼쪽, 원시 데이터) 및 전신 오류 (오른쪽, 배치 황토)에 대한 교정 후. 아래쪽 패널은 분석 변동에 대한 샘플(n=650) 및 배치(n=10) 사전(왼쪽) 및 사후(오른쪽) 보정에 대한 피쳐(Cluster_00005) 분포를 보여 줍니다. 약어: PCA = 주성분 분석; QC = 품질 관리; LOESS = 로컬로 추정된 산점도 평활화. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 4: 결합된 GWAS 결과를 보여주는 플레오트로픽 맵. pleiotropic지도는 여러 특성과 관련된 전체 게놈의 영역을 강조합니다. 외부 고리의 숫자는 해당 염색체를 나타냅니다. 각 원은 크게 연관된 SNP와 함께 개별 특성을 나타냅니다. 색상은 서로 다른 화합물 클래스(회색 = 화합물 클래스 1, 녹색 = 화합물 클래스 2, 보라색 = 화합물 클래스 3, 노란색 = 화합물 클래스 4)를 나타냅니다. 동일한 게놈 영역과의 화합물간 클래스 연관의 경우, 유전자가 강조된다. 내부 회색 원은 특정 게놈 위치와 관련된 모든 중요한 SNP의 합을 보여줍니다. 이 그림에 표시된 연관성은 설명을 위해서만 인위적으로 생성됩니다. 약어: GWAS = 게놈 전체 연관 연구; SNPs = 단일 뉴클레오티드 다형성. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

지질에 대한 UHPLC-MS 설정
시간 [분]	용리액 A ~ B [%]*	정보
0 - 1.00	45% A	용리액 A : 1 % 1M NH₄- 아세테이트, 물 중 0.1 % 아세트산 (UHPLC 등급)
1.00 - 4.00	lg 45 % - 25 % A	용리액 B : 1 % 1M NH₄- 아세테이트, 아세토 니트릴 / 2- 프로판올 7 : 3 (UHPLC 등급) 0.1 % 아세트산
4.00 - 12.00	lg 25 % - 11 % A	유속: 400 μL/분
12.00 - 15.00	lg 11 % - 0 % A	주입량: 2 μL
15.00 - 19.50	CW 0% A
19.50-19.51	0% - 45% A
19.51-24.00	eq 45%
극성 및 반극성 대사 산물에 대한 UHPLC-MS/MS 설정
시간 [분]	용리액 A 및 B [%]*	정보
0 - 1.00	99% A	용리액 A : 물에 0.1 % 포름산 (UHPLC 등급)
1.00 - 11.00	lg 99 % -60 % A	용리액 B : 아세토 니트릴 중 0.1 % 포름산 (UHPLC 등급)
11.00 - 13.00	lg 60 % - 30 % A	유속: 400 μL/분
13.00 - 15.00	lg 30 % - 1 % A	주입량: 3 μL
15.00 - 16.00	CW 1% A
16.00 - 17.00	lg 1 % - 99 % A
17.00 - 20.00	eq 99 % A
유도체화된 대사산물에 대한 GC-MS 설정
시간 [분]	온도 [°C]	정보
0 - 2.00	85	캐리어 가스: 헬륨
2.00 - 18.66	lg 80 - 330	유속: 2 mL/분
18.66 - 24.66	cw 330	온도 구배: 15 °C/분
24.66	급속 냉각	주입량: 1 μL

표 1: 각 분석 플랫폼에 대한 그라디언트 설정⁷. 약어: lg = 선형 그라디언트; cw = 컬럼 세척; eq = 평형화; UHPLC-MS = 초고성능 액체 크로마토그래피-질량 분광법; UHPLC-MS/MS = 초고성능 액체 크로마토그래피-탠덤 질량 분광법; GC-MS = 가스 크로마토그래피 - 질량 분광법. * = 백분율 값은 용리액 A에 해당하고; 나머지 백분율 값은 용리액 B에 해당합니다.

보충 표 1: 원시 지질학 데이터. 각 샘플에 걸쳐 검출된 각 클러스터에 대한 피크 강도를 나타냅니다. 이 테이블을 다운로드하려면 여기를 클릭하십시오.

Discussion

GC-MS와 LC-MS는 모두 다양한 대사 산물 클래스의 복잡한 혼합물을 프로파일 링하는 데 널리 사용되는 도구입니다. 이러한 도구로 대규모 데이터 세트를 처리하는 것은 본질적으로 비 생물학적 변이, 예를 들어 결과의 해석을 방해하고 편향시키는 분석 변형과 관련이 있습니다. 이 프로토콜은 비생물학적 기원의 변이를 제거하고 대규모 "omics"연구를 수행하기 위해 포괄적 인 대사 프로파일 링을위한 강력하고 높은 처리량의 추출 파이프 라인을 제공합니다. 이 프로토콜에 사용 된 부피 및 농도는 다른 조직의 콩과 식물 종에 대해 조정되었습니다. 그러나, 이들 파라미터는 약간 변형될 수 있고 다른 식물 종으로부터의 대규모 대사 샘플에도 사용될 수 있다.

앞서 기술^{한 15개의} MTBE-기반 추출은 유도체화된 대사산물, 반극성 대사산물 및 지질을 분석하는데 사용될 수 있다. 이것은 단백질 및 식물 호르몬 추출(³⁹)을 위해 확장될 수 있으며, 이는 이 프로토콜의 범위를 벗어났다. 다른 추출 프로토콜은 디클로로메탄:에탄올 혼합물^40,41에 의존한다. 이러한 추출 프로토콜 중 MTBE:메탄올 추출 프로토콜은 기존의 클로로포름 기반 추출 프로토콜⁽⁴²)에 유리하고 덜 위험한 대안을 제공하며, 극성과 지질 단계 사이의 상으로 단백질 펠릿을 생성하지 않는다. 더욱이, MTBE 방법은 이미 다양한 생물학적 샘플(^43,44,45)에 대한 몇몇 연구에서 사용되어 왔다.

이 프로토콜은 많은 수의 샘플들을 처리하면서 잠재적 변동으로 이어질 수 있는 몇 가지 중요한 단계들, 예를 들어, 수확(^12,13), 추출(14) 및 랜덤화(⁴⁶) 동안에 논의한다. 더욱이, 고품질의 대사체 데이터, 예를 들어, 매트릭스 효과 및 이온 억제(¹⁴)를 보장하기 위해 고려되어야 하는 이 프로토콜에서 논의되지 않은 추가적인 문제들이 있다.

QC 기반 정규화 방법의 힘은 본질적으로 각 배치의 QC 샘플 수에 따라 달라집니다. 앞서 언급한 바와 같이, 수를 늘리면 검정력이 증가하겠지만, QC의 배치내 변동은 그림 3에 예시된 바와 같이 이들 분석 시스템의 배치 간 변동에 비해 상대적으로 미미하다. 전반적으로, 무작위 포리스트(SERRF)를 사용한 전신 오류 제거와 같은 다른 QC 기반 정규화 방법이 있는데, 이는 배치 단위 비율, 다중 내부 표준(NOMIS)의 최적 선택을 이용한 정규화, 확률적 지수 정규화(PQN)⁴⁷와 같은 다른 정규화 방법의 대부분을 능가하는 것으로 나타났습니다. . 그러나 SERRF는 각 배치의 여러 QC 샘플, 예를 들어 열 번째 샘플마다 의존하며, 이는 많은 수의 샘플을 처리하는 동안 실현 가능하지 않습니다. 다른 데이터 기반 또는 내부 표준 기반 방법에 비해 QC 기반 정규화의 주요 이점은 원치 않는 기술적 변동⁽²⁸)을 수용하면서 필수적인 생물학적 변이를 유지한다는 것이다. 독자는 변동²⁸의 처리에 관한 이 검토를 참조할 수 있다.

GIS의 주요 쟁점 중 하나는 오탐의 비율이며, 이는 주로 인과 관계 및 비 인과 관계 사이트^48,49의 연관성으로 인해 발생합니다. 둘째, 보수적 통계적 보정 접근법, 예를 들어, Bonferroni 및 FDR은, 독립적인 시험의 수에 대해 정확하며, 이는 근접한 SNPs(^50,51) 사이의 연계로 인해 GIS에서 분석된 SNP의 수와 동일하지 않기 때문에^, 실제 독립적인 시험의 수는 종종 더 낮다. 보존적 통계적 역치를 감소시키는 또 다른 방법은 정의된 게놈 영역⁽⁵²)에 대한 결합 붕괴에 기초하여 GIS에 사용되는 시험된 SNP의 수를 감소시키는 것이다. 이 프로토콜에 설명된 GWAS-통합 고처리량 대사체학 플랫폼은 광범위한 응용 분야를 가지고 있습니다. 특히, 대사 산물 / 지질 조성을 산업적으로나 영양적으로 원하는 수준으로 변경함으로써 작물 육종의 개선을 촉진 할 것입니다. 전반적으로, 대사체학은 지난 수십 년 동안 작물 가축화 과정에서 발생한 과다한 대사 산물의 유전 구조와 대사 다양화에 대한 심층적 인 통찰력을 제공하여 대사체학 관련 육종⁵³의 광대 한 잠재력을 나타냅니다. 하류 QTL 검증을 위한 분자생물학적 접근법은 CRISPR/Cas9 돌연변이 라인(54), T-DNA 삽입 라인(55), 안정 및/또는 일시적 과발현 라인(56), VIGS, 생체외 대사체학 접근법⁽⁵⁷)의 생성뿐만 아니라 상이한 집단에서의 교차 검증뿐만 아니라 교차 F2 집단을 생성하는 종래의 접근법 옆에 포함된다.

상기와 같은 분석 변이에 대해 필요한 보정을 수행함으로써, 대사산물-대사산물, 대사산물-지질 상관관계 분석, 보다 복잡한 형질을 밝히기 위한 현상 데이터에 대한 상관관계 분석, 및/또는 생물학적 시스템⁽⁵⁸)의 기초를 더욱 풀기 위한 공동발현 분석과 같은 GIS 이외에 몇 가지 통합된 접근법이 수행될 수 있다.

Disclosures

저자는 선언 할 이해 상충이 없습니다.

Acknowledgments

M.B.는 IMPRS-PMPG '일차 대사 및 식물 성장'에 의해 지원됩니다. A.R.F.와 S.A.는 EU Horizon 2020 연구 및 혁신 프로그램, 프로젝트 PlantaSYST (SGA-CSA No. 739582 under FPA No. 664620) 및 Project INCREASE (GA 862862)의 재정적 지원을 인정합니다.

Materials

Name	Company	Catalog Number	Comments
Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC)	Avanti Polar Lipids	850360P	Internal standard for lipids
Chloroform	Supleco	67-66-3	FAME solvent
Isovitexin	Sigma Aldrich	38953-85-4	Internal standard for metabolites
Lignoceric Acid Methylester	Sigma Aldrich	2442-49-1	FAME
Methanol (MeOH)	Biosolve Chemicals	13684102	ULC-MS grade
Methoxyamin -hydrochlorid	Sigma Aldrich	593-56-6	Metabolite deriviatization
Methyl laurate	Sigma Aldrich	111-82-0	FAME
Methyl myristate	Sigma Aldrich	124-10-7	FAME
Methyl palmitate	Sigma Aldrich	112-39-0	FAME
Methyl stearate	Sigma Aldrich	112-61-8	FAME
Methyl tert-butyl ether (MTBE)	Biosolve Chemicals	13890602	HPLC grade
Methyl-caprat	Sigma Aldrich	110-42-9	FAME
Methylcaprylat	Sigma Aldrich	111-11-5	FAME
Methyldocosanoat	Sigma Aldrich	929-77-1	FAME
Methyleicosanoat	Sigma Aldrich	1120-28-1	FAME
Methyl-hexacosanoat	Sigma Aldrich	5802-82-4	FAME
Methyl-octacosanoat	Sigma Aldrich	55682-92-3	FAME
Methyl-pelargonate	Sigma Aldrich	1731-84-6	FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA)	Macherey-Nagel	24589-78-4	Metabolite deriviatization
Pyridine	Supleco	110-86-1	Metabolite deriviatization
Ribitol	Supleco	22566-17-2	Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester	TCI Chemicals	629-83-4	FAME
Water	Biosolve Chemicals	23214102	ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes	Eppendorf	3120086
2 mL Safe-lock microcentrifuge tubes	Eppendorf	3120094
Balance	Sartorius Corporation	14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm	Aglient	123-3832	Analysis of derivatized metabolites
GC-MS system	Leco Pegasus HT TOF-MS (LECO Corporation)		Analysis of derivatized metabolites
Grinding Balls, Stainless Steel	OPS DIAGNOSTICS	GBSS 196-2500-10
MS system	Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific)		Analysis of lipids
MS system	Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific)		Analysis of metabolites
Refrigerated microcentrifuge	Eppendorf, model 5427R	22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles)	Waters	186002878	Analysis of lipids
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles)	Waters	186003539	Analysis of metabolites
Shaker	Eppendorf Thermomixer 5436	2050-100-05
Sonicator	USC 300 TH	142-0084
Tissue grinding mixer mill	Retsch, Mixer Mill MM 300	20.746.0001
UPLC system	Waters Acquity UPLC system (Waters)
Vacuum concentrator	Scan Speed Maxi Vac Alpha Evaporators	7.008.500.002
Vortex mixer	Vortex-Genie 2, Model G560	SI-0236
Software
MetAlign			Chromatogram processing
MzMine			Chromatogram processing
R package "data.table"
R package "fujiplot"			pleiotrpoic map
R package "genetics"
R package "Ime4"			BLUPs calculation
R package "LDheatmap"			LD plots
R package "MASS"			transformation
R package "rMVP"			GWAS
R version 4.0.4
RefinerMS			Chromatogram processing
RefinerMS Genedata	Expressionist		Chromatogram processing
Tassel 5			Genotype filtering
Xcalibur	Thermo Fisher Scientific	OPTON-30965	Chromatogram processing