Summary

미르머신: 식물 miRNA 주석을 위한 원스톱 상점

Published: May 01, 2021
doi:

Summary

여기에서는 1) 알려진 miRNA와 새로운 miRNA를 보다 정확하게 식별할 수 있고 2) 완전히 자동화되어 자유롭게 사용할 수 있는 새롭고 완전히 자동화된 miRNA 파이프라인인 mirMachine을 제시합니다. 이제 사용자는 간단한 제출 스크립트를 실행하여 완전히 자동화된 mirMachine 파이프라인을 실행할 수 있습니다.

Abstract

다양한 유형의 비암호화 RNA 중에서 마이크로RNA(miRNA)는 틀림없이 지난 10년 동안 주목을 받아 왔습니다. 유전자 발현의 전사 후 조절자로서 miRNA는 가뭄 및 질병과 같은 생물학적 스트레스에 대한 발달 및 반응을 포함하여 다양한 세포 경로에서 중요한 역할을 합니다. 고품질 참조 게놈 서열을 보유하면 miRNA 서열이 고도로 보존되는 여러 식물 종에서 miRNA를 식별하고 주석을 달 수 있습니다. 전산 miRNA 식별 및 주석 프로세스는 대부분 오류가 발생하기 쉬운 프로세스이므로 상동성 기반 예측은 예측 정확도를 높입니다. 우리는 지난 10년 동안 miRNA 주석 파이프라인인 SUmir를 개발하고 개선했으며, 그 이후로 여러 식물 게놈에 사용되었습니다.

본 연구는 (i) 2차 구조 예측에 대한 추가 필터링 단계를 추가하고, (ii) 완전 자동화하고, (iii) 이전 파이프라인을 사용하여 작은 RNA 시퀀싱 판독을 기반으로 하는 상동성 또는 새로운 miRNA를 기반으로 알려진 miRNA를 예측하는 새로운 옵션을 도입함으로써 완전 자동화된 새로운 miRNA 파이프라인인 mirMachine (miRNA Machine)을 제시합니다. 새로운 miRNA 파이프라인인 mirMachine은 애기장대 정보 리소스, TAIR10, 애기장대 게놈 방출 및 국제 밀 게놈 시퀀싱 컨소시엄(IWGSC) 밀 참조 게놈 v2를 사용하여 테스트되었습니다.

Introduction

차세대 염기서열분석 기술의 발전으로 RNA 구조와 조절 요소에 대한 이해가 넓어졌으며 기능적으로 중요한 비코딩 RNA(ncRNA)가 밝혀졌습니다. 다양한 유형의 ncRNA 중에서 마이크로 RNA (miRNA)는 식물 1,2에서 길이가 19에서 24 뉴클레오티드 사이 인 작은 RNA의 기본 조절 클래스를 구성합니다. 선충류에서 최초의 miRNA가 발견 된 이후 Caenorhabditis elegans3, miRNA의 존재와 기능은 동물 및 식물 게놈에서도 광범위하게 연구되었습니다 4,5,6. miRNA는 절단 또는 번역 억제를 위해 mRNA를 표적으로 하여 기능합니다7. 축적된 증거는 또한 miRNA가 성장 및 발달8, 자가 생물 발생9 및 여러 생물학적 및 비생물적 스트레스 반응10을 포함하여 식물의 광범위한 생물학적 과정에 관여한다는 것을 보여주었습니다.

식물에서 miRNA는 처음에 pri-miRNA11이라고 하는 긴 1차 전사체에서 처리됩니다. 핵 내부의 RNA 중합효소 II에 의해 생성된 이들 pri-miRNA는 불완전한 폴드백 구조(12)를 형성하는 긴 전사체이다. pri-miRNA는 나중에 pre-miRNA11이라고 하는 miRNA의 내인성 단일 가닥(ss) 헤어핀 전구체를 생성하기 위해 절단 과정을 거칩니다. pre-miRNA는 단일 가닥이 이중 가닥 구조로 접혀 miRNA 듀플렉스(miRNA/miRNA*)13를 절제하는 헤어핀 유사 구조를 형성합니다. 다이서 유사 단백질은 miRNA/miRNA* 듀플렉스의 두 가닥을 절단하여 2-뉴클레오티드 3′-오버행14,15를 남깁니다. miRNA 듀플렉스는 핵 내부에서 메틸화되어 miRNA의 3′-말단을 분해 및 우리딜화 활성으로부터 보호합니다16,17. 헬리카제는 수출 후 메틸화된 miRNA 이중체를 풀고 성숙한 miRNA를 세포질18의 RNA 유도 침묵 복합체(RISC)에 노출시킵니다. 듀플렉스의 한 가닥은 RISC에 통합된 성숙한 miRNA인 반면 다른 가닥인 miRNA*는 분해됩니다. miRNA-RISC 복합체는 표적 서열에 결합하여 완전 상보성의 경우 mRNA 분해 또는 부분 상보성의 경우 번역 억제를 유도한다13.

발현 및 생물발생 특징에 기초하여, miRNA 주석에 대한 가이드라인이15,19에 기재되었다. 정의된 가이드라인에 따라 Lucas와 Budak은 식물9에서 상동성 기반 인실리코 miRNA 식별을 수행하기 위해 SUmir 파이프라인을 개발했습니다. SUmir 파이프라인은 SUmirFind 및 SUmirFold라는 두 개의 스크립트로 구성되었습니다. SUmirFind는 2개 이하의 불일치가 있는 히트를 포함하고 더 짧은 히트(blastn-short-unapped -penalty -1 -reward 1)에 대한 편향을 피하기 위해 수정된 매개변수를 사용하여 NCBI(National Center for Biotechnology Information) 기본 로컬 정렬 검색 도구(BLAST) 스크리닝을 통해 알려진 miRNA 데이터 세트에 대해 유사성 검색을 수행합니다. SUmirFold는 UNAfold21을 사용하여 BLAST20 결과로부터 추정되는 miRNA 서열의 2차 구조를 평가합니다. SUmirFold는 헤어핀 구조의 특성을 식별하여 miRNA를 작은 간섭 RNA와 구별합니다. 또한, 매개 변수, 최소 배 에너지 지수 > 0.67 및 GC 함량 24-71 %에 의해 miRNA를 tRNA 및 rRNA와 같은 다른 ssRNA와 구별합니다. 이 파이프라인은 (i) 민감도 증가, (ii) 주석 정확도 증가, 및 (iii) 예측된 miRNA 유전자(22)의 게놈 분포를 제공하기 위한 2개의 추가 단계를 추가함으로써 최근에 업데이트되었다. 식물 miRNA 서열23의 높은 보존성을 감안할 때, 이 파이프라인은 원래 상동성 기반 miRNA 예측을 위해 설계되었습니다. 그러나 새로운 miRNA는 밀접하게 관련된 종 간의 miRNA의 서열 보존에 크게 의존했기 때문에 이 생물정보학 분석으로 정확하게 식별할 수 없었습니다.

이 논문은 1) 알려진 miRNA와 새로운 miRNA를 보다 정확하게 식별할 수 있고(예를 들어, 파이프라인은 이제 sRNA-seq 기반 새로운 miRNA 예측 및 상동성 기반 miRNA 식별을 사용함) 2) 완전히 자동화되고 자유롭게 사용할 수 있는 새롭고 완전히 자동화된 miRNA 파이프라인인 mirMachine을 제시합니다. 출력에는 예측된 miRNA의 게놈 분포도 포함되었습니다. mirMachine은 밀 및 애기장대 게놈에서 상동성 기반 및 sRNA-seq 기반 예측 모두에 대해 테스트되었습니다. 처음에는 자유 소프트웨어로 출시되었지만 UNAfold는 지난 10년 동안 상용 소프트웨어가 되었습니다. 이 업그레이드를 통해 2차 구조 예측 도구가 UNAfold에서 RNAfold로 전환되어 mirMachine을 자유롭게 사용할 수 있습니다. 이제 사용자는 간단한 제출 스크립트를 실행하여 완전히 자동화된 mirMachine 파이프라인을 실행할 수 있습니다(예제는 https://github.com/hbusra/mirMachine.git 에서 제공됨).

Protocol

1. 소프트웨어 종속성 및 설치 홈 사이트에서 또는 conda를 사용하여 소프트웨어 종속성을 설치합니다.Perl이 아직 설치되지 않은 경우 홈 사이트(https://www.perl.org/get.html)에서 다운로드하여 설치합니다.참고: 표시된 결과는 Perl v5.32.0을 사용하여 예측되었습니다. 정렬 프로그램인 Blast+를 홈 사이트(https://www.ncbi.nlm.nih.gov/books/NBK279671/)에서 실행 파일 및 소스 코드로 다운로드합?…

Representative Results

상술한 miRNA 파이프라인인 mirMachine을 파이프라인의 성능을 빠르게 평가하기 위한 테스트 데이터에 적용하였다. miRBase v22.1에 침착된 신뢰도가 높은 식물 miRNA만이 IWGSC 밀 RefSeq 게놈 v224의 염색체 5A에 대해 스크리닝되었습니다. mirMachine_find 최대 1개의 불일치가 허용되는 189개의 고신뢰도 miRNA의 비중복 목록에 대해 312개의 히트를 반환했습니다(표 1). mirMachine_fold 2차 구…

Discussion

당사의 miRNA 파이프라인인 SUmir는 지난 10년 동안 많은 식물 miRNA의 식별에 사용되었습니다. 여기에서 우리는 완전히 자동화되고 자유롭게 사용할 수 있는 새로운 miRNA 식별 및 주석 파이프라인인 mirMachine을 개발했습니다. 더욱이, 이전 파이프라인을 포함하되 이에 제한되지 않는 다수의 miRNA 식별 파이프라인은 UNAfold 소프트웨어(21)에 의존했는데, 이는 한때 자유롭게 이용가능했음…

Materials

https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Riferimenti

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).
check_url/it/62430?article_type=t

Play Video

Citazione di questo articolo
Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

View Video