Summary

اكتشاف رواية تسلسل الجينوم مطروح

Published: January 25, 2019
doi:

Summary

والغرض من هذا البروتوكول هو استخدام مزيج من الحسابية ومقاعد البدلاء للبحث للبحث عن تسلسل الرواية التي لا يمكن فصلها بسهولة عن تسلسل تنقية المشترك، الذي قد يكون معروفا إلا جزئيا.

Abstract

يمكن استخدام علم الجينوم مطروح في أي بحث حيث كان الهدف هو تحديد التسلسل الجيني أو البروتين، أو المنطقة العامة المضمنة في سياق أوسع المجين. علم الجينوم الاختزالي تمكن باحث لعزل تسلسل هدف من الفائدة (T) بترتيب شامل وطرح العناصر الوراثية المعروفة (مرجع, R). يمكن استخدام الأسلوب لتحديد تسلسل الرواية مثل الميتوكوندريا، والمعايشة، والفيروسات، أو germline مقيد الكروموسومات، وهي مفيدة بشكل خاص عندما تي لا يمكن أن تكون معزولة بسهولة من ر. تبدأ مع بيانات الجينوم شاملة (R + T)، الأسلوب يستخدم الأساسية المحلية المحاذاة البحث أداة (الانفجار) ضد سلسلة مرجع، أو تسلسل، لإزالة تسلسل المعروفة المطابقة (R)، تاركة وراءها الهدف (T). للطرح تعمل بشكل أفضل، ينبغي أن يكون البحث والتطوير مشروع مكتمل نسبيا يفتقد ت. منذ متواليات المتبقية بعد الطرح يتم اختبارها من خلال الكمية “تفاعل البوليميراز المتسلسل” (qPCR)، لا يلزم R تكون كاملة لأسلوب العمل. هنا نربط الخطوات الحسابية مع خطوات تجريبية في دوامة الذي يمكن تكراره حسب الحاجة، إزالة متعددة مرجع تسلسل تسلسلياً وصقل البحث عن ت. الاستفادة من علم الجينوم الاختزالي هو أنه يمكن تحديد تسلسل رواية تماما هدف حتى في الحالات التي يتم تنقية المادية صعبة أو مستحيلة أو باهظة الثمن. عيب الأسلوب هو إيجاد مرجع مناسب للطرح والحصول على T-إيجابية وسلبية عينات لاختبار قبكر. يصف لنا تنفيذنا للأسلوب في تحديد الجينات الأولى من كروموسوم مقيدة بالفعل من زيبرا فينش. في هذه الحالة تصفية حسابية تشترك ثلاث إشارات (R)، إزالة تسلسلياً على مدى ثلاث دورات: الجمعية الجينوم ناقصة وبيانات الجينوم الخام والبيانات ترانسكريبتوميك.

Introduction

والغرض من هذا الأسلوب تحديد هدف رواية (T) الجينوم تسلسل، أما من الحمض النووي الريبي، أو من سياق الجينوم، أو إشارة (R) (الشكل 1). الأسلوب مفيد جداً إذا كان الهدف لا يمكن فصلها ماديا، أو أنها ستكون مكلفة القيام بذلك. فقط بعض الكائنات الانتهاء تماما مورثات للطرح، حيث أحد الابتكارات رئيسية لدينا أسلوب هو مزيج من الحسابية وأساليب مقاعد البدلاء في دورة تمكن الباحثين لعزل تسلسل الهدف عند الإشارة لا تخلو من العيوب، أو مشروع الجينوم من كائن غير نموذجية. في نهاية دورة، يستخدم qPCR اختبار لتحديد ما إذا كانت هناك حاجة إلى الطرح أكثر. سوف تظهر تسلسل المرشحين المصادق عليها تي كشف أكبر إحصائيا في عينات تي-الإيجابية المعروفة ب qPCR.

نفذت التجسيد للأسلوب في اكتشاف المخدرات البكتيرية الأهداف الجديدة التي لم تقم المضيف هومولوجس1،2،،من34 وتحديد الفيروسات رواية من المضيفين المصابة 5،6. بالإضافة إلى تحديد تي، يمكن تحسين الأسلوب r: استخدمنا الأسلوب مؤخرا لتحديد الجينات المفقودة 936 من الجينوم مرجع زيبرا فينش ومورثة جديدة من كروموسوم germline فقط (T)7. علم الجينوم الاختزالي قيمة خاصة عند تي يرجح أن تكون متباينة جداً من تسلسل المعروفة، أو عند هوية تي غير معروف على نطاق واسع، كما هو الحال في كروموسوم مقيدة بالفعل زيبرا فينش7.

التي لا تتطلب تحديد إيجابية من T مسبقاً، مزايا رئيسية للجينوم الاختزالي أنه غير متحيز. في دراسة أجريت مؤخرا، ريدهيد et al. دراسة العلاقة بين مرض الزهايمر ووفرة الفيروسية في أربع مناطق الدماغ. لتحديد الفيروسية، ريادهياد et al. بإنشاء قاعدة بيانات للفيروسات 5158، الحد من شدة عوامل فيروسية يمكن أن تحدد هذه الدراسة. الجينوميات الاختزالي يمكن قد استخدمت للمقارنة بين الأصحاء والجينوم الزهايمر بغية عزل الفيروسات رواية المحتملة المرتبطة بهذا المرض، بغض النظر عن التشابه مع العوامل المعدية المعروفة. بينما هناك 263 الفيروسات المعروفة تستهدف الإنسان، يقدر وجود حوالي 1.67 مليون من الأنواع الفيروسية غير المكتشفة، مع 631,000-827,000 منها يمكن أن تصيب البشر9.

عزل فيروسات جديدة منطقة فيها الاختزالي الجينوميات فعالة بشكل خاص، ولكن بعض الدراسات قد لا تحتاج إلى مثل هذا أسلوب صارمة. على سبيل المثال، دراسات استخدمت الفيروسات رواية تحديد التسلسل الفائق غير متحيزة تليها النسخ العكسي وبلاست لتسلسلات فيروسية5 أو إثراء للأحماض النووية الفيروسية لاستخراج وعكس نسخ تسلسلات فيروسية 6. في حين استخدمت هذه الدراسات تسلسل حيثياته والجمعية، الطرح لم يستخدم لأن تسلسل المستهدفة التي حددت إيجابيا من خلال الانفجار. إذا كانت الفيروسات تماما الرواية ولا يتصل (أو ذات الصلة بعيد) للفيروسات الأخرى، كان علم الجينوم الاختزالي تقنية مفيدة. الاستفادة من علم الجينوم الاختزالي هو أنه يمكن الحصول على تسلسلات جديدة تماما. إذا كان يعرف الجينوم للكائن، يمكن طرح خارجاً بمغادرة أي تسلسلات فيروسية. على سبيل المثال، في دراستنا المنشورة نحن عزل تسلسل فيروسية رواية من زيبرا فينش من خلال الجينوم الاختزالي، على الرغم من أنه ليس لدينا النية الأصلية7.

علم الجينوم الاختزالي أثبت أيضا مفيدة في تحديد أهداف اللقاحات البكتيرية، ودافع عن الارتفاع الكبير في مقاومة المضادات الحيوية1،2،،من34. للتقليل من مخاطر رد فعل المناعة الذاتية، ضاقت الباحثين أهداف اللقاح المحتملة عن طريق طرح أي البروتينات التي قد هومولوجس في المضيف البشري. دراسة خاصة واحدة، تبحث في pseudotuberculosis وتدية، يتم الطرح لجينوم مضيف الفقارية من عدة مورثات بكتيرية التأكد من أن الأهداف المحتملة المخدرات لن يؤثر على البروتينات في المضيفين مما يؤدي إلى آثار جانبية 1-تدفق العمل الأساسي لهذه الدراسات هو لتحميل البروتين البكتيري، تحديد البروتينات الحيوية، إزالة البروتينات الزائدة عن الحاجة، واستخدام بلاستب لعزل البروتينات الأساسية، وبلاستب ضد البروتين المضيف لإزالة أي البروتينات مع المضيف هومولوجس 1 , 2 , 3 , 4-وفي هذه الحالة، علم الجينوم الاختزالي ضمان أن اللقاحات البلدان المتقدمة النمو لن يكون أي آثار خارج الهدف في المضيف1،2،،من34.

استخدمنا الجينوم الاختزالي لتحديد الجينات ترميز البروتين الأولى في تقييد germline كروموسوم (GRC) (في هذه الحالة، تي)، الذي تم العثور عليه في جيرملينيس ولكن الأنسجة الجسدية لا من كلا الجنسين10. قبل هذه الدراسة، كانت المعلومات الجينومية فقط أنه كان يعرف عن GRC منطقة متكررة11. وأجرى الجمعية حيثياته في الجيش الملكي النيبالي متسلسلة من أنسجة المبيض ورؤوس (R + T) من الكبار زيبرا العصافير. أجرى القضاء متواليات حسابية باستخدام المنشورة جسدية (العضلات) الجينوم تسلسل (R1)12، الخام (سانجر) قراءة البيانات (ص2) و جسدية (الدماغ) الترنسكربيتوم (ص3)13. استخدام ثلاث إشارات متتابعة كان يقودها qPCR اختبار في الخطوة 5 لكل دورة (الشكل 2ألف)، تبين أن هناك حاجة إلى تصفية إضافية. وأكد الجين α-الأدوات المكتشفة من خلال قبكر من الحمض النووي والجيش الملكي النيبالي، والاستنساخ وتسلسلها. علينا أن نبدي في مثالنا أن هذا الأسلوب مرنة: أنها لا تعتمد على مطابقة الأحماض النووية (مقابل الحمض النووي الريبي)، ويمكن أن يؤديها هذا الطرح مع المراجع (R) التي تتألف من جمعيات أو يقرأ الخام.

Protocol

1- نوفو دي “تسلسل بدء تجميع” ملاحظة: أي بيانات الجيل التالي تسلسل (خ ع) يمكن استخدامها، ما دام يمكن أن تنتج جمعية من تلك البيانات. تتضمن بيانات الإدخال المناسبة إيلومينا، باكبيو، أو “نانوبوري أكسفورد” يقرأ مجمعة في ملف فاستا. لواقعية، يصف هذا القسم جمعية على أساس إيلومينا ت?…

Representative Results

وسيكون ملف الإخراج بعد تشغيل الانفجار، قائمة بتسلسل من الاستعلام التي تتطابق مع قاعدة البيانات. بعد الطرح بيثون، عددا من المنظومات تسلسل سيتم الحصول عليها، واختبارها من قبل قبكر. وتناقش النتائج هذه، والخطوات المقبلة، أدناه. سلبية ا?…

Discussion

حين علم الجينوم الاختزالي قوية، ليس نهجاً قطع كعكة، التي تتطلب التخصيص في العديد من الخطوات الرئيسية، والاختيار الدقيق لتسلسل المرجعية وعينات الاختبار. تصفية الخطوات إذا كانت الجمعية العامة الاستعلام من نوعية رديئة، قد عزل التحف الجمعية فقط. ولذلك، من المهم أن دقة التحقق من الجمعية حي…

Declarações

The authors have nothing to disclose.

Acknowledgements

المؤلفين تقر بيديرمان ميشيل، بيدرسن أليسا وسالدانها جيه كولين لمساعدتها في مشروع الجينوم زيبرا فينش في مراحل مختلفة. ونعترف أيضا بيسك يفغيني للحوسبة العنقودية نظام الإدارة والمعاهد الوطنية للصحة منحة 1K22CA184297 (على J.R.B.) والمعاهد الوطنية للصحة 042767 NS (إلى C.J.S).

Materials

Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

Referências

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer’s Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics’ GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).
check_url/pt/58877?article_type=t

Play Video

Citar este artigo
Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

View Video