Biology

CorrelationCalculator and Filigree: أدوات لتحليل الشبكة القائمة على البيانات لبيانات الأيض

Published: November 10, 2023 doi: 10.3791/65512

Gayatri Iyer¹, Marci Brandenburg^1,2, Christopher Patsalis¹, George Michailidis³, Alla Karnovsky¹

¹Department of Computational Medicine and Bioinformatics, University of Michigan, Ann Arbor, ²Taubman Health Sciences Library, University of Michigan, Ann Arbor, ³Department of Statistics, University of Florida

Summary

نقدم CorrelationCalculator و Filigree ، وهما أداتان لبناء شبكة تعتمد على البيانات وتحليل بيانات الأيض. يدعم CorrelationCalculator بناء شبكة تفاعل واحدة من المستقلبات بناء على بيانات التعبير ، بينما يسمح Filigree ببناء شبكة تفاضلية ، تليها تجميع الشبكة وتحليل الإثراء.

Abstract

يتمثل أحد التحديات الكبيرة في تحليل بيانات omics في استخراج المعرفة البيولوجية القابلة للتنفيذ. الأيض ليست استثناء. تتفاقم المشكلة العامة المتمثلة في ربط التغيرات في مستويات المستقلبات الفردية بعمليات بيولوجية محددة بسبب العدد الكبير من المستقلبات غير المعروفة الموجودة في دراسات قياس الطيف الكتلي للكروماتوغرافيا السائلة غير المستهدفة (LC-MS). علاوة على ذلك ، يتم تمثيل التمثيل الغذائي الثانوي واستقلاب الدهون بشكل ضعيف في قواعد بيانات المسار الحالية. للتغلب على هذه القيود ، طورت مجموعتنا العديد من الأدوات لبناء وتحليل الشبكة القائمة على البيانات. وتشمل هذه حاسبة الارتباط و Filigree. تسمح كلتا الأداتين للمستخدمين ببناء شبكات قائمة على الارتباط الجزئي من بيانات الأيض التجريبية عندما يتجاوز عدد المستقلبات عدد العينات. يدعم CorrelationCalculator بناء شبكة واحدة ، بينما يسمح Filigree ببناء شبكة تفاضلية باستخدام البيانات من مجموعتين من العينات ، يليها تجميع الشبكة وتحليل الإثراء. سنصف فائدة وتطبيق كلتا الأداتين لتحليل بيانات الأيض الواقعية.

Introduction

في العقد الماضي ، برز الأيض كعلم أوميكس بسبب التقدم في التقنيات التحليلية مثل كروماتوغرافيا الغاز - قياس الطيف الكتلي (GC-MS) وكروماتوغرافيا السائل - قياس الطيف الكتلي (LC-MS). تسمح هذه التقنيات بالقياس المتزامن لمئات إلى آلاف مستقلبات الجزيئات الصغيرة ، مما يؤدي إلى إنشاء مجموعات بيانات معقدة متعددة الأبعاد. يمكن إجراء تجارب الأيض في أوضاع مستهدفة أو غير مستهدفة. تقيس تجارب الأيض المستهدفة فئات معينة من الأيضات. وعادة ما تكون مدفوعة بالفرضيات، في حين أن النهج غير المستهدفة تحاول قياس أكبر عدد ممكن من المستقلبات وتولد الفرضيات بطبيعتها. عادة ما تتضمن المقايسات المستهدفة معايير داخلية وبالتالي تسمح بالتحديد الكمي المطلق للمستقلبات ذات الأهمية. في المقابل ، تسمح المقايسات غير المستهدفة بالقياس الكمي النسبي وتشمل العديد من المستقلبات غير المعروفة¹.

تحليل بيانات الأيض هو عملية متعددة الخطوات تستفيد من العديد من أدوات البرامج المتخصصة¹. يمكن تقسيمها إلى الخطوات الرئيسية الثلاث التالية: (1) معالجة البيانات ومراقبة الجودة ، (2) التحليل الإحصائي ، و (3) تفسير البيانات البيولوجية. تم تصميم الأدوات الموضحة هنا لتمكين الخطوة الأخيرة من التحليل.

تتمثل إحدى الطرق البديهية والشائعة لتفسير بيانات الأيض في تعيين القياسات التجريبية على المسارات الأيضية. تم تصميم العديد من الأدوات لتحقيق ذلك²،³^،⁴،⁵ ، بما في ذلك Metscape ^، التي طورتها مجموعتنا⁶. غالبا ما يتم الجمع بين رسم خرائط المسار وتحليل الإثراء ، مما يساعد على تحديد أهم المسارات ^7,8. اكتسبت هذه التقنيات أهمية لأول مرة في تحليل بيانات التعبير الجيني وتم تطبيقها بنجاح لتحليل بيانات البروتينات وعلم ما فوق الجينوم⁹،¹⁰،^11،12^،¹³. ومع ذلك ، فإن تحليل بيانات الأيض يمثل عددا من التحديات للنهج القائمة على المعرفة. أولا ، بالإضافة إلى المستقلبات الداخلية ، تقيس مقايسات الأيض المركبات الخارجية ، بما في ذلك تلك التي تأتي من التغذية والمصادر البيئية الأخرى. لا يمكن تعيين هذه المركبات ، وكذلك المستقلبات التي تنتجها البكتيريا ، على المسارات البشرية أو الأيضية للكائنات حقيقية النواة الأخرى. علاوة على ذلك ، لا تسمح تغطية المسار لعملية التمثيل الغذائي الثانوي واستقلاب الدهون حاليا برسم خرائط عالية الدقة على المستوى الذي من شأنه أن يدعم بسهولة التفسير البيولوجي للبيانات^14,15.

يمكن أن تساعد تقنيات تحليل الشبكة القائمة على البيانات في التغلب على هذه التحديات. على سبيل المثال ، يمكن أن تساعد الشبكات القائمة على الارتباط في اشتقاق العلاقات بين كل من المستقلبات المعروفة وغير المعروفة وتسهيل شرح المجهول¹⁶. في حين أن حساب معاملات ارتباط بيرسون هو النهج الأكثر مباشرة لإنشاء العلاقات الخطية بين المستقلبات ، فإن العيب هو أنه يلتقط كل من الارتباطات المباشرة وغير المباشرة¹⁷،¹⁸^،¹⁹. البديل هو حساب معاملات الارتباط الجزئي التي يمكن أن تميز بين الارتباطات المباشرة وغير المباشرة. يمكن استخدام النمذجة الرسومية الغاوسية (GGM) لتقدير شبكات الارتباط الجزئي. ومع ذلك ، يتطلب GGM أن يكون حجم العينة وعدد الميزات قابلين للمقارنة. نادرا ما يتم استيفاء هذا الشرط في بيانات LC-MS غير المستهدفة التي تحتوي على قياسات لآلاف الميزات الأيضية. يمكن استخدام تقنيات التنظيم للتغلب على هذا القيد. يعد لاسو الرسومي (Glasso) والانحدار العقدي من الطرق الشائعة للتقدير المنظم لشبكة الارتباط الجزئي^16,20.

تعتمد أول أدوات المعلوماتية الحيوية المعروضة هنا ، CorrelationCalculator¹⁶ ، على خوارزمية الارتباط الجزئي المتناثر غير المتحيز (DSPC). يعتمد DSPC على نمذجة لاسو رسومية غير متفرقة. الافتراض الأساسي للخوارزمية هو أن عدد الاتصالات بين المستقلبات أصغر بكثير من عدد العينات ، أي أن شبكة الارتباط الجزئي للمستقلبات قليلة. يسمح هذا الافتراض ل DSPC باكتشاف الاتصال بين أعداد كبيرة من المستقلبات باستخدام عينات أقل ، والاستفادة من تقنيات الانحدار المنظم. علاوة على ذلك ، باستخدام خطوة عدم التحيز لتقديرات الانحدار المنظمة ، فإنه يحصل على توزيعات أخذ العينات لمعلمات الحافة التي يمكن استخدامها لبناء فترات الثقة واختبار فرضيات الاهتمام (على سبيل المثال ، وجود / عدم وجود واحد أو مجموعة من الحواف). وبالتالي يمكن اختبار وجود أو عدم وجود حافة في شبكة الارتباط الجزئي رسميا باستخدام قيم p المحسوبة.

أثبتت CorrelationCalculator أنها مفيدة جدا لتحليل المجموعة^{الواحدة 16} ؛ ومع ذلك ، فإن الهدف من العديد من تجارب الأيض هو التحليل التفاضلي لشرطين أو أكثر. بينما يمكن استخدام CorrelationCalculator على كل مجموعة على حدة لإنشاء شبكات ارتباط جزئية لكل حالة ، فإن هذا النهج يحد من عدد العينات التي يمكن استخدامها لتوليد الشبكة. نظرا لأن حجم العينة الكبير بما فيه الكفاية هو أحد أكبر الاعتبارات في التحليل المستند إلى البيانات ، فإن الطرق التي يمكنها الاستفادة من جميع العينات المتاحة في البيانات لبناء الشبكات مرغوبة للغاية. يتم تنفيذ هذا النهج في الأداة الثانية المعروضة هنا ، والتي تسمى Filigree²¹. يعتمد Filigree على خوارزمية تحليل إثراء الشبكة التفاضلية (DNEA) المنشورة سابقا²². يوضح الجدول 1 التطبيقات وسير العمل لكلتا الأداتين.

عدد الظروف التجريبية (ك)	ك = 1	ك = 2
أداة برمجية	الارتباطحاسبة	الصغر
إدخال البيانات	• المستقلبات × مصفوفة بيانات العينات	• المستقلبات × مصفوفة بيانات العينات • المجموعات التجريبية
سير العمل •المعالجه المسبقه • تقدير الشبكة • تجميع الشبكات • تحليل الإثراء	• تحويل السجل. التحجيم التلقائي • DSPC • عبر التطبيقات الخارجية •لا	• تحويل السجل. التحجيم التلقائي • تقدير الشبكة المشتركة • تجميع توافق الآراء • نت جي إس إيه
تصور البيانات	عبر تطبيق خارجي ، على سبيل المثال ، Cytoscape	عبر تطبيق خارجي ، على سبيل المثال ، Cytoscape
اختبار وحدات التمثيل الغذائي للارتباط مع نتائج الاهتمام (اختياري)	عبر التطبيقات الخارجية	عبر التطبيقات الخارجية

الجدول 1: نطاق التطبيق وسير عمل CorrelationCalculator و Filigree.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. حاسبة الارتباط

قم بتنزيل نموذج ملف إدخال محدد بفواصل يحتوي على قائمة من المستقلبات مع قياسات تجريبية في http://metscape.med.umich.edu/kora_data_240.csv.
انقر نقرا مزدوجا فوق نموذج الملف الذي تم تنزيله لفتحه.
1. تأكد من أن الملف يحتوي على ملصقات لكل من العينات والمستقلبات.
2. نظرا لوجود العينات في صفوف، تأكد من أن العمود الأول هو أسماء العينات وأن الصف الأول هو أسماء الأيض.
قم بتنزيل تطبيق Java CorrelationCalculator (http://metscape.med.umich.edu/calculator.html). انقر نقرا مزدوجا فوق ملف .jar الذي تم تنزيله لتشغيل التطبيق.
في علامة التبويب إدخال ، انقر فوق الزر استعراض لتحميل ملف الإدخال.
ضمن تحديد تنسيق الملف، استخدم سهم القائمة المنسدلة لتحديد تنسيق ملف الإدخال المناسب. حدد العينات في صفوف (الشكل التكميلي 1).
انتقل إلى علامة التبويب تسوية البيانات بالنقر فوق الزر ">> التالي " في أسفل يمين النافذة.
ضمن تحديد طريقة (طرق) ، حدد المربع بجوار Log2-تحويل البيانات. حدد المربع بجوار تغيير حجم البيانات تلقائيا.
ضمن تطبيع البيانات، انقر فوق الزر تشغيل .
ملاحظة: بمجرد اكتمال التسوية ، انقر فوق الزر عرض البيانات التي تمت تسويتها ، الموجود ضمن تطبيع البيانات ، وراجع مجموعة البيانات المحدثة (الشكل التكميلي 2).
ضمن تطبيع البيانات، انقر فوق الزر حفظ واحفظ ملف البيانات الجديد.
انتقل إلى علامة التبويب تحليل البيانات بالنقر فوق الزر >> التالي في أسفل يمين النافذة.
ضمن حساب ارتباط بيرسون، انقر فوق تشغيل. حدد أفضل نطاق ارتباط لبيرسون للبيانات.
1. انقر فوق الزر عرض الرسم البياني . راجع تكرار درجات الارتباط القصوى ل Pearson لكل ميزة.
2. انقر فوق الزر عرض خريطة التمثيل اللوني . راجع تمثيل مصفوفة ارتباط بيرسون.
ضمن تصفية حسب ارتباطات بيرسون، اترك الأرقام الافتراضية للتصفية حسب نطاق من 0.00 إلى 1.00
ملاحظة: حرك السهم الأزرق الصغير في الطرف الأيمن من 1 والسهم الأزرق الصغير في اليسار من 0 لتغيير عامل التصفية. يعد إدخال أرقام محددة في مربعات النص خيارا أيضا.
ضمن تحديد طريقة الارتباط الجزئي ، حدد الطريقة المطلوبة ، طريقة DSPC.
ملاحظة: إذا كان عدد المستقلبات أصغر من عدد العينات في مجموعة البيانات، يمكن استخدام طريقة DSPC فقط.
ضمن حساب الارتباطات الجزئية ، انقر فوق يجري زر (الشكل التكميلي 3).
انقر على عرض ملف CSV واعرض النتائج. انقر فوق الزر حفظ واحفظ النتائج.
انقر فوق الزر عرض في MetScape لبدء تشغيل شبكة ارتباط تفاعلية.
انظر Karnovsky، A. et ^al.6 لمزيد من المعلومات حول استخدام MetScape.
ملاحظة: MetScape هو تطبيق Cytoscape يسمح بإنشاء واستكشاف شبكات الارتباط.

2. الفيليغري

قم بتنزيل نموذج ملف إدخال محدد بفواصل يحتوي على قياسات الأيض في http://metscape.med.umich.edu/T1D_primaryMetabolites_noIS_log_scaled_sorted.csv.
انقر نقرا مزدوجا فوق نموذج الملف الذي تم تنزيله لفتحه.
1. تأكد من أن الملف يحتوي على أسماء النماذج في العمود 1 وتجميع الأسماء في العمود 2. تأكد من أن الأعمدة المتبقية تحتوي على مستقلبات / دهون.
2. تأكد من أن كل صف يمثل عينة.
  ملاحظة: يجب تحويل قياسات المستقلب إلى اللوغاريتم وقياسه تلقائيا ما لم يتم إجراء تجميع المعالم ، وفي هذه الحالة يجب تحويل القياسات إلى log فقط.
قم بتنزيل تطبيق Filigree Java (http://metscape.med.umich.edu/filigree.html).
ملاحظة: يتوفر دليل مستخدم مفصل على http://metscape.ncibi.org/v0.1.2Filigree_UserManual.pdf.
انقر نقرا مزدوجا فوق ملف .jar الذي تم تنزيله لتشغيل التطبيق.
في علامة التبويب بيانات ، انقر فوق الزر استعراض لتحميل ملف الإدخال.
ضمن تحديد أعمدة/صفوف، انقر فوق سهم القائمة المنسدلة بجوار نموذج المعرف لتحديد اسم العمود/الصف المقابل من ملف الإدخال. حدد عينة.
ضمن تحديد الأعمدة / الصفوف ، انقر فوق سهم القائمة المنسدلة بجوار "مجموعة" لتحديد العمود / الصف المقابل من ملف الإدخال. حدد مجموعة.
ضمن تحديد مجموعات نموذجية ، انقر فوق أسهم القائمة المنسدلة بجوار كل مجموعة لتحديد عمود المجموعة المقابل من ملف الإدخال. بالنسبة إلى المجموعة 1، اختر مريض السكري. بالنسبة إلى المجموعة 2، حدد غير مصاب بالسكري.
ضمن تجميع المعالم، حدد المربع بجوار الطريقة المطلوبة، حساب مجموعات المعالم.
انقر فوق الزر عرض خرائط الحرارة . عرض خريطة التمثيل اللوني وتحديد النسبة المئوية المطلوبة للتخفيض.
استخدم شريط تمرير تقليل الميزات لتحديد النسبة المئوية المطلوبة لتقليل المعالم. حرك الدائرة الصغيرة حتى تظهر النسبة المئوية للتخفيض نسبة ميزة إلى عينة تبلغ 1.25 (الشكل التكميلي 4).
انتقل إلى علامة التبويب تحليل بالنقر فوق الزر >> التالي في أسفل يسار النافذة.
ضمن تحديد دليل الإخراج ، انقر فوق الزر "استعراض" وحدد موقع الدليل المطلوب لتخزين ملفات الإخراج التي تم إنشاؤها.
انقر فوق الزر تشغيل التحليل الموجود في أسفل يسار النافذة. يتم تحديث أشرطة التقدم لكل مكون من مكونات التحليل (الشكل التكميلي 5). انقر على OK زر في النافذة المنبثقة التي تعرض الرسالة اكتمل التحليل بنجاح.
في علامة التبويب تحليل ، انقر فوق الزر استعراض الشبكات لفتح الشبكات الفرعية Filigree التفاعلية في علامة تبويب المستعرض.
انقر فوق ارتباط الشبكة الفرعية 1 أسفل عمود اسم الشبكة الفرعية .
استكشف الشبكة الفرعية التفاعلية باستخدام الأزرار المختلفة. انقر فوق الزر + وقم بتكبير جزء الشبكة. انقر فوق الزر - وقم بالتصغير (الشكل التكميلي 6).
انقر فوق عقدة المجموعة واسحبها لتغيير موضعها داخل الشبكة الفرعية.
ملاحظة: يمثل لون العقدة التنظيم لأعلى / لأسفل ، ويمثل عتامة اللون تغيرا أعلى / أقل في الطي. يمثل لون الحافة الحالة التفاضلية بين المجموعات.
انقر فوق الزر توسيع الميزات في أعلى يمين الصفحة لتوسيع جميع عقد المجموعة. راجع المركبات المحددة التي تشكل عقد المجموعة.
انقر فوق الزر طي الميزات في أعلى يسار الصفحة لطي عقد المجموعة الموسعة مؤخرا.
انقر فوق الزر حسب المجموعة النموذجية في أعلى يسار الصفحة لتغيير طريقة العرض من شبكة فرعية واحدة إلى شبكات فرعية متعددة مقسمة حسب مجموعة. استكشف وقارن المجموعات باستخدام طريقة العرض هذه للشبكات الفرعية (الشكل التكميلي 7).
انقر فوق الزر كافة العينات للعودة إلى طريقة عرض الشبكة الفرعية الفردية.
اعرض الشبكة الفرعية التالية بالنقر فوق الزر التالي في أعلى يمين الصفحة.
كرر الخطوات 2.19-2.23 لكل شبكة فرعية.
انقر فوق الارتباط نتائج تحليل إثراء الشبكة التفاضلية في أعلى منتصف النافذة للعودة إلى طريقة عرض جدول الملخص التي تسرد كافة الشبكات الفرعية.
ملاحظة: قم باستيراد ملفات إخراج الحافة و/أو العقدة في أداة برمجية مختلفة، مثل Cytoscape²³، لإنشاء مرئيات شبكة إضافية.

3. اعتبارات إضافية

بالنسبة لأجهزة كمبيوتر Mac التي تعمل بنظام Big Sur (OSX 11.2) أو إصدار أحدث، قم بالموافقة على الأداة في قائمة Apple > تفضيلات النظام > الأمان والخصوصية > عام وحدد السماح في أسفل علامة التبويب.
بالإضافة إلى ذلك ، اسمح ل Filigree بالوصول إلى الملفات الموجودة في قائمة Apple > تفضيلات النظام > الأمان والخصوصية > الخصوصية عن طريق تحديد الملفات والمجلدات في القائمة الموجودة على اليسار ثم تحديد Filigree في القائمة على اليمين.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

لتوضيح استخدام CorrelationCalculator ، قمنا ببناء شبكة ارتباط جزئي باستخدام مجموعة فرعية من بيانات الأيض من دراسة سكان KORA الموصوفة في Krumsiek et ^al.24. احتوت مجموعة البيانات على 151 مستقلبا و 240 عينة. يوضح الشكل 1 شبكة الارتباط الجزئي الناتجة التي تم تصورها في Cytoscape. تحتوي الشبكة على 148 عقدة و 272 حافة. يمثل لون العقد المستقلبات التي تنتمي إلى فئات كيميائية مختلفة ، بينما تمثل الحواف القيمة p المعدلة لمعاملات الارتباط الجزئي (القيمة p المعدلة < 0.05) . والجدير بالذكر أنه على الرغم من عدم استخدام أي معلومات سابقة ، تمكنت CorrelationCalculator من تجميع المستقلبات ذات الصلة كيميائيا. على سبيل المثال ، ترتبط الفوسفاتيديل كولين والليزوفوسفاتيديل كولين ارتباطا وثيقا في الشبكة. يمكن أن يؤدي تصور تغييرات الأيض في سياق هذا النوع من الشبكات إلى تسهيل توليد الفرضيات والمساعدة في تخطيط التجارب المستقبلية وتمكين إعداد المخطوطة. لتوضيح سير عمل محتمل باستخدام شبكة مستقلب ارتباط جزئي ، أجرينا تجميع شبكة إجماع كما هو موضح في Ma et ^al.22 ، مما أدى إلى تحديد 9 شبكات فرعية أو وحدات أيضية. كان لهذه الوحدات اتفاق جيد مع الفئات الكيميائية ، أي أن المستقلبات التي تنتمي إلى نفس الفئة الكيميائية تميل إلى أن تكون جزءا من نفس الوحدة الأيضية. يمكن للمستخدم الوصول إلى أداة التجميع clusterNet في https://github.com/Karnovsky-Lab/clusterNet.

الشكل 1: مثال تمثيلي لشبكة حاسبة الارتباط. تم إنشاء الشبكة من مجموعة فرعية من بيانات الأيض²⁴ لدراسة السكان KORA تتكون من 151 مستقلبا عبر 240 شخصا. تمثل العقد المستقلبات ، ويتم ترجيح الحواف التي تربطها بقيمة p المعدلة لمعاملات الارتباط الجزئي (القيمة p المعدلة < 0.05). يمثل شكل العقد فئات أيضية مختلفة ، ويمثل اللون وحدات التمثيل الغذائي التي تم الحصول عليها عن طريق تجميع الشبكة باستخدام طريقة تجميع الإجماع. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

نوضح تطبيق Filigree من خلال تحليل مجموعة بيانات من نموذج فأر لمرض السكري من النوع الأول (T1D)^25,26. تم استخدام قياسات مستقلب البلازما من الفئران T1D وغير المصابة بالسكري (NOD) لتوليد شبكة ارتباط جزئي تفاضلي (الشكل 2). والجدير بالذكر أننا نلاحظ درجة أعلى من الاتصال بالشبكة في المجموعة غير المصابة بالسكري. حددت الخطوات التالية للتحليل اثنتي عشرة وحدة أيضية ، تسعة منها كانت مختلفة بشكل كبير بين T1D والفئران غير المصابة بالسكري (FDR < 0.05). نحيل القارئ إلى المنشور الأصلي لمزيد من الأفكار حول الاستنتاجات البيولوجية التي يمكن استخلاصها من هذا التحليل²¹.

الشكل 2: مثال تمثيلي لشبكة Filigree. تم بناء الشبكة التفاضلية باستخدام مستويات 163 مستقلبا من 71 فأرا (30 T1D و 41 غير T1D)^25,26. يشار إلى الحواف التفاضلية بين مجموعات T1D وغير T1D باللون الوردي والأزرق ، على التوالي. يتم تلوين العقد بناء على تغيير الطي. يوضح الجدول نتائج الإثراء التي أنتجتها Filigree. كانت تسع من أصل اثنتي عشرة شبكة فرعية محددة مختلفة بشكل كبير بين T1D وغير T1D (القيمة p المعدلة < 0.05). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.

الشكل التكميلي 1: CorrCalc_InputTab. لقطة شاشة لعلامة التبويب إدخال حاسبة الارتباط. الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي 2: CorrCalc_DataNormTab. لقطة شاشة لعلامة التبويب تسوية البيانات في حاسبة الارتباط. يتم فحص بيانات تحويل السجل 2 وبيانات القياس التلقائي. الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي 3: CorrCalc_DataAnalTab. لقطة شاشة لعلامة تبويب تحليل البيانات في حاسبة الارتباط تظهر التصفية إلى ارتباط بيرسون من 0-0.8. بالإضافة إلى ذلك ، تم تحديد طريقة DSPC . الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي 4: Filigree_DataTab. لقطة شاشة لعلامة التبويب بيانات Filigree. تم تحديد الأعمدة والصفوف والمجموعات. تم تحديد طريقة حساب مجموعات المعالم مع تقليل نسبة المعالم إلى العينة 1.25. الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي 5: Filigree_AnalysisTab. لقطة شاشة لعلامة التبويب تحليل Filigree تعرض تقدم مكونات التحليل المختلفة. الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي 6: Filigree_Subnetwork1. شبكة فرعية تم إنشاؤها من Filigree. يمثل لون العقدة التنظيم لأعلى / لأسفل ، ويمثل عتامة اللون تغيير الطي الأعلى / السفلي. يمثل لون الحافة الحالة التفاضلية بين المجموعات. الرجاء الضغط هنا لتنزيل هذا الملف.

الشكل التكميلي 7: Filigree_Subnetwork_SampleGroup. شبكة فرعية مفصولة بالمجموعة. تمثل الشبكة اليسرى عينات السكري ، وتمثل الشبكة اليمنى عينات غير مصابة بالسكري. يمثل لون العقدة مستوى التعبير المتناسب مع متوسط المجموعة. الرجاء الضغط هنا لتنزيل هذا الملف.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

تساعد طرق تحليل الشبكة القائمة على الارتباط الجزئي المطبقة في CorrelationCalculator و Filigree في التغلب على بعض قيود تحليلات المسار الأيضي القائمة على المعرفة ، خاصة بالنسبة لمجموعات البيانات ذات الانتشار المرتفع للمستقلبات غير المعروفة والتغطية المحدودة للمسارات الأيضية (على سبيل المثال ، بيانات الدهون). تم استخدام هذه الأدوات على نطاق واسع من قبل مجتمع البحث لتحليل مجموعة واسعة من بيانات الأيض والدهون¹⁴،²²،²⁷،^28،29^،³⁰. على سبيل المثال ، تم استخدام CorrelationCalculator لتحليل البيانات من العديد من الأنظمة البيولوجية التي تتراوح من الميكروبيوم والنباتات إلى الأمراض البشرية³¹،³²،³³^،³⁴. نوضح هنا كيف يمكن دمج تحليل الشبكة المستند إلى البيانات ، والذي تم تمكينه بواسطة أدواتنا ، مع تحليل التجميع والانحدار لتحديد الوحدات الأيضية المرتبطة بالنمط الظاهري محل الاهتمام.

يمكن تجميع شبكات الارتباط الجزئي التي تم إنشاؤها باستخدام CorrelationCalculator و Filigree باستخدام خوارزميات تجميع الرسم البياني لإنتاج وحدات التمثيل الغذائي. تميل هذه الوحدات إلى أن تشتمل على مستقلبات مرتبطة كيميائيا أو وظيفيا ببعضها البعض. هذه الوحدات مفيدة للغاية ليس فقط من منظور التصور ولكن أيضا من وجهة نظر الأهمية البيولوجية. يمكن أن توفر دراسة العلاقات بين الوحدات الأيضية ونتائج النمط الظاهري ذات الأهمية (على سبيل المثال ، نتائج البقاء على قيد الحياة) المزيد من القوة الإحصائية وتوليد رؤى بيولوجية إضافية مقارنة باختبار المستقلبات الفردية.

يمكن أيضا استخدام وحدات التمثيل الغذائي المحددة من خلال نهج تجميع الشبكة في تحليل الإثراء. يستخدم Filigree وحدات التمثيل الغذائي المحددة من خلال التجميع التوافقي بدلا من المسارات البيولوجية المحددة مسبقا. على الرغم من أن الوحدات الأيضية القائمة على الارتباط الجزئي ليست متطابقة مع المسارات ، إلا أنها تجمع باستمرار مستقلبات متشابهة كيميائيا وكيميائيا حيويا (على سبيل المثال ، الأحماض الأمينية ، الأسيل كارنيتين ، الدهون من نفس الفئة ، إلخ). يختبر Filigree كذلك أهمية هذه الوحدات باستخدام خوارزمية NetGSA^22,35. بالإضافة إلى العقد التفاضلية ، يمثل NetGSA الاختلافات الخاصة بالمرض في بنية الشبكة.

إحدى المشكلات التي يجب مراعاتها عند استخدام CorrelationCalculator و Filigree لتحليل بيانات الأيض والدهون "الواقعية" هي العلاقة بين عدد المستقلبات مقابل عدد العينات في تجربة معينة. في حين أن الدراسات الوبائية واسعة النطاق التي تشمل آلاف العينات أصبحت أكثر شيوعا ، فإن حجم العينة في غالبية تجارب الأيض لا يزال متواضعا. وينطبق هذا بشكل خاص على الدراسات الميكانيكية التي تنطوي على أنظمة يتوقع فيها تباين بيولوجي منخفض (أي خطوط الخلايا أو النماذج الحيوانية المتجانسة وراثيا). يمكن تطبيق الخوارزميات الإحصائية المطبقة في كلتا الأداتين في المواقف التي يتجاوز فيها عدد المستقلبات عدد العينات ، لكن الزيادة في هذه النسبة تؤدي إلى شبكات أكثر تناثرا.

هناك اعتبار مهم آخر لتطبيق الأدوات الموصوفة هنا يتعلق بتحليل بيانات الأيض غير المستهدفة المعروفة باحتوائها على عدد كبير من السمات الزائدة عن الحاجة أو المتدهورة³⁶ ، والتي قد تشمل النظائر ، والمواد الكيميائية المضافة ، والشظايا في المصدر ، والملوثات. نظرا لأن العديد من الميزات المنحطة تنشأ من نفس المستقلب ، فإنها تميل إلى أن يكون لها درجة عالية من الارتباط. قد يتطلب التحليل القائم على الارتباط الجزئي لهذه البيانات شرحا دقيقا وإزالة الميزات المتدهورة.

في الختام ، توفر الأدوات المعروضة هنا بديلا قابلا للتطبيق لأدوات تحليل المسارات القائمة على المعرفة لتفسير بيانات الأيض.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

وليس للمؤلفين مصالح مالية متنافسة.

Acknowledgments

تم دعم هذا العمل من خلال منحة NIH 1U01CA235487.

Materials

Name	Company	Catalog Number	Comments
CorrelationCalculator	JAVA	http://metscape.med.umich.edu/calculator.html
clusterNet		https://github.com/Karnovsky-Lab/clusterNet
Cytoscape	Cytoscape	https://cytoscape.org/
Filigree	JAVA	http://metscape.med.umich.edu/filigree.html
MetScape	Cytoscape	https://apps.cytoscape.org/apps/metscape	Cytoscape application that allows for the creation and exploration of correlation networks.

DOWNLOAD MATERIALS LIST

References

Sas, K. M., Karnovsky, A., Michailidis, G., Pennathur, S. Metabolomics and diabetes: analytical and computational approaches. Diabetes. 64 (3), 718-732 (2015).
Cottret, L., et al. MetExplore: Collaborative edition and exploration of metabolic networks. Nucleic Acids Research. 46 (W1), W495-W502 (2018).
Garcia-Alcalde, F., Garcia-Lopez, F., Dopazo, J., Conesa, A. Paintomics: A web based tool for the joint visualization of transcriptomics and metabolomics data. Bioinformatics. 27 (1), 137-139 (2011).
Kuo, T. C., Tian, T. F., Tseng, Y. J. 3Omics: A web-based systems biology tool for analysis, integration and visualization of human transcriptomic, proteomic and metabolomic data. BMC Systems Biology. 7, 64 (2013).
Paley, S. M., Karp, P. D. The pathway tools cellular overview diagram and Omics Viewer. Nucleic Acids Research. 34 (13), 3771-3778 (2006).
Karnovsky, A., et al. Metscape 2 bioinformatics tool for the analysis and visualization of metabolomics and gene expression data. Bioinformatics. 28 (3), 373-380 (2012).
Chong, J., Xia, J. Using MetaboAnalyst 4.0 for metabolomics data analysis, interpretation, and integration with other omics data. Methods in Molecular Biology. 2104, 337-360 (2020).
Lopez-Ibanez, J., Pazos, F., Chagoyen, M. MBROLE 2.0-functional enrichment of chemical compounds. Nucleic Acids Research. 44 (W1), W201-W204 (2016).
Cavalcante, R. G., et al. Broad-Enrich: Functional interpretation of large sets of broad genomic regions. Bioinformatics. 30 (17), i393-i400 (2014).
Huang, D. W., et al. DAVID bioinformatics resources: Expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Research. 35 (Web Server issue), W169-W175 (2007).
Lee, P. H., O'Dushlaine, C., Thomas, B., Purcell, S. M. INRICH: interval-based enrichment analysis for genome-wide association studies. Bioinformatics. 28 (13), 1797-1799 (2012).
Segre, A. V., Groop, L., Mootha, V. K., Daly, M. J., Altshuler, D. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genetics. 6 (8), e1001058 (2010).
Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102 (43), 15545-15550 (2005).
Afshinnia, F., et al. Lipidomic signature of progression of chronic kidney disease in the chronic renal insufficiency cohort. Kidney International Reports. 1 (4), 256-268 (2016).
Barupal, D. K., et al. MetaMapp: Mapping and visualizing metabolomic data by integrating information from biochemical pathways and chemical and mass spectral similarity. BMC Bioinformatics. 13, 99 (2012).
Basu, S., et al. Sparse network modeling and Metscape-based visualization methods for the analysis of large-scale metabolomics data. Bioinformatics. 33 (10), 1545-1553 (2017).
Krumsiek, J., Suhre, K., Illig, T., Adamski, J., Theis, F. J. Gaussian graphical modeling reconstructs pathway reactions from high-throughput metabolomics data. BMC Systems Biology. 5, 21 (2011).
Camacho, D., de la Fuente, A., Mendes, P. The origin of correlations in metabolomics data. Metabolomics. 1 (1), 53-63 (2005).
Steuer, R., Kurths, J., Fiehn, O., Weckwerth, W. Observing and interpreting correlations in metabolomic networks. Bioinformatics. 19 (8), 1019-1026 (2003).
Bühlmann, P., Van De Geer, S. Statistics for High-Dimensional Data: Methods, Theory and Applications. , Springer Berlin, Heidelberg. (2011).
Iyer, G. R., et al. Application of differential network enrichment analysis for deciphering metabolic alterations. Metabolites. 10 (12), 479 (2020).
Ma, J., et al. Differential network enrichment analysis reveals novel lipid pathways in chronic kidney disease. Bioinformatics. 35 (18), 3441-3452 (2019).
Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Reserach. 13 (11), 2498-2504 (2003).
Krumsiek, J., et al. Mining the unknown: a systems approach to metabolite identification combining genetic and metabolic information. PLoS Genetics. 8 (10), e1003005 (2012).
Fahrmann, J., et al. Systemic alterations in the metabolome of diabetic NOD mice delineate increased oxidative stress accompanied by reduced inflammation and hypertriglyceremia. American Journal of Physiology. Endocrinology and Metabolism. 308 (11), E978-E989 (2015).
Grapov, D., et al. Diabetes associated metabolomic perturbations in NOD mice. Metabolomics. 11 (2), 425-437 (2015).
Jin, Y., Bai, S., Huang, Z., You, L., Zhang, T. Technology characteristics and flavor changes of traditional green wheat product nian zhuan in Northern China. Frontiers in Nutrition. 9, 996337 (2022).
Lin, Y. S., et al. Probing folate-responsive and stage-sensitive metabolomics and transcriptional co-expression network markers to predict prognosis of non-small cell lung cancer patients. Nutrients. 15 (1), 3 (2022).
Pan, C., et al. Metabolomics study identified bile acids as potential biomarkers for gastric cancer: A case control study. Frontiers in Endocrinology (Lausanne). 13, 1039786 (2022).
Pancoro, A., Karima, E., Apriyanto, A., Effendi, Y. (1)H NMR metabolomics analysis of oil palm stem tissue infected by Ganoderma boninense based on field severity Indices. Scientific Reports. 12 (1), 21087 (2022).
Chele, K. H., et al. A global metabolic map defines the effects of a Si-based biostimulant on tomato plants under normal and saline conditions. Metabolites. 11 (12), 820 (2021).
Hubert, J., et al. The effect of residual pesticide application on microbiomes of the storage mite Tyrophagus putrescentiae. Microbial Ecology. 85 (4), 1527-1540 (2023).
Li, K., et al. Metabolomic and exposomic biomarkers of risk of future neurodevelopmental delay in human milk. Pediatric Research. 93 (6), 1710-1720 (2023).
Marino, C., et al. The metabolomic profile in amyotrophic lateral sclerosis changes according to the progression of the disease: An exploratory study. Metabolites. 12 (9), 837 (2022).
Ma, J., Shojaie, A., Michailidis, G. Network-based pathway enrichment analysis with incomplete network information. Bioinformatics. 32 (20), 3165-3174 (2016).
Mahieu, N. G., Patti, G. J. Systems-level annotation of a metabolomics data set reduces 25000 features to fewer than 1000 unique metabolites. Analytical Chemistry. 89 (19), 10397-10406 (2017).

Biology

CorrelationCalculator and Filigree: أدوات لتحليل الشبكة القائمة على البيانات لبيانات الأيض

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.