Waiting
Traitement de la connexion…

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

أداء استخراج البيانات والتحليل التكاملي لمؤشر الحيوية في سرطان الثدي باستخدام قواعد بيانات متعددة يمكن الوصول اليها علنا

Published: May 17, 2019 doi: 10.3791/59238

Summary

هنا ، نقدم بروتوكولا لاستكشاف مؤشر الحيوية والبقاء علي قيد الحياة من سرطان الثدي استنادا إلى تحليل شامل من مجموعات البيانات السريرية المستمدة من مجموعه متنوعة من قواعد البيانات المتاحة للجمهور ، وذلك باستخدام استراتيجية التعبير والارتباط تحليل البقاء علي قيد الحياة خطوه بخطوه.

Abstract

وفي السنوات الاخيره ، صممت قواعد البيانات الناشئة لخفض الحواجز التي تحول دون الاقتراب من مجموعات البيانات الجينية المعقدة للسرطان ، مما يسهل علي المحققين تحليل وتفسير الجينات والعينات والمعطيات السريرية عبر أنواع مختلفه من السرطان. هنا ، ونحن وصف اجراء عمليه العملي ، مع الأخذ ID1 (مثبط الحمض النووي البروتينات ملزمه 1) علي سبيل المثال ، لتوصيف أنماط التعبير من المؤشرات الحيوية والبقاء علي قيد الحياة من سرطان الثدي علي أساس تجميع مجموعات البيانات السريرية المستمدة من قواعد البيانات المتاحة علي الإنترنت, بما في ذلك ONCOMINE, bcGenExMiner الخامس 4.0 (سرطان الثدي الجينات التعبير عامل المنجم الخامس 4.0), GOBO (الجينات التعبير علي أساس النتائج لسرطان الثدي علي الإنترنت), HPA (أطلس البروتين البشري), وكابلان ماير الراسمة بدا التحليل مع الاستعلام عن نمط التعبير من جين الفائدة (علي سبيل المثال ، ID1) في العينات السرطانية مقابل العينات العادية. ثم ، تم اجراء تحليل الارتباط بين ID1 والخصائص السريرية الباثولوجية في سرطان الثدي. بعد ذلك ، تم تقسيم ملامح التعبير عن ID1 وفقا للمجموعات الفرعية المختلفة. وأخيرا ، تم تحليل العلاقة بين التعبير ID1 ونتائج البقاء علي قيد الحياة. ويبسط اجراء التشغيل مفهوم دمج أنواع البيانات المتعددة الابعاد علي مستوي الجينات من قواعد بيانات مختلفه وفرضيات اختباريه فيما يتعلق بالتكرار والسياق الجيني لاحداث تغيير الجينات في سرطان الثدي. ويمكن لهذه الطريقة ان تحسن مصداقية الاستنتاجات وتمثيلها ، التالي فانها تقدم منظورا زاخرا بالمعلومات عن جين الاهتمام.

Introduction

سرطان الثدي هو مرض غير متجانسة مع مختلف التشخيص واستراتيجيات العلاج في الأنواع الفرعية الجزيئية المختلفة ، والتي من المحتمل ان تكون مرتبطة التولد والتنمية مع أليات الجزيئية المتباينة1،2 , 3. ومع ذلك ، تحديد الهدف العلاجي عاده ما يستغرق سنوات ، أو حتى عقود ، من الاكتشاف الاولي في البحوث الاساسيه للاستخدام السريري4. تطبيق الجينوم علي نطاق واسع من تكنولوجيا التسلسل عاليه الانتاجيه لجينوم السرطان قد تقدمت إلى حد كبير عمليه البحث عن المؤشرات الحيوية القيمة أو الأهداف العلاجية 5.

الكمية الساحقة من البيانات الجينوم السرطان المتولدة من منصات السرطان واسعه النطاق الجينوم ، مثل ICGC (الاتحاد الدولي لجينوم السرطان) و TCGA (أطلس الجينوم السرطاني) ، يشكل تحديا كبيرا للباحثين لأداء البيانات الاستكشاف والتكامل والتحليلات ، خاصه بالنسبة للمستخدمين الذين يفتقرون إلى التدريب المكثف في المعلوماتية والحسابات6و 7و8و9و10. في السنوات الاخيره ، وقواعد البيانات الناشئة ، (علي سبيل المثال ، ONCOMINE ، bcGenExMiner الخامس 4.0 ، وكابلان ماير الراسمة ، الخ) تم تصميم وتطويرها لخفض شريط لتقترب من مجموعات البيانات الجينية السرطان معقده ، التالي تسهيل المحققين لتحليل تفسير الجينات والعينات والبيانات السريرية عبر أنواع مختلفه من السرطان11. والهدف من هذا البروتوكول هو وصف استراتيجية بحثيه تتكامل مع مستويات متعددة من المعلومات الجينية من سلسله من قواعد بيانات النفاذ المفتوح ، التي اعترف بها علي نطاق واسع عدد كبير من الباحثين ، لتحديد المؤشرات البيولوجية المحتملة العوامل النذيره لسرطان الثدي.

قاعده البيانات ONCOMINE هو منصة علي شبكه الإنترنت لاستخراج البيانات مع معلومات ميكروصفيف السرطان ، ويهدف إلى تسهيل اكتشاف العلامات الحيوية الجديدة والأهداف العلاجية11. حاليا ، هناك أكثر من 48,000,000 التعبيرات الجينية القياسات من 65 مجموعات بيانات التعبير الجيني في هذه القاعدة11،12. و bcGenExMiner الخامس 4.0 (أداه مجانية للمؤسسة غير الربحية) ، وتسمي أيضا سرطان الثدي الجينات التعبير عامل المنجم ، هو تطبيق سهل الاستخدام علي شبكه الإنترنت التي تتالف من الحمض النووي ميكروصفائف نتائج 3,414 تعافي مرضي سرطان الثدي و 1,209 من ذوي الخبرة الحدث الازدراء13. وهو مصمم لتحسين أداء تحليل الجينات نذير مع البرامج الاحصائيه R والحزم.

و GOBO هو أداه متعددة الوظائف علي الإنترنت سهله الاستخدام مع المعلومات ميكروصفائف (علي سبيل المثال ، Affymetrix U133A) من مجموعه خط خليه سرطان الثدي 51 عينه ومجموعه بيانات ورم الثدي 1881 عينه ، التي تسمح لطائفه واسعه من التحليلات14. هناك مجموعه متنوعة من التطبيقات المتاحة في قاعده بيانات GOBO ، والتي تشمل التحليل السريع لملامح التعبير الجيني في الأنواع الفرعية الجزيئية المختلفة من أورام الثدي والخطوط الخلوية ، والكشف عن الجينات المعرب عنها لخلق metagenes المحتملة ، و تحليل الارتباط بين النتائج ومستويات التعبير الجيني من جينات واحده, مجموعات من الجينات, أو التوقيعات الجينية في البيانات سرطان الثدي مجموعه15.

أطلس البروتين البشري هو برنامج الوصول المفتوح المصممة للعلماء لاستكشاف بروتينيه البشرية ، والتي ساهمت بالفعل في عدد كبير من المنشورات في مجال البيولوجيا البشرية والمرض. يتم التعرف علي أطلس البروتين البشري كمورد أساسي أوروبي لمجتمع علوم الحياة16,17.

الراسمة كابلان ماير هو أداه علي الإنترنت دمج التعبير الجيني والبيانات السريرية في وقت واحد ان يسمح تقييم تاثير نذير من 54,675 الجينات علي أساس 10,461 عينات السرطان ، والتي تشمل 1,065 المعدة ، 2,437 الرئة ، 1,816 المبيض و 5,143 مرضي سرطان الثدي مع متابعه متوسط من 33/49/40/69 أشهر18. معلومات التعبير الجيني ، والبقاء علي قيد الحياة خاليه من الانتكاس (rfs) والبقاء الشامل (OS) للتحميل من قاعده البيانات هذه19،20.

هنا ، ونحن وصف اجراء عمليا لاستخدام قواعد البيانات متعددة المتاحة للجمهور للمقارنة ، وتحليل وتصور أنماط التغييرات في التعبير عن جين الفائدة عبر دراسات السرطان متعددة ، بهدف تلخيص ملامح التعبير ، والقيم النذيره والوظائف البيولوجية المحتملة في سرطان الثدي. فعلي سبيل المثال ، أشارت الدراسات الحديثة إلى خصائص البروتينات المرتبطة بالهوية في الأورام وارتبطت بالسمات الخبيثة ، بما في ذلك التحول الخلوي ، والخلود ، والانتشار المعزز ، والورم الخبيث21، 22و23. ومع ذلك ، كل عضو في عائله ID يلعب أدوارا متميزة في أنواع مختلفه من الأورام الصلبة ، ودورها في سرطان الثدي لا يزال غير واضح24. في الدراسات السابقة, استكشاف من خلال هذه الطريقة, وجدنا ان ID1 كان مؤشرا نذير ذات مغزى في سرطان الثدي25. ولذلك ، فان البروتوكول سياخذ ID1 كمثال لإدخال أساليب التعدين البيانات.

يبدا التحليل من الاستعلام عن نمط التعبير لجين الفائدة في العينات السرطانية مقابل العينات العادية في ONCOMINE. ثم ، تم تنفيذ الارتباط التعبير من الجينات الاهتمام في سرطان الثدي باستخدام bc-GenExMiner الخامس 4.0 ، GOBO ، و ONCOMINE. وبعد ذلك ، تم تقسيم لمحات التعبير عن ID1 وفقا لفئات فرعيه مختلفه باستخدام قواعد البيانات الثلاث المذكورة أعلاه. وأخيرا ، تم تحليل الارتباط بين التعبير ID1 والبقاء بها باستخدام bc-GenExMiner v 4.0 ، أطلس البروتين البشري ، وكابلان-ماير الراسمة. تم عرض اجراء التشغيل كمخطط انسيابي في الشكل 1.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. تحليل نمط التعبير

  1. انتقل إلى واجهه ويب ONCOMINE26.
  2. الحصول علي مستويات التعبير النسبي من ID1 الجينات في أنواع مختلفه من الأورام الخبيثة عن طريق كتابه ID1 إلى مربع البحث.
  3. حدد نوع التحليل من قائمه عوامل التصفية الاساسيه. ثم ، حدد السرطان مقابل التحليل العادي، سرطان الثدي مقابل التحليل العادي.
  4. حدد عرض ملخص الجينات من القائمة " طرق" أخرى . تعيين عتبه القيمة Pعند 0.01. تحميل الأرقام.
    ملاحظه: عتبه التغيير اضعاف 2 ، كما هو موضح في الدراسة السابقة27.

2. تحليل ارتباط التعبير

  1. الذهاب إلى واجهه الويب قبل الميلاد-GenExMiner الإصدار 4.028.
  2. حدد الارتباط من قائمه التحليل ، واضغط علي الزر الشامل. اكتب ID1 إلى مربع البحث. اضغط علي زر الإرسال وزر التحليل أبدا .
    ملاحظه: الاعداد الافتراضي إظهار تحليل ارتباط التعبير لجميع المرضي ، والتي يمكن ان تكون أكثر دقه في أنواع فرعيه مختلفه من سرطان الثدي عن طريق الضغط علي فلتر النوع الفرعي جزيء .

3-تحليل المجموعات الفرعية

  1. تحليل المجموعة الفرعية في bc-جينيكمينر الإصدار 4.0
    1. الذهاب إلى واجهه الويب قبل الميلاد-GenExMiner الإصدار 4.028.
    2. حدد تعبير من قائمه التحليل ، اضغط علي الزر الشامل. اكتب ID1 إلى مربع البحث واضغط علي زر الإرسال وزر تحليل البدء .
    3. انقر فوق الحالة العقديه (LN) و Scarff بلوم & ريتشاردسون الصف (سبر) الصور المصغرة لعرض الصورة الكاملة. في صور سبر ، اضغط علي الزر أدناه لتصور قيم Pللأرقام. تحميل الأرقام.
  2. تحليل المجموعة الفرعية في النتائج القائمة علي التعبير الجيني لسرطان الثدي علي الإنترنت (GOBO)
    1. انتقل إلى واجهه ويب GOBO14.
    2. نوع مورثه رمز من فائده ID1 إلى الشاشة تحميل المورثة مجموعه.
    3. تعيين نطاق البحث تعريف معرفات الجينات/المسبار إلى رمز الجينات. تعيين الكل في اختيار الورم. حدد حاله العقدة والدرجة الطبقية في المعلمات متعددة المتغيرات. تظل العناصر الأخرى افتراضيه. تقديم التحقيق وتحميل الأرقام.

4. تحليل البقاء علي قيد الحياة

  1. تحليل البقاء علي قيد الحياة في bc-جينيكمينر الإصدار 4.0
    1. الذهاب إلى واجهه الويب قبل الميلاد-GenExMiner الإصدار 4.028.
    2. حدد نذير من قائمه التحليل ، اضغط علي الزر الشامل. اكتب ID1 إلى مربع البحث واضغط علي زر الإرسال وزر تحليل البدء .
    3. في التحليل نذير الشامل ، حدد Nm ، والمخاطر المؤسسية ، MR في السكان ومعايير الحدث واضغط علي زر الإرسال للحصول علي مزيد من المعلومات. اضغط علي الصور المصغرة لمنحني كابلان-ماير لتصدير الرسوم البيانية الكاملة.
      ملاحظه: N (+ ،-، m): الحالة العقديه (+: إيجابي ،-: سالب ، m: مختلط) ؛ ER (+,-, m): وضع مستقبلات الاستروجين (+: إيجابي,-: سلبي, m: مختلطة); السيد: الانتكاس المنتشر
  2. تحليل البقاء علي قيد الحياة في أطلس البروتين البشري (HPA)
    1. انتقل إلى واجهه ويب أطلس البروتين البشري29.
    2. اكتب ID1 إلى مربع البحث وانقر فوق الزر بحث . حدد الأطلس الفرعي لعلم الامراض.
      ملاحظه: يتم عرض مستويات التعبير mRNA عبر أنواع السرطان 17 في المقطع نظره عامه حول تعبير RNA. كل تسميه الانسجه السرطانية من مؤامرة مربع هو النقر للوصول إلى صفحه مفصله توفير بيانات تحليل البقاء علي قيد الحياة ومستويات التعبير RNA.
    3. انقر علي تسميه سرطان الثدي، ثم صفحه مفصله لإظهار التفاعلية البقاء علي قيد الحياة مبعثر المؤامرة وتحليل البقاء علي قيد الحياة. تحميل الأرقام.
  3. تحليل البقاء علي قيد الحياة في كابلان-ماير الراسمة البقاء علي قيد الحياة
    1. انتقل إلى كابلان-ماير راسمه واجهه الويب30. انقر فوق بدء الراسمة كم لسرطان الثدي في منطقه رقاقه الجينات mrna.
    2. اكتب ID1 إلى شريط البحث وحدد العنصر الأخضر في قائمه المرشحين.
    3. حدد Rfs كنوع البقاء علي قيد الحياة وتظل العناصر الأخرى افتراضيه. انقر فوق رسم كابلان-ماير المؤامرة وتحميل الأرقام.
      ملاحظه: يمكن تغيير إعدادات أنواع البقاء علي قيد الحياة ، وأنواع القطع ، وعتبه المتابعة ، فضلا عن خيارات مجموعه التحقيق ، كما هو مطلوب. يمكن الحصول علي تحليل نذير المجموعات الفرعية بما في ذلك ER ، PR ، لها-2 ، الغدد الليمفاوية ، الصف ، Tp53 الحالة ، والأنواع الجزيئية عن طريق تغيير الاعداد في التحليل تقييد إلى الأنواع الفرعية المربع1. المثل ، يمكن تعيين الحد فلتر العلاج في تقييد التحليل إلى المجموعات المختارة ' مربع.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

وقد أجريت نتيجة تمثيليه لاستخراج البيانات والتحليل التكاملي لسرطان الثدي البيولوجية باستخدام ID1 ، واحده من مثبطات افراد الاسره ملزمه الحمض النووي ، والتي تم الإبلاغ عنها في الدراسة السابقة 25.

كما هو موضح في الشكل 2، تم تحليل الاختلافات في التعبير ID1 mrna بين الورم والانسجه الطبيعية في أنواع متعددة من السرطان باستخدام قاعده بيانات ONCOMINE ، والتي تحتوي علي ما مجموعه 445 تحليلات فريدة من نوعها. كانت هناك 5 دراسات التي كشفت ان مستوي التعبير mRNA من ID1 كان اعلي بكثير في الانسجه الطبيعية من في انسجه سرطان الثدي. وأشارت هذه البيانات إلى التعبير تقلبات من ID1 في سرطان الثدي. واظهر الشكل 3 أفضل الجينات النسبية الايجابيه والسلبية من ID1 من التحليل الذي اجري في Bc-GenExMiner الإصدار 4.0. لتحديد الارتباط بين التعبير mRNA ID1 والمعلمات السريرية للمرضي BC ، تم استخدام قاعده بيانات bc-GenExMiner الإصدار 4.0 التحليل. كما هو مبين في الشكل 4، وقد وجدت زيادة كبيره في مستوي MRNA من ID1 في مرضي سرطان الثدي دون الانبثاث العقدة الليمفاوية ، بالمقارنة مع تلك التي مع العقدة الليمفاوية الانبثاث (P= 0.0005). وعلاوة علي ذلك ، اظهر التحليل في GOBO ان زيادة مستويات mRNA من ID1 كانت مرتبطة بانخفاض درجه الورم (الشكل 5، P< 0.00001). وتضمنت هذه النتائج ان زيادة التعبير عن ID1 ارتبطت بانخفاض القدرة المنتشرة وانخفاض الصف المرضي في BC. وأشار التحليل من قاعده بيانات قبل الميلاد-GenExMiner الإصدار 4.0 إلى ان مستوي mRNA اعلي من ID1 كان مرتبطا لفتره أطول بعيده المدى البقاء خاليه من الانبثاث (DMFS) في مرضي سرطان الثدي (الشكل 6, HR = 0.82, 95% CI: 0.73-0.92, P= 0.001). باستمرار ، والتحليل من أطلس البروتين البشري اقترح ان مستوي البروتين مرتفعه من ID1 ارتبطت مع أفضل نتيجة البقاء علي قيد الحياة في مرضي سرطان الثدي (الشكل 7، P= 0.0389). واظهر تحليل البقاء علي قيد الحياة من كابلان-ماير راسمه أيضا ان مستوي mRNA اعلي من التعبير ID1 توقع أفضل بقاء خاليه من تكرار (RFS) في مرضي سرطان الثدي (الشكل 8, HR = 0.81, P= 0.00023).

Figure 1
الشكل 1 نظره عامه علي استكشاف أنماط التعبير وقيم نذير من العلامات الحيوية سرطان الثدي متميزة واختيار قواعد البيانات علي الإنترنت. واجري التحليل المنهجي لسرطان الثدي متميزة العلامات البيولوجية خطوه بخطوه في مجموعه متنوعة من قواعد البيانات. أولا ، نمط التعبير من جين الفائدة في العينات السرطانية مقابل العينات العادية. ثم ، تم تنفيذ الارتباط التعبير من الجينات الاهتمام في سرطان الثدي. وبعد ذلك ، كانت ملامح التعبير من ID1 الطبقية وفقا لمختلف. أخيرا, الارتباط بين ID1 تعبير وبقاء خارجا كان حللت. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 2
الشكل 2 نمط التعبير mRNA من ID1 في أنواع مختلفه من سرطان الإنسان. تم تحليل التعبير mRNA ID1 مع قاعده بيانات ONCOMINE. وقد اظهر الرسم أرقام مجموعات البيانات التي لها دلاله احصائيه علي التعبير الفوقي (الأحمر) أو التعبير المنظم (الأزرق) للجينات المستهدفة. ويمثل الرقم الموجود في كل خليه عدد التحليلات التي تستوفي العتبة داخل أنواع التحليل والسرطان هذه. حللت المورثة رتبه كان بنسبه مئوية من الهدف مورثه في الأعلى من كل مورثات يقاس في كل بحث. تم تحديد لون الخلية من قبل أفضل رتبه الجينات المئوية للتحليلات داخل الخلية. تم اعداد القيمة P في 0.01 وتم تعريف تغيير الطي علي انه 2 ، كما هو موضح في الإطار الأحمر. وقد تم تعديل هذا الرقم من الدراسة السابقة25. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 3
الشكل 3 الجينات الارتباط تحليل ID1 في bc-جينيكمينر الخامس 4.0. الارتباط التعبير mRNA من ID1 والجينات ذات الصلة في 5, 696 المرضي سرطان الثدي في 36 الدراسات التي حللت في bcGenExMiner v 4.0. وقد تم تعديل هذا الرقم من الدراسة السابقة25. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 4
الشكل 4 العلاقة بين التعبير ID1 وحاله الانبثاث العقدة الليمفاوية. مستوي التعبير mRNA ID1 في 4, 307 المرضي الذين يعانون من سرطان الثدي مع مختلف الغدد الليمفاوية (LN) وضع تحليلها في bcGenExMiner الإصدار 4.0. وقد تم تعديل هذا الرقم من الدراسة السابقة25. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 5
الشكل 5 العلاقة بين مستوي التعبير الجيني لID1 ودرجه الورم. تم تحليل مستوي التعبير mRNA من ID1 في مرضي سرطان الثدي مع الصف المرضية المختلفة في GOBO. وقد تم تقييم الفرق الكبير العالمي بين المجموعات لتوليد القيم pواعتبر ال< 0.05 للاشاره إلى وجود فرق كبير إحصائيا. 1 ، 2 ، 3 في x-محور الوقوف للمجموعات الفرعية من المرضي في الصف المرضي المختلفة 1 ، الصف 2 ، الصف 3. وقد تم تعديل هذا الرقم من الدراسة السابقة 25. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 6
الشكل 6 القيم النذيره لل ID1 للبقاء بعيدا الانبثاث خاليه من البقاء علي قيد الحياة في مرضي سرطان الثدي. تم تحليل الارتباط بين مستويات ID1 mRNA وبعيده الانبثاث خاليه من تقديرات البقاء علي قيد الحياة في bcGenExMiner الإصدار 4.0. وقد تم تعديل هذا الرقم من الدراسة السابقة25. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 7
الشكل 7 احتمال بقاء ID1 في مرضي سرطان الثدي.  تم تحليل تاثير مستوي البروتين ID1 لبقاء المرضي الذين يعانون من سرطان الثدي في أطلس البروتين البشري (HPA). وقد تم تعديل هذا الرقم من الدراسة السابقة25. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 8
الشكل 8 القيم النذيره لID1 في سرطان الثدي وفقا لبقاء المتكررة الحرة (RFS). ID1 مختلفه مستوي mRNA في جميع المرضي الذين يعانون من سرطان الثدي 3, 951 تحليلها في كابلان ماير الراسمة. وقد تم تعديل هذا الرقم من الدراسة السابقة25. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

وقد يشير التحليل الشامل لقواعد البيانات العامة إلى الوظيفة الاساسيه لجين الاهتمام ويكشف عن الصلة المحتملة بين هذه الجينات والمعلمات الباثولوجية في السرطان المحدد27،31. وقد يوفر الاستكشاف والتحليل القائم علي قاعده بيانات واحده وجات نظر محدوده أو منعزلة بسبب التحيز المحتمل في الاختيار ، أو بدرجه معينه ، ربما بسبب تنوع نوعيه البيانات ، بما في ذلك جمع البيانات والخوارزميه التحليلية قاعده البيانات19. واهم خطوه في هذا البروتوكول هي اختيار قواعد البيانات المناسبة التي ينبغي ان يعترف بها علي نطاق واسع عدد أكبر من العلماء ذوي التمثيل الكافي. وينبغي للمحقق ان يستخدم قواعد بيانات متعددة لاختبار الفرضية والتثبت من النتائج المستمدة من قواعد بيانات مختلفه ، بدلا من استخدام قاعده بيانات واحده.

البروتوكول الموصوف هنا هو اجراء عمليه وديه للمحقق. ميزه هذا الأسلوب هو انه يسمح للرؤية السريعة وتفسير دور الجينات المحتملة في سرطان الثدي. وعلاوة علي ذلك ، يمكن اختبار جميع النتائج التي تم الحصول عليها من خلال هذا الاجراء علي الفور وتكرارها ببساطه عن طريق الاستعلام عن المواقع المقابلة. والحد من هذه الطريقة هو ان الاستنتاجات التي تاتي من التحليل الشامل لقواعد البيانات قد لا تعكس بالبالضبط الوظيفة الفعلية أو العلاقة في الوضع السريري. وهذا يمكن ان تنبع من التحيز المنهجي لقاعده البيانات ، وفي بعض الحالات ، ربما بسبب عدم كفاية حجم العينة32،33. باستخدام أكثر من قاعده بيانات واحده للاستعلام عن نفس السؤال البحثي يمكن ان تؤكد بشكل متبادل النتائج وزيادة مصداقية الاستنتاج34. ويوصي بشده باستخدام عينات من مؤسسه المحقق للتحقق من النتائج ، أو إذا كان ذلك ممكنا ، لاجراء التجارب الاساسيه ذات الصلة لاختبار النتائج.

المزيد والمزيد من الإنترنت السرطان الجينوم أو قواعد البيانات بروتيميميكس ستكون متاحه ويمكن الوصول اليها للباحثين35،36. قد يوفر البروتوكول طريقه فعاله واقتصاديه للباحث لتحديد الجينات المستهدفة المحتملة ومسار الإشارات المرتبطة بها من خلال التحليل المتعمق لقواعد البيانات علي الإنترنت وباستخدام الجينوم ، والنسخ ، والجينوم النهج.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

المؤلفون ليس لديهم ما يكشفون عنه

Acknowledgments

وقد دعم هذا العمل جزئيا مؤسسه العلوم الطبيعية في مقاطعه قوانغدونغ ، الصين (No. 2018A030313562) ، مشروع إصلاح التعليم في قاعده قوانغدونغ للتدريس السريري (رقم.  2016JDB092) ، المؤسسة الوطنية للعلوم الطبيعية في الصين (81600358) ، ومشروع المواهب المبتكرة للشباب من الكليات والجامعات في مقاطعه قوانغدونغ ، الصين (رقم 2017KQNCX073)

Materials

Name Company Catalog Number Comments
A personal computer or computing device with an Internet browser with Javascript
enabled
Microsoft 051690762553 We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above
Adobe Flash player Adobe Systems Inc. It can be freely downloaded from http://get.adobe.com/flashplayer/. This browser plug-in is required for visualizing networks on the network
analysis tab.
Chrome Broswer Google Inc. It can be freely downloaded from https://www.google.cn/chrome/ This is necessary for viewing PDF files including the Pathology Reports and many of
the downloadable files.
Java Runtime Environment Oracle Corporation It can be downloaded from http://www.java.com/getjava/.
Office 365 ProPlus for Faculty Microsoft 2003BFFD8117EA68 This is necessary for viewing the Pathology Reports and for viewing many of
the downloadable files.
Vectr Online Vectr Labs Inc. It can be freely used from https://vectr.com/new This is necessary for visualizing and editing many of
the downloadable files and pictures.

DOWNLOAD MATERIALS LIST

References

  1. van 't Veer, L. J., et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 415 (6871), 530-536 (2002).
  2. Loi, S., et al. Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade. Journal of Clinical Oncology. 25 (10), 1239-1246 (2007).
  3. Cancer Genome Atlas, N. Comprehensive molecular portraits of human breast tumours. Nature. 490 (7418), 61-70 (2012).
  4. Emerson, J. W., Dolled-Filhart, M., Harris, L., Rimm, D. L., Tuck, D. P. Quantitative assessment of tissue biomarkers and construction of a model to predict outcome in breast cancer using multiple imputation. Cancer Informatics. 7, 29-40 (2009).
  5. Yu, H., et al. Integrative genomic and transcriptomic analysis for pinpointing recurrent alterations of plant homeodomain genes and their clinical significance in breast cancer. Oncotarget. 8 (8), 13099-13115 (2017).
  6. He, W., et al. TCGA datasetbased construction and integrated analysis of aberrantly expressed long noncoding RNA mediated competing endogenous RNA network in gastric cancer. Oncology Reports. , (2018).
  7. Liu, J., et al. An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics. Cell. 173 (2), e411 400-416 (2018).
  8. Esgueva, R., et al. Next-generation prostate cancer biobanking: toward a processing protocol amenable for the International Cancer Genome Consortium. Diagnostic Molecular Pathology. 21 (2), 61-68 (2012).
  9. Joly, Y., Dove, E. S., Knoppers, B. M., Bobrow, M., Chalmers, D. Data sharing in the post-genomic world: the experience of the International Cancer Genome Consortium (ICGC) Data Access Compliance Office (DACO). PLoS Computational Biology. 8 (7), e1002549 (2012).
  10. Zhang, J., et al. International Cancer Genome Consortium Data Portal--a one-stop shop for cancer genomics data. Database (Oxford). 2011, bar026 (2011).
  11. Rhodes, D. R., et al. ONCOMINE: a cancer microarray database and integrated data-mining platform. Neoplasia. 6 (1), 1-6 (2004).
  12. Rhodes, D. R., et al. Oncomine 3.0: genes, pathways, and networks in a collection of 18,000 cancer gene expression profiles. Neoplasia. 9 (2), 166-180 (2007).
  13. Jezequel, P., et al. bc-GenExMiner: an easy-to-use online platform for gene prognostic analyses in breast cancer. Breast Cancer Research and Treatment. 131 (3), 765-775 (2012).
  14. , Available from: http://co.bmc.lu.se/gobo/gsa.plb (2018).
  15. Ringner, M., Fredlund, E., Hakkinen, J., Borg, A., Staaf, J. GOBO: gene expression-based outcome for breast cancer online. PLoS One. 6 (3), e17911 (2011).
  16. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  17. Ponten, F., Schwenk, J. M., Asplund, A., Edqvist, P. H. The Human Protein Atlas as a proteomic resource for biomarker discovery. Journal of Internal Medicine. 270 (5), 428-446 (2011).
  18. Gyorffy, B., et al. An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients. Breast Cancer Research and Treatment. 123 (3), 725-731 (2010).
  19. Stevinson, C., Lawlor, D. A. Searching multiple databases for systematic reviews: added value or diminishing returns? Complementary Therapies in Medicine. 12 (4), 228-232 (2004).
  20. Yin, J., et al. Integrating multiple genome annotation databases improves the interpretation of microarray gene expression data. BMC Genomics. 11, 50 (2010).
  21. Patel, D., Morton, D. J., Carey, J., Havrda, M. C., Chaudhary, J. Inhibitor of differentiation 4 (ID4): From development to cancer. Biochimica et Biophysica Acta. 1855 (1), 92-103 (2015).
  22. Kamalian, L., et al. Increased expression of Id family proteins in small cell lung cancer and its prognostic significance. Clinical Cancer Research. 14 (8), 2318-2325 (2008).
  23. Cruz-Rodriguez, N., et al. High expression of ID family and IGJ genes signature as predictor of low induction treatment response and worst survival in adult Hispanic patients with B-acute lymphoblastic leukemia. Journal of Experimental and Clinical Cancer Research. 35, 64 (2016).
  24. Yang, H. Y., et al. Expression and prognostic value of Id protein family in human breast carcinoma. Oncology Reports. 23 (2), 321-328 (2010).
  25. Zhou, X. L., et al. Prognostic values of the inhibitor of DNAbinding family members in breast cancer. Oncology Reports. 40 (4), 1897-1906 (2018).
  26. , Available from: https://www.oncomine.org (2018).
  27. Lin, H. Y., Zeng, L., iang, Y. K., Wei, X. L., Chen, C. F. GATA3 and TRPS1 are distinct biomarkers and prognostic factors in breast cancer: database mining for GATA family members in malignancies. Oncotarget. 8 (21), 34750-34761 (2017).
  28. , Available from: http://bcgenex.centregauducheau.fr/BCGEM/GEM-requete.php (2018).
  29. , Available from: https://www.proteinatlas.org (2018).
  30. , Available from: http://kmplot.com/analysis (2018).
  31. Zhu, Y. F., Dong, M. Expression of TUSC3 and its prognostic significance in colorectal cancer. Pathology-Research and Practice. 214 (9), 1497-1503 (2018).
  32. Nelson, J. C., et al. Validation sampling can reduce bias in health care database studies: an illustration using influenza vaccination effectiveness. Journal of Clinical Epidemiology. 66 (8 Suppl), S110-S121 (2013).
  33. Haibe-Kains, B., Desmedt, C., Sotiriou, C., Bontempi, G. A comparative study of survival models for breast cancer prognostication based on microarray data: does a single gene beat them all? Bioinformatics. 24 (19), 2200-2208 (2008).
  34. Yang, C., et al. Understanding genetic toxicity through data mining: the process of building knowledge by integrating multiple genetic toxicity databases. Toxicology Mechanisms and Methods. 18 (2-3), 277-295 (2008).
  35. Cannata, N., Merelli, E., Altman, R. B. Time to organize the bioinformatics resourceome. PLoS Computational Biology. 1 (7), e76 (2005).
  36. Wren, J. D., Bateman, A. Databases, data tombs and dust in the wind. Bioinformatics. 24 (19), 2127-2128 (2008).

Tags

أبحاث السرطان العدد 147 سرطان الثدي المؤشرات الحيوية قاعده بيانات استخراج البيانات التشخيص المعلومات البيولوجية
أداء استخراج البيانات والتحليل التكاملي لمؤشر الحيوية في سرطان الثدي باستخدام قواعد بيانات متعددة يمكن الوصول اليها علنا
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Chen, M. n., Zeng, D., Zheng, Z. q., More

Chen, M. n., Zeng, D., Zheng, Z. q., Li, Z., Wu, J. l., Jin, J. y., Wang, H. j., Huang, C. z., Lin, H. y. Performing Data Mining And Integrative Analysis Of Biomarker in Breast Cancer Using Multiple Publicly Accessible Databases. J. Vis. Exp. (147), e59238, doi:10.3791/59238 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter