Summary
تحليلات بصرية (VA) هو نهج جديد من تحليل البيانات بشكل تفاعلي. في هذا الفيديو ، نناقش مشكلة الزائد البيانات الناتجة عن الإنتاجية العالية التجارب البيولوجية ، واقتراح VA كحل لمشكلة من هذا القبيل. شريط الفيديو يظهر تحليل داخل وبين مجموعات البيانات المناعية باستخدام أداة تسمى VA تابلوه.
Abstract
وقد ظهرت تحليلات بصرية (VA) بوصفه وسيلة جديدة لتحليل بيانات كبيرة من خلال العرض المرئي التفاعلي. أثبتنا فائدة ومرونة نهج VA في تحليل قواعد البيانات البيولوجية. أمثلة من هذه المجموعات في علم المناعة وتشمل التدفق الخلوي ، والبيانات Luminex ، والتنميط الجيني (على سبيل المثال ، تعدد الأشكال النوكليوتيدات واحد) البيانات. خلافا لنهج المعلومات التصور التقليدي ، VA استعادة السلطة في أيدي تحليل المحلل المحلل بالسماح للانخراط في الوقت الحقيقي عملية التنقيب عن البيانات. اخترنا البرنامج VA دعا تابلوه بعد تقييم VA أدوات عدة. وقد برهنت على نوعين من التحليل تحليل المهام داخل وبين قواعد البيانات في عرض الفيديو باستخدام هذا النهج دعا تحليل المقترنة. تحليل مقترن ، على النحو المحدد في فرجينيا ، هو نهج التحليل الذي خبير VA أداة تعمل جنبا إلى جنب مع خبراء المجال أثناء التحليل. الخبير المجال هو ذاك الذي يدرك أهمية البيانات ، ويطلب من الأسئلة التي قد تعالج البيانات التي تم جمعها. الخبير أداة ثم يخلق تصورات للمساعدة على إيجاد أنماط في البيانات التي قد تجيب على هذه الأسئلة. على المدى القصير الفجوة الزمنية بين الجيل فرضية وعرض سريع للبيانات البصرية هي الميزة الرئيسية للنهج فرجينيا.
Protocol
1. استكشاف يستند التحليل على تابلوه
- لديك مجموعة البيانات وترغب في استكشاف العلاقات المختلفة بين الأعمدة داخل البيانات.
- (الشكل 1) استيراد ورقة العمل من خلال النقر على "اتصال بيانات". اختيار نوع مصدر البيانات واتباع التعليمات لاستيراد مجموعة البيانات الخاصة بك.
- (الشكل 1) تأكد من أن يحتوي على أعمدة الجرف أبعاد القاطع في حين جرف التدابير يحتوي على أعمدة من مجموعة البيانات الرقمية الخاصة بك. أحيانا قد يتم سرد عمود البعد مثل معرف الموضوع ، كما في حالة قياس محصاة عليه. تغييره إلى أبعاد بالنقر بزر الفأرة الأيمن عليه واختر "تحويل إلى البعد". في الشكل 1 ، يتم وضعها بشكل صحيح أعمدة القاطع من ورقة العمل مثل مستوى تركيز التحفيز ومعرفات الموضوع في الجرف الأبعاد ، ويتم وضعها بشكل صحيح لوحظ تركيز من السيتوكينات في الجرف التدابير.
- (الشكل 2) إذا كان أثناء عملية التحليل ، لا بد من حقل محسوب ، ببساطة انقر على الحق في أي أبعاد أو الجرف التدابير ، وحدد "إنشاء حقل محتسب. مدخلات العملية الحسابية في خانة الصيغة مع الحقول جنبا إلى جنب مع المهام أو العمليات الحسابية. الشكل 2 يوضح كيفية إنشاء حقل جديد يسمى PFD> 2 بتجميع PFD2 ، PFD3 والقيم PFD4.
- (الشكل 3) انتج مؤامرة 2 - D في تابلوه ، وعادة مع البعد وعلى قدر من الفائدة. منذ واجهة بسيطة تقدم السحب والإفلات التفاعل ، يمكن اختيار وقياس البعد تغييرها بسهولة. عادة ما يتم وضعها في الرف أبعاد الأعمدة ، والتدابير في الجرف الصفوف. في الشكل 3 ، ويحتوي على الرف أبعاد التحفيز مستوى التركيز ، والجرف يحتوي على تدابير لاحظ مستوى تركيز السيتوكينات.
- (الشكل 3) إلى التفريق بين التصور من خلال البعد محددة ، والمكان الذي تسمية البعد في الجرف النص أو اللون أو الحجم ، اعتمادا على طبيعة البعد. الجرف النص محاولات التفريق البيانات في التصور وذلك عبر تسمية لهم المعلومات النصية التي قدمتها البعد المحدد. وسوف اللون والحجم الجرف تفرق البيانات تلقائيا حسب اللون والحجم ، والتي يمكن تعديلها مع شريط التمرير الموجود في أسفل كل رف. في الشكل 3 ، واضعا في الجرف اللون الوراثي يؤدي إلى فصل من ثلاثة المورثات بواسطة ألوان متميزة.
- (الشكل 3) تصفية التصور من متغيرات معينة في العمود البعد الآخر. يمكن القيام بذلك عن طريق سحب التسمية البعد في الجرف التصفية. سوف تظهر نافذة مع قائمة من القيم للاختيار من بينها. وسوف يتم تحديد قيمة القيم الوحيدة المتبقية في التصور.
- (الشكل 4) يجوز لك الجمع بين التصور مع البعد الآخر أو تدبير لإنتاج مصفوفة من التصور. ويمكن القيام بذلك عن طريق اسقاط أبعاد متعددة في الجرف الأعمدة ، واتخاذ تدابير متعددة في الجرف الصفوف. ويتضمن الشكل 4 مثالا على عمودين من خلال وضع تصور مصفوفة بعدين مختلفين في الجرف الأعمدة.
- لإنتاج لوضع تصور مماثل ، انقر على الحق في الورقة الحالية من ناحية الزاوية السفلى اليسرى ، واختيار "ورقة مكررة.
- تكرار عملية تحليل لتحديد اتجاهات مثيرة للاهتمام أو القيم المتطرفة التي قد تساعدك على توليد فرضية جديدة حول البيانات.
- لديك مجموعة بيانات متعددة ولدت من نفس المصدر ، وترغب في استكشاف احتمال وجود صلة بين هذه المجموعات.
- مكان قواعد البيانات متعددة في نفس المصدر ، أي مكان اثنين جداول البيانات في نفس المصنف ، للسماح للاتصال تابلوه هذه مجموعة البيانات من خلال الاتصال نفسه.
- الشكل (5) الاتصال من خلال انضمام مجموعات البيانات المنطقية من القيم الأساسية ، والتأكد من أن يتم تحديد الأبعاد التي هي نفسها بالنسبة للمجموعات البيانات متعددة. في الشكل (5) ، وهناك خمسة القيم الأساسية للانضمام : نوع من الخلايا ، التحفيز مستوى التركيز ، ومرحلة أو مجموعة ، التحفيز ، وتخضع المعرف.
- إجراء تحليل مماثل للقسم 1.1.
2. العرض القائم على الاحتياجات
- كنت تعرف العلاقات بين البيانات ، ولكن أردت أن تكون قادرة على توليد بسرعة لائحة تصورات لاستخدامها في العرض.
- متابعة بروتوكول المبينة في القسم 1.1 ، وتعليم والمرئيات وفقا لذلك.
- استخدام وظيفة التصدير في تابلوه لإنتاج صور من تصورات.
- كنت قد ولدت مجموعة من المرئيات القوية في المصنف تابلوه وتريد حصة هذا المصنف.
- حفظ المصنف ك مصنف حزم تابلوه وحصة هذا الملف.
- يمكن لزملاء العمل دون سطح اللوحة تنزيل قارئ تابلوه لفتح المصنف تعبئتها. قارئ اللوحة يسمح زملائك على التفاعل مع تصورات التي قمت بإنشائها.
3. الممثل النتائج
الشكل 1. لقطةلوحة بعد استيراد جدول اسمه NFKBIA من demo.xls ملف Excel. وكانت مأهولة بالسكان بشكل صحيح أبعاد والرفوف التدابير مع البيانات الفئوية والعددية ، على التوالي.
الشكل 2. تم استدعاء إطار حقل محتسب لإنشاء حقل محسوب خاصة لاستخدامها في اللوحة. القائمة على المربع الأيسر السفلي يساعد على تحديد المجالات الممكنة ، والقائمة على الجانب الأيمن يحتوي على الاختصار من الوظائف التي يمكن استخدامها في الصيغة. في هذا المثال ، أردنا إضافة قيم PFD3 ، وPFD4 PFD2 للحصول على القيمة النهائية التي نشير إليها ك 2> PFD
الشكل 3. التصور من مستوى تركيز الحوافز مقابل وحظ تركيز خلوى. التصور يبين مؤامرة من مستويات تركيز مختلفة من التحفيز 3M - 002 ضد لوحظ من تركيز خلوى TNF - α. ألوان خطوط الرجوع إلى المورثات مختلفة لتعدد الأشكال النوكليوتيدات واحد في الجين NFKBIA من الأفراد في دراستنا المناعة الفطرية.
الشكل 4. لقطة لمصفوفة التصور عمودين. ولدت لدينا مصفوفة عمودين لتسهيل المقارنة جنبا إلى جنب من الاستجابات لاثنين من المحفزات ، 3M - 003 وLPS. في العاشر من محاور هي مستويات تركيز مختلفة من المحفزات اثنين ، والمؤامرات محور y قيم الحقل المحسوب ، PFD> 2.
الشكل 5. هذه النوافذ الحوار وحة توضح كيفية توصيل البيانات المسجلة في جداول مختلفة. ويمكن تحقيق ربط البيانات من جداول مختلفة عن طريق الجمع بين هذه البنود باستخدام المنطقي الانضمام للقيم الأساسية.
التصور والتحليل أداة | ||||||||||
وظيفة | اللوح | VIS - STAMP | xmdvtool | GGobi | مضاء بالنجوم | Gapminder | Visulab | أدوات InfoVis | Geotime | إلهام |
تنسيق موازية المؤامرات | نعم | نعم | نعم | نعم | نعم | لا | نعم | نعم | لا | لا |
مصفوفات مؤامرة مبعثر | نعم | لا | نعم | نعم | نعم | لا | نعم | لا | لا | لا |
تخفيض الأبعاد | لا | لا | نعم | نعم | لا | لا | لا | لا | لا | لا |
الأبعاد الزمانية | نعم | نعم | لا | نعم | نعم | نعم | لا | نعم | نعم | لا |
الأبعاد الجغرافية المكانية | نعم | نعم | لا | لا | نعم | نعم | لا | لا | نعم | لا |
النص التعدين | لا | لا | لا | لا | نعم | لا | لا | لا | لا | نعم |
المباشرة ومعالجة البيانات | نعم | نعم | نعم | نعم | نعم | نعم | نعم | لا | نعم | لا |
تصفية | نعم | نعم | نعم | نعم | نعم | نعم | نعم | لا | نعم | نعم |
التمدد إلى منصات أخرى (على سبيل المثال ، R) | نعم | لا | نعم | نعم | لا | نعم | لا | نعم | لا | لا |
تنسيقات CSV الجدول | نعم | نعم | نعم | نعم | لا | لا | نعم | نعم | نعم | لا |
XML نماذج البيانات | نعم | لا | لا | نعم | نعم | لا | نعم | نعم | نعم | لا |
تستطيع أن تتعامل مع 10000 + الصفوف | نعم | لا | لا | لا | نعم | لا | لا | لا | لا | نعم |
توثيق | نعم | نعم | نعم | نعم | نعم | نعم | نعم | نعم | نعم | نعم |
المنتجات التجارية | نعم | لا | لا | لا | نعم | لا | لا | لا | نعم | نعم |
الجدول 1. قائمة من الأدوات التحليلية والبصرية وبعض خصائصها.
Subscription Required. Please recommend JoVE to your librarian.
Discussion
أدى ظهور الإنتاجية العالية التكنولوجيا في البحوث الطبية الحيوية الحديثة في انفجار بيانات البحوث التي تتطلب طريقة أكثر فعالية من التحليل. تحليلات بصرية (VA) هو علم المنطق التحليلي ييسرها واجهات البصرية التفاعلية (1). نهج VA يستعيد السلطة التحليلية في يد المحلل الإنسان ، على العكس من النهج التقليدي للكشف عن أنماط بواسطة الكمبيوتر. وقد تم تطبيق التحليل البصري للبحث في مختلف المجالات ، مثل مجال الدفاع (1) والاتجاهات الإعصار (2). حتى الآن ، لا يوجد سوى بضعة أمثلة من التطبيقات في مجال البيولوجيا VA (3). أثبتنا في هذه المقالة الفيديو التي VA هو النهج الذي يمكن أن تضاف إلى ترسانة من الأحياء أدوات التحليل. VA برامج كثيرة متوفرة بدءا من تلك التي هي في طور التنمية في المختبرات الأكاديمية لتلك التي هي متوفرة تجاريا. لعملنا على مناعة الفطرية الوليد (4) ، اخترنا تابلوه بسبب صلاحيتها في تحليل البيانات على غرار قواعد البيانات المتوفرة في المختبر. أدوات أخرى قد VA ، وبعضها ذكرنا في المادة لدينا شريط فيديو ، أن يكون أكثر ملائمة لأنواع أخرى من البيانات البيولوجية. سرد لنا وظائف وخصائص بعض الأدوات VA أكثر شعبية في الجدول 1. وليس المقصود من هذه القائمة أن تكون شاملة ، لأنها خارجة عن نطاق دراستنا ، لكن يجب أن يكون نقطة انطلاق جيدة للعلماء لتحديد الأداة المناسبة VA لمجموعات البيانات الخاصة بهم.
هناك نقطتين رئيسيتين حول VA التي نود تسليط الضوء عليها. واحد ، والمقصود نهج VA باعتبارها عملية الاستكشاف عن طريق مساعدة المحلل بسرعة أنماط بقعة مثل الاتجاهات العامة والقيم المتطرفة في البيانات. المحور الرئيسي لVA هو توفير تقنية التصور قوية لمجموعات البيانات الكبيرة. انها ليست بديلا عن التحليل الإحصائي. في الواقع ، هي محدودة جدا معظم الأدوات VA في قدرتها على أداء والتحليل الإحصائي على الرغم من أننا نتوقع أن يتغير ذلك في المستقبل القريب. النقطة الثانية أننا نريد أن نذكر أن البيانات السابقة للتجهيز مسبق لاستيراد مجموعة البيانات إلى أداة VA أمر حاسم لنجاح التحليل. نضع في اعتبارنا أن البيانات الواردة في الشكل البشري قابل للقراءة في جداول مختلفة في بعض الأحيان من شكل مقروء آليا. ويمكن تجهيز البيانات قبل أن تكون خطوة تستغرق وقتا طويلا ، وتتطلب في كثير من الأحيان تحول هائلة من البيانات ، إذا كان الشكل الأصلي للبيانات ليست مناسبة إلى أداة مساعدة الضحايا. نحن نوصي بشدة على التخطيط الدقيق لإدخال البيانات وترميز للسماح للتحميل مرنة وفعالة لتحليل المصب أدوات البرمجيات مثل تلك المتوفرة في فرجينيا.
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
الإعلان عن أي تضارب في المصالح.
Acknowledgments
نود أن نشكر أعضاء معهد فانكوفر التحليلات البصرية (فيفا) لتقديم التعليقات والمشورة للمشروع. على وجه الخصوص ، نود أن نشكر جون الشبت ، برايان فيشر ، وDarvill ديفيد. نود أيضا أن نشكر أعضاء المختبر Kollmann لما قدموه من دعم ومناقشات مفيدة. وأيد هذا العمل في جزء من المعهد الوطني للحساسية والأمراض المعدية ، المعهد الوطني للصحة منح N01 AI50023 ؛ المنح NCE حساسية A1A 07 - 07 وB2B ؛ ومايكل سميث مؤسسة للبحوث الصحية. ويدعم TRK جزئيا على جائزة شهادة في العلوم الطبية الحيوية من إعلان صندوق بوروز ويلكوم من قبل المعاهد الكندية لأبحاث الصحة الكندية منح تدريبية في برنامج الصحة عالم الطفل الطبيب ، في شراكة مع أطفال المرضى ، مؤسسة الطفل والأسرة معهد بحوث ( كولومبيا البريطانية) ، والمرأة والطفل الصحة معهد بحوث (البرتا) ، ومانيتوبا معهد صحة الطفل.
References
- Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
- Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
- Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
- Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).