معلومة

كيفية استرداد التعبير المنطقي (على أساس KO) لردود الفعل من KEGG؟


يمكن بسهولة التحقق مما إذا كانت الوحدة النمطية مكتملة أم لا من خلال تقييمتعريفالدخول المرتبط بالوحدة ؛ على سبيل المثال في الوحدة النمطية M00010 ، يتم إعطاؤها بواسطة

التعريف K01647 (K01681، K01682) (K00031، K00030)

والتي يمكن ترجمتها إلى

K01647 و (K01681 أو K01682) و (K00031 أو K00030)

إذا تم تقييم هذا التعبير إلىحقيقية، الوحدة كاملة.

الآن أنا أتساءل عما إذا كانت المعلومات التناظرية موجودة لرد فعل واحد. لذلك على سبيل المثال بالنسبة لـ R00352 ، يجد المرء المعلومات التالية حول تقويم العظام:

ولكن كيف أعرف الآن في أي علاقة منطقية هي KOs؟

لذلك يمكن أن يكون

K01648 و K15230 و K15231

أو

K01648 OR (K15230 و K15231)

وما إلى ذلك وهلم جرا.

هل يمكن استرجاع هذه المعلومات من KEGG وإذا كان الأمر كذلك ، فكيف؟

تعديل:

في المثال أعلاه ، سيكون التعبير الصحيح:

K01648 OR (K15230 و K15231)

يحتاج المرء إماK01648أو الوحدتين الفرعيتين الأخريين معًا. لذا ، لسوء الحظ ، ليس الأمر بالسهولة التي وصفهاaretaon في إجابته لأن وحدة واحدة فقط من الوحدتين الفرعيتين لن تكون كافية. لذلك لا يمكن للمرء فقط توصيل KOs المرتبطة برد فعل باستخدام منطقيأو.


لإعادة صياغة ما ذكرته بالفعل في سؤالك: لكي تكتمل وحدة KEGG (حتى يتمكن الكائن الحي من أداء وظيفة معينة) ، فأنت بحاجة إلى مجموعة معينة من الوحدات الوظيفية أو الإنزيمات. لذلك لتقييم قدرات كائن حي ، يمكنك التحقق من جينومه بحثًا عن تسلسل الجينات المتعلقة بالوحدة من خلال إجراء العملية المنطقية التي ذكرتها أعلاه.

تتكون الوحدة النمطية من مواد كيميائية (C) وتفاعلات (R) ، كما ترون في المثال الخاص بك. لشرح الاختلافات بين الوحدات والتفاعلات ، من الأفضل إلقاء نظرة على التفاعل الأخير ، Isocitrate إلى 2-Oxoglutarate. هناك ثلاثة تفاعلات محاصرة (أحدها مزيج من اثنين) تؤدي جميعها إلى Oxoglutarate. عندما تنظر إلى Orthology (الإنزيمات المعنية) للتفاعلات في المربع الأول (R01899 + R00268) والمربع الثاني (R00267) سترى أنه نفس الإنزيم (K0030) يؤدي تفاعلات مختلفة. يحتوي المربع الثالث الآن على تفاعل (R00709) يتم إجراؤه بواسطة إنزيم ثانٍ (K0031) ، والذي يقود بنفس الطريقة (يختلف في استخدام NAD + بدلاً من NADP + كمستقبل للإلكترون). لذلك لكي تكتمل الوحدة ، يمكنك استخدام أي من الاثنين (هذا هو سبب عامل التشغيل OR في العملية المنطقية).

إذا كنت تريد الآن تقييم ما إذا كان نوع معين من التفاعل يحدث في كائن حي معين ، فيكفي أن يكون لديك أحد الإنزيمات المحتملة التي تحفز هذا التفاعل. وبالتالي:

K01648 أو K15230 أو K15231

AlgaePath: تحليل شامل لمسارات التمثيل الغذائي باستخدام بيانات وفرة النسخ من تسلسل الجيل التالي في الطحالب الخضراء

تعد الطحالب نباتات غير وعائية مهمة لها العديد من التطبيقات البحثية ، بما في ذلك التنوع الكبير في الأنواع ، ومصادر الوقود الحيوي ، وامتصاص المعادن الثقيلة ، وبعد المعالجة ، يتم استخدامها كمكونات في المكملات الصحية. إن التوافر المتزايد لبيانات تسلسل الجيل التالي (NGS) لجينومات الطحالب والترانسكريبتومات قد جعل تطوير مورد متكامل لاسترداد بيانات التعبير الجيني والمسار الأيضي ضروريًا للتحليل الوظيفي وبيولوجيا الأنظمة. في أحد الموارد المتاحة حاليًا ، يتم عرض ملفات تعريف التعبير الجيني والمسارات البيولوجية بشكل منفصل ، مما يجعل من المستحيل البحث بسهولة في قواعد البيانات الحالية لتحديد آليات الاستجابة الخلوية. لذلك ، في هذا العمل ، تم تطوير قاعدة بيانات AlgaePath الجديدة لاسترداد ملفات تعريف وفرة النسخ بكفاءة في ظل ظروف مختلفة في العديد من المسارات الأيضية.

وصف

AlgaePath هي قاعدة بيانات على شبكة الإنترنت تدمج معلومات الجينات والمسارات البيولوجية ومجموعات بيانات NGS للطحالب الخضراء كلاميدوموناس رينهاردتي و Neodesmus sp. UTEX 2219-4. يمكن للمستخدمين البحث في قاعدة البيانات هذه لتحديد ملفات تعريف وفرة النص ومعلومات المسار باستخدام خمس صفحات استعلام (بحث الجينات ، بحث المسار ، البحث عن الجينات المعبر عنها تفاضليًا (DEGs) ، تحليل مجموعة الجينات ، وتحليل التعبير المشترك). بيانات وفرة نسخة من 45 وأربع عينات من C.reinhardtii و Neodesmus sp. يمكن الحصول على UTEX 2219–4 ، على التوالي ، مباشرة على خرائط المسار. يمكن تحديد الجينات التي يتم التعبير عنها بشكل تفاضلي بين شرطين باستخدام البحث عن الطيات. تتضمن صفحة تحليل مجموعة الجينات تحليل إثراء للمسار ، ويمكن استخدامها بسهولة لمقارنة ملفات تعريف وفرة النسخ للجينات ذات الصلة وظيفيًا على الخريطة. أخيرًا ، يمكن استخدام صفحة تحليل التعبير المشترك للبحث عن النصوص المعبر عنها بشكل مشترك للجين المستهدف. ستوفر نتائج عمليات البحث مرجعًا قيمًا لتصميم مزيد من التجارب ولتوضيح الآليات الحرجة من البيانات عالية الإنتاجية.

الاستنتاجات

تعد AlgaePath واجهة فعالة يمكن استخدامها لتوضيح آليات استجابة النص في مسارات التمثيل الغذائي المختلفة في ظل ظروف مختلفة. الأهم من ذلك ، يمكن تعدين AlgaePath لتحديد الآليات الحرجة بناءً على التسلسل عالي الإنتاجية. على حد علمنا ، يعد AlgaePath المورد الأكثر شمولاً لدمج العديد من قواعد البيانات وأدوات التحليل في الطحالب. يمكن الوصول إلى النظام مجانًا عبر الإنترنت على http://algaepath.itps.ncku.edu.tw.


الندوة الأوروبية الرابعة والعشرون حول هندسة العمليات بمساعدة الحاسوب

دومينيك فيركامين ،. جان فان إمبي ، في الهندسة الكيميائية بمساعدة الحاسوب ، 2014

2.1 شبكات التفاعل الأيضي

تمثل شبكة التفاعل الأيضي (مجموعة فرعية من) جميع التفاعلات الأيضية التي تحدث داخل الخلية (Van Impe et al. ، 2013). في هذه الشبكات ، مint داخل الخلايا و متحويلة ترتبط المستقلبات خارج الخلية ببعضها البعض من خلال ن التفاعلات ، والتي يمكن أن تكون تفاعلات داخل الخلايا أو تبادل ردود الفعل بين الخلية والبيئة. يتم تلخيص معدلات تفاعل هذه التفاعلات ، والتي تسمى التدفقات ، في (ن × 1) متجه التدفق الخامس [مول / (gDW ∙ ح)]. يتم تمثيل نمو الخلية كتفاعل زائف للكتلة الحيوية ، والتي يتم تعريفها على أنها مركب خارج الخلية ، ينتج متحويلة + 1 مستقلبات خارج الخلية في المجموع. يتم تصنيف جميع التفاعلات على أنها قابلة للعكس أو لا رجوع فيها ، بناءً على المعلومات الديناميكية الحرارية. يتم تمثيل كل هذه المعلومات بواسطة المصفوفة المتكافئة س، والذي يحتوي على معاملات التفاعل المتكافئ. يمكن تقسيم هذه المصفوفة إلىسint, ستحويلة و سالسيرة الذاتية، وهي الصف (الصفوف) المقابلة للمستقلبات داخل الخلايا وخارجها ، والكتلة الحيوية ، على التوالي.


ملخص المؤلف

التمثيل الغذائي الخلوي هو شبكة كبيرة ومعقدة. ومن ثم ، فإن التحقيقات في شبكات التمثيل الغذائي بمساعدة في السيليكو النمذجة والمحاكاة. يمكن اشتقاق شبكات التمثيل الغذائي من تسلسل الجينوم الكامل ، من خلال تحديد الإنزيمات الموجودة وربطها بالتفاعلات الكيميائية الرسمية. لتسهيل إعادة بناء نماذج التمثيل الغذائي على نطاق الجينوم (GEMs) ، قمنا بتطوير RAVEN 2.0. يمكن لمجموعة الأدوات المتنوعة هذه إعادة بناء GEMs بسرعة ، إما من خلال قواعد بيانات المسار الأيضي KEGG و MetaCyc ، أو من التماثل مع GEM الحالي. نظهر وظائف RAVEN من خلال توليد نموذج التمثيل الغذائي من Streptomyces coelicolor، وهي بكتيريا منتجة للمضادات الحيوية. مقارنة هذا من جديد تم إنشاء GEM باستخدام نموذج تم تنسيقه يدويًا مسبقًا يوضح أن RAVEN تلتقط معظم النموذج السابق ، وقمنا لاحقًا بإعادة بناء نموذج محدث من س. coelicolor: Sco4. بعد ذلك ، استخدمنا Sco4 للتنبؤ بأهداف واعدة للهندسة الوراثية ، والتي يمكن استخدامها لزيادة إنتاج المضادات الحيوية.

الاقتباس: Wang H ، Marcišauskas S ، Sánchez BJ ، Domenzain I ، Hermansson D ، Agren R ، et al. (2018) RAVEN 2.0: صندوق أدوات متعدد الاستخدامات لإعادة بناء الشبكة الأيضية ودراسة حالة حول Streptomyces coelicolor. بلوس كومبوت بيول 14 (10): e1006541. https://doi.org/10.1371/journal.pcbi.1006541

محرر: Christos A. Ouzounis، CPERI، اليونان

تم الاستلام: 9 مايو 2018 وافقت: 2 أكتوبر 2018 نشرت: 18 أكتوبر 2018

حقوق النشر: © 2018 وانج وآخرون. هذا مقال مفتوح الوصول يتم توزيعه بموجب شروط ترخيص Creative Commons Attribution License ، والذي يسمح بالاستخدام غير المقيد والتوزيع والاستنساخ في أي وسيط ، بشرط ذكر المؤلف والمصدر الأصليين.

توافر البيانات: معظم البيانات ذات الصلة موجودة داخل الورقة وملفات المعلومات الداعمة الخاصة بها. يمكن الوصول إلى ملفات معلومات الدعم أيضًا على: http://doi.org/10.6084/m9.figshare.6236903. يتوفر RAVEN Toolbox 2.0 مجانًا من https://github.com/SysBioChalmers/RAVEN. يتوفر نموذج Sco4 مجانًا من https://github.com/SysBioChalmers/Streptomyces_coelicolor-GEM.

التمويل: يقر المؤلفون بتمويل مشروع ERASysApp SYSTERACT المقدم من Västra Götalandsregionen (RUN 612-0436-15) ، http://www.vgregion.se/ وتمويل إضافي من مؤسسة Novo Nordisk ، http://novonordiskfonden.dk/ و مؤسسة كنوت وأليس والنبرغ ، https://kaw.wallenberg.org/. لم يكن للممولين أي دور في تصميم الدراسة أو جمع البيانات وتحليلها أو اتخاذ قرار النشر أو إعداد المخطوطة.

تضارب المصالح: وقد أعلن الباحثون إلى أن لا المصالح المتنافسة موجودة.


2. المواد والأساليب

2.1 الفئران

تم استخدام فئران B6D2F1 عمرها ثمانية إلى 10 أسابيع (Orient-Bio Inc) لجمع البويضات المتلقية وكمانحات SCNT. تم استخدام إناث الفئران البالغة من العمر ثمانية إلى 10 أسابيع كأمهات حاضنة في نقل الأجنة. للحث على الحمل الكاذب ، تم تزاوج هذه الفئران مع فئران ذكور مستأصلة من نفس السلالة. تمت الموافقة على بروتوكولات استخدام الحيوانات في هذه الدراسات من قبل لجنة رعاية الحيوان المؤسسية واستخدامها (IACUC) بجامعة CHA (رقم المشروع IACUC-170119 ، IACUC-180053 ، IACUC-190070) ، وتم تنفيذ جميع التجارب في وفقًا للبروتوكولات المعتمدة.

2.2 تحضير البويضات والخلايا النووية المانحة

تم تحضير كل من البويضات وخلايا الركام عن طريق الإباضة الفائقة من 8 إلى 10 أسابيع من الفئران الإناث B6D2F1. تم تحفيز الإباضة عن طريق الحقن المتسلسل 5 وحدة دولية من الجونادوتروبين في مصل الفرس الحامل (Sigma-Aldrich) ، متبوعًا بـ 5 وحدة دولية من موجهة الغدد التناسلية المشيمية البشرية (hCG ، Sigma-Aldrich) بفاصل 48 ساعة. تم جمع مجمعات البويضات الركامية (COCs) من قنوات البيض في وسط M2 (Sigma-Aldrich) بعد 14 ساعة من حقن قوات حرس السواحل الهايتية وعولجت بـ M2 التي تحتوي على 0.1 ٪ هيالورونيداز الخصية البقري (Sigma-Aldrich) للحصول على خلايا الركام المنفصلة والبويضات. تم بعد ذلك زراعة البويضات الخالية من الركام في وسط محسن بوتاسيوم بسيط (KSOM Millipore) عند 37 درجة مئوية تحت 5 ٪ من ثاني أكسيد الكربون.2 حتى مزيد من الاستخدام. تم فصل خلايا الركام المشتتة عن طريق معالجة الهيالورونيداز ، وتم تخفيفها في وسط M2 وجمعها. تم بعد ذلك إعادة تعليق الحبيبات في حجم صغير من البولي فينيل بيروليدون (PVP) في وسط M2 في غرفة مناور.

2.3 إعداد Kdm4a مرنا

تم إجراء النسخ في المختبر كما هو موضح سابقًا. 27 بإيجاز ، فأر كامل الطول كدم 4 ا / جضمع تم استنساخ (كدنا) في بلازميد pcDNA3.1 يحتوي على بولي (A) 83 في نهاية 3 من موقع الاستنساخ باستخدام مجموعة In-Fusion Kit (# 638909 ، Clonetech). تم تصنيع Messenger RNA من بلازميدات القالب الخطي عن طريق النسخ في المختبر باستخدام مجموعة mMESSAGE mMACHINE T7 Ultra Kit (# AM1345 ، تقنيات الحياة). تم إذابة الرنا المرسال المركب في الماء الخالي من نوكلياز. تم قياس تركيز mRNA باستخدام مقياس الطيف الضوئي NanoDrop ND-1000 (NanoDrop Technologies) تم تخزين أجزاء من mRNA عند درجة حرارة -80 درجة مئوية حتى الاستخدام.

2.4 إجراء Mouse SCNT وعلاج RS-1

تم استئصال جميع البويضات في مرحلة MII ذات الأجسام القطبية الأولى المتميزة في وسط M2 الذي يحتوي على 5 ميكروغرام / مل من السيتوكالاسين B. بالنسبة للنقل النووي ، تم حقن خلايا الركام في البويضات المنضوية في وسط M2 باستخدام معالج دقيق مدفوع بـ PIEZO (Primetech). بعد النقل النووي ، تم تحضين البويضات المعاد بناؤها في وسط KSOM لمدة 1-2 ساعة قبل التنشيط. تم إجراء التنشيط عن طريق الحضانة في وسط M16 (ميليبور) يحتوي على 10 مليمول / لتر SrCl2، 2 مليمول / لتر EGTA ، و 5 ميكروغرام / مل من السيتوشالاسين B لمدة 6 ساعات ، ثم تمت زراعة البويضات في KSOM في جو رطب بنسبة 5٪ CO2 عند 37 درجة مئوية. أثناء التنشيط ، تم استكمال المجموعات المعالجة بمركب تحفيز RAD51 1 (RS-1 R9782 ، Sigma-Aldrich) ، والذي استمر لمدة 22 ساعة بعد التنشيط ، حتى المرحلة المكونة من خليتين. في التجربة الأولية ، تمت مراقبة التطور الجنيني وفقًا لوقت العلاج لمدة 22 (وقت الانقسام الأول) ، 48 و 72 ساعة ، ثم تم اختيار علاج RS-1 لمدة 22 ساعة بسبب ارتفاع معدل تكوين الكيسة الأريمية (البيانات لا معروض). تم اختيار تركيز RS-1 من الاختبار الذي يقارن نتائج العلاج مع أو بدون 5 ميكرو مول / لتر و 10 ميكرو مول / لتر و 15 ميكرو مول / لتر RS-1 (الشكل 1 أ ، ب). تم تقييم التطور الجنيني للأجنة المستنسخة لمدة 5 أيام (120 ساعة) بعد التنشيط.

2.5 الإخصاب في المختبر وزراعة الأجنة

تم جمع كتل الحيوانات المنوية من ذيل البربخ ووضعها في قطرات من وسط HTF (Millipore) المحتضن مغطى بالزيت المعدني. تم تكثيف الحيوانات المنوية لمدة ساعة واحدة تحت 5٪ من ثاني أكسيد الكربون2 عند 37 درجة مئوية قبل استخدامها في التلقيح. كعنصر تحكم تجريبي ، تم جمع بويضات MII التي تحتوي على موانع الحمل الفموية من الفئران الأنثوية B6D2F1 التي خضعت للإباضة الفائقة وتم تلقيحها بالحيوانات المنوية المحتضنة مسبقًا والحفاظ عليها تحت 5 ٪ من ثاني أكسيد الكربون.2 عند 37 درجة مئوية. كان التركيز النهائي للحيوانات المنوية في وسط التلقيح

150 حيوان منوي / ميكرولتر. بعد حوالي 5-6 ساعات من التلقيح ، تم نقل الزيجوت إلى KSOM لمزيد من الزراعة.

2.6 اشتقاق PSCs الماوس من الكيسات الكيسية الكيسية

تم وضع الكيسات الأريمية المفرغة التي تم الحصول عليها من مجموعات التلقيح الصناعي (IVF) و SCNT على حد سواء مع وبدون علاج RS-1 على خلايا مغذية ليفية جنينية للفأر معطلة الانقسامية (MEF) في وسط زراعة الخلايا الجذعية الجنينية للفأر (mESC) لتشكيل النواتج. DMEM / F12 يحتوي على 20٪ KSR ، 0.1 ملي مول / لتر مركابتوإيثانول ، 1٪ أحماض أمينية غير أساسية ، 100 وحدة / مل بنسلين ، 100 ميكروغرام / مل ستربتومايسين (جميع المنتجات من Gibco / Invitrogen) و 1.5 × 10 3 وحدة / تم استخدام العامل المثبط لسرطان الدم المؤتلف مل (Chemicon) كوسيط ثقافة mESC. تم نقل النواتج أولاً ميكانيكيًا إلى خلايا مغذية MEF جديدة ثم تم تمريرها باستخدام التربسين- EDTA. تمت مراقبة جميع خطوط PSC الخاصة بالماوس وتميزت بالفحص المورفولوجي وتلطيخ الفوسفاتيز القلوي. تم تقييم نشاط الفوسفاتيز القلوي بالتلوين الكيميائي للنسيج. تم تثبيت المستعمرات في بارافورمالدهيد بنسبة 4 ٪ في درجة حرارة الغرفة لمدة دقيقة واحدة ، وغسلها مرتين باستخدام PBS وملطخة بمحلول ركيزة فوسفاتيز قلوي (10 مل من محلول FRV-alkaline ، و 10 مل من مجموعة naphthol AS-BI القلوية محلول الفوسفاتيز القلوي ، Sigma- Aldrich) لمدة 30 دقيقة في درجة حرارة الغرفة. تم الكشف عن نشاط الفوسفاتيز القلوي بطريقة قياس الألوان بواسطة الفحص المجهري الضوئي.

2.7 تجربة نقل الأجنة

تم نقل أجنة نقل نواة الخلية الجسدية المستزرعة إلى المرحلة المكونة من خليتين تحت علاج RS-1 أو ظروف غير علاجية إلى قناة البيض لفئران الإناث الكاذبة ICR التي تم تزاوجها مع ذكر تم استئصاله في الليلة السابقة للنقل (0.5 يوم بعد الولادة [dpc) ]). أجريت العملية القيصرية في اليوم 19.5 dpc وتم رعاية الجراء الناجين من قبل الإناث المرضعات ICR.

2.8 التهجين الجيني المقارن القائم على المصفوفة

تم غسل ESCs و PSCs المستمدة من المجموعات التجريبية (IVF و SCNT و SCNT-RS-1) في PBS قبل تحميلها في أنبوب PCR يحتوي على محلول تحلل. تم عزل الحمض النووي الجيني باستخدام مجموعة متعددة عينات الحمض النووي (Thermo Fisher Scientific) وتخزينها عند درجة حرارة -80 درجة مئوية حتى يتم استخدامها في التجارب. تم إجراء تضخيم الجينوم الكامل باستخدام مجموعة تضخيم الجينوم الكامل (WGA) (Sigma-Aldrich) لتحقيق التضخيم التمثيلي للحمض النووي الجيني. تم إجراء التهجين الجيني المقارن المستند إلى المصفوفة (aCGH) باستخدام مصفوفة دقيقة CGH عالية الدقة غير مقيدة من SureScan (تقنيات Agilent). بعد مسح شرائح ميكروأري ، تم تحليل الصور باستخدام برنامج استخراج الميزات المقدم من Agilent كبرنامج مستقل ومكون أساسي لبرنامج CytoGenomics (Agilent).

2.9 المناعة

تم غسل الأجنة المستنسخة المكونة من خلية واحدة و 2 خلية في برنامج تلفزيوني يحتوي على 0.1 ٪ كحول بولي فينيل (PVA Sigma-Aldrich) ثم تم تثبيتها بـ 4 ٪ (وزن / حجم) بارافورمالدهيد عند درجة حرارة الغرفة لمدة 30 دقيقة. تم غسل الأجنة بعد ذلك في PBS / PVA ، وتم نفاذها وحظرها في برنامج تلفزيوني يحتوي على 0.1 ٪ Triton مع 1 ٪ من ألبومين مصل البقر (BSA) طوال الليل عند 4 درجات مئوية. تم غسلها مرتين في برنامج تلفزيوني يحتوي على 0.1 ٪ من مساحة سطح الجسم في اليوم التالي ، وحضنت مع الجسم المضاد الأولي في درجة حرارة الغرفة لمدة ساعتين في PBS-0.1 ٪ BSA ، وغسلت مرتين في درجة حرارة الغرفة في 0.1 ٪ PBS-0.1 ٪ BSA ، المحتضنة مع الثانوي جسم مضاد مترافق في PBS-0.1٪ BSA في درجة حرارة الغرفة لمدة ساعة واحدة ، وغسلها كما هو موضح أعلاه ، وملطخ بـ DAPI لمدة 30 دقيقة ويستخدم في الفحص المجهري متحد البؤر. تم إجراء التلوين والتحليل باستخدام الأجسام المضادة التي تتعرف على phospho-γH2AX (05-636 ، استنساخ JBW 301 ، Millipore ، 1: 1،000) ، RAD51 (PC130 ، EMD Millipore ، 1: 1،000) ، H3K9me3 (ab8898 ، Abcam ، 1: 1،000) ، والأجسام المضادة لـ Oct4 (sc5279 ، Santa Cruz ، 1: 200) ، والتي تم تخفيفها في محلول PBS-0.1٪ BSA. تم الحفاظ على نفس الظروف بين العينات المختلفة.

2.10 مقايسة المذنب

تم تقييم تلف الحمض النووي في الأجنة أحادية الخلية الناتجة عن التلقيح الاصطناعي أو نقل نواة الخلية في أوقات مختلفة (5 و 8 ساعات بعد التلقيح أو SCNT) بطول مذنب الحمض النووي باستخدام نسخة محايدة من اختبار المذنب ، 37 ، 38 كما هو مفصل في تعليمات الشركة الصانعة من مجموعة CometAssay ® (Trevigen ، Inc).

لتعظيم كفاءة تحلل الخلايا ، تمت إزالة المنطقة الشفافة من الأجنة. بعد تعليق الأجنة في 1٪ agarose نقطة انصهار منخفضة (LMA) عند 37 درجة مئوية ، تم وضع خليط جنين LMA على شريحة مزودة بمجموعة CometAssay ® Kit. تم تحضين الشرائح عند 4 درجات مئوية في الظلام لتحقيق الالتزام الكامل ثم غمرها في محلول تحلل خلايا Trevigen المبرد طوال الليل. في اليوم التالي ، تمت إزالة الشرائح من محلول التحلل وغمرها برفق في محلول مؤقت 4 درجات مئوية 1X Tris-acetate-EDTA (TAE) لمدة 30 دقيقة لغسل محلول التحلل المتبقي. بعد ذلك ، تم تعريض الشرائح لرحلان كهربائي لمدة 40 دقيقة عند 30 فولت. ثم غُمرت الشرائح في محلول أسيتات أمونيوم 1 مولار عند درجة حرارة الغرفة لمدة 25 دقيقة ، متبوعًا بالغمر في 75٪ إيثانول للتثبيت عند درجة حرارة الغرفة لمدة 25 دقيقة. بعد خطوة التثبيت ، تم تحضين الشرائح عند 40 درجة مئوية لمدة 40 دقيقة على الأقل حتى يتم تجفيف LMA بالكامل ثم تلطيخها بمحلول تلطيخ 1X SYBR ® Green I لمدة 5 دقائق في الظلام. وقد لوحظت الشرائح الملطخة تحت مجهر مضان نيكون ECLIPSE TE2000-V.لقياس المذنبات الجنينية الفردية ، سجلنا كل مذنب وفقًا لطول الذيل.

2.11 النسخ العكسي الكمي - تفاعل البوليميراز المتسلسل (RT-PCR)

تم استخلاص إجمالي الحمض النووي الريبي لكل مجموعة من عشرين جنينًا بمرحلة واحدة أو 2 أو 4 خلايا باستخدام كاشف TRIzol (Invitrogen). تم تصنيع (كدنا) من إجمالي الحمض النووي الريبي المستخرج باستخدام نظام توليف LeGene Premium Express 1st strand cDNA (LeGene Biosciences) وفقًا لتعليمات الشركة الصانعة (حتى 20 ميكرولتر من الحجم النهائي). تم إجراء PCR في الوقت الحقيقي الكمي باستخدام 2 ميكرولتر من محلول cDNA (من أجنة 2) باستخدام TOPreal TM qPCR 2X PreMIX (Enzynomics) على جهاز PCR في الوقت الحقيقي Bio-Rad CFX96 ™ (Bio-Rad). ΔΔجر تم تطبيق طريقة لتطبيع مستويات التعبير لكل جين لتلك الخاصة بـ جابده. تم استخدام المواد الأولية التالية لـ PCR في الوقت الحقيقي الكمي: الماوس راد 51 إلى الأمام 5′- CAG TGG AGG CTG TTG CTT AT-3 ′ ، فأر راد 51 عكس 5′-CAG CTC TTT GGA GCC AGT AG-3 ، فأر جابده إلى الأمام 5′- AAT GGT GAA GGT CGG TGT G-3 ′ ، فأر جابده عكس 5′- ACA AGC TTC CCA TTC TCG G -3 ′.

2.12 إعداد المكتبة وتسلسل الحمض النووي الريبي أحادي الخلية

لتحليل RNA-Seq ، تم استخدام طريقة إعداد مكتبة DriveMap TM (Selecta). من أجل تخليق (كدنا) ، تم فصل كل جنين في محلول تحلل 1 × TCL ، ووضع في آبار منفصلة من صفيحة TurboCapture 96 mRNA (Qiagen) وحضنت في درجة حرارة الغرفة لمدة ساعة واحدة بعد غسل اللوحة ثلاث مرات بمخزن غسيل بارد TCW (Qiagen) ، تمت إضافة 10 ميكرولتر من محلول المزيج الرئيسي للتفاعل RT. تم بعد ذلك إخضاع اللوحة للحضانة عند 50 درجة مئوية لمدة 40 دقيقة ، تليها تعطيل RT عند 95 درجة مئوية لمدة 5 دقائق.

بالنسبة للجولة الأولى من التمديد التمهيدي الخاص بالجينات (GSP) ، تم خلط 10 ميكرولتر من (كدنا) و 10 ميكرولتر من مزيج تفاعل بوليميريز الحمض النووي المتعدد (تجمع GSP الأمامي) واحتضانها لمدة 30 دقيقة عند 64 درجة مئوية. بعد تفاعل إزالة التمهيدي ، تم تحضين اللوحة لمدة 30 دقيقة عند 37 درجة مئوية و 5 دقائق عند 95 درجة مئوية. تم إجراء التمديد الثاني تحت نفس ظروف التمديد الأول ، وتم إنهاء التفاعل بإضافة خليط كاشف إزالة التمهيدي والحضانة عند 37 درجة مئوية لمدة 30 دقيقة. باستخدام مزيج فريد من بادئات Fwd و Rev IND PCR ، تم إجراء الجولات الأولى (20 دورة) والثانية (9 دورات) من تفاعل البوليميراز المتسلسل لتضخيم الحمض النووي. تم تنقية الحمض النووي المتضخم وتعريضه للتسلسل باستخدام منصة NextSeq500 Illumina.

2.13 تحليل بيانات تسلسل الحمض النووي الريبي

تم تحليل بيانات RNA-Seq باستخدام إما أداة ROSALIND (OnRamp) أو الموارد العامة. تم استخدام أداة STAR (v2.5.2b ، https://github.com/alexdobin/STAR) لتعيين قراءات نهائية مقترنة أولية لتجميع جينوم الماوس mm9. باستخدام ملفات نتائج STAR ، تم استخدام Cuffnorm of Cufflinks (v2.2.1) لتحديد قيم FPKM للجينات في عينات SCNT و SCNT-RS و IVF. تم اعتبار 39 جينًا معبرًا تفاضليًا عند تغيير أضعاف & gt3 و FPKM & gt3. تم إجراء تجميع وتصور DEGs باستخدام حزمة gplots (v3.0.1.1) في R (v3.3.2) (https://www.R-project.org/). تم إجراء تحليلات علم الجينات (GO) (العملية البيولوجية) لـ DEGs باستخدام أداة DAVID (الإصدار 6.8). 40 باستخدام أداة ClueGO (الإصدار 2.5.1) 41 المكون الإضافي لـ Cytoscape (الإصدار 3.6.1) ، تم إجراء 42 تحليلاً لمسار KEGG لمجموعات DEG في خرائط الحرارة. ص- تم حساب القيم باختبارات فرط هندسية من الجانب الأيمن. تم استخدام ضبط Benjamin-Hochberg لتصحيح الاختبارات المتعددة. مسارات KEGG مع ص- القيم و lt.05 اعتبرت ذات دلالة إحصائية.

2.14 التحليل الإحصائي والتكاثر

تتكون جميع البيانات المقدمة مع أشرطة الخطأ من ثلاث تجارب على الأقل من تجارب SCNT المستقلة (تحليل RNA-seq استثنائي وغير متكرر). تم تصوير الأجنة التمثيلية لجميع السلالات ، وعرضت صور نفس الجنين في الأشكال. يتم تقديم النتائج على أنها متوسط ​​± SEM. تم استخدام برنامج GraphPad Prism 5.0 لحساب الدلالة الإحصائية باستخدام برنامج Student ر اختبار للأرقام ذات الصلة ، كما هو محدد في أساطير الشكل. تم تحليل التطور الجنيني بواسطة ANOVA أحادي الاتجاه مع اختبار Duncan باستخدام برنامج SAS ، بينما تم تحليل معدلات الانغراس واشتقاق ESC باستخدام اختبار مربع كاي. ص & lt .05 تعتبر ذات دلالة إحصائية.


انقر على زر "تصفح المسارات" في الصفحة الرئيسية. في الصفحة التالية ، انقر فوق الزر "تحليل" في الجزء العلوي الأيمن:

بدلاً من ذلك ، حدد الزر "تحليل البيانات" في الصفحة الرئيسية:

يؤدي هذا إلى فتح نموذج إرسال ، حيث يمكنك تحديد التحليل الذي تريد إجراؤه ، أو لصقه أو استعراض ملف يحتوي على بياناتك ، أو استخدام نموذج لمجموعة بيانات.

هناك قسمان لاستمارة التقديم. يتم تحديد قسم "تحليل بياناتك" بشكل افتراضي لإرسال بياناتك. يمكن إجراء العديد من التحليلات المختلفة ، اعتمادًا على تنسيق بياناتك.

إذا كانت بياناتك عبارة عن عمود واحد من المعرفات مثل معرفات UniProt أو رموز الجينات أو معرّفات ChEBI ، يتم تعيينها إلى المسارات ويتم تشغيل تحليلات التمثيل الزائد والمسار والطوبولوجيا. تحليل التمثيل الزائد هو اختبار إحصائي (التوزيع الهندسي الفائق) الذي يحدد ما إذا كانت بعض مسارات Reactome مفرطة التمثيل (غنية) في البيانات المقدمة. يجيب على السؤال "هل تحتوي قائمتي على المزيد من البروتينات للمسار X مما هو متوقع بالصدفة؟" ينتج هذا الاختبار درجة احتمالية ، والتي يتم تصحيحها لمعدل الاكتشاف الخاطئ باستخدام طريقة Benjamani-Hochberg.

يأخذ تحليل طوبولوجيا المسار في الاعتبار الاتصال بين الجزيئات التي يتم تمثيلها بخطوات المسار (التي نشير إليها على أنها تفاعلات) في المسار. يقوم بتجميع جميع الجزيئات الممثلة في كل تفاعل كمسار "وحدة". إذا تم تمثيل أي من هذه الجزيئات في مجموعة الاستعلام الخاصة بك ، فسيتم اعتبار ذلك مطابقًا لهذا التفاعل. قد يعطي هذا مؤشرًا أفضل لنسبة المسار التي تتطابق مع بياناتك ، بدلاً من عدد الجزيئات المشتركة بين بياناتك والمسار. قد يشير أيضًا إلى أن بياناتك تتطابق مع بداية عملية المسار أو نهايتها أو فرع معين منها. لا يحتوي هذا الاختبار على درجة احتمالية.

إذا كانت بياناتك تحتوي على عمود أو أكثر من أعمدة الأرقام الإضافية ، فسيتم التعرف عليها على أنها بيانات تعبير وسيتم تنفيذ تراكب بيانات التعبير. لاحظ أن تنسيق البيانات هذا يجب أن يتضمن صفًا رئيسيًا. يجب أن يبدأ رأس العمود الأول بالرمز #. تُستخدم الأرقام لإنتاج تراكب ملون متدرج على مخططات مسار Reactome ، كوسيلة لتصور مستويات التعبير النسبي. لاحظ أن القيم الرقمية لا يجب أن تكون بيانات تعبيرية ، على سبيل المثال باستخدام درجات الارتباط الجيني ، يمكن استخدام نفس التحليل لتصور نتائج التنميط الجيني.

تعيين المعرف

تتعرف عملية التقديم على العديد من أنواع المعرفات. كجزء من التحليل المسبق ، يتم تعيينها لجزيئات Reactome. المعرفات المثالية لاستخدامها هي معرفات UniProt للبروتينات ، ومعرفات ChEBI للجزيئات الصغيرة ، وإما رموز جينات HGNC أو معرفات ENSEMBL لجزيئات DNA / RNA ، لأن هذه هي مصادرنا المرجعية الخارجية الرئيسية للبروتينات والجزيئات الصغيرة. يتم التعرف على العديد من المعرفات الأخرى وتعيينها لجزيئات Reactome المناسبة. تتضمن المعرفات المقبولة رموز جين HUGO و GenBank / EMBL / DDBJ و RefPep و RefSeq و EntrezGene و MIM و InterPro وبروتين EnsEMBL وجين EnsEMBL ونسخة EnsEMBL وبعض معرفات Affymetrix و Agilent. يمكن تحديد الأشكال الإسوية UniProt باستخدام التنسيق P12345-2. إذا تم حذف اللاحقة -n ، فسيتم مطابقة هذا الشكل المتعارف عليه وجميع الأشكال الإسوية منه. يمكن استخدام قوائم المعرفات المختلطة (معرفات البروتين المختلفة أو معرفات البروتين / الجينات). يجب أن تكون المعرفات واحدة في كل سطر. عادةً ما يتم تعيين المعرفات الخاصة بالبروتين على كيانات البروتين ، في حين أن المعرفات الخاصة بالجينات ستعمل على تعيين الجين والنسخة والبروتينات المشتقة. إذا كان من الممكن تصفية النتائج المرغوبة لإظهار النتائج الخاصة بالبروتين أو النتائج الخاصة بالجينات / النسخ ، التفاصيل أدناه.

فيما يلي مثال على تنسيق المعرفات فقط:

انقر فوق الزر "متابعة". تظهر صفحة اختيار خيارات ثانية:

يتم فحص المشروع للإنسان بشكل افتراضي. مع تحديد هذا الخيار ، يتم تحويل كافة المعرفات غير البشرية في استعلامك بواسطة خدمة التحليل إلى معادلاتها البشرية. بشكل عام ، يزيد هذا من فرص التوافق الناجح مع المسارات البشرية المنسقة لـ Reactome. ومع ذلك ، إذا كنت تريد استخدام المعرفات غير البشرية ومطابقتها مع مساراتنا غير البشرية المستنبطة حسابيًا ، فقم بإلغاء تحديد المربع. يمكنك أيضًا اختيار إلغاء تحديد هذا المربع إذا كان استفسارك يتكون من مزيج من المعرفات البشرية والميكروبية وهدفك هو العثور على مسارات تمثل عمليات العدوى.

يتم إلغاء تحديد "تضمين المتفاعلات" افتراضيًا. مع عدم تحديد هذا المربع ، سينظر استعلامك في مسارات Reactome فقط. إذا اخترت تحديد المربع ، فسوف يأخذ استفسارك في الاعتبار مسارات Reactome التي تم توسيعها من خلال تضمين جميع متفاعلات البروتين البروتين المتاحة من قاعدة بيانات IntAct. يؤدي هذا إلى زيادة حجم مسارات Reactome بشكل كبير ، مما يزيد من فرص مطابقة المعرفات المرسلة إلى المسار الموسع ، ولكنه سيتضمن المتفاعلات التي لم تخضع لعملية المعالجة اليدوية بواسطة Reactome وقد تتضمن تفاعلات ليس لها أهمية بيولوجية أو صلة غير مبررة. من الناحية العملية ، يُفضل الاستعلام مع عدم تحديد "تضمين المتفاعلات" في المقام الأول ، متبوعًا باستعلام متكرر مع تحديد "تضمين المتفاعلات" ، إذا كانت نسبة كبيرة من المعرفات المقدمة لا تتطابق مع مسار Reactome ، لمعرفة ما إذا كان بإمكانهم ذلك يتم تحديدها كمتفاعلات.

نتائج قوائم المعرفات بدون قيم رقمية مرتبطة

إذا قمت بإرسال عمود واحد من البروتين أو معرفات جزيء صغير يتم تعيينها إلى المسارات ويتم إجراء تحليلات التمثيل الزائد والمسار - طوبولوجيا. النتائج سوف تشبه المثال أدناه.

يتم عرض نتائج التحليل في علامة التبويب "التحليل" داخل "لوحة التفاصيل". يتم عرض جميع مسارات Reactome ، في كتل من 20 مسارًا ، مرتبة حسب القيمة p التي تم الحصول عليها من تحليل التمثيل الزائد. إذا كانت المسارات المتعددة لها نفس القيمة p ، فسيتم ترتيبها حسب عدد المعرفات في الاستعلام التي تطابق المسار. تمت إضافة عدد الجزيئات المتطابقة / العدد الإجمالي للجزيئات وقيم FDR إلى الجانب الأيمن من أسماء المسارات في لوحة التسلسل الهرمي. أسماء التفاعلات التي تتطابق مع معرف واحد على الأقل في الاستعلام ، والتي تمثل نتائج تحليل طوبولوجيا المسار الإيجابي ، مكتوبة باللون البرتقالي.

في علامة التبويب "التحليل" ، سيؤدي النقر فوق اسم المسار إلى تحديده في التسلسل الهرمي ، والذي سيؤدي إذا لزم الأمر إلى توسيع المستويات الهرمية المخفية لإظهار المسار ، بينما يتم تمييز الاسم باللون الأزرق الداكن.

بشكل افتراضي ، تُستخدم الجزيئات من جميع الأنواع (البروتين ، الجزيئات الصغيرة ، الجينات ، النصوص) لتحليل التمثيل الزائد ، ولكن من الممكن قصر نتائج التحليل على نوع فرعي معين باستخدام قائمة منسدلة تقع أعلى يسار جدول النتائج. سيؤدي تحديد إحدى المجموعات الفرعية إلى عرض النتائج التي تراعي النوع الفرعي الجزيئي المحدد فقط.

تمثل الأعمدة في تفاصيل التحليل:

  1. اسم المسار: انقر فوق الاسم لفتح المسار.
  2. الكيانات التي تم العثور عليها: عدد الجزيئات المنسقة من النوع المحدد مع نوع النتائج الشائعة بين مجموعة البيانات المقدمة والمسار المسمى في العمود 1. انقر فوق هذا الرقم لعرض المعرفات المتطابقة المرسلة وتعيينها إلى جزيئات Reactome.
  3. إجمالي الكيانات: العدد الإجمالي للجزيئات المنسقة من النوع المحدد مع نوع النتائج داخل المسار المسمى في العمود 1.
  4. تم العثور على المتفاعلات (إذا تم تحديد هذا الخيار). عدد جزيئات التفاعل من النوع المحدد مع نوع النتائج الشائعة بين مجموعة البيانات المرسلة والمسار المسمى في العمود 1. انقر فوق هذا الرقم لعرض المعرفات المطابقة المرسلة وتعيينها إلى جزيئات Reactome.
  5. إجمالي المتفاعلات (إذا تم تحديد هذا الخيار): العدد الإجمالي لجزيئات التفاعل من النوع المحدد مع نوع النتائج داخل المسار المسمى في العمود 1.
  6. نسبة الكيانات: ببساطة ، نسبة جزيئات مسار Reactome التي يمثلها هذا المسار. تُحسب كنسبة الكيانات من هذا المسار والتي تكون جزيئات من النوع المحدد باستخدام نوع النتائج مقابل. جميع الكيانات من النوع المحدد مع نوع النتائج.
  7. قيمة الكيانات: نتيجة الاختبار الإحصائي للتمثيل الزائد لجزيئات نوع النتائج المختارة.
  8. الكيانات FDR: معدل الاكتشاف الخاطئ. تصحيح احتمال التمثيل الزائد.
  9. تم العثور على ردود الفعل: عدد التفاعلات في المسار التي يتم تمثيلها بواسطة جزيء واحد على الأقل في مجموعة البيانات المقدمة ، لنوع الجزيء المحدد مع نوع النتائج.
  10. مجموع التفاعلات: عدد التفاعلات في المسار التي تحتوي على جزيئات من النوع المحدد بنوع النتائج.
  11. نسبة التفاعلات: ببساطة ، نسبة تفاعلات Reactome التي يمثلها هذا المسار. تُحسب كنسبة التفاعلات من هذا المسار التي تحتوي على جزيئات من النوع المحدد باستخدام نوع النتائج مقابل. جميع تفاعلات Reactome التي تحتوي على جزيئات من النوع المحدد بنوع النتائج.
  12. اسم النوع.

عند تشغيل التحليل ، سيعرض مستعرض المسار نظرة عامة على المسار. يتم تمييز جميع المسارات التي تحتوي على معرفات من قائمتك المرسلة ، باستخدام مقياس ملون للإشارة إلى الاحتمال المصحح (FDR). يمكن تغيير نظام الألوان باستخدام علامة تبويب ملفات تعريف الألوان (أيقونة الحامل للفنانين) في لوحة الإعدادات المنبثقة ، الموجودة على الحافة اليمنى من لوحة المسار. سيؤدي تحديد التغطية في لوحة Overexpression إلى تغيير عرض نظرة عامة على المسار لإظهار الارتباطات المتقاطعة الإضافية للأحداث المقابلة للمناطق التي تمت تغطيتها بشدة مقابل المناطق ذات التغطية المنخفضة (كما هو موضح في طريقة العرض pValue) ، وتسهيل تصور المسارات المخصبة داخل الخاص بك مجموعة البيانات.

يوفر تمييز المسارات في النظرة العامة تمثيلاً سريعًا لنتائج التحليل لجميع المسارات. لمشاهدة تفاصيل مسار معين ، انقر نقرًا مزدوجًا فوق العقدة التي تمثل المسار في النظرة العامة أو في تسلسل المسار الهرمي على اليسار. بدلاً من ذلك ، انقر فوقه مرة واحدة لتحديده واستخدم الزر "إظهار الكل" (مربع به مثلثات تشير إلى الخارج بالداخل) في الزاوية اليسرى العلوية من لوحة "نظرة عامة". يمكن التنقل في النظرة العامة باستخدام عجلة التمرير بالماوس للتكبير والتصغير والنقر والسحب لتحريكها. بدلاً من ذلك ، استخدم أزرار التنقل في الزاوية اليمنى السفلية من لوحة النظرة العامة. في أي مستوى من المسار ، يمكن العثور على مفتاح الرسم التخطيطي بالنقر فوق رمز البوصلة في الزاوية اليمنى العليا.

تمثل المخططات عالية المستوى المحسنة نتائج التحليل داخل تسمية المسارات الفرعية. تتغير خلفية التسمية من اللون الأزرق إلى الأبيض ، ويتم استخدام شريط أصفر للإشارة إلى نسبة المسار التي يتم تمثيلها في مجموعة بيانات الاستعلام. يشير الشريط الرمادي الموجود أعلى التسمية إلى عدد كيانات المسار الممثلة في مجموعة بيانات الاستعلام ، والعدد الإجمالي للكيانات في المسار ، ودرجة الاحتمالية المصححة FDR

في مخططات المسار ، يتم إعادة تلوين الكيانات (باللون الأصفر في نظام الألوان الافتراضي) إذا تم تمثيلها في مجموعة البيانات المقدمة. يتم تلوين رموز المجمعات والمجموعات والمسار الفرعي لتمثيل النسبة الممثلة في قائمة المعرفات المرسلة. في الشكل أدناه ، مستقبلات الأنسولين باللون الأصفر مما يدل على وجودها في القائمة المقدمة. لم يكن الأنسولين في القائمة المقدمة لذا لم يتم إعادة تلوينه. معقد الأنسولين: مستقبل الأنسولين أعيد تلوينه جزئيًا ، وجزءًا آخر ليس كذلك ، مما يشير إلى أن بعض الجزيئات في المجمع تم تمثيلها في مجموعة البيانات المقدمة بينما لم يتم تمثيل أخرى.

إذا تم تحديد الخيار Include Interactors ، فإن الكيانات ذات المتفاعلات التي كانت جزءًا من قائمة المعرفات المرسلة لها شريط في الزاوية اليمنى العليا. في المثال أدناه ، لا يمثل RASA1 تطابقًا مباشرًا مع قائمة المعرفات المرسلة ولكن له متفاعلات تطابق القائمة. يتم عرض المتفاعلات ، ويشير التراكب الأصفر إلى المتفاعلات المطابقة. PTPN11 هي مطابقة مباشرة ولها متفاعلات تطابق القائمة. يتم عرض عدد محدود من المتفاعلات لتجنب الازدحام.

في الجانب الأيمن من تفاصيل نتائج التحليل ، يوجد زر يشير إلى عدد المعرفات المرسلة التي لم يتم مطابقتها بنجاح مع الجزيئات في Reactome. انقر فوق الزر لإنتاج قائمة.

نتائج قوائم المعرفات ذات القيم الرقمية المرتبطة (تمثيل التعبير)

لتشغيل تحليل التعبير ، أرسل بياناتك بتنسيق يتضمن الصف الأول من رؤوس الأعمدة. يجب أن يبدأ رأس العمود 1 بالرمز #. يجب أن يحتوي العمود الأول على بروتينات أو مركبات أو معرّفات مناسبة أخرى ، مثل معرّفات المسبار. يجب أن تكون جميع الأعمدة الأخرى عبارة عن قيم رقمية ، بدون أحرف أبجدية. ستفسر أداة التحليل بياناتك على أنها بيانات تعبيرية. تُستخدم القيم الرقمية لتلوين الكائنات في مخططات المسار. تم إنشاء هذا الملف الشخصي لبيانات microarray ، ولكن يمكن استخدام أي مجموعة بيانات تتكون من قائمة المعرفات ذات القيم الرقمية المرتبطة ، على سبيل المثال البروتينات الكمية ، درجات GWAS.

يتم تشغيل الأداة باستخدام زر تحليل البيانات في شريط عنوان متصفح المسار. إما أن تقوم بلصق بياناتك في نموذج الإرسال أو الاستعراض وصولاً إلى ملف محفوظ (أو تحديد ملف مثال).

يوضح الشكل أدناه تنسيق البيانات الصحيح. يجب أن يحتوي كل صف على معرف في العمود الأول (صف الرأس اختياري).

تعرفت عملية التقديم على العديد من أنواع المعرفات. كجزء من التحليل المسبق ، يتم تعيينها لمدخلات UniProt المكافئة أو للمركبات الصغيرة لمعرفات ChEBI. هذه هي المعرفات المثالية لاستخدامها مع أدوات تحليل Reactome. تشمل المعرفات الأخرى التي يتم التعرف عليها وتحويلها إلى مكافئات UniProt رموز جين HUGO و GenBank / EMBL / DDBJ و RefPep و RefSeq و EntrezGene و MIM و InterPro ID وبعض معرفات Affymetrix و Agilent وبروتين Ensembl ومعرفات النسخ والجينات. المعرفات التي تحتوي على أرقام فقط مثل تلك الموجودة في OMIM و EntrezGene يجب أن تكون مسبوقة باسم قاعدة البيانات المصدر ونقطتين ، على سبيل المثال MIM: 602544 ، EntrezGene: 55718. يمكن استخدام قوائم المعرفات المختلطة (معرفات البروتين المختلفة أو معرفات البروتين / الجينات). يجب أن تكون المعرفات واحدة في كل سطر.

بشكل افتراضي ، يتم تعيين جميع المعرفات غير البشرية إلى نظيراتها البشرية ، ما لم يكن المشروع في خانة الاختيار البشرية غير محدد.

بعد العمود 1 ، يجب أن تحتوي جميع الأعمدة الأخرى على أرقام تمثل تعبيرًا أو قيمًا أخرى. يمكن استخدام ملفات Microsoft Excel وقيمة مفصولة بعلامات جدولة (TSV). عند إرسالها ، تُعتبر أعمدة الأرقام عينات منفصلة أو ظروفًا تجريبية. تُستخدم القيم لتراكب اللون على مخططات المسار. تتيح لك أداة متصفح التجربة تحديد تراكبات وعرضها لكل عمود من أعمدة البيانات المرسلة. هذه الأداة هي اللوحة التي تظهر في منتصف الجزء السفلي من كل من نظرة عامة على المسارات وعارض الرسم التخطيطي عند إرسال أعمدة بيانات التعبير. في تلك اللوحة ، يمكن للمستخدم التنقل عبر السلاسل الزمنية المختلفة (وكذلك تشغيله كـ "فيلم"). هذا مفيد بشكل خاص لتصور النقاط الزمنية أو تطور المرض.

قد تستغرق النتائج بضع ثوان لتظهر.

تتشابه صفحة النتائج إلى حد كبير مع تلك التي تظهر بعد إرسال قائمة بسيطة مكونة من عمود واحد من المعرفات ، مع أعمدة إضافية في تفاصيل التحليل التالية للعمود 9. وتمثل هذه الأعمدة الإضافية قيم التعبير المرسلة.

يؤدي النقر فوق اسم المسار إلى تشغيل متصفح المسار وعرض مخطط المسار ذي الصلة (انظر المثال أدناه).

يتم إعادة تلوين الكائنات في مخطط المسار وفقًا للقيم الرقمية المقدمة. تستند الألوان إلى مقياس كما هو موضح في شريط على الجانب الأيمن. هناك العديد من أنظمة الألوان المحددة باستخدام لوحة الإعدادات المنبثقة على الجانب الأيمن. يتم ضبط المقياس (على الجانب الأيمن) تلقائيًا ليلائم نطاق القيم في مجموعة البيانات.

الكائنات التي لم يتم تمثيلها في بيانات الإدخال لا يتم إعادة تلوينها.

تمثل الكائنات ذات الأشرطة الملونة معقدات أو مجموعات تحتوي على أكثر من جزيء واحد. عند التصغير ، يعكس لون النطاق متوسط ​​القيم المرسلة للجزيئات الممثلة في مجموعة البيانات. يعكس حجم النطاق نسبة الجزيئات التي قدمت القيم. قم بالتكبير لرؤية النطاقات الفردية ، لكل جزيء له قيمة مرسلة ، مرتبة أبجديًا حسب الاسم. تعكس نطاقات اللون الآن القيم المرسلة. إذا تم إرسال عدة أعمدة من القيم ، تمثل نماذج متعددة ، على سبيل المثال النقاط الزمنية أو تطور المرض ، سيكون ترتيب النطاقات هو نفسه لكل عينة.

لعرض تفاصيل مكونات المجمع أو تعيينه ، انقر بزر الماوس الأيمن فوقه. هذا يفتح لوحة المعلومات السياقية (CIP) (انظر الشكل أعلاه). يحتوي هذا على علامتي تبويب - الجزيئات والمسارات. تُظهر الجزيئات الجزيئات المشاركة ، وإذا تم إجراء تحليل تعبير ، فإن قيم تعبيرها. تحدد المسارات ما إذا كان الكائن المحدد موجودًا في أي مسارات Reactome أخرى ، مع روابط إلى مخططات المسار المناسبة.

يمكن فتح وتثبيت CIPs متعددة بحيث تظل مرئية عند تحديد كيانات أخرى.

يتذكر المتصفح برامج CIP التي تم تثبيتها في الزيارة الأخيرة (لما يصل إلى 5 رسوم بيانية).

يتم استخدام شريط أدوات متصفح التجربة البرتقالي (أسفل اليسار في الشكل أعلاه) للتنقل عبر أعمدة بياناتك ، على سبيل المثال النقاط الزمنية أو تطور المرض. تنقل بينهم عن طريق النقر على أزرار الأسهم. يتم عرض رأس عمود البيانات (إن وجد) بين الأسهم. سيعيد رسم مخطط المسار اللون ليعكس القيم الجديدة.

للحصول على شرح للنتائج التي تظهر في علامة تبويب نتائج المعرف ، راجع الشرح في قسم نتائج قوائم المعرف بدون قيم رقمية مرتبطة.

تقرير التحليل

بالنسبة لبعض مستخدمينا ، قد يكون من المهم الحفاظ على تحليل المسار على المدى الطويل. بعد تحليل المسار ، يمكن تنزيل النتائج كتقرير PDF سهل القراءة عن طريق النقر فوق الزر "تقرير (PDF)" الموجود في الركن الأيسر السفلي من لوحة التفاصيل. ستبدو الصفحة الأولى من تقرير PDF كما يلي:

تمثل أقسام تقرير التحليل ما يلي:

  1. مقدمة: نظرة عامة على مشروع Reactome وأداة التحليل.
  2. الخصائص: ملخص تفصيلي لمخرجات التحليل. على سبيل المثال ، عدد المعرفات التي تم العثور عليها في Reactome.
  3. نظرة عامة على الجينوم: نظرة عامة على الجينوم لنتائج تحليل المسار الخاص بك.
  4. أهم المسارات: جدول لأفضل 25 مسارًا. يتم تصنيف النتائج بناءً على قيمة FDR الأكثر أهمية. ستتصل الروابط المضمنة داخل اسم مسار الجدول بتفاصيل المسار (القسم رقم 5).
  5. تفاصيل المسار: عرض ملخص لكل نتيجة مسار. سيتصل معرف المسار الموجود بين قوسين عند النقر فوقه بصفحة تفاصيل المسار على موقع ويب Reactome. يتم أيضًا توفير رسم تخطيطي للمسار ، وجمع للمسار ، ومحفوظات التحرير ، وقائمة المعرفات التي تم العثور عليها ، والمراجع (عند توفرها).
  6. المعرفات التي تم العثور عليها: جدول بالمرادفات أو المعرفات التي تم العثور عليها في Reactome بناءً على قائمة الإدخال.
  7. لم يتم العثور على المعرفات: جدول بالمرادفات أو المعرفات التي لم يتم العثور عليها في Reactome بناءً على قائمة الإدخال.

تحليل التعبير الجيني

ReactomeGSA هي أداة تحليل مسار جديدة مدمجة في النظام البيئي Reactome. ميزته الرئيسية هي أنه يجري تحليلات المسار الكمي (ما يسمى بتحليلات مجموعة الجينات). هذا يزيد من القوة الإحصائية لتحليل التعبير التفاضلي ، والذي يتم إجراؤه مباشرة على مستوى المسار. مزيد من المعلومات انقر هنا.

مقارنة الأنواع

تُستخدم المسارات البشرية المنسقة يدويًا في Reactome للتنبؤ بالمسارات المكافئة في 18 نوعًا آخر. تعتمد هذه العملية الحسابية الآلية على علم تقويم العظام. يمكن العثور على وصف كامل لعملية الاستدلال على الصفحة الرئيسية ضمن التوثيق ، توقع تقويم العظام.

تتيح لك أداة مقارنة الأنواع مقارنة المسارات البشرية بالمسارات المتوقعة حسابيًا في الكائنات الحية النموذجية ، وتسليط الضوء على عناصر المسار المشتركة لكلا النوعين وتلك التي قد تكون غائبة في كائن النموذج.

يتم تشغيل مقارنة الأنواع باستخدام الزر "تحليل" في شريط عنوان متصفح المسار. في قسم مقارنة الأنواع ، حدد أحد الأنواع في القائمة المنسدلة. انقر فوق الزر Go:

تكون النتائج جاهزة للعرض عندما تظهر نتائج التحليل (أو يتم تحديثها إذا كانت موجودة بالفعل) في تسلسل المسار الهرمي.

يؤدي النقر فوق اسم المسار إلى تشغيل متصفح المسار وعرض مخطط المسار ذي الصلة (انظر المثال أدناه).

يشير لون أجسام التفاعل إلى نتيجة المقارنة:

  • يشير اللون الأصفر إلى أن البروتين له مكافئ مستنتج في الأنواع المقارنة.
  • عدم وجود تراكب يشير إلى أن الاستدلال لم يكن ممكنًا. هذا هو الحال دائمًا بالنسبة للجزيئات الصغيرة والحمض النووي والكائنات الأخرى التي ليس لها مدخل UniProt (أو لم يكن لها مدخل UniProt في الوقت الذي تم فيه إنشاء المسار).
  • تمثل الكائنات ذات الأشرطة الملونة معقدات أو مجموعات تحتوي على أكثر من جزيء واحد. تعكس نطاقات اللون نجاح الاستدلال للجزيئات داخل المجمع / المجموعة.

لعرض نتائج مقارنة الأنواع لمجموعة معقدة أو قم بتمرير الماوس فوق الكائن وسيظهر مثلث أزرق صغير على جانبه الأيمن. حدد هذا لفتح لوحة المعلومات السياقية.

هذا يكشف عن جدول يمثل جميع البروتينات المشاركة في المجمع / المجموعة. يمثل كل مربع في الشبكة مكونًا واحدًا للمجمع / المجموعة ، ملونًا كما هو موضح أعلاه.

يمكن استخدام شريط الأنواع في الجزء السفلي من مخطط المسار (انظر المثال أعلاه) لإيقاف تلوين مقارنة الأنواع ، عن طريق إلغاء تحديد المربع.

راجع قسم Navigating Pathway Diagrams لمزيد من المعلومات حول محتوى الرسم التخطيطي.

توزيع الأنسجة

تقليديًا ، تمثل التفاعلات في Reactome الأحداث التي تحدث داخل خلية بشرية عامة واحدة. ومع ذلك ، سيكون من المفيد تصنيف التفاعلات إلى أنواع مختلفة من الأنسجة البشرية ، لتوفير صورة متطورة للتفاعلات والمسارات في مختلف البيئات الخاصة بالخلية والأنسجة. لقد قمنا باستيراد تعبير البروتين في أنواع مختلفة من الخلايا / الأنسجة من Human Protein Atlas (HPA) ، وقمنا بتغطية هذه البروتينات على بيانات Reactome ، واستخرجنا مجموعة فرعية من التفاعلات لهذا النوع المحدد من الخلايا. يمكن تصور بيانات HPA التي تعكس التعبير عن جينات ترميز البروتين في 44 نسجًا بشريًا مختلفًا من خلال أدوات التحليل.

يتم تشغيل توزيع الأنسجة باستخدام الزر "تحليل" في شريط عنوان متصفح المسار. في قسم توزيع الأنسجة ، حدد مجموعة بيانات الأنسجة التجريبية [HPA (E-PROT-3) - Expression Atlas] في القائمة المنسدلة. بمجرد تحديث النافذة ، حدد "الأنسجة المتاحة" في اللوحة اليمنى واضغط على الزر "إضافة" لإضافة بيانات تعبير الأنسجة إلى أداة التحليل. اضغط على الزر "إضافة الكل" ، إذا كنت ترغب في ربط جميع بيانات تعبير الأنسجة. استخدم الزرين "إزالة الكل" و "إزالة" لحذف بيانات تعبير الأنسجة من قائمة التصفية. بمجرد تحديد جميع الأنسجة المناسبة ، c لعق زر Go لبدء التحليل.

تكون النتائج جاهزة للعرض عندما تظهر نتائج التحليل (أو يتم تحديثها إذا كانت موجودة بالفعل) في Pathway Hierarchy ولوحة Overview.

يؤدي النقر فوق اسم المسار إلى تشغيل متصفح المسار وعرض مخطط المسار ذي الصلة (انظر المثال أدناه).

يتم إعادة تلوين الكائنات في مخطط المسار وفقًا للقيم الرقمية المقدمة. تستند الألوان إلى مقياس كما هو موضح في شريط على الجانب الأيمن. هناك العديد من أنظمة الألوان المحددة باستخدام لوحة الإعدادات المنبثقة على الجانب الأيمن. يتم ضبط المقياس (على الجانب الأيمن) تلقائيًا ليلائم نطاق القيم في مجموعة البيانات.

الكائنات التي لم يتم تمثيلها في بيانات الإدخال لا يتم إعادة تلوينها.

تمثل الكائنات ذات الأشرطة الملونة معقدات أو مجموعات تحتوي على أكثر من جزيء واحد. عند التصغير ، يعكس لون النطاق متوسط ​​القيم المرسلة للجزيئات الممثلة في مجموعة البيانات. يعكس حجم النطاق نسبة الجزيئات التي قدمت القيم. قم بالتكبير لرؤية النطاقات الفردية ، لكل جزيء له قيمة مقدمة ، مرتبة أبجديًا حسب الاسم. تعكس نطاقات اللون الآن القيم المرسلة. إذا تم إرسال عدة أعمدة من القيم ، تمثل نماذج متعددة ، على سبيل المثال النقاط الزمنية أو تطور المرض ، سيكون ترتيب النطاقات هو نفسه لكل عينة.

لعرض تفاصيل مكونات المجمع أو تعيينه ، انقر بزر الماوس الأيمن فوقه. هذا يفتح لوحة المعلومات السياقية (CIP) (انظر الشكل أعلاه). يحتوي هذا على علامتي تبويب - الجزيئات والمسارات. تُظهر الجزيئات الجزيئات المشاركة ، وإذا تم إجراء تحليل تعبير ، فإن قيم تعبيرها. تحدد المسارات ما إذا كان الكائن المحدد موجودًا في أي مسارات Reactome أخرى ، مع روابط إلى مخططات المسار المناسبة.

يمكن فتح وتثبيت CIPs متعددة بحيث تظل مرئية عند تحديد كيانات أخرى.

يتذكر المتصفح برامج CIP التي تم تثبيتها في الزيارة الأخيرة (لما يصل إلى 5 رسوم بيانية).

يتم استخدام شريط أدوات متصفح التجربة (أسفل اليسار في الشكل أعلاه) للتنقل عبر أعمدة بياناتك ، على سبيل المثال النقاط الزمنية أو تطور المرض. تنقل بينهم عن طريق النقر على أزرار الأسهم. يتم عرض رأس عمود البيانات (إن وجد) بين الأسهم. سيعيد رسم مخطط المسار اللون ليعكس القيم الجديدة.

يؤدي النقر فوق رمز الرسم التوضيحي (أيقونة تشبه الصورة في الجزء العلوي الأيمن من متصفح المسار) إلى عرض توضيح المسار ذي الصلة (انظر المثال أدناه).

ابدء

تحليل المسار تمارين

يهدف هذا التمرين إلى التحقق من فهمك لنتائج تحليل المسار.

في الصفحة الرئيسية ، افتح متصفح المسار. انقر فوق الزر تحليل البيانات. عندما يظهر نموذج الإرسال ، في قسم أدوات التحليل ، حدد "انقر هنا للصق بياناتك أو تجربة نماذج مجموعات البيانات ..."

... وانقر على زر قائمة انضمام UniProt على الجانب الأيمن.

يجب أن تبدو صفحة الإرسال الخاصة بك كما يلي:

انقر فوق متابعة. تأكد من تحديد Project to human ، لكن تضمين المتفاعلات ليس كذلك. عندما تظهر النتائج:

  1. ما المسار (المسارات) الأكثر تمثيلاً في مجموعة البيانات هذه؟
  2. كم عدد المعرفات التي تطابق المسار الموجود أعلى القائمة؟
  3. ما نسبة الجزيئات المتطابقة في المسار تقريبًا؟
  4. ما هي نسبة التفاعلات المتطابقة؟
  5. كرر التحليل ولكن هذه المرة حدد المربع لتضمين المتفاعلات. هل النتائج هي نفسها؟ إذا لم يكن كذلك ، فلماذا؟

تحليل التعبير تمارين

يهدف هذا التمرين إلى التحقق من إمكانية تشغيل نتائج تحليل التعبير وتفسيرها.

قم بتشغيل Expression Analysis وتحميل نموذج مجموعة البيانات. انقر فوق GO عندما يتم عرض النتائج ، ابحث عن مسار إصلاح DNA ،

  1. كم عدد البروتينات في هذا المسار؟
  2. ما هي نسبة هؤلاء الذين لديهم بيانات تعبيرية؟
  3. ما هو متوسط ​​التعبير في 24 ساعة؟
  4. أي مسار فرعي يحتوي على أعلى متوسط ​​قيمة تعبير عند 24 ساعة؟ (تلميح: حرك مؤشر الماوس فوق الرسم التخطيطي لنظرة عامة على المسار ، وانظر إلى المقياس على الجانب الأيمن).

مقارنة الأنواع تمارين

هذا التمرين للتحقق من أنه يمكنك تشغيل وتفسير نتائج مقارنة الأنواع.

إطلاق مقارنة الأنواع واختيار الأنواع Danio rerio. عند عرض النتائج ، استخدم التسلسل الهرمي للمسار للانتقال إلى "الإرقاء" ، "انحلال جلطة الفيبرين".

  1. ابحث عن PLAT (36-562) أعلى يمين الرسم التخطيطي - ما لونه ولماذا؟
  2. ابحث عن HRG - ما هو لونه ولماذا؟
  3. لماذا Zn2 + (أعلى اليسار) غير ملون؟

معلومات اكثر

تراكب التفاعل الجزيئي

إذا كان المستخدم مهتمًا بتحليل البيانات مع المتعاملين من مصادر أخرى (مثل IntAct) ، فيجب تحديد خيارات "تضمين المتفاعلات" في قسم "تحليل البيانات". مرة واحدة في مخطط المسار ، يسمح تراكب التفاعل الجزيئي (MI) بتفاعل البروتينات البروتينية أو البروتينات الجزيئية الصغيرة ليتم تثبيتها على مخطط المسار. يعتمد المصدر على قاعدة بيانات التفاعل المحددة حاليًا. قاعدة بيانات التفاعل الافتراضية هي IntAct (Static) ، والتي توفر وصولاً سريعًا إلى إصدار ربع سنوي محدث ومستضاف محليًا من بيانات IntAct. يمكن تحديد الوصول إلى مجموعة البيانات المستضافة IntAct ومصادر PSICQUIC الأخرى لبيانات التفاعل (بروتين بروتين وجزيء بروتين صغير) باستخدام ميزة 'PSICQUIC' في علامة تبويب Interactor Overlays ضمن لوحة الإعدادات في منتصف يمين المسار رسم بياني. تسمح القائمة باختيار مصدر المتفاعلات. يتم ملء هذا تلقائيًا عن طريق الاستعلام عن PSICQUIC Registry. إذا تم تحديد قاعدة بيانات جديدة أثناء عرض المتفاعلات على مخطط المسار ، فسيتم استخدام البروتينات التي تمثلها تلك الكيانات كاستعلامات في قاعدة البيانات الجديدة وسيتم تحديث العرض تلقائيًا. يوفر الزر "i" ("المعلومات") الموجود أعلى يمين علامة التبويب Interactor Overlays نصيحة سريعة حول استخدام تراكب MI. سيؤدي تحديد "سماوي" أو "أزرق مخضر" في القائمة المنسدلة "ملف تعريف ألوان التفاعل" ضمن ميزة "لوحة الألوان" في لوحة الإعدادات إلى تغيير لون المتفاعل.

بمجرد عرض رسم تخطيطي للمسار في منفذ العرض ، ستظهر تلقائيًا دائرة حمراء صغيرة برقم بأحرف بيضاء في الزاوية اليمنى العليا من الكيان للكيانات البروتينية والكيميائية الفردية التي لها متفاعلات. يمثل الرقم عدد المتفاعلات المعروفة للبروتين المحدد. سيؤدي الضغط على الدائرة الحمراء بالمؤشر إلى عرض المتفاعلات. يتم عرض 10 متفاعلات كحد أقصى على شكل حلقة من الصناديق ذات الحدود الزرقاء (متفاعلات البروتين) أو أشكال بيضاوية ذات حدود خضراء (تفاعلات جزيئية صغيرة) متصلة بخطوط سوداء بالبروتين المحدد. إذا كان نفس المتفاعل متصلاً بأكثر من كيان ، فسيتم إعادة استخدامه ، أي متصل بجميع الكيانات المحددة في الرسم التخطيطي. علاوة على ذلك ، إذا كان المتفاعل عبارة عن كيان بروتيني أو جزيء صغير موجود مسبقًا داخل مخطط المسار ، فإن الخط الأسود يربط الكيانين. سيؤدي الضغط على الدائرة الحمراء مرة ثانية إلى إزالة المتفاعلات من مخطط المسار. إذا كان الكيان يتفاعل مع نفسه ، فسيتم عرض سهم حلقي.

يوفر عدد من الإجراءات معلومات إضافية حول المتفاعل وعلاقته بكيان البروتين. وتشمل هذه:

  • قم بتمرير مؤشر الماوس فوق متفاعل البروتين للكشف عن تلميح أداة يحتوي على اسمه ومعرف UniProt.
  • انقر فوق المتفاعل لفتح إدخال قاعدة البيانات الخاصة به في نافذة جديدة.
  • انقر فوق الخط الذي يربط المتفاعل بجزيء المسار لفتح تفاصيل التفاعل من قاعدة البيانات المصدر ، في نافذة جديدة.
  • انقر بزر الماوس الأيمن فوق كائن مسار ، أو حدد المثلث الأزرق الذي يظهر على الجانب الأيمن عند تحريك مؤشر الماوس فوقه ، لفتح لوحة منبثقة (لوحة المعلومات السياقية). حدد علامة التبويب Interactors (أسفل) لعرض جدول بجميع المتفاعلات للكائن المحدد. هذا الجدول قابل للتمرير ويوفر معلومات إضافية حول المتفاعلات. انقر فوق اسم "Interactor" أو معرف الوصول للاتصال بـ UniProt أو قاعدة بيانات مصدر التفاعل ، على التوالي. انقر فوق الزر "معرف" لتبديل عرض إما اسم المتفاعل أو معرف قاعدة البيانات الخاصة به. انقر فوق زر الدبوس لإصلاح الجدول المفتوح في موضعه على مخطط المسار. انقر فوق "X" في الزاوية اليمنى العليا لإغلاق عرض الجدول.

التفاعلات من قاعدة بيانات IntAct لها درجات ثقة يتم إنشاؤها كمجموع تراكمي للنتيجة المرجحة التي تعتمد على طريقة اكتشاف التفاعل وعدد الملاحظات. الحد الأدنى الافتراضي هو 0.45. تظهر التفاعلات بمستوى ثقة يساوي أو أعلى من ذلك. حرك شريط التمرير في شريط أدوات التراكب الجزيئي (شريط رمادي فاتح مع شريط تمرير رمادي غامق موجود في الجزء السفلي من مخطط المسار) إلى اليمين لرفع عتبة مستوى الثقة. ستختفي المتفاعلات التي تقل عن مستوى الثقة المعروض تدريجيًا. حرك شريط التمرير إلى اليسار وستظهر المتفاعلات مرة أخرى. انقر على "X" في شريط أدوات التراكب الجزيئي لإخفائه.

يؤدي التكبير / التصغير ، إما باستخدام عناصر التحكم الموجودة في الزاوية اليمنى السفلية من مخطط المسار أو عجلة تمرير الماوس ، إلى زيادة حجم جميع الكائنات المعروضة في مخطط المسار بما في ذلك المتفاعلات. عندما يتم الوصول إلى حجم كافٍ ، ستظهر البنية البلورية للبروتينات أو التركيب الكيميائي للجزيئات الصغيرة في الكائن المتفاعل ، إذا كان متاحًا.

يمكن تنزيل تفاصيل كل متفاعل لكل بروتين في المسار المعروض كملف محدد بعلامات جدولة عن طريق النقر فوق الزر "Cloud" في شريط أدوات التراكب الجزيئي أو من علامة التبويب Interactor Overlays في لوحة الإعدادات.

تراكب التفاعل الجزيئي تمارين

يهدف هذا التمرين إلى التحقق من أنه يمكنك استخدام تراكبات التفاعل الجزيئي وتفسيرها


أساليب

المواد النباتية واستخراج الحمض النووي الريبي

استخدمت التجربة صنفًا نموذجيًا من الفراولة المزروعة ، فراجاريا × أناناسا دوك. "Benihoppe" ، تم تقديمه من قبل مركز بكين للبحوث الهندسية للفراولة وتم تنفيذه في أكاديمية بكين لعلوم الغابات وعلم زراعة الثمار ، منطقة هايديان ، بكين ، الصين (40 ° 1´21 ″ شمالًا ، 116 ° 16´32 شرقًا). SA ، مع براءة اختراع لا. ZL200610112418.7 ، يتكون أساسًا من جسم الحشرات ومستقلبات الحشرات ويتم إنتاجه بشكل مستقل بواسطة مختبرنا. تمت زراعة جميع النباتات عند درجة حرارة 22 ± 1 درجة مئوية في البيوت البلاستيكية في فترة ضوئية مظلمة تبلغ 16 ساعة / 8 ساعات. احتوت الدفيئة على 80 سرير فراولة بطول 100 سم × عرض 40 سم × ارتفاع 40 سم تم معالجة 40 سرير فراولة باستخدام SA ، وكان النصف الآخر بمثابة عنصر تحكم. زرعت شتلات الفراولة في صفين لكل سرير. خضعت البيوت المحمية لممارسات الإدارة الزراعية العامة ، والتي اشتملت على استخدامات الأسمدة الأساسية التالية: 29985 كجم / هكتار من السماد الزراعي مع & gt 25٪ مواد عضوية و 300 كجم / هكتار سماد NPK مع ≥45٪ N + P2O4 + K2O. تتكون المواد النباتية من مجموعتين: الزراعة المستمرة (CC) والحصاد المستمر مع تعديل التربة (CC + SA). زرعت نباتات الفراولة CC في تربة CC ، والتي تمت زراعتها منفردة بنباتات الفراولة لمدة 12 عامًا. تمت زراعة نباتات الفراولة CC + SA في نفس تربة CC التي تم فيها تطبيق SA مرة واحدة أثناء صناعة الفراولة.تم جمع عينات النبات بشكل عشوائي بعد 15 يومًا من معاملة SA ، وتم شطف الجذور بالماء. تم تسجيل الوزن الطازج على الفور ، واستخدمت عينات الجذر للمجموعتين (CC و CC + SA) لمزيد من تحليل RNA-Seq. تضمنت كل مجموعة عينة 3 مكررات بيولوجية (CC-1 و CC-2 و CC-3 CC + SA-1 و CC + SA-2 و CC + SA-3) ، وتم تجميع جذور 3 شتلات لكل معاملة كنسخة بيولوجية واحدة [48]. في المجموع ، تم تضمين 18 شتلة (3 شتلات × 3 مكررات بيولوجية × 2 معاملة) في التحليل. تم تجميد جميع العينات في النيتروجين السائل وتخزينها عند -80 درجة مئوية.

تم استخراج إجمالي الحمض النووي الريبي من 100 ملغ من أنسجة الجذر باستخدام مجموعة RNA للنبات (BioTeke ، بكين ، الصين) وفقًا لمواصفات الشركة المصنعة. تم نسخ عكسي أول حبلا (كدنا) باستخدام FastQuant RT Kit (تيانجين ، بكين ، الصين).

بناء مكتبة RNA-Seq وتسلسلها

تم استخدام ما مجموعه 1 ميكروغرام من الحمض النووي الريبي لكل عينة كمواد إدخال لإعداد عينة الحمض النووي الريبي. تم إنشاء مكتبات التسلسل باستخدام NEBNext UltraTM RNA Library Prep Kit لـ Illumina (NEB ، الولايات المتحدة الأمريكية). لتحديد أجزاء مكتبة cDNA بشكل مفضل يبلغ طولها 240 نقطة أساس ، تم استخدام نظام AMPure XP (Beckman Coulter ، Beverly ، الولايات المتحدة الأمريكية) لتنقية الأجزاء. بعد ذلك ، تم خلط ثلاثة ميكرولتر من إنزيم USER (NEB ، الولايات المتحدة الأمريكية) مع الأجزاء المختارة بالحجم. تم إجراء تفاعل البوليميراز المتسلسل باستخدام بوليميراز الحمض النووي عالي الدقة Phusion ، وأشعال PCR العالمي والفهرس التمهيدي (X). أخيرًا ، تمت تنقية منتجات PCR (نظام AMPure XP) ، وتم تقييم جودة المكتبة على نظام Agilent Bioanalyzer 2100. تم إجراء تجميع العينات المشفرة بالفهرس على نظام cBot Cluster Generation System باستخدام TruSeq PE Cluster Kit v4-cBot-HS (Illumina). بعد إنشاء الكتلة ، تم تسلسل تحضيرات المكتبة على منصة Illumina في شركة Beijing BioMarker Corporation.

تحليل البيانات

تمت معالجة البيانات الأولية (القراءات الأولية) بتنسيق fastq من خلال نصوص Perl الداخلية. تمت إزالة تسلسلات المحول ، والقراءات التي تحتوي على poly-N وقراءات التسلسل منخفضة الجودة من مجموعات البيانات. تم تحويل التسلسلات الأولية إلى قراءات نظيفة بعد معالجة البيانات. تم حساب محتوى Q30 و GC للبيانات النظيفة. تم بعد ذلك تعيين القراءات النظيفة إلى تسلسل الجينوم المرجعي باستخدام برنامج أدوات TopHat2. تم إجراء تحليل التعبير التفاضلي للمجموعتين باستخدام حزمة DESeq R (1.10.1). ال ص- تم تعديل القيم باستخدام نهج Benjamini و Hochberg للتحكم في معدل الاكتشاف الخاطئ (FDR). الجينات مع تعديل ص-القيمة & lt 0.01 و | تغيير أضعاف (FC) | ≥ 2 وفقًا لـ DESeq تم التعبير عنها بشكل تفاضلي. تم إنشاء خرائط الحرارة والتكتل الهرمي باستخدام تكوين 1.8.1. تم تنفيذ تحليل إثراء Gene Ontology (GO) بواسطة حزمة GOseq R بناءً على توزيع Wallenius غير المركزي للهندسة الفائقة [49]. تم استخدام برنامج KOBAS لاختبار الإثراء الإحصائي لـ DEGs في مسارات KEGG (http://www.genome.jp/kegg/ أو http://www.kegg.jp/) [27 ، 50]. تم إنشاء أشجار النشوء والتطور بواسطة MEGA 7.0 باستخدام طريقة ربط الجوار (NJ) مع إعادة تشكيل التمهيد بألف ضعف [51 ، 52]. تم استخدام SMART (http://smart.embl.de/) لاشتقاق شبكة التفاعل [53]. تم تحليل البيانات بواسطة اختبار T لعينات مستقلة باستخدام SPSS 20.0 (SPSS Inc. ، الولايات المتحدة الأمريكية).

تحليل التعبير الجيني

ال إتش إس بي- تم اختيار جينات العائلة للتحقق من صحة qPCR في الوقت الفعلي باستخدام نظام QuantStudio ™ 6 Flex Real-Time PCR (النظم البيولوجية التطبيقية ، فوستر سيتي ، كاليفورنيا ، الولايات المتحدة الأمريكية). تم الحصول على بادئات qRT-PCR من qPrimerDB (https://biodb.swu.edu.cn/qprimerdb/) وهي مدرجة في الملف الإضافي 1: الجدول S1 [54]. تضمن كل خليط تفاعل 10 ميكرولتر من 2 × SYBR® Select Master Mix (Applied Biosystems ، Foster City ، CA ، USA) ، 100 نانوغرام من منتج cDNA المخفف ، و 0.8 ميكرولتر من كل من البادئين (10 ميكرومتر) ، وتم تعديله إلى 20 ميكرولتر من الماء الخالي من DNase / RNase. تم تقديم التعبير الجيني كوحدات نسبية بعد التوحيد القياسي لبروتين ربط الحمض النووي لجين الفراولة (DBP) EU727547 كعنصر تحكم داخلي باستخدام طريقة 2-CT مع ثلاث مكررات تكنولوجية [55،56،57]. تم تكرار كل تفاعل باستخدام ثلاث مكررات بيولوجية وتقنية مستقلة.


توافر البيانات والمواد

جميع مجموعات البيانات متاحة بشكل مفتوح من قواعد البيانات العامة. تم تنزيل مجموعة بيانات TCR [49] من GEO (GSE137554). تم تنزيل مجموعة بيانات HCA [50] من "تعداد الخلايا المناعية" الذي يعد جزءًا من أطلس الخلايا البشرية (https://preview.data.humancellatlas.org/) ، اعتبارًا من 31 يوليو 2018. مجموعة بيانات LCH [51 ] من GEO (GSE133704). تم تنزيل مجموعة بيانات AML [52] من GEO (GSE116256). تم تنزيل مجموعة بيانات الورم الأرومي الدبقي [53] من GEO (GSE131928). الكود المصدري لتدريب وتحليل KPNNs (في Python و R) متاح بموجب ترخيص GNU العام v3.0 كمستودع GitHub [125] وفي شكل مؤرشف في Zenodo [126].


أساليب

يتم تنفيذ واجهة الويب على أنها JSF (JavaServer Faces) باستخدام مكتبة مكون PrimeFaces. يتم تخزين البيانات في قاعدة بيانات MySQL وجلبها باستخدام Hibernate كتطبيق JPA (Java Persistence API). يتم تنفيذ البحث عن المكونات باستخدام استعلامات بسيطة مثل "SELECT DISTINCT h FROM Hormone h LEFT JOIN h.names AS n WHERE Lower (n.name) like: pattern". يتم تحميل خصائص المكون المسترجع والكيانات ذات الصلة بواسطة JPA.

للاتصال بخدمة OBA ، تتم إضافة عميل OBA إلى مسار الفئة ويستخدم بروتوكول REST للاتصال بالخادم. الكيانات التشريحية المخزنة في EndoNet لها معرف Cytomer المقابل مشروحًا. بعد تحديث بيانات EndoNet ، يتم نقل مجموعة فئات الأنطولوجيا المستخدمة في قاعدة البيانات إلى خدمة OBA. للبحث عن الهياكل التشريحية ذات الصلة ، فإن الدالتين "findUpstreamInSet" و "findDownstreamInSet" بالتزامن مع المجموعة المحملة السابقة.

يتم التمثيل الرسومي للمسارات بمساعدة Graphviz. يتم دفق عُقد وحواف الشبكة بتنسيق ملف نقطي إلى ملف نقطي لبدلة Graphviz. تتم إضافة الرسم المتجه القابل للتحجيم (SVG) الناتج إلى صفحة الويب ويتم تقديمه بواسطة المستعرض.


تصميم نماذج الترميز الخاصة بالبيولوجيا التركيبية

يعد استخدام النماذج الكمية أحد المكونات الرئيسية لأي جهد في مجال البيولوجيا التركيبية. تسمح هذه النماذج والمحاكاة المقابلة لها بتحسين تصميم النظام ، بالإضافة إلى توجيه تحليلها اللاحق. كانت النمذجة الديناميكية لشبكات تنظيم الجينات وشبكات التفاعل مجالًا للنمو على مدار العقد الماضي. كانت هناك زيادة مصاحبة في عدد أدوات ومعايير البرامج ، مما يسهل تبادل النماذج وإعادة استخدامها. نقدم هنا نظرة عامة على عمليات إنشاء النماذج وتحليلها بالإضافة إلى بعض أدوات البرامج شائعة الاستخدام. باستخدام لغة الترميز لتشفير النموذج والتعليقات التوضيحية المرتبطة به ، نصف تعدين المكونات وتكاملها في النماذج العلائقية والصياغة وتحديد المعاملات. يؤدي تقييم نتائج المحاكاة والتحقق من صحة النموذج إلى إغلاق "حلقة" بيولوجيا الأنظمة.

1 المقدمة

شهدت البيولوجيا التركيبية تطورًا هائلاً على مدار العقد الماضي (Sprinzak & amp Elowitz 2005 Andrianantoandro وآخرون. 2006). تم تعزيز هندسة النظم البيولوجية من خلال توافر وتحسين تقنيات المختبر الرطب. جنبًا إلى جنب مع تطوير هذه الأساليب التجريبية ، انتشر استخدام الأدوات والأساليب الحسابية لنمذجة وتفسير الأنظمة البيولوجية وأصبح الاتجاه السائد. بينما في نهاية القرن الماضي ، تم تصميم عدد قليل فقط من أدوات البرمجيات خصيصًا لبناء وتفسير شبكات التفاعل التنظيمي والكيميائي الحيوي للجينات ، واليوم يصل عددها إلى المئات.

الأنظمة البيولوجية مترابطة بشكل كبير ، ولا يمكن اشتقاق سلوكياتها في أغلب الأحيان من خصائص مكونات مفردة دون مساعدة أجهزة الكمبيوتر. بينما يمكن أحيانًا الاستدلال على ديناميكيات التفاعلات الأولية والزخارف التنظيمية البسيطة دون مساعدة النماذج الرياضية ، لا يمكن حل سلوك شبكات التفاعل الأكثر تعقيدًا من خلال التفكير وحده. لذلك ، أصبحت الأوصاف الرياضية للعمليات الكيميائية الحيوية والتحليل الحسابي ، بالاقتران مع النتائج التجريبية ، ضرورة.

تسمح المحاكاة الحاسوبية بالتنبؤ بسلوك النظام ويمكن أن تساعد في توضيح الآليات الكامنة وراء الظواهر البيولوجية. يجب إنشاء نموذج أولي يكون مخلصًا بشكل معقول للبنية البيولوجية ، وقادر على إعادة إنتاج السلوكيات المعروفة إلى حد مقبول. يمكن بعد ذلك استخدام هذا لاستكشاف تأثيرات الظروف البيئية المختلفة والاضطرابات والمتغيرات أو التصميمات المختلفة. على سبيل المثال ، من الممكن استخدام في السيليكو تجارب للكشف عن أهداف دوائية محتملة (Undrovinas وآخرون. 2006) ، لتحسين جوانب معينة من النظام (مثل Reijenga وآخرون. 2001) ، لمحاكاة سلوك المسوخ (مثل براي وآخرون. 1993 Novak & amp Tyson 1997) ولتحليل قابلية تطور وقوة أنظمة معينة (von Dassow وآخرون. 2000). لا يمكن إجراء التحليلات بهذه السرعة والتكلفة المنخفضة فقط باستخدام الأساليب التجريبية الكلاسيكية. أخيرًا ، وربما بنفس القدر من الأهمية ، يمكن للنماذج أن توضح لنا فجوات في فهمنا للعمليات البيولوجية وتقترح أي جزء من اللغز أو البيانات التجريبية مفقودة. تسمح عملية النمذجة نفسها للفرد بفحص ليس فقط البيانات المتاحة ، ولكن أيضًا الآليات المعروفة أو المفترضة. يؤدي هذا غالبًا إلى أسئلة أكثر من الإجابات ، ويظهر أحيانًا أن الآليات التي يُعتقد أنه تم إنشاؤها لا تتناسب فعليًا مع الظواهر المرصودة أو غير كافية لشرح النتائج التجريبية.

كانت النمذجة جزءًا لا يتجزأ من عمل البيولوجيا التركيبية منذ بدايتها (Elowitz & amp Leibler 2000 Gardner وآخرون. 2000). في الواقع ، لا تختلف البيولوجيا التركيبية عن أي نشاط هندسي آخر ، حيث يكون تصميم النماذج واختبارها بنفس أهمية خطوة البناء. هذا لا يسمح فقط بتوفير الوقت والجهد ، بل يسمح أيضًا بتحسين المنتج النهائي. ومع ذلك ، فإن النمذجة في علم الأحياء غالبًا ما تكون عملية تكرارية ، يجب التحقق من صحة النموذج الرياضي من خلال مقارنة تحليلات النموذج ونتائج المحاكاة مع القياسات التجريبية ، ويتم صقلها اعتمادًا على هذه المقارنات. هذا ينطبق بشكل خاص على النمذجة الحركية حيث أن وصف الحالة النهائية للنظام مطلوب مع تغييراته على مدى زمني. يوضح الشكل 1 عملية إنشاء النموذج.

الشكل 1 رسم تخطيطي يصف عملية إنشاء النموذج ، تتمحور حول ملف النموذج. تأتي المدخلات الخارجية من الأدبيات أو قواعد البيانات أو التجارب. يعطي التحقق من الصحة وتقدير المعلمة ردود فعل مباشرة على النموذج ، بينما يمكن للتنبؤات أيضًا أن توجه التصميم التجريبي. الأهداف المرجوة من النظام المراد تصميمه هي جزء من معظمها في السيليكو تعد دورة التصميم والتنفيذ البيولوجي والتركيب والمقارنة للنموذج بالملاحظات جزءًا من دورة تطوير نموذج بيولوجيا الأنظمة القياسية.

بناءً على احتياجات مجتمع البحث ، وتوافر أدوات برمجية أكثر قابلية للاستخدام ووجود معايير المجتمع ، تحول مجتمع المستخدمين من خبراء متخصصين في النمذجة الرياضية إلى علماء من خلفيات واهتمامات مختلفة. أصبحت النماذج الحسابية الآن أداة أخرى للاستخدام بالتوازي مع الأساليب التجريبية المختلفة. النمذجة ، رغم ذلك ، لا تزال مهمة متعددة التخصصات للغاية. أولاً ، يتطلب فهمًا تفصيليًا للعمليات البيولوجية والكيميائية الحيوية التي سيتم نمذجتها. عادة لا تكون هذه المعرفة البيولوجية وحدها كافية ، لأن ترميزها في شكل يمكن قراءته بواسطة الكمبيوتر يتطلب بعض المعرفة الرياضية ، واعتمادًا على الأدوات المستخدمة ، يحتاج أيضًا إلى بعض مهارات الكمبيوتر. من ناحية أخرى ، تتطلب معالجة النماذج والتقييم والتنبؤ خبرة حسابية وبيولوجية. لذلك ، بينما تظهر المزيد والمزيد من أدوات البرمجيات القابلة للاستخدام بشكل حدسي ، لا تزال النمذجة جهدًا تعاونيًا للخبراء في مختلف المجالات أو مجال العلماء مع نظرة عامة وتدريب أوسع.

2. تنسيقات لتمثيل النموذج

يمكن تمثيل الشبكات التنظيمية الكيميائية الحيوية أو الجينية بأشكال وأشكال مختلفة ، بدءًا من مسار خام أو خريطة تفاعل على منديل إلى نظام من المعادلات التفاضلية العادية في نظام الجبر الحاسوبي (ملف نصي عادي) ، أو إلى إنتاج الكود القابل للتنفيذ. دورات زمنية متكاملة لنظام معين. شبكات التفاعل البيولوجي لها طبقات منطقية عديدة مختلفة. تتكون الطبقة الأولى من الجزيئات المتفاعلة ، بالإضافة إلى جميع متغيرات الحالة. تحدد التفاعلات بين المكونات وشبكة التفاعل الأساسية طوبولوجيا النظام وتشكل الطبقة المنطقية التالية. تتكون الطبقة الأخيرة من التعبيرات الرياضية للتفاعلات والتدفقات داخل وخارج النظام.

تتطلب أنشطة البيولوجيا التركيبية دمج أكبر عدد ممكن من هذه الطبقات في النموذج. يتطلب تحليل الشبكة الثابتة أو إنشاء طفرات حذف لنظام معرفة قياس العناصر المتفاعلة في التفاعلات. لا يمكن دائمًا اشتقاق هذا بسهولة من ، على سبيل المثال ، تمثيلات المعادلات التفاضلية العادية دون معلومات إضافية. علاوة على ذلك ، في بعض الحالات ، يجب تفسير النظام باستخدام أطر نمذجة مختلفة. على سبيل المثال ، في الشبكات التنظيمية الجينية ، قد يكون الإطار الحتمي المستمر مفيدًا لتحليل التشعب للسلوك النوعي ، بينما يمكن استخدام نهج منفصل احتمالي لاستكشاف القوة والسلوك عند تركيزات منخفضة من بعض الأنواع (Elowitz & amp Leibler 2000).

كأدوات مخصصة ، تستهدف مهام مختلفة ، غالبًا ما تستخدم تنسيقات إدخال مميزة ، يتطلب استخدامها تحويل أو إعادة تنفيذ النماذج الأصلية إلى تنسيقات متوافقة. يمكن أن يكون التحويل اليدوي لنموذج من تنسيق إلى آخر مهمة شاقة للغاية ومعرضة للخطأ ، خاصة للأنظمة الأكبر حجمًا. سهّل تطوير صيغ التبادل للنماذج الرياضية استخدام البرامج والأدوات المختلفة وسهّل إعادة استخدامها وتعديلها. تنسيقان للغة الترميز الموسعة (XML) ، لغة ترميز بيولوجيا الأنظمة (SBML) (Hucka وآخرون. 2003) ولغة الترميز الخلوية (CellML Lloyd وآخرون. 2004) ، اكتسبت دعمًا واسعًا في مجتمع النمذجة. كلتا اللغتين تخزن التعبيرات الرياضية باستخدام محتوى MathML v. 2.0 (Ausbrooks وآخرون. 2003) واستخدم إطار عمل وصف الموارد (RDF Beckett 2004) لتضمين البيانات الوصفية المقروءة آليًا.

تم تطوير SBML كجهد مجتمعي ويتكون من قوائم هرمية من العناصر التي تصف أجزاء النموذج ، وتجمعات الكيانات المتفاعلة والتفاعلات التي تحدث. يمكن وضع تعليقات توضيحية على جميع العناصر والتعليق عليها في كل من الأشكال التي يمكن قراءتها بواسطة الإنسان وقابلة للتفسير الآلي ، مما يسمح بتوثيق شامل ومراجع خارجية ليتم تضمينها مباشرة في ملف النموذج. تم اعتماد SBML على نطاق واسع من قبل مجتمع النمذجة وهو مدعوم بمئات من الأدوات (انظر http://sbml.org/SBML_Software_Guide). كان مفتاح النجاح والاعتماد السريع لـ SBML من قبل المطورين هو توفر مكتبة واجهة برمجة التطبيقات العامة (API) ، lib SBML (Bornstein وآخرون. 2008). يتيح ذلك الوصول السهل إلى جميع عناصر النموذج ويوفر فحصًا للوحدة والدلالات لملف SBML. لذلك يمكن للأدوات استخدام التمثيل الداخلي الخاص بها للنموذج الرياضي ، وقراءة ملف النموذج الفعلي وكتابته عبر الواجهة المعيارية. نظرًا لأن libSBML يتميز أيضًا بالارتباطات بلغات البرمجة النصية الشائعة ، يمكن لمنظم الكمبيوتر المتعلم استخدام واجهة برمجة التطبيقات (API) لمعالجة الدُفعات تلقائيًا أو التحليل البسيط لملفات SBML.

حجرة. وعاء مُقلب جيدًا تتواجد فيه الأنواع وتحدث التفاعلات. قد يكون هذا ، على سبيل المثال ، غشاء ثنائي الأبعاد أو خلية تمتد في ثلاثة أبعاد.

صنف. كيانات من نوع معين مقيمة في حجرة معينة. على سبيل المثال ، قد يشكل ATP في الميتوكوندريا الحجرة نوعًا مختلفًا عن ATP في العصارة الخلوية.

معامل. وهذا يشمل جميع الأنواع الأخرى من الكميات المسماة. يمكن أن تكون ثابتة أو متغيرة ويتم تعديلها بواسطة القواعد والأحداث. على سبيل المثال ، يمكن تعريف القوة الدافعة للبروتون أو الجهد الكيميائي كمعامل في النموذج.

رد فعل. تحول بين نوع واحد أو أكثر بقياسات كيميائية محددة. لا يشمل هذا التفاعلات الكيميائية فحسب ، بل يشمل أيضًا النقل بين المقصورات والتدفق الداخلي والخارجي وما إلى ذلك. يمكن أن يحتوي على تعبير لقانون المعدل.

القاعدة. التعبيرات الرياضية لتحديد العلاقات بين الأنواع والمعلمات. تأتي في ثلاثة أنواع مختلفة: تقوم قواعد التخصيص بتعيين قيمة تعبير ما إلى متغير ، وقواعد المعدل لمعدل تغيره مع مرور الوقت ، وتحدد القواعد الجبرية المساواة الجبرية العامة بين المتغيرات المختلفة.

وظيفة. تعريفات الوظائف الرياضية القابلة لإعادة الاستخدام.

حدث. تغيير متقطع يحدث عندما تتغير حالة المشغل من خطأ إلى صحيح. يمكن أن يكون التغيير في جميع أنواع المتغيرات ويمكن تطبيقه على أكثر من واحد.

ملحوظة. ملاحظات موسعة بلغة ترميز النص التشعبي الموسعة (XHTML) ، والمقصود منها أن تكون ذات شكل يمكن قراءته من قبل الإنسان.

حاشية. ملاحظة. البيانات الوصفية الخاصة بالبرامج والتوصيفات المتحكم فيها والقابلة للقراءة آليًا بتنسيق RDF.

يوفر تنسيق XML الآخر المستخدم على نطاق واسع ، CellML ، بنية أكثر نمطية. يتكون وصف النموذج من المكونات وقوائم الاتصالات فيما بينها. يؤدي هذا إلى مزيد من المرونة ، خاصة بالنسبة للنماذج متعددة النطاقات ، ويسمح بإعادة استخدام المكونات بسهولة على حساب الدلالات الكيميائية الحيوية. تم تطوير اللغة في الغالب من قبل مشروع Physiome ومعهد الهندسة الحيوية في جامعة أوكلاند. حتى الآن ، كان هناك عدد أقل من الأدوات التي تدعم CellML (http://www.cellml.org/tools) مقارنة بـ SBML ، ولكن توجد أدوات للتحويل بين كلا التنسيقين (انظر http://www.ebi.ac.uk/compneur- srv / sbml / convertors / SBMLConvertors.html Schilstra وآخرون. 2006) ، مما يتيح للمستخدمين إمكانية الاختيار من بين مجموعة واسعة من برامج التقييم.

جزء مهم من النماذج الرياضية ، على الرغم من إهماله في كثير من الأحيان ، هو الأوصاف والتوصيفات لمكوناتها. قد يكون من المفيد جدًا تضمين المراجع والتعليقات مباشرةً في ملف النموذج ، خاصةً للنماذج الأكبر حجمًا. هنا ، يمكن أن يصبح من الصعب تخصيص الكيانات والعلاقات لأنواعها وعملياتها البيولوجية المقابلة ، وقد يكون من الصعب تتبع المصادر الأصلية. لذلك ، يجب دائمًا الاحتفاظ بالتوثيق الشامل للنموذج والمراجع الخاصة بمكوناته مع ملف النموذج ، خاصةً إذا كان هناك أكثر من شخص واحد مشترك في عملية النمذجة. تقليديًا ، يوصف النموذج بنص مرفق مفصول ماديًا عن الملف الذي يحتوي عليه.في حين أنه من الضروري الحصول على وصف مطول للنموذج ، فإن التعليق التوضيحي المباشر للعناصر مفيد جدًا لتبادل النماذج وإعادة استخدامها ، وكذلك أثناء عملية الإنشاء نفسها. معيار إعداد التقارير لمعالجة النماذج البيولوجية والتحقق منها - MIRIAM أو الحد الأدنى من المعلومات المطلوبة في شرح النماذج البيوكيميائية (Le Novère وآخرون. 2005) - لا يعطي فقط القواعد نموذجًا مشفرًا ليتوافق معها ، ولكنه يحدد أيضًا نموذجًا للتعليقات التوضيحية التي يتم التحكم فيها. يتكون مخطط التعليقات التوضيحية هذا من معرف ثابت في شكل معرف مورد موحد (URI Berners-Lee وآخرون. 2005) لكل معلومة ومعرف يشير إلى علاقة هذه المعلومات بالعنصر المشروح. يتم توفير كتالوج للموارد (مثل المفردات أو قواعد البيانات الخاضعة للرقابة) في موارد MIRIAM (Laibe & amp Le Novère 2007) ، بالإضافة إلى مجموعة من الخدمات عبر الإنترنت ، والتي تتضمن إنشاء وحل التعليقات التوضيحية النموذجية في شكل URI. القدرة على تضمين ليس فقط الوصف الرياضي ، ولكن أيضًا المعلومات المرجعية والبيولوجية في نفس الملف تبسط تبادل وإعادة استخدام النماذج وتسهل العمل التعاوني لمجموعات من الأشخاص في نموذج واحد. باستخدام لغة نمذجة رسمية مثل SBML ، يمكن أن تصبح عملية النمذجة جهدًا تعاونيًا بسهولة ، حيث يستخدم أشخاص مختلفون أدوات مختلفة لإدراج اللاعبين الرئيسيين وردود الفعل والتعليقات التوضيحية وقوانين معدل الحركة والتعبيرات الرياضية وقيم المعلمات في ملف نموذج مشترك.

3. جمع القطع والقطع

قبل إنشاء نموذج حركي مفصل ، يحتاج المرء إلى سرد العناصر الرئيسية. هذه هي الأنواع الرئيسية المتفاعلة والملاحظات الأخرى للنظام الذي يريد المرء أن يصوغه (ثم يصنعه بعد ذلك). بالإضافة إلى ذلك ، يجب على المرء أن يجمع تفاعلاته التنظيمية المعروفة والتفاعلات الكيميائية من المؤلفات العلمية وقواعد البيانات. يعتمد نوع قواعد البيانات الخاصة بي بشكل كبير على النظام الذي سيتم نمذجته. بصرف النظر عن القائمة العامة الواردة في قضية قاعدة بيانات أبحاث الحمض النووي السنوية (Galperin & amp Cochrane 2009) ، يتم تقديم نظرة عامة على الموارد الأكثر تحديدًا للنمذجة في Ng وآخرون. (2006) و Wierling وآخرون. (2007). بالنسبة للمسارات والتفاعلات البيولوجية ، فإن موسوعة كيوتو للجينات والجينوم (KEGG Kanehisa وآخرون. 2008) ، Reactome (Vastrik وآخرون. 2007 ماثيوز وآخرون. 2008) ، النمر (مي وآخرون. 2007) و Meta- و BioCyc (Caspi وآخرون. 2008) قواعد البيانات مفيدة بشكل خاص ، لأنها إما تصدر مباشرة في تنسيقات يمكن قراءتها بواسطة الكمبيوتر (مثل SBML) أو يمكن تحويل مخرجاتها إليها.

تكملة للبحث من خلال قواعد البيانات ، يمكن أن تساعد أدوات التنقيب عن النص في تقييد عدد المقالات التي يتم فحصها وكذلك الكشف عن معلومات قيمة حول التفاعلات أو العلاقات بين المكونات. من بين الأدوات المتاحة ، كانت i HOP (http://www.ihop-net.org/ Hoffmann & amp Valencia 2004) و Chilibot (http://www.chilibot.net Chen & amp Sharp 2004) مفيدة لنا في تحديد الإمكانات تفاعلات البروتين والجينات المنظمة. نظرة عامة على التنقيب عن النص وبعض الأدوات المتاحة في Krallinger وآخرون. (2008) وأنانيادو وآخرون. (2006) ، على سبيل المثال.

الاحتمال الآخر هو البدء بالنماذج الحالية التي يمكن الوصول إليها من خلال قواعد البيانات والمستودعات مثل قاعدة بيانات النماذج الحيوية (Le Novère وآخرون. 2006 الشكل 2) ، محاكاة الويب Java (JWS) عبر الإنترنت (Snoep & amp Olivier 2002) أو مستودع نموذج CellML (Lloyd وآخرون. 2008). لمزيد من النماذج المحددة ، على الرغم من أنها لا تزال بعيدة تمامًا عن مشاريع البيولوجيا التركيبية ، يمكن للمرء استخدام مستودعات مخصصة مثل قاعدة بيانات الإشارات الخلوية الكمية (Sivakumaran وآخرون. 2003) و ModelDB (Hines وآخرون. 2004). لا تعطي النماذج المخزنة في قواعد البيانات هذه فكرة عن التفاعلات والأنواع التي قد يحتاجها المرء لنمذجة عملية بيولوجية معينة فحسب ، بل توفر أيضًا نظرة عامة على العلاقات الرياضية التي يستخدمها باحثون آخرون. يمكن بعد ذلك استخدام النماذج أو أجزاء منها كنقاط بداية أو وحدات لجهود النمذجة الجديدة. تسمح بعض قواعد البيانات هذه ، مثل قاعدة بيانات النماذج الحيوية ، مباشرة بإنشاء واسترجاع نماذج فرعية كاملة بناءً على المكونات التي يختارها المستخدم. هناك إمكانية أخرى لإنشاء نماذج من النماذج الحالية وهي استخدام بيئة النمذجة عبر الإنترنت مثل W eb C ell (Lee وآخرون. 2006). بالإضافة إلى تقديم طرق تحليل متعددة ، يسمح W eb C ell أيضًا باستيراد وتعديل النماذج من قاعدة بيانات النماذج الحيوية و JWS عبر الإنترنت. تم اعتماد نهج مثير للاهتمام بواسطة SYCAMORE (Weidemann وآخرون. 2008) ، الذي يدمج قاعدة بيانات حركية الإنزيم الكمية - SABIO-RK (Wittig وآخرون. 2006) - مع القدرة على إنشاء نماذج عبر واجهة الويب الأمامية. يمكن تنزيلها لاحقًا بتنسيق SBML.

الشكل 2 قاعدة بيانات النماذج الحيوية هي مورد يقدم إصدارات منسقة ومشروحة من النماذج المنشورة في الأدبيات التي راجعها النظراء. يمكن تصفح النماذج أو تنزيلها أو محاكاتها مباشرة عبر الإنترنت ، كما هو موضح هنا لمانع الضغط.

لتتبع الموارد والمراجع المستخدمة لمكونات النموذج ، كما هو مذكور أعلاه ، يمكن تخزينها في ملف نصي منفصل أو كبيانات وصفية في ملف XML مباشرة. يقدم SBML احتمالين للأخير: (1) الملاحظات و (2) عناصر التعليقات التوضيحية. يوفر كلاهما مزيدًا من المعلومات حول عناصر النموذج بتنسيق يمكن قراءته بواسطة الإنسان أو بتنسيق سهل الاستخدام للآلة ، على التوالي. يتم ترميز الملاحظات بلغة XHTML ، مما يوفر المرونة وسهولة القراءة البشرية. من ناحية أخرى ، تحتوي التعليقات التوضيحية على بيانات وصفية يمكن قراءتها آليًا بتنسيقات XML مختلفة ، والتي قد تكون معلومات خاصة بالبرمجيات أو مؤشرات قياسية ، مثل شرح MIRIAM في RDF. العديد من أدوات دعم SBML ، مثل محرر SBML (Rodriguez وآخرون. 2007) ، CO mplex P athway SI mulator (COPASI ، Hoops وآخرون. 2006) و C ell D esigner (Funahashi وآخرون. 2003) ، والسماح بالاحتفاظ بالملاحظات أو التعليقات التوضيحية.

4. إنشاء النموذج

بعد تحديد المكونات الرئيسية للنظام ، والكيانات المتفاعلة والطوبولوجيا ، يحتاج المرء إلى تصميم الهيكل الكيميائي الحيوي للنموذج. في حين أن الخطوات السابقة تعاملت مع علم الأحياء ، فإن الخطوة الحالية تتعامل مع الكيمياء. لا تزال هذه الخطوة مستقلة عن إطار رياضي محدد أو صيغة مستخدمة. بينما يمكن رسم مخطط القياس المتكافئ والتأثير النوعي للأنواع في هذه المرحلة ، لا يلزم وجود تعبيرات رياضية ومعلومات كمية لإنشاء نموذج ثابت للنظام. ومع ذلك ، فقد تم بالفعل استخدام هذا النوع من النموذج لإجراء تحليل هيكلي أساسي ، على سبيل المثال لبناء نماذج حالة ثابتة من التمثيل الغذائي (للمراجعات ، انظر Klamt & amp Stelling 2003 Llaneras & amp Picó 2008 Planes & amp Beasley 2008) ، ودراسة الشبكات المنطقية (Glass & amp Kauffman 1973 Thomas 1973) أو البحث عن أشكال الشبكة في الشبكات التنظيمية (Alon 2007).

يدعم SBML هذه المرحلة ، خاصة مع عنصر التفاعلات. هذا العنصر ليس مخصصًا فقط للتفاعلات الكيميائية البسيطة ، ولكنه يشمل جميع أشكال التحولات بين الكيانات المادية وكذلك النقل والتدفقات الداخلية والخارجية. يجب أن يحتوي كل تفاعل على مادة تفاعل أو منتج واحد على الأقل باستخدام قياس كيميائي معين. علاوة على ذلك ، يمكن أن يحتوي أيضًا على نوع يسمى المعدلات ، والتي لا يستهلكها التفاعل ، ولكنها تؤثر على معدله في شكل ما. لمزيد من توصيف دور المواد المتفاعلة والمعدلات المعنية ، من المفيد استخدام المفردات الخاضعة للرقابة. يسمح SBML بإدراج المعرفات التي تشير إلى مصطلحات من علم الوجود لبيولوجيا الأنظمة (SBO Le Novère وآخرون. 2007) لإضافة طبقة من الدلالات على مكونات النموذج. SBO عبارة عن مجموعة من ستة مفردات مضبوطة تغطي ، في سياق بيولوجيا الأنظمة ، عناصر مثل التفاعلات والتعبيرات الرياضية وأطر النمذجة والمعلمات الكمية. في نموذج المكبِع ، على سبيل المثال ، LacIp يمكن وصفه بأنه مثبط (SBO: 0000020) في نسخ ملف رباعي الجين.

فيما يتعلق بمخططات الدوائر الكهربائية ، يمكن أن يكون التمثيل الرسومي لنظام كيميائي حيوي مفيدًا جدًا في هذه المرحلة. على عكس التخصصات الهندسية ، ومع ذلك ، لا يزال يتعين على المجتمع البيولوجي اعتماد لغة رسومية فريدة وموحدة لعرض الشبكات البيولوجية. يعد الترميز الرسومي لبيولوجيا الأنظمة (SBGN) لغة مرئية تم اقتراحها مؤخرًا لتمثيل الشبكات البيولوجية (Le Novère وآخرون. 2008). يسمح بتمثيل لا لبس فيه لمخطط عملية لشبكة التفاعل. يسمح عدد من أدوات النمذجة لأحد بتخطيط الأنظمة بيانياً وتخزينها في SBML. C ell D esigner (Funahashi وآخرون. 2003) ، على سبيل المثال ، محرر رسومي مستقل عن النظام الأساسي للشبكات البيولوجية ، حيث يمكن استيراد النماذج الموجودة بتنسيق SBML وتعديلها. يمكن أيضًا إضافة الملاحظات وإدخال المعادلات الرياضية للتفاعلات المختلفة. يمكن إضافة الركائز والمنتجات والمعدِّلات إما مباشرة عن طريق رسم وتعيين الوصلات المناسبة على اللوحة القماشية أو عن طريق إدخالها في القوائم المقابلة. يتم تخزين المعلومات حول التخطيط الرسومي بتنسيق خاص بـ C ell D esigner في عناصر التعليق التوضيحي لملف SBML الذي تم إنشاؤه حديثًا. يظهر تخطيط متوافق مع SBGN لمانع الضغط وواجهة C ell D esigner في الشكل 3.

الشكل 3 توفر واجهة C ell D esigner مجموعة كبيرة من العناصر الرسومية وخيارات التحرير لتصميم النماذج البيوكيميائية والرياضية. يتم تمثيل المكبِط في التدوين الرسومي لـ C ell D esigner ، وهو مشتق من SBGN. النافذة المرتفعة هي شكل تحرير للقانون الحركي لتفاعل واحد.

بينما يعد C ell D esigner محررًا بشكل أساسي ، إلا أنه يحتوي على بعض ميزات إمكانية التكامل الحتمية المضمنة ، استنادًا إلى طرف ثالث ODE S olver ، SBML ode S olver (Machné وآخرون. 2006). للحصول على تحليل أكثر شمولاً ، مثل التفسيرات العشوائية أو التحليل الهيكلي ، فإن حزمة المحاكاة COPASI (الأطواق وآخرون. 2006) والمجموعة الكبيرة من الأدوات الموجودة في طاولة عمل بيولوجيا الأنظمة (SBW Sauro وآخرون. 2003) يمكن استخدامها مباشرة من البرنامج. باستخدام SBML كتنسيقها الأصلي ، ينتج C ell D esigner نماذج يمكن استخدامها من قبل جميع أفراد عائلة أدوات SBML المدركة.

على الرغم من كونها بديهية وجذابة بصريًا ، يمكن أن تصبح العروض الرسومية مشوشة ومربكة للشبكات الكبيرة أو المتصلة بكثافة. هناك إمكانية أخرى لإنشاء نماذج وتحريرها بتنسيق SBML وهي محررات تستند إلى النموذج تمامًا ، والتي توفر قابلية التوسع مع الاحتفاظ بالدقة. نود فقط أن نذكر بعض الأساليب المختلفة في هذه المرحلة. على سبيل المثال ، J ig C ell (Vass وآخرون. 2004) ، الذي تم تطويره في معهد Virginia Polytechnic وجامعة amp State ، يستخدم منشئ نموذج في شكل جدول بيانات. هذا يعطي نظرة عامة لطيفة حتى في حالات الشبكات المعقدة والمكثفة. وفي الوقت نفسه COPASI (Hoops وآخرون. 2006) تمثيلاً يشبه الشجرة لعناصر النماذج المختلفة ، وجداول البيانات لسرد عناصر من نوع معين بسرعة ونماذج أكثر تفصيلاً لتغيير كل عنصر بدقة. في حين أنه من المحتمل أن يكون أبطأ من إدخال التفاعلات في جدول بيانات خالص ، فإنه يسهل تعريف التفاعلات المعقدة ويقوم بإجراء تدقيق مكثف في الخلفية. يتم اتباع نهج ثالث بواسطة ditor SBMLE (Rodriguez وآخرون. 2007 الشكل 4) ، محرر SBML منخفض المستوى ، حاليًا بدون أي قدرات محاكاة أو تقييم. يعتمد SBMLE ditor بشكل وثيق على تنسيق SBML نفسه ويدعم اللغة بأكملها. لقد كان حتى الآن أحد القلة التي تسمح بالدخول المباشر لتعليقات MIRIAM و SBO التوضيحية.

الشكل 4 ditor SBMLE يسمح بمعالجة مفصلة لجميع عناصر SBML. هنا يتم عرض النظرة العامة الرئيسية ، ونموذج تحرير الأنواع ، وحوار التعليقات التوضيحية MIRIAM ورمز MathML للقانون الحركي الموضح في الشكل 2.

في الآونة الأخيرة ، تم إنشاء بعض الأدوات التي تهدف تحديدًا إلى البيولوجيا التركيبية. كان أحد الأساليب هو إنشاء شبكات تنظيم الجينات من وحدات قابلة لإعادة الاستخدام مماثلة لتلك المخزنة في سجل معهد ماساتشوستس للتكنولوجيا للأجزاء البيولوجية القياسية (Endy 2005). تم تقديم جهد باستخدام الوحدات الكمية بتنسيق CellML في مؤتمر SysBioSys 2007 (Rouilly وآخرون. 2007). سمحت بعض الأدوات الحديثة بالتصدير بتنسيق SBML ، مثل أداة سطر الأوامر A smparts (Rodrigo وآخرون. 2007) ، مجموعة برامج البيولوجيا التركيبية (Hill وآخرون. 2008) ، وكذلك ملحق (Marchisio & amp Stelling 2008) مكتوب لـ P ro M ot (Ginkel وآخرون. 2003) جناح. لا تزال هذه الأدوات والجهود في مراحلها الأولى ، لكنها بدت بالفعل قابلة للاستخدام تمامًا ، حتى لو لم تقدم النطاق الكامل للأجزاء البيولوجية المتاحة في السجل.

5. إدخال العلاقات الرياضية والقيم العددية

بمجرد إنشاء بنية شبكة محتملة ، يجب اختيار إطار رياضي لتطوير نسخة حركية. نظرًا لأن الأطر المختلفة تسمح بالتحليل والتفسير التكميليين ، فمن المفيد غالبًا إبقاء النموذج قابلاً للتفسير بأكثر من شكلية واحدة. ثبت أن الاستخدام المتزامن للأطر البديلة مفيد ، خاصة لشبكات تنظيم الجينات. يمكن ملاحظة ذلك في إحدى الأوراق البحثية البارزة في البيولوجيا التركيبية التي تصف المكبِط (Elowitz & amp Leibler 2000). تم استخدام نهج حتمي لتحليل السلوك النوعي في الاعتماد على المعلمات الرئيسية ، بينما سمحت النسخة العشوائية باختبار متانة التصميم للضوضاء النسخية. في هذا القسم ، سوف نركز على هذين الإطارين.

نظرًا لأن العمليات الكيميائية والبيولوجية هي بطبيعتها عشوائية ، يبدو من الطبيعي أخذ ذلك في الاعتبار عند النمذجة. ومع ذلك ، فإن عمليات المحاكاة العشوائية تكون بشكل عام أكثر كثافة من الناحية الحسابية ، وبالنسبة للنماذج الأكبر أو أعداد أكبر من المكونات المتفاعلة ، يصبح هذا العبء محدودًا بسرعة. بالنسبة لعمليات التمثيل الغذائي ، وفي التفاعلات العامة التي تتضمن أكثر من بضع مئات من الجزيئات ، يوفر النهج الحتمي المستمر تقريبًا جيدًا إلى حد ما.

غالبًا ما يصعب العثور على الأشكال المناسبة للتعبيرات الرياضية التي تصف التفاعلات وسرعات التفاعل في البداية ، وفي بعض الأحيان يجب تجربة قوانين حركية مختلفة. بشكل عام ، يمكن للمرء تطبيق التعبير المشتق من المبادئ الأولى أو ، إذا كانت آلية التفاعل غير محددة جيدًا أو غير معروفة تمامًا ، يلجأ إلى قوانين المعدل العام أو التجريبي. أحد الأساليب الأكثر عمومية هو استخدام قوانين الأسعار المشتقة وفقًا لقانون حركية الحركة الجماعية. في هذه المعادلات ، معدلات التفاعل تتناسب طرديًا مع أنشطة المواد المتفاعلة (مثل التركيزات في التخفيفات والضغوط الجزئية في الطور الغازي) إلى قدرة ، تسمى ترتيب التفاعل لهذا المتفاعل ، والتي تساوي قياس العناصر المتفاعلة. يسمح هذا بالتوليد التلقائي للتعبيرات الحركية لشبكات تفاعل أكبر بمعلومات متكافئة فقط ، عن طريق تركيب مجموعات بيانات تجريبية (تؤدي أحيانًا إلى أوامر تفاعل تختلف عن مقاييس العناصر المتكافئة). بينما يتم تطبيق هذا النهج على نطاق واسع في الأنظمة الكيميائية وقد تم استخدامه أيضًا بنجاح كبير في نقل الإشارة ، فإنه يؤدي إلى عدد كبير من المعلمات والخطوات الوسيطة ، ويحتاج إلى التضمين الصريح للإنزيمات المحفزة. بالنسبة للتفاعلات المحفزة بالإنزيم باستخدام آلية تفاعل معروفة ، يمكن تطبيق قوانين المعدل الميكانيكي باستخدام افتراضات شبه مستقرة أو توازن سريع. يمكن البحث عن قوانين الأسعار الأكثر شيوعًا في الكتب المرجعية (مثل Segel (1993) أو Cornish-Bowden (2004)) أو اشتقاقها باستخدام طرق مثل القانون المستند إلى الرسم البياني المشتق من King & amp Altman (King & amp Altman 1956 Chou 1989) . ومع ذلك ، بالنسبة لهذا النهج ، فإن المعرفة التفصيلية لآليات التفاعل وتعديل المؤثرات أمر ضروري. يجب أيضًا معالجة كل تفاعل على حدة ، وهو ما قد لا يكون ممكنًا للنماذج الأكبر حجمًا. كبديل ، يمكن استخدام التعبيرات العامة ، والتي تُظهر السلوك العام للتفاعلات المحفزة بالإنزيم لنطاقات مختلفة حول الحالات المرجعية للنظام. هذه تسمح بإدراج المعلمات المشتقة تجريبياً أو المنشطات أو المثبطات إلى حد ما ، حتى لو كانت الآليات الدقيقة غير معروفة. أبسط أشكال هذه هي قوانين معدل ميكايليس مينتين غير القابلة للإلغاء وقوانين أسعار هيل الشبيهة. ومع ذلك ، نظرًا لأنه لا يمكن افتراض أن العديد من التفاعلات أحادية الاتجاه في الغالب (Cornish-Bowden & amp Cardenas 2001) ، فقد تم اقتراح أشكال عكسية عامة لقوانين معدل الكيمياء الحيوية الأكثر استخدامًا. ومن الأمثلة على ذلك قانون معدل الملاءمة (ليبرمايستر وأمب كليب 2006) ومعادلة هيل القابلة للعكس (روهور) وآخرون. 2007). تسمح قوانين المعدل هذه أيضًا بتضمين الثوابت الديناميكية الحرارية ، والتي يسهل قياسها من الثوابت الحركية ، وتبني المعلمات المحددة تجريبياً بسهولة ، مع عرض سلوكيات مشابهة لآليات أكثر تفصيلاً على نطاق واسع من التركيزات.

تقدم بعض أدوات النمذجة قوانين أسعار محددة مسبقًا. على سبيل المثال ، يحتوي COPASI و W eb C ell على مجموعة واسعة من قوانين الإنزيم والقوانين الحركية العامة التي يمكن دمجها بسهولة في النموذج أو استخدامها لإنشاء قوانين أكثر تفصيلاً إذا لزم الأمر. ميزة أخرى مثيرة للاهتمام تقدمها COPASI هي القدرة على تحويل جميع التفاعلات العكسية في نموذج إلى أزواج من التفاعلات التي لا رجعة فيها. في حين أن هذا بالطبع لا يعمل إلا مع قوانين المعدل البسيط ، إلا أنه يسهل استخدام التقييمات العشوائية اللاحقة ، حيث تتطلب هذه التقييمات استخدام الاحتمالات للأحداث الجزيئية الأولية.

يتم عرض طريقة ملائمة لتجربة قوانين الأسعار المختلفة للنماذج الأكبر بواسطة عصارة SBML (Dräger وآخرون. 2008) ، وهو مكون إضافي لـ C ell D esigner. يسمح للمرء باختيار ردود فعل فردية أو مجموعات ، وتطبيق قوانين حركية مختلفة من قائمة الشكليات. من أجل تعيين قانون المعدل المناسب واستخدام المواد المتفاعلة والمنتجات والمعدلات الصحيحة ، فإنه يحلل المخطط الذي تم إنشاؤه بواسطة C ell D esigner (شكل مشتق من SBGN) ويأخذ تعليقات SBO للأنواع والمعلمات والتفاعلات في الاعتبار. في حين أن هذا لا يزال يحتاج إلى بعض تفاعل المستخدم ، إلا أنه تحسن جدير بالثناء يسهل بشكل كبير إنشاء نماذج أكبر ومعقدة.

يتم استخدام أشكال رياضية مختلفة لنمذجة شبكات تنظيم الجينات (تمت مراجعتها في de Jong 2002). في حين أن هناك أدلة على الطبيعة العشوائية لتنظيم النسخ (Fiering وآخرون. 2000 Elowitz وآخرون. 2002) ، غالبًا ما يتم اختيار الأساليب الحتمية نظرًا لسهولة تقييمها وبساطة التحليل النوعي. في مثالنا ، القمع ، استخدم المؤلفون وظيفة تنظيم من نوع Hill لمحاكاة قمع النسخ ، وقوانين معدل الحركة الجماعية من الدرجة الأولى لنمذجة الترجمة والنسخ والانحلال. غالبًا ما تُستخدم الوظائف من نوع Hill لنمذجة التعبير الجيني أو نقل الإشارة لأنها مجموعة فرعية من الوظائف اللوجستية ، وتوفر استجابة جرعة سينية أو شبيهة بالخطوة للمُعدِّلات ، كما هو موجود في بعض النتائج التجريبية (Yagil & amp Yagil 1971 Rosenfeld وآخرون. 2005 كابلان وآخرون. 2008). في بعض الأحيان ، يمكن تبرير معامل هيل بسلوك ملزم تعاوني - كما في حالة المكبِع.في حالات أخرى ، يمكن أن يكون بسبب قيود الأبعاد أو آليات أكثر تعقيدًا ، يتم تصنيفها في خطوة واحدة. على الرغم من أن النسخ والترجمة يتألفان في الواقع من تفاعلات متعددة ، إلا أنهما تم تصميمهما على أنهما تفاعلات من الدرجة الأولى. بالنسبة لعمليات المحاكاة العشوائية ، كان لا بد من فك ارتباط المكبِط في خطوات مفردة. يسمح COPASI للمرء بتفسير النموذج باستخدام خوارزميات مختلفة. يظهر كل من عينة التقييم العشوائي والحتمية للدورة الزمنية في الشكل 5.

يقدم الشكل 5 COPASI طرقًا مختلفة لتقييم النماذج الديناميكية وعرض النتائج. يتم عرض الدورات الزمنية لأرقام البروتين في المكبِع هنا ، محسوبة باستخدام طريقة حتمية (LSODA) وطريقة عشوائية (جيبسون - بروك). يتم تمثيل الحل القطعي أيضًا على أنه مستوى الطور لبروتينات tetR و LacI ، مما يدل على التقارب مع دورة محدودة. في نافذة منفصلة ، يتم عرض تعليقات MIRIAM التوضيحية لعنصر النموذج.

لا يمكن وصف بعض المشكلات بشكل كافٍ دون مراعاة عدم التجانس المكاني. على الرغم من وصف العديد من العمليات داخل الخلايا بافتراض بيئة تفاعل جيدة التحريك ، فإن هذا النهج غير كافٍ للعمليات التي تتضمن تدرجات داخل الخلايا أو خارجها أو مجموعات غير متجانسة من الجزيئات (Kholodenko 2006). بينما توجد بعض الأدوات للمساعدة في الإنشاء والمحاكاة ، لا توجد حتى الآن تنسيقات قياسية لتبادل النماذج التي تتضمن عمليات انتشار. مسح شامل لمختلف مناهج النمذجة المكانية هو خارج نطاق هذه الورقة. تتم مراجعة أدوات البرمجيات المختلفة والشكليات المستخدمة بشكل شائع في Lemerle وآخرون. (2005) تاكاهاشي وآخرون. (2005) و Tolle & amp Le Novère (2006).

هناك مشكلة أخرى تعاني منها النمذجة ، لا سيما عمليات الإشارة ، وهي الانفجار التوافقي الناتج عن الارتباط البديل غير التساهمي للبروتينات ، والكيانات الجزيئية الموجودة في حالات مختلفة (المطابقات ، والتعديلات التساهمية ، وما إلى ذلك) أحد الأساليب لتجنب المشكلة هو استخدام نماذج السكان المستندة إلى الوكيل. في هذه الطرق ، تتم محاكاة التفاعلات بين الأفراد المستقلين. لقد تم توظيفهم بنجاح لمحاكاة ، على سبيل المثال ، سيارات الأجرة الكيماوية البكتيرية (Shimizu وآخرون. 2003) ، وتشكيل الأنسجة والعمليات التنموية (تمت مراجعتها في Thorne وآخرون. 2007) ونمو السرطان (Wang وآخرون. 2007 تشانغ وآخرون. 2009). النهج ذو الصلة هو استخدام النماذج المستندة إلى القواعد ، حيث لا يتم وصف التفاعلات الفعلية ، ولكن فقط القواعد لتوليدها أثناء عمليات المحاكاة (على سبيل المثال Blinov وآخرون. 2004 Lok & amp Brent 2005). كما هو الحال مع النمذجة المكانية ، لا يزال هناك عدد قليل من أدوات البرامج التي تدعم هذه الأطر ، خاصة في علم الأحياء.

6. إيجاد وتركيب المعلمات

لإنشاء نموذج كمي ، يجب اشتقاق قيم الثوابت والمعلمات المختلفة المستخدمة في العلاقات الرياضية. في حين أن هناك قدرًا هائلاً من القيم المشتقة تجريبياً في الأدبيات العلمية ، فإنه غالبًا ما يكون من الصعب العثور على القيم ذات الصلة في العديد من المنشورات.

بالنسبة للتفاعلات المحفزة بالإنزيم ، توجد قواعد بيانات مختلفة تساعد على تحديد القيم المناسبة. قاعدتا بيانات توفران معلمات حركية هما BRENDA (تشانغ وآخرون. 2008) و SABIO-RK المذكورة أعلاه (Wittig وآخرون. 2006). يقدم كلاهما مجموعة واسعة من المعلمات وردود الفعل المستخرجة من الأدبيات الأولية ، مع خيارات بحث قوية. يوفر SABIO-RK أيضًا الآلية المفترضة في المصدر الأصلي والقدرة على تصدير التفاعلات بتنسيق SBML. المساعدة في البحث المباشر في الأدبيات الأولية مقدمة من KMedDB (http://sysbio.molgen.mpg.de/KMedDB Hakenberg وآخرون. 2004). يسمح بالبحث في مستخلصات PubMed عن العديد من المعلمات الحركية بالاشتراك مع معرفات تفاعل المركب أو الكائن الحي أو الإنزيم. يتوفر مزيد من المعلومات حول الديناميكا الحرارية للتفاعلات البيولوجية في TECRDB (Goldberg وآخرون. 2004). مصدر آخر مفيد لمعلمات التفاعل العامة تم توفيره بواسطة بيانات Kinetik لقاعدة بيانات التفاعل الجزيئي الحيوي (Kumar وآخرون. 2008).

هناك طريقة أخرى شائعة للعثور على المعلومات الكمية وهي مراجعة الأوراق التي تصف جهود النمذجة في المجالات ذات الصلة. يمكن أن تكون هذه مصدرًا قيمًا للمؤشرات إلى الأدبيات الأولية ذات الصلة ، ويمكن أن تساعد أيضًا في اشتقاق أو تكييف المعلمات التجريبية للشكل المطلوب للنموذج. تعد قواعد البيانات ومستودعات النماذج المذكورة أعلاه مفيدة جدًا في هذا الصدد ، حيث إنها لا تقدم فقط نظرة عامة على النماذج المعلمة الحالية ، ولكنها تقدم أيضًا روابط إلى الأدبيات الأولية.

ومع ذلك ، لا يمكن اعتبار معظم المعلمات المشتقة من الأدبيات إلا كقيم إرشادية للنمذجة. إذا كانت الدورات الزمنية المقاسة أو بيانات الحالة المستقرة موجودة للنظام المراد وصفه ، فقد تم تنفيذ العديد من الخوارزميات لتقدير المعلمات وصقلها. للحصول على نظرة عامة موجزة ومقارنة لبعض هذه الطرق ، انظر Moles وآخرون. (2003) ورودريجيز فرنانديز وآخرون. (2006). يتم تقديم واجهة سهلة الاستخدام ومفيدة تتميز بالعديد من طرق التقدير العالمية والمحلية بواسطة COPASI. يسمح بالتركيب المتزامن لمجموعة فرعية من المعلمات لمجموعات مختلفة من القيم التجريبية. لسوء الحظ ، لم يتضمن COPASI حتى الآن دعمًا للأحداث. لتقدير المعلمات في النماذج التي تحتوي على أحداث ، توفر الأداة PET (http://mpf.biol.vt.edu/pet) ، المرتبطة ارتباطًا وثيقًا بمجموعة J ig C ell ، واجهة رسومية مريحة تتيح أيضًا تركيب سلاسل زمنية متعددة الوقت ذاته. هناك أداة أخرى تدعم الأحداث وهي SBML-PET المستندة إلى سطر الأوامر (Zi & amp Klipp 2006). لمستخدمي بيئة Matlab التجارية (The MathWorks ، MA ، الولايات المتحدة الأمريكية) ، SB toolbox 2 (Schmidt & amp Jirstrand 2006) ، وهي حزمة مجانية مع دعم SBML ، تقدم طرق تقدير وتحسين متنوعة.

يتم تضمين نهج مختلف تمامًا للبحث عن معلمات مناسبة تحت مصطلح التحسين. بينما تتشابه في أساليبها مع تقدير المعلمات ، إلا أنها تختلف من حيث أنها تحاول الوصول إلى هدف عالمي بدلاً من ملاءمة مجموعة معينة من المعلمات ، وتستخدم على نطاق واسع في هندسة أنظمة التمثيل الغذائي. للحصول على مراجعة شاملة ، انظر Banga (2008). مرة أخرى يقدم COPASI مجموعة من الخوارزميات المختلفة لتقليل وظيفة الهدف المستهدفة المحددة.

نهج آخر مثير للاهتمام هو تحليل التشعب العكسي (Lu وآخرون. 2006). يمكن استخدامه للعثور على قيم المعلمات التي تظهر سلوكيات نوعية معينة. على سبيل المثال ، يمكن أن يساعد في العثور على الأنظمة التي تعرض أنواعًا معينة من سلوك التحويل ، أو إنشاء مذبذبات أكثر قوة مع نظام معين. لسوء الحظ ، فإن الأدوات المتاحة لهذا النهج حتى الآن تستخدم M athematica (Wolfram Research ، Inc. ، IL ، الولايات المتحدة الأمريكية) أو Matlab ، ولا تزال تتطلب بعض المعرفة والمهارة المتخصصة. نأمل أن يتم تطوير أدوات أكثر سهولة في الاستخدام لهذا النهج الواعد في المستقبل.

7. التحقق من صحة النموذج وتقييمه

بمجرد إنشاء نموذج يمكن تشغيله ، لا يزال يتعين عليه إثبات قدرته على إعادة إنتاج النتائج التجريبية حتى الدقة المطلوبة والتنبؤ بالملاحظات المثيرة للاهتمام وغير التافهة.

يمكن إجراء التحقق من صحة النموذج على مرحلتين. يمكن أن تكون مراقبة السلوك النوعي للنموذج مفيدة للغاية في النماذج التي تحتوي على حالات ثابتة متعددة وتظهر سلوكيات شبيهة بالتبديل أو سلوك متذبذب. يمكن دراسة السلوك النوعي إما على أجزاء صغيرة من مساحة المعلمة ، ببساطة عن طريق المسح عبر نطاقات محددة من المعلمات والظروف الأولية ، أو عن طريق إجراء تحليلات التشعب العالمية. بينما يمكن الوصول إلى الإجراء الأول بسهولة في العديد من حزم البرامج ، يتطلب الإجراء الثاني المزيد من الأدوات المخصصة. يوفر C ell D esigner مسحًا بسيطًا عبر مجموعة من المعلمات من خلال SBML ode S olver ، بينما يوفر COPASI إمكانيات أكثر تعقيدًا. باستخدام الحلقات ومجموعات المهام ، من الممكن إجراء عمليات مسح لأكثر من شرط أو معلمة. لتحليل السلوك النوعي العالمي لنموذج ما ، يعد تحليل التشعب العددي أحد أكثر الطرق استخدامًا. من بين الأدوات المتاحة ، تم استخدام الأدوات المجانية XPP-A ut (Ermentrout 2002) و O scill 8 (http://oscill8.sourceforge.net/) ، وكلاهما يستخدم مكتبة A uto المستمرة (Doedel 1981) ، في علم الأحياء. النمذجة (مثل Csikász-Nagy وآخرون. 2006). تم دمج المحولات من SBML إلى التنسيق المستخدم بواسطة XPP-A ut و O scill 8 في J ig C ell و COPASI و SBW و SB toolbox 2 وقاعدة بيانات النماذج الحيوية. يمكن أيضًا دمج O scill 8 في SBW ، مما يسمح بتحليل النماذج في هذا الإطار بسلاسة.

فحص النموذج ، المستخدم أصلاً في علوم الكمبيوتر (Clarke & amp Emerson 1982 Queille & amp Sifakis 1982) ، هو نهج مختلف للتحقق من السلوك النوعي للأنظمة. يسمح للمرء باختبار ما إذا كان النظام يمكنه تحقيق أهداف معينة ، على سبيل المثال قابلية الوصول إلى حالات معينة ، أو التنشيط الزمني المتتالي لأنواع معينة أو السلوك التذبذب. بينما لا يزال دعم النماذج الديناميكية الكمية غير كافٍ ، فإن BIOCHAM (Calzone وآخرون. 2006) لديه دعم SBML محدود ويوفر إمكانات فحص النموذج. R o V er G e N e (Batt وآخرون. 2007) ، وهي إضافة مجانية لبيئة Matlab التجارية ، تهدف بشكل أكثر تحديدًا إلى تلبية احتياجات البيولوجيا التركيبية. باستخدام دالات أفينية مجزأة ، أو لوظائف متعددة الأفنية مناسبة بشكل أفضل لنمذجة تنظيم النسخ ، فإنه يسمح للمستخدمين بالتحقق مما إذا كان النظام التنظيمي الجيني يمكن أن يُظهر خاصية أو سلوكًا ديناميكيًا مرغوبًا في نطاق معين من المعلمات والشروط الأولية. أكثر ملاءمة لتصميم الشبكات ، يمكن أيضًا استخدام الأداة للعثور على المعلمات التي تظهر السلوك المطلوب واختبار متانة السلوك حول قيم المعلمات هذه.

يمكن أن يعطي التحليل النوعي أيضًا تلميحات حول المعلمات التي تقدم أفضل نجاح في تحقيق السلوك المطلوب أو ما إذا كان تصميمًا معينًا يمكن أن يعرض الوظيفة المطلوبة على الإطلاق. إن تحديد أكثر المعلمات الواعدة للتغيير ، بالطبع ، لا يعتمد فقط على التحليل الرياضي ، ولكن أيضًا على الجدوى البيولوجية. في حين أن بعض الخصائص مثل قوة المروج واستقرار النسخ والبروتين متغيرة تمامًا ، فقد يكون من الصعب تعديل الأنشطة الأنزيمية ، على سبيل المثال. أيضًا نظرًا لأن التغييرات في خصائص المكونات البيولوجية يمكن أن تكون نوعية في أفضل الأحوال ، فمن المهم العثور على نطاقات المعلمات التي تُظهر سلوكًا قويًا للتغيرات. في مثال المكبح المذكور أعلاه ، أدى التحليل النوعي إلى تحديد عدد قليل من الخصائص الرئيسية المهمة للحصول على تذبذبات مستقرة - محفزات قوية ذات قمع تعاوني محكم و mRNA مماثل وعمر نصف للبروتين ، مع فترات نصف عمر للبروتين تحدد بشكل أساسي الفترة الطول. بصرف النظر عن المساعدة في اختيار المكونات البيولوجية الصحيحة ، أدت هذه المعايير أيضًا إلى مؤلفي الورقة لإدخال علامات للبروتياز في تسلسل المثبط.

يمكن أيضًا التحقق من صحة النموذج من خلال مقارنة نتائج المحاكاة التي يتم تشغيلها مع البيانات التجريبية الكمية ، مثل الدورات الزمنية أو تركيزات الحالة الثابتة وتدفقها. يمكن أحيانًا اشتقاقها من الأدبيات ، أو استرجاعها من قواعد البيانات ، على سبيل المثال ، القياس الكمي لـ mRNA أو المستقلبات. إذا كان النموذج يعيد إنتاج النتائج التجريبية بشكل مرض ويعرض السلوكيات المرغوبة ، فيمكن اختباره أيضًا عن طريق التحقق التجريبي من نتائجه وسلوكه المتوقع. يتميز J ig C ell بأداة مخصصة ، C omparator (الموصوفة في Allen وآخرون. 2003) ، لأتمتة هذه المقارنة. باستخدام وظائف الهدف التي يحددها المستخدم ، يقارن نتائج النموذج وتحولاته مع مجموعات معينة من البيانات التجريبية والتأكيدات على متغيرات النموذج. كما يسمح باختبار نماذج أو إصدارات مختلفة من النموذج على نفس البيانات والتأكيدات ثم مقارنة أدائها.

8. الخلاصة والنظرة

الأدوات المتاحة بالفعل لإنشاء النماذج كافية تمامًا لمعظم التطبيقات. إن استخدام التنسيقات القابلة للتحويل مثل SBML أو CellML يمنح العلماء مجموعة أدوات غنية تدعم تقريبًا جميع جوانب تقييم النموذج وتفسيره وصقله. معظم هذه الأدوات متاحة مجانًا للمستخدمين الأكاديميين ، مما يسمح للعلماء بمحاولة استخدام أكثر من برنامج واحد لكل مهمة. تتيح إمكانيات الشرح الواسع لهذه التنسيقات المستندة إلى XML وصف النماذج بدقة ، مما يساعد في بناء النموذج التعاوني وتفسيره ، وكذلك في تبادل النماذج وإعادة استخدامها.

ومع ذلك ، نظرًا لأن معظم الأدوات قد تم تصميمها لأغراض بيولوجيا الأنظمة ، مع وضع عملية نمذجة مختلفة قليلاً في الاعتبار ، فإنها تفتقر إلى بعض الميزات المرغوبة في علم الأحياء التركيبي. أولاً ، بالكاد يدعمون عملية البناء المعيارية المستخدمة في بعض الجهود لإنشاء أنظمة تنظيم الجينات الاصطناعية. تحاول بعض الأدوات تضمين الموارد المتاحة التي تستهدف البيولوجيا التركيبية - مثل سجل معهد ماساتشوستس للتكنولوجيا للأجزاء البيولوجية القياسية - كمصادر بناء نموذجية. في حين أن هذا يبدو واعدًا جدًا ، إلا أنهم يقدمون حاليًا وحدات قليلة فقط من العناصر البيولوجية المتاحة. على الرغم من أن بعضها يدعم تنسيقات التبادل العام وبالتالي يسمح بالتصدير السهل إلى أدوات أخرى ، إلا أنها تقتصر على عدد صغير فقط من الصيغ الرياضية ، وتفتقر إلى تكامل التمثيل الغذائي وتسلسل نقل الإشارة.

ميزة أخرى مدعومة بالكاد حتى الآن هي القدرة على استخدام التنبؤ بالسلوك النوعي لتوجيه عملية التصميم. قد تكون الأدوات التي تستنتج السلوكيات المحتملة وتقترح المخططات الممكنة مفيدة جدًا في المراحل الأولى من مشروع البيولوجيا التركيبية. تقدم BIOCHAM هذه التسهيلات إلى حد ما ، ولكن سيكون من المرغوب فيه استخدام المزيد من الأدوات للنمذجة الحتمية والعشوائية. بينما يتم دمج تقدير المعلمات وتحسينها في العديد من البرامج ذات الواجهات البديهية ، فإن إمكانات التحليل النوعي توجد في الغالب في أدوات مخصصة منفصلة ، وتتطلب المزيد من المهارات والخبرات الرياضية. الجهود المبذولة لجعل هذه الأدوات في متناول العلماء الأقل كفاءة في الرياضيات ستكون مفيدة جدًا لكل من الأنظمة ومجتمعات البيولوجيا التركيبية.

تتمثل المشكلة العامة في كل من الأنظمة والبيولوجيا التركيبية في الافتقار إلى الأدوات التي تدعم التعليقات التوضيحية الموحدة لعناصر النموذج والكيانات البيولوجية. لم يتم الاتفاق على بعض المعايير إلا مؤخرًا من قبل جزء أوسع من المجتمع ، لذلك قد تظل هناك حاجة إلى بعض الوقت حتى اعتمادها على نطاق واسع. نعتقد أن استخدام مثل هذا التعليق التوضيحي القياسي هو تطور ضروري لتبادل وإعادة استخدام النماذج والوحدات من قبل مختلف العلماء والأدوات. تم إنشاء أحد الجهود الناجحة للغاية في تطوير قاعدة بيانات معيارية ومتاحة للجمهور للأجزاء البيولوجية للبيولوجيا التركيبية في سجل BioBrick للأجزاء البيولوجية القياسية (http://partsregistry.org/). في منشور حديث ، كانتون وآخرون. اقترح (2008) طريقة واعدة لتمثيل الخصائص الكمية للأجهزة البيولوجية في شكل ورقة بيانات وإثباتها على جهاز مكون من أجزاء BioBrick. النمذجة الرياضية و في السيليكو سيستفيد تصميم الأنظمة كثيرًا من تبني المجتمع لمثل هذه المعايير.

نظرًا لأن المجتمعات النابضة بالحياة والمتنامية بسرعة للبيولوجيا التركيبية والأنظمة قد أنتجت عددًا كبيرًا من الأدوات والخوارزميات ، فنحن متفائلون بأن الميزات المذكورة أعلاه سيتم تنفيذها قريبًا. أثبت استخدام الأشكال القياسية المفتوحة والتنمية المجتمعية أنها ذات قيمة كبيرة في النمذجة البيولوجية ، ونأمل أن يستمر هذا الاتجاه الناجح ويتسع ليشمل المجالات الناشئة حديثًا.


شاهد الفيديو: Uso de KEGG (كانون الثاني 2022).