معلومة

النموذج الحتمي لتحلل / لازوج لامدا-فج [MATLAB]


قاعدة المشروع 1:

هل يمكن لأي شخص مساعدتي في فهم ما أحتاجه من الكود الأساسي للمشروع 1 لإجراء السؤالين 1 و 2 من الصورة الأولى؟ أنا جديد في MATLAB لذا فإن الشرح الشامل سيكون رائعًا.


بالنسبة لأسئلة الواجب المنزلي ، تتمثل السياسة في رؤية بعض الأعمال من الملصق. نظرًا لأنك لا تعرف البرمجة ، فقد أوجزت ما يفعله الكود ، بخلاف العمليات البسيطة (+ ، - ، / ، * ، ^) ، لتبدأ. أعتقد أنه يجب أن تكون قادرًا على تنفيذ النماذج بهذه المعلومات ، ويسعدني تأكيد إجاباتك.


لذا فإن أفضل طريقة لمعرفة ما يعنيه أي سطر من التعليمات البرمجية ، في أي لغة ، هو كتابته ومعرفة ما سيحدث. لمساعدتك في بدء البرمجة في MATLAB:

أي نص يتبع٪ (على نفس السطر) هو تعليق: إنه لا يفعل شيئًا في البرنامج ، ويوجد لك فقط لكتابة ملاحظات لنفسك.

القسمان الأولان ، الثوابت المرتبطة بالوقت وثوابت المحاكاة ، هما مجرد متغيرات. إنه مثل قول x = 3 ، بحيث يمكنك لاحقًا إجراء عمليات أخرى باستخدام x.

تمنع الفاصلة المنقوطة في نهاية السطر (في MATLAB) إخراج السطر. انظر ماذا يحدث إذا كتبتس = 3 ؛عكسس = 3في موجه الأوامر.

في ثوابت التكرار ،الطولهي مجرد دالة تخبرك بطول المتجه.X_rna_0تم تهيئته مسبقًا للانتقال من 0 إلى 1.4 في خطوات 0.2: بناء الجملة هو vector_name = start: step: end.

يقوم قسم متغيرات المحاكاة بإنشاء مصفوفات xyz ، مع تهيئة جميع القيم إلى الصفر. الطول في x هو xr_max وهكذا. الفكرة هي أنه ، لاحقًا ، في كل خطوة في طريقة أويلر وكل قيمة من قيم xr_max و xp_max ، ستحفظ قيمة X_rna.

يتم تعيين الشروط الأولية باستخداممشجريد، وهو أفضل شرح هنا. ال:تعني جميع الصفوف / الأعمدة ، المقابلة للموضع: لنفترض أن لديك مصفوفة 3 × 3 تسمىتفاح.تفاحة [:، 1]يمنحك العمود الأول (1) من جميع الصفوف الثلاثة.تفاحة [1 ،:]يمنحك الصف الأول (1) من جميع الأعمدة الثلاثة. ال .' يعني أنه يتم تبديل المصفوفة: مرة أخرى ، فإن أفضل طريقة لمعرفة ما يحدث هي إنشاء مصفوفة خاصة بك ، وإجراء العملية ، ومعرفة ما إذا كان ما تحصل عليه هو ما كنت تعتقد أنه سيكون.

للحلقات ، يمكنك أن تقرأ عنها هنا ، كبداية. لا أعتقد أن فهم هذه الحلقة يتطلب معلومات أكثر من تلك الصفحة.

النقطة قبل ^ 2 تعني أن كل عنصر من عناصر المصفوفة يتم تربيعه ؛ أنت لا تضرب المصفوفة في نفسها.

يجب أن يفك ذلك معظم الشفرة نيابة عنك. إذا كانت لديك أسئلة أخرى ، فلا تتردد في التعليق هنا.

تحرير: السؤال 2 يطلب منك عمل مؤامرة. يتم عمل مؤامرة من y مقابل x عن طريق الكتابةمؤامرة (س ، ص)

أيضًا ، يمكن الوصول إلى المساعدة في وظيفة MATLAB معينة عن طريق الكتابةمساعدة name_of_function.


هذه مجموعة من المعادلات التفاضلية العادية. تابع هكذا

  1. قم بعمل دالة matlab لـ ODEs التي تحدد النظام (المعادلات 1،2،3،4). يجب أن تُرجع الدالة متجهًا رباعي الأبعاد وهو أساسًا dy / dt (معادلة المعدل)
  2. في البرنامج الرئيسي يعلن القيم الأولية للمكونات المختلفة. لا توجد قاعدة مطلقة لما يجب أن تكون عليه وهي تستند إلى معرفتك المسبقة بالنظام
  3. في البرنامج الرئيسي ، اكتب وحدة نمطية لدمج دالة المعدل خلال فترة زمنية. هناك العديد من الخوارزميات العددية للقيام بذلك مثل Euler ، و euler الضمني ، و runge-kutta ، وطرق الاستيفاء متعدد الحدود - طرق مصحح التنبؤ (Adam Bashworth) وما إلى ذلك. إذا كنت ترغب في تحسين معرفتك بالطرق الرقمية ، فاكتب الكود الخاص بك لأي خوارزمية . يمكن الرجوع إلى كتاب جيد عن أساسيات الطرق العددية. خلاف ذلك ، يمكنك استخدام حلول ODE المضمنة في Matlab.

ملاحظة حول الطرق العددية لحل المعادلات الثنائية الأبعاد: ما تفعله على وجه التحديد هو إضافة وتحديث دالة المعدل في فترات زمنية صغيرة. الطريقة الأساسية للغاية هي أويلر التي تنفذ فيها هذا للتو:

y = y + h * f (x، t) ... أويلر صريح / أمامي y = y + h * f (x، t + h) ... أويلر ضمني / خلفي

أينdy / dx = f (x، t)وحهي فترة زمنية صغيرة

لذا ما عليك القيام به ، بالضبط ، هو تشغيل حلقة منر = t_initialإلىر = t_finalبزيادات صغيرة منح. يمكنك استخدام أي حلقة أساسية مثللحلقة أوفي حينحلقة.لالحلقات سهلة التنفيذ. (الصيغة الأساسية هي - لـ (الأولي ؛ الشرط النهائي ؛ وظيفة الزيادة) والتي تكون في Matlab سهلة مثلبالنسبة إلى t = t_initial: h: t_final

داخل الحلقة تقوم بتطبيق عملية التكامل.

تستخدم التقنيات الأكثر تقدمًا حجم خطوة متغير لتحسين الأداء. يمكنك استخدام أدوات حل ODE المضمنة إذا كنت تحتاج إلى أداء ودقة أفضل.

بالنسبة لواجبك ... لديك الرمز بالفعل ؛ فقط بحاجة لوضع المعلمات.


الحدود في علم الأحياء الدقيقة

انتماءات المحرر والمراجعين هي الأحدث التي يتم توفيرها في ملفات تعريف بحث Loop وقد لا تعكس موقفهم في وقت المراجعة.



مشاركه فى

المقدمة

يمكن تصنيف الفيروسات البكتيرية (مثل العاثيات أو العاثيات) بناءً على تاريخ حياتها إلى فئتين رئيسيتين: خبيثة ومعتدلة (1،2). تمتلك العاثيات الخبيثة مرحلتين من تاريخ الحياة: مرحلة خارج الخلية ، حيث تنتشر الفيروسات غير النشطة الأيضية بشكل سلبي في البيئة ومرحلة داخل الخلايا ، حيث يقوم الجينوم الفيروسي بإعادة توجيه النسخ والترجمة مما يؤدي إلى إنتاج الفيروس وتحلل الخلية. في المقابل ، بمجرد إصابة العاثيات المعتدلة بالخلايا المضيفة ، يمكنها إما قتل الخلية المضيفة ، وبالتالي إطلاق النسل الفيروسي ، أو دمج مادتها الجينية مع تلك الخاصة بمضيفها البكتيري. بمجرد دمج الجينوم الفيروسي للعاثية المعتدلة ، يشار إلى البكتيريا على أنها ليسوجين. في المرحلة اللايسوجينية ، يحدث الحد الأدنى من النسخ والترجمة للبروتينات الفيروسية وينتقل الجينوم الفيروسي (أي Prophage) عموديًا. في وقت لاحق ، يمكن أن يحدث تحريض الدعامة ويمكن للفيروس أن يعيد دخول المسار اللايتي. تمت دراسة اختيار ما إذا كان سيتم تحليل خلية مضيفة أو الدخول في حالة كامنة عند الإصابة بالإضافة إلى آليات تحريض الدعامة على نطاق واسع في العاثيات المعتدلة. شكل تحليل الآليات الجزيئية الكامنة وراء التحلل مقابل مسارات اللايسوجين أساسًا للعمل التكويني على تنظيم الجينات (3). دراسة التبديل lysogeny في & # x003bb- أصبحت العاثيات نظامًا نموذجيًا لفهم كيف تحدد العاثيات المعتدلة الوسائل التي تستغل بها المضيفين (4 & # x0201315).

زعمت جميع الدراسات النظرية تقريبًا لديناميكيات قرار العاثيات المعتدلة أن التبديل بين المسارات البديلة يعتمد على بعض التغييرات في الظروف البيئية أو بعض العمليات العشوائية المتأصلة في الفيروس (6 ، 7 ، 10 ، 16). ومع ذلك ، فقد وجدت الاختبارات التجريبية طويلة الأمد (4) والدراسات الجزيئية الحديثة (8،11) أن التغييرات في تعدد العدوى تغير بشكل جذري مفتاح القرار الأولي في & # x003bb- فج. تشير الأدلة التجريبية إلى أن اثنين أو أكثر من العدوى المشتركة & # x003bb- سوف تؤدي العاثيات إلى استسقاء ، في حين أن إصابة واحدة & # x003bb- فج يؤدي إلى تحلل الخلايا (4 ، 8 ، 11). قد يبدو هذا التغيير النوعي في النتيجة بناءً على اختلافات صغيرة في مستويات العدوى المرافقة أمرًا بديهيًا ، ويفتقر حتى الآن إلى وصف نظري متماسك. نوضح هنا أنه عندما تصيب فيروسات متعددة نفس الخلية المضيفة ، يمكن أن تؤدي عدم الخطية في الديناميات التنظيمية للجينات إلى تغييرات نوعية في التعبير الجيني للحالة المستقرة ، وفي النهاية إلى نتيجة حتمية ، أي التحلل أو التلاشي. تشير هذه النتيجة إلى أن سمات مفاتيح القرار الجماعي الفيروسية قابلة للتوريث وقابلة للتغيير والتطور. تتضمن الكميات القابلة للتطور في هذه العملية التعددية الحرجة للعدوى التي يحدث فيها التبديل ونسبة التعبير الجيني للحالة المستقرة لحالتين مختلفتين من القرار. يتم تحديد هذه الميزات ، جزئيًا ، من خلال المعلمات الحركية للربط التي تتأثر بسهولة بالطفرة.

النموذج التنظيمي لعمليات اتخاذ القرار الفيروسية

ضع في اعتبارك مزيجًا من الفيروسات البكتيرية المعتدلة والمضيفات البكتيرية التي تصيب الخلايا فيها فيروس & # x02133 من سلالة متطابقة. يوضح الشكل 1 نموذجًا بسيطًا لهذا الموقف وآلية محتملة لعملية اتخاذ القرار الفيروسي داخل خلية بكتيرية. اثنان من الجينات في هذه الشبكة ، x و ذ، تشترك في منطقة مروج مشتركة. عندما ترتبط ثنائيات X بالمحفز ، فإنها توقف نسخ الجين ذ وتعزيز ذلك من x. عندما ترتبط ثنائيات Y بالمحفز ، فإنها توقف نسخ كلا الجينين x و ذ. ومن ثم ، فإن الشبكة التنظيمية الفيروسية تتضمن كلاً من حلقة التغذية الراجعة الإيجابية والسلبية (انظر الجدول 1 لمزيد من التفاصيل).

رسم تخطيطي لمفتاح ثنائي الاستقرار فيه ثنائيات حلقة مثيرة (دائرتين مع خط) وحلقة مثبطة (الدوائر) تنافس على نفس المروج. تشير الخطوط الصلبة إلى تفاعلات البروتين ، بينما تشير الخطوط المتقطعة إلى أحداث نسخية (الترجمة غير مصورة).

الجدول 1

معدلات نسخ mRNAs التي تعطى مواقع المروج غير المشغولة أو المشغولة إما X- أو Y-dimers

يعتبر dimer Y مثبطًا تمامًا بينما يقوم X بالقمع ذ وينشط نفسه. متي & # x003b1ذ & # x0003e & # x003b1x الحلقة المثبطة مفضلة عند المستوى المنخفض

على عكس النماذج الأخرى التي يظل فيها رقم النسخة ثابتًا ، نضع هنا عدد نسخ الجينات الفيروسية مساويًا لعدد الفيروسات المصابة ، باتباع الطرق القياسية (1017 & # x0201319) ، فإننا نعتبر نموذج عمل جماعي لديناميكيات المروجين و mRNA والبروتينات. تتكون الشبكة من حلقة مثيرة وحلقة مثبطة. عندما يكون المروجون غير مشغولين ، يتم نسخ mRNA بمعدل & # x003b1x و & # x003b1ذ للحلقات المثيرة والمثبطة ، على التوالي. يمكن أن تتضاءل هذه المونومرات ثم ترتبط بموقع المروج. عندما ترتبط ثنائيات X ، فإنها تمنع نسخ الجين ذ وتعزيز نسخ الجينات x بمعدل & # x003b2x. عندما ترتبط ثنائيات Y ، فإنها تمنع نسخ كلا الجينين x و ذ. باتباع الطرق القياسية في المجال (10) ، نتتبع كثافة المونومرات x1 و ذ1، ثنائيات x2 و ذ2، نصوص مرنا مx و مذ، وشغل المروج د0, دx، و دذ، مثل الديناميات

في هذا النموذج ، & # x003ba& # x02013 و & # x003ba& # x0002b هي معدلات فك وتناقص المونومرات ، ك& # x02013 و ك& # x0002b هي معدلات انفصال وربط الثنائيات بمواقع المروج ، & # x003c3 هو معدل الترجمة ، & # x003b1س ، ص و & # x003b2x هي معدلات النسخ ، & # x003b3م هو معدل تدهور النصوص ، و & # x003b3ص هو معدل تحلل البروتينات. لاحظ أن التركيز الإجمالي لمواقع المحفز يظل دون تغيير ، ويشير إلى أنه حيث & # x02133 هو التعدد الخلوي للعدوى و ج هو عامل تحويل يتوافق مع التركيز المولي لجزيء واحد في حجم مكافئ لخلية بكتيرية ، إذن د & # x0003d د0 & # x0002b دx & # x0002b دذ هو ثابت في جميع أنحاء الديناميات.

في هذا النموذج الكامل ، يكون التحليل الرياضي غير عملي. ومن ثم ، فإننا نطبق تقريب شبه ثابت غير مقيد (QSSA) على النموذج الكامل (انظر الملحق 1 للحصول على معالجة مفصلة لهذا الاشتقاق). في QSSA ، نستفيد من التباين في المعدلات بين العمليات السريعة والبطيئة في شبكة تنظيم الجينات ونفترض أن المتغيرات الأخرى يتم تحديدها من خلال تركيزات المونومر المتغيرة ببطء. نحن قادرون على اشتقاق تعبيرات لمعدل تغيير التركيزات المعاد قياسها للمونومرات الحرة X و Y ، والمشار إليها هنا باسم ش و الخامس، على التوالى،

المعلمات & # x003b1ش, & # x003b1الخامس، و & # x003b2ش هي معدلات معاد قياسها تجمع بين تأثيرات الربط والنسخ والترجمة والتدهور حيث & # x003b3ص هو معدل تحلل البروتين (انظر الملحق 1 للتعريفات). الأهم من ذلك ، أن إعادة صياغة النموذج تظهر أن التغييرات في التعددية الخلوية للعدوى ، تؤثر بشكل مباشر على معدلات النسخ (في النموذج الكامل من المعادلات. 1 & # x020139) والترجمة (في نموذج البروتين فقط من المعادلات .10 و 11 ). وبالتالي ، فإن التغييرات في عدد الفيروسات داخل الخلية تؤثر على قيم المعلمات الرئيسية في نموذج ديناميكي غير خطي للتحكم التنظيمي. علاوة على ذلك ، فإن تنبؤات التعبير عن الحالة المستقرة متكافئة سواء كنا نفكر في الديناميكيات الكاملة للمروجين ، و mRNA ، والبروتينات ، أو ديناميكيات البروتينات في المعادلات. 10 و 11.

يمكن حل تركيزات مونومر الحالة المستقرة في هذا النموذج ضمنيًا. بعد بعض التحليل (انظر الملحق 1) ، نجد التعبيرات الدقيقة لـ و

تُظهر النسبة التباين في تعبيرات الحالة المستقرة وتعادل نسبة التركيزات الفعلية. للقيم المنخفضة من أجل & # x003b1الخامس/& # x003b1ش، في حين أن القيم الكبيرة لـ تكون بترتيب عندما يتجاوز الإنتاج الأساسي للبروتين المثبط إنتاج البروتين المثير (& # x003b1الخامس & # x0003e & # x003b1ش) ، تتغير نسبة تعبير الحالة المستقرة من الأعلى إلى الأدنى مع زيادة. هذا هو مفتاح أصل صنع القرار الجماعي في الفيروسات. عندما يكون & # x02133 منخفضًا ، يتم الاحتفاظ بالتعبير الكلي عند مستويات منخفضة ويفضل مفتاح القرار الحلقة المثبطة. عندما يكون & # x02133 كبيرًا ، يزداد التعبير الكلي ويفضل مفتاح القرار الحلقة المثيرة التي تهيمن عليها ردود الفعل الإيجابية غير الخطية.

يمكن أن يكون هناك ثلاث نتائج على الأكثر لهذا النموذج: 1) ، نظام يسيطر عليه التثبيط 2) ، نظام ثنائي الاستقرار و 3) ، نظام تهيمن عليه الإثارة (انظر الشكل 2). تحدث هذه الأنظمة من أجل وعلى التوالي (انظر الشكل 3). القيم الحرجة ، وتشير إلى التعدد الخلوي للعدوى عند توقع حدوث تغيير في السلوك. لا يمكننا إيجاد حلول صريحة كدالة للمعلمات. ومع ذلك ، فإن الحلول الضمنية ممكنة لأن هذه النقاط الحرجة تفي بالشرط في المعادلة. 12. يوضح التحليل أن متى & # x003b2ش & # x0226b & # x003b1ش، يجب أن يكون هناك نقطتان حرجتان حيث تحدث تشعبات عقدة السرج (Y. Mileyko ، R. I. Joh ، و J. S. Weitz ، غير منشور). أولاً ، عندما تظهر دولة غير مستقرة ومستقرة. بعد ذلك ، عندما يصطدم التوازن غير المستقر بالفرع المستقر الآخر. متي & # x003b1الخامس & # x0003e & # x003b1ش، لا يوجد سوى حالة ثابتة واحدة محتملة للتعددية الخلوية المنخفضة للعدوى () ، حيث يوجد أيضًا حالة ثابتة واحدة محتملة لتعدد الخلايا عالية العدوى () ، حيث يمكن ضبط مصير الخلية بشكل حاسم من خلال ، في بعض الحالات ، إضافة أو طرح عدد قليل من الفيروسات المعدية. في النظام الوسيط ، تعتمد النتيجة بشدة على التأثيرات العشوائية التي قد تدفع النظام إلى حالة تعبير مستقرة أو أخرى. بدلاً من ذلك ، إذا قمنا بتتبع التركيز الكلي للبروتينات ، مساويًا لمجموع المونومرات ، والثنائيات ، والثنائيات المرتبطة ، فسنجد نفس القيم الحرجة لـ & # x02133 للتشعبات.

ديناميات مستوى الطور من الخامس(ر) عكس ش(ر) في نموذج البروتين فقط من Eqs. 10 و 11 معطى & # x003b1ش & # x0003d 0.5 ، & # x003b1الخامس & # x0003d 5 ، & # x003b2ش & # x0003d 2.5 ، & # x003b3ص & # x0003d 1 و 2 و 4 على التوالي. تشير الأسهم إلى اتجاه المسارات والدوائر الصلبة عبارة عن توازن ثابت. من اليسار إلى اليمين ، تصور الأشكال الأنظمة الثلاثة للنموذج حيث يهيمن المسار المثبط على الديناميكيات (الخامس) ، يحتوي على حالات ثابتة بديلة ، ويهيمن عليها المسار المثير (ش)، على التوالى.

نسبة تركيزات بروتين الحالة المستقرة لتفاوت التعددية الخلوية للعدوى () في نموذج البروتين فقط من Eqs. 10 و 11 معطى & # x003b1ش & # x0003d 0.5 ، & # x003b1الخامس & # x0003d 5 ، & # x003b2ش & # x0003d 2.5 و & # x003b3ص & # x0003d 1. تشير الخطوط الصلبة إلى الفروع المستقرة ، والخط المنقط يدل على الفرع غير المستقر ، والدوائر هي نتائج المحاكاة العددية في ظل الظروف الأولية (ش & # x0003d 0 ، الخامس & # x0003d 0). هناك ثلاثة أنظمة في هذا النموذج وحيث يهيمن المسار المثبط على النموذج (الخامس) ، يحتوي على حالات ثابتة بديلة ، ويهيمن عليه المسار المثير (ش)، على التوالى. النقاط الحرجة وتتوافق مع تشعبات عقدة السرج للنموذج.

العناصر المركزية لهذا النموذج هي ردود الفعل النسخية و dimerization البروتين ، كما تمت الإشارة إليه في سياقات أخرى (18). بدون التغذية الراجعة ، لن تؤدي الزيادات في عدد النسخ إلى تغيير نوعي في نسبة التعبير الجيني. بدون dimerization ، ستتغير نسبة التعبير الجيني مع التباين ولكن التغيير لن يكون جذريًا ولن يكون هناك سلسلة من التشعبات. بالنظر إلى التغذية الراجعة و dimerization ، فإن العثور على تسلسل من التشعبات المدفوعة برقم النسخ قوي للتغييرات في المعلمات الحركية. ستغير التغييرات في المعلمات الحركية ميزات التشعب الذي يتم التحكم فيه برقم النسخ ، بما في ذلك القيم الحرجة لـ & # x02133 حيث تحدث التشعبات والتغيير النسبي في التعبير قبل وبعد النظام ثنائي الاستقرار.

نموذج ميكانيكي & # x003bb-phage التبديل القرار الأولي

الآلية العامة المقدمة لمفتاح القرار المتحكم فيه بشكل حتمي تنطبق أيضًا في السيناريوهات الأكثر تعقيدًا. نسخة مبسطة من مفتاح lysis-lysogeny في & # x003bb- فجوة تشمل الجينات cI, cro، و cII معروض في الشكل 4. من المعتقد الآن على نطاق واسع أن المصير النهائي لعملية اتخاذ القرار في & # x003bb- يتم التحكم في العاثية بواسطة CII. تسهل المستويات العالية من CII إنتاج CI (والمسار اللايسوجيني) في حين أن المستويات المنخفضة من CII تفضل إنتاج Cro (والمسار اللايتي) (3،8،11،12). الآلية الجزيئية المقترحة هي أن كمية بروتينات CII قد تقيس بشكل غير مباشر عدد الفيروسات المصابة (8). على الرغم من الأدلة التجريبية المكثفة على أن الزيادة في العدوى المصاحبة تحول بشكل منهجي مصير الخلية من التحلل إلى التحلل ، حتى الآن لا توجد نظرية عامة تشرح هذه العملية. على وجه الخصوص ، لماذا لا تؤدي الزيادات في أعداد نسخ الجينات الفيروسية إلى زيادة تناسبية في تركيز جميع مكونات النظام التنظيمي بطريقة تُترك نسبها (وبالتالي القرارات) دون تغيير؟

نسخة مبسطة من & # x003bb-مفتاح فاجي حيث يعمل CII كبروتين بوابة بين cl و ال cro مسارات (3،11). في التخطيطي ، تشير الخطوط الصلبة إلى تفاعلات البروتين ، يشير الخط المتقطع إلى أحداث النسخ التي لا تتطلب أي تنشيط ، وتشير الخطوط الصلبة المتقطعة إلى أحداث النسخ التي تتطلب التنشيط. يمكن العثور على مزيد من التفاصيل في الملحق 2.

في النموذج المقترح هنا ، لا نعتبر الكل & # x003bb-دائرة قرار فج. بدلاً من ذلك ، نقترح نموذجًا مبسطًا يلتقط الميزات الهامة لمفتاح القرار الذي يتم التحكم فيه في مواقع المروجين المتعددة (3). يُشار إلى موقعي المروجين المعتبرين هنا على أنهما 1) ، صRM/صر و 2)، صإعادة (انظر الشكل 4 لمزيد من التفاصيل). بالإضافة إلى ذلك ، يتحول كل من CI و Cro و CII إلى dimerize قبل الربط. قواعد النسخ هي كما يلي: 1) ، يبدأ النسخ الأساسي في صRM/صر ليصنع cro و cII النصوص 2) ، ملزم CII في صإعادة يؤدي إلى نسخ cI 3) ، ملزم CI في صRM/صر يحفز النسخ cI ويمنع نسخ cro و cII و 4) ، وتجليد Cro في صRM/صر يمنع نسخ جميع الجينات. في الواقع ، فإن صRM و صر المروجون متميزون ويتكونون من مجموعة متداخلة من ثلاث مناطق مشغل ، والتي نتجاهلها من أجل قابلية التتبع التحليلي (3 ، 20 ، 21).

نقوم بنمذجة هذا النظام ، كما كان من قبل ، من خلال تتبع ديناميكيات المروج ، و mRNA وتركيزات البروتين. يمكن العثور على قائمة كاملة من التعبيرات الديناميكية وقيم المعلمات في الملحق 2. كما في النموذج العام ، نشتق معادلات تقترب من ديناميكيات تركيز البروتين. دلالة ش, الخامس، و ث نظرًا لأن التركيزات المعاد قياسها لمونومرات CI و Cro و CII ، نجد أن معدلات التغيير

حيث & # x02133 ، كما كان من قبل ، يتم تعريف التعددية الخلوية للعدوى والمتغيرات المعاد قياسها في الملحق 2.

تعتمد قيم هذه المعلمات المعاد قياسها على معدلات الحركة ، والتي تمت دراسة بعضها في الأدبيات بينما لم يتم دراسة البعض الآخر. بشكل عام ، يخضع نموذج CI-CII-Cro لسلسلة من تشعبات عقدة السرج التي تنتقل من نظام مستقر حيث يهيمن Cro () إلى نظام ثنائي الاستقرار والعودة إلى نظام مستقر حيث تهيمن CI (). يعمل CII كبروتين بوابة في هذا النظام. تؤدي زيادة & # x02133 إلى تحريك المستوى الديناميكي لـ ث تجاوز نقطة حرجة حيث يؤدي عدم الخطية للتغذية المرتدة الإيجابية في إنتاج CI إلى تحول في السلوك (انظر الشكلين 5 و & # x200 ب و 6). 6). هذه النتائج قوية للتغييرات الصغيرة في قيم المعلمات ، ويمكن تغيير العديد من القيم في الشبكة التنظيمية وسيظل المحول يعمل. كما في الحالة السابقة ، يمتلك النظام حالة ثابتة واحدة فقط نظرًا لمستويات منخفضة أو عالية من العدوى المصاحبة. ومن ثم ، فإن التبديل يسيطر عليه السلوك الحتمي على عكس الاقتراحات بأن نتائج القرار يجب أن يكون لها أصول عشوائية أو مدفوعة بالتغيرات في الظروف البيئية (6).

ديناميات محاكاة تبديل القرار كدالة لتعدد العدوى ، حيث & # x0003d 1 و 3 و 5. لاحظ أن CII يعمل كبروتين بوابة. الزيادات في تحول CII فوق عتبة حرجة تمكن من نسخ ملفات cl والاقتران بحلقة التغذية الراجعة الإيجابية غير الخطية. قيم المعلمات المعاد قياسها المستخدمة في المحاكاة العددية هي & # x003b2ش & # x0003d 0.08 ، & # x003b4ش & # x0003d 0.06 ، & # x003b1الخامس & # x0003d 0.04 ، & # x003b1ث & # x0003d 0.04 ، & # x003b3ش & # x0003d 0.04 ، & # x003b3الخامس & # x0003d 0.05 و & # x003b3ث & # x0003d 0.12 جميعها بوحدات من الحد الأدنى & # x022121. يمكن العثور على مزيد من التفاصيل في الملحق 2.

مخطط التشعب كدالة حيث يكون الخط الصلب منحنى تحليلي والدوائر من المحاكاة العددية لـ Eqs. 14 & # x0201316 بالنظر إلى الشروط الأولية (ش & # x0003d 0 ، الخامس & # x0003d 0 ، ث & # x0003d 0). قيم المعلمات المعاد قياسها هي نفسها المستخدمة في الشكل 5.

يتم اختيار المعلمات (انظر الملحق 2) بحيث تكون معدلات النسخ القصوى بترتيب بضع نسخ في الدقيقة لكل جين ، ومعدلات الترجمة القصوى بترتيب بروتين واحد لكل بضع دقائق لكل نص ، وتكون ثوابت التفكك بترتيب 10 7 M & # x022121 ، ومعدلات تدهور mRNA والبروتين في حدود 0.1 لكل دقيقة (6،7،16،20). تين. يوضح الشكلان 5 و & # x200B و 6 6 أن قيم المعلمات هذه يمكن أن تؤدي إلى مفتاح يحركه CDM حيث يفضل التحلل ويفضل lysogeny بالاتفاق مع الملاحظات (3،4،8). تركيزات الذروة من CI و Cro لها نفس الحجم مثل الملاحظات التجريبية (في مئات الجزيئات) (3). الانحرافات الكمية ليست مفاجئة ، بالنظر إلى عدم اليقين في المعلمات وتقليل تعقيد الشبكة مقارنة بالفرضية & # x003bb-مفتاح فج. العلاقة بين المعلمات الحركية وخصائص المفتاح الجيني الذي يتحكم فيه رقم النسخ ، بما في ذلك عرض النظام ثنائي الاستقرار والاختلاف في تعبير الحالة المستقرة للحالتين ثنائي الاستقرار ، يتم استكشافها في عمل منفصل (Y. Mileyko ، RI Joh و JS Weitz ، غير منشورين). لاحظ أيضًا في هذا النموذج ، إذا زاد معدل تدهور CI فجأة ، كما يحدث بعد تعرض الخلية لتلف الحمض النووي ، تصبح الحالة اللايسوجينية غير مستقرة بالاتفاق مع التجارب (3) والدراسات العددية الأخرى (7 ، 10 ، 16 ، 22) ).


ثالثا. النتائج

أ. المشهد الاحتمالي لحالات الانتقال اللايسوجيني والليتي والسرج

يظهر في الشكل 2 مثال على منظر طبيعي لاحتمالات الحالة المستقرة لجميع مجموعات أرقام نسخ CI و Cro. لاستكشاف كيفية تأثير التغييرات في توليف CI على السلوك النوعي لـ & # x003bb phage ، نحسب مشهد الاحتمالية المختلفة تحت معدل توليف CI مختلف.

حالات Lysogenic و lytic ومعدل تخليق CI. (أ) الحالة اللايسوجينية ، Ks_CI = 0.045 / ثانية ، (ب) حالة التبديل ، Ks CI = 0.0245 / ثانية ، (C) حالة Lytic ، Ks_CI = 0.0077 / ثانية. X و ص المحاور هي أرقام نسخ CI و Cro dimers و ض المحاور هي الاحتمال الهامشي.

لتحديد الظروف التي يظل فيها النظام في الحالة اللايسوجينية ، نقوم بتقليل معدل تخليق CI بمقدار عشرة أضعاف من 0.077 / ثانية إلى 0.0077 / ثانية. عندما يكون معدل تخليق CI أكبر من 0.03 في الثانية ، يبقى النظام في الحالة اللايسوجينية وهو بعيد عن التحول إلى الحالة اللايتية. يوضح الشكل 2 أ المناظر الطبيعية للحالة اللايسوجينية عندما يكون معدل تخليق CI 0.045 في الثانية ، حيث يكون مستوى بروتين CI أعلى بكثير من بروتين Cro. لقد وجدنا أن النظام يبدأ في الانتقال إلى الحالة اللايتية عندما ينخفض ​​معدل تخليق CI إلى 0.0245 في الثانية. يبدو أن المناظر الطبيعية في معدل التوليف هذا على شكل سرج (الشكل 2 ب). عندما يتحول النظام من الحالة اللايسوجينية إلى الحالة اللايسوجينية ، تنخفض الذروة اللايسوجينية (CI العالي ، Cro المنخفض) تدريجيًا ، وتزداد القمة اللايتية (CI منخفضة وعالية Cro) عندما ينخفض ​​معدل تخليق CI. عند معدل توليف CI البالغ 0.0077 لكل ثانية ، تكون الأنظمة في الحالة التحليلية (الشكل 2C) ، أي. ، سيقوم النظام في النهاية بتعطيل الخلية المضيفة وقتلها.

ب. منظر طبيعي للعاثية المتحولة & # x003bb

لقد حسبنا أيضًا مشهد احتمالية الحالة المستقرة للعاثيات الطافرة & # x003bb التي تتوفر نتائجها التجريبية [2]. نظرًا لأن المشغلين الثلاثة في النوع البري يتم ترتيبهم بترتيب 321 (الشكل 1) ، يمكن تشكيل فجّة متحولة & # x003bb حيث يتم استبدال المشغلين في أنماط 121 و 323 و 123. Ks CI = 0.03 / ثانية للحالة اللايسوجينية و Ks CI = 0.0077 / ثانية للحالة التحليلية ، مستوى CI النسبي في مستوى اللايسوجين و Cro في التحلل مقارنةً بالعاثية البرية بالنسب المئوية موضحة في الجدول الثاني والجدول الثالث ، على التوالى. نتائج Little and Zhu et al. [8] مدرجة أيضا. بشكل عام ، تُظهر نتائجنا أنماطًا مماثلة للبيانات التجريبية ، على الرغم من وجود اختلاف كمي لـ mutant 121 في الحالة اللايسوجينية.

الجدول الثاني

مقارنة ليتل وتشو وآخروننتائج [8] ، [9]. تركيب CI المستخدم في lysogen هو Ks_CI = 0.03 / ثانية.

الجدول الثالث

مقارنة تشو وآخروننتائج [8] ، [9] ، مع Ks_CI = 0.0077 / ثانية للتحلل.

تم حساب مستويات CI و Cro في النوع البري والمتحول 121 و 323 و 123 بمعدلات توليف CI إضافية بين 0.0077 / ثانية و 0.077 / ثانية. تم تلخيص النتائج في الشكل 3 ، حيث تمثل كل نقطة تركيز CI أو Cro المحسوب من منظر طبيعي محسوب مشابه لذلك في الشكل 2.

مستويات CI و Cro dimer بمعدلات تخليق CI مختلفة. يتم رسم مستويات CI في خطوط صلبة ، ومستويات Cro في خطوط متقطعة. مستويات ثنائيات البروتين هي قيم نسبية ، تم وصف حساباتها في القسم الثاني (د).


شكر وتقدير

تم تمويل هذا العمل من خلال منحة HFSP Young Investigators (CCG) ومنحة من المعاهد الوطنية الأمريكية للصحة (GM 091875) (B.R.L.). م. حاصل على زمالة DOC من الأكاديمية النمساوية للعلوم في معهد العلوم والتكنولوجيا بالنمسا. تلقى البحث الذي أدى إلى هذه النتائج تمويلًا من برنامج الأفراد (إجراءات ماري كوري) لبرنامج الإطار السابع للاتحاد الأوروبي (FP7 / 2007-2013) بموجب اتفاقية منحة REA رقم 291734. نود أن نشكر A. Bagwatt ، R. بلومنتال ، آي كوباياشي ، إس. ماكوفيتس ، إس. موينو ، آي.مروك ، إم. نشكر S. Abedon و N. Balaban و D. Siekhaus و G. Tkacik وأعضاء C.C.G. مختبر لإجراء مناقشات معمقة وتعليقات على المخطوطة. نشكر بشكل خاص V. Krishna KV للمساعدة في التجارب.


مقدمة

غالبًا ما تُظهر الأنماط الظاهرية للكائنات الحية ، التي يُعتقد أنها تتشكل من خلال أنماطها الجينية وبيئاتها ، تباينًا كبيرًا حتى في حالة عدم وجود اختلاف بيئي جيني أو يمكن ملاحظته 1،2،3،4. هذه العشوائية المتأصلة موجودة في كل مكان في العمليات البيولوجية ، مثل التطور والمرض 5. عادة ، تميل الخلايا إلى إبقاء ضوضاء التعبير الجيني منخفضة بدرجة كافية للحفاظ على حالات مستقرة نسبيًا. من ناحية أخرى ، عندما تتغير الظروف البيئية و / أو الخلوية ، يمكن أن تتغير الخلايا إلى حالات لياقة أعلى بمساعدة الضوضاء 6. من الصعب فهم هذه التأثيرات المتناقضة للضوضاء في الخلايا. علاوة على ذلك ، يمكن للضوضاء التي تنشأ في مكون واحد أن تؤثر عادة على النظام بأكمله بطريقة لا يمكن التنبؤ بها 7 ، مما يجعل المشكلة أكثر صعوبة. من أجل دراسة كيفية تأثير الضوضاء على العمليات البيولوجية ، كيف تحافظ الخلايا على الضوضاء التي تنشأ داخل الخلايا و / أو خارج الخلية في السيطرة وكيف يمكن للخلايا حتى استغلال الضوضاء ، وفهم مكان حدوث الضوضاء وتقدير تأثيرات الضوضاء مطلوب في المقام الأول. من بين المجالات ذات الصلة ، جذبت تأثيرات الضوضاء على التعبير الجيني معظم الاهتمام لأن التعبير الجيني أساسي لجميع الوظائف الخلوية تقريبًا وعرضة للتقلبات ، بسبب انخفاض عدد نسخ الجينات ونصوصها 8،9،10. عادةً ما يتم تصنيف الضوضاء التي تؤثر على التعبير الجيني إلى فئات: الضوضاء الداخلية والضوضاء الخارجية 11. يتم تعريف الضوضاء الداخلية على أنها عشوائية التفاعل الكيميائي الحيوي للجسيمات في عملية التعبير الجيني ، بينما يتم إنشاء الضوضاء الخارجية من العمليات الخلوية الأخرى أو من التقلبات البيئية.

في هذا العمل ، يتم استخدام العاثية λ لدراسة ضوضاء التعبير الجيني. بعد الإصابة في مضيفه الإشريكية القولونية، phage يتخذ قرارًا بين وضعين للنمو ، التحلل والتحلل. في الوضع اللاحلقي ، تولد العاثية عددًا كبيرًا من النسل وتحلل الخلية ، بينما في الوضع اللايسوجيني ، تدمج العاثية DNA الحمض النووي الخاص بها في جينوم المضيف وتبقى كامنة جنبًا إلى جنب مع نمو وتقسيم مضيفها لأجيال. بروتين CI ، منتج الجين cI يلعب دورًا حاسمًا في الحفاظ على الحالة اللايسوجينية. الحالة اللايسوجينية للعاثية مستقرة تمامًا بدون الحث 12. معدل التحويل التلقائي من الحالة اللايسوجينية إلى الحالة التحليلية أقل من 10 8 لكل جيل 13 ، والذي من المتوقع أن يكون نتيجة الضوضاء في تنظيم الجينات بواسطة CI 14. لكن، cI التعبير في الملتهمة اللايسوجينية λ غير مقيد بشكل صارم في نطاق صغير. بدلاً من ذلك ، تُظهر البيانات التجريبية أن هناك تباينًا ملحوظًا بين مجتمع اللايسوجين 15. يمثل هذا الاختلاف التعبير عن ضوضاء الجينات cI.

ضوضاء التعبير الجيني في بكتريا قولونية تمت دراسته على نطاق واسع ، مما أعطى تحديدًا كميًا للضوضاء الجوهرية والخارجية للديناميكيات والحالات المستقرة ، من خلية واحدة إلى عدد السكان 11،16،17،18،19 ، مما يكشف عن عدد من العوامل التي تؤثر على ضوضاء التعبير الجيني في بكتريا قولونية، بما في ذلك تنظيم الجينات ، وتقلب معدل النسخ 11 ومعدل إنتاج البروتين 19. يمكن أن تلعب هذه العوامل أيضًا دورًا في نظام الملتهمة. إلى جانب ذلك ، تم الإبلاغ عن أن حلقات الحمض النووي لها تأثيرات مهمة في الحفاظ على الحالة اللايسوجينية للعاثية 20. تمت دراسة تأثير حلقات الحمض النووي على الضوضاء في لاك النظام ، الذي يشتمل على عاملين ، أقل من ستة مشغلين في نظام الملتهمة. ومع ذلك ، فإن النتائج من لاك نظام مثير للجدل نوعًا ما: يمكن زيادة الضوضاء أو تقليلها 22. في نظام الملتهمة ، لا تزال تأثيرات حلقات الدنا على الضوضاء غير واضحة. بصرف النظر عن الضوضاء الجوهرية المذكورة ، يمكن أن يساهم نمو الخلية ، كمصدر خارجي للضوضاء ، في حدوث ضوضاء أيضًا عن طريق تغيير حجم الخلية والتسبب في تذبذب الجسيمات الخلوية. هناك أيضًا مصادر ضوضاء أخرى مثل مواقع الجزيئات ، اللفائف الفائقة للحمض النووي ، إلخ. في هذا العمل ، قمنا بدمج عوامل الضوضاء في نموذج حسابي لنظام لايسوجيني الملتهمة وحددنا مساهمة كل عامل في إجمالي الضوضاء في توزيع الحالة المستقرة. نحن نعتبر أن الضوضاء تأتي من تنظيم الجينات والنسخ والترجمة ويمكننا تفسير جزء كبير من الضوضاء التي لوحظت في تجربة سابقة 15. The explained noise according to where they come can be further divided into explained intrinsic noise (from gene regulation, transcription and translation) and explained extrinsic noise (from cell growth).

From view of modeling, several models have been developed, focusing on noise sources and their mathematical representations 23,24,25 . However, modeling noise in phage λ is challenging, since there are six operators in the regulation region of cI expression, resulting a state space too huge to be solved using these models. In this work, we use SDEs, which are convenient to study noise owing to the separation of deterministic terms and stochastic ones in their mathematical structure, as well as their good scalability to systems with large state space. The description of promoter state space follows the physico-chemical model used by Shea and Ackers 26 . Although this model takes the assumption of quasi-equilibrium, which means that the rate constant of transcription factor binding and/or unbinding its relative operator is large to get fast equilibrium, it is enough to model average situations as population heterogeneity in steady states. We will show that the model is appropriate in exploring the contribution of each noise source. Factors like memory and bursting, which are important noise sources affect gene expression dynamics 25,27,28 , are not included in the model, since these noise in dynamics will be averaged out for proteins with long enough lifetime 18 , such as protein CI, which barely degrades in normal experimental conditions.

In this work, we will address two questions: (1) How to quantify intrinsic and extrinsic noise from fundamental mechanism of cI expression in phage λ lysogen. We focus on the population fluctuation from an ensemble view and give the mathematical definition of each noise. (2) How and how significantly each noise factor affects gene expression.


شكر وتقدير

We thank B Egan, A Raj, A van Oudenaarden, J Little, D Court, I Dodd, M Elowitz, P Ge, G Altan-Bonnet, T Gregor and all members of the Golding lab for supplying reagents and for their advice. We thank U Alon for commenting on an earlier version of this paper. Some of the CI mutants were constructed by IG while working at the lab of Ted Cox (Princeton). Work in the Golding lab is supported by NIH grant R01GM082837, HFSP grant RGY 70/2008 and NSF Grant 082265 (PFC: Center for the Physics of Living Cells).

Author contributions: IG and CZ conceived the stability measurement project. CZ performed the majority of experiments and developed the theoretical model for lysogen stability. LhS, LAS and SOS performed additional experiments and developed analysis tools. IG, CZ, LhS, LAS and SOS wrote the paper.


A binary gene network

We define a gene network as a set of genes

We can use a graphical representation of gene networks to show which gene products can attach to which binding sites. An example of such representation is given in Figure 2, right.

In general, several genes my share the same binding site (in graphical representation the dotted line coming out of a binding site can fork to several control functions). To describe the functioning of a gene network let us consider an example in Figure 3 (a more formal definition is given in Section 4.1).

The functioning of a simple network of two binary genes with a negative feedback loop.

Further, we assume that at time point t0 = 0 the substance 1 has some positive initial concentration c1(t0) > 0, while c2(t0) = 0, as shown in the graph in the lower part of Figure 3. We also assume that the states of both binding sites are initially equal to 0, i.e., q1 = 0, q2 = 0. Starting from this state at t0, the network Γ1 functions as follows. Since F1(0) = 1, the substance 1 is produced with rate r1,1 > 0, and the concentration c1(t) is growing. On the other hand F2(0) = 0, therefore the concentration c2(t) remains 0. This linear change continues until time t = t1, when c1(t) = a2, i.e., until the concentration of the substance 1 reaches the association constant for binding site b2. At that point b2 switches to attached state 1, and since F2(1) = 1, gene G2 switches to تشغيل state and starts producing substance 2 with rate r2,1. Thus, starting from t = t1, the concentration of both substances are growing. This continues until the c2 reaches a1, at which point b1 switches to تشغيل state, switching gene G1 off. The concentration c1(t) starts falling, and when it reaches d2, gene G2 switches off and c2(t) starts falling too. This continues as shown in Figure 3. The table at the bottom of Figure 3 show the states of the binding sites.

The assumption that the substance concentrations change linearly for the given state is not essential for the model. We think that linearity may be a reasonable approximation in the cases where the gene expression rates are far from saturation levels. This assumption can be relaxed by changing the linear functions to a function that behave approximately linearly while the values are relatively small, decreasing the growth rate for larger values and asymptotically approaching some given maximum. An example of such a function is the solution of the logistic differential equation dc/dt = rc(1-c/k), where c is the concentration, and r and k are constants.

Another instance where the linearity may be insufficient, is if the degradation rate of a certain substance depends on the concentration of another substance (for instance, if one substance is degrading the other). Our model can be generalized to capture this situation in a straight forward manner, if there are no loops in the dependency graph describing which substances degrade which.

Although the linearity is not an essential feature of the model, in the next sections dealing with the reverse engineering, we will stick to this assumption, as we think that the properties of a simpler model should be explored first.

Reverse engineering of gene networks

Let b1, . بم, be all the binding sites in the environment, and let Q(t') = (q1(t'), . فم(t')) be their states at time point t'. We call Q(t') the binding site state vector of the network at time point t'.

Let C(t') = (c1(t'), . جن(t')) be the concentrations of all environment substances at time point t'. We call C(t') the environment concentration vector. We say that the binding site state Q(t') and concentration state C(t') are متوافق, if for every binding site bي = (i, aي, dي), if qي = 0 then cأنا < aي, and if qي = 1 then cأنا > dي. We define the network state vector as a pair

and we say that it is متوافق if Q(t') is compatible with C(t'). We often omit t'.

Note that concentration state vector C(t') = (c1(t'), . جن(t')) at a given time-point t' can be regarded as a concentration measurement. Let us define a measurement series as a pair of m-tuples

ال reverse engineering problem for gene networks can be formulated as follows:

given a measurement series M = ((t0، ر1, . رم), (C(t0), C(t1), . C(tم))), find a gene network Γ that can produce concentrations C(t0), C(t1), . C(tم) at time points t0، ر1, . رم. In this case we say that network Γ is compatible with measurements M.

Theorem

ال problem of reverse engineering is algorithmically solvable for the linear finite state gene network models, i.e., there exists an algorithm that, given a series of measurements M, outputs a gene regulatory network Γ compatible with M.

To prove the theorem, we need to introduce a few auxiliary notions. Given a network Γ and a compatible starting state Σ(t0), network Γ defines the concentration change graph Δ, which is the set of all points C(t) = (c1(t), . جن(t)), for the time interval t ∈ [t0, ∞]. An example of an initial part of such a graph is given in the lower part of Figure 3 and in Figure 4. Note that each concentration changes as a piecewise linear function.

The environment change graph

Let Γ = <>1, . جين>be a network, where Gأنا = (Bأنا, Fأنا, rأنا). Let us consider the sets of all the binding sites in the environment and all the substance generators in the network. Each binding site and each substance generator depends on two real value constants (association and dissociation constants for binding sites, and production and degradation constants for substance generators). Let us denote the set of all binding site constants in the network by β, and the set of all substance generator constants by γ. Let α = β ∪ γ, and we call α the set of the network constants.

Let us consider an initial part Δ(t0,t') of a concentration change graph Δ for a network Γ in time interval [t0,t']. The slopes of the linear parts in the graph are determined by a subset of γ, while the transition-points by a subset β. We denote these subsets by γ' and β'. We call α' = β' ∪ γ' the set of reachable constants for the network Γ in [t0,t'] for the given starting state.

Finally, for a given network Γ, we define the network structure as the object obtained from Γ by ignoring all the network constants (formally, we can substitute all the constants in Γ, for instance, by 0). In the graphical representation the network remains the same, but the constants disappear. The control functions are a part of the structure.

Now, to prove the theorem, first, note that given an initial part of a concentration change graph Δ(t0,t'), we can find all reachable constants β' and γ'. We also know the number of the genes in the network, which equals n. We know the maximal number of binding sites that can switch at least once during [t0, t'] from the graph. As there are only finite number of network structures for the limited number of genes and binding sites, we can enumerate them. For each structure, we can try all possible combinations of assignments of the constants from β' to the binding sites, and γ' to the substance generators and for each combination we can check the compatibility of the obtained network with the measurements. In this way, given Δ(t0,t'), we can construct a gene network that is compatible with it by an enumeration algorithm.

To complete the proof of the theorem, it remains to note that Δ(t0، رم) can be obtained from a series of measurements, for instance, by joining the points of the respective substance concentration by fragments of straight lines (i.e., cي(tأنا) is joined with cي(tأنا + 1) for all j ∈ <1. n>and i ∈ <0. m-1>). Given Δ(t0,tم), we can construct the network by exhaustive search as described above.

Unfortunately such an enumeration algorithm needs exponential time and cannot be used in practice. We do not know if a polynomial-time reverse engineering algorithm exists for our model class. Note that even for finite state automata, the problem of finding a minimal automaton compatible with the input/output data is NP-complete [19, 20].

The theorem does not guarantee the reconstruction of the original network that has produced the concentration vectors. The method that we used in constructing the concentration change graph was very crude and can be easily improved to produce a more realistic graph (i.e., a graph that is more likely to be produced by the original network), by minimizing the number of fragments of straight lines for building the graph. Here, the notion of "more likely" is undefined. The problem of reconstructing the original network is formulated in the "open questions" section, but next, we generalize our model to non-binary networks, and define the functioning of gene networks mathematically more precisely.

The multiple level generalization

For binary genes the control function is boolean, and consequently a gene has only two states: تشغيل أو off. Also, the binding states have only two states. In the general case we assume that a binding site can bind more than one substance, and consequently has more than two states. We assume that the binding is exclusive, i.e., binding of one substance makes binding of any other substance impossible. In this way a binding site can either be in the detached state (denoted by 0), or in any of the attached states 1, 2, . p, characterized by the substance that is bound. For a given binding site b that can bind p substances, each substance has separate association and dissociation constants aح and dح, where h ∈ <1, . p>. In this way a generalized binding site can be described by a finite state automaton of the type given in Figure 1, right.

We also assume that a gene can have several expression levels <0, . k>(the 0 level usually meaning that the gene is not expressed). For this we assume that the control function F may have more than two values, i.e., instead of being a boolean, the function F maps an n-tuple of finite values, to a finite value from 0 to k (i.e., Fأنا: (<0, . m1>, . <0, . من>) → <0. k>). Respectively the gene can have k+1 states, and there are k+1 different concentration change rates r0. صك, i.e., the substance generator has the form r = (i, r0. صك). The concentration change rate of substance i is defined by the value of F(q1, . فك), where q1, . فك are the binding sites of the gene. Concretely, if F(q1, . فك) = j, then the rate equals to rي.

Finally, we can also assume that genes can produce more than one substance, therefore in the general case a gene is defined as a triple G = (B, F, R), where R = <>1, . صص> and ri are the substance generators. We assume that all the substances are different (two genes cannot produce the same substance). In the graphical representation this implies that the dotted line coming out of a control function can fork to more than one substance generator (for instance, see Figure 6). In general, all the lines can fork, but they are not allowed to merge (they combine either through a control function or entering the same binding site). A dotted line leaving a binding site can enter one ore more control functions, a dotted line leaving a control function can enter one or more substance generators, and a solid line leaving a generator can enter one or more binding sites. The control functions can be regarded as defining the logics of the network, while binding sites and substance generators are mediators transforming discrete values into concentration change rates, and concentrations back into discrete values, respectively. Together with binding sites, the control function defines promoter (B, F) of gene G = (B,F,R).

In-formal description of lambda-phage using the elements defined by our model (for further description see text)

Functioning of a gene network and simulations

The notion of binding site state vector can be generalized for multilevel networks in a straight-forward way (by changing a binary vector to a vector of integers representing the states of the respective binding sites at the given moment). The notion of the compatibility of the binding site state and concentration vectors can also be easily generalized to multilevel situation. Further, we can assume that all the control functions F أناin the gene network have the binding site state vector Q = (q1(t), . فن(t)) as the argument (each function Fأنا can be changed to n argument function by adding dummy arguments for those binding sites which actually do not affect the gene). Let

be a compatible environment state, for i ≥ 0. We define the linear concentration change corresponding to state Σ (i) as follows. For a substance j and gene G = (B,F,R), where R = <>1. صح. صم> and Rح = (j, rh,1, . صh,k), for t ≥ tأنا we set

where j = F(Q (i) ). Let t = ti+1 be the smallest t > tأنا, such that (C(t), Q (i) ) is not a compatible state. Let bj1. بjp be the binding sites the states of which are not compatible with C(ti+1). Let Q (i+1) be obtained from Q (i) by changing the states qj1, . فjp to compatible ones. (In principle, there may be more than one way how this can be achieved - we can assume that we always change to the compatible state with the smallest number. This situation will not occur in the probabilistic generalization discussed in the next section.)

Let Σ (i) = (C(ti+1),Q (i+1) ). Then, given the initial compatible environment state Σ (i) = (C(t0),Q (0) ), the environment changes in the described manner for i = 0,1. The environment behaviour can be visualized as in the example in Figure 4.

We say that promoter (B,F) of gene G = (B,F,R) is active at a given time point t, if at this time-point the concentration of the substance produced by the gene G is increasing.

Already with only a few genes the calculation of the network behaviour becomes quite laborious. Therefore we implemented a simulator ("Genenet") for these networks in JAVA. Figure 5 left shows the behaviour of a gene network consisting of only two genes, as depicted on the right of Figure 5. Both genes have a negative feedback loop to themselves. The first gene has an additional negative feedback onto the second gene, while the second gene has an additional positive feedback onto the first one (Figure 5, right). This example demonstrates that a very simple network of just two genes may show a non-trivial behaviour.

Left: Output of the simulation program "Genenet" (using Gnuplot for visualisation) Right: corresponding network abbreviations: a1 stands for association constant 1, belongs to the bindingsite with the a1, d1 label, d1 is the corresponding dissociation constant a2, d2, a3, d3, a4, d4 correspondingly

A model of lambda-phage

The model defined above was designed to describe processes involved in transcriptional regulation. Many additional cellular processes can be involved in gene regulatory networks. This makes some extensions necessary. With minor changes the model can be extended to allow the description of cellular processes like protein degradation. Some informal extensions are made to improve the readability for humans. The shaded boxes indicate how many different output states a control-function can have. The default value is 0,1 indicating the two possible states of the substance generator ON and OFF. But more states are possible, e.g. OFF, weak activity ON1, strong activity ON2. We demonstrate the usage of our model by describing a simplified model of lambda-phage.

Lambda-phage

A lambda-phage has two modes of operating: lysis and lysogeny (for instance see [1]). During the infection of the bacterial cell by the phage a complex decision is made for either lysis or lysogeny. In the lysogenic mode the phage DNA is integrated into the bacterial genome, and the gene for lambda-repressor cI is the only expressed phage gene. External influences can trigger the switch from lysogenic to lytic behaviour. In the lytic mode the phage DNA is replicated, excised, new phage particles are produced and in the end the bacterium is broken open (lysed) to release the new phages. The lysis-lysogeny decision network is well studied and known to involve several cascades of events. In Figure 6 we present a simplified genetic network the lambda-phage. To make the graph more readable, we do not draw the lines between substance generators (depicted by diamonds) and the related bindingsites (depicted by triangles) but instead label them by the respective substances. We also allow more freedom to introduce connections between control-functions.

The mode of a lambda-phage operating is essentially determined by two proteins CI و Cro. If CI is in abundance, the phage is in lysogenic mode, if Cro is in abundance, the phage is in lytic mode. Both genes are regulated by the same DNA region (but transcribed in opposite directions), which has three binding sites: OR1, OR2 و OR3. Each binding site can bind either Cro أو CI competitively, but with different affinities. In this way each binding site can be in one of three states - unbound, Cro-bound, or CI-bound. Depending on these states the control functions Pر and Pم have different activity levels. The circuit functions like a trigger and has two stable state: either cro is transcribed and cI is down-regulated, or vice versa. The regulatory cascades of the lambda-Phage are quite complex, for reference please see [1, 21]. We will now go through a simplified description (Figure 6).

On infection of the بكتريا قولونية-cell by the lambda-Phage, only two promoters PL and PR of the lambda-Genome are active. From promoter PL the expression of ن و CIII are initiated. Between both coding regions there is a leaky terminator of transcription located. Therefore CIII is produced at a lower rate than ن. A second terminator is located between the coding region for CIII و Xis. This terminator is completely stopping transcription. If the concentration of ن is high enough, the RNA-polymerase is able to ignore the terminators and the genes are expressed at the same rate. As it will be important later, transcription from PL can be repressed by CI binding to its CI bindingsite.

The basal activity of promoter PR leads to the expression of cro and at lower level of O, P, cII, because there is also a terminator site located. س is not expressed, because of a second terminator located upstream of it.

For the lysis-lysogeny decision CII is the crucial protein. It is protected by CIII from degradation by cellular enzymes. Thus, the concentration of CII depends on its rate of production, the activity of cellular proteinases and the concentration of CIII.

The promoters PE, PI, PM are active only, if enough CII is present to bind to them. Promoter PI initiates the expression of int. ال Int protein is important for the integration of the phage-DNA into the host genome. Promoter PE with CII leads to the production of CI, also called lambda-Repressor. Therefore the promoter is called صromoter repressor هarly (PE). CI binds to the operator sites OR1 و OR2 in promoter PR and to PL, thus blocking transcription from PR, PL, PE. But it activates its own synthesis via promoter PM (صromoter for repressor مaintenance). Thus the single gene for cI can be either transcribed from PM or PE. Actually these promoters are serially organized on DNA level. The promoters PM and PR are sharing the operator sites OR1, OR2, OR3. These sites are bound by increasing concentrations of CI. Binding to OR1 و OR2 leads to inactivation of PR and activation of PM. However, binding to OR3 at even higher CI concentrations leads to inactivation of PR and PM, thus down-regulating its own expression.

At this point, the lambda-DNA is integrated into the bacterial genome and cI is the only expressed lambda-Phage gene. An auto-regulation circuit for controlling the concentration of CI at a high level is established. This is called the lysogenic state. Bacterial cells at this state show immunity to super-infection with lambda-phages, because they contain enough lambda-Repressor to immediately repress the expression of the newly incoming lambda-phage genes. ال CI protein, however, is prone to be degraded by some bacterial enzymes, which are expressed by the bacterial cell as stress response upon e.g. UV irradiation. عندما CI concentration is rapidly decreasing because of the degradation by cellular enzymes, PR is not repressed anymore. This leads to production of Cro, the counter-player of CI in the lambda-system. The degradation of CI triggered by stress response proteins is depicted in our model by a circular control-function with an input for the stress response signal, which could actually be a bindingsite for a stress response protein.

The regulatory protein Cro activates its own promoter by competing with CI for binding to OR1, OR2, OR3. It binds to these sites with inverse preference compared to CI. Being a self-activating system it is leading to a rapid increase of Cro protein in the cell. Cro also allows activation of PL, leading to increasing amounts of ن. ن is an anti-terminator which binds to the terminators mentioned before. With ن the expression of cIII, xis و int is increasing rapidly. Xis و Int are needed for the excision of the lambda-phage-DNA from the bacterial genome. From PR not only cro is expressed, but also O, P, cII. ا و ص are needed for DNA replication of the lambda-Phage. With ن these genes are produced at a significantly higher rate than without. ن also allows the expression of س. س is an anti-terminator for structural genes coded downstream of promoter PR'. This means, once CI is degraded to sufficiently low concentrations Cro is rapidly produced and then activating the genes necessary for excision from the host DNA, DNA replication and production of new phage particles, leading to host cell lysis and setting free new infectious phage particles ("Cro is opening Pandora"s box").

A lambda-phage simulation

In our model the promoter PL is represented by the control-function Pإل, its output is 1 if the CI binding site is unbound or bound by Cro and 0 if the bindingsite is bound by CI (the control-function would look like "if (Cro-bound OR unbound) return 1 (=ON), if CI-bound return 0 (=OFF)"). The first terminator is modelled by introducing a control-function PL1 which has two inputs, one from a bindingsite for N and the other one from control-function Pإل. The three different possibilities for the production rate of CIII are degradation (state 0), production at lower rate (state 1, if N is not bound to PL1, 80% of full rate) and production at high rate (state 2, if the bindingsite for N at PL1 is occupied, full rate). Control-function PL2 is leads to a complete stop of transcription. The input of PL2 is the used to model the second terminator site. Without N this terminator output of PL1 and a bindingsite for N. The output equals the input from PL1 if N is bound, or is 0 if N is not bound. The control-function Pint is used to model the transcriptional control of Int. The substance Int is generated either if PL2 is active or if the CII binding site of PL2 is occupied.

The implementation of the lambda-switch in the model is achieved in a similar way. The binding sites OR1, OR2 و OR3 can be bound by substance Cro or substance CI and are shared by the control-functions Pر and Pم. The association and dissociation constants for these substances to these bindingsites differ, allowing preferential binding in opposite order.

Using the simulator it is possible to run a simulation of the lambda-phage. Just using a quite arbitrary parameter set leads to the expected behaviour. In the beginning all substances are produced to a higher or lesser extend. After some time there are smaller changes of substance production, some kind of steady state is reached (we will refer to this informally as "behaviour"). Over a wide range of parameter sets we so far only found two principally different "behaviours". One possible outcome is a steady state where only CI is produced. We will refer to this as lysogeny state (Figure 7, top). The other one reaches a steady state where CI and CII are not produced but the other substances are(Figure 7, bottom). To this we will refer to as lytic state. The lytic behaviour shows down-regulation of substance CI and up-regulation of the other substances under control of substance Cro. Some of these are regulated by a negative feedback loop and are limited to a certain concentration. Some of the others are growing infinitely. The lysogenic behaviour is exemplified by down-regulation of all substances besides CI which shows cyclic up- and down-regulation because of the feedback loop controlling its production/degradation. Interesting is to see, that at first the substances are up-regulated and until the "decision making" has taken place. Depending on the concentration of substance Cro and substance CI either lytic or lysogenic "behaviour" is selected. By changing the starting values for the rate of production of substance CII we can trigger the model into lytic or lysogenic behaviour. This reflects some property of the "real" lambda-phage, the dependence on the number of phage particles infecting one cell. If this number is high (about 10 phage particles per cell) the preference is for lysogeny otherwise for lysis. In our model having several substance generators producing the same substance at a low rate it is equivalent to having one substance generator producing the substance at the according higher rate.

Simulation of lambda-phage model leading to lysogenic behaviour (top) or lytic behaviour (bottom)

The simulator allows to test for the effects of mutations easily, thus it is possible to experiment with the model and compare the simulations with the real mutants.

The potentials of the lambda model have to be examined further, for example for what range of parameter sets we get similar behaviours and how many different kind of behaviours we can find. But already using only arbitrary numbers gives promising results. What seems to be a shortcoming of the lambda-phage model is the infinite growth of some substances (e.g. Int, Q). But this might as well be some property of the lambda-phage itself, because it appears in the lytic "behaviour" and this leads finally to the lysis of the host cell. There is not strict need for a feedback control e.g. of the proteins responsible for the lysis of the cell as the major function of these proteins is to kill the cell. The next challenge would be to find parameters which are derived from experimentally measured reaction constants. But the purpose of this model and simulation is rather to illustrate how the model is working in principle than to come up with a new lambda-phage study.

It is obvious that additions to the model are necessary to get closer to the reality.

Informally we introduced in Figure 6 already a new kind of control-functions which are depicted by circles to stress that this is not an action which takes place on a promoter site. These control-functions can have the different current concentrations of substances (depicted by smaller circle labelled with the corresponding substance name) as an input and a substance generator of a different substance as an output. Thus we can model the influence of cellular components on the concentration of a substance, like for instance, a certain proteinase on the concentration of its substrate. This is depicted in our model by the circular control-function with input sites for CIII, CII and other cellular influences. It is important to add that this feature is not yet added to the simulator and not included in the simulation shown in Figure 7.

In the deterministic model, the state of the network is fully determined by its initial state and initial concentrations. To model the behaviour of the decision-making realistically [21], we need to introduce a stochastic element in the model.

Instead of setting precise thresholds for switching from detached to attached state and vice versa, we treat these switches as probabilistic events: the higher the concentration, the higher the probability of switching to attached state, and smaller to detached state, and vice versa. In this way a binary site can be defined as a triple B = (i,A,D), where as before i is the number of the substance that can bind to B, but A and D are two probability distributions, defining the probabilities of B switching from a detached to attached state and vice versa, respectively, depending on the concentration cأنا.

Open questions

We would like to extend our model with some informal elements to allow description of the regulatory processes that may not be fully understood yet or may be too complicated for formal incorporation into the model. The extended model can be regarded as a semi-formal language for depicting gene-regulatory networks. The goals of such a semi-formal language are twofold: finding a semi-formal description of a network is the first step towards building a completely formal model which can be used for simulation (i.e., to "describe" the network to a computer) and at the same time it helps to depict the regulatory network in a systematic way (to describe regulatory networks to other humans). Note that such a semi-formal approach is often used in business modelling, where a formal graph-based description, which allows simulations of the given business process, are supplemented with informal comments, that can be interpreted only by humans.

As already noted, the formulation of the reverse engineering problem given in Section 3 is not entirely satisfactory, as it does not necessarily lead to the reconstruction of the "correct" network. A more satisfactory formulation involves assuming that the data have been produced by some unknown regulatory network (a black box), and the task is to find that or an equivalent network. For this, first, we need to define the equivalence of gene networks.

Let Γ1 and Γ2 be two gene networks and let Σ1(t0) and Σ2(t0) be their compatible starting states at time point t0. Let Σأنا(t) = (Cأنا(t),Qأنا(t)), for i = 1,2. We say that Γ1 and Γ2 نكون equivalent for the starting states. Σ1(t0) و Σ2(t0), if C1(t0) = C2(t0) implies C1(t) = C2(t) for all t > t0. We say that Γ1 and Γ2 نكون equivalent, if they are equivalent for every compatible starting states Σ1(t0) and Σ2(t0), for which C1(t0) = C2(t0). We can also define an approximate equivalence, or more precisely, d - equivalence for a constant d ≥ 0. For this the requirement that C1(t) = C2(t) is relaxed to |C1(t) - C2(t)| ≤ d.

We define the reverse engineering problem in the strict sense in the following way. Let Γ be an unknown gene network and let Σ(t0) = (C(t0),Q(t0)) be its compatible starting state. We are allowed to measure the concentration state vector C(t) at any given time-point t ≥ t0. The task is to find time points t1، ر2, . رن, such that a network Γ' equivalent to Γ for the given starting state can be constructed from the measurements C(t1), C(t2), . C(tن).

A generalized version of the problem is to find Γ' equivalent to Γ if we are allowed to choose arbitrary compatible starting states, and make series of concentration measurements for each of these states. Finally, a more practical problem is to find a network d-equivalent to Γ, from approximate measurements.

At the moment we do not know if these problems are algorithmically solvable or not, even by an enumeration algorithm. They have a certain analogy with the problem of restoring a finite state automata from experiments[18]. This is algorithmically solvable, but is NP-hard [19, 20]. Despite the analogy, situation with the finite state linear networks are different form finite state automata in many respects.

Our theorem on the reverse engineering of gene networks gives us grounds for optimism that the reverse engineering problem for gene networks can be solved, still it is likely that heuristic methods will be needed for doing this in practice. To reconstruct gene networks all available background knowledge, such as knowing which binding sites belong to which gene promoters, will have to be used. Therefore systematic studies for regulatory signals in genomes, such as [22], will complement the approach followed here.


Supplementary tables S1–3, Supplementary figures S1–8

In the version of this supplementary file originally posted online on 9 March 2010, the authors used [number of molecules/cell] as variable's units and [mol/L] as unit for binding affinities. The authors have now converted [mol/L] units into [number of molecules/cell]. In addition, the parameter rmRNA was replaced in equations 1-5 and in Table S1 by five mRNA-specific decay rates rcImRNA, rcI434mRNA, rlacImRNA, rcIindmRNA, rlexAmRNA. These errors have been corrected in this file as of 17 May 2010.


Where can I go for more information?

Review articles

Hartwell LH, Hopfield JJ, Leibler S, Murray AW: From molecular to modular biology. طبيعة سجية 2005, 402(Suppl):C47–C52.

Kirschner M: The meaning of systems biology. زنزانة 2005, 121:503–504.

Kitano H: Systems biology: a brief overview. علم 2002, 295:1662–1664.

كتب مدرسية

Alon U: An Introduction to Systems Biology: Design Principles of Biological Circuits. Boca Raton, FL: Chapman & Hall/CRC 2006.

Heinrich R, Schuster S: The Regulation of Cellular Systems. Berlin: Springer 1996.

Klipp E, Herwig R, Kowald A, Wierling C, Lehrach H: Systems Biology in Practice: Concepts, Implementation and Application. Weinheim, Germany: Wiley-VCH 2005.

Palsson B: Systems Biology: Properties of Reconstructed Networks. Cambridge University Press 2006.

Strogatz SH: Nonlinear Dynamics and Chaos: With Applications to Physics, Biology, Chemistry and Engineering. Boulder, CO: Westview Press 2001.


شاهد الفيديو: 12 صور لذوي التركيز العالي - 90 % لن يستطيعوا حلها!! (كانون الثاني 2022).