معلومة

ما هي الأدوات التي يمكن أن تساعدني في تحديد ما إذا كان البروتين المتماثل للنبات يتفاعل مع ncRNA بنفس الطريقة؟


أول مشاركة هنا ، لذا كن صريحًا معي إذا انتهكت أي قواعد آداب أو تنسيق.

لنفترض أن لديّ بروتين في البشر. عندما يتفاعل مع ncRNA الموجود في البشر ، فإنه يفعل شيئًا أنا مهتم به للغاية. أرى بروتينًا متماثلًا للغاية (~ 85٪ هوية AA) في النباتات ، ويتم حفظه على نطاق واسع. أنا مهتم باستنباط نفس نشاط هذا البروتين في النباتات. المشكلة الوحيدة هي أنه لا يوجد ncRNA منتج نباتي محلي للتفاعل مع بروتين اهتمامي بنفس الطريقة. لذلك خطرت لي فكرة:

ماذا لو قدمت نسخة للنباتات التي تعالج هذه المشكلة؟ إذا تفاعلت النسخة النباتية من هذا البروتين مع هذا الحمض النووي الريبي (المقدم) بنفس الطريقة فسيكون رائعًا حقًا. أود اختبار هذه الفرضية ببعض التركيبات المركبة. لكن قبل أن أنفق آلاف الدولارات على عدد قليل من التركيبات ، أود استكشاف أي أدوات تنبؤية أو تحليلية لتعزيز القضية. أنا أدرك أن الاحتمالات ضدي.

شكرا!


قد يرتبط تسلسل ncRNA من الإنسان بالبروتين النباتي في الخلايا النباتية ، ولكن ماذا بعد؟ قد تكون قادرًا على القول أن البروتين النباتي يعمل كبروتين ملزم للحمض النووي الريبي ، ولكن ليس أكثر من ذلك. مصدر قلق آخر هو أن البروتين النباتي قد لا يتعرف على تسلسل الحمض النووي الريبي نفسه للبروتين البشري.

هناك عدة طرق للعثور على شركاء RNA لبروتينات ربط RNA.

سيليكس

تُستخدم هذه الطريقة للعثور على تسلسلات الإجماع التي يتعرف عليها بروتينك في المختبر. بمجرد العثور على تسلسل الإجماع ، يمكنك البحث عن ncRNAs من النبات.

CLIP

هذا مشابه لفحص الرقاقة. يمكنك العثور على أهداف حقيقية لبروتينات الحمض النووي الريبي التي تربطك


المحاضرة 14: توقع تفاعلات البروتين

قم بتنزيل الفيديو من iTunes U أو Internet Archive.

وصف: هذه المحاضرة عن التنبؤ بتفاعلات البروتين. يناقش التنبؤات الهيكلية لتفاعلات البروتين البروتين. ثم يتحدث عن كيفية إجراء قياسات تفاعلات البروتين والبروتين وتوقع Bayes Net لتفاعلات البروتين والبروتين.

معلم: البروفيسور إرنست فراينكل

المحاضرة 1: مقدمة عن.

المحاضرة 2: المحاذاة المحلية.

المحاضرة 3: المحاذاة العالمية.

المحاضرة 4: Geno المقارن.

المحاضرة 5: Library Complexi.

المحاضرة 6: تجميع الجينوم

Leture 7: تحليل ChIP-seq.

المحاضرة 8: تسلسل الحمض النووي الريبي آنا.

المحاضرة 9: النمذجة و Dis.

المحاضرة 10: ماركوف وحد.

المحاضرة 11: RNA Secondary S.

Leture 12: مقدمة إلى.

المحاضرة 13: توقع الحماية.

المحاضرة 14: توقع الحماية.

المحاضرة 15: Gene Regulatory.

المحاضرة 16: بروتين إنتراك.

المحاضرة 17: النمذجة المنطقية.

المحاضرة 18: تحليل مركز حقوق الانسان.

المحاضرة 19: اكتشاف Qua.

المحاضرة 20: علم الوراثة البشرية.

المحاضرة 21: البيولو الاصطناعي.

المحاضرة 22: السببية ، ناتو.

يتم توفير المحتوى التالي بموجب ترخيص المشاع الإبداعي. سيساعد دعمك MIT OpenCourseWare على الاستمرار في تقديم موارد تعليمية عالية الجودة مجانًا. لتقديم تبرع أو عرض مواد إضافية من مئات دورات معهد ماساتشوستس للتكنولوجيا ، قم بزيارة MIT OpenCourseWare على ocw.mit.edu.

الأستاذ: حسنا. لذلك كنا نتحدث عن التنبؤ ببروتينات البنية. في نهاية المحاضرة الأخيرة بدأنا نتحدث قليلاً عن التنبؤ بالتفاعلات ، وهذا سيكون محور محاضرة اليوم. وحددنا اثنين من تحديات التنبؤ المحتملة المختلفة.

كان أحدها هو التنبؤات الكمية لما يحدث عندما تحدث طفرات معينة في مركب بروتيني معروف. تحدثنا عن محاولة التنبؤ ببنية ، لنقل ، مجرد زوج من البروتينات ، ثم حاولنا القيام بذلك على نطاق عالمي لجميع البروتينات المعروفة.

وفي المرة الأخيرة ، إذا كنت تتذكر ، اعتقدنا أنه في البداية ربما تكون هذه مشكلة بسيطة. لدينا بروتينات ذات بنية معروفة بمركب. هيكل المجمع معروف أيضًا. ونريد عمل تنبؤات فيما يتعلق بالتغير في الألفة عندما تكون هناك طفرة معينة.

من حيث المبدأ ، يجب أن يكون هذا سهلاً لأن لدينا كل تلك التركيبات المختلفة لوظيفة الطاقة الكامنة. وبالتالي إذا اكتشفنا التغييرات الهيكلية المحلية التي نتجت عن إدخال أو حذف بعض السلاسل الجانبية ، فيجب أن نكون قادرين على التنبؤ بالتغير في الطاقة الكامنة ، وبالتالي التغيير في طاقة المجمع. لكن في الواقع ، اتضح أنه كان من الصعب جدًا القيام بذلك.

وهكذا تمت مقارنة هذه المؤامرة - كانت الدوائر السوداء هي خوارزميات التنبؤ لهذه المشكلة ، مقارنةً فقط بمصفوفة الاستبدال ، مصفوفة استبدال BLOSUM المحددة من حيث المنطقة الواقعة تحت المنحنى للطفرات المفيدة والطفرات الضارة. ويمكنك أن ترى أن عددًا قليلاً جدًا من النقاط السوداء تبتعد عن النموذج الافتراضي البسيط حقًا. الكثير منهم يفعلون ما هو أسوأ.

حسنًا ، حسنًا ، ربما لا تكون هذه مشكلة بسيطة لأنها تتطلب تنبؤًا كميًا كبيرًا. ربما سنعمل بشكل أفضل عندما نحاول التنبؤ بالبروتينات التي تتفاعل على الإطلاق. وهذا سيكون محور محاضرة اليوم.

الآن ، كانت هناك مشكلة أيضًا ، أليس كذلك؟ لأنه حتى لو كنت أعرف بنية البروتينين ، فأنا لا أعرف بالضرورة ما تتفاعل أسطح هذين البروتينين. ولذا يجب أن أكتشف مشكلة الالتحام هذه حول أي جزء من البروتين A يتفاعل مع أي جزء من البروتين B.

هذه بداية مشكلتي ، ومن ثم علي اتخاذ سلسلة من القرارات اللاحقة. لذلك سأضطر إلى اكتشاف أي شريك محتمل للبروتين الخاص بي ، أحتاج إلى معرفة مشكلة الالتحام ، اتجاه الموضع النسبي. الآن ، في هذا الكارتون الصغير ، يظهر كبروتين ثابت تمامًا يقترب من بروتين ثابت آخر. الشيء الوحيد الذي يتغير هو الإحداثيات النسبية.

لكن بالطبع ، ستكون هناك تغييرات محلية في التأكيد ، وربما تغييرات عالمية. ولذا نحن بحاجة إلى أن نكون قادرين على إجراء بعض التقديرات لما ستكون عليه تلك الترتيبات الهيكلية عندما يتفاعل البروتينان. وبعد ذلك ، بعد أن توصلنا إلى أفضل تقدير لدينا لإعادة الترتيب الهيكلي ، عندها فقط يمكننا التوصل إلى تقدير لتفاعل الطاقة وتحديد ما إذا كان أفضل من عتبة معينة.

نعم. لذا فإن إحدى المشاكل الواضحة جدًا من هذا هو أن هذا النوع من النهج من حيث المبدأ ، إذا قمنا به بصرامة من خلال جميع الخطوات ، سيكون بطيئًا للغاية. الآن ، جزء آخر ربما يكون أقل وضوحًا قليلاً هو أنه سيكون عرضة جدًا للإيجابيات الكاذبة. ولماذا تعتقد أن هذا قد يكون؟ ما الذي لا أضعه في الاعتبار هنا؟

الجمهور: هل أنت لا تأخذ في الاعتبار حل [غير مسموع].

البروفيسور: إذن إجابة واحدة هي أنني لا آخذ في الاعتبار الخراب ، لكن في الواقع ، يمكنني فعل ذلك. حق؟ لذا فإن بعض وظائف الطاقة الكامنة التي نظرنا إليها ، نسخة الإحصائي بدلاً من صيغة الفيزيائي تجعل من السهل جدًا دمج الإزالة. أي أفكار أخرى حول ما لا آخذه بعين الاعتبار؟ ما هو البروتين الآخر الذي يجب أن أفكر فيه عندما أفكر في مشكلة التفاعل؟

لذا فقد عزلت ، في هذه الحالة ، نوعين من البروتينات. أنا أقول ، في عالم حيث هذان هما البروتينان الوحيدان الموجودان ، هل سيكون لهما تفاعل طاقة مناسب؟ ما أحتاج إلى معرفته حقًا هو ما إذا كان تفاعل الطاقة هذا أكثر ملاءمة من جميع التفاعلات المتنافسة التي يمكن أن يحصلوا عليها.

لذا ، حتى لو وجدت شيئًا يحتمل أن يكون تفاعلًا جيدًا ، فقد لا يكون أفضل تفاعل ممكن. وإذا نظرت بعد ذلك إلى تركيز هذا البروتين وتركيز جميع الجزيئات الأخرى الموجودة التي لها تقارب أعلى ، فيمكن أن يتضح أن هذا هو في الواقع ركيزة ضعيفة إلى حد ما بالنسبة للبروتين ، شريك تفاعل ضعيف نوعًا ما. إذن لدينا هذه المشكلة الإيجابية الخاطئة. نعم.

لكن دعونا نركز على مشكلة الكفاءة الحسابية ، لأن هذه على الأقل مشكلة يمكننا التوصل إليها ببعض الخوارزميات الرائعة لمحاولة حلها. لذا ما نريد القيام به هو محاولة تقييد مساحة البحث لدينا. إذا أردت معرفة - لدي استعلام عن بروتين وأريد أن أسأل ، ما الذي يتفاعل معه ، بدلاً من محاولة إجراء مقارنة زوجية لهذا البروتين مع كل بروتين آخر في قاعدة البيانات ، وإجراء حسابات هيكلية دقيقة للغاية على كل هؤلاء ، ربما هناك طريقة ما يمكنني من خلالها التصفية المسبقة لمجموعة البروتينات التي قد تتفاعل معها.

وهذا ما سننظر إليه. لذلك سنحاول اختيار الشركاء المحتملين رسميًا قبل إجراء أي مقارنة هيكلية. وبعد ذلك بمجرد أن يكون لدينا هؤلاء الشركاء ، سنحاول تجنب الاضطرار إلى إجراء حسابات مفصلة حتى يكون لدينا درجة عالية نسبيًا من الثقة في أن هذه البروتينات يمكن أن تتفاعل وفقًا لمعايير أخرى.

وسنلقي نظرة على ورقتين تصفان الخوارزميات لحل هذه المشكلة ، وكلاهما تم تحميلهما على الموقع. أول شيء سننظر إليه يسمى PRISM الذي يستخدم بالفعل حسابات هيكلية. وبعد ذلك سننظر إلى PrePPI ، الذي يتعامل مع كل شيء في - دون حساب الهياكل بشكل صريح.

نعم. إذن ماذا تفعل PRISM؟ حسنًا ، يعتمد على فكرة أن هناك عددًا محدودًا من البنى التي يمكننا البحث عنها والتي يمكن للبروتينات أن تتفاعل معها. وبالتالي ، إذا تمكنا من تحديد تلك البنى ، فيمكننا محاولة معرفة ما إذا كان البروتين شريكًا محتملاً لبروتين آخر قبل أن نقوم بالحسابات المفصلة والمكلفة.

بالإضافة إلى ذلك ، في تلك الأبنية ، لن تكون جميع الأحماض الأمينية متساوية ، ولكن سيكون هناك بعض الأحماض التي تساهم في الطاقة أكثر من غيرها. ومن خلال تحديد تلك المخلفات الحرجة ، يمكننا مرة أخرى تركيز طاقتنا الحسابية على تلك المجمعات التي من المرجح أن تكون مهمة.

نعم. إذن فهو يحتوي على هذين المكونين - مقارنة بنيوية الجسم الصلب. هذا يعني أن بروتينين لا يغيران إحداثياتهما ، بل يتم تجميعهما معًا في تكوينات مختلفة. وبعد ذلك بمجرد اجتياز البروتينات لسلسلة من الاختبارات ، فإننا نسمح بالتنقيح المرن باستخدام أنواع الطاقات التي بحثناها في المحاضرات السابقة لتقرير مدى التقارب الكبير الذي يمكن أن يكون عليه هذا المركب.

والشيء المهم هو أننا سنتخذ بعض هذه القرارات المبكرة بعد مقارنة الجسم الصلب باستخدام التشابه الهيكلي ، والحفظ التطوري ، وبالأخص النظر إلى هذه المناطق التي تسمى النقاط الساخنة. هذه هي المواقع التي تحدث فيها معظم الطاقة المجانية للتفاعل أثناء الواجهة. لذا فهي ، كما قلت ، ليست موزعة بشكل موحد.

لذا أريتكم هذه الشريحة في المرة الأخيرة. يظهر كيموتريبسين بلون رمادي فاتح وتفاعله مع بعض شركاء البروتين. يشترك هذان الشخصان في بعض التشابه العالمي مع بعضهما البعض ، في حين أن هذا الشريك يختلف تمامًا عن أي من هذين الشريكين على مستوى العالم. لكن يمكنك أن ترى ذلك في الواجهة ، إنها في الواقع متشابهة تمامًا. وهذا يمنحك الأمل في أنه حتى إذا لم تتمكن من العثور على متماثل مباشر - لذلك إذا كنت تحاول معرفة ما الذي يتفاعل معه هذا البروتين باللون الأصفر ، وقمت بالبحث في قاعدة البيانات ولم تتمكن من العثور على أي شيء كان متماثلًا هيكليًا ، ولكن إذا كان بإمكانك اكتشاف متماثلات المناطق السفلية التي تتفاعل ، فقد تتمكن من اكتشاف أنها تتفاعل مع نفس البروتين مثل هذا البروتين. نعم.

إذن ماذا عن فكرة النقاط الساخنة؟ وكانت هذه فكرة تم تطويرها لأول مرة في عام 1995 بواسطة هذه الورقة ، Clackson and Wells ، حيث كانوا يبحثون في تفاعل مستقبل سطح الخلية مع اقتراب ارتباطه. وقاموا بإجراء طفرات منهجية عبر سطح الواجهة لمعرفة متى أحول أي حمض أميني واحد إلى ألانين ، وكم يؤثر على طاقة التفاعل.

ما وجدوه هو أن الأشياء كانت غير موحدة إلى حد كبير. يوضح هذا المنحنى السفلي التغير في الطاقة الحرة عندما تقوم بتحويل أحماض أمينية فردية معينة إلى ألانين. ويمكنك أن ترى أن هناك خسائر كبيرة في الطاقة المجانية في بعض الأماكن ، وفي أماكن أخرى لا يوجد أي تغيير تقريبًا في ارتباط الطاقة الحرة. في عدد قليل من الأماكن ، يمكنك الاستفادة من تحويل سلسلة جانبية إلى ألانين.

لذلك في هذه الحالة بالذات ، وقد تم تعليقه على العديد والعديد من الحالات ، الطاقة الحرة للربط ليست موحدة عبر السطح ، لكنها موزعة فيما يسمى بالنقاط الساخنة. إذن هنا هيكل هرمون النمو البشري ومستقبلاته. وباللون الأحمر ، توجد القليل من الأحماض الأمينية التي تساهم بكميات كبيرة جدًا - أكثر من واحد ونصف كيلو كالوري لكل مول - في طاقة التفاعل.

ولا يتوافق مع أي معلمة هيكلية بسيطة. إذن ، ليست الأحماض الأمينية هي التي تمتلك أكبر مساحة سطحية ، على سبيل المثال ، أو أي شيء من هذا القبيل. لذلك ليس من السهل معرفة ماهية هذه المناطق ، على الرغم من وجود بعض خوارزميات التنبؤ.

لذلك هناك دراسات ، وقد أشارت الدراسات اللاحقة إلى أن ما يقرب من 10٪ من الأحماض الأمينية في الواجهة هي التي لها أكبر مساهمة. هناك بعض الاتجاهات ، لكن لا يوجد أي منها قواعد صارمة. تميل هذه إلى أن تكون غنية بهذه الأحماض الأمينية الثلاثة - التربتوفان والأرجينين والتيروزين.

إذا كنت تتخيل ، فهذه مناطق من البروتين مكملة للغاية. لذلك سيكون هناك رقعة على جانب ما تكون نقطة ساخنة تتطابق مع رقعة أخرى على البروتين الآخر والتي هي أيضًا نقطة ساخنة. وهي ملاحظة مثيرة للاهتمام أنه حول هذه المناطق حيث توجد النقاط الساخنة ، هناك أحماض أمينية أخرى تستبعد المذيب من الواجهة. ويطلقون على ذلك اسم يا الدائري. هذه بعض الميزات التي تحدث عادةً مع واجهات البروتين.

لذلك في خوارزمية PRISM هذه ، ما يفعلونه هو التالي. يبدأون بقالب - بروتينان معروفان بالتفاعل - ويحددان الواجهة ببساطة عن طريق الاقتراب القريب من الأحماض الأمينية في سلسلة واحدة إلى الأحماض الأمينية في الأخرى. لذلك في هذه الحالة ، تظهر في هذه الكرات مناطق من البروتينات التي تتفاعل.

ثم يقومون بعزل المخلفات البينية. تجاهل بقية البروتين ، لأننا قلنا أن الأجزاء التي تتفاعل في بروتينات مختلفة يمكن أن تكون متجانسة حتى لو لم تكن الهياكل العامة للبروتينات كذلك ، أليس كذلك؟ لذلك سنقوم بحسابات التشابه الهيكلية لدينا فقط على مخلفات الواجهة وليس على الهيكل بأكمله.

ثم باستخدام هذا القالب ، يمكنك بعد ذلك النظر إلى الكثير من البروتينات ومعرفة ما إذا كان لديها أي تطابق بنيوي مع القطع التي تتفاعل. لقد حددوا هنا هذا البروتين ، ASPP2 ، الذي له تماثل بنيوي لـ I kappa b في الواجهة. على الرغم من أنها مختلفة تمامًا على مستوى العالم.

والآن ، بمجرد أن يكون لديهم هذا الشريك المحتمل لـ NF kappa b ، ASPP2 هذا ، سيختبرون ما إذا كان هناك تطابق بنيوي جيد ، سواء في المناطق التي تعتبر نقاط ساخنة على وجه التحديد - لديهم خوارزمية للتنبؤ بالنقاط الساخنة - سواء المطابقة جيدة ، سواء كان ذلك في الحفظ المتسلسل في تلك النقاط الساخنة. وعندها فقط يقومون بالتحسين للقيام بالتحسين المرن للنوع الذي نظرنا إليه في المحاضرة السابقة ، وتقليل الطاقة ، والأساليب الأخرى لمعرفة أفضل هيكل ممكن لهذا المجمع ، ثم ما هو مجاني ستكون الطاقة.

إذن هذا هو وصفهم للمشكلة. لديهم بروتينات وأهداف نموذجية. يفعلون محاذاة الهيكل. سألوا عما إذا كان يتجاوز بعض العتبات. هذه حسابات سريعة جدًا للقيام بها. وفقط إذا اجتازوا هذه الحسابات السريعة ، يمكنك إجراء حسابات أكثر تفصيلاً. وأخيرًا ، فقط إذا تم اجتياز هذا الإجراء ، يمكنك القيام بالتحسين الحسابي المكلف للغاية.

ثم هناك شيء مهم يجب تذكره من هذه الخوارزمية وهو أنها لا تتطلب تطابق القالب واستعلامه بشكل مثالي في الهيكل. في الواقع ، يمكن أن تأتي عناصر الهيكل في الواجهة من أجزاء مختلفة من السلسلة. لذا فهم لا يأخذون في الحسبان ترتيب السلسلة.

لذلك إذا كان لدي بنية صفائح بيتا في بروتين واحد يشبه هذا ، في استفساري ، يمكن أن يكون هذان البروتينان مرتبطين بشكل غير مباشر. لا يهمني أن هناك فجوة كبيرة في الإدخال. يهمني فقط أنه محليًا في الواجهة ، يشبه أحد البروتينات كثيرًا الآخر. كان هناك سؤال في الخلف.

الجمهور: كيف تبحث في قاعدة بيانات عن الهياكل ثلاثية الأبعاد؟ هل تنظر فقط إلى كل [غير مسموع]؟

البروفيسور: هذا صحيح. لذا كان السؤال ، كيف تبحث في قاعدة بيانات عن بنية ثلاثية الأبعاد؟ يمكنك إجراء مقارنات تشابه بنيوية تعتمد على الإحداثيات ثلاثية الأبعاد. إن أبسط طريقة للقيام بذلك ، ولكن ليس الأكثر فاعلية ، هي العثور على تراكب الجسم الصلب الذي يقلل من جذر متوسط ​​الانحراف التربيعي ، والذي كان مقياسًا قدمناه في إحدى المحاضرات السابقة.

هناك أشياء أسرع يمكنك القيام بها أيضًا. يمكنك أن تتخيل أنه يمكنك النظر إلى بعض السمات العالمية لعناصر البنية الثانوية وما إلى ذلك. وكان هناك الكثير من العمل لجعل تلك الخوارزميات سريعة جدًا. اسئلة اخرى؟ سؤال جيد.

لذلك أعطوا مثالًا في أوراقهم البحثية التي تبدأ بهذا المركب الهيكلي المعروف ، كيناز المعتمد على السيكلين ، السيكلين ، والمثبط p27. ثم ابحث عن التطابقات الهيكلية. حتى نتمكن من تحديد تطابق الهيكل المحتمل هذا. لقد صقلته ، واحصل على طاقة من التفاعل. جرب واحدة أخرى ليس لها تشابه بنيوي عالمي. مرة أخرى ، بمجرد اجتياز جميع الاختبارات ، يمكنك حساب الصقل والطاقة. وبالمثل مع هذا الجانب.

ومن هذا المركب الأولي ، حيث كان لدينا هذين البروتينين المعروفين بتفاعليتهما في PDP ، يمكنهم توقع أن هذه البروتينات الأخرى من المحتمل أن تتفاعل على الرغم من أنه ، مرة أخرى ، على المستوى العالمي ، هناك القليل جدًا من التشابه في التسلسل. هل هذا واضح؟

نعم. لذا فإن ميزة هذا هو أنه يقوم في النهاية بهذه التحسينات الهيكلية التي تسمح لنا باكتشاف أفضل تطابق بين بروتينين متفاعلين محتملين. لكن هذا أيضًا ضعفها لأن ذلك يستغرق الكثير من الوقت الحسابي.

لذا فإن هذا النهج الآخر المسمى PrePPI لا يقوم في الواقع بهذه التحسينات الهيكلية من النوع الذي تحدثنا عنه في المحاضرة السابقة. إذا كان الأمر كذلك ، كيف تعرف ما إذا كان من المحتمل أن يتفاعل البروتينان؟ إذن هذا هو مخططهم ، وسنتابع الخطوات.

لذلك تبدأ ببروتيني استعلام تريد معرفة ما إذا كانا يتفاعلان أم لا. وتقوم بعمل تشابه تسلسلي مع قاعدة بيانات للبنى المعروفة. لذلك تجد متماثلات متسلسلة لتلك البروتينات. ولذا يسمون تلك النماذج المتماثلة. ماجستير وم.

والآن يبحثون في قاعدة البيانات عن جميع المتماثلات الهيكلية ، وليس متماثلات التسلسل ، ولكن المتماثلات الهيكلية لـ MA و MB.لذلك حصلوا على سلسلة من الجيران يسمونها NA 1 إلى n و NB 1 إلى n. إذن هؤلاء هم جيران هؤلاء المتماثلات.

وسألوا ما إذا كان أي من هؤلاء الجيران ، أي شيء في هذا الصف ، أي شيء في هذا الصف ، معروف بالتفاعل. ويمكن أن يكون هذا التفاعل المحتمل نموذجًا لتفاعل الاستعلام ، أليس كذلك؟ حتى الان جيدة جدا.

ثم يقومون بمحاذاة التسلسل. يتسلسل محاذاة MA و MB ، وهما المتماثلان البنيويان المعروفان للاستعلامات ، والبروتينين المعروفين بالتفاعل. والآن لديهم هذا النموذج المحتمل لتفاعل الاستعلامات المكونة من بروتينين لهما بنية معروفة لهما متماثلات معروفة بالتفاعل. نعم؟ لذلك تم حذف خطوتين من التفاعل الفعلي.

الآن ، بينما تقول شخصياتهم أنهم يقومون بتراكب بنيوي ، هذا ليس ما يفعلونه في الواقع. إذا نظرت إليها بعناية ، فهي عبارة عن تحليل تسلسلي. وسوف آخذك خلال الخطوات في ثانية. لذا فهم يقصدون منظمًا بطريقة فضفاضة إلى حد ما. لذا فهم يقومون فقط بإجراء مقارنات متسلسلة هنا. إنهم لا يقومون أبدًا ببناء نموذج تجانس لطلبات البحث. نعم

إذن هذا الرقم يأتي من الملحق حيث ، لسبب غامض ، قاموا بتغيير كل التسميات. لذا فإن الأشياء التي كانت تسمى سابقًا NA و NB تسمى الآن TA و TB. خذ ما تحصل عليه. هذا زوج من البروتينات المتفاعلة حيث يُعرف هيكل التفاعل. وهم جيران بنيويون لـ NA و NB ، ولا تعرف ما إذا كانوا يتفاعلون أم لا.

يتعرفون على البقايا المتفاعلة في هذا الهيكل. لهذا السبب يتم تمثيله بهذه الخطوط السوداء التي تربط النقاط الزرقاء. إذن فهذه بقايا متفاعلة من بروتينات القالب والجيران NA و NB. وسألوا ما إذا كانت الأحماض الأمينية في MA و MB تطابق جيدًا هذه الواجهة. ولديهم عدد من المعايير للقيام بذلك.

لذلك توصلوا إلى خمسة مقاييس. أول هذه المقاييس هو التشابه الهيكلي بين بروتينات MA و MA و MB و NA و NB. ثم التشابه - حسنًا ، التشابه هو التشابه الهيكلي. ثم سألوا ، كم عدد الأحماض الأمينية في هذه الواجهة ، وما هو جزء الأحماض الأمينية في الواجهة التي يمكن محاذاتها؟ إذن فهذه محاذاة تعتمد على التسلسل لـ MA و- حسنًا ، تسمى هنا TA ، لكنها كانت تسمى سابقًا MA. فقط لجعل الحياة معقدة. إذن هذه هي المحاذاة القائمة على التسلسل.

هذه هي بقايا متفاعلة ، كل البقايا الزرقاء في هيكل تفاعل TA والسل. وسألوا ، ما هو الكسر وما هو عدد هذه الأحماض الأمينية المتوافقة في محاذاة التسلسل هذه؟ لذا ها هم يأتون برقم. في هذه الحالة ، أعتقد أن هناك أربعة أحماض أمينية في هذا - أربعة أزواج ، يجب أن أقول ، من الأحماض الأمينية - واحد ، اثنان ، ثلاثة ، وأربعة ، المشار إليها بهذه الأسطر الأربعة - يتفاعل كلاهما في الهيكل للمركب ويمكن أن تتماشى مع التسلسلات في MA و MB.

وبعد ذلك يستخدمون هذه الخوارزميات الأخرى التي تعتمد أساسًا على التعلم الآلي الذي يبحث في واجهات البروتين لتحديد ما إذا كان تسلسل الأحماض الأمينية التي ستبقى في تلك الأماكن في الواجهة من المحتمل أن تكون بقايا تحدث عادةً في الواجهات. إذن هذا هو نوع الإحصائيات التي عرضتها عليكم من قبل من تلك الأوراق القديمة التي قالت إن 10٪ من الأحماض الأمينية موجودة في هذه النقاط الساخنة. هناك أنواع معينة من الأحماض الأمينية سائدة هناك. لذا فإن عدد الخوارزميات ، وهم يسردون مجموعة ، يستخدمونها للتوصل إلى نتيجة لتقرير ما إذا كانت هذه البقايا ، في الواقع ، من المحتمل إحصائيًا أن تكون مطابقة جيدة. لذلك لديهم هذه المعايير وقرروا بعد ذلك أن بعض أجزاء الأحماض الأمينية في هذه الواجهة في MA و MB من المحتمل أن تكون معقولة لتكون في الواجهة.

بعد كل ذلك ، قاموا باستخدام كل هذه الدرجات المختلفة مع مصنف بايزي ، وسنتحدث بعد ذلك بقليل في هذه المحاضرة وربما المحاضرة التالية بالإضافة إلى ما هو مصنف بايزي. لكنهم قاموا بتجميع كل هذه الدرجات في أنها مشتقة من هذه البروتينات لتحديد ما إذا كان من المحتمل أن يتفاعل هذان البروتينان.

لذا فإن ميزة هذا النهج هي أنه سريع للغاية. كل ما تحدثنا عنه هو حسابات سريعة للغاية. حتى المحاذاة الهيكلية سريعة. تسلسل المحاذاة ، بالطبع ، هي. لذلك نتجاوز قاعدة البيانات بأكملها بسرعة كبيرة. لذلك قاموا بالفعل بحساب شركاء الجذب المحتملين لكل زوج من البروتينات في الجينومات المختلفة بناءً على هذه المحاذاة فقط.

العيب - إذن ما هو عيب هذه الطريقة؟

الجمهور: ألا يمكنك الحصول على تفاعل de novo؟

البروفيسور: لا يمكننا الحصول على أي تفاعل de novo ، لذلك إذا لم تكن هناك هياكل مجاورة تتفاعل ، فلن يأتوا بها أبدًا. إذن فهذه نقطة مهمة. ثم المشكلة الأخرى ، لأنه لا يحتوي على التحسين الهيكلي ، فقد تم التخلي عن هذا الحساب البطيء ، وبالتالي يفقد أيضًا الكثير من الخصوصية المحتملة. سيتم فقد جميع التغييرات التوافقية التي يمكن أن تحدث في خوارزمية مثل هذه.

لذلك لدينا هذان النهجان المتنافسان. نعم ، الأسئلة في الخلف.

الجمهور: ألا يمكن استخدام هذه الطريقة فعليًا كمدخل ، على سبيل المثال ، لخطوة تحسين ، على سبيل المثال؟

البروفيسور: كان السؤال هو ، هل يمكنك استخدام هذا النوع من النهج كمدخل لخطوة التحسين؟ ويمكن للمرء أن يفعل ذلك. هل هناك سؤال آخر هناك؟ اسئلة اخرى؟

حسنا. لذلك سنأخذ منعطفًا طفيفًا هنا في محاضرة الدورة ونبتعد عن النهج الحسابي البحت وننظر في الواقع في كيفية إجراء قياسات التفاعل. أحد التغييرات الكبيرة في العقد الماضي أو نحو ذلك هو أننا انتقلنا من عصر كانت فيه التفاعلات تُقاس بشكل ثنائي إلى تفاعلات تُقاس بكميات كبيرة. لذلك من خلال قياسات عالية الإنتاجية. وسنرى أن هذا يقودنا إلى بعض المشكلات الإحصائية التي تعيدنا في النهاية إلى بعض المشكلات الحسابية أيضًا.

لذلك إذا كنت تريد قياس جميع البروتينات التي تتفاعل في كائن ما ، فمن الواضح أنها صعبة للغاية. أحد التطورات الكبيرة التي ساعدت في ذلك هو فكرة وضع علامات على البروتينات واستخدام مقياس الطيف الكتلي لمعرفة ما تتفاعل معه. لذلك في هاتين المجموعتين من الأوراق ، والتي كانت من أوائل الأوراق التي تم إجراؤها في الخميرة ، أخذوا بروتينًا واحدًا في كل مرة وربطوا به علامة. وسأتحدث عن ماهية تلك العلامات بالضبط ، لكن تلك هي الملصقات التي تسمح لك بإرفاقها بدعم قوي.

وبعد ذلك من خلال الارتباط بدعامة صلبة ، يمكنك بعد ذلك تنقية أي بروتينات عالقة ببروتين واحد هنا. وبعد ذلك ، بعد تنقيتها ، يمكنك إخراجها من مادة هلامية ، وقطعها ، ومعرفة هوية تلك البروتينات المتفاعلة بمواصفات الكتلة. لذلك يبدو هذا كثيف العمالة ، لكنه لا يزال أسرع بكثير من أي شيء سبقه. وبهذا النهج ، تمكنوا من المرور عبر الجينوم بأكمله ، والبروتينات التي يجب أن أقولها ، ومعرفة جميع الشركاء المتفاعلين لكسور كبيرة جدًا جدًا من جميع البروتينات الموجودة هناك.

إذن مع هذا النهج ، ما أنواع البروتينات التي تعتقد أنه من المحتمل أن تكون إيجابية خاطئة؟ أي أفكار؟ نعم فعلا.

الجمهور: عالقة البروتينات في العمود والتي لا علاقة لها بالتفاعل [غير مسموع].

الأستاذ: بالضبط. لذا فإن الشيء الوحيد الذي يمكن أن يكون مشكلة كبيرة هو البروتينات التي تلتصق بالعمود بغض النظر عن البروتين الذي تضعه هناك. وسنرى طريقة للتخلص من ذلك. أنواع أخرى من المشاكل؟ البديل من ذلك. أفكار؟

ماذا عن البروتينات التي تميل إلى الالتصاق ببروتينات أخرى بشكل غير محدد ، أليس كذلك؟ هذه ستكون مشكلة كبيرة أيضًا. وما هي السلبيات الخاطئة المحتملة في نهج كهذا؟ تتفاعل البروتينات التي تتفاعل بالفعل مع البروتين الأزرق ولكن لا يتم التقاطها. نعم فعلا.

الجمهور: شركاء التفاعل الضعيف [غير مسموع]

البروفيسور: ضعف تفاعل الشركاء ، الأشياء ، خاصة مع نصف عمر قصير. نظرًا لأنك تقوم بالغسيل كثيرًا ، فستعتمد على عمر النصف. حسن جدا. ماذا بعد؟ نعم.

الجمهور: ربما شيء يتفاعل في منطقة العلامة؟

الأستاذ: شيء ما يتفاعل في منطقة العلامات ، صحيح. لذا فإن شيئًا ما يتفاعل هنا سيضيع لأن هذا سيتداخل بشكل معقد. حسن جدا. أي شيء آخر؟ ماذا عن تركيز البروتينات. كيف يؤثر ذلك على ظهورهم هنا؟

حسنا. لذلك إذا كان لدي بروتين عالي التركيز ، فقد يتفاعل على الرغم من أنه لا يتفاعل بشكل طبيعي. هم لا يرون بعضهم البعض ابدا هم في مقصورات مختلفة. ولكن عندما [غير مسموع] وافعل هذا. لكن البروتينات منخفضة الوفرة ستكون مشكلة كبيرة لأنه سيكون هناك القليل جدًا منها في هذه المجمعات مقارنة بالبروتينات عالية الوفرة. لن يتم اكتشافه بهذه الطريقة. لن يصلوا أبدًا إلى المواصفات الجماعية ، وما إلى ذلك. إذن ، لدينا إيجابيات كاذبة وسلبيات كاذبة في هذه الأساليب.

الآن ، أحد الأشياء التي ظهرت هو البروتينات التي تلتصق بشكل غير خاص بالعمود. وكان هناك نهج ذكي في إحدى هذه الأوراق المبكرة تم اختياره لتجنب ذلك. وهذا ما يسمى تنقية التقارب الترادفي ، أو علامات TAP. والفكرة هي التالية.

لدينا بعض الجينات. ونستخدم إعادة التركيب المتماثل - تم ذلك في الخميرة حيث يكون ذلك سهلاً - لإدخال هذا التسلسل ، والذي يرمز لما يلي. قطعة من البروتين ليس لها وظيفة معينة ، على حد علم الجميع ، فاصل ، يتبعه هذا البروتين المرتبط بالهدودولين ، يليه موقع التعرف على البروتياز ، ثم البروتين أ.

لذلك بمجرد أن يتم التعبير عن هذا البروتين - ويتم التعبير عنه بمستوياته الأصلية لأنك تقوم بإدخاله في الجينوم. لذلك فهي ليست على مروج خارجي. إنها في وضعها الطبيعي. مهما كان هذا البروتين ، فإنه يحتوي على كل هذه القطع على أنه الطرف C. فكيف يساعد ذلك؟

في عملية التنقية ، نبدأ بشيء ، IgG IGG ، والذي يرتبط بالبروتين A. والآن هذا ما يربطنا بالدعم القوي. وستكون كل تلك الأشياء التي هي مجلدات غير محددة مرتبطة بالدعم القوي.

ولذا ، إذا كان لدي بعض المجلدات غير المحددة التي تحب دعمي القوي ، فستكون هنا. غير محدد. وإذا قمت فقط بغسل كل شيء من العمود وتشغيل المواد الهلامية الخاصة بي ، أو غليتها في SDS ، فسوف أحصل على البروتين غير المحدد أيضًا. لكن ما يفعلونه بدلاً من ذلك هو أنهم بدلاً من ذلك يلتصقون هنا ببروتياز محدد جدًا يتعرف على هذا الموقع. يطلق عليه اسم بروتياز فيروس حفر التبغ. لها تسلسل تمييز طويل جدًا. يمكنك التأكد من أنه لا يقطع أي بروتين آخر.

والآن ، بدلًا من الإشارة إلى مادة غير خاصة بالحامض أو المنظفات ، فأنت تلمح على وجه التحديد بـ TEV ، ومن ثم سوف يسقط هذا الجزء من البروتين. وبعد ذلك تقوم بتنقية ثانية تعتمد على هذه القطعة من البروتين. لذا فأنت تسحب فقط الأشياء التي تريدها والتي تحتوي على الـ CBP ، وهو بروتين رابط للكالودولين ، من خلال الحصول على نوع مختلف من الدعم الصلب المرتبط به كالمودولين.

ومن خلال هذه العملية ، يمكنك التخلص من الكثير من المجلدات غير المحددة. لا يساعدك مع السلبيات الخاطئة ، أليس كذلك؟ لقد جعلت ظروف الغسيل أكثر قسوة ، لذا ستفقد المزيد من البروتينات. لكنك ستلتقط عددًا أقل من الإيجابيات الخاطئة.

وأخيرًا ، يستخدم إجراء التنقية الأخير EGTA ، وهو عامل مخلب. لذا فإن هذا التفاعل بين CBP و calodulin يعتمد على الكالسيوم. EGTA تمتص الكالسيوم من هذا التفاعل. ولذا فهي ، مرة أخرى ، طريقة محددة جدًا للتلميح بطريقة غير محددة إلى حد ما ، مثل الحرارة أو الملح أو الحمض أو المنظفات.

لذلك كانت هذه إحدى التقنيات ، تنقية التقارب متبوعة بمواصفات الكتلة ، والتي أعطتنا الكثير من المعلومات حول تفاعلات البروتين والبروتين. وتقنية الحوسبة التي ساهمت كثيرًا أيضًا تسمى الخميرة ثنائية الهجين.

إذن في هذا النهج ، لديك جين مراسل لن يتم نسخه في العادة. يحتوي على موقع ربط الحمض النووي التصميم ، وبروتين ربط الحمض النووي ، وبروتين الطعم الخاص بك. وتريد معرفة كل بروتين يمكنه التفاعل مع هذه الفريسة. لذا فإن الفريسة الآن مرتبطة بمجال التنشيط.

إذا لم يتفاعل هذان البروتينان ، فلن يتم تعيين مجال التنشيط لهذا المراسل ، فلا يوجد نسخ. ولكن إذا تفاعل البروتين الأخضر والبروتين الأزرق ، فسيتم تجنيد مجال التنشيط لهذا المُعزز وسوف يقوم بتشغيل النسخ ، وبعد ذلك ستحصل على إشارة.

إذن ما هي بعض مزايا هذا النهج؟ لا يتطلب منك تنقية أي شيء. لذلك يجب أن تكون أكثر حساسية للبروتينات منخفضة الوفرة. لذا فهذه بالتأكيد ميزة.

سوف تلتقط الكثير من تلك التفاعلات العابرة. قد لا تحصل على تنشيط مستمر ، ولكن ستحصل على تنشيط عابر. وإذا قمت بإعداد الشروط بشكل صحيح ، يمكنك التقاط التنشيط العابر.

لكن لها تحيزاتها الخاصة ، لذلك لن تكون أي من هذه التقنيات مثالية. سيكون متحيزًا ضد البروتينات التي لا تعبر بشكل جيد. هذا ، كما يوحي الاسم ، يتم عادة في الخميرة. لذلك إذا كان لديك بروتينات بشرية وقمت بالتعبير عنها في الخميرة ، أو البروتينات النباتية التي تعبر عنها في الخميرة ، فقد يكون هناك بعض البروتينات التي لن تظهر بشكل جيد في ذلك الكائن الحي.

ماذا يمكن أن يكون مشكلة؟ بعض البروتينات لا تعمل بشكل جيد في النواة ، أليس كذلك؟ لذا إذا كنت مهتمًا بالتفاعل مع بروتينات الغشاء ، فسيكون من الصعب جدًا جعلها تعبر في النواة ، وبالتالي ، لن تلتقط هذه التفاعلات أبدًا.

نعم. إذن لدينا هاتان التقنيتان المختلفتان - مواصفات كتلة التقاط التقارب والثنائي الهجين. أسئلة حول تلك التقنيات؟ نعم فعلا.

الجمهور: هل يمكن أن يكون عنصر تحكم آخر لتنقية المواصفات الجماعية فقط لطرح كل ما يشير إلى غير محدد.

الأستاذ: كان السؤال ، هل يمكنك طرح أي شيء غير محدد. ونعم ، إذا كان لديك ما يمكن أن تسميه المسافر الدائم ، البروتينات التي تظهر في كل عملية تنقية ، فيمكنك ببساطة تجاهلها. وغالبًا ما يتم ذلك. سيساعدك ذلك في الأشياء غير المحددة للسطح.

ما هو أكثر من مشكلة البروتينات التي لديها بعض الانجذاب إلى البروتين الخاص بك x ولكنها ليست محددة للغاية بالنسبة له. لذلك فهي تميل إلى الارتباط بأنواع معينة من البقع. سيكون من الصعب معرفة ذلك لأنهم لن يلتزموا بكل شيء. سؤال جيد. اسئلة اخرى؟

حسنا. لذلك لدينا هذه التقنيات المختلفة. ما نرغب حقًا في أن نكون قادرين على فعله هو أننا نعلم أن هناك مشاكل في كل نهج. نود أن نكون قادرين على حساب احتمال تفاعل بروتينين بناءً على البيانات. لذا نعود الآن إلى الأساليب الحسابية الأكثر رياضية.

لذلك إذا نظرنا إلى تجربة واحدة فقط - وسنتحدث عن المعيار الذهبي. إذن ما هو المعيار الذهبي؟ إنها مجموعة من البروتينات التي لدينا ثقة عالية للغاية تتفاعل معها لأنه تم تحليلها بواسطة تقنية أخرى. ليست مواصفات جماعية هجينة وغير متقاربة ، ولكن تفاعلات مباشرة أكثر بكثير. بالقياسات الفيزيائية ، ربما العمل الهيكلي. لذا فإن عدد المعايير التي تدخل فيه.

لذلك لدينا مجموعة البيانات القياسية الذهبية حيث نعرف أن البروتينات تتفاعل بالتأكيد ، ولدينا تجربتنا. لذا من الواضح أن أي شيء في التداخل ، يمكننا اعتباره إيجابيات حقيقية ، أليس كذلك؟ اكتشفنا ذلك. إنه موجود في قاعدة بيانات معايير الذهب. والأشياء الموجودة في المعيار الذهبي التي فاتناها هي بوضوح سلبيات كاذبة. أبلغنا عنهم على أنهم غير متفاعلين ، لكنهم في الواقع يفعلون ذلك.

السؤال هو ، ما مقدار هذا الإيجابي الحقيقي؟ كل شيء تم اكتشافه في التجربة ولكن ليس لدينا معلومات عنه في قاعدة البيانات. لذلك يمكن أن يكون ذلك لسبب من سببين ، أليس كذلك؟ يمكن أن يكون ذلك أنهم في الحقيقة لا يتفاعلون. أو ربما لم يقم أحد بقياسها. بيت القصيد من هذه التجربة هو إيجاد أشياء جديدة.

إذن ، هل هناك أي طريقة لتقدير أي جزء من كل الأشياء التي تنفرد بها هذه التجربة يمثل إيجابيات حقيقية ، وما هو الكسر الذي يمثل إيجابيات خاطئة؟ أولئك الذين نود أن نحاول اكتشافهم.

الآن ، إذا كان لدينا تجربة واحدة فقط ، فسيكون ذلك صعبًا للغاية. لكن ماذا يحدث عندما يكون لدينا تجربتان؟ إذن لدينا هاتان التجربتان لمواصفات الكتلة لالتقاط التقارب ، أو ربما مواصفات كتلة التقاط التقارب واثنين من الهجين. لنفكر الآن في تداخل هاتين التجربتين مع المعيار الذهبي.

لقد حصلت على منطقة التداخل هذه بين التجربة 1 والتجربة 2 ، ثم هذه المنطقة المتداخلة بين الأشياء الثلاثة. التجربة 1 والتجربة 2 والمعيار الذهبي. إذن من الواضح أن هذين هما إيجابيان ، أليس كذلك؟ لديهم ثقة عالية لأنني التقطتهم في كلتا التجربتين ، وهم في المعيار الذهبي.

ماذا عن كل هذه الأشياء في ما أشرت إليه هنا المنطقة 2؟ حسنًا ، إذا كنا نعتقد أن هاتين التجربتين مستقلتان عن بعضهما البعض بطريقة صارمة - لذلك لنفترض أن أحدهما مكون من نوعين هجين والآخر خاص بمواصفات كتلة التقاط التقارب ، فلا يوجد سبب محدد لأن الإيجابيات الخاطئة لأحدهما ستكون إيجابية خاطئة في الآخر. في هذه الحالة ، يمكنني أن أسمي هذه المنطقة 2 إجماعي بالإيجابيات الحقيقية. لدي ثقة كبيرة في أن هؤلاء هم المتفاعلون الحقيقيون. الجميع يشتري ذلك؟ يبدو معقولا؟

نعم. وهنا يأتي دور الحيلة. ما هو جزء من كل هذه الإيجابيات الحقيقية المتوافقة مع الإجماع التي تم التقاطها في المعيار الذهبي؟ هذه النسبة ، أليس كذلك؟ المنطقة 1 فوق المنطقة 2. موافق.

الآن لدي هذه المنطقة من الأشياء التي تم التقاطها - الإيجابيات الحقيقية من هذه التجربة ، ثم المعيار الذهبي. ثم حصلت على هذه المنطقة الفريدة من نوعها للتجربة 2 وستكون مزيجًا من الإيجابيات الحقيقية والإيجابيات الزائفة. ويقدم مؤلفو هذه الورقة المذكورة هنا الحجة التالية.

سنفترض أن نسبة I إلى II هي نفسها نسبة III إلى IV. إذن ، جزء الإجماع الإيجابيات الحقيقية التي تم انتقاؤها - هذه تجارب مستقلة. لذا فإن نسبة الإيجابيات الحقيقية التي يتم التقاطها في المعيار الذهبي ستكون ثابتة ، سواء كانت متفق عليها أم لا.

لذا فإن الكسر عند النسبة من I إلى II سيكون هو نفسه نسبة III إلى IV. لذلك ، بعد ذلك ، يمكنني معرفة مقدار هذه المنطقة التي تتكون من إيجابيات حقيقية وكم تتكون من الإيجابيات الكاذبة. الجميع يشتري ذلك؟ نعم.

الجمهور: هل يمكنني التحقق - ألا نقول أن المعيار الذهبي يمثل جميع الإيجابيات الحقيقية؟

الأستاذ: صحيح. حسنًا ، نحن نقول إن المعيار الذهبي يتكون من أشياء نعرف أنها تتفاعل -

الجمهور: ولكن قد يكون هناك المزيد.

الأستاذ: ولكن قد يكون هناك المزيد. والهدف من تجربتنا هو إيجاد تلك التجارب الأخرى. حسنا. لذلك إذا قبلت هذه الفرضية ، والتي تبدو معقولة ، فيمكنك حساب أي جزء من كل الأشياء التي تم التقاطها في كل من هذه التجارب من المحتمل أن تكون إيجابية حقيقية.

حتى لفة الطبل من فضلك. اتضح أن الرقم ليس بهذا الارتفاع. لذا فإن نسبة الأشياء في الإجماع كانت 347 من عام 2000 تقريبًا. وإذا قمت بالحسابات ، فإن ما ينتهي بك الأمر هو أن الجزء الحقيقي في هذه المنطقة ، والذي ليس لدينا بيانات عنه ، هو 1123 من - والقطعة الخاطئة في هذا ستكون حوالي 15000.

وقد تقدموا وقاموا بذلك لعدد من التجارب المختلفة وحسابوا جزء الإيجابيات الزائفة المشتقة لهذه البيانات - قد يكون من الصعب بعض الشيء رؤيته على هذه الشاشة. لكن الأرقام تتراوح بين 50٪ من الإيجابيات الكاذبة ، في بعض الحالات ، أكثر من 90٪ من الإيجابيات الكاذبة. هذا مزعج قليلاً ، أليس كذلك؟ لذا فإن هذه التقنيات جيدة في التقاط التفاعلات ، ولكن هناك سبب للشك الشديد.

نعم. إذن لدينا الآن مشكلة خطيرة ، لأنه كيف سنكتشف أيًا من هذه التفاعلات نثق به عندما نعلم أن جزءًا كبيرًا جدًا منها عبارة عن إيجابيات خاطئة؟ إذن ماذا يمكنك أن تفعل؟ حسنًا ، يمكنك أن تأخذ القليل من التداخل. يمكنك القول ، لدي مخطط فين هذا - الطريقة 1 ، الطريقة 2. لقد اتفقوا بالفعل على مجموعة من الأشياء. لذلك يمكنني أخذ هؤلاء فقط.

من الواضح أن هذا يرمي كثيرًا. اقترح شخص آخر أنه يمكننا التخلص من البروتينات اللاصقة ، أليس كذلك؟ لذلك ربما توجد بروتينات غير محددة لا تظهر في كل تجربة ، لكنها تظهر في جزء كبير جدًا جدًا من جميع التجارب. ربما أرمي هؤلاء. هذا احتمال آخر.

لكن ما نريد فعله حقًا هو التوصل إلى تقدير احتمالية. ألا تضطر إلى اتخاذ قرار صعب ، ولكن توصل إلى تقدير لاحتمال تفاعل الأشياء بناءً على جميع البيانات. إذن كيف نبدأ في القيام بذلك؟

إذن ، أولاً وقبل كل شيء ، ماذا يحدث إذا كنت تحتاج فقط إلى إجماع؟ لذلك تُظهر هذه المؤامرة دقة وتغطية المعيار الذهبي للتجارب الفردية ذات العتبات المختلفة لتقرير ما هو المتفاعل ، والقطع والأشياء المختلفة. لذلك يتم عرض التجارب الفردية هنا.

وبعد ذلك ، إذا اكتسبت طريقتين لاختيار شيء ما ، أو ثلاث طرق لاختيار شيء ما ، يمكنك تحسين دقتك بشكل أفضل. هذا هو مؤامرة لوغاريتمي. لذلك إذا كنت تحتاج إلى ثلاث طرق للاتفاق قبل أن تطلق على شيء ما إيجابيًا حقيقيًا ، فيمكنك الحصول على ما يصل إلى - لست متأكدًا بالضبط ما هو هذا ، ولكن ربما 80٪ ، 90٪. حق؟ لكن انظر إلى مكانك في المحور ص. ستحصل على تغطية أقل من 1٪ فقط من المعيار الذهبي. لذلك هذا ليس أسلوبًا رائعًا.

لذا ما نريد فعله حقًا ، كما قلت ، هو محاولة تقدير احتمالية تفاعل البروتينات في ضوء جميع البيانات المتاحة لدينا. ويمكن أن تكون البيانات تجارب محددة. قل تجربتي مواصفات الكتلة المختلفتين اللتين أشرنا إليهما للتو. أو كما سنرى لاحقًا في هذه المحاضرة وربما في المحاضرة التالية ، أنواع أخرى من البيانات الخارجية التي لا تمثل قياسات فيزيائية مباشرة للتفاعل ، ولكنها قد تمنحنا الثقة في أن الأشياء تتفاعل بناءً على التشابه في التعليق التوضيحي ، أو التشابه في التعبير الجيني ، وما إلى ذلك. وسوف ندخل في تفاصيل ذلك.

نعم. للقيام بذلك ، نحتاج إلى القليل من تجديد المعلومات حول إحصائيات بايزي. لذلك أريد قياس احتمال أن يكون التفاعل صحيحًا بالنظر إلى البيانات المتاحة. حق؟ ويمكنني تقدير ذلك بناءً على احتمالية مراقبة البيانات للأشياء التي أعرف أنها صحيحة وهذه التقديرات السابقة. إذن ما هو الاحتمال السابق أن يكون التفاعل صحيحًا والاحتمال السابق لمراقبة مجموعة بيانات معينة.

الآن ، هذا في حد ذاته ليس مفيدًا حقًا. لم أخبرك بعد بكيفية حساب أي من الشروط على اليمين. لكن تحمل معي. إذا أردت تحديد احتمالية تفاعل البروتين - ما مدى احتمالية تفاعله؟ هل من المرجح أنه يتفاعل أم لا؟ يمكنني حساب هذه النسبة. احتمال أن يكون التفاعل صحيحًا بالنظر إلى البيانات المتعلقة باحتمالية حدوث تفاعل خاطئ بالنظر إلى البيانات. هذه هي نسبة الاحتمالية.

إذن بهذه الصيغة ، ألغي هذا الاحتمال للبيانات ، الاحتمال السابق للبيانات. وإذا كانت لدي طريقة لحساب هذا ، وسنصل إليه في غضون ثانية ، ثم إذا كان من المرجح أن يكون تفاعلًا حقيقيًا ، فيمكنني تسميته تفاعلًا ، صحيحًا ، إذا كان أقل احتمالًا. لذلك إذا كانت هذه النسبة أكبر من 1 ، فأنا أقبلها كتفاعل حقيقي. إذا كانت هذه النسبة أقل من 1 ، فأنا أرفضها.

نعم. لذا فإن التحدي الذي نواجهه الآن هو معرفة كيفية حساب هذه الشروط. هناك شيء آخر يجب ملاحظته وهو إذا كان كل ما أريد فعله هو أن أكون قادرًا على ترتيب كل تفاعل حسب نسبة الاحتمالية هذه ، بدلاً من الخروج بعتبة صارمة ، فأنا في الواقع لست بحاجة إلى كل هذه المصطلحات. إذن هذه هي نسبة الاحتمال. يمكنني تحويله إلى مساحة السجل. إذن سيكون مجموع هذين الحدين.

وإذا كنت أقوم بترتيب كل شيء وفقًا لنسبة احتمالية التسجيل ، فإن هذا المصطلح هو نفسه لكل تفاعل. إنها تتكون فقط من احتمالات سابقة. لذلك لن يؤثر ذلك على الترتيب على الإطلاق. أي أسئلة حول ذلك؟ هل هذا واضح؟ حسن.

لذا ، إذا أردت فقط التوصل إلى وظيفة تصنيف ، فكل ما علي فعله - كل ما علي فعله - هو أن أكون قادرًا على تقدير احتمالية مراقبة البيانات للتفاعلات الحقيقية واحتمال مراقبة تلك المجموعة من البيانات للتفاعلات الخاطئة. الجميع يشتري ذلك؟ نعم من فضلك.

الجمهور: عندما تقول أن الاحتمال السابق هو نفسه لجميع التفاعلات ، فإننا نقول إننا نفترض نفس الاحتمال السابق للجميع ، أم أن هذا [غير مسموع]؟

الأستاذ: هذا هو تعريفه. نعني ، ما هو الاحتمال السابق لتفاعل البروتينات مقابل الاحتمال السابق؟ لذا فهي مستقلة عن البروتينات التي ننظر إليها. اسئلة اخرى؟

حسنا. لذلك نحن بحاجة إلى طريقة لحساب هذه القطعة من كل الأشياء التي نظرنا إليها من قبل. إذن كيف نحصل على تقدير لاحتمال مراقبة تكوين معين للبيانات؟ بمعنى ، اكتشفته في التجربة 1 وليس في التجربة 2 ، ولكن في التجربة 3. ما هو احتمال ذلك نظرًا لأنه تفاعل حقيقي؟ لذلك هذا ما سنغوص فيه الآن.

نعم. هناك شيء واحد يمكننا القيام به لجعل الحياة أبسط ، وبعد ذلك سنزيل هذا التبسيط لاحقًا ، لكن دعنا ، في الوقت الحالي ، نفترض أن جميع بياناتي مستقلة. لذا سيكون للهجينين أخطاء مختلفة تمامًا عن مواصفات كتلة التقاط التقارب. لذا فإن هاتين المجموعتين من البيانات ستكونان مستقلتين تمامًا عن بعضهما البعض.

لذا يمكنني أن أكتب هذا كمنتج لملاحظة معينة - تجربة مواصفات جماعية معينة وتجربة خاصة ثنائية الهجين من أجل عوامل الجذب الحقيقية والتفاعلات الخاطئة. لذلك فهو نتاج الاحتمالية أن تجربة معينة ستكتشف تفاعلًا إذا كان التفاعل صحيحًا على احتمال أن تكتشفه تلك التجربة المعينة إذا لم يكن هناك تفاعل. سأضرب كل هذه الاحتمالات. نعم فعلا.

الجمهور: [غير مسموع]. هذا هو زوج تفاعل واحد؟

الجمهور: وأنت تأخذ المنتج على جميع أزواج التفاعل في جولة واحدة من التجربة. هل هذا صحيح؟

المحاضر: إذا كنت أرغب في تحديد ما إذا كان زوج تفاعل معين - فأنا أريد حساب نسبة احتمالية السجل هذه ، أو نسبة الترتيب هذه ، في الواقع ، لأنني تخلصت من السوابق. أريد حساب نسبة الترتيب هذه لزوج معين. إذن لدي البروتين A والبروتين B. وأريد تحديد ما إذا كنت أعتقد أنه من المرجح أن يتفاعل أم لا ، وأرتبته مع جميع الآخرين ، أليس كذلك؟ لذلك أنا أفعل هذا من أجل زوج من البروتينات الآن. حتى الان جيدة جدا؟

الآن ، بالنسبة لهذا الزوج من البروتينات ، لدي سلسلة من الملاحظات ، أو نقص في الملاحظات ، أليس كذلك؟ لدي مجموعة كاملة من التجارب. هذه التجربة اكتشفتها ، تلك التجربة لم تكتشفها ، هذه فعلتها. إذن ما هو احتمال هذه البروتينات - يتفاعل هذان A و B حقًا بالنظر إلى نعم ، لا ، نعم في تجاربي؟ ثم بالنسبة للبروتين الجديد ، قد يكون لا ، لا ، نعم ، وماذا أريد معرفة احتمالية هذا الزوج.

الجمهور: إذن هل حجم الحرف الكبير M ، هل هو بترتيب مثل 10 تجارب أم 100 تجربة أم آلاف التجارب؟

الأستاذ: آه. لذا فإن السؤال هو ، ما هو حجم هذا. لذا من الواضح أن ذلك سيعتمد على نوع البيانات التي أحملها ، لكن في هذه الحالات ، تكون صغيرة. لذلك لدينا عدد قليل من هذه التجارب عالية الإنتاجية على جينومات وبروتينات كاملة. لذلك ليس هناك الكثير. لذلك في بعض هذه الأوراق المبكرة ، كانت هناك أربع تجارب تفاعل كانوا يدرسون فيها. الآن قد تكون الأرقام أكبر قليلاً ، لكنها ليست أكبر بكثير.

حسنا. الآن لحساب هذا ، نحتاج إلى مجموعة من المعايير الذهبية. لكننا الآن لا نحتاج فقط إلى تفاعلات إيجابية قياسية ، البروتينات التي نعرف أنها تتفاعل بالفعل. نحتاج أيضًا إلى بروتينات نعرف أنها لا تتفاعل حقًا. لأنني أريد حساب احتمالية الملاحظة بالنظر إلى أن بعض التفاعلات خاطئة بالتأكيد.

لذا فإن الطريقة الدقيقة التي أحسب بها هذه المصطلحات ستعتمد على أنواع البيانات. التجارب التي تحدثت عنها للتو ، مواصفات الكتلة الإنتاجية العالية ، والتي كانت تلك التي نظرنا إليها في نسبة الإجماع ، الإيجابيات الحقيقية ، وقدرنا أن 96٪ من جميع البيانات ربما كانت خاطئة. تفاصيل كيفية إجراء هذه الحسابات هنا. أتركك للبحث عن ذلك إذا كنت مهتمًا.

لكن ما سنفعله الآن هو أننا سنرى كيف ، إذا أردنا ترتيب التفاعلات بناءً على هذا المصطلح ، يمكننا تجنب الاضطرار إلى التخلص من معظم بياناتنا. لذلك قلنا أنه إذا طلبنا موافقة جميع التجارب ، فسنحصل على تغطية منخفضة جدًا جدًا. الآن سنقوم بدلاً من ذلك بترتيب كل شيء بناءً على نسبة الاحتمالية هذه ، أو شيء مشتق من نسبة الاحتمالية.

لذا في هذه الورقة حيث كانوا يبحثون ببساطة في مجموعات بيانات تفاعل البروتين والبروتين لحساب هذه التفاعلات ، قاموا بتصنيف كل شيء بناءً على وظيفة التصنيف التي وصفناها للتو. وبعد ذلك ، عندما تقوم بتغيير عتبتك ، يمكنك معرفة عدد الإيجابيات الحقيقية لديك وعدد الإيجابيات الخاطئة التي لديك في المعيار الذهبي. المتفاعلات الحقيقية والمتفاعلات الخاطئة. ويمكنك حساب هذا المنحنى ، أليس كذلك؟ لأي قيمة معينة لنسبة الترتيب هذه ، ما حساسيتي وما هي خصوصيتي؟ هل أنت واضح ما تعنيه هذه الحبكة؟

وهنا رسموا قيم التجارب الفردية. وهذه هي قيمة قاعدة بيانات مستقلة لتفاعلات المعيار الذهبي. والآن ، من أين يأتون بإيجابياتهم الحقيقية وإيجابياتهم الخاطئة؟ سيعتمد الكثير من هذا على مدى تمثيلهم. وتخضع كل هذه الأرقام للمراجعة إذا قررت أن الإيجابيات الحقيقية والإيجابيات الزائفة التي يستخدمها الناس ليست دقيقة بما يكفي.

لذلك استخدموا قاعدتي بيانات مشروحتين جيدًا للتفاعلات. واحد من MIPS وواحد من SGD. ويمكنك أن تلعب ضد بعضها البعض كقاعدة بيانات للإيجابيات الحقيقية. من بعض النواحي ، هذا هو الشيء الأسهل لأن الناس يحبون الإبلاغ عن تفاعل البروتينات. إنهم لا يميلون إلى الإبلاغ عن عدم تفاعل البروتينات. لا ترى الكثير من أوراق الطبيعة تقول أن البروتين x لا يتفاعل مع البروتين y.

إذن كيف ستكتشف ، إذن ، ما هي سلبياتك الحقيقية؟ إذن ، الاستراتيجيات التي استخدموها - حسنًا ، أحد الاحتمالات هو أنها مشروحة لتكون في مجمعات ، وتلك المجمعات مختلفة عن بعضها البعض. هذا ليس سيئا ، أليس كذلك؟ لكنها ليست ضمانًا أيضًا.

أو هذا أفضل قليلاً. لقد تم وضع تعليقات عليها لتكون في أجزاء مختلفة من الخلية. بالطبع ، إذا لم تكن هذه التعليقات التوضيحية مثالية ، فقد تكون مخطئًا إذا كانت التركيزات منخفضة. أو أن لديهم تعبيرًا جينيًا مضادًا للترابط. أنا نوعا ما مثل هذا. لذا ، من الأمور التي لا يجب أن تكون مترابطًا ، ولكن إذا كنت مضادًا للترابط ، فيبدو أنه يوحي بأن هذين البروتينين لا يتحدان معًا أبدًا.

مرة أخرى ، لا يوجد ضمان لأن مستويات الحمض النووي الريبي ، كما سنتحدث عنها بشيء من التفصيل لاحقًا ، ليست منبئات جيدة جدًا لمستويات البروتين. ولكن إذا طبقت ما يكفي من هذه المعايير ، يمكنك التوصل إلى مجموعة من البروتينات التي لديك ثقة عالية إلى حد ما لا تتفاعل حقًا. يمكنك دمج ذلك مع قواعد بيانات البروتينات بثقة عالية جدًا في أنها تتفاعل بالفعل ، ويمكنك الحصول على الإيجابيات الحقيقية والإيجابيات الخاطئة التي تحتاجها لهذا التحليل.

حسنا. هذه طريقة لدمج بعض المعلومات. سنرى تعميمًا لما يسمى شبكات بايزي. لقد ذكرنا هذا بالفعل في سياقين مختلفين على الأقل ، وسيظهر مرة أخرى لاحقًا في الدورة التدريبية أيضًا.

لذا فهذه طرق عامة جدًا للتفكير الاحتمالي. سنراهم في سياق التنبؤ بالتفاعلات هنا. سنراهم لاحقًا في سياق تنظيم الجينات والإشارات أيضًا.

ما نحتاجه بشكل أساسي لعمل شبكة بايز هو هيكل رسومي يمثل فهمنا للعلاقة بين الأسباب والتأثيرات. ومجموعة من الاحتمالات التي تسمح لنا بحساب الأشياء على هذه الشبكة. سنعرض لك أمثلة حيث يتم اشتقاق هذه الشبكات من فهمنا المسبق للمشكلة ، ولكن أيضًا أمثلة حيث يتم تعلم بنية الشبكة من البيانات.

وسنرى سياقين أساسيين. أولاً لدينا هذا السؤال حول ما إذا كانت البروتينات تتفاعل. هذا ما تحدثنا عنه للتو. إذن فهذه أربع تجارب ، التجارب المنسدلة في المختبر وتجارب الخميرة ثنائية الهجين ، والتي تعطينا معلومات مستقلة نسبيًا حول ما إذا كانت البروتينات تتفاعل أم لا. وسننظر في ورقة استخدمت تلك البيانات مع شبكة بايز لحساب احتمال تفاعل بروتينين بالفعل بناءً على مجموعة جميع البيانات ، بدلاً من التخلص من أي شيء لا يقع في التداخل ، والذي يمكن أن يكون عددًا صغيرًا جدًا جدًا.

وبعد ذلك سنرى فيما بعد أمثلة على استخدام شبكات بايز لفهم الشبكات البيولوجية. لذلك قد تكون هذه مجموعة من عوامل النسخ التي تنظم مجموعة من الجينات المعبر عنها تفاضليًا. وبنية الشبكة الرسومية لشبكة Bayesian بها الكثير من أوجه التشابه مع الطريقة التي نفكر بها عادةً حول الشبكات التنظيمية للنسخ. إذن هناك طريقة طبيعية لتحويل مشكلتنا التنظيمية إلى مشكلة شبكة رسومية.

لكننا سنركز على مشاكل التنبؤ هذه لتفاعلات البروتين والبروتين أولاً. الآن ، إذا أردت فقط حساب احتمال اكتشاف تفاعل في تجارب مختلفة ، بالنظر إلى أنه صحيح أو خطأ ، يمكنني حساب هذا الاحتمال صراحة. ورأينا أمثلة على ذلك للتو.

لكن بعض مشكلات شبكة Bayesian هذه تصبح أكبر بكثير من أن تفعل ذلك. هذه قطعة صغيرة جدًا من شبكة بايز التي من المفترض أن تمثل أعتقد أنها شبكة تنظيم النسخ. لا يمكنك أبدًا كتابة جميع المصطلحات في هذا الاحتمال ، حيث يمكن أن تعتمد كل عقدة ، من حيث المبدأ ، على كل عقدة أخرى في الشبكة. سيكون مجرد مشكلة كبيرة يبعث على السخرية.

في الواقع ، كم سيكون حجمه إذا كان لدي عدد N من المتغيرات الثنائية ، أو كان الجيني في وضع التشغيل أو الإيقاف ، وتفاعلي صحيح أو خاطئ ، لدي 2 إلى N من الحالات المحتملة؟ حق؟ والقيد الوحيد الذي أملكه ، من حيث المبدأ ، هو أن كل الاحتمالات يجب أن يصل مجموعها إلى واحد. إذن ، لدي 2 أس N ناقص 1. 2 إلى N ناقص 1 متغيرًا ممكنًا أحتاج إلى ضبطه. هذا رقم كبير يبعث على السخرية في معظم السياقات.

إذن كيف تساعدنا شبكات Bayesian في حل هذه المشكلة؟ حسنًا ، نحن نمثل فهمنا للمشكلة في هيكل رسومي حيث لدينا أسباب وتأثيرات. وسيكون هناك سهم مباشر من سبب إلى نتيجة. لا اعرف السبب دائما. لذا في سياقنا ، كنا نحاول معرفة ما إذا كان هناك بروتينان يتفاعلان. ماذا نقيس؟

نحن في الواقع لا نقيس التفاعلات. نحن نقيس نتيجة تجربة معينة ، والتي هي مزيج من التفاعل وكل أنواع الضوضاء التي ناقشناها للتو. لذلك تم الكشف عن التأثيرات التي نلاحظها في التجربة الأولى أو تم اكتشافها في التجربة الثانية. السبب هل تفاعل أم لا؟ لذلك السبب مخفي ، يتم ملاحظة التأثيرات.

الآن ، في الحالة التي كنا ننظر إليها من قبل ، تعاملنا مع كل هذه الاحتمالات على أنها مستقلة. لكن قد نعرف شيئًا عن بنية تجاربنا ، وأنواع التجارب التي نقوم بها ، والتي قد تقودنا إلى بنية مختلفة. لذلك يمكننا الحصول على تفاعل يؤدي إلى ظهور جميع أنواع البيانات المختلفة.

ولكن اعتمادًا على ما إذا كان البروتين عبارة عن بروتين غشائي أو معبر عنه بدرجة عالية ، فقد يؤثر على نتائج تجارب معينة ولا يؤثر على نتائج تجارب أخرى ، أليس كذلك؟ لذا مثل الهجينين سيكون متحيزًا جدًا لأي واحد من هؤلاء؟ الغشاء صحيح؟ ومن ثم يمكن أن تتأثر مواصفات كتلة التقاط التقارب بشدة بالبروتينات التي يتم التعبير عنها عند مستويات عالية جدًا أو مستويات منخفضة جدًا.

إذا افترضنا أن جميع التفاعلات مستقلة ، فإننا نضرب الاحتمالات. وسنتناول المزيد من التفاصيل ، ولكن هذا ما نبحث عنه حتى الآن. في الحالات التي نعتقد فيها أن جميع الملاحظات ليست مستقلة ، فلن نضاعف الأشياء ببساطة. سنرى أن هناك طريقة أكثر دقة لحساب الاحتمالات.

الآن في هذه الحالة ، رسمت الهيكل البياني لأنني أعتقد أنني أعرف ما يحدث. لكن في الحالة العامة التي سنلقي نظرة عليها ، سنشتق البنية من البيانات.

من الأشياء اللطيفة حول شبكات Bayesian أنها تزيل الحاجة إلى وجود جميع المعلمات المحتملة من 2 إلى N ناقص 1 ، لأنها تخبرنا بوجود شروط استقلالية معينة. لذا فإن العقدة مستقلة عن أسلافها نظرًا لوالديها. ماذا يعني ذلك؟

إذا كنت أحاول التفكير في التعبير عن أحد الجينات بالأسفل هنا ، وأنا أعلم أن عامل النسخ هذا قيد التشغيل ، فأنا لا أهتم حقًا بما هو احتمال وجود أي والد معين لعامل النسخ هذا ، صحيح ؟ لذلك لست بحاجة إلى معرفة أي شيء عن عامل النسخ B1 إذا كنت أعرف حالة B2. إذا كان هذا قيد التشغيل ، فهذا هو الشيء الوحيد الذي سيؤثر على ما إذا كان سيتم تشغيل هذه الجينات ، بغض النظر عن حالة التنشيط لوالدها. هل هذا واضح؟ نعم فعلا.

الجمهور: الشريحة تقول TF B1. [غير مسموع] TF B2؟ تقول TF A1.

البروفيسور: نعم ، آسف. يجب أن نقول TF B1. شكرا لك. نعم. لذلك سنفعل مثالًا صغيرًا. إنه موسم القبول لكل من الدراسات العليا والجامعية. لذلك دعونا نقدم مثالًا صغيرًا للعبة حيث سنتخلص من لجان القبول ونفعل القبول الآلي.

لذلك سنقوم بجمع بيانات مختلفة عن الطلاب ، وبعد ذلك سنقوم ببناء شبكة بايزي.وستقرر هذه الشبكة ما إذا كانت ستقبل الطلاب في هذه النسخة المبسطة. وستكون المعلومات الوحيدة التي ستدخل في قرارنا هي الدرجات الموجودة في النسخة و GREs. نأمل أن يكون هذا ليس هو الحال.

ونعتقد أن بعض الأشياء قد أثرت على درجاتك و GREs الخاصة بك. سواء كان الطالب ذكيًا أم لا ، يجب أن يكون له بالتأكيد بعض التأثير ، ولكن أيضًا للتضخم الكبير في مدرستهم سيكون له بعض التأثير.

لذا فإن مشكلة التنبؤ في شبكة بايز تنتقل من الأسباب إلى التأثيرات. لذا ، إذا أردت أن أتوقع ما إذا كان الطالب قد تم قبوله ، فأنا بحاجة فقط إلى البحث في اتجاه التيار. لذلك نريد أن نتنبأ - نلاحظ الأشياء في الأعلى. قل ، الدرجات و GREs ، ونريد أن نتوقع ما إذا كان ينبغي قبول هذا الطالب أم لا.

هناك مشكلة أخرى تسمى مشكلة الاستدلال ، وهي عندما نلاحظ التأثير ونريد عمل استنتاجات حول الأسباب. مثال على ذلك ، يمكنك التقدم للحصول على تدريب داخلي ويقولون ، أوه ، إنها طالبة في معهد ماساتشوستس للتكنولوجيا. أراهن أنها ذكية. حق؟ إنهم يقومون بمشكلة استنتاج.

سنترك الأمر لك لتقرر ما إذا كنت أنت وزملاؤك أذكياء كما يعتقد الجميع ، ولكن نأمل أن تكون كذلك. نعم. إذن لدينا نوعان مختلفان من المشاكل. لدينا مشاكل تنبؤ من أعلى إلى أسفل ، ومشكلات استدلال من أسفل إلى أعلى.

وسنتحدث عن الاحتمال الشرطي. لذلك إذا كان لدي جزء صغير جدًا من هذه الشبكة مع عقدتين فقط ، يمكنني كتابة جميع الاحتمالات الممكنة لأي زوج من هذه العقد. لذا فإن احتمال أن يكون الطالب ليس ذكيًا نظرًا لأن هذا الطالب لديه درجات منخفضة ، واحتمال أن الطالب ليس ذكيًا نظرًا لأن الطالب لديه درجات جيدة ، وما إلى ذلك ، لجميع المقارنات الزوجية الممكنة.

أو يمكنني كتابة هذا كاحتمال شرطي ، والذي يميل إلى أن يكون طريقة أسهل للتفكير في المشكلة. ما هو الاحتمال الشرطي لذكاء الطالب بالنظر إلى حصوله على درجات جيدة أو بالنظر إلى أنه حصل على درجات سيئة؟ لديهم نفس المعلومات. لهذا ، أحتاج إلى معلومات إضافية حول الاحتمالية الإجمالية للطلاب لأن يكونوا أذكياء أم لا.

وإجمالي عدد المتغيرات ، كما قلت ، في كلتا الحالتين هو نفسه. لذا فهذه قابلة للتبادل تمامًا ، ولكن من الأسهل كثيرًا التفكير باستخدام الاحتمالات الشرطية مقارنة بجداول الاحتمالات المشتركة. سنرى هؤلاء في ثانية.

لذا كما قلت ، لست بحاجة إلى جدول احتمالية كامل لشبكة بايزي. لا تحتاج إلى متغيرين N إلى 1 ناقص. والسبب الأساسي لذلك هو أن الاحتمال المشترك سيعتمد فقط على الوالدين. لذلك في مثال اللعبة هذا ، لا تعتمد درجات GRE هنا على تضخم الدرجة.

الآن ، نأمل أن يكون كل هذا منطقيًا. أسئلة؟ تصبح شبكات Bayesian غامضة قليلاً بعد ذلك ، لذا سأحاول أن أجعلك تدخل - أوه ، نعم. سؤال من فضلك.

الجمهور: قلت إن الآباء لا يؤثرون على أطفالهم ، ولكن إذا كان تضخم الصفوف يؤثر على الدرجات ، فكيف يؤثر ذلك - هل سيؤثر ذلك على الدرجة [غير مسموع]؟

الأستاذ: عذرًا ، هل يمكنك طرح السؤال مرة أخرى؟

الجمهور: أعتقد أنني في حيرة من أمري بهذا المثال بالذات. ماذا تقصد بالاحتمال المشترك؟ الاحتمال المشترك لما؟

المحاضر: إذا أردت معرفة احتمالية تكوين معين لجميع العقد في شبكتي ، فلست بحاجة بالضرورة إلى التفكير في جميع الاحتمالات. لأنه على سبيل المثال ، إذا كنت أرغب في النظر في جميع عينات الاحتمالات المشتركة مع إعدادات GREs ، سواء حصل الطالب على درجات GRE جيدة أم لا ، فلن يتأثر ذلك بسياسات تضخم الصف في مدرسة الطالب.

الجمهور: ولكن لن تتأثر الدرجات بـ-

الأستاذ: لكن الدرجات ستكون. هذا صحيح. لذا يمكنني إزالة بعض المتغيرات والبعض الآخر - بعض عبارات الاحتمالية المشتركة التي لا داعي للقلق بشأنها والبعض الآخر أفعله. وأي منها أحتاج إلى مراعاته يتم تحديده من خلال بنية الرسم البياني. نعم فعلا.

الجمهور: كيف يتم تحديد هيكل الرسم البياني؟

الأستاذ: حسنا. إذن كيف يتم تحديد هيكل الرسم البياني؟ لذلك يتم تحديده بإحدى طريقتين. يمكنني رسمها مسبقًا لأنني أعتقد أنني أعرف شيئًا عن الإعداد الخاص بي ، وأعتقد أن هذه البيانات مستقلة. ثم لديها هذا الهيكل مثل هذا. سبب وحفنة من التأثيرات المستقلة.

أو ربما أدعي أنني أعرف أن اثنين من هذه الأشياء لهما أب مشترك أيضًا. أعرف في بعض الحالات. سنتحدث أيضًا عن كيفية تعلم الهيكل من البيانات ، وهو الإعداد الأكثر شيوعًا في الشبكات التنظيمية. لذلك في هذه الأنواع من المشكلات عند محاولة تحديد كيفية دمج مجموعات البيانات البروتينية المختلفة ، يتخذ الأشخاص عادةً قرارات عشوائية حول ماهية البنية بناءً على معرفتهم بالنظام.

لكن إذا كنت تحاول معرفة نوع البروتينات التي تتفاعل مع أي بروتينات ، وأي البروتينات تنظم أي جينات ، فعليك أن تتعلمها من البيانات. وسنتحدث عن كيفية القيام بذلك في ثانية. أسئلة رائعة. أي أسئلة أخرى؟ أي شيء في النصف الهادئ من الغرفة؟

نعم. لذا كما قلت ، هذا الجزء منه ، أعتقد أنه يمكنك عادة طرح قضايا تمنحك حدسًا جيدًا إلى حد ما. أحد الأشياء الصحيحة في شبكات Bayesian هذه والتي يجدها معظم الناس مفاجأة بعض الشيء في البداية هو شيء يسمى التفسير بعيدًا. لنلق نظرة على شبكة بايزي.

أخرج وأكتشف أن الأشياء زلقة على العشب. قد يكون هذا لعدة أسباب ، ولكن أحد الأسباب المحتملة هو أن العشب رطب. نعم. ما هي أسباب تبلل العشب؟ حسنًا ، من الممكن أن يكون قد هطل المطر أو قد تكون الرشاشات تعمل.

واعتمادًا على هذا كمثال - تم تطوير الكثير من شبكات Bayesian في ستانفورد بواسطة Judea Pearl وزملاؤها. وبالطبع ، لا تمطر في كاليفورنيا كثيرًا. لذلك هناك الموسم محدد قوي لهذه الأشياء. ليس كثيرا هنا.

لذا في هذا المثال الذي يحبون القيام به ، فهل احتمال هطول المطر يعتمد على ما إذا كان الرشاش يعمل أم لا؟ الآن ، يجب أن تكون الإجابة لا ، أليس كذلك؟ أعني ، في الواقع ، عندما تفكر في - لا توجد علاقة سببية بين وجود الرشاش والمطر. لكن في الواقع ، عندما نفكر في هذه الشبكات ، فإننا نتأثر في الواقع.

في نموذج احتمالي ، إذا كنت أعلم أنها تمطر ، وأعلم أن العشب مبلل ، فماذا أفكر في وجود الرش؟ هل أعتقد أنه من المحتمل بنفس القدر؟ لا ، أعتقد أنه أقل احتمالًا ، أليس كذلك؟ إذا خرجت ورأيت العشب مبللاً ، فهناك سحب ، والمطر ينزل ، فهل من المحتمل أن يكون الرشاش يعمل أم لا؟ من المحتمل أن تكون معطلة ، أليس كذلك؟

لذلك لا توجد علاقة سببية ، ولكن هناك علاقة احتمالية من خلال هيكل الرسم البياني. وهذا يسمى التفسير. ويمكنك أن تأخذ دورة كاملة حول كيفية فهم العلاقات التي يمكنك اكتشافها وأيها لا يمكنك اكتشافه. ليس هذا هو المكان المناسب لمحاولة الخوض في ذلك ، لكنني آمل أن تكون على دراية بهذه المشكلة. وسأحاول أن أعطيك مثالاً على لعبة تجعله أكثر وضوحًا قليلاً من حيث المعادلات من أين يأتي هذا.

لذا تخيلوا هذه اللعبة السخيفة حيث نلعب ، نرمي القطع النقدية. نحن نرمى قطعة نقود مرتين. وإذا ظهرت الرؤوس في المرتين ، تحصل على نقطة. إذا ظهرت ذيول في المرتين ، تحصل على نقطة. لكن إذا كان المرء رأسًا والآخر ذيلًا ، فلن تحصل على أي نقاط.

الآن ، هل احتمال أنني رميت رأسي في المرة الأولى يعتمد على ما إذا كنت أرمي ذيلًا في المرة الثانية؟ من الناحية السببية ، من الواضح أنه لا ، أليس كذلك؟ بادئ ذي بدء ، حدث ذلك في وقت مبكر. وثانيًا ، عمليات القذف بالعملة مستقلة تمامًا.

لكن ماذا يحدث عندما أعرف النتيجة؟ ماذا لو كنت أعرف النتيجة التي حصلت عليها؟ لذا ، إذا كنت أعرف درجاتك ، فهل احتمال أنني رميت الرؤوس في المرة الأولى مستقل عما إذا كنت قد حصلت على ذيل في المرة الثانية؟ ماذا تعتقد؟ كم من الناس يعتقدون أنه مستقل إذن؟

كم من الناس يعتقدون أنه ليس مستقلاً. حسن جدا. إنها ليست مستقلة. ومن الواضح ، ها هي الرياضيات لإثبات ذلك ، لكن حدسك يفعل نفس الشيء. إذن ما هو احتمال أنني رميت رأسي في المرة الثانية بالنظر إلى أنني حصلت على واحدة ، وسجلت ، ورميت ذيلًا في المرة الأولى؟ من الواضح أنها صفر ، أليس كذلك؟

إذن ، هذا هو احتمال الحصول على رأس في المرة الأولى وإحراز هدف واحد ، وذيول في المرة الثانية هو صفر تمامًا. لذلك هذا يسمى الشرح بعيدا. يمكنك تقليل إيمانك بآباء معينين بناءً على ما تعرفه عن الأطفال. فكر في مثال رمي العملة هذا أو المطر في كاليفورنيا والرشاشات.

حسنا. إذًا ، بما أن هذا يظهر عدة مرات ، كيف نحصل على بنية شبكة بايز؟ هناك مشكلتان نحتاج إلى حلهما. نحتاج إلى أن نكون قادرين على تعلم البنية ، وأن نكون قادرين على تعلم جداول الاحتمالات هذه.

إذا عرفنا الهيكل ، فكيف نحصل على الاحتمالات؟ حسنًا ، نحتاج إلى تحديد دالة موضوعية سنحاول تحسينها ، ثم نختار قيمًا لجميع التوزيعات الاحتمالية التي تعمل على تحسين هذه الوظيفة الموضوعية. وهذا هو نوع الأشياء التي كنا نقوم بها طوال الوقت ، تمامًا كما في أداة أخذ عينات جيبس. نحن بحاجة إلى بعض الوظائف الموضوعية أو بنية البروتين. نحتاج إلى وظيفة موضوعية سنحاول تحسينها.

لذلك هناك نوعان شائعان يتم استخدامهما كثيرًا. هناك احتمالية قصوى وأقصى خلفي. لذا يُعرَّف الحد الأقصى من الاحتمالية على أنها مجموعة المعلمات - ثيتا هي جميع المعلمات ، وجميع توزيعات الاحتمالات ، واحتمال الحصول على درجة واحدة نظرًا لأن لديك رؤوسًا وذيولًا ، مهما كانت. احتمالية الحصول على القبول بالنظر إلى أن لديك بعض GREs ودرجات معينة.

لذلك نريد إيجاد مجموعة المعلمات ، جميع توزيعات الاحتمال تلك ، التي تزيد من هذا. احتمالية البيانات ، بيانات التدريب لدينا ، في ضوء هذه المعلمات. هذا واضح جدا.

ويتضمن الحد الأقصى اللاحق بعضًا من معتقداتنا حول الاحتمال السابق للبيانات والاحتمال السابق للمعلمات. هذا أقل حدسيًا لأن عليك أن تسأل ، حسنًا ، من أين تأتي هذه الأرقام؟ وهذا ، مرة أخرى ، هو مسار كامل بحد ذاته.

نعم. الآن ، كيف تجد هذه المعلمات؟ مرة أخرى ، إنها أنواع مشاكل البحث التي نظرنا إليها من قبل ، أنواع مختلفة من تسلق التلال. الانحدار الانحدار ، تعظيم التوقع ، أخذ عينات جيبس ​​، والتي نظرت إليها بوضوح. ومرة أخرى ، فإن التفاصيل الكاملة لكيفية القيام بذلك تقع خارج نطاقنا اليوم.

نعم. لذا في مثالنا على لعبة رمي العملة هذه ، سنستخدم إحدى هاتين الوظيفتين لمحاولة تحديد احتمال الحصول على صورة أو ذيل لأي درجة معينة. هذا ما هي أنواع المعلمات.

الآن ، تبين أن مشكلة الهيكل صعبة حقًا ، لأن هناك عددًا كبيرًا جدًا من الهياكل المحتملة التي يمكن الاستفادة منها. وما لم تكن لديك بعض المعرفة المسبقة ، فقد يكون من المستحيل ، اعتمادًا على كمية البيانات التي لديك ، لبناء هذا الهيكل بالفعل.

لذلك تم اقتراح العديد من الخوارزميات. والكثير من إعداداتنا ، سنستخدم نوعًا من المعرفة المسبقة لتقليل مساحة البحث. لذلك إذا كنا نحاول التحدث عن شبكات تنظيم النسخ ، فمن الشائع جدًا أن نفترض أن هناك فقط بعض أنواع العقد التي يمكن أن تكون أسبابًا وأنواعًا أخرى من العقد يمكن أن تكون تأثيرات ، أليس كذلك؟

لذلك في التعبير الجيني سيكون هذا مؤثرًا ، وبعد ذلك ستحد من أسبابك لتكون عوامل نسخ فقط. سيكون بشكل عام إشارة إلى الجزيئات أو شيء من هذا القبيل ، ولن يسمح لجميع الجينات البالغ عددها 20000 أن تكون أسبابًا وجميع الجينات البالغ عددها 20000 أن تكون تأثيرات.

لذلك هناك الكثير من الموارد لمعرفة المزيد عن شبكات بايزي. كما قلت ، يمكنك الحصول على دورات كاملة حول هذا الموضوع. أعتقد أن هناك الكثير من الدروس الجيدة في هذا الموقع. لقد وضعت أيضًا في الملاحظات مثالًا صغيرًا للعبة لكي تعمل من خلال جميع الاحتمالات ، والتي أعتقد ، من أجل مصلحة الوقت ، أننا لن نناقشها بالتفصيل.

حسنا. لذا لتحفيز ما سنفعله في المحاضرة التالية ، أريد فقط أن أتحدث عن أنواع أخرى من البيانات التي يمكنك استخدامها للتأثير على مشكلة التنبؤ بالبروتينات التي تتفاعل. سنرى ، إذن ، كيف يتم تغذية ذلك في شبكة تفاعل بايزي لعمل التنبؤات.

لذلك تحدثنا عن التقاط التقارب والهجينين ، ولكن ما أنواع البيانات الأخرى التي يمكننا استخدامها للتنبؤ بالتفاعل الاحتمالي؟ حسنًا ، شيء واحد يمكنك استخدامه هو بيانات التعبير الجيني. والفكرة هي أنه إذا تفاعل نوعان من البروتينات ، فيجب أن يكونا موجودين في الخلية في نفس الوقت ، أليس كذلك؟

لذلك تحدثنا عن هذا قليلا. إذا كانوا غير مترابطين ، فمن غير المرجح أن يتفاعلوا. ماذا لو كانا مترابطين ، لكنهما غير مترابطين تمامًا؟ إذاً ها هي رسم بياني يوضح مدرج تكراري للبروتينات المعروف أنها تتفاعل ، بروتينات معروفة بعدم تفاعلها. الدوائر الفارغة معروفة ببروتينات متفاعلة ، والدوائر المظلمة هي بروتينات غير متفاعلة ، والأخرى تعتمد على البيانات التجريبية.

والمسافة هنا هي الفرق بين ملفات تعريف التعبير. وسنتحدث في المحاضرة القادمة حول كيفية حساب المسافة بالضبط بين ملفات تعريف التعبير. ولكن كلما زاد الأمر إلى اليمين ، قل تشابه ملفات تعريف التعبير عبر مجموعات البيانات الكبيرة. لذا فإن ما تراه هو أن البروتينات المتفاعلة تميل إلى التحول أكثر إلى اليسار ، وتشابه أكثر في التشكيلات الجانبية للتعبير عن تلك غير المتفاعلة.

لكن ماذا تلاحظ في هذا؟ لا توجد طريقة لرسم خط والقول ، كل شيء على يمين هذا موجود في فئة واحدة وكل شيء على اليسار هو شيء آخر ، أليس كذلك؟ لذلك ، في حد ذاته ، لن يأخذنا بعيدًا جدًا. هناك الكثير من البروتينات غير المتفاعلة التي لها تعبير جيني شديد الترابط والكثير من البروتينات المتفاعلة التي لها ارتباط ضعيف في التعبير الجيني. إذن فهو اتجاه وليس قاعدة.

الآن ، ماذا عن التطور؟ لذا إذا نظرت إلى العديد والعديد من الكائنات الحية ، فقد أتوقع ماذا؟ ستظهر البروتينات التي تتفاعل مع بعضها في نفس النوع ، أليس كذلك؟ لذلك دعونا نلقي نظرة على هاتين الحالتين. لدينا مجموعة من - ثمانية جينومات مختلفة. ولدي الجين 1 والجين 2 ، الذي أظن أنهما يتفاعلان ، والجين 3 والجين 4 ، اللذان أظن أنهما قد يتفاعلان.

الآن ، بالنظر إلى هذين النموذجين من التطور ، أيهما لدينا ثقة أكبر في أنه يتفاعل؟ الأحمر أم الأخضر؟ إذن ما الذي نلاحظه بشأن الاختلاف بينهما؟ ما هو الصحيح بالنسبة للون الأحمر مقارنة باللون الأخضر؟ نعم.

الجمهور: الأحمر موجود فقط في فرع واحد من الشجرة.

المحاضر: الأحمر ليس سوى فرع واحد في الشجرة والأخضر مبعثر في جميع أنحاء. لذلك دعونا نجري تصويتا. هل نعتقد أن اللون الأحمر هو أفضل دليل على التفاعل أم أن اللون الأخضر هو دليل أفضل على التفاعل؟ أحمر؟ لون أخضر؟ هل يمكنني الحصول على مدافع عن البيئة الخضراء. شخص ما يشرح منطقهم؟ أي شخص في الجانب الهادئ من الغرفة؟ حسنًا ، إد.

الجمهور: نظرًا لأن اللون الأحمر موجود فقط على فرع واحد من الشجرة ، أتوقع أنهما أكثر ارتباطًا بشكل طبيعي ببعضهما البعض. لديهم أقل - يظهرون معًا في [غير مسموع] لذا أتوقع [غير مسموع].

الأستاذ: حسنا. لذا فإن الحجة هي أن اللون الأحمر لا يوجد إلا في جزء واحد من الشجرة. وبالتالي يمكن أن يكون هناك تفسير بسيط جدًا لجميع العناصر الحمراء في جزء واحد من الشجرة وواحد لا يوجد ، والذي سيكون حدثًا واحدًا للخسارة والمكاسب. حق؟ في مكان ما في وقت مبكر ، ربما هنا ، اكتسبت هذين البروتينين. ومن ثم يتم توريثها في جميع أنحاء الجينوم ، مثل معظم الجينات التي يتم توريثها في جميع أنحاء الجينوم.

بينما هنا ، لدينا أحداث مستقلة للربح والخسارة. وفي كل حدث من هذه الأحداث المستقلة ، نجعلهم يتحركون معًا ، إما داخل الجينوم أو خارجه. لذلك هناك المزيد من الأدلة على أن اللون الأخضر يتفاعل أكثر من الأحمر. الجميع يشتري ذلك؟ حتى بعض دعاة اللون الأحمر؟ أسئلة؟ نعم فعلا.

الجمهور: هل يمكن أن تكون هناك طريقة [غير مسموع] موضوعيًا أو رياضيًا بهذه الطريقة ، أم أنها مجرد منطق [غير مسموع]؟

البروفيسور: يمكن للمرء أن يقوم بالإحصاءات المتعلقة به بأخرى معروفة ، أليس كذلك؟ أعتقد أن هذه هي أفضل طريقة على الأرجح. وسنرى ذلك في إحدى هذه الأوراق التي تستخدم - حسنًا ، في الواقع ، الآن لا أتذكر ما إذا كانوا يستخدمون هذا التطور المشترك. لكن نعم ، هناك الكثير من الأوراق البحثية التي قامت بالفعل بعمل إحصائيات حول ذلك. لذلك فهو مدعوم.

ونوع من الأسئلة ذات الصلة هو ما يسمى بمقاربة حجر رشيد. لسوء الحظ ، يستخدم مصطلح Rosetta كثيرًا في علم الأحياء الحسابي. إذاً هذا ليس له علاقة بـ Rosetta الأخرى التي تحدثنا عنها. وهذا يتعلق بعدد المرات التي تجد فيها نفس زوج الجينات في نفس الجينوم مقابل الانقسام في جينومات مختلفة. نعم.

إذن ما سنلقي نظرة عليه في المرة القادمة إذن هو نهج يجمع بين هذه الأنواع من البيانات مع القياسات الفيزيائية لتفاعل البروتين من خلال مواصفات الكتلة الهجينة والتقاط التقارب التي تستخدم بالفعل شبكات Bayesian التي تحدثنا عنها هذه المرة توقع ما إذا كان من المحتمل أن يتفاعل بروتينان بناءً على جميع البيانات المتاحة. هذه الحجج التطورية ، [؟ sentiality؟] الحجج ، ثم بيانات التفاعل. أي أسئلة أخيرة؟ حسنًا ، أراك في المرة القادمة.


الملخص

الإزهار والإثمار عمليتان تخضعان لسيطرة معقدة بواسطة إشارات بيئية وداخلية. تشتمل الإشارات الذاتية ، إلى جانب الهرمونات النباتية التقليدية ، أيضًا على إشارات الببتيدات والبروتينات الصغيرة. شاركت البروتينات الصغيرة لعقد السيستين (TCMPs) ، التي تنتمي إلى مجموعة Solanaceous من عائلة البروتين الغنية بـ Cys ، مؤخرًا في تطوير الفاكهة. TCMP-1 و TCMP-2 عرض نمط تعبير معدل للغاية أثناء نمو الأزهار والفاكهة. ذكرت دراسة سابقة أن التغيير في نسبة اثنين من TCMPs يؤثر على توقيت إنتاج الفاكهة. في هذا العمل ، لاستكشاف طريقة عمل TCMP-2 ، بحثنا عن شركائها المتفاعلين. كان أحد المتفاعلات التي تم تحديدها بواسطة شاشة هجينة من الخميرة ، هو البروتين الذي يحتوي على مجال B-box 16 (SlBBX16) ، الذي يعتبر أقرب متماثل له هو Arabidopsis microProtein 1b المتورط في التحكم في وقت الإزهار. أظهرنا إمكانية تفاعل البروتينين في الجسم الحي في خلايا البشرة من التبغ. نباتات نبات الأرابيدوبسيس التي تفرط خارج الرحم في التعبير عن TCMP-2 أظهرت مستوى متزايدًا من زهرة LOCUS T. (FT) مرنا والازدهار المتوقع. وبالمثل ، في نباتات الطماطم المعدلة وراثيًا التي تم إنشاؤها سابقًا مع زيادة TCMP-2 التعبير في براعم الزهور ، لاحظنا تعبيرًا معززًا لـ نقال زهرة واحدة الجين ، طبيب تقويم الطماطم FT، في حين أن التعبير عن المستضد التقليم الذاتي لم يتغير. على الدوام ، أظهرت هذه النباتات المعدلة وراثيًا تغييرات في نمط الإزهار ، مع إنهاء متسارع للوحدات المتماثلة. بشكل عام ، تكشف دراستنا عن وظيفة جديدة لـ TCMP-2 كعامل تنظيمي قد يتكامل ، بفضل قدرته على التفاعل مع SlBBX16 ، في مسارات الإشارات التي تتحكم في الإزهار ، وتتقارب نحو تنظيم الفلوريجين.


نتائج

تفاعلات Inter & # x02010species للبروتينات البشرية مع الوظائف المحفوظة في الخميرة

يمكن أن تكون الأنماط الظاهرية التي تمنحها الطفرات في جين معين في كثير من الأحيان ، ولكن ليس دائمًا ، & # x0201crescued & # x0201d من خلال التعبير غير المتغاير عن أخصائي تقويم العظام من الأنواع ذات الصلة البعيدة (Kachroo وآخرون & # x000a0al، 2015). لقد حددنا أولاً إلى أي مدى يمكن للبروتينات البشرية أن تنقذ طفرات الخميرة وظيفيًا (& # x0201crescuers & # x0201d) تحتفظ بالتفاعلات البشرية المتبادلة & # x02013yeast inter & # x02010 species مع أخصائيي تقويم الخميرة القادرين على إنقاذهم (& # x0201crescuees & # x0201000a) (الشكل & # x0201000) 2 أ). استخدام الخميرة 2 & # x02010 hybrid (Y2H) نظام (Dreze وآخرون & # x000a0al، 2010) ، قمنا بفحص 172 من المنقذين البشريين (الملحق & # x000a0 الطرق التكميلية) كبروتينات هجينة لمجال التنشيط Gal4 (AD) (AD & # x02010Xبشري) مقابل ما يقرب من اثنين & # x02010 من جميع بروتينات الخميرة معبرًا عنها على أنها هجينة لنطاق DB (DB & # x02010Yخميرة). قمنا بمقارنة المجموعة التي تم الحصول عليها من التفاعلات الفيزيائية الحيوية inter & # x02010species بمجموعة جودة عالية من الأدبيات & # x02010 & # x02010 تفاعلات داخل & # x02010 متضمنة عمليات إنقاذ الخميرة المقابلة (الجدول & # x000a0EV1). من بين 46 تفاعلًا بين البشر و # x02013yeast و # x02010 الأنواع المحددة ،

25٪ تتضمن متفاعلًا يتم مشاركته بين المنقذين وعمليات الإنقاذ (10 & # x02010 أضعاف أكثر مما هو متوقع بالصدفة: تجريبي ص& # x02010value & # x000a0 = & # x000a00.001، Fig & # x000a0 2 A، bottom). من بين الأزواج الثمانية من المنقذين وعمليات الإنقاذ التي تم استعادتها كمتفاعل (متفاعلات) الخميرة ، سبعة (88٪) لها وظائف مشابهة لمفاعلاتهم المتبادلة (الشكل & # x000a0 2 أ). على سبيل المثال ، يشارك كل من MLH1 والخميرة Mlh1 والمتفاعل المتبادل بينهما Ntg2 في إصلاح الحمض النووي (الشكل & # x000a0 2 أ). وبالتالي ، يمكن أن تنشأ التفاعلات بين اثنين من البروتينات البعيدة تطوريًا من تفاعلات & # x0201cancestral & # x0201d ، والتي من المحتمل أن تكون قد حدثت في سلفهم المشترك الأخير. من بين بروتينات الخميرة الأحد عشر التي تم استعادتها كتفاعلات متبادلة بين المنقذين وعمليات الإنقاذ ، لم يكن لثلاثة (27٪) متماثل في الإنسان (الشكل & # x000a0 2 أ) ، بما يتفق مع فكرة أن بروتين الأسلاف ومواقع الربط # x02010 تطور تفاعلات جديدة مع غير & # x02010 المحفوظة جينيًا البروتينات.

تكشف تفاعلات Inter & # x02010 الأنواع بين رجال الإنقاذ البشريين أحد عشر تفاعلًا للخميرة تشاركها عمليات إنقاذ الخميرة. جزء من التفاعلات المشتركة بين الخميرة وأخصائيي تقويم العظام البشري نسبة إلى الضوابط العشوائية ، التجريبية ص& # x02010value & # x000a0 = & # x000a00.001. علامات الحذف المنقط تحدد البروتينات بوظيفة مشتركة. تم تسطير ثلاثة بروتينات لم يتم حفظها من الخميرة إلى الإنسان.

مساحة البحث لخريطة الشبكة النظامية بين & # x02010 الأنواع مطابقة لشبكتين أصليتين داخليتين & # x02010 نوعان.

تم استرداد كسور الأزواج بواسطة مقايسة LUMIER المتعامدة للتحقق من صحة: التحكم الإيجابي ، مجموعة المرجع الإيجابي البشري (PRS) (Venkatesan وآخرون & # x000a0al، 2009) التحكم العشوائي ، الخميرة & # x02013 مجموعة مرجعية عشوائية بشرية (RRS) (Venkatesan وآخرون & # x000a0al، 2009) وأزواج عينة inter & # x02010interactome (YHII & # x020101) في مساحة البحث الكاملة وكذلك في الفضاء الجزئي الذي يحتوي على بروتينات فقط غير محفوظة بين الإنسان والخميرة. أشرطة الخطأ: الخطأ المعياري للنسبة. ص& # x02010 تم تحديد القيم باستخدام اختبار chi & # x02010square مع تصحيح Yates.

العدد المتوقع للتفاعلات بين & # x02010 الأنواع بين البروتينات البشرية والخميرة مع مراعاة تغطية مساحة البحث YHII & # x020101 وحساسية أخذ العينات والمقايسة القياسية باستخدام نفس خط أنابيب Y2H (Venkatesan وآخرون & # x000a0al, 2009).

رسم خرائط منهجي للبروتين & # x02013yeast inter & # x02010species & # x02013protein التفاعلات

لتحديد مدى حدوث التفاعلات الفيزيائية الحيوية بشكل منهجي بين البروتينات البعيدة تطوريًا ، أنشأنا خريطة عالية الجودة & # x02010 & # x02010 على نطاق واسع & # x02010 شبكة تفاعلية للإنسان& # x02013تفاعلات الخميرة الثنائية بين & # x02010 الأنواع. للسماح لنا بمقارنة خصائص شبكة interactome الناتجة عن & # x02010 مع تلك الخاصة بالشبكات الأم و # x02010 ، قمنا بتصميم مساحة بحث بين & # x02010 نوع (الشكل & # x000a0 2 B) التي تطابق مجموعات البروتينات المستخدمة سابقًا في التوليد خرائط تفاعلية بين الأنواع و # x02010 للإنسان (Rual وآخرون & # x000a0al، 2005) والخميرة (Yu وآخرون & # x000a0al، 2008). حددنا تفاعلات بين & # x02010 الأنواع من خلال شاشة Y2H مفردة & # x02010 متبوعة باختبارات زوجية رباعية المضاعفات والتحقق المتعامد باستخدام اللمعان المعدل & # x02010 القائم على التفاعل مع الثدييات (& # x0201cLUMIER & # x0201d) (Taipale وآخرون & # x000a0al، 2012). إجمالاً ، أجرينا شاشات Y2H بين 7240 شخصًا (AD & # x02010Xبشري) (روال وآخرون & # x000a0al، 2005) و 3778 خميرة (DB & # x02010Yخميرة) البروتينات (Yu وآخرون & # x000a0al، 2008) ، الموافق

28 مليون خميرة & # x02013 زوج بروتين بشري. حددنا 1،583 تفاعلًا بين الأنواع و # x02010 بين 566 خميرة و 471 بروتينًا بشريًا ، بما في ذلك 284 زوجًا لم يتم حفظ أي من البروتينات بين النوعين (الجدول & # x000a0EV2). كان للأزواج بين الأنواع معدل تحقق مشابه لمعدل مجموعة مرجعية موجبة من البئر & # x02010 موثقة البروتين داخل الإنسان & # x02010 نوع البروتين & # x02013 تفاعلات البروتين (Venkatesan وآخرون & # x000a0al، 2009) (Fig & # x000a0 2 C). على افتراض أن قابلية اكتشاف التفاعلات (Venkatesan وآخرون & # x000a0al، 2009) بين & # x02010 و inter & # x02010species شاشات Y2H ، مع الأخذ في الاعتبار حجم مساحة البحث الخاصة بنا بالنسبة إلى المساحة البينية الكاملة & # x02010 ، ولكن بغض النظر عن تعقيد الأشكال الإسوية المتداخلة البشرية ، فإن الخميرة لدينا & # x02013human تقترح شبكة inter & # x02010species التفاعلي (YHII & # x020101) أن الخميرة والبروتينات البشرية يمكن أن تتوسط 10 4 & # x0201310 5 تفاعلات بيوفيزيائية بين & # x02010 الأنواع (الشكل & # x000a0 2 D). وبالتالي ، يبدو أن الشبكات الداخلية & # x02010 و inter & # x02010 لها نفس الحجم ، مما يستبعد النماذج التي يكون فيها عدد التفاعلات بين & # x02010 نوعًا صغيرًا للغاية بسبب عدم وجود اختيار للتفاعلات الوظيفية ، أو كبير للغاية بسبب نقص الاختيار ضد التفاعلات الضارة.

أصول الأجداد من بين & # x02010 سلالات بروتين & # x02013 بروتين التفاعلات

قمنا بتقييم إلى أي مدى قد تنشأ تفاعلات بين الأنواع من البروتين المحفوظ تطوريًا وآليات الربط # x02010. أولاً ، حيث كانت علاقات التنادد موجودة ، كانت تفاعلات YHII & # x020101 أكثر احتمالاً بمقدار 15 & # x0201320 مرة مما كان متوقعًا عن طريق الصدفة للتداخل مع تفاعلات من خريطتي الأنواع الأصلية الداخلية & # x02010 (Rual وآخرون & # x000a0al، 2005 يو وآخرون & # x000a0al، 2008) (الشكل & # x000a0 3 أ). من المحتمل أن تتضمن تفاعلات الأنواع هذه و # x02010 خصائص الارتباط المحفوظة المحتفظ بها في متماثلات الإنسان و # x02013yeast. تم العثور على أزواج من المتماثلات تتفاعل مع البروتينات التي لا يتم حفظها بين الإنسان والخميرة (الجدول & # x000a0EV3) ، بما يتوافق مع بروتينات الأجداد & # x02010 مواقع الربط التي تطور تفاعلات جديدة مع البروتينات غير المحفوظة جينيًا. ثانيًا ، استخدمنا ثلاثة & # x02010 أدلة هيكلية الأبعاد المتاحة للتفاعلات البينية & # x02010 لإيجاد أن عددًا صغيرًا ولكن مهمًا من التفاعلات بين & # x02010 الأنواع تتوافق مع البروتين المحفوظ & # x02010 مواقع الربط (الملحق & # x000a0 الطرق التكميلية والجدول & # x000a0EV4). ثالثًا ، بالنظر إلى البروتينات التي لها مجالات تفاعل معروفة ، يمكن تفسير ما يقرب من 25٪ من تفاعلات الأنواع الداخلية لهذه البروتينات من خلال تفاعلات المجال & # x02013domain (الجدول & # x000a0EV5). هذا أعلى بكثير مما كان متوقعًا عن طريق الصدفة (الشكل & # x000a0 3 B ، تجريبي ص& # x02010value & # x000a0 = & # x000a00.001). رابعًا ، كانت مؤشرات تشابه ملف تعريف التفاعل بين متماثلات الإنسان والخميرة المقاسة باستخدام تفاعلات بين الأنواع أعلى بكثير من أزواج البروتين الأخرى التي تشترك في متفاعل واحد مشترك على الأقل (الشكل & # x000a0 3 C). تمشيا مع مجالات تفاعل البروتين المحفوظة الكامنة وراء التفاعلات بين & # x02010 الأنواع ، لوحظ أيضًا تشابه أعلى بشكل ملحوظ في ملف تعريف التفاعل لأزواج البروتين البشري و # x02013yeast التي ليست متجانسة بشرية و # x02013yeast ولكن لديها مجال بروتين واحد على الأقل مشترك (الشكل & # x000a0 3 C) . إجمالاً ، تُستمد نسبة كبيرة من تفاعلات & # x000a0inter & # x02010 من تفاعلات الأجداد ، على الرغم من احتمال وجود تفاعلات بيوفيزيائية غير سطرية أو عرضية بين الخميرة والبروتينات البشرية.

أجزاء من التفاعلات المشتركة بين أزواج متجانسة من البشر والخميرة (الأسهم) بالنسبة إلى عناصر التحكم العشوائية (المناطق الرمادية و # x02010 المظللة) ، باستخدام intra & # x02010species human HI & # x020101 (أعلى اليسار) أو الخميرة YI & # x020101 (أعلى اليمين) كشبكة مرجعية ، تجريبي ص& # x02010values ​​& # x000a0 = & # x000a00.001. العقد الزرقاء: البروتينات البشرية العقد البرتقالية: بروتينات الخميرة الحواف الرمادية: داخل & # x02010 الأنواع الخميرة & # x02013yeast أو الإنسان & # x02013 التفاعلات البشرية الحواف الخضراء: الخميرة & # x02013human inter & # x02010 التفاعلات.

أجزاء من التفاعلات المعقولة من خلال مجال الثقة العالية & # x02013 أزواج تفاعل النطاق (Yellaboina وآخرون & # x000a0al، 2011) في الشبكات البشرية (HI & # x020101 ، السهم الأزرق) ، inter & # x02010 interactome (YHII & # x020101 ، السهم الأخضر) ، والخميرة (YI & # x020101 ، السهم البرتقالي) المتعلقة بعناصر تحكم الشبكة العشوائية (الرمادي & # x02010 المناطق المظللة) ، تجريبي ص& # x02010value & # x000a0 = & # x000a00.001.

تشابه ملف تعريف التفاعل لأزواج البروتين البشري والخميرة التي تشترك على الأقل في تفاعل بشري واحد مشترك (يسار) أو خميرة (يمين). ص& # x02010 القيم التي يحددها مان & # x02013Whitney U & # x02010اختبار.

يبدو أن بروتينات الخميرة الأساسية تحتوي على تفاعلات بين & # x02010 سلالة أكثر من البروتينات غير الأساسية & # x02010 (متوسط ​​عدد المتفاعلات لبروتينات الخميرة: أساسي ، 3.3 غير & # x02010 أساسي: 2.6 ص& # x02010value & # x000a0 = & # x000a00.009 بواسطة مان & # x02013Whitney يو& # x02010test). يتم إثراء بروتينات الخميرة الأساسية أيضًا بين البروتينات التي تشكل تفاعلات بين & # x02010 الأنواع المتداخلة مع تفاعلات بين الأنواع و # x02010 (نسبة الأرجحية 1.8 ، ص& # x02010value & # x000a0 = & # x000a00.001 باختبار فيشر الدقيق). تمشيا مع التفاعلات بين & # x02010 الأنواع المقابلة لوظائف الجينات المحفوظة تطوريًا ، وجدنا إثراءًا كبيرًا للبروتينات البشرية في interactome و # x02010 يمكن أن يكمل الوظائف الأساسية لمثيلاتها الخميرة (Kachroo وآخرون & # x000a0al، 2015) (نسبة الأرجحية 3.8 ، ص& # x02010value هي 0.03 من خلال اختبار فيشر الدقيق). تدعم هذه الملاحظات استنتاجاتنا القائلة بأن التفاعلات بين & # x02010 الأنواع تتوافق بشكل كبير مع بروتين الأسلاف ومواقع الربط # x02010 المحفوظة في بروتينات الإنسان والخميرة. من المحتمل أن تكمن التفاعلات المحفوظة بين الأنواع و # x02010 في الإنسان& # x02013عبر الخميرة & # x02010 الأنواع مكمل وظيفي. قد ينبع الحفاظ على آليات ربط الأسلاف من القيود التطورية على وظائف الجينات الأساسية.

البروتينات & # x02010 التوزيع الواسع للبروتين بين & # x02010 سلالات & # x02013 بروتين & # x000a0 التفاعل

لاستكشاف الأنماط العالمية للإنسان& # x02013تفاعلات الخميرة بين & # x02010 الأنواع عبر البروتينات ذات الصلة البعيدة ، قمنا بمقارنة اتجاهات التفاعل العامة بين YHII & # x020101 وبين النوعين الداخليين و # x02010 البشريين (Rual وآخرون & # x000a0al، 2005) والخميرة (Yu وآخرون & # x000a0al، 2008) الشبكات الأم. & # x02010evolution (Moyle وآخرون & # x000a0al، 1994) ، الذي يعدل البروتين & # x02010 واجهات الربط مع الحفاظ على التفاعلات بين البروتينات المحفوظة ، يؤدي إلى فقدان مواقع ربط الأسلاف وعدم التوافق بين البروتينات وأخصائيي تقويم العظام من شركائهم في التفاعل (الشكل & # x000a0 1 ب). قد تكمن حالات عدم التوافق هذه بين & # x02010 في تفاعلات Dobzhansky & # x02013Muller ، التي تم افتراضها في الأصل (Dobzhansky ، 1936 Muller ، 1942) وتم التحقق منها مؤخرًا (Presgraves وآخرون & # x000a0al، 2003 بريدو وآخرون & # x000a0al، 2006 Tang & # x00026 Presgraves، 2009) لتكون آلية يتم من خلالها فصل المتغيرات غير المتوافقة ضمن مجموعة الأنواع التي تدفع السكان. على الرغم من الانفصال التطوري البعيد ، فإن كثافة التفاعلات الموجودة في مساحة البحث بين & # x02010 الأنواع مماثلة لتلك الموجودة في مساحات البحث الأصلية داخل & # x02010 ، حتى بالنسبة لأزواج من البروتينات بحيث لا يتم حفظ أي من البروتينات بين الإنسان والخميرة (الشكل & # x000a0 4 أ). نفس الاتجاه صحيح عندما نظرنا في أزواج من البروتينات البشرية و # x02013yeast مثل أن كلاهما من النسب و # x02010 محدد (بمعنى آخر.، البروتينات البشرية والخميرة مع متماثلات ميتازوان أو فطريات فقط على التوالي). تمشيا مع هذه النتائج ، تنتشر تفاعلات الأنواع بين & # x02010 على نطاق واسع وتتضمن بروتينات بشرية وبروتينات الخميرة مع القليل من حفظ التسلسل أو عدم حفظه في البروتينات المقابلة (الشكل & # x000a0 4 ب).

كثافة التفاعلات داخل مساحات البحث الكاملة والمساحات الفرعية التي تحتوي على بروتينات بشرية وخميرة محفوظة أو غير محفوظة & # x02010. أشرطة الخطأ: الخطأ المعياري للنسبة.

Proteome & # x02010 التوزيع الواسع للتفاعلات بين & # x02010 الأنواع (النقاط الخضراء). يتم ترتيب البروتينات البشرية والخميرة وترتيبها وفقًا لجزء تسلسلها الموجود داخل مجالات البروتين الموجودة في كل من الخميرة والبروتينات البشرية. تصف الرسوم البيانية الكسور الدنيا من التسلسل في البروتينات البشرية (على اليسار) والخميرة (العلوية) داخل كل حاوية تتوافق مع مجالات البروتين المحفوظة بين الإنسان والخميرة. يشير الخط المتقطع إلى الحد الفاصل بين البروتينات مع أو بدون مجالات البروتين الموجودة في كل من الخميرة والبروتينات البشرية. يُظهر الشكل الداخلي (أعلى اليمين) كثافة التفاعلات داخل فئتين فرعيتين تحتويان على بروتينات مع أو بدون مجالات محفوظة ، على التوالي.

المجال & # x02010 ميل التفاعل المحدد يقاس بنسبة الدرجة (ك بين & # x02010/ك داخل & # x02010) من البروتينات البشرية أو الخميرة الفردية التي تحتوي على كل مجال بروتين. ترتيب البروتينات مرتبة حسب نسبة الأنواع بين & # x02010 على درجة داخل & # x02010 نوع (اللوحة اليسرى ، أشرطة أرجوانية). تشير خطوط أرجوانية (ثلاث لوحات على اليمين) إلى رتبة البروتينات البشرية أو الخميرة التي تحتوي على المجالات (المشار إليها في الأعلى) المرتبطة بميول تفاعلية أعلى بين الأنواع. تجريبي ص& # x02010 القيم التي تم الحصول عليها من خلال مقارنة 10000 عنصر تحكم شبكة عشوائية للمجالات الثلاثة هي: WD40، 0.02 zf & # x02010C3HC4، 0.04 Thioredoxin، 0.02.

سألنا بعد ذلك عما إذا كانت بعض البروتينات قد تكون أكثر قدرة على المشاركة في التفاعلات الفيزيائية الحيوية بين البروتينات المتباعدة. قمنا بفحص كل مجال بروتين فيما يتعلق بميله لتشكيل أنواع بين & # x02010 مقابل تفاعلات بين & # x02010 (الشكل & # x000a0 4 C). تظهر ثلاثة نطاقات ميلًا أكبر للأنواع inter & # x02010 من التفاعلات البينية بين & # x02010. من بينها ، يُعرف مجال WD40 بأنه يتوسط تفاعلات البروتين من خلال التعرف على الببتيدات القصيرة المتنوعة والزخارف الخطية (Stirnimann وآخرون & # x000a0al، 2010). المجال zf & # x02010C3HC4 هو نوع فرعي من أصابع الزنك موجود بشكل أساسي في ubiquitin & # x02013protein ligases الذي يساهم في خصوصية اختيار الهدف (Deshaies & # x00026 Joazeiro ، 2009). بالنظر إلى أن الزخارف الخطية يمكن أن تنشأ دي & # x000a0novo أكثر سهولة من واجهات ربط المجال المعقدة والمحددة ، قد تشرح هذه الأشكال الخطية حالات الارتباط العرضي في interactome & # x02010. تتوافق هذه الفرضية مع الملاحظة التي تشير إلى أن جزء من المجال المعقول & # x02013domain التفاعلات في interactome & # x02010 interactome أقل بشكل ملحوظ من تلك الموجودة في الخميرة YI & # x020101 أو HI & # x020101 intra & # x02010species network (الشكل & # x000a0 3 ب). يشير الميل المنخفض للبروتينات التي تحتوي على مجالات WD40 أو zf & # x02010C3HC4 لتشكيل تفاعلات داخل الأنواع (الشكل & # x000a0 4 C) إلى الاختيار مقابل تطور الزخارف الخطية غير الوظيفية التي تربط هذه المجالات في الشبكات الخلوية ، مما يعزز الارتباط والخصوصية الوظيفية لهذه المجالات عزر & # x02010 مجالات البروتين الملزمة (Zarrinpar وآخرون & # x000a0al, 2003).

تشتهر المناطق المضطربة جوهريًا من البروتينات بمنحها المرونة التوافقية للشركاء الملزمين (Dunker وآخرون & # x000a0al، 2005) وللميل إلى تكوين تفاعلات جزيئية مختلطة من خلال تأثيرات الكتلة & # x02010 (Vavouri وآخرون & # x000a0al، 2009). وجدنا أن البروتينات البشرية ذات المحتوى العالي من الاضطرابات لديها ميول أكبر لتشكيل تفاعلات بين الأنواع (ارتباط بيرسون 0.17 ، ص& # x02010 القيمة هي 0.0002). مثل هذا الارتباط غير موجود للتفاعلات البينية & # x02010 الأنواع في شبكة HI & # x020101 البشرية (ص& # x02010value هي 0.2) ، بما يتوافق مع المناطق المضطربة للبروتينات التي توفر ميلًا متزايدًا للتفاعلات العارضة بين الأنواع.

تشير هذه الملاحظات مجتمعة إلى أن كثافات التفاعل المكافئة لـ inter & # x02010 interactome والشبكات الأم داخل & # x02010 هي نتيجة لقوى تطورية معارضة: الظهور المتكرر للتفاعلات الفيزيائية الحيوية غير المنفصلة عن القيود الوظيفية السابقة و # x02010 الموجودة مقابل الانتقاء التطوري الذي يحافظ على التفاعلات الوظيفية ويزيل الضرر. التفاعلات في الشبكات البينية & # x02010 الأنواع.

خصائص الشبكة للإنسان & # x02013yeast inter & # x02010interactome

تشترك الشبكات البيولوجية في الأنواع المتنوعة عبر ممالك الحياة في الخصائص المحلية والعالمية (Barab & # x000e1si وآخرون & # x000a0al، 2011 فيدال وآخرون & # x000a0al، 2011) ، والتي يعتقد أنها ناتجة عن قيود عالمية على الأنظمة المعقدة. نظرًا لأن التفاعلات inter & # x02010 لم تتعرض لضغوط انتقائية مباشرة ، فقد يُظهر interactome # x02010 ميزات مختلفة للشبكة. بدلاً من ذلك ، لا يمكن تمييز الخصائص الطوبولوجية العالمية لـ inter & # x02010interactome عن تلك الخاصة بالشبكات الأبوية.تعرض جميع الشبكات الثلاث مقياسًا مشابهًا & # x02010free ، وخصائص التباعد ، والتشتيت ، وأقصر طول للمسار (الشكل & # x000a0 5 أ) ، ودرجات الخميرة والبروتينات البشرية في interactome & # x02010 ترتبط بشكل كبير بدرجاتها في الشبكات الأم (الشكل & # x000a0 5 ب).

الخصائص الطوبولوجية للشبكات البينية بين & # x02010 (YHII & # x020101 ، النقاط الخضراء) مقارنة بشبكات الإنسان (HI & # x020101 ، النقاط الزرقاء) والخميرة (YI & # x020101 ، النقاط البرتقالية).

البروتينات البشرية (يسار) والخميرة (يمين) لها درجات مترابطة في الشبكات البينية & # x02010 interactome (YHII & # x020101) والبشر (HI & # x020101) أو الخميرة (YI & # x020101). تظهر ارتباطات سبيرمان (rho).

عدد الأنماط الظاهرية المرتبطة بحذف جين خميرة الترميز بالدرجة المشار إليها في الخميرة (YI & # x020101 ، يسار) و interactome # x02010 (YHII & # x020101 ، يمين) مجموعات البيانات. النقاط البرتقالية (يسار) والأخضر (يمين) هي متوسط ​​النقاط السوداء في كل درجة قطع. تشير أشرطة الخطأ إلى الخطأ المعياري للنسبة. ص& # x02010 القيم الخاصة باختبار ارتباط بيرسون.

في الخرائط التفاعلية ، تميل البروتينات العالية & # x02010degree ، أو & # x0201chubs & # x0201d ، إلى أن تكون شديدة التعددية (Yu وآخرون & # x000a0al، 2008). يوفر interactome interactome & # x02010 أول & # x02010 & # x02010its & # x02010 النوع الأول للتحقق من هذا المفهوم عن طريق فصل خصائص التفاعل الفيزيائية الحيوية عن الخصائص الوظيفية. تتضاءل ارتباطات الدرجة مع تعدد الأشكال لبروتينات الخميرة إلى حد كبير داخل & # x02010 interactome (الشكل & # x000a0 5 C). تشير هذه النتيجة إلى أنه على الرغم من الخصائص الطوبولوجية الشائعة للشبكة ، فإن التنسيق بين التفاعلات الفيزيائية الحيوية والوظيفة قد تغير بشكل أساسي في interactome # x02010.

المراسلات بين الشبكات الوظيفية inter & # x02010 interactome و intra & # x02010species

درسنا بعد ذلك التداخلات بين & # x02010 interactome مع الميزات الوظيفية المخصصة لجينات الخميرة. تم اختيار السمات الوظيفية للخميرة وليس الإنسان لأن الشروح الوظيفية والخرائط الجينومية الوظيفية المنهجية متاحة بسهولة أكبر للخميرة. للسماح بمقارنة أزواج من بروتينات الخميرة المتصلة ببروتين بشري في شبكة الأنواع الداخلية وأزواج من بروتينات الخميرة في شبكة الأنواع الداخلية و # x02010 ، حددنا أولاً مستويات التداخل الوظيفي لأزواج من بروتينات الخميرة الواقعة على درجتين من الفصل عن كل منهما أخرى في شبكة الخميرة البينية & # x02010 الأنواع. كما هو متوقع ، لم تكن مستويات وظائف co & # x02010 عالية مثل تفاعل بروتينات الخميرة بشكل مباشر (Gunsalus وآخرون & # x000a0al، 2005). لجميع مقاييس الوظائف المشتركة الثلاثة المستخدمة ، علم الوجود الجيني المشترك (GO) (Ashburner وآخرون & # x000a0al، 2000) ، قياسات معامل الارتباط لبيرسون (PPC) لأوجه التشابه بين الخصائص التركيبية للفتك (كوستانزو وآخرون & # x000a0al، 2010) ، وتشابه تعبيرات & # x02010 (Yu وآخرون & # x000a0al، 2008) ، تم تقليل & # x000a0 مستويات التداخل بين التفاعلات الفيزيائية الحيوية ووظائف co & # x02010 بشكل كبير في الشبكة البينية بين & # x02010 بالنسبة لشبكة الخميرة البينية & # x02010 (Figs & # x000a0 6 A و B و EV1 و EV2).

زيادة أضعاف لأزواج بروتين الخميرة المتفاعلة التي تشترك في GO محددة في الشبكات الداخلية و # x02010 interactome (YHII & # x020101 ، الأخضر) و intra & # x02010 نوع الخميرة (YI & # x020101) الشبكات المتعلقة بعناصر تحكم الشبكة العشوائية ، عند القطع المشار إليها لخصوصية GO (يسار). يتم عرض أزواج المثال من Inter & # x02010species مع تسطير اثنين من البروتينات البشرية غير المحفوظة & # x02010.

إثراء نسبة الأرجحية لأزواج بروتين الخميرة المتفاعلة مع معاملات ارتباط بيرسون لملف التفاعل الجيني (PCC & # x000a0 & # x02265 & # x000a00.2). تشير أشرطة الخطأ إلى الخطأ المعياري. ص& # x02010 قيم التخصيب التي يحددها اختبار فيشر الدقيق. يتم عرض أزواج أمثلة الأنواع Inter & # x02010.

زيادة أضعاف للبروتينات المتفاعلة التي تشارك GO محددة في inter & # x02010 interactome (YHII & # x020101 ، أخضر) و intra & # x02010 نوع الخميرة (YI & # x020101) شبكات قبل وبعد إزالة paralogs بالنسبة إلى 1000 عنصر تحكم شبكة عشوائية في أربع قطع محددة لخصوصية GO (x& # x02010 محور). تشير أشرطة الخطأ إلى الأخطاء المعيارية. تجريبي ص& # x02010 القيم لجميع الحالات 0.001.

توزيع PCCs co & # x02010expression لأزواج البروتين المتفاعلة بشكل مباشر وغير مباشر. جزء من كل توزيع باستخدام PCC & # x000a0 & # x0003e & # x000a00 (أعلى اليمين). أشرطة الخطأ: الخطأ المعياري للنسبة. ص& # x02010 قيم مقارنات توزيع PCC التي حددها Mann & # x02013Whitney يو& # x02010test. يظهر زوج مثال بين & # x02010 الأنواع.

كشف التداخل بين & # x02010 الأنواع الفيزيائية الحيوية والشبكات الوظيفية البينية & # x02010 الأنواع المهمة & # x02010 وظائف مشتركة & # x0201d مقارنة بالتوقعات العشوائية من قبل جميع المؤشرات الوظيفية الثلاثة التي تم فحصها (Figs & # x000a0 6 A و B و EV1 و EV2). في عتبات مختلفة لخصوصية مصطلح GO ، على سبيل المثال ، كانت التفاعلات الفيزيائية الحيوية inter & # x02010 تصل إلى 10 & # x02010 أضعاف احتمال أن تكون مشتركة & # x02010 وظيفية مما هو متوقع بالصدفة (الشكل & # x000a0 6 أ). لا يزال إثراء شروح GO بين الأنواع المتفاعلة وأزواج البروتين المتفاعلة مهمًا عند إزالة paralogs من الشبكة (الشكل & # x000a0 EV1). يبدو أن البروتينات البشرية غير المحفوظة & # x02010 تتوسط في تفاعلات بين الأنواع ذات المغزى الوظيفي & # x02010. على سبيل المثال ، لا يحتوي MCMBP ولا SMN2 على متماثلات يمكن اكتشافها بسهولة في الخميرة ، لكن كلا البروتينين يتفاعل جسديًا مع أزواج من بروتينات الخميرة التي لها وظائف وثيقة الصلة (الشكل & # x000a0 6 أ).

تكشف هذه الملاحظات عن بقايا الوظيفة المشتركة بين الخميرة والبروتينات البشرية ، على الرغم من التنسيق المضطرب بشكل كبير بين التفاعلات بين & # x02010 الأنواع والوظائف داخل & # x02010.

& # x02010 مجتمعات مترابطة في & # x02010 interactome والشبكتين الأم

في الخرائط التفاعلية الفيزيائية الحيوية ، تميل البروتينات ذات الصلة وظيفيًا إلى تكوين شبكة متصلة للغاية & # x0201ccliques & # x0201d أو & # x0201ccommunities & # x0201d (Barab & # x000e1si وآخرون & # x000a0al، 2011 فيدال وآخرون & # x000a0al، 2011). للتحقيق في كيفية تنظيم بقايا وظائف co & # x02010 عالميًا في الشبكة البينية & # x02010 interactome ، استخدمنا ارتباط & # x02010 طريقة التجميع (Ahn وآخرون & # x000a0al, 2010 أرابيدوبسيس Interactome Mapping Consortium ، 2011) لتحديد مجتمعات التفاعلات العنقودية الكثيفة مع مستويات كبيرة من تخصيب GO (الشكل & # x000a0 7 A والجدول & # x000a0EV6). جزء من مجتمعات سلالات & # x02010 التي تم إثرائها لمصطلحات GO المشتركة أعلى بكثير من تلك الموجودة في عناصر التحكم العشوائية ، على غرار ما لوحظ بالنسبة للشبكات الأم و # x02010 الأنواع (الشكل & # x000a0 7 ب). من بين 392 تفاعل بين & # x02010 نوعًا في GO & # x02010 المجتمعات الغنية الموجودة في inter & # x02010interactome (الجدول & # x000a0EV6) ، 292 (

70٪) تتضمن إما الخميرة أو البروتينات البشرية غير المحفوظة & # x02010. ومن ثم ، يبدو أن وظيفة co & # x02010 شائعة وتتسرب عبر شبكة inter & # x02010species ، بما في ذلك البروتينات غير المحفوظة وراثيًا.

Function & # x02010 مجتمعات الشبكة الغنية في شبكات inter & # x02010interactome (YHII & # x020101) و intra & # x02010species human (HI & # x020101) وشبكات الخميرة (YI & # x020101). ترتبط المجتمعات إذا كانت تشترك في عقد بروتينية مشتركة ، مع سماكة خط تقابل عدد العقد المشتركة بينها. لا يتم عرض المجتمعات غير المتصلة. يتم تصنيف كل مجتمع مع وظيفة إثراء تمثيلية. يتم تكبير المجتمع الذي يحتوي على Atg8 لإظهار العديد من تعليقات GO التمثيلية المخصبة في هذا المجتمع. يتم إثراء المجتمعات داخل المنحنى الأسود المتقطع (أسفل اليسار) للوظائف المتعلقة بتهريب البروتين.

جزء من مجتمعات GO & # x02010 الغنية (الأسهم) في شبكات الإنسان (HI & # x020101) و inter & # x02010interactome (YHII & # x020101) وشبكات الخميرة (YI & # x020101) مقارنة بتوزيعات عناصر تحكم الشبكة العشوائية (الرسم البياني الرمادي). يتم عرض مثال تمثيلي من الشبكات العشوائية. تجريبي ص& # x02010values ​​& # x000a0 = & # x000a00.002.

العدد الإجمالي للمجتمعات المرتبطة التي تشترك في بروتينات مشتركة من شبكات بشرية (HI & # x020101) و inter & # x02010 interactome (YHII & # x020101) وشبكات الخميرة (YI & # x020101) (السهم الرمادي) مقارنةً بتوزيعات عناصر تحكم الشبكة العشوائية (الرسم البياني الرمادي) . تجريبي ص& # x02010value & # x000a0 = & # x000a00.002.

هناك العديد من المجتمعات التي تحتوي على بروتينات غير محفوظة & # x02010 في interactome & # x02010. يحتوي أحد الأمثلة على المجتمع على Atg8 (الشكل & # x000a0 7 أ) ، وهو بروتين خميرة ضروري للالتهام الذاتي. الالتهام الذاتي هو مسار حقيقي النواة محفوظ لعزل ونقل البروتينات السيتوبلازمية والعضوية إلى الليزوزوم من أجل التحلل (Shpilka وآخرون & # x000a0al، 2011). يتفاعل Atg8 مع ستة بروتينات بشرية ، ثلاثة منها (BNIP3 ، BNIP3L ، MLX) تشترك في وظائف موت الخلايا المبرمج والاستجابات المناعية. من المعروف أن اثنين من المتفاعلات البشرية الستة (BNIP3L ، TBC1D5) يتفاعلان مع المتماثلات البشرية لـ Atg8 (Rual وآخرون & # x000a0al، 2005 نوفاك وآخرون & # x000a0al، 2010 بوبوفيتش وآخرون & # x000a0al، 2012 رولاند وآخرون & # x000a0al، 2014). لا يحتوي BNIP3 ولا BNIP3L على تجانس الخميرة. يقترح مجتمع الأنواع & # x02010 هذا طريقًا تقترن به الأنواع & # x02010 وظائف محددة بوساطة البروتينات غير المحفوظة & # x02010 بآليات خلوية قديمة ومحفوظة للغاية.

نظرًا لأن المجتمعات المتميزة GO & # x02010 الغنية قد تتداخل وتتشارك البروتينات متعددة الوظائف (Ahn وآخرون & # x000a0al، 2010) ، اختبرنا كيف يمكن أن ترتبط مجتمعات الشبكة البينية بين & # x02010 الأنواع الأبوية و # x02010 الأنواع inter & # x02010 interactome ببعضها البعض عن طريق ربطها من خلال البروتينات التي تنتمي إلى اثنين على الأقل ، داخل & # x02010yeast ، داخل & # x02010human ، أو inter & # x02010species مجتمعات. تؤدي هذه الروابط إلى ظهور شبكة متصلة بشكل كبير من المجتمعات ، بالنسبة إلى الضوابط العشوائية (الشكل & # x000a0 7 C) ، مما يشير إلى أن بقايا وظائف co & # x02010 والوظائف الداخلية & # x02010 & # x02010 متداخلة للغاية & # x02010 ذات صلة. تشترك العديد من مجتمعات inter & # x02010interactome والخميرة YI & # x020101 في البروتينات ويتم إثرائها للوظائف المتعلقة بتهريب البروتين (الشكل & # x000a0 7 أ) ، وهي عملية خلوية محفوظة بدرجة عالية بين الخميرة والإنسان (Wickner & # x00026 Schekman ، 2005).


BIOC221 - البيولوجيا الجزيئية

لتحديد ذلك باستخدام العاثية. قاموا بتسمية الحمض النووي والبروتينات بنظرين مشعين مختلفين (مما أعطاهم ألوانًا مميزة) ووجدوا:
- 82٪ من العاثيات (الفيروس البكتيري) DNA ذهبت إلى البكتيريا المصابة
- فقط 7٪ من البروتينات دخلت البكتيريا.

بشكل عام ، يفشل حوالي 70-80٪ من الأدوية المرشحة في التجارب السريرية ويتم إزالة العديد من الأدوية المعتمدة من السوق بسبب الآثار الجانبية الضارة.

1.أصل النسخ:
منطقة غنية بالـ AT حيث يبدأ تكاثر الحمض النووي حيث تتفكك الخيوط ويبدأ التوليف من خيط متخلف وقائد. يسمح للناقل بالتكاثر بشكل مستقل عن الحمض النووي الصبغي للخلايا المضيفة = زيادة في الأعداد.

2.Selectable علامة:
جين يسمح بالتعرف على الخلايا التي تحمل ناقلًا (بلازميد) والذي يكون عادةً جينًا مقاومًا للمضادات الحيوية

سنترومير:
في حقيقيات النوى ، لا يحتوي Centromere بشكل عام على تسلسل DNA محدد لأنه يتكون عادةً من مصفوفات كبيرة من الحمض النووي المتكرر (تكرار الحمض النووي الترادفي).

2. تتفاعل النيوكليوسومات مع هيستون 1 مما يجعلها تلتف أكثر إلى ألياف كروماتين 30 نانومتر.

- DNA Euchromatin - هو DNA يتم نسخه بنشاط (قيد التشغيل) ويتم تعبئته بشكل فضفاض للسماح لعوامل النسخ بالوصول إلى الحمض النووي ويسمح بالنسخ والترجمة.
- الهيتروكروماتين - هو الحمض النووي داخل الجينوم غير نشط (متوقف) والذي يرتبط ببروتينات هيكلية مما يجعله أكثر إحكامًا.

2. هيليكس الحمض النووي -
يفصل بين خيوط DNA ويشكل شوكة النسخ المتماثل

3. بروتينات ربط حبلا مفردة تمنع إعادة ربط خيوط DNA قبل النسخ المتماثل

4. Primase - إدراج مواد أولية RNA للسماح لبوليميراز الدنا الثالث بالارتباط.

5. DNA polymerase III - مكرر من البادئات

6. DNA polymerase I - يزيل الاشعال ويكرر تلك المنطقة

مجال النخيل:
هو الموقع التحفيزي الذي يخلق البيئة الصحيحة لحدوث التفاعل (إضافة dNTPs).
- يلزم وجود سلاسل جانبية محددة للأحماض الأمينية واثنين من أيونات Mg2 + لجذب أيونات H + وأيونات الفوسفات حتى يحدث التفاعل بشكل صحيح.
يمكن دمج النيوكليوتيدات الصحيحة فقط ، إذا كانت القاعدة الخاطئة موجودة ، فإن تكوين مجال راحة اليد لا يتغير ولن يحدث الربط.
- قادر على التحديد بين rNTPS و dNTPs
- يحتوي أيضًا على نشاط نوكلياز خارجي لإثبات قراءة القواعد المقيدة بشكل غير صحيح.

سيتغير مجال الإصبع لـ DNA polymerase III فقط في الشكل ليجعل القاعدة مرتبطة بالقالب إذا تم اكتشافه ليكون هو الصحيح.

يضاف المشبك المنزلق إلى DNA بواسطة محمل المشبك. يحتوي المشبك المنزلق على وظيفة تشبه الغراء تسمح له بالالتصاق بالحمض النووي أثناء حدوث النسخ المتماثل لزيادة قابلية إنزيم بوليميريز الحمض النووي (يمكن أن يضيف المزيد من النيوكليوتيدات في الثانية ويقل احتمال انفصاله عن الحمض النووي) إلى حبلا القالب.

2. تمنع البروتينات الملزمة أحادية الشريط (SSB) الخيوط من إعادة التلدين أثناء حدوث النسخ المتماثل.

3. عندما تنفك الخيوط ، يحدث الالتفاف الفائق عند شوكة النسخ التي ينشقها TOPOISOMERASE ENZYMES ويفكه ويعيد التصلب لتقليل الضغط على الحمض النووي.

4. لا يتطلب PRIMASE (RNA polymerase) مجموعة 3 'OH وبالتالي يضيف بادئات RNA إلى بداية الخيط الرئيسي وكل جزء من Okazaki.

5. يحتوي جهاز REPLISOME على مشبك منزلق يسمح له بالالتصاق بشريط DNA أثناء تحركه. 2 بوليميراز الحمض النووي III - أحدهما يكرر الشريط الرئيسي باستمرار والآخر يكرر الخيط المتأخر بشكل متقطع حيث يتم ربط الحمض النووي لضمان حدوث التكرار في اتجاه 5 - 3 الذي يشكل شظايا Okazaki.

6. يحتوي DNA POLYMERASE I على إنزيم نوكلياز خارجي داخل مجال راحة اليد وهو قادر على اكتشاف هجينة RNA / DNA. يمكنه بعد ذلك إزالة بادئات RNA في اتجاه 3-5 'أثناء تكرار الحمض النووي في اتجاه 5 - 3.

7. ينضم إنزيم LIGASE إلى شظايا Okazaki المُصنَّعة حديثًا مع روابط phosphdiester.

- تستخدم بعض الإنزيمات الإضافية في حقيقيات النوى مثل إنزيم RNase H لإزالة المواد الأولية.

- حقيقيات النوى لها أصول متعددة للنسخ المتماثل والتي تكون عمومًا في مناطق غنية في حين أن بدائيات النوى لها أصل واحد فقط.

اكتشف ديديوكسينوكليوتيد ثلاثي الفوسفات (ddNTP) وهي نيوكليوتيدات لا تحتوي على مجموعة هيدروكسيل OH في موقعها 3.
- استخدم القواعد العادية و ddNTPs لتحديد تسلسل جزيء الحمض النووي.

كيف فعل هذا:
1. أضاف dCTPs و dGTPs و dTTPs العادي لكنه أضاف dATPS و ddATPs لأنابيب الاختبار.
2. إن القاعدة الطبيعية أو القاعدة المعدلة سترتبط بالحمض النووي بشكل عشوائي ولكن بمجرد إرفاق ddNTP ، سيتوقف التوليف.
3. لقد فعل هذا مع جميع النيوكليوتيدات الثلاثة الأخرى أيضًا.
4. تمكن من تحديد تسلسل الجينوم باستخدام الرحلان الكهربائي للهلام مع كل نوع قاعدي في بئر مختلف وتحديد طول كل جزيء من جزيئات الحمض النووي.

2. ترتبط كل شظايا الحمض النووي المنفصلة بحبات خاصة تسمح بتضخيم (PCR) لجميع الحمض النووي في الآبار المنفصلة.

- وظيفة محتملة للجين

2. يمكننا إجراء بحث BLAST (أداة البحث عن المحاذاة المحلية الأساسية) باستخدام تسلسل الحمض النووي من الإنزيم المعروف على nbci.nlm.nih.gov

3. يمكن لهذا البرنامج أن يأخذ التسلسل المعروف ويطابقه مع العديد من الجينومات المماثلة في الفئران المخزنة في قاعدة البيانات. يسمح لنا بالعثور على العديد من الجينات التي يمكن أن يكون لها نفس الوظيفة في المعدة
- يتم تمييز قواعد المطابقة بالحرف الموجود في المنتصف
- تظهر القواعد غير المطابقة على شكل فجوات
- تظهر القواعد ذات الوظائف المماثلة على أنها. علامات زائد.

4. الباحثون قادرون على تحديد الجينات المحتملة التي لها مناطق قوية من التشابه مع الإنزيم المعروف حيث تم حفظ قواعد معينة بين الجينات والتي قد تشير إلى أنها مرتبطة وظيفيًا.

5. يتم عزل هذه الإنزيمات المحتملة ويتم عمل نسخة (كدنا) منها جميعًا بشكل منفصل.

6. يتم إدخالها في نواقل لتضخيمها.

7. يتم اختبار جميع الإنزيمات لمعرفة ما إذا كانت ستعمل على إضافة حمض دهني إلى جريلين. (تم العثور على واحد)

8. يمكن استخدام تفاعل البوليميراز المتسلسل في الوقت الحقيقي لتحديد ما إذا كان الإنزيم يتم التعبير عنه في نفس المواقع كما في جسم الإنسان (الصورة).
- المزيد من الإزهار يعني أن هناك المزيد من الشك في نسخ الحمض النووي لنسخة (كدنا) من الرنا المرسال (يشير إلى أن إنزيم الماعز هو الأبرز في خلايا الجهاز الهضمي)

9. الآن نحن قادرون على أخذ تسلسل الفئران الجديد والبحث بلاست للعثور على جين مشابه في الجينوم البشري.
- قادرة على تحديد الجين لأن الجينوم البشري والفأر متشابهان للغاية.


مصادر البيانات والمعالجة

موارد البيانات لإعادة بناء شبكة التفاعل

تكمن قوة وتعبير أي شبكة إلى حد كبير في نموذج البيانات المستخدم لتمثيل التفاعلات الجزيئية. من منظور حسابي ، قمنا بتطبيق معايير منهجية موحدة وأساليب إحصائية لتدريب شبكة PPI الخاصة بنا على وجه التحديد أرابيدوبسيس . بالإضافة إلى ذلك ، لضمان جودة البيانات ، تعاملنا مع كل مورد على حدة كميزات مرجحة وأعدنا بناء شبكة PPI من خلال التكامل المناسب لمجموعات بيانات تفاعل البروتين المختلفة وفقًا لنظرية Naïve Bayesian Network. بهذه الطريقة ، يتم توفير بيانات بيولوجية ذات مغزى من خلال AtPID. هنا يتم إنشاء بيانات تفاعل البروتين بالطرق التالية: يتم الحصول على النتائج التجريبية من الأوراق ذات الصلة في PubMed ويمكن الوصول إلى قواعد البيانات والبيانات الأخرى المتاحة من تنبؤات المعلوماتية الحيوية. يتم وصف تفاصيل إنشاء بيانات التفاعل أدناه.

تم استخراج تفاعلات البروتين التي تم جمعها يدويًا ليس فقط من آلاف المقالات المنشورة ، ولكن أيضًا من قواعد بيانات IntAct (44) و BIND (45) و TAIR (13). قمنا بإيداع بيانات تفاعل البروتين التي تمتلك أدلة مادية أو مراجع تجريبية تتعلق بالارتباط بين بروتينين في AtPID. لضمان موثوقية هذه البيانات ، أجرينا أيضًا عملية تحقق. أولاً ، قمنا بتعيين PPI التي تم جمعها من الأدبيات التي تفتقر إلى معرفات موقع AGI إلى IPI (46) وأزلنا الرموز بدون تطابق. طبقنا رموز AGI الموحدة على البروتينات في AtPID لمزيد من التحليل. وجدنا 3866 زوجًا من PPI تتضمن 1875 بروتينًا باستخدام عملية الترشيح هذه.بالإضافة إلى ذلك ، تم أيضًا استنتاج أزواج البروتين في مجمعات الإنزيم كجزء من GSP استنادًا إلى افتراض أن الوحدات الفرعية في مجمع الإنزيم لها ارتباط وظيفي عالي وتفاعلات فيزيائية محتملة. تم الحصول على مجمعات الإنزيمات من KEGG (47) لاستخراج تقاطع التفاعلات من التنقيب عن النص ومجمعات الإنزيمات التي تم الحصول عليها مباشرة من قاعدة بيانات KEGG. استخدمنا لاحقًا شجرة القرار لتحديد عدد البروتينات التي تنتمي إلى مركب إنزيم أدى إلى دقة أقل إيجابية زائفة وأعلى. نظرًا لأنه يتم تعيين العديد من الوحدات الفرعية أو مكونات مجمع الإنزيم من تشابه التسلسل مع الأنواع الأخرى أو أخصائيي تقويم العظام ، قمنا بمقارنة بيانات تفاعل البروتين الحقيقية لتقليل الضوضاء والمعلومات الزائدة عن الحاجة. في النهاية ، تم الحصول على 800 زوج فريد من خلال مجمع الإنزيم بعد استبعاد التكرار من 3866 زوجًا عن طريق التنقيب عن النص. وبالتالي ، تم إنشاء ما مجموعه 4666 زوجًا من التفاعل تتضمن 2285 بروتينًا (الجدول 1). يتم تخزين موارد تفاعل البروتين هذه ، والتي تسمى GSP (المعيار الذهبي الإيجابي) في AtPID وتستخدم لتسجيل شبكة التفاعل التي تعين كل زوج من التفاعلات التنبؤية بمقاييس كمية.

نظرة عامة على موارد نظام الأفضليات المعمم

. موارد PPI. عدد أزواج PPI. عدد البروتينات في أزواج PPI.
GSP PPI [1] الآداب من PubMed 1259 740
[2] InAct 1528 677
[3] ملزمة 1475 538
[4] الطير 1073 698
[ 1 ]∼[ 4 ] 3866 1875
مجمعات البروتين [5] KEGG (مركب إنزيم) 1700 856
المجموع [ 1 ]∼[ 5 ] 4666 2285
. موارد PPI. عدد أزواج PPI. عدد البروتينات في أزواج PPI.
GSP PPI [1] الآداب من PubMed 1259 740
[2] InAct 1528 677
[3] ملزمة 1475 538
[4] الطير 1073 698
[ 1 ]∼[ 4 ] 3866 1875
مجمعات البروتين [5] KEGG (مركب إنزيم) 1700 856
المجموع [ 1 ]∼[ 5 ] 4666 2285

[1] تُستخلص تفاعلات البروتين التي يتم جمعها يدويًا مباشرةً من آلاف المقالات المنشورة في PubMed. [2] يوفر InAct نظام قاعدة بيانات مفتوح المصدر متاح مجانًا لبيانات تفاعل البروتين في EMBL-EBI. جميع التفاعلات مستمدة من معالجة الأدبيات أو عمليات إرسال المستخدم المباشرة. [3] BIND هو مورد جديد لإجراء عمليات بحث عبر قواعد البيانات للتسلسل المتاح ، والتفاعل ، والمعلومات المعقدة والمسار. إنه يدمج مجموعة من قواعد بيانات المكونات بما في ذلك Genbank و BIND ، قاعدة بيانات شبكة التفاعل الجزيئي الحيوي. [4] توفر TAIR ملف "Tair Protein Interaction" بواسطة Matt Geisler في FTP (ftp://ftp.arabidopsis.org/home/tair/Proteins/). [5] KEGG ، وهي قاعدة معرفية مرجعية تربط الجينومات بالنظم والبيئات البيولوجية ، توفر معلومات معقدة عن الإنزيمات. [1] ∼ [4] بعد تعيين رموز مختلفة لـ AGI ، وجدنا 3866 زوج PPI تشتمل على 1875 بروتينًا مع دعم أدبي. [1] ∼ [5] جنبًا إلى جنب مع مركبات الإنزيم من KEGG ، فإن العدد الإجمالي لـ GSP يصل إلى 4666 يتضمن 2285 بروتينًا.

نظرة عامة على موارد نظام الأفضليات المعمم

. موارد PPI. عدد أزواج PPI. عدد البروتينات في أزواج PPI.
GSP PPI [1] آداب من PubMed 1259 740
[2] InAct 1528 677
[3] ملزمة 1475 538
[4] الطير 1073 698
[ 1 ]∼[ 4 ] 3866 1875
مجمعات البروتين [5] KEGG (مركب إنزيم) 1700 856
المجموع [ 1 ]∼[ 5 ] 4666 2285
. موارد PPI. عدد أزواج PPI. عدد البروتينات في أزواج PPI.
GSP PPI [1] آداب من PubMed 1259 740
[2] InAct 1528 677
[3] ملزمة 1475 538
[4] الطير 1073 698
[ 1 ]∼[ 4 ] 3866 1875
مجمعات البروتين [5] KEGG (مركب إنزيم) 1700 856
المجموع [ 1 ]∼[ 5 ] 4666 2285

[1] تُستخلص تفاعلات البروتين التي يتم جمعها يدويًا مباشرةً من آلاف المقالات المنشورة في PubMed. [2] يوفر InAct نظام قاعدة بيانات مفتوح المصدر متاح مجانًا لبيانات تفاعل البروتين في EMBL-EBI. جميع التفاعلات مستمدة من معالجة الأدبيات أو عمليات إرسال المستخدم المباشرة. [3] BIND هو مورد جديد لإجراء عمليات بحث عبر قواعد البيانات للتسلسل المتاح ، والتفاعل ، والمعلومات المعقدة والمسار. إنه يدمج مجموعة من قواعد بيانات المكونات بما في ذلك Genbank و BIND ، قاعدة بيانات شبكة التفاعل الجزيئي الحيوي. [4] توفر TAIR ملف "Tair Protein Interaction" بواسطة Matt Geisler في FTP (ftp://ftp.arabidopsis.org/home/tair/Proteins/). [5] KEGG ، وهي قاعدة معرفية مرجعية تربط الجينومات بالنظم والبيئات البيولوجية ، توفر معلومات معقدة عن الإنزيمات. [1] ∼ [4] بعد تعيين رموز مختلفة لـ AGI ، وجدنا 3866 زوج PPI تتضمن 1875 بروتينًا مع دعم أدبي. [1] ∼ [5] جنبًا إلى جنب مع مركبات الإنزيم من KEGG ، فإن العدد الإجمالي لـ GSP يصل إلى 4666 يتضمن 2285 بروتينًا.

للتنبؤ بمؤشرات أسعار المنتج في AtPID ، طبقنا مناهج حسابية ، بما في ذلك تفاعلات البروتين المحفوظة (أي interologs) (48) ، وبيانات التعبير الجيني (49 ، 50) ، والسياق الجيني (أي خوارزمية الجينات المجاورة) (51 ، 52) ، اندماج الجينات (Rosetta) طريقة الحجر) (53 ، 54) ، وملامح النشوء والتطور (55 ، 56) وشروح GO. تم إنشاء ملفات التعريف النشوء والتطور الأمثل وتقييمها باستخدام طريقة الشمس وآخرون. (57). مثبطات مضخة البروتون المتعامدة في A. thaliana تم الحصول عليها وفقًا لنقل وظيفة تقويم العظام. تم أيضًا جمع ملفات الخرائط التقويمية في Inparanoid (58) وبيانات تفاعل DIP للكائنات الأخرى (59). لاستنتاج أرابيدوبسيس تفاعلات البروتين ، قمنا بتعيين العديد من الكائنات الحية النموذجية (على سبيل المثال S. cerevisiae ، D. melanogaster ، C. elegans و H. العاقل ) بيانات تفاعل البروتين وأخصائيي تقويم العظام أرابيدوبسيس . بالإضافة إلى ذلك ، استخدمنا أطلس أرابيدوبسيس تطوير بيانات ميكروأري (Acc.no: ME00319) من قاعدة بيانات TAIR (13) لتحديد الجينات المعبر عنها بشكل مشترك.

تم تحديد البروتينات غير الزائدة عن الحاجة مع شرح GO من Gene Ontology Consortium. تم استخدام هذه البيانات لحساب قيمة العمليات البيولوجية الأصغر المشتركة (SSBP) لكل زوج لجميع البروتينات التي تستخدم طرق شرح GO (40). غالبًا ما تعمل البروتينات المتفاعلة في نفس العملية البيولوجية. لذلك ، من المرجح أن تتفاعل البروتينات المشاركة في نفس العملية أكثر من البروتينات في عمليات متميزة. علاوة على ذلك ، من المرجح أن تتفاعل البروتينات التي تظهر خصوصية وظيفية عالية أكثر من البروتينات التي تعمل في عمليات أكثر شمولاً. بناءً على هذا الافتراض ، حددنا أولاً جميع مصطلحات العملية البيولوجية المشتركة بين بروتينين. بعد ذلك ، قمنا بحساب عدد البروتينات الأخرى التي تم تخصيصها لكل من المصطلحات الشائعة وأنتجنا مصطلح العملية البيولوجية المشتركة مع أصغر عدد (SSBP). بشكل عام ، كلما قل عدد SSBP ، كلما كان مصطلح العملية البيولوجية أكثر تحديدًا ، وزاد التشابه الوظيفي بين بروتينين. بهذه الطريقة ، استخدمنا SSBP للتنبؤ بمؤشرات أسعار المنتجين.

لقد بحثنا أيضًا في الافتراض القائل بأن بعض الأوبونات الموجودة داخل كائن حي معين يمكن حفظها عبر كائنات أخرى بناءً على طريقة Gene Neighbours. يوفر الحفاظ على بنية الأوبرون دليلًا إضافيًا على أن الجينات داخل الأوبرون مرتبطة وظيفيًا وربما تكون مكونات لمركب أو مسار بروتيني.

أخيرًا ، اعتمدنا طريقة اندماج الجينات. الافتراض الأساسي لهذه الطريقة هو أنه إذا كان البروتين المركب مشابهًا بشكل فريد لبروتينين مكونين في نوع آخر ، فمن المرجح أن تتفاعل البروتينات المكونة (53). تم تحديد أحداث اندماج الجينات في الجينوم الكامل ، بناءً على مقارنات التسلسل فقط. تمكن هذه البيانات من استنتاج الارتباطات الوظيفية بين البروتينات.

نهج شبكات بايزي

تم دمج مجموعات البيانات التنبؤية من هذه الأساليب الفردية باستخدام شبكات Naïve Bayesian (40). تم استخدام نهج Bayesian Networks لدمج أكثر من سبعة مصادر بيانات تنبؤية ومن ثم بناء نموذج لاستنتاج مؤشرات أسعار المنتجين الجديدة لـ أرابيدوبسيس . يتمثل جوهر النهج في توفير قاعدة رياضية ، في ضوء بعض الأدلة التنبؤية ، لشرح كيفية ضبط احتمالات تفاعل زوج من البروتينات ، إما في مثيل تفاعل حقيقي (GSP) أو في المقابل ، في تفاعلات البروتين السلبية ، والمعروفة باسم GSN (المعيار الذهبي سلبي). لا توجد معلومات مباشرة بشأن عدم وجود تفاعلات بروتينية محددة متاحة. ومع ذلك ، توفر بيانات توطين البروتين دليلاً غير مباشر ، بالنظر إلى أننا نفترض أن البروتينات في الأجزاء الخلوية المختلفة لا تتفاعل (60). ومن ثم ، تم إنشاء قيم GSN بناءً على هذا الافتراض باستخدام بيانات التوطين الخلوية من قاعدة بيانات SUBA (61). تم حساب نسب الاحتمالية الفردية بسهولة عن طريق حساب عدد أزواج البروتين مع القيم التي تتداخل مع مجموعات GSP و GSN في مجموعة البيانات التنبؤية.

كانت درجات الثقة (LR) لكل زوج PPI المستنتج عبارة عن مجموع الشكل اللوغاريتمي لجميع نسب الاحتمالية الفردية السبع من الطرق المقابلة. تصف صفحة نتائج استعلام AtPID درجة LR من كل طريقة بدوائر مفتوحة أو مملوءة جزئيًا أو كليًا تشير إلى ارتباطات إيجابية بمستوى الثقة في علاقة التفاعل. يظهر الرقم التفصيلي لكل مجموعة بيانات تنبؤية في الجدول 2 ويمكن تنزيل جميع مجموعات البيانات التنبؤية من موقع ويب AtPID.

نظرة عامة على عدد مجموعة البيانات التنبؤية الفردية

. عدد أزواج PPI التنبؤية. عدد البروتينات في أزواج PPI.
O: مجموعات بيانات التفاعل التقويمي 3045 1359
G: الوظيفة البيولوجية المشتركة: GO علم الوجود 553 523
E: التعبير المشترك 14 837 8024
F: طريقة الانصهار الجيني 6570 5671
N: طريقة جيران الجينات 2008 1637
P: طريقة الملف الشخصي النشوء والتطور 15 723 8751
D: زوج المجال المخصب 2182 1288
AtPID أ 28 062 (PPI المفترض مع GSP) 12 506
23396 (PPI المفترض بدون نظام الأفضليات المعمم) 11 706
. عدد أزواج PPI التنبؤية. عدد البروتينات في أزواج PPI.
O: مجموعات بيانات التفاعل التقويمي 3045 1359
G: الوظيفة البيولوجية المشتركة: GO علم الوجود 553 523
E: التعبير المشترك 14 837 8024
F: طريقة الانصهار الجيني 6570 5671
N: طريقة الجوار الجيني 2008 1637
P: طريقة الملف الشخصي النشوء والتطور 15 723 8751
D: زوج المجال المخصب 2182 1288
AtPID أ 28 062 (PPI المفترض مع GSP) 12 506
23396 (PPI المفترض بدون نظام الأفضليات المعمم) 11 706

(أ) من خلال التكامل من خلال شبكة Naïve Bays ، حققت AtPID 2862 زوجًا من وحدات PPI مع 23396 زوجًا من طرق التنبؤ. هناك سبع مجموعات بيانات فردية من طرق مختلفة ، تم تحديدها بواسطة O و G و E و F و N و P و D. يمكن تصفح تفاصيل كل طريقة في الأسئلة الشائعة لـ AtPID.

نظرة عامة على عدد مجموعة البيانات التنبؤية الفردية

. عدد أزواج PPI التنبؤية. عدد البروتينات في أزواج PPI.
O: مجموعات بيانات التفاعل التقويمي 3045 1359
G: الوظيفة البيولوجية المشتركة: GO علم الوجود 553 523
E: التعبير المشترك 14 837 8024
F: طريقة الانصهار الجيني 6570 5671
N: طريقة الجوار الجيني 2008 1637
P: طريقة الملف الشخصي النشوء والتطور 15 723 8751
D: زوج المجال المخصب 2182 1288
AtPID أ 28 062 (PPI المفترض مع GSP) 12 506
23396 (PPI المفترض بدون نظام الأفضليات المعمم) 11 706
. عدد أزواج PPI التنبؤية. عدد البروتينات في أزواج PPI.
O: مجموعات بيانات التفاعل التقويمي 3045 1359
G: الوظيفة البيولوجية المشتركة: GO علم الوجود 553 523
E: التعبير المشترك 14 837 8024
F: طريقة الانصهار الجيني 6570 5671
N: طريقة جيران الجينات 2008 1637
P: طريقة الملف الشخصي النشوء والتطور 15 723 8751
D: زوج المجال المخصب 2182 1288
AtPID أ 28 062 (PPI المفترض مع GSP) 12 506
23396 (PPI المفترض بدون نظام الأفضليات المعمم) 11 706

(أ) من خلال التكامل من خلال شبكة Naïve Bays ، حققت AtPID 2862 زوجًا من وحدات PPI مع 23396 زوجًا من طرق التنبؤ. هناك سبع مجموعات بيانات فردية من طرق مختلفة ، تم تحديدها بواسطة O و G و E و F و N و P و D. يمكن تصفح تفاصيل كل طريقة في الأسئلة الشائعة لـ AtPID.


معلومات الكاتب

بيرند شويتنغروبر وآن ماري مارتينيز: ساهم هؤلاء المؤلفون بالتساوي في هذا العمل.

الانتماءات

Institut de Génétique Humaine، CNRS، 141، Rue de la Cardonille، Montpellier Cedex 5، 34396، France

بيرند شوتينجروبر وآن ماري مارتينيز ونيكولا يوفينو وأمبير جياكومو كافالي

Université de Montpellier 2، Place Eugène Bataillon، Montpellier Cedex 5، 34095، France

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

المؤلف المراسل


5 تفاعلات المفعول

... لإدارة نظام بشكل فعال ، يمكنك التركيز على تفاعلات الأجزاء بدلاً من سلوكها بشكل منفصل.

راسل أكوف وفريد ​​إيمري ، على الأنظمة الهادفة

يمكن القول إن الكأس المقدسة لتوصيف المستجيب هي تحديد الأهداف الجزيئية الدقيقة لكل مستجيب و / أو الجزيئات التي يستخدمها النبات لربطها. يمكن أن يؤدي هذا إلى تحديد التسلسلات الدقيقة والتفاعلات الجزيئية التي تحدث عند نقطة (نقاط) الاتصال المباشر. الأول يمثل تحديًا كبيرًا لأن متواليات المستجيب لا تعطي أدلة كثيرة على وظيفتها (وظائفها).

5.1 لقطة في الظلام: فحص غير متحيز

يعد الفحص "الأمامي" غير المتحيز للعثور على تفاعلات البروتين والبروتين (PPI) أسلوبًا شائعًا يستخدم في العديد من جوانب البيولوجيا الجزيئية. يسمح نظام الخميرة ثنائي الهجين (Y2H) ، الذي تم تطويره لأول مرة منذ 30 عامًا ، بالفحص على نطاق واسع لمكتبات cDNA المشتقة من النباتات المصابة بالعوامل الممرضة لتحديد هدف المستجيب (Fields and Song ، 1989 Mukhtar وآخرون. ، 2011). يجب التحقق من صحة التفاعلات التي تم الكشف عنها بواسطة شاشات Y2H من خلال مقايسات PPI الإضافية لأن هذا النهج عرضة للإيجابيات الخاطئة.

أكثر تقنيات التحقق من صحة Y2H شيوعًا هي الترسيب المناعي المشترك (Co-IP). يستخدم الترسيب المناعي المشترك لفحص المتفاعلات المؤثرة في الأنظمة غير المتجانسة. عندما يكون 20 فطرًا مرشحًا لصدأ الحور (M. larici-populina) تم تمييز المؤثرات بـ GFP وتم التعبير عنها بـ بنثاميانا ، تم العثور على خمسة تتفاعل على وجه التحديد مع البروتينات النباتية عن طريق المقايسات المنسدلة باستخدام مضاد GFP متبوعًا بتنقية البروتين (الشكل 4 أ) (Petre وآخرون., 2015 ).

يستخدم Biotinylation أيضًا في وضع العلامات التقريبية بناءً على أدوات مثل BioID (Li وآخرون. ، 2017). تتمثل فائدة وضع العلامات التقريبية على الترسيب المناعي المشترك في إمكانية تحديد البروتينات التي تتفاعل بشكل ضعيف أو عابر مع الهدف (الشكل 4 ب). في الآونة الأخيرة ، تم إثبات أن أداة وضع العلامات التقريبية الجديدة ، TurboID ، توفر تصنيفًا أكثر كفاءة في Planta مقارنةً بـ BioID ويمكنها أيضًا تقليل وقت حضانة البيوتين من 16 ساعة إلى 10 دقائق (Branon وآخرون. ، 2018 تشانغ وآخرون. ، 2019). تمهد هذه التطورات الجديدة في تقنية PPI الطريق أمام فحص تفاعل مؤثر إنتاجي أعلى في بلانتا.

5.2 تكملة علامة الانقسام

المستجيب Pep1 ضروري لإمراضية فطر تفحم الذرة يو ميديس (دويلمان وآخرون، 2009). تم التحقق من صحة التفاعل المباشر بين Pep1 ونبات البيروكسيديز POX12 باستخدام مقايسة تكملة التألق ثنائية الجزيئات (BiFC) (الشكل 4 ج) ، والتي تتضمن جزأين من علامة الفلورسنت يتم دمجها مع المتفاعلات المرشحة. فقط عندما تلتقي المتفاعلات ، يمكن تجميع العلامة الفلورية كاملة الطول واكتشافها. بدلاً من ذلك ، يمكن استخدام إنزيم لوسيفيراز المشتق من اليراع لتكملة علامة الانقسام. هذا له ميزة على BiFC في دراسات النباتات لأن لوسيفيراز لا يتطلب الإثارة بالضوء للكشف ، وبالتالي القضاء على تداخل التألق الذاتي (Li وآخرون. ، 2011). ومع ذلك ، فإن استخدام تكملة علامة الانقسام للتحقق من صحة PPI ليس معصومًا عن الخطأ مثل الإفراط في التعبير المتغاير عن البروتينات في بنثاميانا يمكن أن يؤثر على توطين البروتين وبالتالي المتفاعلات.

5.3 التفاعلات الهيكلية: تحديد نقاط التلامس السطحية ونقاط قوتها

تمنحنا معرفة الهياكل المؤثرة أثناء التعقيد مع أهدافها نظرة ثاقبة على الأساس الجزيئي لهذه التفاعلات عبر المملكة.

ال C. فولفوم كان المستجيب Avr4 واحدًا من أوائل العناصر التي تم تمييزها من عائلة المؤثرات التي تربط وتحمي الكيتين جدار الخلية الفطري من الكيتيناز المضيف (Joosten وآخرون.، 1997 فان دن بورغ وآخرون، 2006). في الآونة الأخيرة ، سلط التركيب البلوري لـ Avr4 المركب مع رابط الكيتين الخاص به (تم حله إلى 1.95 درجة مئوية) الضوء على البقايا المطلوبة لهذه الوظيفة (Hurlburt وآخرون. ، 2018). أظهرت دراسات الطفرات الهيكلية أيضًا أن التعرف على Avr4 من قبل المستقبل المناعي Cf-4 المشابه لا يعتمد على ارتباط الترابط نفسه كما كان يعتقد سابقًا (Hurlburt وآخرون., 2018 ).

التركيب البلوري لمستقبلات الأرز المناعي NLR داخل الخلايا في مركب مع M. oryzae يكشف المستجيب Avr-Pik (بدقة 1.6 درجة) عن التفاصيل الجزيئية لحدث التعرف الذي يؤدي إلى موت الخلايا الناجم عن الموارد البشرية (مقبول وآخرون. ، 2015). تم تحديد سطح المستجيب المتضمن في هذا التفاعل أيضًا على أنه مشارك في التفاعلات السطحية بين Avr-Pia و NLR-RATX1 في M. oryzae (أورتيز وآخرون., 2017 ).

في العقد الماضي ، تم حل الهياكل البروتينية بشكل متزايد دون الحاجة إلى تكوين بلورات أو استخدام أشعة سينية ضارة ولكن باستخدام الفحص المجهري الإلكتروني بالتبريد. تُستخدم هذه التقنية على نطاق واسع لحل البروتينات في المجمعات وقد تم استخدامها لإظهار كلاهما غير نشط أرابيدوبسيس مركب NLR ZAR1-RKS1 والشكل الوسيط عندما يتفاعل المركب مع البروتين المعدل بواسطة المستجيب البكتيري AvrAC (Xanthomonas campestris الكهروضوئية. كامبستريس) (وانغ وآخرون. ، 2019). Cryo-e ، على الرغم من اكتساب شعبية في البيولوجيا الهيكلية ، غير قادر على حل البروتينات التي يقل حجمها عن 65 كيلو دالتون ، وهو استبعاد للحجم يتضمن العديد من المؤثرات الفطرية والفطرية (Muench وآخرون., 2019 ).

يمكن تحديد قوة التفاعلات بين المستجيب والهدف باستخدام قياس حراري معايرة متساوي الحرارة حيث يعطي القياس المباشر للحرارة التي يتم إطلاقها أو امتصاصها أثناء حدث الارتباط الجزيئي صورة ديناميكية حرارية كاملة للتفاعل ، بما في ذلك التقارب ، والانثالبي ، والقياس المتكافئ (داف) وآخرون. ، 2011). للمحفظين M. oryzae تم استخدام مستجيب MAX Avr1-CO39 ، قياس حراري معايرة متساوي الحرارة لتأكيد أن التفاعل المباشر مع المجال المرتبط بالمعادن الثقيلة (HMA) للأرز NLR RGA5 كان مطلوبًا لربط المستجيب (Guo وآخرون., 2018 ).

إن الفهم الأكبر للكيفية التي تساعد بها التفاعلات الهيكلية على خصوصية التعرف على Avr أمر حيوي للعمل المستقبلي في تطوير مقاومة مستدامة للأمراض في المحاصيل الغذائية المهمة.


مناقشة

على الرغم من أن العديد من الاستنباط من فيتوفثورا تم الإبلاغ عن الأنواع ، فليس من الواضح ما إذا كانت المستحلبات تساهم بشكل مباشر في فيتوفثورا الإمراضية. يؤدي Elicitins إلى استجابة دفاعية للنبات في معظم الأحيان نيكوتيانا ، وهذه الاستجابة كافية للحماية من العدوى ليس فقط فيتوفثورا ولكن أيضًا البكتيريا والفطريات والفيروسات [3]. من الأعراض البارزة للاستجابة الدفاعية الاستجابة شديدة الحساسية (HR) ، والتي تنتج عن التفاعلات غير المتوافقة بين النبات ومسببات الأمراض. تتضمن الموارد البشرية الموت السريع للخلايا للأنسجة النباتية المصابة وتكوين بروتينات دفاعية محفزة. إن الطريقة التي يحفز بها المستخلصون الموارد البشرية محيرة. إن Elicitins هي بروتينات خارج الخلية ، وبالتالي يبدو من المحتمل أن يكون أحد مستقبلات elicitin موجودًا في غشاء البلازما في النبات. إن تحديد المستقبل المسؤول عن استجابة الاستنباط له أهمية كبيرة ، كما هو الحال بالنسبة للغالبية العظمى فيتوفثورا الأنواع تنتج elicitins وبالتالي يجب أن تمنح مستقبلات elicitin طيف واسع فيتوفثورا المقاومة [32 & # x0201334].

في هذه الدراسة ، قمنا بعزل الجين المشفر capsicein CAP-Pa28 من P. capsici Pa28 وحدد بروتينًا متفاعلًا مع الكبسولة ، وهو متماثل مع نبات RLKs ، من N. glutinosa باستخدام مقايسة الخميرة ثنائية الهجين. RLKs هي كينازات بروتين نباتي غير عادي مرتبطة بالغشاء ، وبعضها له أدوار مهمة في مقاومة مسببات الأمراض [35]. يشتمل RLK على مجال مفترض خارج الخلية ، ومجال عبر الغشاء ، ومجال بروتين كيناز. جميع RLKs التي تم تحديدها في النباتات حتى الآن لها مجال Ser / Thr kinase ، على عكس مجال كيناز الخاص بالتيروزين الشائع في الحيوانات. يحتوي NgRLK1 على هيكل مجال مشابه لهيكل RLKs الخاص بالمصنع. استنادًا إلى بنية المجال خارج الخلية المفترض ، Satterlee et al. تنقسم كينازات مستقبلات النبات إلى عدة فئات [35]: تلك ذات المجال خارج الخلية المتماثل للبروتينات السكرية S-locus [36] ، أو المتماثلة مع الليكتينات المفترضة المرتبطة بالكربوهيدرات [37] ، أو البروتينات المرتبطة بالتسبب المرضي (PR5) [31] بعض RLKs لها نطاقات خارج الخلية مع عدد متغير من التكرارات الغنية باللوسين (LRRs) [38]. ومن المثير للاهتمام ، أن المجال خارج الخلية لـ NgRLK1 يحتوي على كل من مجالات البروتين السكري التي تشبه اللقطة و S-locus ، بالإضافة إلى مجال PAN AP ، المعروف بتوسط البروتين & # x02013 البروتين أو البروتين & # x02013 تفاعلات الكربوهيدرات [39]. يشبه هيكل المجال لـ NgRLK1 بنية مستقبلات S كيناز (SRK) من ب. oleracea [40]. لقد ثبت أن شاروخان يتوسط في استجابة عدم التوافق الذاتي في الكرنب [41]. في الآونة الأخيرة ، كانزاكي وآخرون. تم الإبلاغ عن NbLRK1 ، وهو بروتين كيناز يشبه مستقبلات الليكتين بنثاميانا التي تتفاعل مع INF1 المستخرج من P. infestans [23]. يلعب NbLRK1 دورًا مهمًا في تشغيل إشارة الموارد البشرية بوساطة INF1 في اتجاه مجرى النهر. كانزاكي وآخرون أظهر أيضًا أن INF1 يرتبط بمجال كيناز داخل الخلايا لـ NbLRK1 في اختبار هجين من الخميرة. تشير هذه النتيجة إلى أن تعرف النبات على INF1 يحدث داخل الخلايا النباتية. على عكس NbLRK1 ، تم العثور على NgRLK1 خارج الخلية للتفاعل مع CAP-Pa28 في مقايسات الخميرة الهجينة و GST المنسدلة ، ويشير هيكل المجال خارج الخلية NgRLK1 إلى تفاعلات محتملة مع البروتينات أو الكربوهيدرات. دعم هذا الدليل التفاعل المباشر للمجال خارج الخلية لـ NgRLK1 مع CAP-Pa. ومن المثير للاهتمام ، أن CAP-Pa28 وجد أيضًا أنه يرتبط بمجال كيناز داخل الخلايا لـ NgRLK1. كانزاكي وآخرون اقترح أن بروتين INF1 يمكن نقله داخل الخلايا النباتية عن طريق الالتقام الخلوي أو آلية غير معروفة للتفاعل مع مجال كيناز لـ NbLRK1 [23]. بناءً على هذا التقرير والنتائج التي توصلنا إليها ، نتوقع أن التعرف على النبات لـ CAP-Pa28 يحدث في المساحات خارج الخلية وداخل الخلايا. لدعم هذه الفرضية ، يجب تأكيد توطين الخلايا النباتية لـ CAP-Pa28.

في التحليل الوراثي القائم على البروتين ، كان NgRLK1 أكثر ارتباطًا بـ PR5K من A. thaliana من كينازات مستقبلات تشبه الليكتين ، والتي تشمل NbLRK1 ، وغيرها من RLKs النباتية. وانغ وآخرون. اقترح أن مستقبل PR5K متورط في إدراك الإشارات الميكروبية [31]. يشير تحليل النشوء والتطور وبنية المجال لـ NgRLK1 إلى أن NgRLK1 قد يلعب دورًا كمستقبل لجزيئات الإشارة المشتقة من مسببات الأمراض مثل الإليسيتين ، ونقترح أن NgRLK1 هو نوع جديد من النبات RLK يتعرف على Cap-Pa.

كان لمجال Ser / Thr kinase المؤتلف لـ NgRLK1 نشاط الفسفرة الذاتية ، وكان هذا النشاط أعلى مع Mn 2+ منه مع Mg 2+ ، كما تم الإبلاغ سابقًا عن RLKs للنباتات الأخرى [42 & # x0201344]. مقارنة بـ GST & # x02013NgRLK1 522 & # x02013789 المنشط بواسطة Mg 2+ ، GST & # x02013NgRLK1 522 & # x02013789 التي تم تنشيطها بواسطة Mn 2+ أعطت نطاقًا أكثر انتشارًا من التنقل الأقل على SDS & # x02013PAGE ، مما يشير إلى أن GST & # x0201289PAGE المتوافقة عند التنشيط الأنزيمي. هذه النتيجة تظهر ذلك NgRLK1 يشفر بروتين كيناز نشط ويزيد من احتمال أن يكون NgRLK1 متورطًا في مسار إشارات الموارد البشرية في N. glutinosa.

أشار تحليل اللطخة الجنوبية إلى وجود أكثر من نسخة من NgRLK1 في N. glutinosa (Y. T. Kim ، بيانات غير منشورة) ، في حين تم الإبلاغ عن RLKs من البطونية inflata ، B. napus، و كاثارانثوس روزوس موجودة فقط كنسخ فردية [42 ، 45 ، 46].

هنا ، أبلغنا عن استخدام اختبار هجين من الخميرة لعزل RLK للنبات بناءً على تفاعله مع الكابسيسين. نقترح أن NgRLK1 يمثل نوعًا جديدًا من النبات RLK ومستقبل محتمل للكابسيسين. للتحقق من ذلك ، سيكون من الضروري تحديد ما إذا كان NgRLK1 يعمل كمستقبل للكبسسين في & # x000a0vivo. تساهم البيانات المقدمة في هذه الدراسة في فهم الوظائف البيوكيميائية والفسيولوجية لمركبات RLKs النباتية وآلية الاستجابة الدفاعية التي يسببها elicitin. قد يكون لهذه النتائج آثار مهمة على التربية الجزيئية لمقاومة الأمراض في المحاصيل.


الاتجاهات والاستنتاجات المستقبلية

يتم تعديل المكونات الأساسية الأربعة للحمض النووي الريبي بأكثر من 100 تعديل مختلف للحمض النووي الريبي. هذا التعقيد الإضافي للحمض النووي الريبي ضروري للوظائف الأساسية ، مثل تنظيم الجينات والترجمة. ال أرابيدوبسيس تم الآن تعيين epitranscriptome للعديد من تعديلات الحمض النووي الريبي ، والتي تحدث في مواقع مختلفة عبر النصوص ، وهي محفزة استجابة للضغوط اللاأحيائية والحيوية ولها أدوار متنوعة في تطوير النبات ، تتراوح من دقيقة (م 5 ج) إلى دراماتيكية (م 6 أ) التأثيرات على نمو النبات. بينما تم التحقيق في "كتاب" تعديل الحمض النووي الريبي في النباتات ، تفتقر الدراسات حول "المحايات" و "القراء" المحتملة. ال أرابيدوبسيس يشفر الجينوم أكثر من 200 من بروتينات ربط الحمض النووي الريبي والتي تعمل كقراء محتملين ومؤثرين لنتائج تعديلات الحمض النووي الريبي (Lorkovic and Barta 2002). علاوة على ذلك ، الإمكانات أرابيدوبسيس لم يتم بعد استكشاف "المحايات" من عائلة ALKBH للأدوار في تطوير المصنع والتوسط في التنظيم الديناميكي لتعديلات الحمض النووي الريبي (Mielecki et al. 2012). تتميز عائلة ALKBH من dioxygenases بخصائص ركيزة متنوعة ولا تقتصر على إزالة ميثيل الأدينوزين (Aas et al. 2003 Jia et al. 2011). محدد أرابيدوبسيس قد تزيل بروتينات عائلة ALKBH أيضًا تعديلات RNA الإضافية. هناك حاجة إلى مزيد من البحث لتوضيح الآليات والأدوار الوظيفية لتعديلات mRNA مثل الربط البديل ، واستجابات الإجهاد. باستخدام أدلة RNA صغيرة ، من الممكن تحفيز ومنع m 6 A و بشكل مصطنع في mRNAs (Karijolich و Yu 2011 Chen et al. 2015b). يجب أن يتيح ذلك دراسة الوظائف المحددة لتعديلات الحمض النووي الريبي الفردية. هناك العديد من الطرق المختلفة التي يمكن أن تؤثر بها تعديلات RNA على بنية RNA والتفاعلات بين RNA و RNA والبروتينات وحتى تفاعلات RNA-DNA المحتملة (الشكل 3). الخطوات التالية لفك تشفير ملف أرابيدوبسيس تتضمن epitranscriptome Ψ-seq ، ورسم خرائط 2′-O-ribose methylations (Karijolich and Yu 2011 Birkedal et al. 2015) ، ورسم خرائط N1-methyladenosine (m 1 A) (Dominissini et al. 2016) ، رسم خرائط بدقة أحادية النوكليوتيد للتخطيط. 6 A (Ke et al. 2015) ، وتحديد قابلية الانعكاس المحتملة ، وآلية (آليات) الاستهداف المراوغة لتعديلات RNA.