معلومة

كيفية التعرف على ملف ملفوف من تسلسل الأحماض الأمينية؟


كنت أتساءل ، عندما يكون لدينا تسلسل للأحماض الأمينية ، هل يكفي التحقق مما إذا كانت المواضع a-d تتوافق مع الأحماض الأمينية الكارهة للماء من أجل تحديد ما إذا كان يمكن أن تشكل بنية ملفوفة؟ أم أننا بحاجة إلى التأكد من أن المواضع الأخرى ليست كارهة للماء أيضًا؟

كل مساعدة موضع تقدير كبير.


تكرار heptad ، يشار إليه [abcdefg]ن، وعادة ما تحتوي على بقايا كارهة للماء في أ و د، والمخلفات القطبية / المشحونة عند ه و ز.

من هنا.

هناك أداة تنبؤ بالصور المفيدة هنا.


يحدد تصنيف عائلة بروتين THAP البشرية منطقة الملف الملفوف المحفوظة تطوريًا

تشارك عائلة بروتين THAP (البروتينات المرتبطة بـ Thanatos) في البشر في العديد من العمليات الخلوية المهمة مثل التنظيم اللاجيني ، والحفاظ على تعدد القدرات ، والتبديل ، والاضطرابات مثل السرطانات والهيموفيليا. عائلة بروتين THAP البشرية التي تتكون من اثني عشر عضوًا من أطوال مختلفة لها طرف أميني مميز جيدًا ، وتنسيق الزنك ، ومجال ربط الحمض النووي يسمى مجال THAP. ومع ذلك ، فإن الطرف الكربوكسي لمعظم بروتينات THAP لم يتم توصيفه هيكليًا بعد. من المعروف أن منطقة الملف الملفوف تساعد في قلة البروتين في THAP1 و THAP11. من غير المعروف ما إذا كانت بروتينات THAP البشرية الأخرى قليلة البروتين. لقد استخدمنا أدوات المعلومات الحيوية لاستكشاف إمكانية إضعاف بروتينات THAP عبر منطقة ملفوفة.

نتائج

أدى تصنيف بروتين THAP البشري إلى ثلاث مجموعات قائمة على الحجم إلى تحديد منطقة حلزونية ألفا محفوظة تطوريًا ، في اتجاه مجرى المجال الأميني THAP. أظهرت تنبؤات البنية الثانوية ومخططات عجلة ألفا الحلزونية ونماذج البروتين إمكانية قوية لتشكيل ملف ملفوف في هذه المنطقة الغنية بالليوسين المحفوظة لجميع بروتينات THAP باستثناء THAP10.

الاستنتاجات

يفتح تحديد منطقة oligomerization المتوقعة في عائلة بروتين THAP البشرية اتجاهات جديدة للتحقيق في أعضاء عائلة البروتين هذه.


خلفية

بدأت التقنيات التجريبية عالية الإنتاجية مؤخرًا في الكشف عن تفاعلات البروتين والبروتين على المستوى البروتيني [1-6]. ومع تزايد عدد الكائنات الحية كاملة التسلسل ، يصبح من الضروري بشكل متزايد تطوير طرق حسابية للتنبؤ بهذه التفاعلات. تقترح صعوبة التنبؤ الحسابي بهياكل البروتين استراتيجية التركيز أولاً على التفاعلات التي تتم بوساطة واجهات محددة من الهندسة المعروفة.

في هذه المقالة ، نركز على واجهة تفاعل بروتين مشتركة وجيدة المواصفات - الملف المتوازي الملفوف ثنائي الشريطة. تم العثور على الملفات الملفوفة في البروتينات التي تشارك في العديد من العمليات المتنوعة ، بما في ذلك النسخ والتكوين الورمي واندماج الغشاء الذي يتنبأ بتفاعلات البروتين والبروتين بوساطة هذا النموذج سيكون لها تداعيات بيولوجية مهمة. تتكون الملفات الملفوفة من اثنين أو أكثر من حلزونات α التي تلتف حول بعضها البعض مع التفاف طفيف فوق حلزوني أعسر. تكرار سباعي مميز (abcdefg)ن يحدد موضع المخلفات في كل حلزون بالنسبة لواجهة التفاعل (الشكل 1). المواقف المدفونة أ و د عادة ما تحتوي على أحماض أمينية كارهة للماء ، والمواضع الأكثر تعرضًا ز و ه غالبًا ما تحتوي على أحماض أمينية مشحونة وقطبية. تسمح هذه البنية البسيطة والتواتر بالتعرف على تسلسلات الملف الملفوف المحتملة من خلال الأساليب الإحصائية (على سبيل المثال ، [7-12]) ، بالإضافة إلى التنبؤات التفصيلية لهيكل وطاقة واجهاتهم الكارهة للماء من خلال النمذجة الجزيئية [13-15].

رسم كاريكاتوري لفائف ملفوفة متوازية ذات شريحتين. (أ) عرض الجانب و (ب) منظر علوي. يتم تشكيل الواجهة بين حلزونات α في هيكل ملفوف بواسطة بقايا في المواضع الأساسية أ, د, ه و ز. يتم تمييز المواضع في اللولبتين عن طريق الترميز الأولي على سبيل المثال ، أ و أ' هي مواقع متشابهة في الحلزونية. N ، المحطة الأمينية C ، محطة الكربوكسي.

تم التحقق من الكثير مما هو معروف عن بنية وخصوصية الملفات الملفوفة المتوازية ثنائية الشريطة من خلال الدراسات الفيزيائية الحيوية للببتيدات المشتقة من عوامل النسخ bZIP (على سبيل المثال ، [16-22]). تُعرف مناطق الملفوف من هذه البروتينات أيضًا باسم سحابات الليوسين لأن اللب د تهيمن بقايا الليوسين على المواقف. bZIPs متجانسة وغير متجانسة مع بعضها البعض عبر مناطق الملف الملفوف الخاصة بهم. على الرغم من تجانس التسلسل الواضح بسهولة ، إلا أنهم يظهرون درجة عالية من انتقائية الشراكة التي تسمح لهم بالعمل في مسارات متنوعة. في الآونة الأخيرة ، تم استخدام تقنية مصفوفة البروتين لتحديد تفاعلات الملف الملفوف ضمن مجموعة شبه كاملة من عوامل نسخ bZIP البشرية [23]. أظهرت التفاعلات التي تم الكشف عنها قابلية استنساخ عالية واتساق ممتاز مع الدراسات المنشورة مسبقًا ، مما أعطانا ثقة عالية في البيانات.

في هذا العمل ، نطبق طريقة للتنبؤ بتفاعلات الملف اللولبي [24] لبروتينات bZIP البشرية. توفر بيانات الصفيف فرصة ممتازة لاختبار طريقتنا وتقييم فائدتها في مشكلة التنبؤ العامة بالملف الملفوف. تمثل طريقتنا الملفات الملفوفة من حيث تفاعلاتها بين الحلقات وتستمد ، من مجموعة بيانات أساسية من البيانات المتسلسلة والبيانات التجريبية ، "وزن" يشير إلى مدى ملاءمة كل تفاعل متبقي. طريقتنا قادرة على التنبؤ بشركاء التفاعل بثقة عالية ، وتحديد جزء كبير (70٪) من أزواج bZIP القوية مع الحفاظ على صحة غالبية التفاعلات المتوقعة (92٪). يوضح اختبار التحقق المتبادل الإضافي إلى أي مدى تقوم بيانات bZIP البشرية بتنقيح أسلوبنا ، وتقترح مستويات الثقة ، بناءً على تشابه التسلسل المشترك ، للتنبؤ بتفاعلات bZIP داخل الجينوم الجديد.

قبل هذا العمل ، كان هناك نجاح متواضع فقط في التنبؤ بخصوصية الشراكة للبروتينات الملفوفة التي تحدث بشكل طبيعي. تم اختبار نسخة سابقة من طريقتنا على ملفات ملفوفة ليفية. كان قادرًا على القضاء على جزء كبير من الشركاء غير المتفاعلين لتسلسل ملفي ملفوف معين ولكن ليس العثور على الشريك الفعلي [24]. قامت عدة مجموعات أخرى بحساب عدد التفاعلات الكهروستاتيكية المؤاتية وغير المواتية لعمل تنبؤات محددة حول طبيعة تفاعلات ملفوفة معينة [18 ، 25 ، 26]. في الآونة الأخيرة ، تم دمج القواعد البسيطة على حد سواء ge ' كهرباء و أأ تم استخدام التفاعلات القطبية لتقييم ثنائيات bZIP المحتملة في ذبابة الفاكهة الجينوم [27] ، ولكن حتى الآن لم يتم تأكيد معظم هذه التوقعات تجريبيًا. بالنسبة لبيانات bZIP البشرية ، فإن مثل هذه القواعد البسيطة قادرة على تحديد جزء صغير فقط من التفاعلات القوية المعروفة بمستوى عالٍ من الدقة. على سبيل المثال ، عندما يتم تعريفها لتحديد ما لا يقل عن ثلث التفاعلات القوية ، فإنها تؤدي إلى العديد من الإيجابيات الخاطئة (FP) مثل الإيجابيات الحقيقية (TP).

حققت المقاربات الشاملة وعبر الجينومية للتنبؤ بشركاء البروتين بعض النجاح [28 - 34]. ومع ذلك ، فإن عملنا هو أول من أظهر تنبؤات حسابية واسعة النطاق وعالية الثقة لأي فكرة تفاعل بروتيني.


التنبؤ بمجال البروتين

مجالات البروتين هي ترتيبات لعناصر البنية الثانوية ، والتي تمنح وظيفة بيولوجية. لقد تطورت البروتينات المعقدة عن طريق مجموعة مختلطة ومطابقة للمجالات الفردية أو عن طريق ربط عدة وحدات من نفس المجال معًا. المجالات لها وظيفة مماثلة في الكائنات الحية المختلفة وتنظيم مجالات البروتين يؤدي إلى تلميحات حول وظيفة البروتين. أحد الأشكال واسعة الانتشار هو "الحلزون الدوراني" ، والذي يلمح إلى أن البروتين الخاص بك قادر على ربط الحمض النووي ببعض السعة.

أمثلة على البرامج التي تتنبأ بمجالات محددة:

منضدة عمل PSIPRED & # 8211 لتحليل تسلسل البروتين بما في ذلك الهيكل الثانوي وتنبؤ البروتين المضطرب

Phobius & # 8211 شرائح حلزونية عبر الغشاء وتسلسل إشارة

تنبؤات COILS & # 8211 لمناطق الملف الملفوف ، المميزة للبروتينات الهيكلية أو البروتينات المشاركة في تنظيم النسخ


إسقاطات العجلة الحلزونية للبروتينات

العجلة الحلزونية هي نوع من الحبكة أو التمثيل المرئي يستخدم لتوضيح خصائص حلزونات ألفا في البروتينات. يتم رسم تسلسل الأحماض الأمينية التي تشكل منطقة حلزونية للبروتين والبنية الثانوية بطريقة دوارة حيث تكون زاوية الدوران بين الأحماض الأمينية المتتالية 100 درجة ، بحيث ينظر التمثيل النهائي إلى أسفل المحور الحلزوني. تكشف المؤامرة ما إذا كانت الأحماض الأمينية الكارهة للماء مركزة على جانب واحد من اللولب ، عادةً مع الأحماض الأمينية القطبية أو المحبة للماء على الجانب الآخر. هذا الترتيب شائع في حلزونات ألفا داخل البروتينات الكروية ، حيث يتم توجيه وجه واحد من اللولب نحو النواة الكارهة للماء والوجه الآخر موجه نحو السطح المعرض للمذيب. تم الكشف أيضًا عن أنماط محددة من سمات طيات البروتين وزخارف الالتحام بالبروتين ، كما هو الحال في تحديد مناطق ديميريزيشن سحاب الليوسين والملفات الملفوفة. غالبًا ما يُطلق على مخطط الإسقاط هذا & quotEdmondson wheel & quot باسم مخترعها.

ماذا يقول مخترعها؟

ذكر Edumudosn في ورقته الكلاسيكية

كيف تقرأ عجلة حلزونية

من الفهم الأساسي للهياكل الحلزونية ألفا التي حددها كوري ، وبولينج وراماشاندران ، نعلم أن الدوران الحلزوني الكامل (وهو ما يعني الدوران 360 درجة) يتم الحصول عليه في غضون 3.6 بقايا (وهذا هو السبب في تسمية alpha helix أيضًا باسم 3.613 اللولب). الآن تخيل المظهر ولولب ألفا من الأعلى. أي حلزون من الأعلى سيبدو كعجلة. ولكن من أجل تحديد تسلسل ، يجب على المرء أن يلاحظ الزوايا التي سيتم فيها ملاحظة الأحماض الأمينية اللاحقة. لذلك من المعلومات أعلاه يمكننا القول أن إضافة حمض أميني جديد إلى الببتيد في حلزون ألفا ستحدث عند 100 درجة (360 درجة مقسومة على 3.6). يجب أيضًا أن يتذكر المرء أنه في حالة استخدام حلزون ألفا الأيمن ، ستتم القراءة في اتجاه عقارب الساعة ، بينما في حالة استخدام حلزون ألفا الأيمن ، ستتم القراءة في عكس اتجاه عقارب الساعة.

مثال على عجلة حلزونية

الشكل التالي يصور إسقاطًا بسيطًا للعجلة الحلزونية ، للببتيد الحلزوني ألفا مع تسلسل ADITYAARYA ، قد تلاحظ أن هذا الحلزون هو حلزون أيمن لذا يحتاج المرء أن يبدأ من الأحماض الأمينية التي تحمل علامة A1 ، ثم التحرك في اتجاه عقارب الساعة للحصول على تسلسل كامل. إذا كان اللولب الأيسر (أو اللولب المكون من الأحماض الأمينية D بدلاً من الأحماض الأمينية L) فسنقرأه في اتجاه عكس اتجاه عقارب الساعة.


& ltp> يقدم هذا القسم معلومات عن تعبير الجين على مستوى الرنا المرسال أو البروتين في الخلايا أو في أنسجة الكائنات متعددة الخلايا. & ltp> & lta href = '/ help / expression_section' target = '_ top'> المزيد. & lt / a> & lt / p> التعبير i

قواعد بيانات التعبير الجيني

قاعدة بيانات Bgee لتطور التعبير الجيني

التعبير الأطلس ، التفاضل والتعبير الأساسي

بوابة بحث Genevisible لبيانات التعبير المنسقة والمنسقة من Genevestigator

قواعد البيانات الخاصة بالكائنات الحية


& ltp> يعرض هذا القسم افتراضيًا تسلسل البروتين الأساسي وعند الطلب جميع الأشكال الإسوية الموضحة في الإدخال. ويتضمن أيضًا معلومات ذات صلة بالتسلسل (التسلسلات) ، بما في ذلك & lta href = "http://www.uniprot.org/help/sequence٪5Flength"> length & lt / a> و & lta href = "http: //www.uniprot .org / مساعدة / التسلسلات "> الوزن الجزيئي & lt / a>. يتم تقديم المعلومات في أقسام فرعية مختلفة. الأقسام الفرعية الحالية ومحتواها مذكورة أدناه: & ltp> & lta href = '/ help / Sequences_section' target = '_ top'> المزيد. & lt / a> & lt / p> التسلسل s (2+) i

& ltp> هذا القسم الفرعي من & lta href = "http://www.uniprot.org/help/sequences٪5Fsection"> Sequence & lt / a> يشير إلى ما إذا كان & lta href = "http://www.uniprot.org/help / canonical٪ 5Fand٪ 5Fisoforms "> التسلسل الكنسي & lt / a> المعروض افتراضيًا في الإدخال مكتمل أم لا. & ltp> & lta href = '/ help / sequence_status' target = '_ top'> المزيد. & lt / a> & lt / p> حالة التسلسل i: مكتمل.

يصف هذا الإدخال 2 & ltp> يسرد هذا القسم الفرعي من قسم "التسلسل" تسلسلات البروتين البديلة (الأشكال الإسوية) التي يمكن إنشاؤها من نفس الجين بواسطة واحد أو عن طريق مجموعة تصل إلى أربعة أحداث بيولوجية (استخدام المروج البديل ، والربط البديل ، والبدء البديل و تغيير الإطارات الريبوسومية). بالإضافة إلى ذلك ، يقدم هذا القسم معلومات ذات صلة عن كل شكل إسوي بروتيني بديل. & ltp> & lta href = '/ help / altern_products' target = '_ top'> المزيد. & lt / a> & lt / p> الأشكال الإسوية التي أنتجتها الربط البديل . المحاذاةإضافة إلى السلة تمت الإضافة إلى السلة

يحتوي هذا الإدخال على شكلين إسويين موصوفين وشكل إسوي واحد محتمل تم تعيينه حسابيًا.

تم اختيار هذا الشكل الإسوي باعتباره & ltdiv> & ltp> & ltb> ما هو التسلسل الأساسي؟ & lt / b> & ltp> & lta href = '/ help / canonical_and_isoforms' target = '_ top'> المزيد. & lt / a> & lt / p> التسلسل الأساسي المتعارف عليه. تشير جميع المعلومات الموضعية في هذا الإدخال إليها. هذا هو أيضًا التسلسل الذي يظهر في الإصدارات القابلة للتنزيل من الإدخال.

يختلف تسلسل هذا الشكل الإسوي عن التسلسل الكنسي على النحو التالي:
225-273: VQHKRYDAIL. ELRKCIGMQE ← GLAPSPRLEC. IFSRDGVSPC

& ltp> في البروتينات المرجعية حقيقية النواة ، يتم تعيين الإدخالات التي لم تتم مراجعتها والتي من المحتمل أن تنتمي إلى نفس الجين حسابيًا ، استنادًا إلى معرفات الجينات من Ensembl و EnsemblGenomes وقواعد بيانات الكائنات الحية النموذجية. & ltp> & lta href = '/ help / gene_centric_isoform_mapping' target = '_ top > المزيد. & lt / a> & lt / p> متواليات الشكل الإسوي المحتملة المعينة حسابيًا i

درجة التعليقات التوضيحية: 1 من 5

البديل الطبيعي

مفتاح الميزةالمنصب (المواقف)وصف الإجراءات عرض رسوميطول
& ltp> يصف هذا القسم الفرعي من قسم "التسلسل" المتغير الطبيعي (المتغيرات) لتسلسل البروتين. & ltp> & lta href = '/ help / variant' target = '_ top'> المزيد. & lt / a> & lt / p> المتغير الطبيعي i VAR_061579 269I → T. يتوافق مع dbSNP المتغير: rs9567280 Ensembl. 1

التسلسل البديل

مفتاح الميزةالمنصب (المواقف)وصف الإجراءات عرض رسوميطول
& ltp> يصف هذا القسم الفرعي من قسم "التسلسل" تسلسل الأشكال الإسوية البروتينية البديلة التي تحدث بشكل طبيعي. قد تكون التغييرات في تسلسل الأحماض الأمينية ناتجة عن التضفير البديل ، أو استخدام المروج البديل ، أو البدء البديل ، أو تغيير الإطارات الريبوزومية. & ltp> & lta href = '/ help / var_seq' target = '_ top'> المزيد. & lt / a> & lt / p> التسلسل البديل i VSP_025114 225 – 273VQHKR ... IGMQE → GLAPSPRLECSSAISAHCKL CLPGSRHSPASASGVAGTTG ACHHTQLIFCIFSRDGVSPC في الشكل 2. 2 المنشورات

& # xd & ltp> معلومات منظمة يدويًا تستند إلى عبارات في مقالات علمية لا يوجد لها دعم تجريبي. & lt / p> & # xd & # xd & ltp> & lta href = "/ manual / Evidences # ECO: 0000303"> أكثر. & lt / a> & lt / p> & # xd تأكيد يدوي استنادًا إلى الرأي في i


Mirsky، A.E. & amp Pauling، L. حول بنية البروتينات الأصلية والمتحوّلة والمتخثرة. بروك. ناتل. أكاد. علوم. الولايات المتحدة الأمريكية 22, 439–447 (1936).

ماثيوز ، ب. بنية الأشعة السينية للبروتينات. البروتينات (محرران H. Neurath & amp R.L Hill) 403-590 (Academic Press ، San Francisco ، vol. 3) (1977).

Fischer، E. Einfluss der konfiguration auf die wirkung der enzyme. بير. دت ، تشيم. جيس. 27, 2985–2993 (1894).

ليدربيرج ، ج. الجينات والأجسام المضادة. علم 129, 1649–1653 (1959).

بيتسكو ، ج. & amp Ringe، D. التقلبات في بنية البروتين من حيود الأشعة السينية. آن. القس بيوفيس. بيوفيز. تشيم. 13, 331–371 (1984).

كار ، سي. & أمبير ؛ كيرن ، P. آلية محملة بنابض للتغيير التوافقي في هيماجلوتينين الأنفلونزا. زنزانة 73, 823–832 (1993).

Bullough ، PA ، Hughson ، F.M. ، Skehel ، J.J. & amp Wiley ، D.C. هيكل هيماجلوتينين الأنفلونزا عند درجة الحموضة في اندماج الغشاء. طبيعة سجية 371, 37–43 (1994).

Stein، P. & amp Chothia، C. تحويل هيكل Serpin الثالثي. جيه مول بيول. 221, 615–621 (1991).

سبرانج ، S.R. وآخرون. التغيرات الهيكلية في فسفوريلاز الجليكوجين الناجم عن الفسفرة. طبيعة سجية 336, 215–221 (1988).

Olson ، A.J. ، Bricogne ، G. & amp Harrison ، S.C. هيكل فيروس حيلة الطماطم. جسيم الفيروس بدقة 2.9. جيه مول. بيول. 171, 61–93 (1983).

بيترسن ، ج. وآخرون. تعديل ارتباط الحمض النووي لعامل النسخ Ets-1: الكشف عن اللولب α الناجم عن الحمض النووي. علم 269, 1866–1869 (1995).

فوت ، جيه & أمبير ميلشتاين ، سي. التماثل التوافقي وتنوع الأجسام المضادة. بروك. نات. أكاد. علوم. الولايات المتحدة الأمريكية 91, 10370–10374 (1994).

بريج ، ك. وآخرون. التركيب البلوري للمرافق البكتيري GroELat 2.8 Å. طبيعة سجية 371, 578–586 (1994).

بارو ، سي جيه وأمب زاجورسكي ، إم. هياكل المحلول لببتيد بيتا والأجزاء المكونة له: علاقة بترسيب الأميلويد. علم 253, 179–182 (1991).

بيتز ، س.ف. ، برايسون ، ج.و. & ديجرادو ، دبليو. حزم α- حلزونية مصممة على الطراز الأصلي وذات سمات هيكلية. بالعملة. رأي. هيكل. بيول. 5, 457–463 (1995).

هيل ، سي بي ، أندرسون ، دي إتش ، ويسون ، إل ، ديجرادو ، دبليو إف. & amp Eisenberg، D. التركيب البلوري لـ alpha 1: الآثار المترتبة على تصميم البروتين. علم 249, 543–546 (1990).

لاندشولتز ، WH ، جونسون ، P.F. & amp McKnight، S.L. سحاب الليوسين: هيكل افتراضي مشترك لفئة جديدة من بروتينات ربط الحمض النووي. علم 240, 1759–1764 (1988).

هودجز ، ر. سوديك ، ج. ، سميلي ، إل بي. & amp Jurasek ، L. Tropomyosin: تسلسل الأحماض الأمينية وهيكل ملفوف. كولد سبرينج هاربور سيمب. كمية. بيول. 37, 299–310 (1972).

Cohen، C. & amp Parry، A.D. α-Helical لفائف وحزم: كيفية تصميم بروتين α-helical. البروتينات 7, 1–15 (1990).

Harbury ، P.B. ، Zhang ، T. ، Kirn ، PS. & amp Alber، T. مفتاح بين اثنين ، وثلاثة ، وأربعة ملفات ملفوفة في طفرات GCN4 ليسين زيبر. علم 262, 1401–1407 (1993).

Zhu، B.Y.، Zhou، N.E.، Kay، C.M. & أمبير هودجز ، ر. تأثيرات التعبئة والكره للماء على طي البروتين واستقراره: تأثيرات الأحماض الأمينية المتفرعة β ، فالين وإيزولوسين ، على تكوين واستقرار لفائف ملفوفة حلزونية ألفا / سحابات ليسين. علوم البروتين. 2, 383–394 (1993).

هاربوري ، بي بي ، كيرن ، بي إس. & amp Alber، T. هيكل بلوري لماكينة تقليم أيسولوسين-سحاب. طبيعة سجية 371, 80–83 (1994).

لوفجوي ، ب. وآخرون. هيكل بلوري لسحاب ليسين اصطناعي ثلاثي الخيوط. علم 259, 1288–1293 (1993).

جونزاليس الابن ، L. ، Plecs ، J.J. & amp Alber، T. مفتاح خيفي هندسي في أوليجوميرات الليوسين-زيبر. هيكل الطبيعة. بيول. 3, 510–515 (1996).

Betz، S.، Fairman، R.، O'Neil، K.، Lear، J. & amp DeGrado، W.F. تصميم ببتيدات ملفوفة ثنائية وثلاثية الخيوط. فيل. عبر. روي. شركة لوند.ب 348, 81–88 (1995).

لامب ، ك. & أمبير كيم ، PS. يضفي التفاعل القطبي المدفون تفردًا بنيويًا في ملف ملفوف غير متجانسة مصمم. الكيمياء الحيوية 34, 8642–5648 (1995).

O'Shea، E.K.، Rutkowski، R. & amp Kim، PS. دليل على أن سحاب الليوسين عبارة عن ملف ملفوف. علم 243, 538–542 (1989).

أوشيا ، إ.ك. ، كليم ، ج.د. ، كيم ، ب. & amp Alber، T. علم 254, 539–544 (1991).

هيرست ، إتش. تسلسل بروتينات bZIP. حماية. الملف الشخصي 1, 125–134 (1994).

جونيوس ، ف. وآخرون. توصيف الرنين المغناطيسي النووي لمجال سحاب Jun leucine: خصائص غير عادية للمخلفات القطبية البينية الملفوفة. الكيمياء الحيوية 34, 6164–6174 (1995).

Potekhin ، S.A. ، Medvedkin ، V.N. ، Kashparov ، I.A. & amp Venyaminov، S.U. توليف وخصائص الببتيد المطابق للشكل الطافر لسحاب الليوسين لمنشط النسخ GCN4 من الخميرة. هندسة البروتين. 7, 1097–1101 (1994).

برونجر ، أ. تمديد الاستبدال الجزيئي: استراتيجية بحث جديدة تعتمد على تحسين ارتباط باترسون. اكتا كريستالوجر. أ 46, 46–57 (1990).

كريك ، ف. تغليف حلزونات α: ملفات ملفوفة بسيطة. اكتا كريستالوجر. 6, 689–697 (1953).

Harbury ، P.B. ، Tidor ، B. & amp Kim ، PS. إعادة تعبئة نوى البروتين بحرية العمود الفقري: التنبؤ بالبنية للملفات الملفوفة. بروك. نات. أكاد. علوم. الولايات المتحدة الأمريكية 92, 8408–8412 (1995).

تأمل ، ج. & أمبير ريتشاردز ، ف.م. القوالب الثلاثية للبروتينات. استخدام معايير التعبئة في تعداد التسلسلات المسموح بها لفئات هيكلية مختلفة. جيه مول. بيول. 193, 775–791 (1987).

جودمان ، إي إم وأمبير كيم ، بي إس. دورية معدلات تبادل بروتون الأميد في ببتيد ملفوف بسحاب ليسين. الكيمياء الحيوية 30, 11615–11620 (1991).

لومب ، ك.ج. ، كار ، سم. & أمبير كيم ، PS. طي المجال الفرعي لسحاب اللوسين الملفوف من المنشط النسخي GCN4. الكيمياء الحيوية 33, 7361–7367 (1994).

Seo، J. & amp Cohen، C. تنوع الملعب في الملفات الملفوفة α-helical. البروتينات 15, 223–234 (1993).

ديلانو ، ذ. & amp Brünger، A.T. التعبئة الحلزونية في البروتينات: التنبؤ الناجح والتحليل النشط لهياكل ملفوف GCN4 ثنائية الأبعاد وثلاثية ورباعية. هيكل البروتينات. فونك. جينيه. 20, 105–123 (1994).

كونولي ، م. أسطح البروتينات والأحماض النووية التي يمكن الوصول إليها بالمذيبات. علم 222, 709–713 (1983).

آيزنبرغ ، د. وأمبير ماكلاتشلان ، إيه.دي.طاقة الذوبان في طي البروتين وربطه. طبيعة سجية 319, 199–203 (1986).

Pauling، L. & amp Corey، R.B. تكوينات حلزونية مركبة لسلاسل بولي ببتيد: بنية بروتينات من نوع α-keratin. طبيعة سجية 171, 59–61 (1953).

فيليبس ، ج. ما هي درجة حرارة الملف الملفوف α- حلزوني؟ البروتينات 14, 425–429 (1992).

Offer، G & amp Sessions، R. النمذجة الحاسوبية للملف الحلزوني الملفوف: تغليف السلاسل الجانبية في القلب الداخلي. جيه مول. بيول. 249, 967–987 (1995).

فريزر ، R.D.B. & أمبير ماكراي ، T.P. التشكل في البروتينات الليفية وعديد الببتيدات الاصطناعية ذات الصلة. 456-462 (لندن: المطبعة الأكاديمية ، 1973).

Chothia ، C. ، Levitt ، M. & amp Richardson ، D. Helix لتعبئة اللولب في البروتينات. جيه مول. بيول. 145, 215–250 (1981).

تشانغ ، هـ. وآخرون. التحولات التوافقية في الببتيدات التي تحتوي على حلزوني ألفا مفترضين لبروتين البريون. جيه مول. بيول. 250, 514–526 (1995).


نتائج

عائلة LRIM

تتكون عائلة LRR الفائقة من البروتينات المحتوية على LRR مع مجموعة متنوعة من هياكل المجال مثل مستقبلات Toll عبر الغشاء مع مجالات مستقبلات Toll-Interleukin (TIR) ​​داخل الخلايا. تم العثور على أكثر من 180 من أفراد العائلة الفائقة LRR في البروتينات المتوقعة لكل من البعوض الثلاثة كما تم التعرف عليه من خلال التعليقات التوضيحية لـ InterPro "التكرار الغني بـ Leucine" (IPR001611). البحث عن الجينات المحتوية على LRR مع ميزات التسلسل الأكثر تشابهًا AgLRIM1 و AgAPL1C استخدمت مجموعة من الأساليب وتم تحديدها 24 ان. غامبيا, 29 الزهره. مصريةو 30 Cx. quinquefasciatus LRIM-مثل الجينات (انظر الملف الإضافي 1). تعرض البروتينات المشفرة كل أو معظم الخصائص الرئيسية لـ اي جي LRIM1 و اي جي APL1C: ببتيد الإشارة ، و LRRs ، وأنماط بقايا السيستين ، والملفات الملفوفة. ومع ذلك ، لم يتم تحديد الجينات ذات الصلة بهذه الخصائص المميزة في أي من الجينومات الممثلة للحشرات الأخرى (ذبابة الفاكهة ، نحل العسل ، أو قمل الجسم). يمكن تجميع LRIMs البعوض مع جميع ميزات التسلسل الرئيسي في عائلة فرعية "طويلة" مع 10 أو أكثر من LRRs التي تتضمن اي جي LRIM1 و اي جي APL1C ، و LRIMs "القصيرة" مع 6 أو 7 LRRs فقط (الشكل 1). تشتمل الجينات الإضافية ذات الصلة على LRIMs "TM" مع منطقة غشاء C-terminal متوقعة ، و LRIMs "غير الملفوف" التي تعرض توقيعات التسلسل المميزة ولكنها تفتقر إلى مجالات الملف الملفوف C- الطرفية.

يمكن تصنيف بروتينات LRIM الخاصة بالبعوض إلى أربعة فصائل فرعية متميزة. يتم تصنيف أفراد عائلة LRIM التي تتطابق مع جميع الميزات المحددة على أنها LRIMs طويلة مع 10 أو أكثر من LRRs ، و LRIMs القصيرة مع 6 أو 7 LRRs. يُصنف أولئك الذين يعرضون ميزات التعريف ولكن من المتوقع أيضًا أن يحتويوا على مجال عبر الغشاء C- الطرفية على أنها TM LRIMs ، وتلك التي تفتقر فقط إلى مجال الملف الملفوف تسمى LRIMs بدون ملف. تشكل وحدات LRR المتكررة هيكلًا يشبه حدوة الحصان حيث تشكل خيوط بيتا القصيرة ورقة بيتا متوازية على الوجه المقعر للقوس وتتوضع الحلزونات أو المنعطفات الرابطة على الوجه المحدب.

تسمح خصائص التسلسل الرئيسية لأفراد عائلة LRIM بإجراء استدلالات فيما يتعلق بالهياكل الهيكلية المحتملة ، مع السمة المشتركة لمجال LRR متغير الطول. تكشف الهياكل البلورية للعديد من البروتينات المحتوية على LRR أن كل تكرار يتكون من خيط بيتا قصير ولولب أو منعطف بيتا حيث تشكل الخيوط ورقة بيتا متوازية على الوجه الداخلي لهيكل يشبه حدوة الحصان في حين أن الحلزونات أو المنعطفات الاستلقاء على الوجه الخارجي. أكد تحديد بنية المجال الخارجي للمستقبل البشري 3 (TLR3) LRR الطية التي تشبه حدوة الحصان ، ومكن من اقتراح نموذج تفاعل حيث يمكن أن يكون السطح الخالي من الجليكوزيلات مهمًا لكل من قلة القلة وكذلك ربط الترابط [18 ، 19]. تشير هذه الهياكل إلى أن LRIMs المحتوية على 6 أو 7 LRR من المحتمل أن تشكل قوسًا ضحلًا بينما قد تنحني تلك التي تحتوي على المزيد من LRR إلى هياكل أكثر امتدادًا تشبه حدوة الحصان (الشكل 1).

تحليلات تسلسل مقارن للبعوض LRIMالجينات المشابهة التي تم تحديدها على الأرجح علاقات تقويمية وشبه. تم المساعدة في ذلك من خلال فحص المناطق الجينومية التقويمية (synteny) بين البعوض الثلاثة ، والتي حددت مجموعات من LRIM أخصائيو تقويم العظام مع تكرار الجينات المحلية وأحداث الخلط. مجموعة قصيرة LRIMs (LRIMs 7, 8, 9، و 10) على مقربة من عامل تبادل نيوكليوتيدات الجوانين (GNEF) الذي يحتوي على الجين الموجود في جميع الأنواع الثلاثة (الشكل 2). ازدواجية LRIM8 في ان. غامبيا و LRIM10 في الزهره. مصرية خلقت اثنين من أزواج Paralogous ، في حين LRIM7 و LRIM9 ظلوا كأخصائيي تقويم العظام من نسخة واحدة. الموقع النسبي واتجاه LRIM9 ظلت محفوظة في حين LRIM10 يبدو معكوسًا ان. غامبيا. ال LRIM7-LRIM8 حافظ الزوج على اتجاهه من الرأس إلى الذيل في جميع الأنواع الثلاثة (مع LRIM8B Paralogue in ان. غامبيا)، ولكن في الزهره. مصرية تم نقله بالنسبة إلى المكرر LRIM10. الامتداد الجينومي للمنطقة المتعامدة في الزهره. مصرية أكبر بحوالي أربع مرات ، ويرجع ذلك أساسًا إلى تراكم العديد من العناصر المتكررة والمتوافقة مع الإجمالي

4.6 أضعاف مساحة المناطق المخلقة في الزهره. مصرية مقارنة ب ان. غامبيا [20]. هذا التوسع الجيني الملحوظ في الزهره. مصرية كما لوحظ في AgAPL1 الكتلة التي تقع مع LRIM 3, 4، و 11 تقويم العظام بين الحفظ براكا 2مثل (بروتين القابلية لسرطان الثدي) وجينات أصابع الزنك. فحص التنظيم الجينومي لـ LRIMوهكذا تكشف الجينات الشبيهة بالجينات عن أحداث ازدواج الجينات وخلطها والتي شكلت تطور LRIM عائلة الجينات في البعوض.

مجموعات الجينوم المتعامدة من البعوض القصير LRIM الجينات. أنوفيليس غامبيا (أحمر) كروموسوم (كر) ، وتقويم Culex quinquefasciatus (أرجواني) و الزاعجة المصرية (الأصفر) تم تصوير الحواف الفائقة (Scont) مع LRIM الجينات (الخضراء) ، عامل تبادل النوكليوتيدات الجوانين (GNEF) الذي يحتوي على الجين (الأزرق) ، وتكرار المناطق (التظليل الخفيف). تكشف تحليلات التسلسل المقارن عن ازدواجية (خطوط متقطعة) في LRIM8 في ان. غامبيا وبناءا على LRIM10 في الزهره. مصرية، في حين LRIM7 و LRIM9 تبقى كأخصائي تقويم العظام من نسخة واحدة. بعض خلط LRIM حدثت أوامر الجينات والتوجهات ، وترك تراكم العناصر المتكررة الزهره. مصرية منطقة

تم تحديد العديد من LRIMالجينات المشابهة تم إسنادها بشكل مفترض إلى الأدوار المتعلقة بالمناعة من الدراسات الوظيفية ، مما يشير إلى أنها قد تعمل أيضًا في ردود الفعل المناعية الرئيسية للبعوض. وتشمل هذه AgLRIM4، LRIM طويل مستحث في المعي المتوسط ​​بواسطة المتصورة المنجلية غزو ​​ookinete [21] AgLRIM7 و AgLRIM10، LRIMs القصيرة التي تظهر استجابات نسخية لطفيليات الملاريا [21] و AgLRIM8B، جين ثالث قصير LRIM يظهر أنماط نسخ تستجيب للطفيليات [21] ويتم تنظيمه أثناء العدوى ببكتيريا سالبة الجرام [22]. الملف أقل AgLRIM17 يتم أيضًا تحفيز الجين بشكل نسخي في المعي المتوسط ​​للبعوض عند غزو الطفيلي [21] وتم تحديده في البداية في نفس ان. غامبيا المسح السكاني الذي سلط الضوء على دور AgAPL1 للإستجابة ل المتصورة [6]. إسكات AgLRIM17 كشف أنه خصم لكليهما P. berghei و المتصورة المنجلية [21]. في الزهره. مصرية، على الأرجح LRIM1 يتم تنظيم تقويم العظام مع الجينات المناعية الأخرى بعد الإصابة Wolbachia البكتيريا مما يؤدي إلى تنشيط المناعة ويقصر عمر البعوض [23]. نتائج الاستعلام من تجارب ميكروأري ان. غامبيا حددت الاستجابات النسخية لعدوى طفيل الملاريا [24] وتغذية الدم [25] 18 على الأقل LRIMs مع تغييرات كبيرة في التعبير الجيني (انظر الملف الإضافي 1). تقريبا كل هؤلاء ان. غامبيا LRIMs تستجيب لتغذية الدم ، بينما LRIMs 1, 4, 6, 8 أ, 8 ب, 10 و 26 الرد على P. berghei الالتهابات. بالإضافة إلى ذلك ، ما لا يقل عن 12 LRIMs تظهر تعبيرًا أعلى بشكل ملحوظ في الجسم الدهني ، العضو المناعي الرئيسي للحشرات ، مقارنةً بالمعي المتوسط ​​أو أنسجة المبيض. المحدد LRIMالجينات الشبيهة بذلك تشكل عائلة من جينات البعوض الناقل للأمراض والتي يبدو أنها مؤثرات مهمة في المناعة الفطرية للبعوض.

ميزات تسلسل البروتين LRIM

تمثل الطبيعة المتكررة لكل من مجالات LRR والملف الملفوف ، جنبًا إلى جنب مع تحملها لمستويات عالية من بدائل الأحماض الأمينية ، تحديًا كبيرًا لخوارزميات محاذاة التسلسل المتعدد. ومع ذلك ، فإن الأساليب التدريجية مع المعالجة اليدوية لمحاذاة تسلسل البروتين LRIM تعمل على تحديد السمات المميزة التي تحدد الأسرة وتساعد على استنتاج العلاقات المحتملة للتسلسل والبنية والوظيفة. تصبح خصائص التسلسل هذه واضحة للعيان عند مقارنة بروتينات البعوض الأكثر ارتباطًا بها اي جي LRIM1 و اي جي APL1A / B / C (الشكل 3): LRIMs الطويلة (LRIMs 1-4 و APL1) ، أطول LRIM بدون ملف (LRIM17) ، و TM LRIMs (LRIMs 15-16).

سمات التسلسل المميز لعائلة بروتينات البعوض LRIM. أ. المحاذاة المتعددة المشروحة لـ LRIMs الطويلة (LRIM1-4) ، أطول LRIM بدون ملف (LRIM17) ، و TM LRIMs (LRIM15-16) من أنوفيليس غامبيا (اي جي، أحمر)، الزاعجة المصرية (أأوالأصفر) و Culex quinquefasciatus (Cq، نفسجي). تسلط المحاذاة الضوء على ميزات LRIM المحددة بما في ذلك ببتيد الإشارة (SP) وأنماط بقايا السيستين (C-C و C-CC و C *) والزعيم الغني باللوسين (LRL) والتكرارات الغنية باللوسين (LRRs) أ-ن) ومجالات الملف المزدوج والملف الفردي (الظلام ، والميل 90٪ ، والضوء ، والميل 90٪). تحدد منطقة الغشاء الطرفي C (TM) TM LRIMs وتكرار الأحماض الأمينية PANGGL (Pro-Ala-Asn-Gly-Gly-Leu) فريد من نوعه اي جي APL1C. الماس الأسود يشير إلى مواضع تغيير إطار التسلسل في ترميز الجينات اي جي APL1A وإدخال عنصر قابل للتبديل في ترميز الجينات Cq LRIM2A. ب. يكشف فحص الاختلافات في طول LRR عن قيود مختلفة على أطوال التسلسلات التي تربط خيوط بيتا التي تشكل بنية تشبه حدوة الحصان LRR. يتم عرض نسب أطوال LRR لكل مجموعة من LRRs المحاذاة المحددة في الشكل 3 أ (باستثناء تلك التي تحتوي على 3 أو 4 تسلسلات تمثيلية فقط) وبالنسبة لتلك المحسوبة من المسح الآلي لجميع LRIMs البالغ عددها 26 الموضحة في اللوحة A (أ) ، البروتينات الكاملة لكل نوع من أنواع البعوض الثلاثة (السيدة) ، وبروتينات أربع حشرات أخرى (في, أبيس ميليفيرا, بومبيكس موري, ذبابة الفاكهة سوداء البطن، و تريبوليوم كاستانيوم). ج. نمط حفظ بقايا الأحماض الأمينية في LRR قصير بشكل غير عادي-ز (المحددة في اللوحة أ) مصورة بتنسيق شعار التسلسل. يتميز توقيع LRR بهليون محفوظ (ن) والليوسين (إل) (أو الأيسولوسينات المماثلة فيزيائيًا كيميائيًا (أنا) و valines (الخامس)) ، وبرولين (ص) البقايا شائعة في الموضعين 17 و 18 من LRR-ز.

تستهدف LRIMs الدملمف البعوض

اي جي LRIM1 و اي جي تتعرف الأجسام المضادة الببتيدية APL1C بشكل خاص على نطاقات البروتين الفردية ذات الأحجام المتوقعة في ان. غامبيا مقتطفات الدملمف [3] ، بما يتفق مع تسلسل إشارة الببتيد المتوقع التي من شأنها توجيه هذه البروتينات ليتم إفرازها في الدورة الدموية للبعوض. ومن المثير للاهتمام ، أن استنفاد أي من النسخ يمنع إفراز كلا البروتينين من الخلايا الدموية ، مما يشير إلى أن التعبير المشترك لهذين LRIMs مطلوب للتكوين الصحيح وإفراز معقد LRIM1 / APL1C الوظيفي [3]. بصرف النظر عن أحد Cx. quinquefasciatus نظائر LRIM2 (Cq LRIM2C ، الشكل 3A) ، تم العثور على مواقع الانقسام لتنبؤات إشارة الببتيد لجميع بروتينات LRIM (انظر الملف الإضافي 1). أول إكسون يحتوي على الببتيد إشارة CqLRIM2C من المحتمل أن يكون محجوبًا عن طريق إدخال عنصر قابل للنقل المجاور (TE) والذي قد يجعل هذا الجين غير وظيفي. وبالمثل ، أ

امتداد 4.4 كيلو بايت لإدخال TE في منطقة تشفير الملف الملفوف من CqLRIM2A Paralogue (الشكل 3 أ) قد يعطل وظيفة هذه النسخة ، وترك CqLRIM2B كطبيب تقويم وظيفي محتمل لـ APL1 / LRIM2. يجب أن توجهها ببتيدات إشارة LRIMs نحو المسار الإفرازي ، ولكن من المحتمل أن تقوم مناطق C الطرفية الكارهة للماء بتثبيتها في غشاء الخلية مما يعرض النطاقات الخارجية المحتوية على LRR بطريقة مشابهة لـ TLRs. القصير،

30 من الأحماض الأمينية ، المناطق داخل الخلايا من TM LRIMs ليس لها مجالات فرز أو إشارات يمكن التعرف عليها ، ولكن بقايا السيرين والثريونين المحفوظة يمكن أن تكون أهدافًا محتملة للفسفرة. يتم إفراز LRIMs في الدملمف البعوض أو مكشوفًا على أغشية الخلايا (ربما خلايا دموية) ، وبالتالي تكون قادرة على الانتشار على نطاق واسع إلى المواقع التي قد يؤدي فيها التحدي المناعي إلى استجابة.

تكرار PANGGL فريد بالنسبة إلى AgAPL1C

المنطقة N- الطرفية المجاورة لببتيد إشارة من AgAPL1C gene encompasses multiple repeats of the consensus amino acid sequence Pro-Ala-Asn-Gly-Gly-Leu, PANGGL (Figure 3A). Such repeats are not present in the other LRIM proteins and could not be identified in any other protein-coding genes. Sequencing multiple APL1C cDNA clones from laboratory adult male An. غامبيا mosquitoes indicated the existence of polymorphic AgAPL1C alleles encoding variable numbers of PANGGL repeats (Figure 4). The G3 mosquitoes exhibit three major bands likely corresponding to different alleles, while up to six different alleles were identified from individuals of the more recently colonised Yaounde strain. However, the possible structural and functional significance of these PANGGL repeat polymorphisms remains to be determined.

Variation of أنوفيليس غامبيا APL1C PANGGL (Pro-Ala-Asn-Gly-Gly-Leu) repeats in individual male mosquitoes from three laboratory strains. PCR primers amplify variable-length fragments likely corresponding to up to three, four, and six PANGGL repeat copy-number variations in samples of 12 individual G3, L35, and Yaounde mosquitoes, respectively.

LRIMs contain 6 to 14 LRRs of different lengths

The Short LRIMs and the majority of Coil-less LRIMs contain 6 or 7 recognisable LRRs while the LRR domains of the Long, TM, and remaining 3 Coil-less LRIMs are made up of 10 to 14 repeats (see additional file 1). LRR motifs are typically 20 to 30 residues in length and are characterised by an 11-residue consensus defined principally by the spacing of the leucines, LxxLxLxxNxL (Figure 3). The LRR pattern tolerates various substitutions with the leucines (إل) frequently being replaced by valine (الخامس) or isoleucine (أنا) and the position of the asparagine (ن) accepting serine (س), threonine (تي), or cysteine (ج) replacements. LRRs of the Coil-less LRIMs show frequent ن replacements while the ن is ubiquitous among Long LRIM LRRs and highly-conserved among TM and Short LRIMs: تي replaces ن in LRR-ك of the TM LRIMs (Figure 3A), and the Short LRIM5 and LRIM11 each have one LRR where ن is not maintained. Apart from the LRIM1 orthologues, the LRIM LRR domains are preceded by a leucine-rich leader (LRL, Figure 3A) that resembles the LRR signature sequence but exhibits elevated leucine substitutions and almost never has the characteristic ن. The similarity suggests that LRLs may form similar strand-helix/turn structures of the more canonical LRRs, but as the first of these repeating structures the LRL sequences are likely to be less constrained. The Short and Coil-less LRIMs also exhibit LRL sequences, but these are less distinct among many Coil-less LRIMs where the LRR consensus sequences are generally less well-defined. Such an irregular type of LRR-like sequence found at the start of the LRR domain is also frequently observed in the sequences of vertebrate TLRs [26]. The last LRR (LRR-ن) is distinct from the other LRIM LRRs, this LRR is well-conserved with a tryptophan (W) or phenylalanine (F) consistently replacing the last 'إل' of the LRR consensus followed by a ubiquitously present cysteine residue (LxxLxLxxNx[WF]xC). This distinctive terminal LRR pattern is also observed among the Short and Coil-less LRIMs.

Examining the lengths of the LRIM LRRs revealed the exceptionally short LRR-ز, which is consistently only 19 amino acids long (Figure 3B). The majority of LRIM LRRs are 24 residues in length, which is also the most common LRR length among LRR-containing proteins of mosquitoes and other insects. LRR lengths include the 11-residue consensus identifiable from sequence profiles plus the additional variable-length region before the start of the next consensus, which for LRR-ز is just 8 residues long (Figure 3C). Although rare, examples of short LRRs with only 19 amino acids have been identified, e.g. Mimivirus protein R380 [27], suggesting that such short LRRs may not necessarily interrupt the complete LRR fold. Proline residues in the LRR variable regions are common in short LRRs where they form part of the convex side of these repeats. Consistent with this observation, proline is the most common residue at positions 17 and 18 of LRR-ز (Figure 3C). The LRR immediately following the short LRR-ز exhibits the most variable lengths with LRRs of 20, 21, 22, 23, and 24 amino acids (LRR-ح) and the third 'إل' of its 11-residue LRR consensus is almost always replaced by a less bulky alanine (أ) residue. The mosquito LRIM-like genes are thus characterised by a variable number of 6 to 14 recognisable LRRs of different lengths, with a subset of LRIMs that exhibit an unusually short LRR of only 19 amino acids.

Patterns of LRIM cysteine residues suggest critical disulphide bridging

The comparison of protein sequences most closely related to اي جي LRIM1 and اي جي APL1C highlights several well-conserved patterns of cysteine residues (Figure 3A). The leading C-C motif is notably absent from اي جي LRIM1 and اي جي APL1B, while the double-cysteine motif (C-CC) is incomplete in أأ LRIM2 and missing from the frameshift-disrupted اي جي APL1A. This frameshift is present in the sequenced An. غامبيا PEST genome assembly but may not occur in other populations where anti-parasitic effects of اي جي APL1A have been observed [13]. The double-cysteine motif is consistently replaced by a tyrosine-cysteine motif in the TM LRIMs, and a third solitary cysteine (C*) is conserved in only LRIM1 and LRIM2/APL1 proteins. The leading C-C motif and the double-cysteine motif are also present in all Short and Coil-less LRIMs apart from the three LRIM20 orthologues that lack the leading C-C motif (see additional file 1). Such cysteine patterns are common to many LRR-containing proteins in the regions immediately flanking the LRR domain where they form intramolecular disulphide-bonded caps that stabilise the N-and C-terminal ends of the LRR domains [27]. A double-cysteine motif resembling that found in the LRIMs forms the disulphide-bonded C-terminal cap of the Nogo-66 receptor, a human LRR protein involved in signalling that modulates axon regeneration [28]. This motif contains six cysteines that form three disulphide bridges, suggesting that the LRIM C-CC motif, together with a ubiquitously conserved cysteine residue that immediately follows the last LRR consensus, could allow for the formation of two disulphide bridges to build a stabilising cap.

As well as forming the N-and C-terminal LRR caps, the patterns of cysteine residues may also be important in stabilising LRIM-LRIM interactions as in the case of اي جي LRIM1 and اي جي APL1C. Examining the behaviour of اي جي LRIM1 and اي جي APL1C using specific antibodies under non-reducing conditions revealed major protein bands of a high molecular weight complex that resolved into expected monomer sizes under reducing conditions [3]. Thus, these two LRIMs form a disulphide-bridged complex, further suggesting that the patterns of conserved cysteine residues that characterise the family of LRIM proteins may be critical to the formation of LRIM complexes. LRR-flanking cysteines have also been implicated in facilitating interactions with other proteins as in the case of mammalian TLR4 and its MD-2 (myeloid differentiation protein) partner required for the recognition of lipopolysaccharide [29]. The MD-2-like family of proteins is expanded in mosquitoes compared to the fruitfly and exhibits six conserved cysteines that may be important in such protein-protein interactions [1, 21]. At least one of these MD-2-like proteins in An. غامبيا shows specificity in regulating resistance to P. falciparum [21]. Thus, cysteine residue patterns among LRIM-like proteins may be important for LRR capping as well as for stable interactions both in the formation of LRIM complexes and in the interaction with other protein partners.

LRIM coiled-coil domains may facilitate protein-protein interactions

The LRIM1 and APL1/LRIM2 proteins all exhibit a double coiled-coil C-terminal domain (Figure 3A), while the remaining Long LRIMs and all the Short LRIMs exhibit at least one coiled-coil C-terminal region (see additional file 1). Coiled-coil domains can take on a variety of conformations with different helix stoichiometries and orientations [30]. Protein coiled-coils are formed when alpha-helices wrap around each other into stable supercoiled structures of parallel or anti-parallel, homo-or hetero-, dimers or higher order oligomers found in both fibrous and globular proteins. Each of the seven-residue repeats that define the primary structure of coiled-coils gives rise to a complete turn along the alpha-helix, with an amphipathic nature required for supercoil formation. Despite understanding these principles, reliable predictions of coiled-coil domain interactions remain generally unfeasible.

While the predicted monomer sizes of An. غامبيا LRIM1 and APL1C are

80 kD, respectively, the disulphide-bridged complex migrated at

260 kD suggesting the presence of a functional multimer in the hemolymph [3]. However, given that the observed size changes significantly depending on the resolving power of the gel system used for protein separation (Povelones M, unpublished data), and that coiled-coil containing proteins often exhibit aberrantly slow electrophoretic mobility, it is possible that the complex is assembled from 2-4 LRIM1 or APL1C monomers. Their double coiled-coil domains may facilitate initial associations that bring the proteins together in an orientation to promote the formation of stabilising disulphide bridges. The LRIM coiled-coil domains may therefore play critical roles in facilitating protein-protein interactions, both in the formation of LRIM protein complexes as well as in associating with other components of the mosquito complement-like system.


Protein Secondary Structure: α-Helices and β-Sheets

In the following we will focus on the general aspects of protein secondary structure. Many of the features discussed here are essential for practical applications &minus for example in sequence alignment and analysis, homology modelling and analysis of model quality, in planning mutations or when analyzing protein-ligand interactions.

The &alpha-helix
The most common type of secondary structure in proteins is the &alpha-helix. Linus Pauling was the first to predict the existence of &alpha-helices. The prediction was confirmed when the first three-dimensional structure of a protein, myoglobin (by Max Perutz and John Kendrew) was determined by X-ray crystallography. An example of an &alpha-helix is shown on the image below. This type of representation of a protein structure is called &ldquosticks representation&rdquo. To get a better impression of how a helix looks like, only the main chain of the polypeptide is shown, no side chains. There are 3.6 residues/turn in an &alpha-helix, which means that there is one residue every 100 degrees of rotation (360/3.6). Each residue is translated 1.5 Å along the helix axis, which gives a vertical distance of 5.4 Å between structurally equivalent atoms in a turn (pitch of a turn). The repeating structural pattern in helices is a result of repeating (similar) &phi and &psi values, which is reflected in the clustering of the torsion angles within the helical region of the Ramachandran plot . When looking at the helix in the figure below, notice how the carbonyl (C=O) oxygen atoms (shown in red) point in one direction, towards the amide NH groups 4 residues away (i, i+4). Together these groups form a hydrogen bond, one of the main forces in the stabilization of secondary structure in proteins. The hydrogen bonds are shown on the figure as dashed lines.

The &alpha-helix is not the only helical structure in proteins. Other helical structures include the 3_10 helix, which is stabilized by hydrogen bonds of the type (i, i+3) and the &pi-helix, which is stabilized by hydrogen bonds of the type (i, i+5). The 3_10 helix has a smaller radius, compared to the &alpha-helix, while the &pi-helix has a larger radius. The first detailed analysis of the occurrence of the &pi-helix in proteins, based on the analysis of entries in the Protein Data Bank (PDB), was published by Fodje & Al-Karadaghi, 2002 .
We should also note that in addition to the &ldquosimple&rdquo helical structures mentioned here, there is a number of so-called coiled-coil structures, in which two or more &alpha-helices together build higher-order helical structures.

The &beta-sheet
The second major secondary structure element in proteins is the &beta-sheet. &beta-sheets consist of several &beta-strands, stretched segments of the polypeptide chain kept together by a network of hydrogen bonds between adjacent strands. An example of a &beta-sheet, with the stabilizing hydrogen bonds between adjacent strands (shown as dotted lines), is shown in the image below:

It is important to note that unlike in helices, the residues informing hydrogen bonds between the adjacent strands are separated from each other by long segments of the amino acid sequence.

In the following image the same &beta-sheet is shown, this time in the context of the 3D structure to which it belongs and in a so-called "ribbon" representation (the coloring here is according to secondary structure - &beta-sheets in yellow and helices in magenta). Each &beta&minusstrand is represented by an arrow, which defines its direction starting from the N- to the C-terminus. When the strand arrows point in the same direction, we call such &beta-sheet parallel (the protein PDB code is 1G8P, BchI subunit of magnesium chelatase). You may also notice a &beta-hairpin, two strands connected by a loop in the left corner of the image:

In the image below you can see that the strand arrows point in opposite directions, which is a characteristic of an anti-parallel &beta-sheet (this protein PDB code is 1USR, Newcastle disease virus hemagglutinin-neuraminidase).

Loops, turns and hairpins
When there are only 2 anti-parallel &beta-strands, like in the figure below, it is called a &beta-hairpin.

The loop between the two strands is called a &beta-turn. Short turns and longer loops play an important role in protein 3D structures, connecting together strands to strands, strands to &alpha-helices, or helices to helices. The amino acid sequences in loop regions are often highly variable within a protein family. But in some cases, when a loop has some specific function, for example interaction with another protein, the sequence may be conserved. Loop length in proteins from organisms living at elevated temperatures (thermophilic organisms) is usually shorter than in protein from lower-temperature family members, presumably to give a protein additional stability at high temperatures, preventing its unfolding and denaturation. During sequence alignment and homology modeling , when it is essential to have an accurate sequence alignment, the highly variable length of loop regions justifies the localization of insertions and deletions in the amino acid sequence to loop regions.

Structural motifs that contain combinations of helices, helices and strands, etc., are closely linked to protein fold. For this reason, when viewing a protein 3D structures, it is an advantage to be able to recognize the secondary structure elements and to identify structural motifs. In the next section we will examine some of the ways by which secondary structure elements connect to each other, forming common structural motifs and folds .


شاهد الفيديو: الدرس 33: سلوك الأحماض الأمينية في الوسط شرح بعض المفاهيم (كانون الثاني 2022).