معلومة

ما هي مقاييس مقاومة الماء الأفضل للكشف عن مناطق الغشاء ، ولماذا؟


هناك العديد من مقاييس مقاومة الماء لتحليل البروتين.

على نطاق واسع ، أجمع الاختلافات بينهما من الطريقة التجريبية للحصول على البيانات وتطبيع (أو عدم وجود) البيانات.

لاكتشاف / التنبؤ بأجزاء الغشاء ، تتمثل إحدى الطرق في استخدام نافذة من 19 إلى 20 من مقاييس المخلفات هذه لاكتشاف منطقة كارهة للماء فوق عتبة. أيزنبرغ وآخرون. مقياس يستخدم من قبل uniprot على سبيل المثال.

لا يبدو أن Uniprot يفسر اختيارهم لاستخدام Eisenberg وآخرون. مقياس.

لماذا قد يستخدم المرء مقياسًا معينًا على الآخر عند التنبؤ بأجزاء الغشاء؟


تمت دراسة هذا من قبل بعض زملائي في المختبر في لماذا يعتبر مقياس مقاومة الماء البيولوجي أكثر دقة من مقاييس كره الماء التجريبية السابقة؟ أنا لا أشارك في أبحاثهم ، ولكن هنا جوهر الورقة:

المقاييس المختلفة ، كما تقول ، تم تطويرها بناءً على معايير مختلفة. على وجه الخصوص ، مقياس أيزنبرغ هو أحد مقاييس الإجماع ، ونأمل أن يكون هذا على الأقل جيدًا مثل جميع مكوناته. كان يعتقد أنه لا توجد فروق كبيرة في الأداء بين المقاييس. قد يكون هذا هو السبب في عدم تحديد Uniprot اختيارهم للمقياس: في ذلك الوقت ، لم يكن الأمر مهمًا كثيرًا. أظهرت دراسة أجريت في عام 2009 أن مقياس UHS الجديد كان في الواقع أفضل من غيره.

نتائج المقياس هي أن الاختلافات ليست كبيرة بالفعل: ما يقرب من $ pm2 ٪ $ في دقة التنبؤ. الفائز بشكل عام؟ Hessa ، حيث سجلت 1.29 $ sigma $ فوق متوسط ​​المقاييس ، ولكن يتبعها عن كثب UHS و PM1D و PM3D. بالمناسبة ، أداء أيزنبرغ متوسط.

ملاحظة أخيرة: وجدوا أن حجم النافذة شبه الأمثل لجميع المقاييس كان 21 مع ضعف الوزن في الثلث المركزي.


MemBrain: تحسين دقة توقع الحلزونات عبر الغشاء

يوفر توقع حلزونات الغشاء (TMH) في بروتينات الغشاء الحلزوني α معلومات قيمة حول طوبولوجيا البروتين عندما لا تتوفر الهياكل عالية الدقة. تم تطوير العديد من المتنبئين بناءً على مقياس مقاومة الماء للأحماض الأمينية أو الأساليب الإحصائية البحتة. بينما تؤدي هذه المتنبئات أداءً جيدًا بشكل معقول في تحديد عدد TMHs في البروتين ، إلا أنها غير دقيقة بشكل عام في التنبؤ بنهايات TMHs ، أو TMHs ذات الطول غير المعتاد. لتحسين دقة اكتشاف TMH ، قمنا بتطوير متنبئ قائم على التعلم الآلي ، MemBrain ، والذي يدمج عددًا من مناهج المعلوماتية الحيوية الحديثة بما في ذلك تمثيل التسلسل من خلال مصفوفة محاذاة تسلسل متعددة ، وخوارزمية تنبؤ الجار K الأقرب النظري المحسّن للأدلة ، ودمج أحجام نافذة التنبؤ المتعددة ، والتصنيف حسب العتبة الديناميكية. يوضح MemBrain تحسنًا عامًا بنسبة 20 ٪ تقريبًا في دقة التنبؤ ، خاصة في التنبؤ بنهايات TMHs و TMHs التي تكون أقصر من 15 من المخلفات. كما أن لديها القدرة على اكتشاف ببتيدات إشارة N-terminal. يُعد متنبئ MemBrain أداة تحليل مفيدة قائمة على التسلسل للتوصيف الوظيفي والهيكلية لبروتينات الغشاء الحلزوني ، وهو متاح مجانًا على http://chou.med.harvard.edu/bioinf/MemBrain/.

الاقتباس: Shen H ، Chou JJ (2008) MemBrain: تحسين دقة توقع حلزونات الغشاء. بلوس واحد 3 (6): e2399. https://doi.org/10.1371/journal.pone.0002399

محرر: بوستجان كوبي ، جامعة كوينزلاند ، أستراليا

تم الاستلام: 28 فبراير 2008 وافقت: 27 أبريل 2008 نشرت: 11 يونيو 2008

حقوق النشر: © 2008 شين ، تشو. هذا مقال مفتوح الوصول يتم توزيعه بموجب شروط ترخيص Creative Commons Attribution License ، والذي يسمح بالاستخدام غير المقيد والتوزيع والاستنساخ بأي وسيلة ، بشرط ذكر المؤلف الأصلي والمصدر.

التمويل: تم دعم هذا العمل من قبل المعاهد الوطنية للصحة وبرنامج Pew Scholars في العلوم الطبية الحيوية الممنوحة إلى JJC.

تضارب المصالح: وقد أعلن الباحثون إلى أن لا المصالح المتنافسة موجودة.


خلفية

بروتينات الغشاء المتكامل هي الخيار الأساسي كأهداف عند تطوير عقاقير جديدة ، وعلى الرغم من أنها ذات صلة طبية واضحة ، وتشكل 20٪ - 30٪ من المنتجات الجينية لمعظم الجينومات ، فقد تم تحديد هذه البروتينات هيكليًا في حوالي ثلاثين حالة فقط [1 ، 2] . في حالة وجود مستويات عالية من تجانس التسلسل ، يمكن أحيانًا استنتاج بنية البروتين غير المعروفة ، وبالتالي موقع الأجزاء التفاعلية الغشائية ، عن طريق المقارنة المباشرة بهياكل البروتين المعروفة. ومع ذلك ، في حالة توفر معلومات التسلسل وحدها ، يتم تحديد هوية الغشاء αيتطلب الهيكل الحلزوني نهج المعلوماتية الحيوية لفهم العلاقات الهيكلية / الوظيفية لهذه α-هيليس. عدد من α- تم استخدام الخصائص الحلزونية كنماذج لدراسة الغشاء α- القفزات وعلاقاتها بالهيكل / الوظيفة ولكن الأكثر شيوعًا هي تلك القائمة على برمائية البروتين α- حواجز ذات عزم مسعور تستخدم كمقياس للزخم [3].

لتحديد كمية البرمائية للبنى الثانوية للبروتين ، قدم أيزنبرغ وزملاؤه [4] اللحظة الكارهة للماء ، ميكرومتر(θ) ، والذي يوفر مقياسًا للتقسيم المنظم للمخلفات المحبة للماء والمضادة للماء في بنية متكررة منتظمة للفترة θ. لهيكل يضم إل المخلفات المتتالية ، الشكل العام لـ ميكرومتر(θ) اعطي من قبل:

أين ح يهي الكراهية للماء ي بقايا عشر في التسلسل ، و θ هو التردد الزاوي لبقايا الأحماض الأمينية التي تشكل الهيكل. أيزنبرغ وآخرون. ، [4] افترض أن ل α-هيلكس ، θ ثابت عند 100 درجة ، وأن قطعة من أحد عشر بقايا متتالية ، أي ما يعادل ثلاث لفات من αالحلزون ، يمكن أن تستخدم لتمثيل البرمائيات α-هيليس. أدت هذه الافتراضات إلى المقياس الأكثر استخدامًا لـ α- حلزوني البرمائيات ، متوسط ​​عزم مسعور & الملازمμH& GT ، أين

كامتداد رئيسي لاستخدام اللحظة الكارهة للماء ، أيزنبرغ وآخرون. ، [5] قدم منهجية مؤامرة العزم الكارهة للماء ، والتي توفر تقنية رسومية للتصنيف العام للبروتين α-هيليس. باستخدام هذه المنهجية ، بروتين مفترض α- يتميز اللولب بالحد الأقصى & ltμH& gt وما يقابلها من كراهية للماء ، & ltح& gt ، حيث يتم تحديد ذلك من خلال:

المعلمات & الملازمμH& GT و & ltح& gt يتم رسمها بعد ذلك على مخطط الرسم البياني للحظة الكارهة للماء (الشكل 1) وموقع نقطة البيانات الناتجة المستخدمة لتصنيف المفترض α- حلزوني.

تحليل مخطط اللحظة التقليدية الكارهة للماء لمجموعة بيانات البروتين عبر الغشاء. يوضح الشكل 1 أ مخطط مخطط اللحظة الكارهة للماء [5] بحدود تصنيف البروتين. يوضح الشكل 1 ب نتائج تحليل مخطط اللحظة الكارهة للماء لتسلسل الغشاء 403 لمجموعة البيانات الخاصة بنا باستخدام القيم التقليدية لـ إل = 11 و θ = 100° [4].

يتم استخدام متوسط ​​العزم الكارهة للماء على نطاق واسع ويعتبر بشكل عام مؤشرًا جيدًا على α- حلزوني البرمائيات ولكن نتائج التحليلات الإحصائية أظهرت فعالية منهجية مؤامرة العزم الكارهة للماء كمؤشر على α- أن تكون الطبقة الحلزونية أقل يقينًا [6]. لاحظ عدد من المؤلفين أن المنهجية يمكن أن تصنف بشكل خاطئ α- الحلزونات في الحالات التي تتأثر فيها اللحظة الكارهة للماء لتسلسل حمض أميني معين بشكل كبير بالترتيب المكاني لعدد قليل من الأحماض الأمينية المتطرفة ، وبالتالي إخفاء الطبيعة العامة α- حلزوني [3]. ومع ذلك ، يمكن أن يأتي مصدر أكثر جوهرية للتصنيف الخاطئ من الافتراض المشكوك فيه الذي قدمته منهجية العزم الكارهة للماء فيما يتعلق بالتواتر الزاوي. ومن المعروف أنه يحدث بشكل طبيعي α-هيليس ، θ يمكن أن تختلف على مدى (95 درجة ≤ θ ≤ 105 درجة) وبين المخلفات المتتالية [7]. من الواضح أن افتراض قيمة ثابتة لـ θ = 100 درجة للجميع α- المراكب تقريبية ويمكن أن تؤدي إلى صعوبات تصنيف للمنهجية. علاوة على ذلك ، يمكن أن تنشأ صعوبات التصنيف من الاختيار التعسفي لطول النافذة بواسطة المنهجية حيث من المعروف أن طول النافذة له تأثير عميق على العلاقة بين & ltμH& GT و & ltح& جي تي [7]. يبدو أن التحسين θ وطول النافذة حاسمة لتصنيف البرمائيات α-لا تزال القيم المختارة لهذه المعلمات من خلال تحليل مخطط اللحظة الكارهة للماء ليست مثالية لتصنيف أي فئة فرعية مفردة.

أخذ عدد من الدراسات في الاعتبار أهمية & ltμH& GT فيما يتعلق بالهيكل / العلاقات الوظيفية ل α-الفئات الحلزونية الموصوفة بمنهجية مؤامرة العزم الكارهة للماء مع أمثلة شائعة بما في ذلك: السطح النشط α- الحلزونات ، الغشاء α- الهوامش والمائلة المنحى α- القفزات [8-10]. ومع ذلك ، إذا كانت مختلفة α- الفصول الحلزونية لها أمثلية مختلفة لـ θ وطول النافذة ، لا يشكك هذا في صحة النتائج التي تم الحصول عليها في هذه الدراسات فحسب ، بل يشكك أيضًا في صحة α- تصنيف اللولب وفقًا لمنهجية مؤامرة العزم الكارهة للماء. في هذه الورقة ، نفحص المعايير التي تستند إليها المنهجية ، وبالنظر إلى أهميتها الطبية ، فإننا نستخدم الغشاء α- الروافع كمجموعة بيانات اختبار. هؤلاء α- تمتلك القفزات مناطق مركزية ، تتكون في الغالب من بقايا كارهة للماء وتتفاعل مع لب الغشاء الدهني ، ومناطق النهاية ، والتي تتكون أساسًا من بقايا محبة للماء وتوجد في مناطق سطح الغشاء [8]. بالنسبة إلى α-رؤوس مجموعة البيانات الخاصة بنا ، نقوم بتحليل العلاقات من أجل متوسط ​​اللحظة الكارهة للماء وحجم النافذة والتردد الزاوي والمتانة للتردد الزاوي المتغير. الارتباطات بين متوسط ​​اللحظة الكارهة للماء والمتوسط ​​الكراهية للماء من الغشاء α- تم إنشاء المروحيات والتحقق منها وتحليلها لتقييم الوظيفة البيولوجية باستخدام تقنيات إعادة تشكيل Bootstrap و Monte Carlo [11 ، 12].


نتائج

تصنيف مجالات البروتين الغشائي متعدد التنظير

يعتمد الإجراء المستخدم لتصنيف مجالات الغشاء متعدد التنظير بشكل أساسي على مخططات تصنيف الأسرة (Pfam-A و Pfam-B) ويظهر في الشكل 1 أ. حددنا عائلات مجالات الغشاء متعدد التنظير في Pfam [15] من خلال تخصيص حلزونات TM المشروحة في SWISS-PROT [16] للبروتينات في Pfam. بعد اختيار 183 عائلة Pfam-A و 152 Pfam-B بشكل متحفظ ، أجرينا تحليلًا للحلقات التي تربط TM-helices. تبين أن الحلقات تميل إلى أن تكون قصيرة ، مع وجود أقل من 80 حمضًا أمينيًا في معظمها (& 95٪ GT). لذلك أخذنا 80 وحدة بنائية باعتبارها الحلقة داخل المجال القصوى بين TM-helices لتحديد مجالات الغشاء متعدد التنظير. على الرغم من أن القطع المكون من 80 وحدة بنائية قد لا ينطبق على جزء صغير (حوالي 5٪) من بروتينات الغشاء المتكامل ، إلا أنه يقلل من فرصة تضمين المجالات القابلة للذوبان داخل مجالات الغشاء ، نظرًا لأن المجال القابل للذوبان المتوسط ​​يحتوي على حوالي 170 وحدة بنائية [17].

تصنيف مجالات الغشاء متعدد التنظير. (أ) إجراء لتصنيف مجالات الغشاء متعدد التنظير. من خلال التصنيف التلقائي والفحص اليدوي ، تم تصنيف 228 عائلة Pfam-A و 299 Pfam-B و 121 عائلة مجمعة. (ب) يتألف ملف تعريف مثال (PF01618) لعائلة مصنفة من مجالات الغشاء متعدد الأشكال من (من أعلى إلى أسفل): محاذاة تسلسلية مؤامرة متوسط ​​الكراهية للماء بناءً على تسلسل إجماع قيم الكراهية للماء GES المعروض بواسطة شعار تسلسل مع بقايا محفوظة في مناطق كارهة للماء أبرزت تسلسل إجماع لـ TM-helices ، حيث يتم عرض الأحماض الأمينية المحفوظة فقط في الرمز أحادي الحرف (مع تمثيل الباقي بـ "x").

باستخدام TMHMM ، وهو برنامج تنبؤ بالبروتين الغشائي يعتمد على نموذج ماركوف المخفي [6] ، تم توقع حلزونات TM لبروتينات الغشاء في 26 جينومًا. تم تحديد مجالات الغشاء متعدد التنظير باستخدام حجم الحلقة بين حلزونات TM كدليل. تم تصنيف هذه المجالات بعد ذلك إلى 231 عائلة Pfam-A و 318 عائلة Pfam-B إما عن طريق مطابقة معرف SWISS-PROT المباشر أو مطابقة التشابه التسلسلي باستخدام FASTA [18]. من بين المجالات المتوافقة ، فإن معظم حلزونات TM الخاصة بهم تتماشى جيدًا أيضًا ، خاصة في عائلات Pfam-A ، التي لها محاذاة تستند إلى نماذج Markov المخفية المصممة يدويًا. تم تجميع المجالات غير المصنفة في 121 عائلة من خلال تشابه تسلسلها. لكل عائلة ، تم إنشاء ملف تعريف ، كما هو موضح في الشكل 1 ب. وشمل ذلك: مخطط متوسط ​​الكراهية للماء لجميع أفراد الأسرة بناءً على مقياس Goldman-Engelman-Steitz (GES) [8] تسلسل إجماعي للعائلة ، يمثله مخطط شعار متسلسل [19] وتسلسل إجماعي لـ TM -هيليس. من خلال تحليل مؤامرات الكراهية للماء ، يمكننا تحديد موقع TM-helices في التسلسلات المتوافقة في عائلات البروتين ، وتعيين عدد من TM-helices لكل عائلة. تم القضاء على بعض العائلات ، بما في ذلك 3 في Pfam-A و 20 في Pfam-B ، في هذه الخطوة ، بسبب غموض TM-helices لوحظ في المؤامرة. من خلال هذه العملية ، حددنا 228 عائلة Pfam-A و 298 Pfam-B و 121 عائلة مجمعة لتحليلاتنا ، مع ما يقرب من 95 ٪ من المجالات المصنفة في عائلات Pfam.

تحليل عدد حلزونات TM في عائلات Pfam-A لمجالات الغشاء متعدد التنظير

بعد تعيين عدد من TM-helices لكل عائلة ، أجرينا مسحًا للأعداد المخصصة من TM-helices في 228 عائلة Pfam-A من مجالات الغشاء متعدد التنظير (الشكل 2). يتم تصنيف عائلات Pfam-A يدويًا والتي تحتوي على مجالات بروتينية جيدة التنسيق ، ومعظمها يحتوي على رقم محدد جيدًا لـ TM-helices. لقد اخترنا أيضًا العائلات في أنظمة النقل المذابة التي تم شرحها كناقلات ورموز وقنوات ، وقمنا بتحليل عدد TM-helices لهذه العائلات (الشكل 2).

عدد حلزونات TM في عائلات Pfam-A لمجالات الغشاء متعدد التنظير. الموضح هو عدد عائلات Pfam-A لمجالات الغشاء متعدد التنظير مع عدد معين من TM-helices. تم إحصاء العائلات التي تضم أكثر من 20 فردًا فقط. تشير الأشرطة الخضراء إلى الأرقام من جميع عائلات Pfam-A المدروسة والأشرطة الصفراء تلك من عائلات Pfam-A التي تم شرحها كنواقل ، و symporters ، وقنوات.

بشكل عام ، تميل معظم عائلات Pfam-A إلى امتلاك عدد صغير من TM-helices. بالنسبة لأولئك الذين لديهم سبعة أو أقل من TM-helices ، لا يختلف عدد العائلات بشكل كبير مع رقم اللولب ، على الرغم من وجود عدد أكبر من العائلات التي تحتوي على اثنين أو أربعة من TM-helices أكثر من ثلاثة أو خمسة أو ستة أو سبعة. بالنسبة للعائلات التي تحتوي على أكثر من سبع ذبذبات TM ، يتناقص عدد العائلات بشكل حاد مع زيادة عدد TM-helices. العائلات التي تحتوي على 12 TM-helices هي الاستثناء ، ولكن لديها ذروة صغيرة في الأرقام مقابل المنحدر العام للأسفل للمخطط. لقد أجرينا أيضًا نفس النوع من التحليل على عائلات Pfam-A التي تم شرحها على أنها شركات نقل ، ورموز ، وقنوات ، ووجدنا أن عائلات 12-TM-helix مفضلة من قبل العائلات الشبيهة بالناقل. بالإضافة إلى ذلك ، فإن معظم (11 من 12) عائلة Pfam-A مع 12 TM-helices هي عائلات شبيهة بالناقلات. يبدو أن هناك ميلًا للعائلات الشبيهة بالناقل للحصول على عدد زوجي من حلزونات TM ، لأن العائلات التي تحتوي على حلزونات TM 2 و 4 و 6 و 8 و 12 لها نسبة حدوث أعلى نسبيًا من تلك التي لديها عدد فردي مجاور من TM-helices.

تحليل توزيع الأحماض الأمينية والزخارف الزوجية

اخترنا 168 عائلة من Pfam-A تضم أكثر من 20 فردًا. لكل من هذه العائلات ، قمنا بعد ذلك بتوليد متواليات إجماع مع قيمة الحفظ (Rتسلسل) باستخدام برنامج Alpro [19]. الأحماض الأمينية المحفوظة نسبيًا في تسلسل الإجماع (Rتسلسل value & gt 3.0 ، تمثل أعلى 15٪ Rتسلسل تم تحليل قيمة جميع الأحماض الأمينية) وفي المناطق الحلزونية TM لتكوينها بالإضافة إلى الأشكال الزوجية.

قمنا بمقارنة تركيبة الأحماض الأمينية في حلزونات TM بشكل عام بتكوين المواقع المحفوظة فقط في TM-helices في 168 عائلة (الشكل 3). لاحظنا أن بعض الأحماض الأمينية أكثر انتشارًا في المواضع المحفوظة ، مثل الجلايسين (8٪ متوسط ​​التركيب في TM-helices مقابل 19٪ في المواضع المحفوظة من TM-helices) ، البرولين (4٪ مقابل 9٪) والتيروزين (3٪ مقابل 5٪). في المقابل ، فإن الأيزولوسين (10٪ مقابل 4٪) ، فالين (8٪ مقابل 4٪) ، الميثيونين (4٪ مقابل 1٪) والثريونين (7٪ مقابل 4٪) أقل انتشارًا في المواضع المحفوظة.

تركيبات الأحماض الأمينية من حلزونات TM. تكوين الأحماض الأمينية في المناطق الحلزونية TM (أ) لجميع التسلسلات وتسلسلات الإجماع ، و (ب) لـ 168 عائلة Pfam-A من مجالات الغشاء متعدد التنظير التي تحتوي على أكثر من 20 عضوًا.

كما هو متوقع ، تعكس التغييرات في انتشار بعض الأحماض الأمينية حفظها في تسلسل الإجماع. لذلك ، فإن الجلايسين والبرولين والتيروزين هي بقايا محفوظة نسبيًا في مناطق TM-helical ، كما أن الأيزولوسين والفالين والميثيونين والثريونين لها قابلية عالية للتغير نسبيًا. ترتبط هذه النتيجة جيدًا بمصفوفة بيانات الطفرات (MDM) لمناطق الغشاء متعددة الامتداد في بروتينات الغشاء [10]. في MDM من حلزونات ألفا عبر الغشاء متعدد الامتداد ، وجد أن الأيزولوسين والميثيونين والفالين لديها قابلية عالية للتغير نسبيًا كمخلفات كارهة للماء ، كما أن السيرين وثريونين يحتلان مرتبة عالية في قابلية التحور كمخلفات قطبية. في المصفوفة ، يبدو أن البرولين محفوظ بدرجة عالية. تؤكد نتائجنا هذه النتائج بالإضافة إلى ذلك ، وجدنا أن الجلايسين والتيروزين هما أيضًا بقايا محفوظة بدرجة عالية في حلزونات TM متعددة الخلايا.

قمنا أيضًا بتحليل التسلسل الإجماعي لـ 168 عائلة Pfam-A لزخارف أزواج الأحماض الأمينية المهمة وقارننا نتائجنا بالدراسات السابقة. يوضح الجدول 1 ثلاث قوائم زوجية: تتضمن إحداها أفضل 50 زوجًا من أزواج Senes وآخرون. مع أهميتها [12] يتضمن الثاني أفضل 50 زوجًا مع حدوثها من أزواج تم إنشاؤها عشوائيًا والثالث يتضمن أفضل 50 زوجًا مع حدوثها باستخدام Senes وآخرونأهم 200 زوج. من بين القوائم الثلاث ، يحتل زوج GxxxG المرتبة الأولى دائمًا ، مما يبرز أهميته في TM-helices [12،13،14]. في القائمة الأخيرة ، والتي تحتوي على أزواج ذات ترتيب عالٍ في أول قائمتين ، لاحظنا بعض أنماط الزخارف المثيرة للاهتمام المرتبطة بالجليسين. تم تصنيف أزواج الأحماض الأمينية مثل ZxxxZ و ZxxxxxxZ (يمثل Z بقايا الجلايسين أو الألانين أو السيرين - بقايا ذات سلسلة جانبية صغيرة) في القائمة الأخيرة. من المعروف أن الأحماض الأمينية موضوعة بمتوسط ​​3.6 بقايا لكل دور في TM-helices [20].وبالتالي يتم توجيه اثنين من البقايا المفصولة بثلاثة أو ستة بقايا في نفس الاتجاه. لذلك ، تم اقتراح أن هذه الأشكال مفضلة لتعبئة TM-helix [12 ، 14]. تتوافق نتائجنا جيدًا مع الزخارف الزوجية المكونة من بقايا صغيرة ، ولكنها لا تفضل الأزواج التي تحتوي على بقايا أليفاتية متفرعة (أيزولوسين وفالين). ربما يكون هذا بسبب أن الأيزولوسين والفالين عبارة عن بقايا متغيرة للغاية في TM-helices.

من بين جميع عائلات Pfam-A البالغ عددها 168 من نطاقات الغشاء متعدد التنظير التي درسناها ، تم تصنيف 45 منها على أنها ناقلات وقنوات و symporters ، تمثل 27 ٪ من إجمالي العائلات. درسنا أزواج GxxxG و GxxxxxxG ، ووجدنا أنها تميل إلى الارتباط ببروتينات الغشاء الشبيهة بالناقل / القناة (الجدول 2). عندما يتحول أحد الجلايسين أو كليهما إلى بقايا صغيرة مثل السيرين أو الألانين ، فإن هذا الارتباط يضعف. لذلك ، يتم حفظ أزواج GxxxG و GxxxxxxG نسبيًا في بروتينات غشاء تشبه القناة / الناقل. بمقارنة تركيبة الأحماض الأمينية للبقايا المحفوظة في حلزونات TM للعائلات الشبيهة بالناقل مع بقية عائلات Pfam-A (الجدول 3) ، وجدنا أن الجلايسين يتم حفظه مرتين أكثر في الناقل- مثل العائلات ، مما يعكس أزواج GxxxG و GxxxxxxG المفضلة في هذه العائلات. يعتبر البرولين والأسباراجين أيضًا من بين المخلفات المحفوظة المفضلة في العائلات الشبيهة بالناقلات ، في حين أن السيستين ، والهيستيدين ، والآيسولوسين ، والليوسين ، والميثيونين ، والفالين غير مفضل.

تحليل الجينوم على مستوى عائلات مجالات الغشاء متعدد التنظير

تمثل مجالات البروتين الغشائي متعدد التنظير المصنف من 40٪ إلى 81٪ من إجمالي مجالات الغشاء المتعدد الأشكال في الجينومات المدروسة ، بمتوسط ​​تغطية 61٪ (الشكل 4 أ). لقد حافظنا على تصنيف الأسرة متحفظًا نسبيًا بدلاً من استهداف تغطية شاملة عالية مع تصنيف أقل دقة. لتجنب تضمين العائلات التي تم توقعها بشكل خاطئ ، اعتمدنا تحليلنا على العائلات التي لا يقل عدد أفرادها عن أربعة أفراد. ومع ذلك ، يمكن تصنيف نسبة أعلى من مجالات الغشاء متعدد التنظير إذا تم النظر في العائلات الأصغر (الشكل 4 أ).

مجالات غشاء متعددة التنظير مصنفة في 26 جينوم. (أ) تمثل الأشرطة ذات اللون الأخضر الداكن النسبة المئوية لمجالات الغشاء متعدد التنظير المصنفة في كل جينوم ، باستخدام العائلات المصنفة فقط مع أربعة أعضاء على الأقل. عندما يتم تضمين العائلات المصنفة التي تحتوي على عضوين أو ثلاثة أفراد في هذا التحليل ، يتم تمثيل التغطية الإضافية بأشرطة خضراء فاتحة. (ب) نسبة المجالات الغشائية متعددة التنظير مصنفة بطرق مختلفة في جميع الجينومات المدروسة. يتم تحديد معظم مجالات الغشاء متعدد النسق من خلال مطابقة الهوية المباشرة والتشابه المتسلسل (FASTA) مع أفراد عائلات Pfam-A المصنفة (أشرطة خضراء وخضراء فاتحة) وعائلات Pfam-B (أشرطة صفراء وخفيفة صفراء). يتم تجميع نسبة صغيرة من المجالات الغشائية متعددة التنظير على أساس تشابه تسلسلها (الأشرطة الرمادية). للحصول على اختصارات الجينوم ، انظر المواد والأساليب.

قمنا بتصنيف مجالات الغشاء متعدد التنظير إلى Pfam-A و Pfam-B وعائلات مجمعة ذاتيًا. يوضح الشكل 4 ب توزيع هذه الأنواع الثلاثة من العائلات في جميع الجينومات. تنتمي معظم مجالات الغشاء متعدد التنظير المصنفة إلى Pfam-A و Pfam-B ، والتي تغطي 95 ٪ من المجالات المصنفة.

تمت دراسة مجالات الغشاء متعدد التنظير المصنفة وعائلاتها فيما يتعلق بعدد ORFs في كل جينوم. يوضح الشكل 5 أ عدد المجالات الغشائية متعددة النسق المصنفة مقابل عدد ORFs في جميع الجينومات ، ويظهر الشكل 5 ب نفس العلاقة في جينومات الكائنات وحيدة الخلية. يبدو أن هناك علاقة خطية تقريبية بين عدد مجالات الغشاء متعدد التنظير المصنف وعدد ORFs في كل جينوم. ومع ذلك ، من المثير للاهتمام أن C. ايليجانس هو منعطف واضح في هذا الاتجاه. لمحاولة شرح ذلك ، ألقينا نظرة فاحصة على أكبر عائلات نطاقات الغشاء متعدد التنظير في C. ايليجانس (الشكل 5 ج). أكبر ثلاث عائلات في C. ايليجانس هي PF01604 و PF01461 و PB000009 ، والتي توصف بأنها عائلات مستقبلات كيميائية 7-TM. (التعليق التوضيحي لـ PB000009 مأخوذ من PD000148 في Prodom [21].) هذه العائلات تكاد تكون فريدة من نوعها ايليجانس ، لأن معظم أعضائها في Pfam هم من C. ايليجانس. تحتوي هذه العائلات على مجالات غشاء مضخمة جيدًا ، بأعداد إجمالية قدرها 289 و 250 و 216 على التوالي. هذه الأرقام هي أكثر من ضعف أكبر عائلة في ذبابة الفاكهة سوداء البطن، وهو PF00083 (سكر (وغيره) ناقلة) مع 108 أعضاء. من خلال إزالة عدد البروتينات في هذه العائلات الثلاث (ما مجموعه 754) ، يمكننا أن نرى ملاءمة أفضل لـ C. ايليجانس لخط الاتجاه. لذلك من المحتمل أن يكون السبب في العدد الكبير غير المعتاد من مجالات الغشاء متعدد التنظير هو تضخيم البروتين في عدد قليل من العائلات.

المجالات الغشائية متعددة التنظير المصنفة فيما يتعلق بعدد ORFs في الجينومات الـ 26 المدروسة. (أ ، ب) قطع عدد المجالات الغشائية متعددة النسق المصنفة مقابل عدد ORFs في (أ) جميع الجينومات المدروسة و (ب) في جينومات الكائنات وحيدة الخلية. خطوط الاتجاه ، على الرغم من إنشائها على أساس البيانات في كل مخطط ، لها نفس المنحدر تقريبًا. يشير CE * باللون الأحمر إلى عدد مجالات الغشاء متعدد النسق المصنفة في C. ايليجانس بعد إزالة عائلات المستقبلات الكيميائية السبعة TM الكبيرة (انظر (ج)). (ج) العشرة الأوائل من مجالات الغشاء متعدد التنظير ، كما يحكم عليها حدوثها في C. ايليجانس. (د) رسم بياني لعدد العائلات المصنفة لمجالات الغشاء متعدد التنظير مقابل لوغاريتم عدد ORFs في كل جينوم.

تم دعم هذه الفرضية من خلال تحليل الشكل 5 د ، والذي يوضح عدد عائلات نطاقات الغشاء متعدد التنظير فيما يتعلق بعدد ORFs في الجينوم المدروس. يبدو أن عدد العائلات لها علاقة لوغاريتمية في جميع الجينومات المدروسة ، بما في ذلك C. ايليجانس. بشرط C. ايليجانس يحتوي على عدد كبير بشكل غير عادي من مجالات الغشاء متعدد التنظير ولكن عددًا طبيعيًا من العائلات ، فإن تضخيم مجالات الغشاء متعدد التنظير يقتصر على عدد قليل من العائلات.


استنتاج

لقد أوضحنا أن معظم مقاييس الكره للماء تصل إلى نفس المستوى من سعة فصل الببتيد (الأشكال 3 ، 4) ، وبالتالي ، فإن الطريقة التي تم بها إنشاء المقياس ليس لها تأثير مباشر على التجميع أو سعة الفصل (الأشكال 1 ، 3) . ومع ذلك ، إذا أدركنا على الإطلاق أن المقياس 14 الذي حدده Naderi-Manesh الذي طوره في عام 2001 [40] يؤدي إلى حد ما أداء أفضل من المقاييس الأخرى للكراهية للماء. نقترح قاعدة عامة للتجارب التجريبية التي تهدف إلى استخدام مقياس الكراهية للماء لتحديد الببتيدات بأجزاء عبر الغشاء من مجموعة من الببتيدات. يجب أن تكون قيمة مقاومة الماء للأرجينين والتيروزين أبعد ما تكون عن قيمة الغلوتامات ، بينما يجب أن تكون قيم الكراهية للماء لـ Asn و Asp و His و Lys في وسط المقياس (الشكل 8 ج). لاحظنا كذلك أن فصل تجمعات التسلسل المحددة بواسطة الهياكل الثانوية المعروفة هو أكثر احتمالا من فصل تجمعات التسلسل مع مجموعة من الهياكل الثانوية المشتقة من هضم السيليكو (الأشكال 3 ، 4) ، ولكن تجمعات التسلسل التجريبي المهضوم مع حلزوني وحبلا من الأفضل فصل المحتوى أو محتوى الغشاء ß-strand أو α-helix عن المجمعات الأخرى (الشكل 4). ومع ذلك ، فقد أدركنا عتبة S = 0.6 ، بغض النظر عن طبيعة المقياس ، والتي يدعمها نهج في السيليكو لتحسين المقياس (الشكل 7). بدورها ، تعتمد سعة الفصل على عدد المعلمات المحسوبة (ملف إضافي 3: الشكل S1) ، على الرغم من أننا أدركنا أن الكراهية المتناوبة للماء لديها أدنى سعة لفصل تجمع التسلسل (الشكل 5). بشكل ملحوظ ، لاحظنا أن اكتشاف خيوط ß في الببتيدات يمكن دعمه من خلال الكشف عن الببتيدات الخماسية (الشكل 6) لأنه تم اكتشاف مثل هذه الببتيدات في البركة الهيكلية وفي المجمعات الناتجة عن المحاكاة التجريبية المحاكاة (الجدول 7) . وبالمثل ، فقد لوحظت أنماط الأحماض الأمينية الخاصة بسلاسل ß عبر الغشاء (الجداول 6 ، 7) أو المحتوى العشوائي إلى حد كبير (الجدول 7). في المقابل ، بالنسبة لحمامات السباحة التي تتكون أساسًا من هياكل حلزونية ، يمكن اكتشاف حلزون α واحد محدد فقط للذوبان (الحلزون s) والغشاء (krtm-helix) (الجدول 7). تلخيصًا ، تعتمد جودة فصل تجمعات التسلسل بدلاً من ذلك على المعلمة المستخدمة في الحساب بدلاً من المقياس المستخدم ويمكن دعمها بالبحث عن نمط حمض أميني معين.


نتائج

تمت مقارنة مجالات الغشاء المتوقعة مع الطوبولوجيا المحددة تجريبياً التي تحسب لكل تسلسل:

النسبة المئوية للمخلفات المتوقعة بشكل صحيح (عامل الاتفاق) ، سحدده تشو وفاسمان (1978)

نسبة تطابق المقطع ، SM ، التي حددها Cserzo وآخرون. (1997).

قمنا بتحسين قطع مؤشر الكراهية للماء على مجموعة فرعية من 64 بروتينًا من المجموعة التي يستخدمها Rost وآخرون. (1995) (لم يتم استخدام التسلسلات 2MLT و GLRA_RAT و GPLB_HUMAN و IGGB_ STRSP و PT2M_ECOLI التي لم يتم العثور عليها في قواعد البيانات العامة). تم الحصول على أفضل النتائج عند الشرائح ذات نيو هامبشايرم تم تجاهل p & lt2. في المجموعة المكونة من 64 بروتينًا ، تم الحصول على عامل اتفاق قدره 88.24٪ ، مع معامل ارتباط 0.79 ونسبة تطابق المقطع 0.945.

من أجل اختبار خوارزمية PRED-TMR ، قمنا بجمع كل التسلسلات المتاحة المستخدمة في ثلاث أوراق بحثية حديثة (Rost وآخرون. ، 1995 ، 1996 سيرزو وآخرون. ، 1997) وتجاهل أولئك الذين لديهم أكثر من 25 ٪ من التماثل. تحتوي المجموعة الناتجة على 101 بروتين عبر غشاء غير متماثل في المجموع. تفاصيل النتائج التي تم الحصول عليها غير معروضة هنا ، ولكن يمكن تنزيلها مع قائمة تخصيصات مقطع الغشاء من http://o2.db.uoa.gr/PRED-TMR/Results/.

أعطت نتائج الاختبار على هذه المجموعة المكونة من 101 بروتينًا متوسطًا س من 88.83٪ ، أ ج 0.80 ونسبة تطابق المقطع SM تبلغ 0.954. بروتين واحد (1٪) له معامل ارتباط & lt0.4 و 10 لها ج & lt 0.6 (10٪). هذه الدرجات مماثلة لتلك التي تم الحصول عليها من خلال استبعاد البروتينات المستخدمة لتحسين قطع مؤشر الكراهية للماء (س = 87.81%, ج = 0.78 و SM = 0.943).

يوضح الجدول الثاني النتائج التي تم الحصول عليها بتطبيق PRED-TMR وخمسة طرق تنبؤ أخرى على مجموعة من 101 بروتين. بالنظر إلى معامل الارتباط ، وجد أن أداء PRED-TMR أفضل قليلاً من أفضل طريقتين ، PHDhtm و tmPRED ، في هذه المجموعة. فيما يتعلق بعامل الاتفاق ، يعمل PRED-TMR بطريقة مشابهة لـ tmPRED و TOPPRED ، بينما بالنسبة لنسبة تطابق المقطع فهو أسوأ قليلاً من PHDhtm ، وهو الأفضل.

على الرغم من الأخطاء الواردة في SwissProt ، يُعتقد أن المقارنة بين مناطق الغشاء المتوقعة والمناطق المشروحة ، في قاعدة البيانات بأكملها ، جديرة بالاهتمام. يمكن أن يكون بمثابة مجموعة اختبار مشتركة للخوارزميات التي تكشف (توقع) المجالات عبر الغشاء.

SwissProt ، الإصدار 35 ، يحتوي على 9392 متواليات غشائية بإجمالي 40672 منطقة غشاء. لم نتجاهل مقاطع غشاء الاختبار ذات النقاط النهائية غير المؤكدة كما فعلنا لإنشاء الإحصائيات. تُنتج خوارزمية PRED-TMR المطبقة على جميع البروتينات الموجودة في قاعدة بيانات SwissProt قيمًا أقل قليلاً لـ س و ج الدرجات وانخفاض أكبر في نسبة مباريات الجزء (س = 86.14, ج = 0.73 ، SM = 0.889) بالنسبة لمجموعة الاختبار المكونة من 101 بروتينًا المذكورة أعلاه. من بين 9392 بروتينًا ، يوجد 1710 (18٪) منها ج & lt 0.6.


شكر وتقدير

بفضل Jinfeng Liu (كولومبيا) للمساعدة في الكمبيوتر وجمع مجموعات بيانات الجينوم وإلى Jinfeng Liu و Dariusz Przybylski (كولومبيا) لتوفير المعلومات والبرامج الأولية. شكر خاص لفولكر إيريش (كولومبيا) لإتاحة خادم META-PredictProtein! عمل ب. كان مدعومًا بالمنح 1-P50-GM62413-01 و RO1-GM63029-01 من المعاهد الوطنية للصحة. أخيرًا وليس آخرًا ، شكرًا لجميع الذين قاموا بإيداع بياناتهم التجريبية في قواعد البيانات العامة ، ولأولئك الذين يحتفظون بقواعد البيانات هذه.

تم تحمل تكاليف نشر هذا المقال جزئيًا عن طريق دفع رسوم الصفحة. لذلك يجب وضع علامة "إعلان" على هذه المقالة وفقًا للمادة 18 USC القسم 1734 فقط للإشارة إلى هذه الحقيقة.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


E & # x0017D و VS و MN: وضع المفاهيم. KV و VS: المنهجية والتحليل. KV: البرمجيات والتصور. KV و VS و E & # x0017D: تحقيق. KV و E & # x0017D: كتابة & # x02014 إعداد المسودة الأصلية. MN و VS: كتابة & # x02014 مراجعة وتحرير. VS: الإشراف. MN: إدارة المشروع. MN و E & # x0017D: اكتساب التمويل. قرأ جميع المؤلفين النسخة المنشورة من المخطوطة ووافقوا عليها.

تم تمويل هذا البحث من قبل وكالة الأبحاث السلوفينية ، منحة برنامج ARRS P1-0017 (بقيادة MN) و P1-0140 (بقيادة الأستاذ B. Turk).


ما هي مقاييس مقاومة الماء الأفضل للكشف عن مناطق الغشاء ، ولماذا؟ - مادة الاحياء

50 عامًا من مقاييس مقاومة الماء للأحماض الأمينية: إعادة النظر في القدرة على تصنيف الببتيد

Stefan Simm I Jens Einloft II Oliver Mirus I Enrico Schleiff III ، *

قسم العلوم البيولوجية ، بيولوجيا الخلايا الجزيئية للنباتات ، جامعة جوته ، شارع ماكس فون لاو. 9 ، 60438 فرانكفورت / ماين ، ألمانيا
II المعلوماتية الحيوية الجزيئية ، مجموعة التميز في فرانكفورت "مجمعات الجزيئات الكبيرة" ، معهد علوم الكمبيوتر ، كلية علوم الكمبيوتر والرياضيات ، جامعة جوته ، فرانكفورت ، روبرت ماير- Str. 11-15 ، 60325 فرانكفورت / ماين ، ألمانيا
III قسم العلوم البيولوجية ، بيولوجيا الخلايا الجزيئية للنباتات ، مجموعة التميز في فرانكفورت (CEF) ومعهد بوخمان لعلوم الحياة الجزيئية (BMLS) ، جامعة جوته ، شارع ماكس فون لاو. 9 ، 60438 فرانكفورت / ماين ، ألمانيا

معرفتي: كثيرًا ما تُحلل الخواص الفيزيائية والكيميائية لتوصيف تسلسل البروتين ذي الوظيفة المعروفة وغير المعروفة. غالبًا ما تستخدم خاصية كره الماء للأحماض الأمينية للتنبؤ الهيكلي أو للكشف عن الغشاء المرتبط أو المدمج & # 946 - الصفائح و & # 945 - القفزات. لهذا الغرض ، تم تحديد العديد من المقاييس التي تصنف الأحماض الأمينية وفقًا لخصائصها الفيزيائية والكيميائية على مدى العقود الماضية. في موازاة ذلك ، تم تحديد العديد من معلمات كارهة الماء لحساب خصائص الببتيد. قمنا بتحليل أداء فصل أحواض التسلسل باستخدام 98 مقياسًا للكارهة للماء وخمسة معلمات مختلفة للكارهة للماء ، وهي الكراهية الكلية للماء ، واللحظة الكارهة للماء للكشف عن & # 945-حلزوني و & # 946-شرائح الغشاء ، التناوب الكارهة للماء ودقيق & # 946 درجة ستراند.
النتائج: معظم المقاييس قادرة على التمييز بين الغشاء و # 945-helices و transembrane & # 946 -sheets ، لكن تخصيص الببتيدات لأحواض الببتيدات القابلة للذوبان ذات الهياكل الثانوية المختلفة لا يتحقق بنفس الجودة. تعتبر سعة الفصل كمقياس للتمييز بين العناصر الهيكلية المختلفة أفضل من خلال استخدام خمسة معلمات مختلفة للكارهة للماء ، ولكن إضافة التناوب الكارهة للماء لا تقدم فائدة كبيرة. يُظهر النهج التطوري في السيليكو أن المقاييس لها حدود في سعة الفصل مع عتبة قصوى تبلغ 0.6 بشكل عام. لاحظنا أن المقاييس المشتقة من النهج التطوري حققت أداءً أفضل في فصل تجمعات الببتيد المختلفة عندما كانت قيم الأرجينين والتيروزين مختلفة إلى حد كبير عن قيمة الغلوتامات. أخيرًا ، يمكن دعم فصل تجمعات البنية الثانوية عن طريق مقاومة الماء من خلال أنماط محددة يمكن اكتشافها لأربعة أحماض أمينية.
استنتاج: يمكن افتراض أن جودة قدرة الفصل لمقياس معين تعتمد على التباعد بين قيمة مقاومة الماء لبعض الأحماض الأمينية. بغض النظر عن ثروة مقاييس الكره للماء ، لا يوجد مقياس يفصل بين جميع أنواع الهياكل الثانوية المختلفة أو بين الببتيدات القابلة للذوبان وعبر الغشاء مما يعكس أن الخصائص الأخرى غير الكارهة للماء تؤثر على تكوين البنية الثانوية أيضًا. ومع ذلك ، فإن تطبيق مقاييس كره الماء يسمح بالتمييز بين الببتيدات ذات الغشاء & # 945-helices و & # 946 -sheets. علاوة على ذلك ، يمكن مساعدة درجة سعة الفصل الإجمالية البالغة 0.6 باستخدام معلمات مختلفة للكراهية للماء من خلال البحث عن نمط على مستوى تسلسل البروتين لببتيدات محددة بطول أربعة أحماض أمينية.

الكلمات الدالة: مقياس مقاومة الماء ، صفائح ترانسيمبرين ، حلزون ترانسيمبرين ، لوح بيتا ، نمط الأحماض الأمينية ، كاره الماء البديل

كثيرا ما تستخدم مقاومة الماء كخاصية فيزيائية كيميائية لوصف الهياكل الثانوية للبروتينات. في وقت مبكر ، لوحظ أن هذه الخاصية للأحماض الأمينية تهيمن على التفاعلات الأولية أثناء طي البروتين [1 ، 2]. بالإضافة إلى ذلك ، تعتمد الخواص الفيزيائية والكيميائية للبنى الثانوية على خصائص أحماضها الأمينية وتختلف فيما يتعلق بالبيئة الأصلية للبنية الثانوية ، على سبيل المثال ، في المحلول أو في الأغشية [3-5]. بالنظر إلى ذلك ، ليس من المستغرب أن تصنيف وتوصيف الأحماض الأمينية وفقًا لرهابها المائي قد جذب الكثير من الاهتمام.

في عام 1962 تمت صياغة أول مقياس للكارهة للماء للأحماض الأمينية [6]. بالإضافة إلى ذلك ، تم إنشاء أول نموذج لحساب الفرق في الطاقة الحرة للشكل الأصلي وغير المطوي من بروتين الكاتلاز في المحلول [6]. منذ أن تم نشر العديد من "مقاييس كره الماء". ومع ذلك ، لا تركز كل هذه المقاييس حصريًا على مقاومة الماء ، لكننا سنواصل استخدام هذا المصطلح. تم استخلاص المعلومات حول كره الماء للأحماض الأمينية من التجارب البيوكيميائية [7] ، وتوزيعات الأحماض الأمينية في فئات بروتينية مختلفة [8 ، 9] ، وقدرة الأحماض الأمينية على المشاركة في بيئة كارهة للماء أو محبة للماء [10 ، 11] أو من في حسابات السيليكو [12]. يوجد اليوم حوالي 98 مقياسًا للكره للماء والتي تحتوي على قيمة محددة للكارهة للماء لكل من الأحماض الأمينية العشرين. يمكن توقع وجود تباين كبير بين هذه المقاييس بسبب تباين الأساليب التجريبية الأساسية.

في الوقت نفسه ، تم تطوير العديد من معلمات مقاومة الماء لتصنيف الببتيد لأغراض محددة. تم تقديم الكراهية الكلية للماء لتصنيف الببتيدات عالميًا [6]. بالإضافة إلى ذلك ، لحظة كارهة للماء لاكتشاف مقاطع الغشاء الحلزوني [13] ، الكراهية المائية المتناوبة للكشف عن الغشاء المدمج & # 946 - ورقة [14 ، 15] أو درجة & # 946 - الدرجة (EBSS) مع مراعاة تواتر تم تحديد الأحماض الأمينية التي تشير إلى الداخل أو الخارج من برميل & # 946 [16].

في موازاة ذلك ، تم تطوير العديد من الخوارزميات والطرق البديلة للتنبؤ بخصائص البروتين بناءً على مقاييس مقاومة الماء وتصنيفها فيما يتعلق بالبيئة (القابلة للذوبان ، عبر الغشاء) أو الوظيفة. من بينها إجراءات روتينية للتنبؤ بالمناطق العابرة للغشاء [17-20] أو طي البروتين [21-25]. حتى اليوم ، غالبًا ما تُستخدم مقاييس مقاومة الماء لتحديد خصائص الببتيدات داخل البروتينات [26-29]. ومع ذلك ، فإن ثروة مقاييس كره الماء تعقد عملية اختيار المقياس والمعلمات المراد حسابها.

وهكذا ، بعد 50 عامًا من صياغة المقياس الأول ، قمنا بتحليل 98 مقياسًا مختلفًا للكره للماء موجودة في الأدبيات [22 ، 30 ، 31]. استخدمنا الكراهية الكلية للماء ، اللحظة الكارهة للماء للكشف عن & # 945-helical و & # 946- عناصر الغشاء الغشائي ، التناوب hydrophobicity و EBSS كمعلمات لتقييم تأثيرها على الفصل في برك البنية الثانوية المختلفة. لتحليل المقاييس والمعايير المختلفة ، قمنا بتطوير نهج إجماع خماسي الأبعاد لتحديد جودة الاستخدام التوليفي. أخيرًا ، قمنا بتجميع مقاييس hydropho-bicity لتصنيف أدائها لسعة الفصل العامة للهياكل الثانوية أو المواصفات البيئية أو مجموعات فرعية منها. وجدنا أن الأداء العام لمقاييس كره الماء يمكن مقارنته إلى حد ما بغض النظر عن استراتيجية التوليد. ومع ذلك ، فإن تطبيق أكثر من معلمة كارهة للماء يعزز قدرة فصل المسبح ، لكن التناوب الكارهة للماء له أقل تأثير على سعة الفصل عند مقارنته بالمعلمات الأربعة الأخرى. بشكل عام ، الكارهة للماء مناسبة لتصنيف الغشاء & # 945-helices و & # 946-الصفائح أفضل من الببتيدات مع الهياكل الثانوية الأخرى. ومع ذلك ، تم تحديد نمط معين من أربعة أو خمسة أحماض أمينية في مجموعات الببتيد المختلفة التي تم تحليلها.

نتائج ومناقشة

تجمعات التسلسل ، ومقاييس مقاومة الماء واختيار المعلمات

تم إنشاء أحواض تسلسلية مختلفة لدراسة قدرة الفصل لمقاييس مقاومة الماء ومعلمات كثافة الماء. تحقيقا لهذه الغاية ، تم استخراج تسلسل البروتينات ذات البنية المعروفة من قاعدة بيانات ASTRAL40 (http://scop.berkeley.edu/astral/) [32] وتم تشريحها في تسلسلات باستخدام & # 945-helical، & # 946 -sheet ومحتوى ملف عشوائي (عشوائي). تم فصل التسلسلات & # 945-helical و & # 946 -sheet بشكل أكبر في تجمعات تمثل مقاطع الغشاء (tm-sheet ، tm-helix) وقابلة للذوبان (s-sheet. s-helix مشروحة على أنها حشوية). بعد ذلك ، تم توسيع بركتي ​​الغشاء الفرديين الصغيرين بجولة واحدة من انفجار psi باستخدام التسلسلات ذات المعلومات الهيكلية كطعم. تم إجراء Psi-blast لمجموعتي البيانات الصغيرتين باستخدام تسلسلات الهياكل الثانوية المعروفة فقط للوصول إلى زيادة في التسلسلات المتشابهة للغاية من تجمعات تسلسل الطعم. لمنع الإفراط في تجهيز المجمعين ، تم إجراء تصفية للتسلسلات الزائدة عن الحاجة والمتشابهة (& gt95٪ تسلسل الهوية). كان هذا النهج مطلوبًا لتجنب القطع الأثرية من خلال مقارنة أحجام مختلفة بشكل كبير وكثافات الببتيد. خلاف ذلك ، قد ينتج عن الحجم الصغير قيمة فصل جيدة غير مبررة. لم يتم توسيع المجمعات الثلاثة الأخرى (عشوائي ، حلزون ، ورقة s) مما أدى إلى رقم التسلسل النهائي لمجموعات الهياكل الثانوية الخمسة المختلفة (tm-sheet ، tm-helix ، s-sheet ، s-helix ، عشوائي) (الجدول 1 ملف إضافي 1: الجدول S1 ، ملف إضافي 2: الجدول S2).

تيقادرة 1 تسلسل برك على أساس تشريح الهيكل الثانوي

تحتوي جميع الببتيدات على حد أدنى من عشرة أحماض أمينية مطلوبة للتحليل القائم على EBBS. تحتوي الأحواض القابلة للذوبان على الببتيدات فقط مع SSE المحدد ، بينما تحتوي أحواض الغشاء العابرة على كل من الببتيدات مع SSE المحدد فقط ومع SSE المحدد والأحماض الأمينية الإضافية للوصول إلى طول عشرة أحماض أمينية

علاوة على ذلك ، قمنا بتنفيذ خلاصة في السيليكو تربتيك [K (Lysine) / R (Arginine)] لقاعدة بيانات ASTRAL40 [32] بأكملها. من ناحية أخرى ، ينتج عن هذا النهج المد والجزر بمحتوى هيكلي مختلط. من ناحية أخرى ، على أساس هذه الببتيدات ، أردنا اختبار ما إذا كان يمكن استخدام الببتيدات التي تم تحديدها من خلال مناهج قياس الطيف الكتلي التي يتم إنشاؤها عادةً عن طريق الهضم التربيني لتحديد طوبولوجيا البروتينات. تم تصنيف هذه التسلسلات وفقًا لعناصر البنية الثانوية (SSE) المستمرة (ورقة dc ، dc-helix ، dc-random) أو المتقطعة (dd-sheet ، dd-helix ، dd-ran-dom). يتم تجميع الببتيدات دون سيطرة SSE فيما يتعلق بنصيبها من SSE المختلفة (بدون حلزون ، بدون ورقة ، لا عشوائي ، الكل). بالإضافة إلى ذلك ، تم تجميع التسلسلات التي تحتوي على محتوى غشاء الإرسال بشكل فردي من أجل اللولب والصفائح SSE (krtm-helix ، krtm-sheet ، الجدول 2). بدمج المجمعات الناتجة عن عملية الهضم التجريبي بالسيليكو أو استنادًا إلى مناهج البنية الثانوية المعروفة ، انتهى بنا الأمر مع 17 تجمعًا متسلسلًا مختلفًا. يحتوي كل من مجموعات التسلسل السبعة عشر المختلفة على عدد منفصل من التسلسلات (الجدولان 1 و 2).

تيقادرة على 2 حمامات التسلسل القائمة في silico K / R- الهضم

تحتوي جميع الببتيدات على حد أدنى من عشرة أحماض أمينية (AA). تهيمن SSE على محتوى SSE أكبر من 70٪ من إجمالي AA. يعني المستمر أن هذا SSE بدون فجوة

TM الغشاء. التسمية هي كما يلي: العاصمة الببتيد المشتق من هضم السيليكو التربتي مع عنصر هيكلي مستمر ، ي الببتيد المشتق في هضم السيليكو التربتي مع عنصر هيكلي متقطع ، كرتم الببتيد المشتق من هضم السيليكو تربتيك (كر) مع جزء عبر الغشاء

بعد جمع أحواض الاختبار ، تم استخراج مقاييس مختلفة من الكراهية للماء من الأدبيات (الجدولان 3 ، 4 ، ملف إضافي 1: الجدول S1). تغطي المقاييس المختارة البالغ عددها 98 المقاييس المطورة تجريبياً والمقاييس المحسوبة وكذلك المقاييس التي تم إنشاؤها عن طريق تحسين المقاييس الموجودة مسبقًا. بالإضافة إلى ذلك ، فإن ثمانية مقاييس تمثل المقاييس الرقمية الجبرية العكسية لمقاييس أخرى لاختبار ما إذا كان الرقم الجبري له تأثير على النتائج.

تيقادرة 3 مقاييس مقاومة للماء محسوبة ومقلوبة

تظهر فئة المقياس (العمود 1) ، ومعرف مقياس الكراهية للماء (العمود 2) سنة النشر (العمود 3) ، واسم المؤلفين (العمود 4) واسم المقياس (العمود 5) )

تيقادرة على 4 مقاييس تجريبية للكراهية للماء

يظهر معرّف مقياس مقاومة الماء (العمود 1) وسنة النشر (العمود 2) واسم المؤلفين (العمود 3) واسم المقياس (العمود 4) والمرجع ذي الصلة الذي تم استخلاص المقياس منه

للتحقيق في قدرة الفصل لمقاييس كره الماء المختارة في أحواض التسلسل المحددة المختلفة ، تم تحديد خمس معلمات قياس (الجدول 5). تعتبر EBSS [16] ، والتناوب الكارهة للماء [14 ، 15] والعزم الكارهة للماء المحسوبة للصفائح & # 946 بزاوية 180 درجة [13] علامات مميزة للمحتوى الكارهة للماء ، بينما العزم الكارهة للماء محسوبة لـ & # 945-helices [14] ومتوسط ​​كره الماء [33] يُستخدمان لتحديد & # 945 - مناطق الغشاء الحلزونية (العزم الكارهة للماء & # 945). تم حساب كل من المعلمات في نافذة منزلقة من عشرة أحماض أمينية. تم اعتبار أكبر وأصغر قيمة لكل ببتيد على النحو المبين أدناه.

الجدول 5 معلمات الكراهية للماء

الموضح هو الفهرس (العمود 1) ، الاسم (العمود 2) ووصف معلمات كارهة الماء المستخدمة (العمود 3). الوصف يساوي الحد الأدنى والحد الأقصى لمعلمة مقاومة الماء المستخدمة

علاقة مقاييس كره الماء

قمنا بتجميع مقاييس مقاومة الماء من خلال مقارنة قيمة مقاومة الماء لكل حمض أميني مع بعضها البعض. تم تحليل التباين في مقاييس كره الماء المختلفة من خلال ارتباط بيرسون. قيم oكان لديناإد لحساب الاختلاف لإنشاء طريقة مجموعة زوج غير مرجح مع شجرة متوسط ​​حسابي (UPGMA) لمقاييس كره الماء عبر MEGA6 [34]. تم استخدام الشجرة لتجميع تلك المقاييس إلى مجموعات من سلوك قيمة الأحماض الأمينية المماثلة التي تحدد عتبة (الشكل 1 ، ملف إضافي 2: الجدول S2). تم فحص شجرة UPGMA الخطية لمقاييس الكراهية المائية 98 لتقسيم المقاييس في مجموعات باستخدام عتبة اختلاف أقصى قدره 0.05. تم تسمية المجموعات التي تم إنشاؤها أبجديًا. تم وضع دائرة حول شجرة UPGMA لإعطاء لمحة عامة عن جميع مقاييس مقاومة الماء الـ 98 وموضعها في لمحة (الشكل 1).

Fig. 1 تجميع جداول مقاومة الماء. تظهر شجرة UPGMA لمقاييس مقاومة الماء المجمعة بناءً على مسافات قيمة الأحماض الأمينية الطبيعية (انظر قسم "الطرق"). يتم تجميع جداول مقاومة الماء في مجموعات إلى z) ضمن تشابه أكبر من 0.07

كما هو متوقع ، فإن مقاييس كره الماء الناتجة عن قلب مجموعة قيم الأحماض الأمينية مع المقاييس الأصلية (الجدول 3). ومع ذلك ، ليست كل مقاييس كره الماء التي تم إنشاؤها بواسطة نفس النهج التجريبي أو من قبل نفس المؤلف تجمع معا (الجدول 4). أبرز الأمثلة هي (1) المقاييس التي أنشأها جونز (المقاييس 29 ، 63 JONES ، JOND750101 الكتلة K) [35] والتي عدلت مقياس Zimmerman (المقياس 69 ZIMJ680101 الكتلة J) [36] من خلال النظر في القيم المشتقة التجريبية (المقياس 54 ، مجموعة تانفورد أ) [37] أو (2) المقاييس التي اقترحها زفيلينج (المقاييس 89-91 SET1-3 المجموعة الأولى) [12] والتي تستند إلى مقاييس Kyte و Doolittle (المجموعة B) [38] و إنجلمان (المجموعة أ) [39].

حساب سعة الفصل لمقاييس مقاومة الماء

بعد ذلك قمنا بتحليل قدرة مقاييس 98 كارهة للماء لفصل 17 تجمع تسلسلي محدد. استند التحليل الأولي إلى جميع معايير مقاومة الماء الخمسة. لكل معلمة تم حساب القيمة القصوى والدنيا لكل ببتيد (الجدول 5). ومع ذلك ، فقد أدركنا أن التطبيق المتزامن للقيمة الدنيا والقصوى لنفس المعلمة لا يزيد من أداء الفصل. من خلال هذا ، نحد من اختيار المعلمة إما الحد الأدنى أو الحد الأقصى للقيمة. قمنا بحساب 32 مجموعة معلمة (خمسة معلمات وقيمة متبادلة الحد الأدنى والحد الأقصى) لكل ببتيد لجميع مقاييس الكره للماء البالغ عددها 98. تم استخدام المتجهات الخماسية الأبعاد الناتجة لكل ببتيد وكل مقياس كارهة للماء لتحديد السحب الخماسية الأبعاد لكل تجمع ولكل مقياس كارهة للماء.

لتحليل سعة الفصل (الشكل 2 ، يمين) لمقياس بين غيمتين من مجموعات التسلسل ، قمنا بحساب حجم التداخل (الشكل 2 ، يسار) وعدد الببتيدات داخل التداخل (الشكل 2 ، الوسط) . حجم حجم التداخل وعدد الببتيدات داخل حجم التداخل يرتبط سلبًا بقدرة الفصل لمجموعتي التسلسل. علاوة على ذلك ، قمنا بتعريف "المغلف المحدب" كما هو موضح في قسم "الطرق". بعد ذلك أزلنا جميع الببتيدات ، التي هي جزء من الغلاف المحدب. أعدنا حساب أحجام التجمعات وكررنا الخطوة الأخيرة من الروتين مع المجلدات الجديدة. تم إجراء إزالة الببتيدات على الغلاف المحدب لأن وجود عدد قليل فقط من الببتيدات في مكان بعيد عن الببتيدات الأخرى يمكن أن يزيد الحجم بشكل كبير. في حالة وضع الببتيدات بالقرب من الآخرين ، لم يتغير الحجم بشكل كبير ، وبالتالي ، أدت هذه الخطوة إلى تحسين موثوقية تخصيص غالبية الببتيدات.

الصورة 2 مخطط التهديف. الموضح هو مخطط تسجيل النقاط للفصل بين مجموعتين متتاليتين. كلا حمامات التسلسل (رمادي غامق منطقة، رمادي المنطقة) بناء سحابة. تداخل كلا الغيمتين (رمادي فاتح المنطقة) وكذلك التسلسلات (بالخط العريض نقاط) في هذا التداخل لحساب سعة الفصل. تمثل الدائرة المحيطة بكلتا الغيوم حجم الطبقة الخارجية

بعد ذلك ، حددنا درجة سعة الفصل (الصيغة 1) لتصنيف جميع السيناريوهات. سالخامس هي درجة تعتمد على حجم التداخل فيما يتعلق بأحجام الغيمتين. بالنسبة لـ S.ص قمنا بحساب جميع الببتيدات في الحجم المتداخل لمجموعتين متتاليتين وقمنا بتعيينهما بالنسبة لجميع الببتيدات في الغيمتين. يتم قياس الدرجة S بين صفر (كلتا الغيوم متداخلة تمامًا) وواحدة (لا توجد ببتيدات في الحجم المتداخل) وتعطي جودة مقياس معين للكره للماء لفصل بين بركتين محددتين.

فورمولا 1 درجة قدرة الفصل

هنا ، P1 و ص2 هي إجمالي عدد الببتيدات في الببتيدات 1 و 2 ، Pاوف هو عدد جميع التسلسلات في حجم التداخل ، V1 و V.2 هي الأحجام المحددة بواسطة تجمعات التسلسل 1 و 2 و V.اوف هو الحجم المتداخل لكلا البركتين. عدد V.أنا و صأنا كان دائمًا i = 2 لأنه تم تحليل مجموعتين على التوازي.

تم حساب قيمة S العامة لكل مقياس لتجمعات التسلسل بناءً على تشريح الهيكل الثانوي (الجدول 1 الشكل 3 أ ، الخط البرتقالي) ، تجمعات التسلسل المتولدة في هضم السيليكو (الجدول 2 الشكل 3 أ ، الخط الأزرق) وكلاهما معًا ، تجمعات التسلسل على أساس تشريح الهيكل الثانوي وتجمعات التسلسل المتولدة في هضم السيليكو (الشكل 3 أ ، الخط الأخضر: مختلط). في حين أن جميع المقاييس تؤدي أداءً مشابهًا للمسبح المشتق عن طريق الهضم أو عن طريق الجمع بين جميع البرك ، تم العثور على تمييز لبركة "الهيكل". أفضل ثلاثة مقاييس للكراهية للماء هي 14 و 15 (NADH010102 و NADH010103 الجدول 4) [40] و 82 (جدول NNEIG 3) [41]. المقياسان 14 و 15 عبارة عن مقاييس تجريبية للطب المائي وتستند إلى قيم المعلومات الذاتية لنموذج ذو حالتين مع إمكانية الوصول إلى سطح البروتين بنسبة 9 و 16 ٪. مقياس 82 هو تحسين لمقياس Sweet and Eisenberg من عام 1983 [42] باستخدام القيم الذاتية لمصفوفة أقرب مجاور طبيعية.

Fig. 3 فصل المسابح بمقاييس مقاومة الماء. أ الموضح هو قيمة الفصل الإجمالية لكل مقياس كارهة للماء للهيكل الثانوي (البرتقالي)، في هضم السيليكو التربتي (أزرق) ومختلط (لون أخضر) تسلسل تجمعات كمنطقة مؤامرة. يتم فرز مقاييس مقاومة الماء من أعلى إلى أدنى قيمة. ب نفس الشيء كما في أ ولكن يتم حساب قيمة الفصل لمجموعة مقاييس مقاومة الماء

بالتوازي مع ذلك ، تم حساب متوسط ​​قيمة S لمجموعات مقاييس مقاومة الماء (الشكل 1) المحددة وفقًا لشجرة UPGMA (الشكل 3 ب). لا تُظهر قيم S المتوسطة التي تم ملاحظتها لحمامات الببتيد التي تم الحصول عليها في هضم السيليكو التربتي (الشكل 3 ب ، الأزرق) أو عن طريق الجمع بين تجمعات الببتيد الناتجة عن الاستراتيجيتين (الشكل 3 ب الأخضر) اعتمادًا على المجموعة المحددة. فقط بالنسبة لمجمعات الببتيد الهيكلية الثانوية ، تختلف قيم S المتوسطة الملحوظة بين 0.28 للمجموعة B و 0.13 للمجموعة X. علاوة على ذلك ، بعد فرز المجموعات وفقًا لمتوسط ​​قيم S لمجمعات الببتيد الهيكلية الثانوية ، لا يتبع ترتيب المجموعات الترتيب في شجرة UPGMA (الشكل 3 ب ، برتقالي).

فصل برك بنية محددة عن طريق مقاومة الماء

دفعتنا قدرة الفصل المعتدلة لجميع مقاييس الكراهية المائية باستخدام جميع مجموعات التسلسل السبعة عشر إلى فحص الفصل بين أزواج تجمع التسلسل الفردي. تم توضيح النتائج لقيمة الفصل لأفضل مقياس أداء 14 [40] (الشكل 4 أ) بالإضافة إلى سعة الفصل القصوى من جميع مقاييس الكارهة للماء البالغ عددها 98 لكل مجموعة تجمع متسلسل مزدوج (الشكل 4 ب). على الصعيد العالمي ، تكون قيم S التي تم الحصول عليها لفصل البركة الزوجي بسعة الفصل القصوى من بين جميع مقاييس الكراهية المائية 98 (الشكل 4 ب) أكبر بشكل عام من قيم S التي تم الحصول عليها باستخدام المقياس الأفضل أداء 14 فقط.

Fig. 4 قدرة فصل تجمعات تسلسلية محددة. الموضح هو سعة الفصل الزوجي للمقياس 14 (أ) وللحصول على أفضل قيمة لأي من جميع مقاييس مقاومة الماء كمؤامرة رادار (ب) مع التركيز على قدرة الفصل أقل من 0.4 (اليسار) وما فوق 0.4 (حق). كل خط يمثل تجمعًا واحدًا ، حيث يتم تمثيل الفصل بين جميع التجمعات الأخرى وفقًا لـ رمز

بالتفصيل ، فإن التجمعات الثلاثة ذات الغشاء & # 945-helix (krtm-helix) ، مع الغشاء & # 946 -sheet (krtm-sheet) أو بدون محتوى عشوائي للملف (غير عشوائي) الناتجة عن الهضم لها أكبر قيمة S بينما تحليل التداخل مع مجمعات التسلسل الأخرى ، بصرف النظر عما إذا كان المقياس الأفضل (الشكل 4 أ) أو أفضل قيمة (الشكل 4 ب) قد أخذ في الاعتبار. على النقيض من ذلك ، تُظهر تجمعات الغشاء المرنة للهيكل الثانوي (tm-sheet ، tm-helix) قيم S منخفضة أثناء تحليل التداخل مع التجمعات الأخرى. ومع ذلك ، فإن قيم S لأحواض الغشاء ذات البنية الثانوية أكبر من قيم S الموجودة أثناء تحليل التداخل بين تجمعات التسلسل المتبقية (الشكل 4 ب).

بشكل ملحوظ ، تم العثور على قيم S عالية عند التداخل بين بركتي ​​غشاء الإرسال الهيكلي الثانوي (tm-sheet ، tm-helix) وثلاث حمامات مع الغشاء & # 945-helix (krtm-helix) ، مع الغشاء & # 946 - تم حساب ورقة (krtm-sheet) أو بدون محتوى ملف عشوائي (غير عشوائي) ناتج عن الهضم. قد يشير هذا إلى أن المناطق المحيطة بمجال الغشاء الموجود في تسلسل تجمعات الببتيد الناتجة عن الهضم توفر معلومات إضافية. قد تعطي هذه المعلومات بالاشتراك مع كره الماء توقيعًا إضافيًا لمثل هذه المجالات. ومن ثم ، في هضم السيليكو مع التحليل اللاحق بواسطة المعلمات الموصوفة باستخدام على سبيل المثال يمكن استخدام مقياس الرهاب المائي 14 للكشف عن حلزونات الغشاء والألواح.

فيما يتعلق بالمجمعات المتبقية ، لاحظنا أن قيمة S التي تم الحصول عليها أثناء تحليل تداخل تجمعات الهياكل الثانوية (s-sheet و s-helix و random) أعلى عند مقارنتها بالمجمعات التي تحتوي على تسلسلات ذات هياكل مختلطة (الشكل 4 أ ، ب). هذه النتيجة متوقعة ، حيث تكتشف المعلمات المختارة العناصر الفردية ويؤدي مزيج منها إلى الحصول على معلومات مختلطة.

وبالتالي ، قمنا بتحليل أداء المعلمات الفردية للكارهة للماء واستخدام النهج متعدد الأبعاد. لقد أدركنا أن قيمة S تعتمد بشكل أكبر على توليفة معلمة hydropho-bicity في متجه متعدد الأبعاد أكثر من اعتمادها على مقياس كاره للماء (ملف إضافي 3: الشكل S1).

بما في ذلك أعلى 5٪ من جميع السيناريوهات لفصل بركتين عن بعضهما البعض (الشكل 5 أ) ، يختلف تأثير المعلمة المختلفة اختلافًا كبيرًا (الشكل 5 ب). يصبح من الواضح أن متوسط ​​الكراهية للماء و EBSS لهما التأثير الأقوى على جودة الفصل ، في حين أن الكراهية المائية المتناوبة التي كان يعتقد سابقًا أنها تتعرف على الغشاء الغشائي على وجه التحديد & # 946 - الخيوط [14 ، 15] لها أقل تأثير على الفصل. فقط بالنسبة للحالة المختلطة ، لاحظنا أن التناوب مع الماء ليس له أي تأثير على الإطلاق. وبالتالي ، فإن الأداء العام يعتمد على جميع المعلمات وإن كان إلى حد مختلف.

Fig. 5 تأثير معامل الكراهية للماء للفصل. أ الموضح هو النسبة المئوية للسيناريوهات التي تصل إلى قيم فصل محددة لجميع تجمعات التسلسل بما في ذلك القيم المتطرفة (خط متقطع) وبدون القيم المتطرفة (خط الصلبة). ال خط منقط يُظهر أفضل 5٪ مفصولة من جميع السيناريوهات ويعمل كقيمة هامشية لاكتشاف العتبة لتحليل تأثير معلمة الكراهية المائية المختلفة للفصل. ب الموضح هو التأثير على فصل المعلمات العشر للكارهة للماء (الجدول 5) لمجمعات التسلسل القائمة على الهيكل الثانوي (أسود)، تجمعات التسلسل الناتجة عن الهضم (أبيض) والجمع بين الاثنين (الرمادي). يتم إقران معلمات الكراهية للماء (الحد الأقصى ، الحد الأدنى). يُحسب تأثير الفصل كقيمة مطلقة للفرق بين التردد المرصود والمتوقع لأفضل 5٪ من السيناريوهات المنفصلة (الشكل 5 أ)

بينفع نمط الأحماض الأمينية لفصل تجمعات بنية محددة

تم النظر لاحقًا في نهج قائم على الأحماض الأمينية لتجمعات الهياكل المختلفة بالإضافة إلى الفصل القائم على مقاومة الماء. في البداية تم تحليل تركيبة الأحماض الأمينية للأحواض المختلفة ، والتي لم تسفر عن فرق كبير بين التجمعات الفردية (ملف إضافي 4: الجدول S3).

وهكذا ، تم تحليل حدوث أنماط الأحماض الأمينية من اثنين إلى خمسة من الأحماض الأمينية باستخدام نهج سلسلة ماركوف (الشكل 6 قسم "الطرق"). جميعهم تقريبا (

80٪) اكتشفوا أنماط الأحماض الأمينية حتى أطوال ثلاثة تحدث في كل من مجموعات التسلسل المختلفة. ينخفض ​​عدد أنماط الأحماض الأمينية التي تحدث عالميًا والتي يبلغ طولها أربعة إلى 60٪. ينتج عن استطالة طول النمط إلى أكثر من خمسة أحماض أمينية تغطية أقل من 5٪ ، وبالتالي لا تكون مفيدة للفصل. وبالتالي ، فقد تم تحليل المظهر الحصري أو على الأقل التكاثر المفرط لأنماط الأحماض الأمينية المكونة من أربعة وخمسة أحماض أمينية في تجمعات التسلسل المتميز.

الشكل 6 توزيع أنماط الأحماض الأمينية. الموضح هو النسبة المئوية لحدوث جميع أنماط الأحماض الأمينية الممكنة ذات الطول المحدد في مجموعات التسلسل المختلفة. طول النموذج يختلف من 2 إلى 5. 2 AA دائرة سوداء 3 AA دائرة حمراء 4 AA المثلث الأخضر لأسفل 5 AA المثلث الأصفر

حددنا عدة ببتيدات من أربعة (الجدول 6 ملف إضافي 5: الجدول S4) وخمسة أحماض أمينية محددة أو على الأقل مخصبة في الببتيدات لمجموعة معينة (الجدول 7 ، ملف إضافي 6: الجدول S5). كشف تحليل تواتر حدوث هذه الببتيدات أن الأنماط التي تحتوي على أربعة أحماض أمينية محددة بشكل معتدل فقط لأن القليل منها فقط يكون أكثر تكرارًا بمقدار 50 ضعفًا على الأقل في تجمع معين عن بشكل عام (الجدول 6). في المقابل ، يمكن أن تكون الأنماط التي تحتوي على خمسة أحماض أمينية بمثابة عامل تمييز إضافي نظرًا لوجود أنماط ذات تردد أعلى بمقدار 500 ضعف في تجمع معين مقارنة بمجموعة التسلسل الكلي (الجدول 7). هذا صحيح بشكل خاص عند مقارنة مجموعات التسلسل التي تم إنشاؤها بواسطة نفس الإستراتيجية (الجداول 1 ، 2). لا يمكن أخذ هذه المعلومات إلا بالإضافة إلى معلمات الكراهية للماء ، لأن حدوث أنماط أحماض أمينية محددة في مجموعة بنية محددة واحدة مقارنة بجميع المجمعات كمرجع لم ينتج عنه قيمة p معدلة أقل من 0.05 لأي نمط من الأحماض الأمينية بطول خمسة. ومع ذلك ، يمكن دعم اكتشاف & # 946 - السلاسل في الببتيدات من خلال الكشف عن الببتيدات الخماسية YLVNM (ورقة تيار مستمر) و LTVTG و TLDGG (ورقة dd) و CGGSL و YGGVT (ورقة s). بشكل ملحوظ ، فإن الببتيدات الخماسية التي لوحظت للمجمع المشتق هيكليًا لا تتداخل مع الببتيدات الخماسية التي لوحظت للمجمع المشتق من السيليكو. تريب الهضم مما قد يوحي بأن الأخير يحتوي على مناطق محددة في نهاية الخصلة. علاوة على ذلك ، فإن أنماط الأحماض الأمينية الخاصة بالغشاء & # 946 - السلاسل هي SIGA (ورقة krtm ، الجدول 6) ، LYGKV ، PTLDL و SASAG (ورقة tm ، الجدول 7). بالنسبة للببتيدات ذات المحتوى العشوائي بشكل أساسي ، وجدنا أن S-GSSG-S أو SGPSS أو TILPL مخصب (عشوائي ، جدول dd عشوائي 7). في المقابل ، بالنسبة لحمامات السباحة التي تتكون أساسًا من الهياكل الحلزونية ، وجدنا نمطًا واحدًا محددًا من الببتيد الخماسي للأحواض الهيكلية مع & # 945-helix (s-helix EELKK) ولحوض الببتيدات مع الغشاء & # 945-helix ( جدول krtm-helix YVFFG 7). وبالتالي ، فإن الفرز المسبق لمجمعات التسلسل باستخدام أنماط الأحماض الأمينية قد يحسن جودة التصنيف.

تي6 أنماط من أربعة أحماض أمينية

معطى اسم تجمع التسلسل (العمود 1) وتسلسل الببتيد مع أعلى تكرار لحدوث (العمود 2) وتيرة حدوث هذا الببتيد (FO) في التجمع وفقًا (العمود 3) ، وتكرار حدوث هذا الببتيد في المجموعة التي تحتوي على جميع التسلسلات باستثناء المجموعة التي تم تحليلها (العمود 4) ، وتكرار حدوث هذا الببتيد في المجموعة التي تحتوي على جميع التسلسلات التي تم إنشاؤها بواسطة نفس الإستراتيجية (GBSS) مثل المجموعة التي تم تحليلها باستثناء تسلسل المجموعة التي تم تحليلها ( العمود 5). يُظهر الخط المائل الببتيدات التي لها تردد أعلى بمقدار 50 ضعفًا على الأقل ، فيما يتعلق بالمجموعات المتبقية (العمود 4) أو الببتيدات المتبقية الناتجة عن نفس الإستراتيجية (العمود 5). تم تمييز تسلسل الببتيد بقيم p أقل من 0.05 بعلامة النجمة

تيقادرة على 7 أنماط من الأحماض الأمينية من خمسة أحماض أمينية

معطى اسم تجمع التسلسل (العمود 1) والتسلسل مع أعلى تكرار لحدوث (العمود 2) وتكرار حدوث (FO) لهذا الببتيد في التجمع وفقًا (العمود 3) ، FO في التجمع الذي يحتوي على جميع التسلسلات باستثناء أحد المجموعة التي تم تحليلها (العمود 4) ، FO في المجموعة التي تحتوي على جميع التسلسلات التي تم إنشاؤها بواسطة نفس الإستراتيجية (GBSS) باستثناء تسلسل المجموعة التي تم تحليلها (العمود 5). يُظهر الخط المائل الببتيدات بتردد أعلى بمقدار 50 ضعفًا على الأقل فيما يتعلق بكل (العمود 4) أو الببتيدات من نفس الإستراتيجية (العمود 5). تشير علامة التجزئة بعد النمط إلى تكرار أعلى بمقدار 500 ضعف في العمود 4 أو العمود 5 على الأقل

العوامل المؤثرة في فصل البركة

دفع التباين في قدرة الفصل لمقاييس مقاومة الماء (الشكل 3) إلى تحليل تأثير قيم الأحماض الأمينية الفردية. ومع ذلك ، لم ندرك أي ارتباط بين التوزيع المحدد لقيم الأحماض الأمينية الفردية ضمن المقاييس الفردية وأداء المقياس استنادًا إلى 98 مقياسًا معروفًا للكراهية للماء. كنهج بديل ، أنشأنا مقاييس عشوائية للكره للماء بناءً على 98 مقياسًا معروفًا بالفعل (الجدولان 3 و 4). في البداية ، تم استخدام القيم القصوى والدنيا للأحماض الأمينية للمقياس الحقيقي 98 كفاصل زمني لإنشاء 200 مقياس كره للماء عن طريق تخصيص قيمة عشوائية لكل حمض أميني فردي. بعد ذلك ، تم إجراء عدة جولات من التطور في السيليكو لتحسين قدرة الفصل لمجمعات التسلسل البنيوية الخمسة المختلفة (الشكل 7).

Fig. 7 قدرة الفصل باستخدام التطور العشوائي في مقاييس السيليكو. الموضح هو ملف علبة مخطط توزيع سعة الفصل لـ 98 مقياسًا حقيقيًا للكراهية المائية (حقيقي) ، و 200 مقياس تم إنشاؤه عشوائيًا (عشوائي ، راجع قسم "الطرق") وستة في خطوات تطور السيليكو (evoSl إلى evoS6). تم تحليل التحسين التطوري للنهج التطوري للحصول على أفضل مقياس أداء تم تحديده بعد كل خطوة (خط متقطع) والهضبة المتوقعة 0.588 تظهر على شكل خط منقط

بعد ست جولات من تطور السيليكو ، وصلت مقاييس مقاومة الماء العشوائية إلى حد الفصل 0.6 ، وهو ما يمكن مقارنته بإمكانية الفصل لأفضل مقياس مقاومة للماء أداءً. يشير هذا إلى وجود حد لإمكانات مقاييس الأحماض الأمينية لفصل تجمعات التسلسل الهيكلي بمقدار 0.6. علاوة على ذلك ، أدركنا أثناء تطور مقاييس كره الماء أن قيمة بعض الأحماض الأمينية لها تأثير إيجابي أو سلبي أكبر على قدرة الفصل مثل غيرها.

بعد إنشاء المقياس التطوري ، هدفنا إلى فهم خاصية المقياس التي لها تأثير على قدرة الفصل. في البداية ، اختبرنا ما إذا كان الترتيب العام للأحماض الأمينية فيما يتعلق بقيمة رهابها المائي مهمًا. لقد أدركنا أنه ليس الترتيب العام لقيم مقاومة الماء للأحماض الأمينية هو الذي يؤثر على أداء مقياس الكراهية للماء (ملف إضافي 7: الشكل S2). في الثانية قمنا بتحليل ما إذا كانت قيمة الأحماض الأمينية المحددة تهيمن على قدرة الفصل للمقياس. لقد أدركنا قيم S عالية لمقاييس كره الماء التي تشترك في قيم مقاومة الماء قابلة للمقارنة إلى حد ما لـ Gln أو His أو Gly أو Ser أو Arg إلى المقياس المتطور أو للمقاييس ذات القيم الكارهة للماء لـ Cys أو Met أو Lys أو Val أو Ile المتميزة عن المقياس المتطور (إضافي ملف 8: الشكل S3). وبالتالي ، فإن قيمة مقاومة الماء لبعض الأحماض الأمينية مثل Gln أو His أو Gly أو Ser أو Arg قد تكون أكثر أهمية لقدرة فصل المقاييس عن غيرها.

ثالثًا ، سألنا ما إذا كانت مجموعة الأحماض الأمينية ذات القيم المماثلة أو المتميزة موجودة ضمن مقياس واحد ، مما يؤدي إلى قيم S عالية. تحقيقا لهذه الغاية قمنا بتحليل الفرق بين قيم كره الماء للأحماض الأمينية للمقاييس الفردية ، أي مقياس متطور في السيليكو ، مقياس كره الماء التجريبي بأعلى (أفضل) وأقل مقياس (أسوأ) قيمة S ، على التوالي. تم تطبيع كل مقياس على هذا النحو بحيث تم ضبط أعلى قيمة للكراهية للماء داخل المقياس على واحد وأقل قيمة للكارهة للماء إلى الصفر. بعد ذلك ، تم حساب الفرق في قيم الكراهية المائية للأحماض الأمينية بمقياس واحد (ملف إضافي 9: الجدول S6). أخيرًا قمنا بتحليل ما إذا كان زوج من الأحماض الأمينية يظهر فرقًا صغيرًا جدًا (& lt0.1 ، الشكل 8 أ) أو فرقًا كبيرًا جدًا (& gt0.9 ، الشكل 8 أ ، الحقل الأحمر) في قيمة hydropho-bicity داخل كل من ثلاثة مقاييس. أخيرًا ، قمنا بفحص أزواج الأحماض الأمينية التي تظهر اختلافًا منخفضًا مشابهًا في المقياس التجريبي بأعلى قيمة S والمقياس التطوري (الشكل 8 أ ، الإطار البرتقالي). بالإضافة إلى ذلك ، اخترنا أزواجًا من الأحماض الأمينية ذات قيمة مختلفة جدًا للكارهة للماء على الأقل في أحد المقياسين (الشكل 8 أ ، الإطار الأزرق) ومثل هذه الأزواج حيث كان الاختلاف صغيرًا في أحدهما وكبيرًا في المقياسين الآخر من هذين المقياسين ( الشكل 8 أ ، إطار أصفر).

Fig. 8 مسافة قيمة الأحماض الأمينية في مقاييس مقاومة الماء. أ تم حساب الفرق المطلق بين قيم اثنين من الأحماض الأمينية لأفضل مقياس مشتق تطوري أداءً (المربع الأول) ، من المقياس 14 (أعلى قيمة S ، المربع الثاني) ومقياس 40 (أدنى قيمة S ، المربع الثالث) بعد تطبيع الموازين إلى (X-min) / (max-min). الصناديق الخضراء تحديد المسافات أقل من 0.1 ، مربعات خضراء داكنة أقل من 0.01 ، مربعات حمراء المسافة فوق 0.9 و مربعات حمراء داكنة المسافة فوق 0.99. تركيبة مؤطرة في البرتقالي تحديد الأحماض الأمينية التي يجب أن تكون القيم متشابهة إلى حد ما كما هو مستخلص من الاختلاف المنخفض في أفضل أداء والمقياس التطوري المتطور ، إطارات زرقاء وضع علامة على مجموعات الأحماض الأمينية التي يجب أن تكون القيم مختلفة إلى حد ما على النحو الذي تم التوصل إليه من الاختلاف المنخفض في أفضل أداء والمقياس التطوري المتطور و إطارات صفراء ضع علامة على تركيبة الأحماض الأمينية التي يكون اختلاف القيمة فيها غير ذي صلة. ب المجموعات مع مقارنة (الخطوط السوداء) أو قيم أحماض أمينية مميزة (بلولين) موضحة. ج ال سهم يشير إلى مسافة قيم الأحماض الأمينية التي يجب أن تكون موجودة في مقياس أداء جيد

عند فحص المعلومات ، أدركنا وجود اختلاف كبير في قيم مقاومة الماء للجلوتامات والأرجينين لبعضهما البعض. بالإضافة إلى ذلك ، فإن القيمة المائية للجلوتامات هي الأكثر بعدًا عن قيم الرهاب المائي للتيروزين والتريبتوفان والليوسين والإيزولوسين ، على التوالي ، الشكل 8 أ ، الإطار الأزرق). إن قيمة الرهاب المائي للأرجينين بعيدة عن قيمة فينيل ألانين وميثيونين (الشكل 8 أ ، الإطار الأزرق). في المقابل ، أصبحت ثلاث مجموعات متميزة من الأحماض الأمينية ذات قيم مقاومة للماء قابلة للمقارنة واضحة (الشكل 8 أ ، الإطارات البرتقالية). بالنظر إلى جميع الأزواج ، يمكن للمرء أن يرسم علاقات قيم مقاومة الماء داخل هذه المجموعات. ومن المثير للاهتمام ، أن قيم الكراهية المائية للمجموعة الثالثة هي الأكثر بعدًا عن شكل الأرجينين (الشكل 8 ب) ، في حين أن قيم الرهاب المائي للمجموعة الأولى هي الأكثر بعدًا عن الجلوتا ماتي. ومع ذلك ، لا ترتبط هذه المجموعات بنمط الأحماض الأمينية المكتشفة لتجمعات التسلسل المحددة (الجدولان 6 و 7) علاوة على ذلك ، فهي لا تمثل بالضرورة الخصائص الفيزيائية والكيميائية للأحماض الأمينية.

لقد أوضحنا أن معظم مقاييس الكره للماء تصل إلى نفس المستوى من سعة فصل الببتيد (الأشكال 3 ، 4) ، وبالتالي ، فإن الطريقة التي تم بها إنشاء المقياس ليس لها تأثير مباشر على التجميع أو سعة الفصل (الأشكال 1 ، 3) . ومع ذلك ، إذا أدركنا على الإطلاق أن المقياس 14 الذي حدده Naderi-Manesh الذي طوره في عام 2001 [40] يؤدي إلى حد ما أداء أفضل من المقاييس الأخرى للكراهية للماء. نقترح قاعدة أساسية للتجربة التي تهدف إلى استخدام مقياس الرهاب المائي لتحديد الببتيدات بأجزاء عبر الغشاء من مجموعة من الببتيدات. يجب أن تكون قيمة مقاومة الماء للأرجينين والتيروزين أبعد ما تكون عن قيمة الغلوتامات ، بينما يجب أن تكون قيم الكراهية للماء لـ Asn و Asp و His و Lys في وسط المقياس (الشكل 8 ج). لاحظنا كذلك أن فصل تجمعات التسلسل المحددة بواسطة الهياكل الثانوية المعروفة هو أكثر احتمالًا من فصل تجمعات التسلسل مع مزيج من الهياكل الثانوية المشتقة من هضم السيليكو (الأشكال 3 ، 4) ، ولكن تجمعات التسلسل التجريبية المهضومة مع حلزوني وحبلا المحتوى أو الغشاء & # 946 -strand أو & # 945-helix يمكن فصله بشكل أفضل عن المجمعات الأخرى (الشكل 4).

ومع ذلك ، فقد أدركنا عتبة S = 0.6 ، بغض النظر عن طبيعة المقياس ، والتي يدعمها نهج في السيليكو لتحسين المقياس (الشكل 7). بدورها ، تعتمد سعة الفصل على عدد المعلمات المحسوبة (ملف إضافي 3: الشكل S1) ، على الرغم من أننا أدركنا أن الكراهية المتناوبة للماء لديها أدنى سعة لفصل تجمع التسلسل (الشكل 5). بشكل ملحوظ ، لاحظنا أن اكتشاف & # 946 - خيوط في الببتيدات يمكن دعمه من خلال الكشف عن الببتيدات الخماسية (الشكل 6) لأنه تم اكتشاف مثل هذه الببتيدات في البركة الهيكلية وفي المجمعات الناتجة عن محاكاة هضم التجربة (الجدول) 7). وبالمثل ، فقد لوحظت أنماط الأحماض الأمينية الخاصة بالغشاء & # 946 - خيوط (الجداول 6 ، 7) أو المحتوى العشوائي إلى حد كبير (الجدول 7). في المقابل ، بالنسبة لحمامات السباحة التي تتكون أساسًا من هياكل حلزونية ، يمكن اكتشاف ببتيد خماسي واحد محدد فقط للذوبان (الحلزون s) والغشاء (krtm-helix) & # 945-helices (الجدول 7). تلخيصًا ، تعتمد جودة فصل تجمعات التسلسل بدلاً من ذلك على المعلمة المستخدمة في الحساب بدلاً من المقياس المستخدم ويمكن دعمها بالبحث عن نمط حمض أميني معين.

مقاييس كره الماء

98 مقياس كره الماء (الجداول 3 ، 4) -16 هي فقط أرقام جبرية معكوسة للمقاييس الأخرى في المجموعة تم استخلاصها من ثلاثة مصادر مختلفة (http://www.genome.jp/aaindex/ [30] http: // split4. pmfst.hr/split/scales.html [22] http://web.expasy.org/protscale/ [31]). يتم تقديم مسار تطور مقاييس كره الماء في ملف إضافي 10: الشكل S4.

معلمة كره الماء

تم استخدام خمسة معلمات مختلفة للكارهة للماء (الجدول 5) لتحليل تأثيرها على قدرة الفصل. بالنسبة لجميع معلمات كارهة الماء هذه ، استخدمنا أزواجًا متعارضة (بحد أقصى وأدنى) من المعلمات للبحث عن الاختلافات المحتملة. يجب أن يكون نظام EBBS [16] قادرًا على اكتشاف & # 946 - ورقة ، في حين يجب أن يكون التناوب المسعور [14 ، 15] أكثر تحديدًا للكشف عن الغشاء & # 946 - الصفائح. تم استخدام لحظة الكراهية للماء & # 945 و & # 946 [13] لتحديد & # 945 - القفزات و & # 946 - الورقة بشكل عام. كانت المعلمة الأخيرة هي متوسط ​​الكراهية للماء ، والتي لم يكن لها هيكل ثانوي يمكن اكتشافه بشكل تفضيلي حتى الآن.

تم استخراج تجمعات البنية الثانوية المعروفة (الجداول 1 ، 2) من قاعدة بيانات ASTRAL40 [32] واختلفت في ملف عشوائي (عشوائي) ، وعشاري خلوي & # 946 - ورقة (ورقة) ، وعصاري خلوي & # 945-حلزوني (s- الحلزون) ، الغشاء & # 946-ورقة (tm-sheet) و transembrane & # 945-helix (tm-helix). علاوة على ذلك ، قمنا بتطبيق نهج هضم تجريبي في السيليكو لتقسيم التسلسلات بعد Lysine (K) و Arginine (R) لقاعدة بيانات ASTRAL بأكملها وصنفنا شظايا الببتيد المتعلقة بهياكلها الثانوية. تم تقسيمها إلى أجزاء تحتوي على (1) هيمنة مستمرة SSE (dc) ، (2) متقطعة تهيمن SSE (dd) ، (3) لا يوجد SSE مسيطرة ولكن فقط هيكلين مختلفين (no-) ، (4) جميع الهياكل الثانوية الثلاثة (الكل) أو (v) الصفيحة عبر الغشاء أو شظايا اللولب (krtm-).

فصل المسبح عن طريق مقاييس ومعلمات مقاومة الماء خوارزمية السحابة

خوارزمية حساب السحابة هي نهج من خطوتين. تم استخدام جميع متواليات الببتيد الفردي لمجموعة تشريح بنية ثانوية محددة (الجدول 1) أو في تجمع هضم silico K / R (الجدول 2) كمدخلات لحساب السحابة. وبالتالي ، يتم تمثيل كل ببتيد بواسطة ناقل الأبعاد n (غطاء محدب الحجم الكبير) ، حيث يتم حساب قيم معلمات الكارهة للماء المختلفة (n & lt 5 أبعاد ممثلة بالقيمة الدنيا أو القصوى باستخدام معلمة معينة للكارهة للماء من الجدول 5) محسوبة على أساس على مقياس معين للرهاب المائي (الجداول 3 ، 4) هي مكونات هذا المتجه.

(I) يتم حساب السحابة الأولية بناءً على مجموعة فرعية مختارة عشوائيًا من

30 نقطة (الببتيدات التي تحددها النواقل). بعد ذلك ، يتم توسيع السحابة حتى يتم النظر في كل نقطة. بشكل عام ، تحسب الخوارزمية جميع المسافات والاتجاهات داخل الفضاء ذي البعد n بين جميع النقاط المعطاة (الببتيدات) واختبارات ما إذا كانت هذه المواقع صالحة. يكون الموقع صالحًا إذا كانت جميع نقاط السحابة بأكملها تتبع اتجاه السطح العلوي. من خلال هذا ، يتم تحديد ما إذا كانت هناك نقطة مضافة تقع داخل السحابة المحسوبة حتى الآن.

(II) يتم توسيع السحابة الحالية نقطة بنقطة لتحديد السحابة من خلال مجموعة من المواقع بين النقاط. بعد كل نقطة ، يتم تحديث مجموعة المواقع من خلال الإجراء (1) ويتم اختبار جميع النقاط المتبقية إذا كانت هذه النقاط هي نقاط داخلية أو نقاط حدية مفترضة.

(III) يتم حساب حجم السحابة النهائي بناءً على المواقع الخارجية بين النقاط الحدودية في الفضاء ذي الأبعاد n التي تشكل غلافًا محدبًا. يتم وضع جميع النقاط داخل السحابة (النقاط الداخلية) أو على الغلاف المحدب (النقاط الحدودية).

حساب الفصل

تم استخدام جميع الببتيدات الخاصة بمجموعتي هيكل في سيناريو معين لحساب الأحجام الفائقة الإرشادية لكل تجمع ، على التوالي ، المحددة بواسطة السطح الزائد عبر خط أنابيب.يتم تحديد السيناريو من خلال عدد الأبعاد المستخدمة التي يتم تمثيلها بواسطة معلمات كارهة للماء المحددة ، واختيار مقياس مقاومة الماء وأي نوعين من المجمعات الهيكلية المستخدمة للمقارنة. تم حساب عدد النقاط (الببتيدات) الموضوعة بواسطة المتجه وفقًا للسحب وكذلك النقاط الموجودة داخل تداخل كل من أحجام السحابة.

مغلف محدب

نقوم بإزالة النقاط الحدودية (النتوءات) لكلا بركتي ​​البناء لبناء المغلف المحدب لتجنب كميات كبيرة من السحب على أساس القيم المتطرفة. قمنا بتحليل حجم وعدد الببتيدات لكل مجموعة بنية لجميع التركيبات ذات أبعاد n = 5 وحساب فقدان الببتيدات وفقدان الحجم بالنسبة المئوية. نظرًا للكمية الكبيرة من التركيبات لكل تجمع هيكل (محدد بعدد معلمات الكراهية المائية وعدد مقاييس مقاومة الماء) نحسب الحد الأدنى والحد الأقصى والمتوسط ​​للحجم وتقليل المد والجزر بإزالة النقاط الحدودية (ملف إضافي 11: الجدول S7) . في المتوسط ​​، يؤدي هذا الإجراء إلى التخلص من 6.8٪ من سلاسل الببتيد لحوض البنية ، ولكن يؤدي إلى تقليل الحجم وفقًا لـ 44.6٪.

من خلال ذلك ، تؤدي إزالة المفترضة المفترضة في المتوسط ​​إلى زيادة حجم كل ببتيد بمقدار سبعة أضعاف. بالنسبة للمسابح التي تحتوي على كمية منخفضة من الببتيدات (krtm-sheet ، krtm-helix ، no-random) تكون الزيادة في الحجم لكل ببتيد أقل ، أي بترتيب مزدوج. ومع ذلك ، فإن هذه الزيادة في الكثافة تبرر الإجراء.

تجمع مقياس الكراهية للماء

بالنسبة لمقياس نفاذية الماء ، تم حساب تباين الأزواج المختلفة لقيم مقاومة الماء لكل حمض أميني. تم ذلك باستخدام الارتباط التلقائي بين جميع أزواج 98 مقياسًا مختلفًا للرهاب المائي. بعد ذلك ، تم تطبيع قيم ارتباط بيرسون للحصول على الاختلاف واستخدمها MEGA6 [34] لإنشاء شجرة UPGMA للاختلاف. تم تجميع مقاييس مقاومة الماء عن طريق تحديد عتبة 0.05 (5٪) للاختلاف لتقسيم الشجرة في مجموعات.

البحث عن أنماط الأحماض الأمينية

للبحث عن نمط الأحماض الأمينية ، تم استخدام تجمعات الهياكل المختلفة. أولاً ، تم تحليل شظايا الببتيد لجميع أنماط الأحماض الأمينية التي تحدث بطول معين بناءً على خوارزمية سلسلة ماركوف لحزمة جناح MEME و MAST (fasta-get-markov) [43]. تقدر الخوارزمية نموذج ماركوف من ملف FASTA للتسلسلات مع التصفية السابقة للأحرف الغامضة. على سبيل المثال ، يحتوي الببتيد المكون من أربعة أحماض أمينية في الطول على احتمال مشروط بأن يتبع أحد الأحماض الأمينية الحمض الأميني الآخر مع إعطاء مجموعة محددة من متواليات الببتيد. لذا فإن سلسلة ماركوف تسمح بحساب احتمالية الانتقال من حالة إلى حالة أخرى ، وبهذا تحدد احتمالية حدوث حمض أميني في ببتيد الأحماض الأمينية بطول معين لمجموعة معينة من الببتيدات. في هذا النهج ، تم اكتشاف جميع الأنماط الممكنة في الببتيدات بدءًا من طول نمط واحد وتزداد بكل الاحتمالات العشرين المختلفة لكل حمض أميني. تم تطبيع حدوث النمط المختلف إلى واحد ومقارنته بحدوث تجمعات الهياكل الأخرى لتحديد الفرق الزوجي بين التجمعات لاكتشاف نمط معين للمسبح بطول معين. علاوة على ذلك ، أجرينا اختبارات متعددة بنمطنا المحدد بطول أربعة وخمسة أحماض أمينية. استخدمنا اختبار فيشر الدقيق لحساب قيم p لفحص أهمية الاحتمالية بين حدوث نمط معين فيما يتعلق بتجمع هيكل معين. كمرجع ، قمنا بتجميع جميع مجمعات الهياكل السبعة عشر معًا. للتغلب على الأخطاء الاصطناعية باستخدام عدة مرات اختبار الصياد الدقيق الذي استخدمناه كاختبار لاحق لمعدل الاكتشاف الخاطئ Benjamini / Hochberg (fdr) تصحيح اختبار متعدد لضبط قيم p (ملف إضافي 5: الجدول S4 ، ملف إضافي 6: الجدول S5 ، p القيم). تم تمييز جميع أنماط الأحماض الأمينية بطول أربعة (الجدول 6) وخمسة (الجدول 7) مع قيمة p معدلة أدناه & # 945 = 0.05 بالخط العريض.

في إنشاء مقاييس مقاومة الماء العشوائية في السيليكو

يعتمد توليد مقاييس كره الماء في السيليكو على قيم الحد الأدنى والأقصى للكره للماء المستخرجة من مقاييس الكره للماء 98 التي تم تحليلها ، والتي تم تحديدها كحدود للفاصل الزمني. استخدمنا خمسة تجمعات هيكلية لحساب درجة سعة الفصل (dd-sheet ، dd-helix ، dd-random ، krtm-sheet ، krtm-helix). تم إنشاء مائتي مقياس عشوائي لرهاب الماء. بناءً على مقياس مقاومة الماء العشوائي للسيليكو الأفضل في الخطوات السابقة ، تم إنشاء 2000 مقياس 100 لكل حمض أميني. غيّر نصف مقاييس كثافة الماء لكل حمض أميني قيمة الكراهية للماء للحمض الأميني الفردي في الفاصل الزمني الموجب [0.001: 5] والسالب [-0.001: -5] (evo1 و evo2). في الخطوات التالية في تطور السيليكو (من evo3 إلى evo5) تم تحليل أفضل 100 مقياس للكراهية للماء تم إنشاؤه حديثًا مع أفضل أداء لتصفية الأحماض الأمينية التي لها تأثير على كبسولة الفصل. تم تغيير هذه الأحماض الأمينية فقط في خطوات evo3 إلى evo5 لتحليل تأثيرها. بالنسبة لـ evo3 100 ، تم إنشاء مقاييس كارهة للماء لكل حمض أميني متغيرة خلال الفترة [0.001: 10] لـ E و Y و [-0.001: -10] لـ A و H و F و L. بالنسبة لـ evo4 200 مقاييس كارهة للماء لكل حمض أميني تم إنشاؤها متغيرة خلال الفترة [0.001: 20] لـ E و [-0.001: -20] لـ A و H. في evo5 400 تم إنشاء مقاييس كره للماء متغيرة خلال الفترة [0.001: 40] لـ E. أخيرًا ، في evo6 1000 تم إنشاء مقاييس مقاومة الماء العشوائية بناءً على أفضل مقياس لـ evo5. تم إنشاء 25 مقياسًا للكارهة للماء لكل حمض أميني متغير داخل الموجب [0.001: 5] وتم إنشاء 25 مقياسًا متغيرًا ضمن الفاصل الزمني السالب [-0.001: -5].

أدالملف الإضافي 1: الجدول S1.قيم مقياس كره الماء. معطى فهرس مقياس الكراهية للماء (العمود 1) ، سنة النشر (العمود 2) ، المؤلفون (العمود 3) ، اسم المقياس (العمود 4) ، موقع الويب لتنزيل المقياس (العمود 5) و قيم مقاومة الماء لكل حمض أميني (الأعمدة 6-25).

أالملف الإضافي 2: الجدول S2.ارتباط مقاييس كره الماء. يُعطى مصفوفة الارتباط لمقياس الكراهية للماء 98 بناءً على قيم مقاومة الماء للأحماض الأمينية العشرين. تم إعطاء اسم المقياس (العمود 1 والخط 1) بالإضافة إلى فهرس المقاييس (العمود 2 والخط 2).

أالملف الإضافي 3: الشكل S1.قدرة الفصل باستخدام أبعاد مختلفة للمعلمات. الموضح هو سعة الفصل باستخدام كمية مختلفة من معلمة مقاومة الماء (3-5 أبعاد ، انظر وسيلة الإيضاح في ب) (أ) يوضح الفصل بين أحواض السباحة المجففة ، (ب) أحواض الهياكل الثانوية و (ج) لجميع البرك المختلطة. يتم فرز مقاييس الكراهية للماء 98 على المحور X تنازليًا سعة الفصل في (B). تعني قيمة الفصل 0 التداخل الكامل للتجمعات وتعني القيمة 1 عدم وجود تداخل.

أالملف الإضافي 4: الجدول S3.تكوين الأحماض الأمينية في أحواض متتالية. معطى تجمع التسلسل (العمود 1) ووجود كل حمض أميني في أحواض معينة تم تطبيعه إلى 1.

أالملف الإضافي 5: الجدول S4.نمط الأحماض الأمينية بطول 4. نظرًا لوجود تجمع التسلسل 1 (العمود 1) ومجموعة التسلسل 2 (العمود 2) ، فإن سعة الفصل بين البرك على أساس كره الماء (العمود 3) ، والفرق الأقصى في تكرار الحدوث (FO) قيمة النمط (العمود 4) ، والحد الأدنى من الاختلاف في قيمة نمط FO (العمود 5) ، وعدد النمط الذي تم تمثيله بشكل زائد من pool1 على النقيض من pool2 (العمود 6) وأعلى 5 من النمط المحدد للطول 4.

أالملف الإضافي 6: الجدول S5.نمط الأحماض الأمينية الخاص بالمجمع للطول 5. بالنظر إلى تجمع التسلسل 1 (العمود 1) وحوض التسلسل 2 (العمود 2) ، سعة الفصل بين البرك على أساس الكراهية للماء (العمود 3) ، الفرق الأقصى في تكرار الحدوث ( FO) قيمة النمط (العمود 4) ، والفرق الأدنى في قيمة نمط FO (العمود 5) ، وعدد النمط الذي تم تمثيله بشكل زائد من pool1 على عكس pool2 (العمود 6) وأعلى 5 من النمط المحدد للطول 5.

أالملف الإضافي 7: الشكل S2.قيم الكراهية للماء للأحماض الأمينية الطبيعية للمقياس المتطور. الموضح هو القيمة الطبيعية للكره للماء لجميع الأحماض الأمينية العشرين لأفضل حقيقي (مقياس 28) ، وأسوأ حقيقي (مقياس 40) يقابل تجمعات التسلسل الخمسة المختارة وفي مقياس مقاومة الماء المتطور في السيليكو كمخطط رادار. مقياس Evo للمربعات الخضراء أفضل الدوائر السوداء ذات المقياس الحقيقي أسوأ مثلثات حمراء ذات مقياس حقيقي.

أالملف الإضافي 8: الشكل S3.ارتباط المسافة الكارهة للماء للأحماض الأمينية بمقياس التطور ودرجة قدرة الفصل لمقياس الكراهية للماء الحقيقي. الموضح هو الارتباط عبر التوافق الخطي بين سعة الفصل لمقياس الكراهية للماء الحقيقي 98 ومسافة قيمة مقاومة الماء لحمض أميني واحد إلى مقياس التطور في السيليكو. يتم توزيع الأحماض الأمينية المفردة على أربعة رسوم بيانية (A-D) فيما يتعلق بميلها من التوافق الخطي الفردي. (أ) رفع المنحدر الأحمر (ب) ارتفاع المنحدر قليلاً باللون الأزرق (ج) عدم ارتفاع المنحدر الأسود (د) المنحدر الأخضر.

أالملف الإضافي 9: الجدول S6.المسافة من قيم نفاذية الأحماض الأمينية للماء إلى مقياس عشوائي متطور. يُعطى معرف المقياس (العمود 1) وقدرة فصل المقياس (العمود 2). علاوة على ذلك ، بالنسبة لكل حمض أميني (الأعمدة من 3 إلى 22) ، يتم عرض مسافة قيمة مقاومة الماء الطبيعية إلى قيمة مقياس كره الماء المتطور.

أالملف الإضافي 10: الشكل S4.الهيكل العضوي لمقاييس مقاومة الماء المحسنة. الموضح هو علاقة مقاييس كره الماء فيما يتعلق بأصلها. تعتمد التبعيات (الموضحة بالرسم البياني الموجه) على بحث شامل في الأدبيات. تم تضمين المقاييس الخضراء المميزة للكارهة للماء في دراستنا بينما لم يتم تضمين المقاييس الحمراء.

الملف الإضافي 11: الجدول S7.تأثير المغلف المحدب على حجم وعدد الببتيدات. يتمثل في تقليل حجم وعدد الببتيدات لكل تجمع هيكل (رقم العمود 1 لجميع الببتيدات داخل التجمع ، العمود 2) بالنسبة المئوية لجميع السيناريوهات مع n = 5 أبعاد في المتوسط ​​(الأعمدة 3 ، 4) ، كحد أدنى (الأعمدة 5 ، 6) وبحد أقصى (الأعمدة 7 ، 8).

مساهمات المؤلفين

ES و SS تصور وتصميم التجارب. بحثت OM في data-bses عن مقاييس ومعلمات كره الماء واستخدمت الخوارزمية السحابية. قام JE بإنشاء تجمعات الهيكل عبر عملية الهضم بالسيليكو ، وأجرى تحليلًا لفصل المسبح وإنشاء مقاييس عشوائية للكره للماء. أجرى SS مجموعات مقياس الكراهية المائية والبحث عن أنماط الأحماض الأمينية. يساهم كل من ES و SS و JE في كتابة المخطوطة. كل الكتاب قراءة وافقت على المخطوط النهائي.

تم دعم العمل بمنح من Deutsche Forschungsgemein-schaft SFB807-P17 إلى ES. نشكر نيكولاوس كونستانتينيديس ، وماريو كيلر ، وكاثا رينا وايزمان ، وبنجامين فايس على المناقشة ، ويوهانس أولمان على تنفيذ خط أنابيب الأدوات لحساب الحجم الزائد الاستكشافي.

الكتاب تعلن أنه ليس لديهم المصالح المتنافسة.

1. لانجموير I. أحادي الطبقات البروتين. كولد سبرينج هاربور سيمب كوانت بيول. 19381938 (6): 171-89. [& # 160 روابط & # 160]

2. Langmuir I. خصائص وهيكل أغشية البروتين. بروك روي إنست جي تي بريطانيا. 19381938: 30483-96. [& # 160 روابط & # 160]

3. White SH ، Wimley WC. طي بروتين الغشاء واستقراره: المبادئ الفيزيائية. Annu Rev Biophys Biomol هيكل. 19991999 (28): 319-65. [& # 160 روابط & # 160]

4. Mitaku S، Hirokawa T. العوامل الفيزيائية والكيميائية للتمييز بين البروتينات الذائبة والبروتينات الغشائية: كره الماء للشرائح الحلزونية وطول البروتين. هندسة البروتين. 19991999 (12): 953-7. [& # 160 روابط & # 160]

5. شين SJ. مقارنة الخواص الكيميائية والوظيفية لبروتينات الأوراق القابلة للذوبان من أربعة أنواع نباتية. جي أغريك فود تشيم. 19911991 (39): 681-5. [& # 160 روابط & # 160]

6. تانفورد سي ، لوفرين ر. تفكك الكاتلاز إلى وحدات فرعية. شركة J Am Chem Soc. 1962-1962 (84): 1892-6. [& # 160 روابط & # 160]

7. ويلس إم سي جي ، أغيلار مي ، هيرن إم تي دبليو. الأساس الفيزيائي الكيميائي لمقاييس كره الماء للأحماض الأمينية: تقييم أربعة مقاييس جديدة لمعاملات كره الماء للأحماض الأمينية المشتقة من RP-HPLC للببتيدات. الشرج تشيم. 19951995 (67): 1210-9. [& # 160 روابط & # 160]

8. Ponnuswamy PK، Prabhakaran M، Manavalan P. التعبئة الكارهة للماء والترتيب المكاني لبقايا الأحماض الأمينية في البروتينات الكروية. Biochim Biophys Acta. 1980-1980 (623): 301-16. [& # 160 روابط & # 160]

9. Cid H ، Bunster M ، Canales M ، Gazit & uacutea F. الكره للماء والطبقات الهيكلية في البروتينات. هندسة البروتين. 19921992 (5): 373-5. [& # 160 روابط & # 160]

10. Wimley WC، Creamer TP، White SH. طاقات المذيبات للسلاسل الجانبية للأحماض الأمينية والعمود الفقري في عائلة من خماسي الببتيدات المضيفة. الكيمياء الحيوية. 1996-1996 (35): 5109-24. [& # 160 روابط & # 160]

11. Fauch & egravere J-L، Pliska V. المعلمات الكارهة للماء & # 928 من السلاسل الجانبية للأحماض الأمينية من تجزئة / V- أسيتيل-حمض أميني-أميدات. Eur J Med Chem. 198318: 369-75. [& # 160 روابط & # 160]

12. زفيلينج إم ، ليونوف إتش ، أركين آي تي. التحسين القائم على الخوارزمية الجينية لجداول مقاومة الماء. المعلوماتية الحيوية. 2005-2005 (21): 2651-6. [& # 160 روابط & # 160]

13. أيزنبرغ د ، فايس آر إم ، تيرويليجر تي سي. تكشف اللحظة الكارهة للماء دورية في مقاومة الماء للبروتين. بروك ناتل أكاد علوم الولايات المتحدة الأمريكية. 19841984 (81): 140-4. [& # 160 روابط & # 160]

14. ماندل جوتفروند واي ، جريجوريت إل إم. حول أهمية الأنماط المتناوبة للمخلفات القطبية وغير القطبية في خيوط بيتا. J مول بيول. 2002-2002 (323): 453-61. [& # 160 روابط & # 160]

15. Mirus O ، Schleiff E. التنبؤ ببروتينات غشاء بيتا برميل من خلال البحث عن المجالات المقيدة. المعلوماتية الحيوية BMC. 2005-2005 (6): 254. [& # 160 روابط & # 160]

16. ويملي مرحاض. نحو التحديد الجينومي لبروتينات غشاء البرميل & # 946: تكوين وهندسة الهياكل المعروفة. علوم البروتين. 2002-2002 (11): 301-12. [& # 160 روابط & # 160]

17. Illerg & aringrd K ، Callegari S ، Elofsson A. MPRAP: مؤشر إمكانية الوصول لبروتينات الغشاء الحلزونية التي تؤدي أداءً جيدًا داخل الغشاء وخارجه. المعلوماتية الحيوية BMC. 2010 2010 (11): 333. [& # 160 روابط & # 160]

18. إعادة النظر في تنبؤات Chen CP و Kernytsky A و Rost B. علوم البروتين. 200211: 2774-91. [& # 160 روابط & # 160]

19. باسكيير سي ، برومبوناس فج ، بالايوس جي إيه ، هامودراكاس شبيبة ، هامودراكاس إس جيه. طريقة جديدة للتنبؤ بأجزاء الغشاء في البروتينات بناءً على تحليل إحصائي لقاعدة بيانات SwissProt: خوارزمية PRED-TMR. هندسة البروتين. 19991999 (12): 381-5. [& # 160 روابط & # 160]

20. Deber CM ، Wang C ، Liu LP ، Prior AS ، Agrawal S ، Muskat BL ، Cuticchia AJ. TM finder: برنامج تنبؤ لأجزاء البروتين عبر الغشاء باستخدام مجموعة من مقاييس الهيدروفوبيكتي والمرحلة اللاقطبية. علوم البروتين. 20012001 (10): 212-9. [& # 160 روابط & # 160]

21. Juretic D ، Zoranic L ، Zucic D. مجموعات الشحنة الأساسية وتنبؤات طوبولوجيا بروتين الغشاء. J Chem Inf Comput Sci. 2002-2002 (42): 620-32. [& # 160 روابط & # 160]

22. Juretic D. البروتينات الثانوية الهيكلية المقاييس المرتبطة به. J الرياضيات تشيم. 19931993 (14): 35-45. [& # 160 روابط & # 160]

23. Gromiha MM، Ponnuswamy PK. توقع الهياكل الثانوية للبروتين من خصائصها الكارهة للماء. Int J Pept بروتين Res. 19951995 (45): 225-40. [& # 160 روابط & # 160]

24. King RD، Sternberg MJE. تحديد وتطبيق المفاهيم المهمة للتنبؤ الدقيق والموثوق بهيكل البروتين الثانوي. علوم البروتين. 1996-1996 (5): 2298-310. [& # 160 روابط & # 160]

25. Cid H ، Bunster M ، Arriagada E ، Campos M. التنبؤ بالبنية الثانوية للبروتينات عن طريق الملامح الكارهة للماء. FEBS ليت. 1982-1982 (150): 247-54. [& # 160 روابط & # 160]

26. بيترز سي ، إيلوفسون أ. لماذا يعتبر مقياس مقاومة الماء البيولوجي أكثر دقة من مقاييس كره الماء التجريبية السابقة؟ البروتينات. 2014 2014 (82): 2190-8. [& # 160 روابط & # 160]

27. Perunov N، England JL. النظرية الكمية للتأثير الكارثي للماء كقوة دافعة لبنية البروتين. علوم البروتين. 2014 2014 (23): 387-99. [& # 160 روابط & # 160]

28. Cherry MA ، Higgins SK ، Melroy H ، Lee HS ، Pokorny A. الببتيدات التي لها نفس التركيب ، الكراهية للماء ، والعزم الكارهة للماء ترتبط بطبقات الفوسفوليبيد الثنائية ذات الصلات المختلفة. J Phys Chem B. 2014 2014 (118): 12462-70. [& # 160 روابط & # 160]

29. Nicolau DV ، Paszek E ، Fulga F ، Nicolau DV. رسم خرائط الكراهية للماء على السطح الجزيئي للبروتين بدقة على مستوى الذرة. بلوس واحد. 2014 2014 (9): e114042. [& # 160 روابط & # 160]

30. Kawashima S، Pokarowski P، Pokarowska M، Kolinski A، Katayama T، Kanehisa M. AAindex: قاعدة بيانات مؤشر الأحماض الأمينية ، تقرير مرحلي لعام 2008. Nucleic Acids Res. 2008-2008 (36): D202-5. [& # 160 روابط & # 160]

31. Gasteiger E ، Hoogland C ، Gattiker A ، Duvaud S ، Wilkins MR ، Appel RD ، Bairoch A. أدوات تحديد وتحليل البروتين على خادم ExPASy. في: Walker JM ، محرر. كتيب البروتوكولات البروتينية. Totowa: هيومانا برس إنك 2005. ص. 571-607. [& # 160 روابط & # 160]

32. Chandonia JM ، Hon G ، Walker NS ، Lo Conte L ، Koehl P ، Levitt M ، Brenner SE. خلاصة ASTRAL في عام 2004. الأحماض النووية Res. 2004-2004 (32): D189-92. [& # 160 روابط & # 160]

33. Bigelow CC. في متوسط ​​الكراهية للماء للبروتينات والعلاقة بينها وبين بنية البروتين. J ثور بيول. 1967-1967 (16): 187-211. [& # 160 روابط & # 160]

34. Tamura K ، Stecher G ، Peterson D ، Filipski A ، Kumar S. MEGA6: التحليل الوراثي التطوري الجزيئي ، الإصدار 6.0. مول بيول إيفول. 20132013 (30): 2725-9. [& # 160 روابط & # 160]

35. جونز د. خصائص الأحماض الأمينية وتوجيه السلسلة الجانبية في البروتينات: نهج الارتباط المتبادل. J ثور بيول. 1975-1975 (50): 167-83. [& # 160 روابط & # 160]

36. Zimmerman JM، Eliezer N، Simha R. توصيف متواليات الأحماض الأمينية في البروتينات بالطرق الإحصائية. J ثور بيول. 1968-1968 (21): 170-201. [& # 160 روابط & # 160]

37. Nozaki Y، Tanford C. ذوبان الأحماض الأمينية واثنين من الببتيدات الجليسينية في محاليل الإيثانول المائي والديوكسان. إنشاء مقياس كارهة للماء. J بيول كيم. 19711971 (246): 2211-7. [& # 160 روابط & # 160]

38. Kyte J ، Doolittle RF. طريقة بسيطة لعرض الطابع المائي للبروتين. J مول بيول. 1982-1982 (157): 105-32. [& # 160 روابط & # 160]

39. Engelman DM ، Steitz TA ، Goldman A. تحديد حلزونات الطبقة غير القطبية في تسلسل الأحماض الأمينية لبروتينات الغشاء. Ann Rev of Biophys Biophys Chem. 1986-1986 (15): 321-53. [& # 160 روابط & # 160]

40. نادري مانيش هـ ، صادقي م ، عرب س ، موسافي موحدي أ. التنبؤ بإمكانية الوصول إلى سطح البروتين باستخدام نظرية المعلومات. البروتينات. 20012001 (42): 452-9. [& # 160 روابط & # 160]

41. Cornette JL، Cease KB، Margalit H، Spouge JL، Berzofsky JA، DeLisi C.مقاييس كره الماء والتقنيات الحسابية للكشف عن الهياكل الأمفيباثية في البروتينات. J مول بيول. 1987-1987 (195): 659-85. [& # 160 روابط & # 160]

42. Sweet RM، Eisenberg D. يقيس ارتباط كره الماء المتسلسل التشابه في بنية البروتين ثلاثية الأبعاد. J مول بيول. 1983-1983 (171): 479-88. [& # 160 روابط & # 160]

43. Bailey TL، Bod & eacuten M، Buske FA، Frith M، Grant CE، Clementi L، Ren J، Li WW، Noble WS. MEME SUITE: أدوات لاكتشاف الأفكار والبحث عنها. الدقة الأحماض النووية. 200937: 202. [& # 160 روابط & # 160]

44. Levitt M. مقياس إحصائي للكراهية للماء يعتمد على نظرية المعلومات الخاصة بإمكانية الوصول إلى المذيبات المرصودة للمخلفات في بروتينات ذات بنية معروفة. J مول بيول. 1976-1976 (104): 59-107. [& # 160 روابط & # 160]

45. Eisenberg D. هيكل ثلاثي الأبعاد للغشاء والبروتينات السطحية. Annu Rev Biochem. 1984-1984 (53): 595-623. [& # 160 روابط & # 160]

46. ​​غي إتش آر. طاقات تقسيم السلسلة الجانبية للأحماض الأمينية وتوزيع المخلفات في البروتينات القابلة للذوبان. Biophys J. 19851985 (47): 61-70. [& # 160 روابط & # 160]

47. Rose GD ، Geselowitz AR ، Lesser GJ ، Lee RH ، Zehfus MH. كره الماء لبقايا الأحماض الأمينية في البروتينات الكروية. علم. 19851985 (229): 834-8. [& # 160 روابط & # 160]

48. Fasman GD. التنبؤ ببنية البروتين ومبادئ تكوين البروتين. نيويورك: Plenum 1989. p. 789. [& # 160Links & # 160]

49. Chothia C. طبيعة الأسطح التي يمكن الوصول إليها والمدفونة في البروتينات. J مول بيول. 1976-1976 (105): 1-12. [& # 160 روابط & # 160]

50. Tanaka S، Scheraga HA. المعالجة الميكانيكية الإحصائية لتكوين البروتين. 1. الخصائص التوافقية للأحماض الأمينية في البروتينات. الجزيئات الكبيرة. 1976-1976 (9): 142-59. [& # 160 روابط & # 160]

51. Welling GW ، Weijer WJ ، van der Zee R ، Welling-Wester S. التنبؤ بمناطق مستضدية متسلسلة في البروتينات. FEBS ليت. 1985-1985 (188): 215-8. [& # 160 روابط & # 160]

52. Mohana Rao JK، Argos P. معامل التفضيل المطابق للتنبؤ باللوالب في بروتينات الغشاء المتكاملة. Biochim Biophys Acta. 1986-1986 (869): 197-214. [& # 160 روابط & # 160]

53. Bull HB، Breese K. التوتر السطحي لمحاليل الأحماض الأمينية: مقياس الرهاب المائي لبقايا الأحماض الأمينية. قوس Biochem Biophys. 1974-1974 (161): 665-70. [& # 160 روابط & # 160]

54. Levitt M. تمثيل مبسط لمطابقة البروتين لمحاكاة سريعة لطي البروتين. J مول بيول. 1976-1976 (104): 59-107. [& # 160 روابط & # 160]

55. Bishop CM، Walkenhorst WF، Wimley WC. طي صفائح بيتا في الأغشية: الخصوصية والاختلاط في أنظمة نموذج الببتيد. J مول بيول. 20012001 (309): 975-88. [& # 160 روابط & # 160]

56. Wimley WC، White SH. مقياس مقاومة الماء المحدد تجريبياً للبروتينات في واجهات الغشاء. نات هيكل بيول. 1996-1996 (3): 842-8. [& # 160 روابط & # 160]

57. Kuhn LA، Swanson CA، Pique ME، Tainer JA، Getzoff ED. الماء الذري والمتبقي في سياق هياكل البروتين المطوية. البروتينات. 19951995 (23): 536-47. [& # 160 روابط & # 160]

58. Prabhakaran M. توزيع الخواص الفيزيائية والكيميائية والتوافقية في الإشارات والببتيدات الوليدة. Biochem J. 19901990 (269): 691-6. [& # 160 روابط & # 160]

59. روزمان ماجستير. يتم تقليل قابلية الماء في السلاسل الجانبية للأحماض الأمينية القطبية بشكل ملحوظ عن طريق روابط الببتيد المرافقة. J مول بيول. 1988-1988 (200): 513-22. [& # 160 روابط & # 160]

60. Wolfenden RV، Cullis PM، Southgate CC. الماء ، طي البروتين ، الكود الجيني. علم. 1979-1979 (206): 575-7. [& # 160 روابط & # 160]

61. Manavalan P، Ponnuswamy PK. الطبيعة الكارهة للماء لبقايا الأحماض الأمينية في البروتينات الكروية. طبيعة سجية. 1978-1978 (275): 673-4. [& # 160 روابط & # 160]

62. فون Heijne G ، بلومبيرج C. الانتقال عبر الغشاء للبروتينات. نموذج التحويل المباشر. Eur J Biochem. 1979-1979 (97): 175-81. [& # 160 روابط & # 160]

63. جانين ج. الأحجام السطحية والداخلية في البروتينات الكروية. طبيعة سجية. 1979-1979 (277): 491-2. [& # 160 روابط & # 160]

64. ويلسون KJ، Honegger A، St & otildetzel RP، Hughes GJ. سلوك الببتيدات على دعامات الطور العكسي أثناء اللوني السائل عالي الضغط. Biochem J. 19811981 (199): 31-41. [& # 160 روابط & # 160]

65. Argos P، Rao JK، Hargrave PA. التنبؤ الهيكلي للبروتينات المرتبطة بالغشاء. Eur J Biochem. 1982-1982 (128): 565-75. [& # 160 روابط & # 160]

66. ميازاوا S، Jernigan RL. تقدير طاقات التلامس الفعالة بين القوارض من الهياكل البلورية البروتينية: التقريب شبه الكيميائي. الجزيئات الكبيرة. 1985-1985 (18): 534-52. [& # 160 روابط & # 160]

67. جاكوبس ري ، وايت SH. طبيعة الارتباط الكارهة للماء للببتيدات الصغيرة في السطح البيني الثنائي: الآثار المترتبة على إدخال حلزونات الطبقة العابرة. الكيمياء الحيوية. 1989-1989 (28): 3421-37. [& # 160 روابط & # 160]

68. Parker JM، Guo D، Hodges RS. مقياس محبة للماء جديد مشتق من بيانات احتفاظ الببتيد اللوني السائل عالي الأداء: ارتباط المخلفات السطحية المتوقعة بمولد الضد والمواقع التي يمكن الوصول إليها المشتقة من الأشعة السينية. الكيمياء الحيوية. 1986-1986 (25): 5425-32. [& # 160 روابط & # 160]

69. Cowan R، Whittaker RG. مؤشرات كره الماء لبقايا الأحماض الأمينية على النحو المحدد بواسطة كروماتوجرافيا سائلة عالية الأداء. الدقة Pept. 1990-1990 (3): 75-80. [& # 160 روابط & # 160]

70. أسود SD ، قالب د. تطوير معلمات كارهة للماء لتحليل البروتينات التي تتحمل تعديلات لاحقة أو ترجمة مشتركة. الشرج Biochem. 19911991 (193): 72-82. [& # 160 روابط & # 160]

71. Casari G، Sippl MJ. إمكانات مسعورة مشتقة من الهيكل. إن الإمكانات الكارهة للماء المشتقة من هياكل الأشعة السينية للبروتينات الكروية قادرة على تحديد الطيات الأصلية. J مول بيول. 19921992 (224): 725-32. [& # 160 روابط & # 160]

72. Ponnuswamy PK، Gromiha MM. توقع حلزونات الغشاء من الخصائص الكارهة للماء للبروتينات. Int J Pept بروتين Res. 19931993 (42): 326-41. [& # 160 روابط & # 160]

73. Ponnuswamy PK. الخصائص الكارهة للماء للبروتينات المطوية. بروغ بيوفيس مول بيول. 19931993 (59): 57-103. [& # 160 روابط & # 160]

تم الاستلام: 14 يناير 2016
تاريخ القبول: 17 يونيو 2016
تم النشر على الإنترنت: 04 يوليو 2016

/> Todo el contenido de esta revista، excepto dónde está identificado، está bajo una Licencia Creative Commons


شكر وتقدير

بفضل Jinfeng Liu (كولومبيا) للمساعدة في الكمبيوتر وجمع مجموعات بيانات الجينوم وإلى Jinfeng Liu و Dariusz Przybylski (كولومبيا) لتوفير المعلومات والبرامج الأولية. شكر خاص لفولكر إيريش (كولومبيا) لإتاحة خادم META-PredictProtein! عمل ب. كان مدعومًا بالمنح 1-P50-GM62413-01 و RO1-GM63029-01 من المعاهد الوطنية للصحة. أخيرًا وليس آخرًا ، شكرًا لجميع الذين قاموا بإيداع بياناتهم التجريبية في قواعد البيانات العامة ، ولأولئك الذين يحتفظون بقواعد البيانات هذه.

تم تحمل تكاليف نشر هذا المقال جزئيًا عن طريق دفع رسوم الصفحة. لذلك يجب وضع علامة "إعلان" على هذه المقالة وفقًا للمادة 18 USC القسم 1734 فقط للإشارة إلى هذه الحقيقة.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


شاهد الفيديو: أسياخ النحاس وأغلب الأخطاء التي يقع فيها الباحثون والحلول الفعلية (كانون الثاني 2022).