معلومة

ما الأداة التي يمكنني استخدامها لمحاذاة تسلسلات بروتين متعددة لتسلسل مرجعي واحد؟


لدي بروتين مهم يبلغ طوله حوالي 300 حمض أميني. لدي أيضًا حوالي 40 سلسلة قصيرة (جميع الأحماض الأمينية التسعة في الطول) ؛ هذه كلها مختلفة جدا عن بعضها البعض. أرغب في إجراء محاذاة زوجية متعددة لمعرفة ما إذا كانت هذه التسلسلات تتطابق مع (أو لها تشابه عالٍ في هوية التسلسل) أي مناطق في البروتين محل الاهتمام.

منذ فترة قصيرة 9-أ. المتتاليات غير متجانسة للغاية ، سيكون لها أوجه تشابه في مناطق مختلفة من البروتين محل الاهتمام. أرغب في معرفة ما إذا كان من الممكن إجراء المحاذاة لجميع التسلسلات الأربعين في خطوة واحدة ، بدلاً من استخدام COBALT 40 مرة (والتحقق من كل تسلسل قصير مقابل التسلسل المرجعي بشكل فردي).

يرجى إعلامي إذا كان وصف مشكلتي غير واضح بما فيه الكفاية ، وسأكون ممتنًا لأي مساعدة في تحديد طريقة للقيام بذلك.


ما تريد القيام به يسمى عادة محاذاة تسلسل متعدد. كما قالWayne_Yux ، فإن الخطوة الأولى هي وضع كل تسلسلات البروتين في ملف فاستا واحد. يمكنك بعد ذلك استخدام واحدة من عدة أدوات عبر الإنترنت لتطبيق خوارزميات محاذاة مختلفة لمجموعة تسلسل البروتين الخاص بك.

خوارزمية محاذاة التسلسل الشائعة هي Clustal ، والتي تبني تدريجياً محاذاة تسلسل متعدد من جميع المحاذاة الزوجية. يستضيف genome.jp أداة محاذاة قائمة على الويب تتيح لك الاختيار من بين Clustal وأنواع المحاذاة الأخرى (1). لمحاذاة العديد من التسلسلات الصغيرة لتسلسل واحد أكبر ، يجب عليك استخدام الخيار "SLOW / ACCURATE" (2). بعد تحميل fasta (3) وتنفيذ محاذاة متعددة (4) ، سيتم إنشاء ملف aln يمكنك تنزيله (5).

يمكنك بعد ذلك أخذ ملف aln هذا وتحميله إلى أداة مختلفة تتيح لك تصور المحاذاة. أنا شخصياً أحب ESPript ، الذي يعطي محاذاة مرمزة بالألوان بتنسيق pdf أو تنسيقات صور. نظرًا لأنك تريد مقارنة العديد من التسلسلات ، فمن المحتمل أن يكون من الضروري تغيير معلمات "تنسيق إخراج المحاذاة" ، على سبيل المثال قم بتغيير "الفجوة بين الكتل" إلى رقم أصغر لتناسب جميع التسلسلات في إطار واحد.


يمكنك تخزين 40 تسلسلًا في ملف fasta ثم استخدامهاانفجارلمواءمتها جميعًا مرة واحدة مع التسلسل المرجعي الخاص بك.

بعد ذلك ، يمكنك فحص نتائج المحاذاة ومعرفة ما إذا كانت تناسب توقعات الجودة الخاصة بك


في محاذاة متعددة التسلسل ، ستحاول الخوارزميات محاذاة التسلسلات بطولها (المحاذاة العامة). ما تحتاجه هو نهج محاذاة محلي مع عقوبة عالية لعدم التطابق الأساسي.

قد توفر خوارزمية E-INS-i في MAFFT الوظيفة المطلوبة. حدد الإعدادات المتقدمة وهناك:

  1. الإستراتيجية -> خوارزمية E-INS-i

  2. قم بمحاذاة الأجزاء غير ذات الصلة -> اترك مناطق جابي

اعتمادًا على مدى تباين تسلسلاتك ، قد تحتاج إلى ضبط الإعدادات الأخرى أيضًا. بدون البيانات ، من المستحيل تقديم دليل أكثر تفصيلاً.


ترجمة : بروتين DNA

المواقع: يوجد عدد من المواقع الممتازة التي تسمح جميعها بالترجمة في إطارات القراءة الستة. أود أن أوصي بـ & quotORF Finder & quot بسبب صوره وخط الأنابيب أو GeneMark إذا كنت مهتمًا بجدية بتحديد الجينات ضمن تسلسلك. يسمح البرنامجان الأخيران بتحليل التسلسلات الطويلة (يتم الإرسال عن طريق المرفق وليس في المربع).

أخطاء Frameshift:

اميجين
مسار :: الترجمة الخلفية للبروتين والمواءمة - يعالج مشكلة إيجاد تماثلات البروتين البعيدة حيث يكون الاختلاف نتيجة طفرات واستبدال الإطارات. بالنظر إلى تسلسلين لبروتين الإدخال ، تقوم الطريقة ضمنيًا بمحاذاة جميع الأزواج الممكنة من تسلسلات الحمض النووي التي تشفرها ، عن طريق معالجة تمثيلات الرسوم البيانية الفعالة للذاكرة لمجموعة كاملة من تسلسلات الحمض النووي المفترضة لكل بروتين. (المرجع: G & icircrdea M et al. 2010. خوارزميات البيولوجيا الجزيئية 5:)

أدوات الترجمة البسيطة - تسلسل الحمض النووي إلى البروتين:

افتح مكتشف إطار القراءة (NCBI) - يبحث عن إطارات القراءة المفتوحة (ORFs) في تسلسل الحمض النووي الذي تدخله. يقوم البرنامج بإرجاع نطاق كل ORF ، جنبًا إلى جنب مع ترجمة البروتين الخاصة به. استخدم أداة البحث عن ORF للبحث عن الحمض النووي المتسلسل حديثًا عن شرائح ترميز البروتين المحتملة ، والتحقق من البروتين المتوقع باستخدام SMART BLAST المطوَّر حديثًا أو BLASTP العادي.

يمكن إجراء ترجمات من ستة إطارات في توبنغن ، وروسيا ، و Bioline ، و Science Launcher.

ستة حزمة EMBOSS (EMBL-EBI) - يقرأ تسلسل الحمض النووي ويخرج الترجمات الثلاثة الأمامية و (اختياريًا) الثلاثة العكسية بطريقة مرئية. بدلاً من ذلك ، استخدم EMBOSS Transeq

مترجم MBS (أدوات JustBio) - موقع جديد ممتاز حيث يمكن للمرء أن يترجم على وجه التحديد من ATG ويتم تقديم النتائج مع تسلسل النوكليوتيدات الذي يغلف تسلسل الأحماض الأمينية. مثالي للقص / اللصق في مخطوطة. تحتاج إلى التسجيل لاستخدام هذه الأداة المجانية. أدوات الترجمة السريعة الأخرى موجودة هنا وهنا.

ترجمة (ExPASy ، سويسرا) - هي أداة تسمح بترجمة تسلسل النيوكليوتيدات (DNA / RNA) إلى تسلسل بروتيني.

ترجمة الحمض النووي إلى البروتين (جامعة إقليم الباسك ، إسبانيا) وهنا.

ترجمة تسلسلات متعددة:

الريبوسوم الافتراضي (المرجع: R. Wernersson. 2006. Nucl. Acids Res. 34 (إصدار خادم الويب): W385-388) - أجد أن الإخراج من الموقعين الأولين هو الأمثل لترجمة تسلسلات الحمض النووي المتعددة.

خادم RevTrans 1.4 (CBS ، الجامعة التقنية الدنماركية)

TranslatorX - هو خادم ويب مصمم لمحاذاة تسلسلات نيوكليوتيدات ترميز البروتين بناءً على ترجمات الأحماض الأمينية المقابلة لها. تشمل مستجدات TranslatorX ما يلي: (1) استخدام جميع الرموز الجينية الموثقة وإمكانية تعيين رموز جينية مختلفة لكل تسلسل (2) مجموعة من برامج المحاذاة المتعددة المختلفة (3) ترجمة الكودونات الغامضة عندما يكون ذلك ممكنًا (4) معيارًا مبتكرًا لـ محاذاة النوكليوتيدات النظيفة مع GBlocks بناءً على معلومات البروتين و (v) مخرجات غنية ، بما في ذلك التصور الرسومي المدعوم من Jalview للمحاذاة ، والمحاذاة المستندة إلى الكودون الملونة وفقًا للأحماض الأمينية المقابلة ، ومقاييس التحيز التركيبي والرمز الأول والثاني والثالث محاذاة موقف محددة. (المرجع: Abascal F، et al. (2010) Nucleic Acids Res. 38: W7-13).


المواد والأساليب

قاعدة بيانات المجال الهيكلية وقواعد بيانات المحاذاة الهيكلية

لتحديد المتماثلات ذات الهياكل المعروفة للتسلسلات المستهدفة ، استخدمنا قاعدة بيانات المجال الهيكلي ASTRAL SCOP40 (14 ، 15) (الإصدار 1.69 ، نطاقات 7290 ، مع & lt40٪ هوية تسلسل لبعضها البعض). تم إجراء محاذاة التسلسل القائمة على الهيكل بين كل زوج من المجالات من خلال ثلاثة برامج مقارنة هيكلية: DaliLite (16) و FAST (17) و TM-align (18). تسهل قواعد بيانات المحاذاة هذه استخدام المعلومات الهيكلية من خلال السماح بالبحث عن محاذاة التسلسل القائمة على الهيكل لأي زوج مجال ، دون تشغيل برامج المقارنة الهيكلية لهم أثناء عملية محاذاة التسلسل المتعدد. لكل مجال هيكلي ، أجرينا أيضًا عمليات بحث PSI-BLAST (19) لاسترداد المتماثلات التي يمكن استخدامها في محاذاة ملف التعريف مع التتابعات المستهدفة.

نظرة عامة على خوارزمية PROMALS

PROMALS (10) هي طريقة تقدمية تجمع المتواليات المتشابهة وتحاذيها بخوارزمية بسيطة وسريعة ، وتطبق تقنيات أكثر تفصيلاً لمحاذاة المجموعات المتباينة نسبيًا مع بعضها البعض. في مرحلة المحاذاة الأولى ، يقوم PROMALS بمحاذاة التسلسلات المتشابهة باستخدام وظيفة التسجيل لمجموع الأزواج المرجح من درجات BLOSUM62 (20). المرحلة الأولى سريعة وينتج عنها عدد من المجموعات (المجموعات) المحاذاة مسبقًا والتي تكون بعيدة نسبيًا عن بعضها البعض. في مرحلة المحاذاة الثانية ، يتم تحديد تسلسل تمثيلي واحد لكل مجموعة تمت محاذاتها مسبقًا (يشار إليها لاحقًا باسم "التسلسل المستهدف"). تخضع التسلسلات المستهدفة لعمليات البحث PSI-BLAST عن متماثلات إضافية من قاعدة بيانات UNIREF90 (21) وإلى تنبؤ الهيكل الثانوي PSIPRED (22). ثم يتم تطبيق نموذج ماركوف المخفي (HMM) لمحاذاة الملف الشخصي والملف الشخصي مع الهياكل الثانوية المتوقعة على أزواج من الممثلين للحصول على الاحتمالات الخلفية لمطابقات البقايا. تعمل هذه الاحتمالات كقيود قائمة على التسلسل تُستخدم لاشتقاق دالة تسجيل الاتساق الاحتمالي. تتم محاذاة تسلسلات الهدف التمثيلية تدريجياً باستخدام وظيفة تسجيل الاتساق هذه ، ويتم دمج المجموعات المحاذية مسبقًا التي تم الحصول عليها في المرحلة الأولى في محاذاة الممثلين لتشكيل المحاذاة المتعددة النهائية لجميع التسلسلات.

دمج المعلومات الهيكلية ثلاثية الأبعاد في PROMALS

في PROMALS3D ، يتم اشتقاق القيود الهيكلية للتسلسلات التمثيلية ذات الهياكل المعروفة ويتم دمجها مع القيود المستندة إلى التسلسل (الشكل 1). أولاً ، يحدد البرنامج المتماثلات ذات الهياكل ثلاثية الأبعاد (homolog3D) للتسلسلات المستهدفة الناتجة عن مرحلة المحاذاة السريعة الأولى. لكل تسلسل هدف ، يتم استخدام ملف تعريف بحث PSI-BLAST مقابل قاعدة بيانات UNIREF90 لبدء بحث PSI-BLAST جديد (تكرار واحد) مقابل قاعدة بيانات مجال SCOP40 التي تحتوي على تسلسلات مجال البروتين مع الهياكل المعروفة. المجالات الهيكلية فقط التي تمر بمعايير تشابه معينة (الافتراضي: ه - القيمة & lt0.001 ورقم التسلسل رقم & lt20٪) محفوظة. تتم تصفية هذه المجالات الهيكلية بشكل أكبر لإزالة التكرار بالطريقة التالية: إذا اجتاز مجالان هيكليان المعايير وكانت منطقتهما غير المتداخلة أقل من 30 وحدة بنائية ، فإن النطاق الوحيد الذي يحتوي على أفضل ه - يتم الاحتفاظ بالقيمة. يمكن تحديد متماثلات ثلاثية الأبعاد متعددة واستخدامها لتسلسل هدف واحد إذا كان يحتوي على عدة مجالات متميزة ذات هياكل معروفة.

مخطط انسيابي لطريقة PROMALS3D.

مخطط انسيابي لطريقة PROMALS3D.

يتم اشتقاق قيود مطابقة البقايا الزوجية لتسلسلين مستهدفين من المحاذاة المستندة إلى التسلسل من الهدف إلى المتماثل ثلاثي الأبعاد والمحاذاة القائمة على البنية ثلاثية الأبعاد إلى المتجانسة ثلاثية الأبعاد. على سبيل المثال ، إذا كان بقايا أ في الهدف S1 تتماشى مع البقايا ب في homolog3D T1 ، بقايا ب في homolog3D T1 محاذاة مع البقايا ج في homolog3D T2 وفقًا لبرنامج مقارنة البنية ، والمخلفات ج في homolog3D T2 محاذاة مع البقايا د في الهدف S2 ، ثم نستنتج تلك البقايا أ بالتسلسل S1 محاذاة مع البقايا د بالتسلسل S2 ، ويستخدم هذا الزوج كقيد مشتق من الهيكل (انظر الشكل S1 في البيانات التكميلية). في تمثيل المصفوفة ، مصفوفة القيود الهيكلية لهدفين S1 و S2 هي نتاج مضاعفة ثلاث مصفوفات مطابقة متبقية: مS1 − T1 , مT1 − T2 و مT2 − S2 . يمكن أن تكون المحاذاة بين التسلسل المستهدف و homolog3D الخاص به هي محاذاة PSI-BLAST ، أو يمكن إعادة محاذاتها بواسطة روتين مقارنة الملف الشخصي المستخدم في PROMALS. من أجل محاذاة PSI-BLAST بين الهدف والمتماثل ثلاثي الأبعاد الخاص به والمحاذاة الهيكلية بين اثنين من المتجانسات ثلاثية الأبعاد ، إذا تمت محاذاة اثنين من البقايا ، فإن دخولها في مصفوفة مطابقة البقايا هو 1 ، وإلا يكون 0. بالنسبة لمقارنة الملف الشخصي باستخدام HMM (10) ، إدخالات مصفوفة مطابقة البقايا هي الاحتمالات اللاحقة لمحاذاة اثنين من البقايا (يتم تحديدها بواسطة خوارزمية للأمام والخلف). يتم دمج قيود البنية بين التسلسلات المستهدفة مع تلك القيود المستمدة من مقارنات الملف الشخصي في PROMALS الأصلي لاستنتاج وظيفة تسجيل قائمة على الاتساق تدمج ملفات تعريف تسلسل قاعدة البيانات ، والهياكل الثانوية المتوقعة والمعلومات الهيكلية ثلاثية الأبعاد. استخدمنا نسبة وزن تجريبية قدرها 1.5 لقيود الهيكل بالنسبة لقيود التسلسل لمقارنة المظهر الجانبي في PROMALS الأصلي.

اختبار أداء MSA أو برامج المحاذاة الهيكلية المتعددة

قارنا PROMALS3D ببرامج محاذاة التسلسل المتعددة الشائعة الأخرى. PROMALS3D و 3DCoffee و Expresso (خادم ويب لـ 3DCoffee يتضمن تلقائيًا معلومات ثلاثية الأبعاد) هي برامج محاذاة متعددة تستخدم المعلومات الهيكلية والتسلسل. قمنا بتنفيذ 3DCoffee عن طريق إدخال قيود المحاذاة الهيكلية لبرنامج T-Coffee. لم نتمكن من الحصول على الإصدار المستقل من Expresso ، وبالتالي أرسلنا يدويًا 209 اختبارات "منطقة الشفق" في قاعدة بيانات SABmark إلى خادم Expresso بخيارات افتراضية. PROMALS و SPEM (9) و MUMMALS (5) و ProbCons (4) و MAFFT (13) و MUSCLE (23) و T-Coffee (3) و ClustalW (24) تستخدم فقط معلومات التسلسل (PROMALS و SPEM تتضمن أيضًا بنية ثانوية المعلومات التي تم توقعها من التسلسلات). يتيح لنا توافر بنية معروفة لكل تسلسل في قاعدة بيانات SABmark تقييم MUSTANG ، وهو برنامج محاذاة بنيوية متعددة (25) يستخدم المعلومات الهيكلية ثلاثية الأبعاد فقط. قمنا أيضًا باختبار أداء PROMALS3D على المعلومات الهيكلية فقط من خلال اتخاذ تدابير الاتساق فقط من القيود الهيكلية لمحاذاة DaliLite أو المحاذاة المرجعية. للتقييم المعتمد على المرجع لجودة المحاذاة ، تكون درجة جودة المحاذاة ( س -score) على أنه عدد أزواج المخلفات المحاذاة بشكل صحيح في محاذاة اختبار مقسومًا على العدد الإجمالي لأزواج المخلفات المحاذاة في محاذاة مرجعية (تتراوح قيمتها بين 0 و 1). من أجل التقييم المرجعي المستقل لجودة المحاذاة ، استخدمنا عددًا من الدرجات المستندة إلى الهيكل مثل GDT-TS (26) لتعكس أوجه التشابه بين هيكلين محاذيين وفقًا لمحاذاة التسلسل. تم وصف تفاصيل التقييم المرجعي المستقل في مادة سابقة (5).


الأطر الخوارزمية لحساب MSA

على الرغم من تنوعها الواسع ، تشترك جميع MSAMs في خاصية رئيسية رئيسية: اعتمادها على الاستدلال التقريبي والجشع عادة ، الذي تفرضه طبيعة NP الكاملة للمشكلة. تعتمد جميع هذه الاستدلالات ، بشكل أو بآخر ، بشكل صريح ، على خصائص بيانات محددة ، مثل الحجم وطبيعة التناظر والعلاقة والطول وما إلى ذلك. ونتيجة لذلك ، فإن أي تغيير - حتى وإن كان طفيفًا - على نوع البيانات التي يتم نمذجتها يتطلب تطوير استراتيجيات إرشادية جديدة. تضمنت هذه التغييرات مؤخرًا الحاجة إلى الارتقاء تحت ضغط التسلسل عالي الإنتاجية والحاجة إلى واصفات تسلسل أكثر تعقيدًا ، بما في ذلك الحمض النووي الريبي غير المشفر أو التسلسلات الجينية غير المنسوخة. يمكن أن تؤدي احتياجات النمذجة المتغيرة أيضًا إلى تطوير أساليب الاستدلال الجديدة ، وهي حقيقة موضحة جيدًا من خلال التطور الأخير للمحاذاة المدركة للتطور. كانت القوة الدافعة الأخرى وراء تطوير الاستدلال الجديد هي التوافر المتزايد للبيانات الهيكلية التي غذت تطوير طرق هجينة قادرة على التعامل في وقت واحد مع المتواليات والبنى الثانوية (RNA) أو الثالث (RNA والبروتينات). وبالمثل ، فإن انفجار البيانات الجينومية المتاحة قد وضع الكثير من الضغط على تطوير جيل جديد من محاذاة الحمض النووي غير المشفرة / غير المنقولة.

الخوارزميات شائعة الاستخدام

المكونات الخوارزمية الرئيسية لأكثر أدوات التقويم استخدامًا على نطاق واسع. في خريطة التمثيل اللوني ، تشير المدخلات البرتقالية إلى ميزة مطبقة في الطريقة المدروسة. تم تجميع كل من المحاذاة والمكونات عن طريق التشابه باستخدام الحزمة R. نسخة ملونة من هذا الرقم متاحة على الإنترنت في BIB على الإنترنت: https://academic.oup.com/bib.

المكونات الخوارزمية الرئيسية لأكثر أدوات التقويم استخدامًا على نطاق واسع. في خريطة التمثيل اللوني ، تشير المدخلات البرتقالية إلى ميزة مطبقة في الطريقة المدروسة. تم تجميع كل من المحاذاة والمكونات عن طريق التشابه باستخدام الحزمة R. نسخة ملونة من هذا الرقم متاحة على الإنترنت في BIB على الإنترنت: https://academic.oup.com/bib.

لبناء MSA ، يحتاج المرء إلى وظيفة تسجيل (وظيفة موضوعية) قادرة على تحديد المزايا النسبية لأي محاذاة بديلة فيما يتعلق بالعلاقة النموذجية. يمكن بعد ذلك تقدير MSA عن طريق حساب نموذج التسجيل الأمثل. الوظيفة الموضوعية هي معلمة حاسمة ، لأنها تحدد بدقة دقة النمذجة لـ MSA وقدرتها التنبؤية. عندما يتعلق الأمر بإعادة البناء التطوري ، فإن الوظائف الموضوعية الأكثر شيوعًا تتضمن تعظيم أوجه التشابه الموزونة (على النحو المنصوص عليه في مصفوفة استبدال PAM أو BLOSUM) أثناء استخدام عقوبة الفجوة لتقدير تكاليف indels. يمكن تعديل تكلفة الاستبدال باستخدام مخططات الترجيح المستندة إلى الشجرة التي تعكس مساهمة المعلومات المستقلة لكل تسلسل ، ويتم تقدير درجة الأعمدة من خلال النظر في إجمالي تكلفة الاستبدال (مجموع الأزواج). من المعروف جيدًا أن وظائف مجموع الأزواج من غير المرجح أن تكون نموذجًا للعلاقات البيولوجية بدقة كافية [6] ، ولكن ثبت أنها توفر مفاضلة معقولة بين الصحة الهيكلية والحوسبة ، أي إمكانية لتقدير بسرعة معقولة MSA.

وفقًا للصيغ الأكثر شيوعًا ، يكون تحسين مخططات تقييم مجموعات الأزواج مكتمل NP. لذلك يحتاج المرء إلى الاعتماد على الاستدلال ، وأكثرها شيوعًا هو خوارزمية المحاذاة التقدمية التي وصفها في البداية Hogeweg و Hesper [7]. تتضمن هذه الخوارزمية دمج تسلسل الإدخال واحدًا تلو الآخر في النموذج النهائي ، باتباع أمر التضمين المحدد بواسطة شجرة دليل محسوبة مسبقًا. في كل عقدة ، يتم إجراء محاذاة زوجية بين زوج من التسلسلات ، وتسلسل وملف جانبي أو ملفين جانبيين. يتم تقدير المحاذاة الزوجية التي تحدث عند كل عقدة باستخدام تعديلات أكثر أو أقل تعقيدًا لخوارزمية محاذاة البرمجة الديناميكية العالمية Needlman و Wunsch [8]. يشكل الجمع بين الإستراتيجية التقدمية القائمة على الشجرة وخوارزمية المحاذاة الزوجية العالمية العمود الفقري لمعظم الطرق المتاحة (الشكل 1) ، بما في ذلك ClustalW [2] و T-Coffee [9] و ProbCons [10]. كما أنه مُكيف جيدًا بشكل خاص لتصميم الاستراتيجيات التكرارية (الشكل 1) ، بما في ذلك إعادة تقدير الأشجار والمحاذاة حتى يتقارب كلاهما [11] ، كما هو مطبق في MUSCLE [12] و MAFFT [13] و Clustal Omega [14].

بصرف النظر عن الوظيفة الموضوعية ، فإن المكون الحسابي الرئيسي للمحاذاة التدريجية هو إجراء تقدير شجرة الدليل. يمكن الحصول على هذه الشجرة ، التي تحدد الترتيب الذي سيتم فيه دمج التسلسلات ، باستخدام مجموعة متنوعة من الطرق ، وأكثرها معيارًا هو ربط الجوار (NJ) [15] وطريقة مجموعة الأزواج غير الموزونة مع المتوسط ​​الحسابي (UPGMA) [16] . يعتبر التفاعل بين الوظيفة الموضوعية (مخطط الاستبدال وعقوبات الفجوة) ونظام الترجيح والشجرة معقدًا وقد تم استكشافه على نطاق واسع بواسطة ويلر [17] الذي أظهر كيف يمكن للضبط الصحيح لهذه المكونات المختلفة أن يأخذ طريقة قياسية تصل إلى المستوى من أكثرها دقة.لذلك ليس من المستغرب أن نلاحظ أن أحدث التطورات الحسابية قد ركزت على أشجار التوجيه وتحسينات الوظائف الموضوعية.

يتمثل التحذير الرئيسي لنهج المحاذاة التدريجية في وجود الحدود الدنيا المحلية (مستوى عالٍ من التشابه بين مجموعة فرعية من التسلسلات الناتجة عن قطعة أثرية). على سبيل المثال ، إذا كانت شجرة الدليل تحث على محاذاة تسلسلين مترابطين بشكل بعيد ، فغالبًا ما يحدث أن المحاذاة المثلى لهذين التسلسلين لن تتوافق مع الإسقاط الزوجي الذي سيحصل عليه المرء من MSA الأمثل لمجموعة البيانات بأكملها (أي ضمن MSA ستكون محاذاة التسلسلين دون المستوى الأمثل قليلاً للسماح بأفضلية عالمية على مستوى MSA). هذا الموقف شائع عند التعامل مع متواليات منخفضة الهوية أو منخفضة التعقيد. عند حدوث ذلك ، قد يمنع الحساب المبكر للمحاذاة الزوجية الأولى حساب MSA الأمثل عالميًا.

الإستراتيجية الأكثر شيوعًا لتجنب الحدود الدنيا المحلية أثناء المحاذاة التدريجية هي استخدام الاتساق ، كما هو موضح أصلاً بواسطة [9]. الأساس المنطقي للاتساق واضح نسبيًا: نظرًا لمجموعة من التسلسلات والمحاذاة الزوجية المرتبطة بها ، والتي يتم التعامل معها كقيود ، يتم إعادة تقدير درجات مطابقة أزواج من المخلفات وذلك لتقديم محاذاة زوجية من المرجح أن تكون متوافقة مع MSA الأمثل عالميًا. تم الإبلاغ عن الإستراتيجية الأولى التي تتضمن إعادة تقدير لتكاليف المباراة من قبل Morgenstern كأوزان متداخلة [18]. ألهم هذا المخطط لاحقًا مخطط T-Coffee للتسجيل الذي أصبح نموذجًا أصليًا قائمًا على الاتساق التدريجي [9]. يُعرف تحسين المحاذاة مقابل مجموعة من القيود المحددة مسبقًا بمشكلة تتبع الحد الأقصى للوزن. إنه NP-Complete بموجب صيغه الأكثر شيوعًا ولا يمكن حله إلا للحالات الصغيرة [19 ، 20]. خوارزمية T-Coffee هي نهج إرشادي يتضمن إعادة تقدير التكاليف الأولية لكل مطابقة زوجية محتملة من خلال مراعاة توافقها مع بقية المحاذاة الزوجية. يجعل مخطط التسجيل الناتج من الأرجح تجميع محاذاة فرعية متسقة أثناء إجراء MSA التدريجي. تتمثل القوة الرئيسية لهذا النهج في السماح بحساب MSAs حتى عندما تكون الوظيفة الموضوعية متاحة فقط لتحسينها على مستوى الزوجي. تمت مراجعة الأساليب القائمة على الاتساق وعلاقاتها على نطاق واسع في [4]. منذ ذلك الحين ، أصبح النهج القائم على الاتساق أحد أكثر الأطر الخوارزمية شيوعًا لتطوير طرق جديدة (الشكل 1).

في الخوارزمية القائمة على التناسق ، فإن المعلمة الأكثر أهمية هي المكتبة الأساسية. بالنظر إلى مجموعة من التسلسلات ، فإن المكتبة الأساسية عبارة عن مجموعة من جميع مقارنات التسلسل المزدوج الممكنة. تُستخدم هذه المكتبة لتحديد وظيفة الهدف القائمة على التناسق. في T-Coffee الأصلي [9] ، كانت المكتبة عبارة عن تجميع لكل أزواج البقايا الموجودة في محاذاة المحاذاة الزوجية المحلية والعالمية بأكملها. تم ترجيح أزواج المخلفات هذه وفقًا للموثوقية المقدرة لمحاذاة المصدر. في وقت لاحق ، أنشأ أحد أشكال خوارزمية T-Coffee المسمى ProbCons [10] تفوق المكتبات القائمة على الزوجين HMM. في ProbCons ، يتم تجميع المكتبات باستخدام زوج-HMM لتقدير الاحتمال الخلفي لجميع الأزواج المحتملة من البقايا (بين التسلسلات المميزة) ليتم محاذاتها. سرعان ما أصبح استخدام زوج HMM شائعًا بين طرق المحاذاة الأخرى (الشكل 1). كانت السمات الجديدة الرئيسية لـ ProbCons فوق T-Coffee هي استخدام إطار احتمالي أكثر رسمية ، وذلك بفضل HMM وتنفيذ عقوبة فجوة ثنائية الطور عند تقدير المحاذاة الزوجية. غالبًا ما يُشار إلى الخوارزميات التي تعتمد على مجموعة مماثلة على أنها خوارزميات الاتساق الاحتمالي ، فهي تتضمن محاذاة الجينوم المتعدد PECAN [21] ، والتي تستخدم Durbin [22] إلى الأمام فقط قسِّم وقهر المحاذاة الزوجية و MSAProbs [23] ، والتي تعتمد على قسم وظيفة لتحقيق احتمالات لاحقة أكثر إفادة عند تجميع المكتبة. تم أيضًا دمج درجة معينة من الاتساق في خوارزمية Linsi الخاصة بـ MAFFT.

عند قياسها على محاذاة مرجعية قائمة على الهيكل ، فقد ثبت منذ فترة طويلة أن المصففات القائمة على الاتساق تنتج أكثر دقة MSAs [4 ، 23]. ومع ذلك ، تأتي هذه الدقة بتكلفة كبيرة للذاكرة ووحدة المعالجة المركزية ، حيث تكون معظم التطبيقات تكعيبية في وحدة المعالجة المركزية وتربيعية في الذاكرة مع عدد التسلسلات. تم اقتراح ثلاث استراتيجيات لمعالجة هذه المشكلة. يتضمن أبسط واحد حساب مكتبة أسرع. على سبيل المثال ، FM-Coffee ، يحسب التنفيذ السريع لـ T-Coffee مكتبته باستخدام ثلاثة محاذاة سريعة ، وفي النهاية يستخرج الإسقاطات الزوجية الناتجة. ومن ثم ، فإن الارتباط الكبير بين الإسقاطات المختلفة يجعل من الممكن ربط امتداد الاتساق وتقليل الوقت وتعقيد الذاكرة بشكل كبير على مستوى شبه تربيعي. على الرغم من أن المحاذاة الناتجة ليست دقيقة مثل تلك التي تم الحصول عليها باستخدام الإجراء الافتراضي ، إلا أنها تميل إلى أن تكون أكثر دقة من تلك التي يتم إنتاجها بشكل فردي بالطرق المدمجة. الاستراتيجية الثانية تتضمن الموازاة. تم نشر اثنين من هذه المخططات مؤخرًا Cloud-Coffee [24] و MSAProbs [23] ، وكلاهما يتضمن حسابًا متوازيًا للمكتبة وخطوة الاسترخاء التي يتم خلالها إعادة تقدير التكاليف الزوجية عند إجراء تجميع المحاذاة التدريجي. الخطوة الأخيرة ، التي تتضمن تقسيم الحساب وفقًا لطوبولوجيا الشجرة ، تعتمد بشكل كبير على تناظر شجرة الدليل ، ويتم تحقيق أفضل أداء باستخدام أشجار توجيه متوازنة تمامًا. الاستراتيجية الثالثة أكثر تعقيدًا وتنطوي على ضبط دقة المكتبة من خلال النظر في مقاطع التسلسل بدلاً من البقايا الفردية. هذا التنفيذ ، المتاح في SeqAn [25] ، مناسب بشكل خاص للتسلسلات الطويلة ذات الصلة الوثيقة ، والتي يمكن من خلالها تحديد المقاطع المتطابقة الطويلة.

أدوات تقويم متعددة على نطاق واسع

حتى في أفضل أشكالها ، لا يمكن للطرق القائمة على التناسق التعامل مع أكثر من بضع مئات من التسلسلات. هذا الحد شديد إلى حد ما في سياق أدى فيه انفجار توافر التسلسل الجيني إلى ظهور عائلات متجانسة كبيرة غير مسبوقة يمكن أن تتطلب محاذاة ما يصل إلى 1.5 مليون عضو (عدد ناقلات ABC في Pfam) وقريبًا المزيد. بينما يمكن التشكيك في الأهمية البيولوجية للـ MSAs الكبيرة ، يشير التحليل الأخير إلى أنه يمكن إنشاء نتائج مهمة من مثل هذه النماذج الكبيرة [26] ، مما يجعل البناء الدقيق والفعال للـ MSAs الكبيرة أحد التحديات الكبرى الحالية لبيولوجيا العصر الحديث. هناك ثلاث طرق قادرة حاليًا على التعامل مع مجموعات البيانات الكبيرة هذه: وضع PartTree لـ MAFFT [13] ، Clustal Omega [14] و PASTA [27] ، الإصدار الأحدث من SATé [28] (الشكل 1). تشترك هذه الطرق في خاصية مشتركة: اعتمادها على خطوة تجميع مسبق سريعة (تربيعية فرعية في الوقت المناسب) تجعل من الممكن تحديد الترتيب الذي يجب أن تتم محاذاة التسلسلات به بسرعة.

في الطرق التدريجية الأصلية ، تم تقدير شجرة الدليل من خلال مقارنة جميع التسلسلات مع بعضها البعض لتقدير مصفوفة المسافة. يمكن أن تستند هذه المقارنة إلى محاذاة بطيئة لـ Needleman و Wunsch [8] أو على الصيام ك- مقارنة ناقلات مضاعفة كما تم تنفيذها في MAFFT [13] و MUSCLE [29] و T-Coffee [9]. ومع ذلك ، فإن المقارنة السريعة لا تحل مشكلة متطلبات الوقت والمكان التربيعية لحساب المصفوفة متبوعًا بالتعقيد الزمني المكعب لتقدير الشجرة عند استخدام UPGMA أو NJ. تصبح هذه المتطلبات باهظة عند معالجة أكثر من 10000 تسلسل. تم تصميم أساليب التجميع الحديثة لمعالجة هذه المشكلة. في كلوستال أوميغا [14] ، تم تقدير شجرة الدليل باستخدام طريقة mBed [30]. مبدأ mBed هو تقدير المسافة أولاً بين كل تسلسل ومجموعة فرعية صغيرة من التسلسلات المختارة على أساس طولها. بالنسبة لكل تسلسل ، تكون النتيجة متجه مسافة يمكن استخدامه لتشغيل تسلسل هرمي ك- يعني التجميع (الشكل 1) ، الذي يكون تعقيده منخفضًا نسبيًا (NlogN في ظل أكثر تطبيقات الكشف عن مجريات الأمور شيوعًا) يسمح بمحاذاة مجموعات البيانات الكبيرة المكونة من 10000 تسلسل أو أكثر. يعتمد PartTree على إجراء مختلف قليلاً يتضمن أيضًا استخدام مجموعة صغيرة من تسلسلات البذور لتجميع التسلسلات بسرعة. في كل من mBed و PartTree ، يتم اتباع خطوة ما قبل الكتلة بحساب الأشجار الفرعية التي يتم دمجها معًا في النهاية لتشكيل شجرة الدليل. تم تحسين نهج PartTree مؤخرًا في خوارزمية SATé ، والتي تتضمن خطوة تكرارية إضافية لتحسين الشجرة. أحدث محاولة لمحاذاة مجموعات البيانات الكبيرة هي نسخة معدلة من خوارزمية T-Coffee التي تتضمن الجمع ك- يعني التكتل باستخدام MSA القائم على التناسق عند مستوى أدنى [26]. تتسع هذه المقاربات بشكل جيد ، ولكن على حساب دقة أقل بشكل ملحوظ عند محاذاة تسلسل & gt1000 ، كما هو موضح في تحليل معيار Clustal Omega [14]. كان أحد الآثار الجانبية المحتملة لهذه الدقة المنخفضة هو الإبلاغ عن تناقضات محاذاة عالية بين MAFFT و Clustal Omega و T-Coffee عند التعامل مع مجموعات بيانات كبيرة من متواليات ميتوكوندريا متعامدة متشابهة نسبيًا. عند النظر في مجموعات البيانات الكاملة ، أبلغ المؤلفون عن متوسط ​​مستويات اتفاق منخفضة تصل إلى 60٪ [26].

التقويم المتعدد مدرك للتطور

كان أحد المعالم الرئيسية في تطوير MSAMs هو إدخال محاذاة مرجعية قائمة على الهيكل والتي يمكن استخدامها لمقارنة القدرات النسبية للطرق المختلفة لإعادة بناء المحاذاة الصحيحة هيكليًا من التسلسل فقط. يبدو اختيار الهيكل طبيعيًا إلى حد ما لأن الميزات ثلاثية الأبعاد معروفة بأنها أكثر مرونة تطورية من التسلسلات الأساسية. من ناحية أخرى ، يعتمد هذا النهج على الأساس المنطقي غير المثبت بأن المحاذاة الصحيحة الهيكلية والتطورية متطابقة. لا يوجد دليل على أن هذا الافتراض قد يكون صحيحًا ، وهناك سبب بسيط يشير إلى أنه قد لا يكون كذلك. في الواقع ، بينما يمكن أن يكون هناك طريقة واحدة صحيحة فقط لمطابقة المخلفات المتجانسة - الطريقة التي تعكس تمامًا التاريخ التطوري الفريد للتسلسلات والمطابقات المدروسة - يمكن أن يكون هناك العديد من المحاذاة الصحيحة من الناحية الهيكلية حيث توجد طرق لمطابقة التسلسلات مع ثلاثي الأبعاد مكافئ الاكتناز. التناقض المحتمل الرئيسي الآخر بين المحاذاة الهيكلية والتطورية ينتج عن التطور المتقارب. عندما تكون مثل هذه العملية قد شكلت بعض أجزاء مجموعة بيانات التسلسل ، فإن المحاذاة الناتجة عن مطابقة المناطق المتقاربة ستكون صحيحة من الناحية الهيكلية والخطأ التطوري - وبالمثل.

تمت معالجة هذه المشكلة مؤخرًا من خلال سلسلة من الأعمال التي تهدف إلى تقييم دقة المحاذاة المتعددة على أساس جودة نماذج النشوء والتطور التي تدعمها. ويشار إلى هذه المحاذاة باسم التقويم الوراثي المدرك للتطور (الشكل 1). كان PRANK [31] واحدًا من الأوائل. يعتمد على فكرة أن MSA الصحيح يجب أن يكون له أنماط indels التي تعكس بشكل صحيح شجرة النشوء والتطور. تمت متابعة PRANK بسرعة بواسطة SATé [28] ، وهو مصفف متعدد تكراري مشتق من MAFFT يحاول تقدير MSA الذي يدعم أعلى شجرة احتمالية حاصلة على أعلى الدرجات. من المزايا المهمة لهذا النهج الابتعاد عن الافتراض الذي طال أمده بأن أفضل MSA هو الذي يزيد التشابه بين التسلسلات. في سياق التقويم الوراثي المدرك للتطور ، يتم تعريف أفضل MSA على أنه أفضل نموذج للتطور الوراثي [32]. تعتبر العواقب على المحاذاة الناتجة كبيرة إلى حد ما وقد تم توضيحها بشكل جيد بشكل خاص في تحليل حديث أجراه Blackburne و Whelan اللذان وجدا أن MSAMs `` القائمة على التشابه '' (مثل ClustalW و MUSCLE و ProbCons و MAFFT و T-Coffee) و تميل MSAMs (مثل PRANK و BAliPhy) إلى تكوين مجموعات منفصلة تحت المقياس متعدد الأبعاد بناءً على مقاييس التشابه الخاصة بها بين أزواج من MSAs البديلة [33]. وجد هؤلاء المؤلفون أن المحاذاة المختارة لها تأثير كبير على الاستدلال النشوء والتطور في المصب والإبلاغ عن طوبولوجيا الشجرة وطول الفرع للاعتماد على فئة المصففات. يكون للمحاذاة أيضًا تأثير واضح عند تحديد الاختيار الإيجابي ، مع قراءات مختلفة مرتبطة بمختلف التقويمات كما ورد في تحليل العديد ذبابة الفاكهة الجينوم [34]. يقترح موريسون أن علماء علم الوراثة عادة ما يكونون غير راضين عن المحاذاة القائمة على التشابه ويميلون إلى تعديل MSA يدويًا لإنتاج محاذاة من المرجح أن تعكس التماثل من وجهة نظر تطورية حقيقية [32]. قد تفسر هذه الملاحظة أيضًا سبب اختلاف النتائج والطريقة التي تم تحقيقها على مجموعات البيانات المحاكاة التطورية اختلافًا كبيرًا عن تلك المقاسة على البيانات التجريبية القائمة على الهيكل [4]. ومع ذلك ، أظهرت دراسة حديثة أجراها تشانغ [35] أنه يمكن استخدام نفس مؤشر الموثوقية لاختيار كل من المواضع الأكثر إفادة من الناحية التطورية والمواقف التي يحتمل أن تحتوي على بقايا متشابهة من الناحية الهيكلية. من الجدير بالذكر أن هذه الدراسة أعطت نتائج متناقضة فيما يتعلق بالمحاذاة المدركة للتطور ، وبينما يبدو أن أداء SATé جيد في كل من البنية والمعايير التطورية ، تم العثور على PRANK لإرجاع محاذاة هيكلية ضعيفة ، مع القدرة على إنتاج محاذاة تدعم الأشجار باستخدام دقة قابلة للمقارنة مع MSAMs الأخرى - علم النشوء والتشابه القائم.


محاذاة التسلسل الزوجي

محاذاة التسلسل الزوجي يقارن تسلسلين فقط في كل مرة ويوفر أفضل محاذاة تسلسل ممكنة. ثنائي من السهل فهمه واستنتاجه استثنائيًا من محاذاة التسلسل الناتجة.

يوفر Biopython وحدة خاصة ، Bio.pairwise2 لتحديد تسلسل المحاذاة باستخدام طريقة الازدواج. يطبق Biopython أفضل خوارزمية للعثور على تسلسل المحاذاة وهو مكافئ للبرامج الأخرى.

دعنا نكتب مثالًا للعثور على محاذاة التسلسل لتسلسلين بسيطين وافتراضيين باستخدام وحدة زوجية. سيساعدنا هذا على فهم مفهوم محاذاة التسلسل وكيفية برمجته باستخدام Biopython.

الخطوة 1

قم باستيراد الوحدة زوجي 2 بالأمر الموضح أدناه & ناقص

الخطوة 2

قم بإنشاء تسلسلين ، seq1 و seq2 & amp ؛ ناقص

الخطوه 3

طريقة استدعاء pairwise2.align.globalxx مع seq1 و seq2 للعثور على المحاذاة باستخدام سطر الكود أدناه & ناقص

هنا، globalxx تؤدي الطريقة العمل الفعلي وتجد أفضل المحاذاة الممكنة في التسلسلات المحددة. في الواقع ، يوفر Bio.pairwise2 مجموعة كبيرة من الطرق التي تتبع الاتفاقية أدناه للعثور على محاذاة في سيناريوهات مختلفة.

هنا ، يشير نوع محاذاة التسلسل إلى نوع المحاذاة الذي قد يكون عالمي أو محلي. عالمي النوع هو إيجاد محاذاة التسلسل من خلال أخذ التسلسل بأكمله في الاعتبار. النوع المحلي هو إيجاد محاذاة التسلسل من خلال النظر في المجموعة الفرعية من التسلسلات المحددة أيضًا. سيكون هذا مملاً ولكنه يوفر فكرة أفضل عن التشابه بين التسلسلات المحددة.

يشير X إلى النتيجة المطابقة. القيم المحتملة هي x (المطابقة التامة) ، و m (الدرجة بناءً على الأحرف المتطابقة) ، و d (القاموس الذي يوفره المستخدم مع الحرف ودرجة المطابقة) وأخيرًا c (وظيفة محددة من قبل المستخدم لتوفير خوارزمية تسجيل مخصصة).

يشير Y إلى عقوبة الفجوة. القيم المحتملة هي x (لا عقوبات فجوة) ، s (نفس العقوبات لكل من التسلسل) ، d (عقوبات مختلفة لكل تسلسل) وأخيرًا c (وظيفة يحددها المستخدم لتوفير عقوبات فجوة مخصصة)

لذلك ، تعد localds أيضًا طريقة صالحة ، والتي تجد محاذاة التسلسل باستخدام تقنية المحاذاة المحلية ، والقاموس الذي يوفره المستخدم للمطابقات ، وعقوبة الفجوة التي يوفرها المستخدم لكلا التسلسل.

هنا ، يشير blosum62 إلى قاموس متوفر في وحدة pairwise2 لتقديم نتيجة المطابقة. -10 يشير إلى عقوبة الفتح و -1 يشير إلى عقوبة تمديد الفجوة.

الخطوة 4

قم بعمل حلقة فوق كائن المحاذاة القابلة للتكرار واحصل على كل كائن محاذاة فرديًا واطبعه.

الخطوة الخامسة

توفر الوحدة النمطية Bio.pairwise2 طريقة تنسيق ، format_alignment لتصور النتيجة بشكل أفضل & ناقص

يوفر Biopython أيضًا وحدة أخرى للقيام بمحاذاة التسلسل ، Align. توفر هذه الوحدة مجموعة مختلفة من واجهة برمجة التطبيقات (API) لتعيين المعلمة ببساطة مثل الخوارزمية والوضع ودرجة المطابقة وعقوبات الفجوة وما إلى ذلك ، نظرة بسيطة على كائن المحاذاة هي كما يلي & ناقص


بالنسبة إلى metasite المرتبط بمجموعة واسعة من برامج تحليل تسلسل البروتين والتنبؤات الهيكلية عبر الإنترنت ، أوصي بـ PredictProtein (ROSTLAB و Technische Universit و aumlt M & uumlnchen). انظر أيضًا: توقع بروتين SCRATCH (معهد علم الجينوم والمعلوماتية الحيوية ، جامعة كاليفورنيا ، إيرفين ، الولايات المتحدة الأمريكية)

العديد من المواقع الرائعة للتحليل عبر الإنترنت للبروتينات الغشائية المحتملة هي: (تسلسل الاختبار ارى توجيه البروتينات في الأغشية لـ 268 بنية بروتين غشاء حلزونية فريدة)

TMpred - التنبؤ بالمناطق عبر الأغشية والتوجه - ISREC (المعهد السويسري لأبحاث السرطان التجريبية)
TMHMM - توقع حلزونات الغشاء في البروتينات (مركز تحليل التسلسل البيولوجي ، الجامعة التقنية في الدنمارك)
DAS - خادم التنبؤ عبر الغشاء (جامعة ستوكهولم ، السويد)
الانقسام (د. يوريتيك ، جامعة سبليت ، كرواتيا) - يوفر خادم تنبؤ طوبولوجيا البروتين عبر الغشاء ناتجًا واضحًا وملونًا بما في ذلك تفضيل بيتا ومؤشر عزم الكارهة للماء المعدل.
OCTOPUS - باستخدام مزيج جديد من نماذج Markov المخفية والشبكات العصبية الاصطناعية ، يتنبأ OCTOPUS بالطوبولوجيا الصحيحة لـ 94٪ من مجموعة البيانات المكونة من 124 تسلسلًا بهياكل معروفة. (المرجع: Viklund، H. & amp

Phobius - عبارة عن طوبولوجيا عبر الغشاء مجمعة ومؤشر ببتيد إشارة (المرجع: L. K & aumlll et al. 2004. جيه مول. بيول. 338: 1027-1036) يمكن أيضًا الوصول إلى هذه الأداة هنا (EBI).

CCTOP (جالتعداد جمقيد أعلىology) خادم - يستخدم 10 طرق مختلفة للتنبؤ بالطوبولوجيا الحديثة ، ويدمج خادم CCTOP معلومات الطوبولوجيا من المصادر التجريبية والحاسوبية الحالية المتوفرة في قواعد بيانات PDBTM و TOPDB و TOPDOM باستخدام الإطار الاحتمالي لنموذج ماركوف المخفي. يوفر الخادم خيار تسبق تنبؤات الهيكل بتنبؤ إشارة الببتيد وتمييز البروتين الكروي عبر الغشاء. (المرجع: Dobson L et al. (2015) Nucleic Acids Res 43 (W1): W408 و ndashW412).

TMFoldWeb - هو تطبيق خادم الويب لـ TMFoldRec ، وهي خوارزمية للتعرف على طيات البروتين عبر الغشاء. يستخدم TMFoldRec الإمكانات الإحصائية ويستخدم ترشيح الطوبولوجيا وخوارزمية ترابط بدون فجوات. إنه يصنف هياكل القوالب ويختار المرشحين الأكثر ترجيحًا ويقدر موثوقية نموذج الطاقة الأقل الذي تم الحصول عليه. تم تطوير الإمكانات الإحصائية في إطار أقصى احتمالية على مجموعة تمثيلية من قاعدة بيانات PDBTM.وفقًا للاختبار المعياري ، يبلغ أداء TMFoldRec حوالي 77 ٪ في التنبؤ الصحيح بفئة أضعاف لتسلسل بروتين عبر الغشاء معين. (المرجع: Kozma D & amp Tusn & aacutedy GE (2015) Biol Direct. 10: 54).

MEMSATSVM - هو تنبؤ محسّن لطوبولوجيا البروتين عبر الغشاء باستخدام SVMs. هذه الطريقة قادرة على تمييز ببتيدات الإشارة من الحلزون عبر الغشاء. (المرجع: Reeb J et al. (2015) Proteins 83(3): 473-84).

MEMEMBED - التنبؤ بتوجه بروتين الغشاء. قادر على توجيه بروتينات غشاء ألفا-حلزونية وبيتا داخل الطبقة الدهنية الثنائية بسرعة وبدقة ، مما يُظهر اتفاقًا أوثق مع القيم المحددة تجريبياً من الطرق الحالية. نوضح أيضًا كلاً من التحسينات المتسقة والهامة لنماذج البروتين الغشائي والتمييز الفعال بين الهياكل الأصلية والفخ (المرجع: Nugent T & amp DT Jones (2013) BMC Bioinformatics 14: 276)

RHYTHM - يتنبأ بتوجه حلزونات الغشاء في القنوات والملفات الغشائية ، وتحديداً المدفونة مقابل المخلفات المكشوفة. (المرجع: A. Rose et al. 2009. Nucl. Acids Res. 37(مشكلة خادم الويب): W575-W580)

TMMOD - نموذج ماركوف المخفي للتنبؤ بطوبولوجيا البروتين عبر الغشاء (قسم علوم الحاسب والمعلومات ، جامعة ديلاوير ، الولايات المتحدة الأمريكية) - في صفحة النتائج ، انقر فوق & quot اعرض الاحتمالات اللاحقة & quot لرؤية مخطط من نوع TMHMM

PRED-TMR2 (C. Pasquier & amp S.J. Hamodrakas ، قسم بيولوجيا الخلية والفيزياء الحيوية ، جامعة أثينا ، اليونان) - عند تطبيقه على عدة مجموعات اختبار لبروتينات الغشاء ، يعطي النظام تقديرًا مثاليًا للتنبؤ بنسبة 100٪ عن طريق تصنيف جميع التسلسلات في فئة الغشاء. معدل الخطأ 2.5٪ فقط مع البروتينات غير الغشائية.

TOPCONS - يحسب تنبؤات الإجماع لطوبولوجيا البروتين الغشائي باستخدام نموذج ماركوف المخفي (HMM) والمدخلات من خمس طرق تنبؤ طوبولوجيا حديثة. (المرجع: A. Bernsel et al. 2009. Nucleic Acids Res. 37(إصدار خادم الويب) ، W465-8). بالنسبة لخادم الدُفعات بدون عمليات تشغيل بلاست ، استخدم TOPCONS مفرد.

مينو ( مبروتين امبران أنادينtificatioن معOU• الاستخدام الصريح لملامح ومحاذاة المعالجة المائية) - يتنبأ بمجالات غشاء ألفا حلزونية وكذلك ورقة بيتا (TM) بناءً على تمثيل مضغوط لبقايا الأحماض الأمينية وبيئتها ، والتي تتكون من إمكانية الوصول إلى المذيبات المتوقعة والهيكل الثانوي لكل حمض أميني. (المرجع: Cao et al. 2006. Bioinformatics 22: 303-309). أسطورة للمساعدة في تفسير النتائج هنا.

SuperLooper - يوفر أول واجهة عبر الإنترنت للبحث التلقائي والسريع والتفاعلي ووضع الحلقات في البروتينات. (المرجع: P.W. Hildebrand et al. 2009. Nucl. Acids Res. 37(مشكلة خادم الويب): W571-W574))

توقع شبك الغشاء (TMKink) - السمة المميزة لبنية بروتين الغشاء هي العدد الكبير من حلزونات الغشاء المشوهة. بسبب انتشار الانحناءات ، من المهم ليس فقط فهم كيفية تولدها ولكن أيضًا معرفة كيفية التنبؤ بحدوثها. هنا ، نجد أن هناك تفضيلات تسلسلية محلية في الحلزونات المتعرجة ، وأبرزها وفرة أعلى من البرولين ، والتي يمكن استغلالها لتحديد الانحناءات من معلومات التسلسل المحلي. يحدد متنبئ الشبكة العصبية أكثر من ثلثي جميع الانحناءات (حساسية 0.70) بموثوقية عالية (خصوصية 0.89). (المرجع: Meruelo AD et al. 2011. Protein Sci. 20:1256-64)

طريقة بطاقة تسجيل SCMMTP لبروتينات نقل الغشاء: تحديد وتوصيف بروتينات نقل الغشاء باستخدام درجات الميل من ثنائي الببتيدات. دقة التدريب والاختبار لـ SCMMTP هي 83.81٪ و 76.11٪ على التوالي. (المرجع: Vasylenko، T. et al. 2015. BMC Bioinformatics، 16 (ملحق 1): S8 ، 2015)

لرسم هيكل بروتينات الغشاء يتوفر موقعان:

بروتر - أداة مفتوحة المصدر للتكامل التفاعلي وتصور ميزات تسلسل البروتين المشروح والمتوقع جنبًا إلى جنب مع الأدلة البروتينية التجريبية. يدعم Protter العديد من تنسيقات الملفات البروتينية ويدمج تلقائيًا مجموعة متنوعة من مصادر التعليقات التوضيحية للبروتين المرجعي ، والتي يمكن تمديدها بسهولة عبر المكونات الإضافية المعيارية. تنتج وظيفة التصدير المضمنة رسومات توضيحية بروتينية مخصصة بجودة النشر ، وكذلك لمجموعات البيانات الكبيرة. (المرجع: U. Omasits et al. 2014. المعلوماتية الحيوية. 30:884-886). رسم تخطيطي لهولين من عاثيات لامدا تم إنشاؤها باستخدام بروتر:

أعلى 2 (S. Johns، UCSF Sequence Analysis Consulting Service Consulting، USA) - يوفر هذا الموقع تحكمًا كبيرًا في العرض. يتم توفير وثائق واسعة النطاق هنا.

TMRPres2D (T rans M embrane protein R e- إدخال مسبق في أداة 2 D imensions) - تأخذ أداة Java هذه البيانات من مجموعة متنوعة من خوادم طي البروتين وتقوم بإنشاء صور / نماذج رسومية موحدة وثنائية الأبعاد وعالية التحليل من ألفا حلزونية أو بروتينات الغشاء بيتا برميل. (المرجع: I.C. Spyropoulos et al. 2004. المعلوماتية الحيوية 20: 3258-3260).

التعرف على إشارة الببتيد وتوطين الخلايا الفرعية:

A. البروتينات البكتيرية

PSORTb (مختبر برينكمان ، جامعة سيمون فريزر ، كندا) - يوفر على الأرجح أدق مؤشر لتوطين البروتين البكتيري تحت الخلوي. بدلا من ذلك استخدم PSORT (جامعة طوكيو ، اليابان) - سلسلة من البرامج للتنبؤ بمواقع توطين البروتين في الخلايا. اختر البرامج المخصصة للبروتينات الحيوانية أو الخميرة أو النباتية أو البكتيرية (سالبة الجرام أو إيجابية الجرام).
PSLpred - هي طريقة تعتمد على SVM ، وتتوقع 5 توطين خلوي رئيسي (السيتوبلازم ، الغشاء الداخلي ، الغشاء الخارجي ، خارج الخلية ، المحيط) للبكتيريا سالبة الجرام. تتضمن هذه الطريقة وحدات SVM مختلفة بناءً على ميزات مختلفة للبروتينات. حقق النهج الهجين دقة إجمالية قدرها 91 ٪ ، وهو الأفضل من بين جميع الطرق الحالية للتوطين الخلوي للبروتينات بدائية النواة. ( المرجعي: 21: 2522-2524.)

CELLO subCELلولار لونظام تنبؤي بالمعايرة - يخصص البروتينات سالبة الجرام إلى السيتوبلازم أو الغشاء الداخلي أو المحيط أو الغشاء الخارجي أو الفضاء خارج الخلية مع دقة تنبؤ شاملة تبلغ ca. 89٪. يحلل أيضًا البروتينات حقيقية النواة وإيجابية الجرام. (المرجع: CS Yu et al. 2004. Protein Sci. 13:1402-1406). تم تحديث CELLO2GO (البروتين الفرعيCELلولار لوتوقع المعايرة مع الوظيفة جيإن اشرح علمي) - يجب أن يكون CELLO2GO أداة مفيدة للبحث الذي يتضمن أنظمة خلوية معقدة لأنه يجمع بين CELLO و BLAST في نظام أساسي واحد ويمكن التلاعب بمخرجاته بسهولة بحيث يمكن معالجة الأسئلة الخاصة بالمستخدم بسهولة (المرجع: Yu CS et al. 2014. بلوس وان 9: e99368).

SignalP - يتنبأ بوجود وموقع مواقع انقسام ببتيد الإشارة في بروتينات إيجابية الجرام وسالبة الجرام وحقيقية النواة (مركز تحليل التسلسل البيولوجي ، الجامعة التقنية في الدنمارك). للحصول على مثال على تسلسل اختبار استخدام البروتين periplasmic الذكر.
Phobius - عبارة عن طوبولوجيا عبر الغشاء مجمعة ومؤشر ببتيد إشارة (المرجع: L. K & aumlll et al. 2004. جيه مول. بيول. 338: 1027-1036).
LipoP 1.0.0 تحديث (مركز تحليل التسلسل البيولوجي بالجامعة التقنية الدنماركية) - يسمح بالتنبؤ بمكان انقسام الببتيدات I & amp II للإشارة من البكتيريا سالبة الجرام سوف يشق البروتين.

SecretomeP - ينتج البداية تنبؤات غير كلاسيكية بمعنى آخر. لا يشير الببتيد إلى إفراز البروتين. تستفسر الطريقة عن عدد كبير من خوادم التنبؤ بالميزات الأخرى للحصول على معلومات حول الجوانب المختلفة لما بعد الترجمة والموقع للبروتين ، والتي يتم دمجها في التنبؤ النهائي للإفراز (المرجع: JD Bendtsen et al.2005. BMC Microbiology 5: 58).

SSPRED - تحديد وتصنيف البروتينات المشاركة في أنظمة الإفراز البكتيري. لا تقدم أكثر من أربعة بروتينات دفعة واحدة. (المرجع: Pundhir، S.، & amp Kumar، A. 2011. Bioinformation 6: 380-382).

Signal Find Server - يتضمن (أ) FlaFind الذي يتنبأ ببتيدات إشارة من الدرجة الثالثة (من النوع IV شبيه بيلين) (ببتيدات إشارة من الفئة الثالثة) ومواقع انشقاق ببتيداز prepilin (ب) EppA-pilinFind الذي يتنبأ ببتيدات إشارة من الدرجة الثالثة تتم معالجتها بواسطة a ببتيداز بريبيلين فريد من نوعه ، EppA (c) TatFind الذي يتنبأ بببتيدات إشارة ثنائية الأرجينين (Tat) الأثرية والبكتيرية (د) PilFind الذي يتوقع الببتيدات البكتيرية من النوع IV الشبيه بالبيلين ومواقع انشقاق ببتيداز البيبلين و (هـ) TatLipo الذي يتنبأ بببتيدات إشارة Tat Haloarchaeal التي تحتوي على موقع انقسام SPase II (lipobox).

Signal-3L 2.0 - هو خادم عبر الإنترنت للتنبؤ بببتيد إشارة البروتين الطرفية N ، والمدخلات عبارة عن تسلسل الأحماض الأمينية فقط. تم إنشاؤه باستخدام نموذج خليط هرمي ، والذي يحتوي على الطبقات الثلاث التالية: (1) تمييز بروتينات SP (Signal Peptide) وبروتينات TMH (TransMembrane Helical) من البروتينات الكروية الأخرى (2) التعرف على بروتينات SP من بروتينات TMH و ، (3) تحديد مواقع انشقاق بروتينات SP. (المرجع: YZ Zhang & amp H-B. Shen. Journal of Chemical Information and Modeling، 2017، 57: 988-999)

PrediSi - بريدIction من SIgnal peptides (كارستن هيلر ، جامعة براونشفايغ التقنية)

Signal Find Server - يوفر العديد من البرامج المتميزة: (أ) يتنبأ FlaFind بببتيدات إشارة من الدرجة الثالثة (من النوع IV شبيه بيلين) (ببتيدات إشارة من الفئة الثالثة) ومواقع انشقاق ببتيداز prepilin. (ب) تتنبأ EppA-pilinFind بببتيدات الإشارة من الفئة الثالثة التي تتم معالجتها بواسطة ببتيداز بريبيلين الأصلي الفريد من نوعه ، EppA. (ج) تتنبأ TatFind بببتيدات إشارة إزاحة الأرجينين التوأم (Tat) الأثرية والبكتيرية. (د) تتنبأ PilFind ببتيدات الإشارة البكتيرية من النوع الرابع الشبيه بالبيلين ومواقع انقسام ببتيداز البيبلين. (هـ) تتنبأ TatLipo بببتيدات إشارة Tat Haloarchaeal التي تحتوي على موقع انقسام SPase II (lipobox).

B. بروتينات حقيقية النواة

يتنبأ DeepLoc-1.0 بالتوطين الخلوي للبروتينات حقيقية النواة. يمكن أن يفرق بين 10 مواقع مختلفة: النواة ، السيتوبلازم ، خارج الخلية ، الميتوكوندريا ، غشاء الخلية ، الشبكة الإندوبلازمية ، البلاستيدات الخضراء ، جهاز جولجي ، الليزوزوم / الفراغ والبيروكسيسوم. يحقق نموذجهم دقة جيدة (78٪ لعشر فئات 92٪ للغشاء المربوط أو القابل للذوبان) ، متفوقًا على أحدث الخوارزميات الحالية ، بما في ذلك تلك التي تعتمد على معلومات التماثل. (المرجع: Almagro Armenteros JJ et al. 2017. المعلوماتية الحيوية 33(21): 3387-3395).

يقبل الإصدار 1.2 من Prowler Subcellular Localization Predictor تسلسل الأحماض الأمينية ، المعروضة بتنسيق FASTA ، ويحدد توطين البروتين من بين الفئات التالية: المسار الإفرازي (وجود إشارة ببتيد SP) الميتوكوندريا (وجود ميتوكوندريا يستهدف الببتيد mTP) البلاستيدات الخضراء (وجود الببتيد العابر للبروتينات الخضراء المطبقة فقط على البروتينات النباتية) وغيرها (النواة أو السيتوبلازم أو غير ذلك). (المرجع: Bod & eacuten، M. and Hawkins (2005) المعلوماتية الحيوية. 21(10): 2279-2286).
WoLF PSORT - (المعهد الوطني للعلوم والتكنولوجيا المتقدمة ، اليابان) (المرجع: Horton P et al. (2007) Nucleic Acids Res. 35 (مشكلة خادم الويب): W585 و ndashW587).

ngLOC - هو مصنف بايزي قائم على n-gram يتنبأ بالتوطين الخلوي للبروتينات في كل من بدائيات النوى وحقيقيات النوى. تتراوح دقة التنبؤ الإجمالية من 85.3٪ إلى 91.4٪ عبر الأنواع. يمكن لهذا البرنامج التنبؤ بـ 11 موقعًا متميزًا في كل من الأنواع النباتية والحيوانية. تتنبأ ngLOC أيضًا بـ 4 و 5 مواقع مميزة على مجموعات البيانات البكتيرية موجبة الجرام وسالبة الجرام ، على التوالي. (المرجع: King BR et al BMC Res Notes. 5: 351 ).

بروتكومب (سوفتبيري ، الولايات المتحدة الأمريكية) يمكن استخدامها للتنبؤ بالتوطين الخلوي للبروتينات الحيوانية / الفطرية والنباتية.

SecretomeP - ينتج البداية تنبؤات غير كلاسيكية بمعنى آخر. لا يشير الببتيد إلى إفراز البروتين. تستعلم الطريقة عن عدد كبير من خوادم التنبؤ بالميزات الأخرى للحصول على معلومات حول الجوانب المختلفة لما بعد الترجمة والموقع للبروتين ، والتي يتم دمجها في التنبؤ النهائي للإفراز (المرجع: JD Bendtsen et al.2005. BMC Microbiology 5: 58).

تشمل المواقع الأخرى لتوقعات البنية الثانوية ما يلي:

JPred4 - هو أحدث إصدار من خادم التنبؤ بالهيكل الثانوي لبروتين JPred الشهير والذي يوفر تنبؤات بواسطة خوارزمية JNet ، وهي واحدة من أكثر الطرق دقة للتنبؤ بالهيكل الثانوي. بالإضافة إلى البنية الثانوية للبروتين ، يقوم JPred أيضًا بعمل تنبؤات حول إمكانية الوصول إلى المذيبات ومناطق الملف الملفوف. يتميز JPred4 بدقة أعلى ، مع دقة تنبؤ بالهيكل الثانوي ثلاثي الحالات (a-helix و szlig-strand و coil) تبلغ 82.0٪ بينما تم رفع دقة التنبؤ بإمكانية الوصول إلى المذيبات إلى 90٪ للمخلفات و 5٪ يمكن الوصول إليها. (المرجع: A. Drozdetskiy et al. 2015.Nucl. Acids Res. 43 (W1): W389-W394).

تسلسل بروتين الشبكةnalysis في IBCP - (Institut de Biologie et Chemie des Proteines ، ليون ، فرنسا) - لديه DSC و GORIV و Predator و SOPMA وطريقة الشبكة العصبية الوراثية بالإضافة إلى البرامج القديمة.

منضدة عمل تحليل تسلسل البروتين PSIPRED - تتضمن PSIPRED v3.3 (توقع الهيكل الثانوي) DISOPRED3 و amp DISOPRED2 (توقع الاضطراب) pGenTHREADER (التعرف على الطي المستند إلى الملف الشخصي) MEMSAT3 & amp MEMSAT-SVM (توقع اللولب الغشائي) BioSerf نموذج الإصدار 2.0 (توقع مجال البروتين) FFPred 3 (التنبؤ بوظيفة حقيقية النواة) GenTHREADER (التعرف السريع على الطي) MEMPACK (توقع SVM لطوبولوجيا TM وتعبئة اللولب) pDomTHREADER (التعرف على المجال الطي) و DomSerf v2.0 (نمذجة المجال الآلي بواسطة Homology). (المرجع: Buchan DWA et al. 2013. Nucl. Acids Res. 41 (W1): W340-W348).

للحصول على مجموعة كاملة من خصائص البروتين الخاص بك بما في ذلك مقاومة الماء ، حلزون ألفا ، مخططات صفائح بيتا ، انظر ProScale (ExPASy ، سويسرا).

الدول المضطربة:

العديد من البروتينات التي تحتوي على مناطق لا تشكل هياكل محددة جيدًا والبرامج الجديدة التالية تساعد في تحديد هذه المناطق:

D2P2 (قاعدة بيانات تنبؤات البروتين المضطرب) - تم تشغيل مجموعة من تنبؤات الاضطراب ومتغيراتها ، VL-XT و VSL2b و PrDOS و PV2 و Espritz و IUPred ، على عدد كبير من تسلسلات البروتين. يتم توفير عمليات البحث مقابل قاعدة البيانات ويتم توفير روابط لكل خادم من الخوادم المضطربة. (المرجع: Oates ME et al. (2013). Nucleic Acids Res 41 (د 1): D508-D516).

RONN (الشبكة العصبية للترتيب الإقليمي) - (المرجع: Z.R. Yang et al. 2005. المعلوماتية الحيوية 21: 3369-3376). لتفسير الاضطراب المحلي انظر هنا.
IUPred - الافتراض الأساسي هو أن البروتينات الكروية تتكون من الأحماض الأمينية التي لديها القدرة على تكوين عدد كبير من التفاعلات المفضلة ، في حين أن البروتينات غير المنظمة جوهريًا (IUPs) لا تتبنى أي بنية مستقرة لأن تركيبها من الأحماض الأمينية لا يسمح بالتفاعلات الملائمة الكافية شكل. (المرجع: Z. 3433-3434).
DISOPRED3 (المرجع: J.J. Ward et al. 2004. J. Molec. Biol. 337: 635-645).

PrDOS هو خادم للتنبؤ بالمناطق المضطربة محليًا لسلسلة البروتين من تسلسل الأحماض الأمينية. يعرض PrDOS احتمالية حدوث اضطراب لكل بقايا كنتائج تنبؤ (المرجع: Ishida T، & amp Kinoshita K (2007) Nucleic Acids Res. 35 (مشكلة خادم الويب): W460-4.).

MFDp (ممتقدم Fالقائم على الاستخدام دisorder صredictor) - يهدف إلى تحسين التنبؤات الحالية بالاضطراب. (المرجع: MJ Mizianty et al. 2010. Bioinformatics 26: i489-i496)

MoRFpred - موlecular صالإدراك Fالميزات (MoRFs) هي مناطق ربط قصيرة تقع داخل مناطق مضطربة جوهريًا أطول ترتبط بشركاء البروتين عبر انتقالات الاضطراب إلى الترتيب. MoRFs متورطة في عمليات مهمة بما في ذلك الإشارات والتنظيم. MoRFpred هي أداة حسابية للتنبؤ على أساس التسلسل وتوصيف مناطق الربط القصيرة من اضطراب إلى ترتيب في البروتينات التي تحدد جميع أنواع MoRF (a ، & szlig ، coil and complex). (المرجع: F.M. Disfani et al. 2012. Bioinformatics 28: i75-i83).

سكوبي المجال (سإكوينجهيدرافتاهأوبicitذ يتوقع نطاقق) هي طريقة لتحديد المناطق الكروية في تسلسل البروتين المناسبة للدراسات الهيكلية. يمكن استخدام تطبيق JAVA الصغير Scooby-domain كأداة لتحديد المناطق & # 39 قابلة للطي & # 39 بصريًا في تسلسل البروتين. رسومات مثيرة للاهتمام. (المرجع: R.A. George et al. 2005. Nucl. Acids Res. 33: W160-W163).

للحصول على تقديرات حول مستضدات مناطق البروتينات ، انظر:

مؤامرة الأنتيجين (وحدة JaMBW) - بالنظر إلى تسلسل الأحماض الأمينية ، يقوم هذا البرنامج بحساب ورسم مولد الضد على طول سلسلة البولي ببتيد ، كما تنبأت خوارزمية Hopp & amp Woods (1981).
ساب بريد - هو خادم تنبؤ بالأجسام المضادة يعتمد على البنية (المرجع: J. Dunbar et al. Nucleic Acids Res. 2016 44 (مشكلة خادم الويب): W474 و ndashW478.

مستضد EMBOSS (حزمة EMBOSS) - يتنبأ هذا البرنامج بالمناطق التي يحتمل أن تكون مستضدية في تسلسل البروتين ، باستخدام طريقة Kolaskar & amp Tongaonkar (1990). يمكن الوصول إليها أيضًا هنا.

أداة تصميم OptimumAntigen والتجارة (جين سكريبت) - تم تحسين الببتيدات باستخدام خوارزمية تصميم المستضد الأكثر تقدمًا في الصناعة. يتم قياس كل ببتيد مقابل عدة قواعد بيانات بروتينية لتأكيد خصوصية الحاتمة المرغوبة. تشمل فوائد استخدام OptimumAntigen & Trade Design Tool تجنب الحلقات غير المكشوفة ، والقدرة على تحديد التفاعل التبادلي المرغوب ، والاستضداد القوي للببتيد المختار ، وتحديد أفضل خيارات الاقتران والعرض للمقايسة (الاختبارات) المرغوبة ، واستخدام البرنامج التعليمي الببتيد المدمج من أجل التوليف والذوبان ، والاستجابة المناعية المضمونة.

EpiC (مصدر اختيار ProteomeBinders Epitope) يجمع ويقدم ملخصًا للوظيفة الهيكلية والتنبؤ باستضد البروتين الخاص بك لمساعدتك في تصميم الأجسام المضادة المناسبة لتجاربك المخطط لها. (المرجع: Haslam، N. & amp Gibson. T. Proteome Res.، 2010، 9 (7): 3759 & ndash3763).

SVMTriP - هي طريقة للتنبؤ بحلقات مستضدية باستخدام آلة ناقلات الدعم لدمج التشابه والميل ثلاثي الببتيد. (المرجع: B. Yao et al. PLoS ONE (2012) 7(9):e45152).

لفحص مناطق الملفوف في البروتينات ، استخدم:

الملفات - التنبؤ بمناطق الملف الملفوف في التروتينات (العقدة السويسرية لـ EMBnet ، سويسرا) - (المرجع: A. Lupas et al. 1991 Science 252: 1162-1164). انظر أيضًا PCOILS و MARCOILS.
أزواج (مختبر MIT لعلوم الكمبيوتر ، الولايات المتحدة الأمريكية) - (المرجع: B. Berger et al. 1995. Proc. Natl. Acad. Sci. USA، 92: 8259-8263) أو MultiCoil - يعتمد على خوارزمية PairCoil ويستخدم لتحديد موقع الملفات الملفوفة ثنائية الأبعاد وثلاثية الأبعاد. (المرجع: E. Wolf et al. 1997. Protein Sci. 6: 1179-1189). ملف P

ريبير (اعادة عديأكل ولهم لكلiodicities) - يكتشف ويحلل المناطق ذات التكرارات القصيرة الخالية من الفجوات في البروتينات.يجد الدوريات بواسطة تحويل فورييه (FTwin) وتحليل التشابه الداخلي (REPwin). يخصص FTwin القيم العددية للأحماض الأمينية التي تعكس خصائص معينة ، على سبيل المثال الكراهية للماء ، وتعطي معلومات عن الفترات المقابلة. يستخدم REPwin المحاذاة الذاتية ويعرض التكرارات التي تكشف عن أوجه تشابه داخلية كبيرة. يتم استكمالها بواسطة PSIPRED والتنبؤ بالملف الملفوف (COILS) ، مما يجعل الخادم أداة تحليلية مفيدة للبروتينات الليفية. (المرجع: M. Gruber وآخرون 2005. Nucl. Acids Res. 33: W239-W243).

بروتينات الغشاء الخارجي بيتا برميل: (تسلسل الاختبار)

PRED-TM & szlig & szlig (باجوس ، بي جي ، وآخرون.بيولوجيا الخلية والفيزياء الحيوية ، جامعة أثينا ، اليونان) - يستخدم طريقة Hidden Markov Model ، القادرة على التنبؤ والتمييز بين بروتينات الغشاء الخارجي ذات الأسطوانة بيتا. يمنح المرء فرصة تنزيل مخطط صورة مخصص أو تمثيل ثنائي الأبعاد (انظر أدناه):

BetaTPred2 (مركز المعلوماتية الحيوية ، معهد التكنولوجيا الميكروبية ، الهند) - توقع & szlig يتحول في البروتينات من محاذاة متعددة باستخدام الشبكة العصبية من تسلسل الأحماض الأمينية المحددة. بالنسبة للتنبؤ بالدوران & szlig ، فإنه يستخدم مصفوفات النقاط الخاصة بالموقع والتي تم إنشاؤها بواسطة PSI-BLAST والبنية الثانوية التي تنبأ بها PSIPRED. لتصنيف نوع الانعطاف & szlig ، استخدم BetaTurns.

BOMP - متنبئ بروتين الغشاء الخارجي & szlig-برميل (المرجع: Berven، F.S. et al. 2004. Nucl. Acids Res. 32 (مشكلة خادم الويب): W394-9).

HHomp - الكشف عن بروتينات الغشاء الخارجي عن طريق مقارنات HMM-HMM

ConBBPred - التنبؤ الإجماعي لبروتينات بيتا برميل عبر الغشاء - يعطي المرء خيارًا من بين ثمانية برامج تنبؤ.


محاذاة التسلسلات الجينومية المتعددة مع تقويم المجموعات المترابطة

نحدد "كتلة مترابطة" ، وهي تعميم جديد للمفهوم الكلاسيكي للمحاذاة المتعددة. يقوم برنامج كمبيوتر جديد يسمى TBA (لـ "محاذاة بلوكسيت الخيوط") ببناء مجموعة كتل ملولبة على افتراض أن جميع المقاطع المطابقة تحدث بنفس الترتيب والاتجاه في التسلسلات المحددة لم تتم معالجة الانعكاسات والازدواجية. تم تصميم TBA ليكون مناسبًا لمحاذاة العديد من المناطق ذات حجم القاعدة الضخمة من جينومات متعددة للثدييات ، ولكن ليس جميعها بأي حال من الأحوال. يمكن إسقاط ناتج TBA على أي جينوم تم اختياره كمرجع ، مما يضمن أن الإسقاطات المختلفة تقدم تنبؤات متسقة عن المواضع الجينومية المتعامدة. يتم توضيح هذه الإمكانية باستخدام أداة تصور جديدة لعرض المحاذاة التي تم إنشاؤها بواسطة TBA لمجموعات Hox الفقارية من منظور الثدييات والأسماك. يشير التقييم التجريبي لجودة المحاذاة ، باستخدام برنامج يحاكي التغيير التطوري في التسلسلات الجينية ، إلى أن TBA أكثر دقة من البرامج السابقة. لتنفيذ خطوة محاذاة البرمجة الديناميكية ، تدير TBA برنامجًا قائمًا بذاته يسمى MULTIZ ، والذي يمكن استخدامه لمحاذاة الجينومات المعاد ترتيبها بشكل كبير أو المتسلسلة بشكل غير كامل. نصف استخدامنا لـ MULTIZ لإنتاج محاذاة متعددة للجينوم الكامل في متصفح Santa Cruz Genome Browser.

الأرقام

( أ ) كتل (محاذاة) ...

( أ ) الكتل (المحاذاة) لمجموعة كتل مترابطة افتراضية للتسلسلات h ...

( أ ) المحاذاة بين ...

( أ ) المحاذاة بين جينومات البلاستيدات الخضراء لـ نبات الأرابيدوبسيس thaliana و Oenothera ...

كتلة مترابطة للفقاريات ...

كتلة مترابطة للفقاريات HoxA المناطق المعروضة في عارض blockset التفاعلي ...

( أ ) دقة المحاذاة المتعددة التي تنتجها تقويمات مختلفة على ...

تمثيل تصويري لتطبيق ...

تمثيل تصويري لتطبيق MULTIZ. M عبارة عن مجموعة كتل مرجعية بشرية من ...

عرض مستعرض الجينوم UCSC لـ ...

عرض مستعرض الجينوم UCSC لمحاذاة الدعابة. ( أ ) بروتين الريبوسوم RPL31 ...


الخطوة 2: إنشاء المحاذاة

حدد كلا العنصرين في طريقة عرض المشروع.

انقر بزر الماوس الأيمن فوق العناصر المحددة ، ثم انقر فوق ملف أداة التشغيل.

في مربع حوار أداة التشغيل ، في قسم إنشاء المحاذاة ، حدد ملف ProSPLIGN أداة.

انقر التالي.

ينشئ ProSplign محاذاة زوجية بين البروتين والتسلسل الجيني. هنا يمكنك تحديد نطاقات جينومية متعددة أو نصوص لتتماشى مع بروتين واحد. ال خيارات عامة علامة التبويب تسمح بتعيين الخيارات المختلفة. يمكنك اختيار خيط التسلسل الجيني الذي قد يكون "زائد" أو "ناقص" أو "كلاهما". للتسلسلات التي لا تحتوي على إنترونات ، قم بإلغاء تحديد خانة الاختيار "مع الإنترونات". يتم تحديد الكود الجيني تلقائيًا من الكائن الحي المرتبط بالتسلسل ، أو يمكنك تحديده يدويًا. يمكنك أيضًا اختيار ثلاثة من معلمات التسجيل: تكلفة تغيير الإطارات وفتح الفجوة بالإضافة إلى تكلفة تمديد الفجوة لحمض أميني واحد.

ال خيارات الصقل تسمح علامة التبويب بضبط خيارات المعالجة اللاحقة للمحاذاة. بشكل افتراضي ، يتم تعيين هذا الخيار - لإلغاء الضبط ، قم بإلغاء تحديد خانة الاختيار تحسين المحاذاة. مربعات الاختيار الأخرى مسؤولة عن إزالة المناطق الجانبية فقط وإزالة Ns من نهاية المناطق الجيدة من المحاذاة الكاملة.

الإيجابيات الخاصة بالجناح وإجمالي الإيجابيات هي النسبة المئوية الدنيا للإيجابيات التي ستحصل عليها المحاذاة النهائية المكررة. إذا كانت النسبة المئوية للإيجابيات أقل من إجمالي الإيجابيات ، فسيتم إزالة المزيد من القطع السيئة. سيتم قطع أي جانب به نسبة موجبة أقل من إيجابيات الخاصرة. سيتم أيضًا قطع المناطق الجيدة الأقصر من الحد الأدنى لطول المنطقة الجيدة.

يمثل الحد الأدنى للهوية / الإيجابيات exon أصغر نسبة من هوية exon / الإيجابيات التي قد تظهر في المحاذاة المكررة لإكسون كامل أو جزئي. عدد القواعد في exon الأول والأخير الذي سيظهر في المحاذاة المكررة سيكون على الأقل الحد الأدنى لطول exon المحيط.

عندما تنتهي من اختيار الإعدادات الخاصة بك ، انقر فوق التالي. لاستعادة كل من المعلمات العامة والتصفية إلى قيمها الافتراضية ، انقر فوق الافتراضات.

حدد الخيار "إضافة إلى مشروع موجود" وانقر ينهي. تتم إضافة المحاذاة التي تم إنشاؤها إلى المشروع.

في غضون ذلك ، لاحظ أنه يتم عرض المحاذاة الجديدة في عرض التسلسل الرسومي في مسار المحاذاة. يظهر تلميح أداة عند التمرير فوقه.


الانتماءات

قسم علوم الحياة ، جامعة شيف نادار ، نويدا الكبرى ، 201314 ، الهند

بشارات بهات وأمب أشوتوش سينغ

قسم التكنولوجيا الحيوية الحيوانية ، جامعة شير كشمير للعلوم والتكنولوجيا الزراعية ، شوهاما ، جامو وكشمير ، 190016 ، الهند

نذير عبد القني ، سيد مدثر أندرابي وأمبير رياض أ. شاه

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

مساهمات

كما. تصور المشكلة ، أجرى B.B. التجربة مع S.M.A. و R.A.S.، A.S. و ن. تخطيط تدفق العمل و A.S. تذمر. وكتب ب.ب. المخطوطة. راجع جميع المؤلفين المخطوطة.

المؤلف المراسل


عمليات البحث عن الهوملوجيا:

معلومات اساسية : برامج BLAST الثلاثة التي سيستخدمها المرء بشكل شائع هي BLASTN و BLASTP و BLASTX. ستقارن BLASTN تسلسل الحمض النووي الخاص بك مع جميع تسلسلات الحمض النووي في قاعدة البيانات غير الزائدة (nr). سيقارن BLASTP تسلسل البروتين الخاص بك مع جميع تسلسلات البروتين في عدد. في بلاستكس ، سيتم ترجمة تسلسل النوكليوتيدات الخاص بك في جميع إطارات القراءة الستة والمنتجات مقارنة بقاعدة بيانات البروتين. تتوفر العديد من البرامج التعليمية عبر الإنترنت بما في ذلك BLAST QuickStart و Basic Web BLAST من NCBI وفيديو YouTube.

انفجار النيوكليوتيدات (بلاستن) قاعدة البيانات الافتراضية هي & quotnucleotide collection (nt / nr). & quot نسبيًا مؤخرًا يوفر NCBI القدرة على إجراء عمليات بحث Batch BLAST.
بروتين بلاست (بلاستب) يقترن هذا البرنامج أيضًا ببحث عن الفكرة. إذا كنت تشك في أن البروتين الخاص بك قد يظهر تشابهًا ضعيفًا في التسلسل مع البروتينات الأخرى ، أقترح النقر فوق ميزة PSI-BLAST (Position-Specific Iterated BLAST). يوفر NCBI برنامجًا تعليميًا PSI-BLAST وفيديو YouTube. نظرًا لأن تفسير النتائج يتطلب براعة علمية ، فقد ترغب في التحقق من المتجانسات المحتملة باستخدام SIB-BLAST. سينفثأناسبeautiful هي منهجية جديدة تهدف إلى تحسين التقييم الإحصائي للنتائج التي تم إرجاعها من بحث PSI-BLAST للحصول على تحديد أفضل للإيجابيات الصحيحة والخطأ (المرجع: Lee، M.M. et al.2008. Bioinformatics 24: 1339-1343). يمكن أيضًا الوصول إلى SIB-BLAST هنا.
Translated BLAST (BLASTX) - يدير تسلسل إدخال DNA مرة أخرى في قواعد بيانات البروتين.
تقوم عمليات البحث TBLASTX بترجمة قواعد بيانات النوكليوتيدات باستخدام استعلام نيوكليوتيد مترجم بينما يبحث TBLASTN في قواعد بيانات النوكليوتيدات المترجمة باستخدام استعلام بروتيني. هذه موارد مفيدة إذا كنت مهتمًا بالمتماثلات في الجينوم غير المكتمل. تحت & quot؛ قواعد البيانات & quot؛ حدد & quot تسلسلات المسح الجينومي & quot، & quot
انفجار النوكليوتيدات الميكروبية (BLASTN ، TBLASTN ، TBLASTX إلخ). يسمح للمرء بمقارنة تسلسل الحمض النووي أو البروتين مع الجينومات البدائية والبكتيرية المكتملة.

ملحوظة.
1. اعتمادًا على الوقت من اليوم ، قد تظهر نتائجك على الفور تقريبًا أو قد يتأخر بحثك أو لا يُقبل على الإطلاق. كن مستعدًا للكثير من النتائج. قد ترغب فقط في طباعة الصفحات القليلة الأولى (على سبيل المثال ، 1-5). بدلاً من ذلك ، ضمن & quotAlgorithm Parameters & quot ، قم بتغيير & quotMaximum Goals & quot من 100 (افتراضي) إلى 10 أو 50.
2. بالنسبة إلى PSI-BLAST وعمليات البحث الأخرى ، فأنا كثيرًا ما أدخل المعلومات في & quotEntrez Query & quot قسم ، على سبيل المثال Escherichia coli [كائن] أو فيروسات [كائن حي] لترى & quothits & الاقتباس على وجه التحديد بكتريا قولونية أو الفيروسات / العاثيات (انظر هنا للحصول على التفاصيل)
3. يُنصح دائمًا بتحديد & quot إظهار النتائج في نافذة جديدة & quot

انفجار EMB - (شبكة البيولوجيا الجزيئية الأوروبية - العقدة السويسرية) . ملائم للغاية لأنه يسمح لأحد بالبحث على وجه التحديد في قواعد البيانات مثل بدائيات النوى والعاثيات والفطريات و 16S rRNA باستخدام BLASTN وجينومات بكتيرية محددة أو SwissProt باستخدام BLASTX أو BLASTN.

BlastStation-Free في السحابة (مؤسس شركة TM Software: Takashi Miyajima) هي BlastStation محلية 64 بت تعمل على الكمبيوتر السحابي. وهو يدعم عمليات البحث megablast و blastn و blastp و blastx ، مما يسمح بإنشاء قاعدة بيانات سهلة من ملف FASTA أو FASTQ ، والذي يمكن ضغطه بتنسيق gz أو .Z أو .zip. عرض رسومي لنتائج البحث وجدول ملخص يعرض نتائج البحث. يمكن تصدير الأخير بتنسيق CSV ، بينما يمكن تصدير تسلسلات النتائج بتنسيق FASTA. متاح أيضًا للتنزيل بتنسيق Mac أو الكمبيوتر الشخصي.

GTOP تسلسل بحث Homology (مختبر معلوماتية المنتجات الجينية ، المعهد الوطني لعلم الوراثة ، اليابان) - يوفر إمكانية بحث BLASTP ضد العتائق والبكتيريا و Eukaryota والفيروسات الفردية.

قاعدة بيانات أكتينوباكتيريوفاج (جراهام هاتفول ، الولايات المتحدة الأمريكية) - يسمح بتحليل BLASTN و BLASTP ضد قائمة متزايدة من العاثيات التي تصيب العوائل البكتيرية داخل الشعبة الشعاعية.

إن اكتشاف HHPred Homology والتنبؤ بهيكل الأمبير عن طريق مقارنة HMM-HMM - هو طريقة للبحث في قاعدة البيانات والتنبؤ بالهيكل الذي يسهل استخدامه مثل BLAST ولكنه أكثر حساسية في العثور على المتجانسات البعيدة. HHpred هو الخادم الأول الذي يعتمد على المقارنة الزوجية لنماذج Markov المخفية للملف الشخصي (HMMs). في حين أن معظم طرق البحث المتسلسلة التقليدية تبحث في قواعد بيانات التسلسل مثل UniProt أو NR ، فإن HHpred يبحث في قواعد بيانات المحاذاة ، مثل Pfam أو SMART. يعمل هذا على تبسيط قائمة النتائج إلى حد كبير لعدد من عائلات التسلسل بدلاً من فوضى من التسلسلات الفردية. يقبل HHpred تسلسل استعلام واحد أو محاذاة متعددة كمدخلات. (المرجع: S & oumlding J et al. 2005. Nucl. Acids Res. 33، W244-W248 (مشكلة خادم الويب)

IGBLAST - يمكن استخدامه لتحليل متواليات الغلوبولين المناعي (Ig) وتسلسلات مستقبلات الخلايا التائية (TR)

Primer-BLAST: العثور على مواد أولية خاصة بقالب PCR الخاص بك (باستخدام Primer3 و BLAST).

VecScreen هو نظام يبحث بسرعة عن أجزاء من تسلسل الحمض النووي التي قد تكون ذات أصل ناقل. يساعد الباحثين على تحديد وإزالة أي أجزاء من أصل ناقل قبل تحليل أو إرسال التسلسلات.

لمزيد من الدراسات المتطورة ، قد ترغب في توظيف:

PSI-BLAST أو PHI-BLAST أو DELTA-BLAST (تفجير وقت البحث المحسّن للمجال) البحث - (NCBI) ينشئ التكراري التكراري الخاص بالموضع ملفًا شخصيًا بعد البحث الأولي.
جينوم مقابل جينوم بلاست - (NCBI) انفجار تسلسلين ضد بعضهما البعض. ملحوظة. هذا يستخدم BLASTN و P و X وكذلك TBLASTN و TBLASTX.

أداة سياق الجينات NG - هي أداة رائعة لتصور سياق الجينوم لجين أو مجموعة من الجينات (synteny). في الرسم البياني التالي تم تحليل بروتين RpoN (Sigma54). (المرجع: R. Ciria et al. (2004) Bioinformatics 20: 2307-2308).

Cinteny - خادم لتحديد وتحليل إعادة ترتيب الجينوم باستخدام مسافة الانعكاس كإجراء. يمكنك إنشاء مشروع وتحميل بياناتك الخاصة باتباع الروابط أدناه أو العمل مع البيانات المحملة مسبقًا عن طريق تحديد الجينومات أدناه (المرجع: Sinha، A.U. & amp Meller، J. 2007. BMC Bioinformatics 8: 82)

تشمل محركات البحث الأخرى:

بحث تشابه بروتين Fasta - (EBI) توفر هذه الأداة بحثًا عن تشابه التسلسل مقابل قواعد بيانات البروتين باستخدام مجموعة برامج FASTA. يوفر FASTA بحثًا إرشاديًا باستخدام استعلام عن البروتين. يترجم FASTX و FASTY استعلام الحمض النووي. تتوفر عمليات البحث المثلى مع SSEARCH (محلي) و GGSEARCH (عالمي) و GLSEARCH (استعلام عالمي ، قاعدة بيانات محلية).

TC- بلاست (Saier Laboratory Bioinformatics Grp ، جامعة سان دييغو ، الولايات المتحدة الأمريكية) - يقوم بمسح قاعدة بيانات بروتين النقل (TC-DB) لإنتاج محاذاة وأشجار النشوء والتطور. يفصل TC-DB نظام تصنيف شامل لبروتينات نقل الأغشية المعروف باسم نظام هيئة النقل (TC).

انفجار ميروبس - يسمح للفرد بفحص متواليات البروتين مقابل قاعدة بيانات واسعة من الببتيدات المميزة (المرجع: Rawlings، N.D et al.2002. Nucleic Acids Res. 30: 343-346).

COMPASS - هي طريقة قائمة على الملف الشخصي للكشف عن تشابه التسلسل البعيد والتنبؤ ببنية البروتين. يتميز الخادم بثلاثة تطورات رئيسية: (1) تحسين الدقة الإحصائية (2) زيادة السرعة من التنفيذ المتوازي و (3) ميزات وظيفية جديدة تسهل التنبؤ بالهيكل. تتضمن هذه الميزات أدوات التصور التي تسمح للمستخدم بتحليل تنبؤات منطقة هيكلية محلية محددة بسرعة وفعالية مقترحة بواسطة محاذاة COMPASS (المرجع: R.I. Sadreyev et al. 2009. Nucl. Acids Res. 37(مشكلة خادم الويب: W90-W94)

SANSparallel: بحث تجانس تفاعلي ضد Uniprot - يوفر خادم الويب عمليات بحث في قاعدة بيانات تسلسل البروتين مع استجابة فورية وتصور المحاذاة المهنية بواسطة برنامج تابع لجهة خارجية. الإخراج عبارة عن قائمة أو محاذاة زوجية أو محاذاة مكدسة للبروتينات المشابهة للتسلسل من Uniprot أو UniRef90 / 50 أو Swissprot أو بنك بيانات البروتين. يتم عرض المحاذاة المكدسة في Jalview أو كشعارات متسلسلة. يستخدم البحث في قاعدة البيانات طريقة البحث عن حي مصفوفة اللاحقة (SANS) ، والتي أعيد تنفيذها كخادم عميل ، وتم تحسينها وتوازيها. الطريقة سريعة للغاية وحساسة مثل BLAST فوق هوية التسلسل بنسبة 50 ٪. (المرجع: P. Somervuo & amp L. Holm. 2015. Nucl. Acids Res. 43 (W1): W24-W29).

كشف السموم البكتيرية من خلال البحث النصي والتماثل:

قاعدة بيانات DBETH للسموم الخارجية البكتيرية للإنسان - هي قاعدة بيانات للتسلسلات والتركيبات وشبكات التفاعل والنتائج التحليلية لـ 229 سمًا خارجيًا من 26 نوعًا مختلفًا من أنواع البكتيريا المسببة للأمراض البشرية. يتم تصنيف جميع السموم إلى 24 فئة مختلفة من السموم. الهدف من DBETH هو توفير قاعدة بيانات شاملة للسموم الخارجية البكتيرية المسببة للأمراض البشرية. (المرجع: Chakraborty، A. et al. 2012. Nucl. Acids Res. 40(إصدار قاعدة البيانات): D615-620).

الجينات / البروتينات المتعامدة

تحليل COG - جاللمعان ارثولوجي جيroups - تم إنشاء قاعدة بيانات بروتين COG من خلال مقارنة البروتينات المتوقعة والمعروفة في جميع الجينومات الميكروبية المتسلسلة تمامًا لاستنتاج مجموعات من أخصائيي تقويم العظام. يتكون كل COG من مجموعة من البروتينات التي وجدت أنها متعامدة عبر ثلاثة سلالات على الأقل ومن المحتمل أنها تتوافق مع مجال قديم محفوظ (CloVR). تشمل المواقع التي تقدم هذا التحليل ما يلي:

WebMGA (المرجع: S. Wu et al. 2011. BMC Genomics 12:444)، RAST (المرجع: Aziz RK وآخرون 2008. BMC Genomics 9:75) ، و BASys (بأكتيري أملاحظة سمرجع ystem: Van Domselaar GH et al. 2005. الأحماض النووية الدقة. 33(مشكلة خادم الويب): W455-459.) و JGI IMG (أناتكامل مميكروبي جيenomes المرجع: Markowitz VM et al. 2014. نوكل. الدقة الأحماض. 42: D560-D567. )

مواقع أخرى:

EggNOG - قاعدة بيانات للمجموعات المتعامدة والتعليق التوضيحي الوظيفي الذي ينشأ نتحت الإشراف ارثولوجي جيroups (NOGs) من الجينوم الكامل ، ثم يطبق خط أنابيب توصيف وتحليل شامل لعائلات الجينات الناتجة. (المرجع: Powell S et al. 2014. Nucleic Acids Res. 42 (D1): D231-D239

OrthoMCL - هي خوارزمية أخرى لتجميع البروتينات في مجموعات تقويمية بناءً على تشابه تسلسلها. تستغرق العملية عادة ما بين 6 و 72 ساعة (المرجع: Fischer S et al. 2011. Curr Protoc Bioinformatics الفصل 6: الوحدة 6.12.1-19).

يوفر KAAS (KEGG Automatic Annotation Server) تعليقًا توضيحيًا وظيفيًا للجينات عن طريق مقارنات BLAST أو GHOST مقابل قاعدة بيانات KEGG GENES المنسقة يدويًا. تحتوي النتيجة على مهام KO (KEGG Orthology) ومسارات KEGG التي تم إنشاؤها تلقائيًا. (المرجع: Moriya Y et al. 2007. Nucleic Acids Res. 35(مشكلة خادم الويب): W182-185).

محرك بحث فريد:

MineBlast - يقوم بإجراء عمليات بحث BLASTP في UniProt لتحديد الأسماء والمرادفات بناءً على البروتينات المتماثلة واستعلامات PubMed لاحقًا ، باستخدام مصطلحات البحث المجمعة من أجل العثور على الأدبيات ذات الصلة وتقديمها. تسمح هذه الأداة فقط بحد أقصى. 100 استفسار لكل مستخدم في اليوم. (المرجع: G. Dieterich et al. 2005. المعلوماتية الحيوية 21: 3450-3451).

مقارنة التنادد بين جينومين صغيرين:

يساعدك Kablammo في إنشاء تصورات تفاعلية لنتائج بلاست من متصفح الويب الخاص بك. ابحث عن المحاذاة الأكثر إثارة للاهتمام ، وقم بسرد المعلمات التفصيلية لكل منها ، وقم بتصدير صورة متجهية جاهزة للنشر. سهل الاستخدام بشكل لا يصدق - إليك نتائج مقارنة BLASTN بـ الإشريكية العاثيات T1 (استعلام) و ADB-2. (المرجع: Wintersinger JA et al. المعلوماتية الحيوية 31:1305-1306).

مسح ضوئي 2 (Softberry.com) يوفر واحدًا بمحاذاة رسومية مرمزة بالألوان لطول الجينوم DNA في Java. في الجزء العلوي من اللوحة ، يتم عرض مناطق هوية التسلسل العالي باللون الأحمر.من خلال تمييز المربعات الرمادية والأصفر والأخضر والأسود ، يمكن للمرء تحديد مناطق معينة لفحص محاذاة التسلسل. للحصول على معلومات إضافية حول الإخراج انظر هنا. يبدو أن هذا الموقع يعمل بشكل أفضل مع Internet Explorer.
متقدم PipMaker ( شوارتز وآخرون. مجلد أبحاث الجينوم. 10، العدد 4، 577-586، أبريل 2000 ) يقوم بمحاذاة تسلسلين من الحمض النووي ويعيد نسبة مئوية من مخطط الهوية لتلك المحاذاة ، جنبًا إلى جنب مع شكل نصي تقليدي للمحاذاة. قد ترغب في تنزيل Laj ( ولاية بنسلفانيا - مجموعة المعلوماتية الحيوية ، الولايات المتحدة الأمريكية ) لعرض ومعالجة الإخراج من برامج المحاذاة الزوجية مثل تمثيلات PipMaker للمحاذاة.

JDotter - هو عارض Java Dot Plot ( مركز موارد المعلوماتية الحيوية الفيروسية ، جامعة فيكتوريا ، كندا) - راسمة نقطية لجافا. ينتج مخططات مماثلة للبرامج المذكورة أعلاه ، ولكن مع تحكم أفضل في الإخراج. متاح أيضا هنا.

zPicture: أداة محاذاة تسلسل متعدد (مركز الجينوم المقارن ، مختبر لورانس ليفرمور الوطني ، الولايات المتحدة الأمريكية) - يوفر رسوم بيانية نقطية لطيفة وتصورات ديناميكية. إذا تم توفير مواقع الجينات البسيطة في النموذج (على سبيل المثال ، يشير & gt 2000 5000 RNA_polymerase إلى أن جين RNA polymerase موجود على الخيط الزائد بين القاعدتين 2000 و 5000) ، فستتم إضافة هذه البيانات إلى التصور الديناميكي. يمكن إرسال محاذاة zPicture تلقائيًا إلى rVista لتحديد مواقع ربط عامل النسخ المحفوظة. لأكثر من اثنين من الجينوم اذهب هنا.


شاهد الفيديو: المحاذاة و التوزيع في الاليستراتور Align u0026 Distribute in Adobe Illustrator CC 2017 #24 (كانون الثاني 2022).