معلومة

Clades على شجرة - biopython


افترض أن لدينا محاذاة. عند استخدام أداة التطور النسبي (PhyML في هذه الحالة) في هذه المحاذاة ، يتم إرجاع شجرة تتكون من 5 مجموعات.

الشيء هو: لنفترض أن لدينا هذه المحاذاة على موقع ويب ، وقام بعض المستخدمين بتحميل تسلسل جديد لإضافته إلى هذه المحاذاة. بعد إعادة المحاذاة مع التسلسل الجديد ، يتم تطبيق استدلال نسالة ، ثم متخيل شجرة.

أرغب في معرفة أي من المجموعات الخمسة يحتوي على التسلسل الجديد (إن وجد) ، دون الحاجة إلى النظر إلى الشجرة.

كيف يمكنني التعامل مع هذه المشكلة؟ أعتقد أنه أولاً وقبل كل شيء ، يجب أن أحدد الفروع الخاصة بي (كيف؟) ، وبعد ذلك ، أقيس المسافات من تسلسالي الجديد ، إلى جميع الفروع ، وأحتفظ بالتسلسل الذي يحتوي على أقصر مسافة ... لكنني لست متأكدًا مما إذا كان هذا صحيحًا استراتيجية جيدة (كي لا أقول إنني لست متأكدًا من كيفية تحقيق ذلك ...)

ربما يكون هذا أكثر من سؤال مفهوم ...

أنا أعمل مع بيوبيثون.


يمكنك أن تقرر فقط إدخال الكليد الجديد بجوار أحد "الأقرب" (يتم تحديد "الأقرب" بطريقة ذكية لا يزال يتعين ابتكارها) ، ولكن من الممكن أن تكون النتيجة مختلفة عما ستحصل عليه من خلال إعادة البناء نسالة من الصفر. والسبب هو أن المعلومات التي تجلبها مجموعة الأحرف في الكليد الجديد قد تغير العلاقات بين المجموعات الأخرى الموجودة في البيانات في نسالة محسّنة حديثًا.

مثال على التطبيق هو أن المرء يريد عادةً إضافة المزيد من الأصناف في نسالة أودر لمنع جاذبية الفروع الطويلة.

كملاحظة جانبية: عندما يتحدث المرء عن "كليد" ، عادة ما يفكر المرء في مجموعة من الأصناف النهائية (أوراق الشجرة): هل تريد إدراج مجموعة كاملة من الأصناف تشكل مجموعة أحادية الفصيلة ، والتي تكون طوبولوجيتها الداخلية بالفعل معروف ، أو أصنف طرفي واحد فقط؟


شاهد الفيديو: نشيد ما أجمل الشجرة (ديسمبر 2021).