معلومة

طول الفرع في أشجار النشوء والتطور


أعلم أن هذا سؤال أساسي للغاية ، لكن ليس من الواضح جدًا بالنسبة لي ما هي وحدة قياس طول الفرع في أشجار النشوء والتطور. لقد فهمت أنه عادة ما يتم التعبير عنها بعدد الاستبدالات / الموقع / وحدة زمنية معينة. ما هذه "وحدة زمنية"؟ أجيال؟ هل يعتمد على طريقة بناء الشجرة التي أستخدمها (NJT ، MP ، ML)؟

شكرا لك على وقتك.


عندما تقوم بتقدير شجرة النشوء والتطور ، سواء كان ذلك عن طريق الاحتمالية أو البخل أو المسافة (مثل نيوجيرسي) ، سيتم إعطاء الأطوال بوحدات الاستبدالات لكل موقع ، بدون معلومات عن الوقت. على سبيل المثال من هنا:

عادةً ما تكون وحدات طول الفرع عبارة عن بدائل نيوكليوتيد لكل موقع - وهذا هو عدد التغييرات أو "البدائل" مقسومًا على طول التسلسل (على الرغم من أنه يمكن إعطاؤها كنسبة مئوية للتغيير ، أي عدد التغييرات لكل 100 موقع نيوكليوتيد) .

لتحويل هذه الأطوال إلى مقياس زمني ، من الضروري الحصول على مزيد من المعلومات. على سبيل المثال ، بافتراض أن الساعة الجزيئية صالحة ، أو تستخدم بدلاً من ذلك ساعة مريحة النماذج التي تصف طول كل فرعl = r x tيمكن أن تتحلل إلى معدلصووقتر. نظرًا لأن المعدل في كثير من الحالات ليس ثابتًا على طول الشجرة (أي أن الساعة غير صالحة) ، فإن شجرة النشوء والتطور المستنتجة ليست فوقية (أي أن مجموع أطوال الفروع من الأوراق إلى MRCA ليس ثابتًا).

هناك حزم برامج ، وأبرزها BEAST ، التي تشكل نموذجًا صريحًا لساعة صارمة أو مريحة لك ، ومن ثم يمكنها إرجاع أطوال الفروع بوحدات زمنية عشوائية. تعني كلمة "تعسفي" أن الأرقام في حد ذاتها ليس لها معنى خاص ، وستعكس اختيارك على سبيل المثال السابق. في هذه الحالة يمكن أن تمثل السنة أو مليون سنة أو أجيال (http://beast.bio.ed.ac.uk/faq#Evolutionary_rates_and_time_scales).


هذه الإجابة مستوحاة بشكل أساسي من نقاش طويل في الدردشة معLeoMartins.

يمثل طول الفرع بعض قياس اختلاف النسب

يمثل طول الفرع بعض قياس اختلاف النسب. يعتمد القياس الفعلي على نوع البيانات التي تم النظر فيها. بالنسبة للبيانات الجينية ، يكون بشكل عام (إن لم يكن دائمًا) عددًا من البدائل. على أي حال ، فإن مقاييس اختلاف النسب هذه ليست تصميمًا مسبقًا لتكون أفضل تقديرات للوقت ، ولكنها غالبًا ما تكون بديلاً جيدًا للوقت وغالبًا ما يتم تفسيرها على أنها قياس للوقت.

حالات لا معنى لها طول الفرع

كن حذرًا من أن بعض الأشجار تستخدم الفروع فقط لتمثيل العلاقات التطورية ولكن لا تنقل المعنى عبر أطوال الفروع.

نهج الأدلة الكاملة

في كثير من الأحيان ، نأخذ في الاعتبار "مناهج الأدلة الكلية" (على سبيل المثال Arrigo et al. 2013) والتي يمكن أن تستخدم بيانات التسلسل وبيانات الحفريات وبيانات مورفو لتكوين إجماع وتقديم أفضل تقدير للتباعد في النسب.


يشير طول الفرع إلى الوقت بالسنوات (أو أي وحدة زمنية موضوعية معيارية). سيكون من غير المنطقي (على الرغم من أنه يمكن للمرء أن يجادل بأنه سيكون من المثير للاهتمام أن ننظر إليه) لبناء شجرة الحياة حيث يكون الوقت في الجيل حيث يختلف وقت الجيل بشكل كبير بين الأنساب.

من المهم عدم الخلط بين متوسط ​​تقدير طول الفرع وطول الفرع نفسه. لهذا سأعطيك فقط تقنيتين مستخدمتين لتقدير طول هذا الفرع.

عدد الاستبدالات

الآن ، نقدر هذا الوقت بناءً على عدد من الطرق. واحد منهم هو عدد الاستبدال في المواقع المحايدة. عدد الاستبدال في المواقع المحايدة على $ n $ أجيال يساوي معدل الطفرة $ mu cdot t $. هذه نتيجة كلاسيكية ، ويرجع ذلك إلى حقيقة أن هناك طفرات بقيمة $ 2 N mu $ في كل جيل ، كل منها لديه احتمال $ frac {1} {2N} $ لإصلاحه (نظرًا لأنه محايد) وبالتالي معدل الاستبدال المحايد هو $ frac {2N mu} {2N} = mu $.

لذلك ، باستخدام معدل الاستبدال ، يمكننا تقدير عدد الأجيال ومن خلال تقدير وقت التوليد ، يمكننا تقدير الوقت الفعلي (بالسنوات).

في معظم الأوقات ، يكون طول الفروع هو ببساطة عدد الاستبدالات المرصودة ولكن نظرًا لأنه لا يتم إنشاء جميع أشجار النشوء والتطور من هذه البيانات ، يجب على المرء أن يعتبر طول الفرع في أشجار النشوء والتطور بشكل عام مقياسًا للوقت.

البيانات الأحفورية

توجد طرق أخرى لتقدير طول الفروع مثل التأريخ الأحفوري على سبيل المثال. نحن هنا نقدر بشكل مباشر الوقت بالسنوات ، وليس في الجيل الأول.

من المهم عدم الخلط بين متوسط ​​تقدير الوقت


الأشجار التطورية

الملخص

تصور الأشجار التطورية ، أو النشوء والتطور ، تطور مجموعة من الأصناف من أسلافها المشتركين الأحدث (MRCA). شجرة الأنواع عبارة عن شجرة نسجية تمثل التاريخ التطوري لمجموعة من الأنواع (أو المجموعات السكانية). شجرة الجينات هي شجرة نسالة تشكل نموذجًا لسلالة الجين. قد تختلف أشجار الجينات من جينات مختلفة المأخوذة من مجموعة من الأنواع مع بعضها البعض ، وكذلك مع شجرة الأنواع ، بسبب مجموعة متنوعة من العوامل. تتوفر مجموعة واسعة من الخوارزميات وبرامج الكمبيوتر لاستنتاج أشجار النشوء والتطور من أنواع مختلفة من البيانات. في حين أن الأشجار التطورية الحقيقية متجذرة وغالبًا ما تكون ثنائية (متشعبة) ، قد تكون الأشجار المستنتجة غير متجذرة أو متعددة التشعب.


المصطلح

أولاً ، بعض التصحيحات لاستخدامك للمصطلحات. شجرة يجب لها أطوال الفروع المرتبطة بها ليتم تسميتها أ شجرة النشوء والتطور لأنه يمثل كلا من العلاقات بين OTU / التصنيف / الإجازات و المسافات بينهما (أي أطوال الفروع. تسمى الشجرة التي لا معنى لها لأطوال الفروع أ cladograms أو أ مخطط شجر الأسنان. يمكنك معرفة ما إذا كانت الشجرة عبارة عن مخطط فصلي نظرًا لأن جميع المخارج / الأصناف / الأوراق تنتهي في نفس الموضع وعادة ما تكون أطوال الفروع الداخلية (ليس دائمًا) متساوية في الطول. في حين أن التطور العرقي ، فإن OTUs / الأصناف / الأوراق ستبدو عادةً "متداخلة" و الفروع الداخلية ستكون ذات أطوال مختلفة.

لذلك ، إذا كانت الشجرة التي قدرتها ، حقًا لا تحتوي على أطوال فرع مقدرة ومرتبطة بها ، فهي في الواقع مخطط تفرع.


تتم مناقشة مجموعات النشوء والتطور بشكل مستمر وصقلها من قبل علماء الأحياء التطورية. في كل عام ، تظهر أدلة جديدة تزيد من تغيير العلاقات الموصوفة في مخطط شجرة النشوء والتطور. في السابق ، تم بناء أشجار النشوء والتطور على أساس التشكل المتماثل والمماثل ، ومع ذلك ، مع التقدم في علم الأحياء الجزيئي ، يتم تنفيذ بناء أشجار النشوء والتطور بشكل متزايد باستخدام البيانات المستمدة من التحليلات الجزيئية.

تم تحديد العديد من العلاقات التطورية في الشجرة الحديثة مؤخرًا فقط بسبب الأدلة الجزيئية. لقد ساعدت تحليلات الأحماض النووية والبروتينات في بناء شجرة حيوانية حديثة للتطور. تأتي هذه البيانات من مجموعة متنوعة من المصادر الجزيئية ، مثل الحمض النووي للميتوكوندريا والحمض النووي النووي والحمض النووي الريبي الريباسي (rRNA) وبعض البروتينات الخلوية. يمكن صنع الأشجار التطورية من خلال تحديد تسلسل المعلومات للجينات المتشابهة في الكائنات الحية المختلفة. تعتبر التسلسلات التي تتشابه مع بعضها البعض في كثير من الأحيان أقل وقتًا للتباعد ، في حين أن التسلسلات الأقل تشابهًا لديها وقت تطوري أكبر للتباعد. يتم إنشاء الشجرة التطورية عن طريق محاذاة التسلسلات ويكون طول كل فرع متناسبًا مع اختلافات الأحماض الأمينية في التسلسلات. علاوة على ذلك ، من خلال تعيين معدل طفرة ثابت للتسلسل وإجراء محاذاة تسلسلية ، من الممكن حساب الوقت التقريبي عندما تباعد تسلسل الاهتمام إلى مجموعات أحادية اللون.

الشكل ( PageIndex <1> ): شجرة الحياة النشوء والتطور: ساهم التقدم في علم الأحياء الجزيئي وتحليل الجزيئات البوليمرية مثل DNA و RNA والبروتينات في تطوير أشجار النشوء والتطور.

يمكن إجراء محاذاة التسلسل على مجموعة متنوعة من التسلسلات. لبناء شجرة تطورية من البروتينات ، على سبيل المثال ، تتم محاذاة التسلسلات ثم مقارنتها. يستخدم الرنا الريباسي (RNA الريبوزومي) عادة لمقارنة الكائنات الحية لأن الرنا الريباسي لديه معدل طفرة أبطأ وهو مصدر أفضل لبناء الشجرة التطورية. وأفضل ما يدعم ذلك هو البحث الذي أجراه الدكتور كارل ووز في أواخر السبعينيات. نظرًا لأن الريبوسومات ضرورية لوظيفة الكائنات الحية ، فلا يمكن تغييرها بسهولة من خلال عملية التطور. مستفيدًا من هذه الحقيقة ، قارن الدكتور ووز الفروق الضئيلة في تسلسل الريبوسومات بين مجموعة كبيرة من البكتيريا وأظهر أنها ليست كلها مرتبطة ببعضها البعض.

على سبيل المثال ، كان يُعتقد منذ فترة طويلة أن مجموعة من الحيوانات المصنفة سابقًا تسمى lophophorates ، والتي تضمنت ذراعي الأرجل و bryozoans ، هي ثنائيات بدائية. وجد التحليل الجزيئي المكثف باستخدام بيانات الرنا الريباسي أن هذه الحيوانات هي أوليات ، ترتبط ارتباطًا وثيقًا بالأقنيات والرخويات. سمح هذا الاكتشاف بتمييز كليد البروتستوم: lophotrochozoans. ألقت البيانات الجزيئية الضوء أيضًا على بعض الاختلافات داخل مجموعة lophotrochozoan. يعتقد بعض العلماء أن phyla Platyhelminthes و Rotifera داخل هذه المجموعة يجب أن تنتمي في الواقع إلى مجموعتهم الخاصة من البروتستومات المسماة Platyzoa.

كشفت الأبحاث الجزيئية المشابهة للاكتشافات التي أدت إلى التمييز بين فصيلة lophotrochozoan أيضًا عن إعادة ترتيب دراماتيكية للعلاقات بين الرخويات ، والحلقيات ، والمفصليات ، والديدان الخيطية ، تم تشكيل كليد جديد من ecdysozoan. بسبب أوجه التشابه المورفولوجية في أنواع أجسامهم المجزأة ، كان يُعتقد في يوم من الأيام أن الحلقات ومفصليات الأرجل مرتبطة ارتباطًا وثيقًا. ومع ذلك ، فقد كشفت الأدلة الجزيئية أن مفصليات الأرجل هي في الواقع أكثر ارتباطًا بالديدان الخيطية ، التي تضم الآن كليد ecdysozoan ، وترتبط الحلقيات ارتباطًا وثيقًا بالرخويات ، وذوات الأرجل ، والشعب الأخرى في الفرع lophotrochozoan. تشكل هاتان المجموعتان الآن البروتستومات.

يتضمن تغيير آخر للتجمعات السابقة للتطور بسبب التحليلات الجزيئية ظهور شعبة جديدة تمامًا من الدودة تسمى Acoelomorpha. كان يُعتقد منذ فترة طويلة أن هذه الديدان المفلطحة من نوع acoel تنتمي إلى فصيلة Platyhelminthes بسبب تشابهها و ldquoflatworm و rdquo. ومع ذلك ، كشفت التحليلات الجزيئية أن هذه علاقة خاطئة واقترحت في الأصل أن أكويلات تمثل الأنواع الحية لبعض من أقدم الثنائيات المتباعدة. وقد وصفت الأبحاث الحديثة في هذه الفرضية بأنها موضع تساؤل واقترح علاقة أوثق مع deuterostomes. لا يزال موضع هذه الشعبة الجديدة محل نزاع ، لكن العلماء يتفقون على أنه مع وجود بيانات جزيئية كافية ، سيتم تحديد أصولهم الحقيقية.


بناء أشجار النشوء والتطور

يمكن استخدام العديد من أنواع البيانات المختلفة لبناء أشجار النشوء والتطور. نحن & # 8217 نعتبر نوعين: البيانات المورفولوجية والجينية. تتضمن البيانات المورفولوجية السمات الهيكلية وأنواع الأعضاء والترتيبات الهيكلية المحددة ، بينما تشتمل البيانات الجينية على تسلسل الحمض النووي الجينومي والمتقدري ، وجينات الحمض النووي الريبي الريبوزومي ، وغالبًا ما تركز على الجينات ذات الأهمية.

تستخدم هذه الأنواع من البيانات للتعريف التنادد ، وهو ما يعني التشابه بسبب أصل مشترك. هذه ببساطة فكرة أنك ترث سمات من والديك ، يتم تطبيقها فقط على مستوى الأنواع: كل البشر لديهم أدمغة كبيرة وإبهام متقابل لأن أسلافنا فعلوا جميع الثدييات تنتج اللبن من الغدد الثديية لأن أسلافهم فعلوا ذلك. هذه الصفات متشابهة.

يتم بناء الأشجار على مبدأ البخل ، مما يعني أن النمط المتفرّع الأكثر احتمالاً هو النمط الذي يتطلب أقل قدر من التغييرات. على سبيل المثال ، من المرجح أن تنتج جميع الثدييات الحليب لأنها جميعًا ورثت الغدد الثديية من سلف مشترك أنتج الحليب من الغدد الثديية ، مقابل الفرضية الأقل شحًا بأن مجموعات متعددة من الكائنات الحية قد طورت كل منها بشكل مستقل غدد ثديية.


دليل ميداني لشجرة الحياة الجديدة

إذا كنت مدمنًا للأخبار العلمية ، فربما شاهدتها أثناء التمرير عبر موجز الأخبار: شجرة الحياة الجديدة. أعلن الباحثون الشهر الماضي أنهم استخدموا التسلسلات الجينية لبناء صورة أكثر شمولاً لشجرة الحياة. الشجرة فريدة من نوعها لأنها تضم ​​العديد من الأنواع الميكروبية التي لم يسبق للباحثين رؤيتها من قبل ، ناهيك عن معرفة كيفية النمو في المختبر. نحن نعرف هذه السلالات حصريًا من أجزاء مقطوعة من الحمض النووي التي انتزعها الباحثون من مجموعة متنوعة من البيئات و [مدش] من مروج كاليفورنيا إلى أنظمة السخانات. تم جمع بعض الحمض النووي من داخل أفواه الدلافين! قام الباحثون بتركيب أجزاء الحمض النووي هذه معًا مثل اللغز حتى حصلوا على الجينوم الكامل لهذه الكائنات الغامضة واستخدموا هذه المعلومات لتحديد مواقع فروعها على الشجرة. كل هذا رائع و [مدش] ولكن عندما تحفر وتبدأ في النظر إلى هذه الشجرة الجديدة ، لن يتم لومك على التساؤل ، "آه ، أين الشجرة هنا؟" في الواقع ، تبدو شجرة الحياة الجديدة أشبه بألعاب نارية متفجرة أكثر من كونها بلوط أو دردار. هنا ، سوف نستكشف أداة يمكن أن تساعدك في تفسير الأنماط المختلفة للأشجار التطورية (أي الأنماط التطورية) التي قد تراها عبر الإنترنت ، أو في الكتب المدرسية ، أو في معروضات المتحف.

أين التطور؟

من المرجح أن يلهم إلقاء نظرة على هذه الشجرة الجديدة العديد من الأسئلة. أين جذر الشجرة؟ لماذا تنمو بعض الفروع للأسفل؟ لماذا كل تلك الألوان المختلفة؟ كيف تكون بعض الفروع أطول من غيرها؟ ماذا تعني النقاط الحمراء؟ والأهم من ذلك ، كيف يمكنني معرفة الأنساب الأكثر ارتباطًا ببعضها البعض؟

انقر لرؤية نسخة أكبر.

يعد الدليل الميداني للأشجار التطورية ميزة تفاعلية يمكن أن تساعد في فهم طبيعة الأشجار المربكة. إنه جزء من منطقة فهم التطور الجديدة المخصصة لعلم الوراثة والتي تسمى غرفة الشجرة. دعنا نستخدم الدليل الميداني لتفسير هذه الشجرة الجديدة. يمكنك متابعة استخدام الدليل الميداني لنفسك إذا كنت ترغب في ذلك.

لاستخدام الدليل الميداني ، سيتعين عليك أولاً تحديد نمط الشجرة الأكثر تشابهًا مع شجرة الحياة الجديدة. كل الأشجار الموجودة في الدليل الميداني (الموضح أدناه على اليسار) تصور نفس الشيء & و [مدش] العلاقات التطورية و [مدش] لكنها تستخدم أنماطًا مختلفة من الخطوط للقيام بذلك ، مما يؤدي غالبًا إلى الأشجار التي تبدو مختلفة تمامًا عن بعضها البعض ولكنها تظهر نفس المعلومات. تبدو الشجرة التي تتخذ شكل انفجار نجمي (محاطة بدائرة أدناه) مشابهة جدًا لشجرة الحياة الجديدة.

ابدأ بتحديد الشجرة من دليل الحقول التي تشبه إلى حد بعيد الشجرة التي تهتم بها. الشجرة المحاطة بدائرة هي الشجرة الأكثر تشابهًا مع شجرة الحياة الجديدة.

يؤدي النقر فوق شجرة انفجار النجوم إلى توجيه المستخدمين إلى هذه الصفحة من الدليل الميداني التي تشرح الميزات الأساسية لشجرة انفجار النجوم.

يؤدي النقر فوق شجرة انفجار النجوم إلى إصدار بسيط من هذا النوع من الشجرة (أعلى اليمين) والذي يعرض أربعة أصناف فقط. من خلال النقر على الأزرار وعلامات الاستفهام في هذه الصفحة ، يمكنك الإجابة على بعض الأسئلة المهمة حول شجرة الحياة الجديدة ، بما في ذلك:

  • أين جذر الشجرة ولماذا تنمو بعض الفروع لأسفل؟ هذه الشجرة ليس لها جذر لأن العلماء ليسوا متأكدين من السلالة الأقدم وأي النسب الأقل ارتباطًا بالآخرين. لم تكن الدراسة التي أنتجت هذه الشجرة مصممة للبحث عن جذر شجرة الحياة ولكن لفحص تنوع الحياة على الأرض اليوم. عندما لا يتم تجذير الشجرة ، غالبًا ما يقوم العلماء بترتيب الأنساب بشكل تعسفي في نمط انفجار نجمي لتوفير مساحة وتعزيز الرسالة التي مفادها أنهم لا يدعون مكان جذر الشجرة. ومع ذلك ، عادة ما يتم ترتيب هذه الأشجار بحيث تكون الفروع التي يرجح ارتباطها بالجذر في اتجاه مركز الرسم التخطيطي (كما هو موضح أدناه على اليسار). على شجرة انفجار نجمي مثل هذه ، يتدفق الوقت عمومًا من المنطقة المركزية للشجرة إلى الخارج في جميع الاتجاهات. أقدم ، سلالات الأجداد تتصل ببعضها البعض في منتصف الرسم التخطيطي.

في أشجار نمط انفجار النجوم ، مثل شجرة الحياة الجديدة ، يتدفق الوقت عمومًا من مركز المخطط إلى الخارج في جميع الاتجاهات.

تم تسمية هذا الفرع من شجرة الحياة الجديدة لإظهار كيفية تفسير تقارب العلاقات التطورية على شجرة نمط انفجار النجوم. ترتبط بكتيريا Gammaproteobacteria و Betaproteobacteria ارتباطًا وثيقًا ببعضها البعض أكثر من ارتباط أي منهما بالبكتيريا Acidithiobacillia.

  • كيف يمكنني معرفة الأنساب الأكثر ارتباطًا ببعضها البعض؟ لمعرفة ذلك ، تحتاج إلى إلقاء نظرة على النقاط الموجودة على الشجرة حيث يلتقي فرعين (أي عقد الشجرة). تمثل العقد الأسلاف المشتركة للأنساب عند أطراف الشجرة. في الآونة الأخيرة ، تشترك سلالتان في سلف مشترك ، وكلما زاد ارتباطهما ارتباطًا وثيقًا. لذلك ، على سبيل المثال ، إذا نظرت إلى الجانب الأيسر من شجرة الحياة الجديدة (الموضحة أعلاه على اليمين) ، ستلاحظ أن بكتيريا Gammaproteobacteria و Betaproteobacteria أكثر ارتباطًا ببعضها البعض من أي منهما إلى Acidithiobacillia لأن معظمها السلف المشترك الحديث أصغر من السلف الذي يشترك فيه كل منهما مع Acidithiobacillia.

للإجابة على الأسئلة الأخرى حول هذه الشجرة ، ستحتاج إلى النقر فوق الزر "ميزات الشجرة المتقدمة" في دليل الحقول. بعد ذلك ، بالنقر فوق علامات الاستفهام الموجودة على هذه الشجرة الأكثر تعقيدًا ، يمكنك الإجابة عن أسئلة أخرى حول شجرة الحياة الجديدة ، بما في ذلك:

  • لماذا كل تلك الألوان المختلفة؟ في هذه الشجرة ، تحدد الألوان مجموعات مسماة مختلفة. ما عليك سوى البحث عن الألوان على الأغصان التي تتطابق مع ألوان الخط التي تمت كتابة الأسماء بها. إذا قمت بمسح محيط الشجرة ، فسترى العديد من المجموعات غير المألوفة (Aenigmarchaeota ، أي شخص؟) وعدد قليل من الأصدقاء القدامى و [مدش] أو أعداء مثل قد تكون الحالة في بعض الأحيان (Amoebozoa ، Chlamydiae!). بالمناسبة ، كل الحياة النباتية والفطرية والحيوانية (بما في ذلك نحن البشر) يتم تمثيلها بواسطة شظيتين رفيعتين من فرع حقيقيات النوى الأخضر في الجزء الأيمن السفلي من الرسم التخطيطي (الموضح أدناه) و [مدش] Opisthokonta (الحيوانات والفطريات) و Archaeoplastida (نباتات).

تمثل الحيوانات والفطريات والنباتات جزءًا صغيرًا من التنوع الظاهر في شجرة الحياة الجديدة.

  • لماذا بعض الفروع أطول من غيرها؟ في هذه الشجرة ، يمثل طول الفرع مقدار التغيير التطوري كما ينعكس في الاختلافات بين تسلسل الحمض النووي للكائنات الحية. على طول الفروع الأطول ، حدث المزيد من التغيير في التسلسل أكثر من الفروع الأقصر. لذلك ، على سبيل المثال ، يقع سلالة Eukaryote / DPANN / Archaea / TACK في نهاية فرع طويل جدًا (كما هو موضح أدناه). هذا يعني أن هناك العديد من الاختلافات الجينية بين الكائنات الحية في هذه المجموعة والكائنات الأخرى على الشجرة. لمعرفة مقدار التغيير الذي يحدث بالضبط ، يجب عليك استخدام شريط المقياس ، الذي يقرأ 0.4 ، مما يعني أنه لكل جزء من فرع بهذا الطول ، حدثت 0.4 استبدالات نيوكليوتيد لكل موقع في الجينات المستخدمة لإنشاء هذه الشجرة.

في شجرة الحياة الجديدة ، يشير طول الفرع إلى عدد بدائل النوكليوتيدات التي تراكمت على طول هذا الفرع.

تضيف المخططات الشجرية أحيانًا تسميات أو رموزًا لإبراز ميزات معينة للشجرة ، في هذه الحالة النقاط الحمراء. يصف تعليق الشجرة في الورقة العلمية الأصلية ما تعنيه النقاط الحمراء. تمثل كل نقطة من هذه النقاط سلالة لم يرها أي عالم على الإطلاق ولا تُعرف إلا من خلال الحمض النووي. في الواقع ، اكتشف العلماء الذين يعملون في هذه الدراسة 1011 كائنًا منفصلاً بهذه الطريقة! يُعتقد أن العديد من هذه السلالات المكتشفة حديثًا عبارة عن تكافؤ وأعضاء من ميكروبات الأنواع الأخرى. في حين أن هذا مثير للإعجاب ، إلا أنه من شبه المؤكد أنه يمثل جزءًا صغيرًا من التنوع الميكروبي الذي لا يزال ينتظر من يكتشفه. في هذه الدراسة ، تم جمع الحمض النووي من ست بيئات مختلفة تمامًا ، لكن هذا الاختلاف لا يقترب من شمول مجموعة كاملة من البيئات على الأرض ، والتي تسكنها تقريبًا أنواع مختلفة من الميكروبات. نظرًا لأن العلماء يستخدمون الأدوات الجينية للبحث بشكل أعمق وأعمق في النطاق الكامل لتنوع الحياة ، فمن المؤكد أنهم سيضيفون انفجارات جديدة إلى عرض الألعاب النارية الفخم بالفعل! وبما أن هذه الفروع الجديدة يتم تطعيمها على الشجرة ويتم عرض هذه المعلومات بطرق مختلفة ، فستتمكن من العودة إلى الدليل الميداني وغرفة الشجرة للمساعدة في معرفة معنى كل ذلك.

فهم موارد التطور:

أسئلة المناقشة والإرشاد

استخدم الدليل الميداني للإجابة على الأسئلة المتعلقة بهذه الشجرة ، والتي تعرض نفس العلاقات الموضحة في شجرة الحياة الجديدة ، ولكن بتنسيق مختلف.


نتائج

لتحديد تأثيرات التغاير على الاستدلال الوراثي ، أجرينا 3 أنواع مختلفة من التحليلات ، كل منها مصمم لمعالجة سؤال مختلف. أولاً ، لتقييم كيفية تأثير أشكال معينة من التغاير على دقة النشوء والتطور ، قمنا بمحاكاة التسلسلات في ظل ظروف صعبة للغاية تتطور فيها المواقع على مجموعات مختلفة من أطوال الفروع غير المتجانسة. ثانيًا ، لفحص الأشكال الأكثر ارتباطًا تجريبياً من التغاير في ظل ظروف خاضعة للرقابة ، قمنا بمحاكاة التسلسلات في ظل إصدارات قوية من أنواع التغاير التي لوحظت في مجموعات البيانات الحقيقية. أخيرًا ، لتحديد إمكانات طول الفرع المختلط ونماذج covarion لمعالجة مشاكل النشوء والتطور الحقيقية ، قمنا بتحليل بيانات التسلسل التجريبي المعروف أنها تطورت بشكل غير متجانس على سلالات معروفة جيدًا.

تحت كل حالة ، طرحنا سؤالين: 1) كيف تؤثر الأشكال المختلفة من التغاير غير المدمج على أداء النماذج المتجانسة و 2) ما إذا كانت النماذج التطورية التي تتضمن التباين غير المتجانس تنتج سلالات أكثر دقة (انظر الشكل 1 للحصول على رسم تخطيطي للنماذج المستخدمة في هذه الدراسة ). تم استخدام نموذجين غير متجانسين: 1) تطبيق Bayesian لنموذج covarion (Tuffley and Steel 1998) و 2) تنفيذ ML لنموذج طول الفروع المختلط (Kolaczkowski and Thornton 2004 Spencer et al. 2005) ، مع عدد الفرع تم تقدير فئات الطول من البيانات باستخدام AIC (Akaike [1974]) و BIC (Schwartz [1978]) ، وهما طريقتان مستخدمتان على نطاق واسع لاختيار النموذج الإحصائي (Posada and Buckley 2004).

محاكاة عدم تجانس طول الفرع المبسط

لتوضيح أنواع المشكلات التي قد تسببها الأشكال المختلفة من الانتصاب المغاير وقدرة النماذج غير المتجانسة على معالجة هذه المشكلات ، قمنا بفحص مجموعات البيانات التي تم إنشاؤها باستخدام 4 أنواع من مجموعات طول الفروع النمطية الصعبة. قمنا بمقارنة دقة النشوء والتطور لطول الفرع المختلط ونماذج covarion من التباين غير المتجانسة مع تلك الخاصة بالنموذج المتماثل الأنسب من خلال رسم جزء من الاستدلالات الصحيحة باستخدام كل طريقة مقابل زيادة إشارة النشوء والتطور (طول الفرع الداخلي). للكشف عن التأثيرات المحددة للتغاير غير المتجانسة ، قمنا بمقارنة دقة كل طريقة مع دقة النموذج المقسم الحقيقي (MLحقيقية) ، والذي يقوم بتعيين المواقع بشكل صحيح لفئات طول الفروع مسبقًا وتقدير أطوال الفروع المنفصلة داخل كل فئة. قمنا أيضًا بفحص دقة MP.

تحت جميع الظروف التي تمت دراستها ، قلل التغاير غير المدمج بشكل كبير من دقة النماذج المتجانسة. كان نموذج طول الفرع المختلط أكثر دقة بشكل ملحوظ ، حيث استعاد الشجرة الصحيحة بإشارة أقل للتطور وأنتج تقديرات أكثر دقة لأطوال الفروع المتوقعة عبر المواقع (الشكل 2). على الرغم من أن النموذج المختلط أظهر عمومًا قوة إحصائية منخفضة مقارنة بـ MLحقيقية (انظر الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت) ، لم يكن النموذج المختلط متحيزًا تحت أي من هذه الظروف. في المقابل ، خضعت النماذج المتجانسة والنماذج المتجانسة لتحيزات طوبولوجية قوية ، وفقدان القوة الإحصائية ، واستدلال تعدد الأشكال الصلب ، اعتمادًا على النمط المحدد للتغاير في البيانات.

في ظل المجموعة الأولى من الشروط & # x02014 المتتاليات المتولدة على شجرة ذات فرعين طرفيين طويلين و 2 فرعين قصيرين و # x02014 كلا النموذجين المتماثلين و covarion كانا متحيزين بشدة لصالح شجرة الجذب طويلة الفروع (الشكل 2)أ و ب ). كما هو الحال مع جاذبية الفروع الطويلة الكلاسيكية ، يعتمد اتجاه التحيز على الأصناف التي لها فروع طويلة. كما لوحظ سابقًا (Kolaczkowski and Thornton 2004) ، عندما لم تكن المحطات الطويلة شقيقة لبعضها البعض ، فضل التحيز شجرة غير صحيحة (شكل 2)أ ). عندما كان للأصناف الشقيقة فروع طويلة ، كان التحيز يفضل السلالة الصحيحة ، كما يتضح من الدعم القوي لهذه الشجرة حتى عندما كان طول الفرع الداخلي صفرًا (شكل 2)ب ). في المقابل ، كان نموذج طول الفرع المختلط غير متحيز ، مما ينتج عنه استنتاجات الطوبولوجيا وتقديرات أطوال الفروع أكثر تشابهًا مع تلك التي تم الحصول عليها باستخدام MLحقيقية.

في ظل المجموعة الثانية من الظروف & # x02014 ، أظهرت المواقع ذات إشارة النشوء والتطور القوية التي تمت محاكاتها جنبًا إلى جنب مع المواقع الصاخبة العشوائية & # x02014 كل من نماذج homotachous و covarion انخفاضًا حادًا في القدرة الإحصائية لحل السلالة الصحيحة مقارنة بـ MLحقيقية ( الصورة 2ج ). كان نموذج طول الفرع المختلط أكثر دقة ، وكان تحسين الأداء صغيرًا ولكنه مهم من الناحية الإحصائية (ص& # x02009 & # x0003c & # x020090.001). كانت تقديرات طول الفرع أكثر دقة باستخدام النموذج المختلط مقارنة بـ ML المتماثل في ظل هذه الظروف.

في ظل المجموعة الثالثة من الشروط & # x02014in ، يتم تحرير المواقع من الاختيار في سلالات مختلفة & # x02014 ، قدّر ML بشكل غير صحيح فرعًا داخليًا بطول صفري على الهيكل الأكثر احتمالية ، مما يعني استنتاج تعدد شديد (الشكل 2)د ). تم استرداد هذه الشجرة متعددة الأشكال حتى عندما تم تحليل متواليات ذات طول لانهائي فعال ، مما يشير إلى أن ML المتماثل غير متسق إحصائيًا في ظل هذه الظروف. على النقيض من ذلك ، لم يكن نموذج طول الفرع المختلط متحيزًا واستعاد السلالة الصحيحة بشكل ملحوظ في كثير من الأحيان. على الرغم من أن BMCMC المتماثل كان أيضًا غير متحيز ، فإن الأشجار التي تم استنتاجها باستخدام BMCMC كانت مدعومة بشكل ضعيف للغاية عندما كان هناك حاجة إلى دعم قوي لحل التطور ، تم تقليل دقة BMCMC إلى تلك الخاصة بـ ML المتماثل. لم يحسن نموذج covarion الأداء (انظر النص التكميلي ، القسم 1 ، المواد التكميلية عبر الإنترنت).

في جميع الظروف ، اختارت AIC العدد الصحيح لفئات طول الفرع لتحليل النموذج المختلط في كثير من الأحيان أكثر من اختيار نموذج بسيط للغاية ، ولم تبالغ أبدًا في تقدير تعقيد النموذج (انظر الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت). على النقيض من ذلك ، فضل BIC نموذجًا أقل من المعلمة في ظل بعض الظروف.

محاكاة أنواع التغاير الملحوظ في التطور الجزيئي

كشفت دراسات التغاير المغايرة عن 3 سمات مهمة. أولاً ، يناسب نموذج covarion الثابت للتطور البيانات التجريبية بشكل أفضل من النماذج المتماثلة (Miyamoto and Fitch 1995 Galtier 2001 Huelsenbeck 2002). ثانيًا ، قد تكون المواقع المختلفة في التسلسل ثابتة في سلالات مختلفة (Fitch and Markowitz 1970 Fitch 1971 ، 1976). ثالثًا ، لوحظ أن نسبة المواقع غير المتغيرة تتباين بين السلالات (Germot and Philippe 1999 Steel et al. 2000 Lockhart et al. 2005). لفحص التأثيرات المحتملة لهذه الأنواع من التغاير على الاستدلال النشئي ، قمنا بمحاكاة التسلسلات تحت 3 نماذج مبسطة: 1) نموذج مشترك ثابت يمكن فيه لكل موقع التبديل باستمرار بين المتغير والثابت بمعدل ثابت مع استمرار التطور ، 2) أ تغيير معدل غير ثابت & # x0201d & # x0201d نموذج تعرض فيه مجموعات المواقع تغييرات مترابطة دورية في المعدلات التطورية ، و 3) نموذج تختلف فيه نسبة المواقع الثابتة بين السلالات. في كل حالة ، قمنا بمحاكاة التسلسلات على طول شجرة منطقة Felsenstein مع سلالات غير متفرعة طويلة الفروع (انظر الشكل 3) ، باستخدام ظروف صعبة وانتظام تغاير قوي. على الرغم من أن هذه المحاكاة لا تشير بالضرورة إلى مستويات التغاير الملحوظة في مجموعات البيانات التجريبية ، إلا أن هذه المحاكاة تسمح لنا باختبار التحيزات الطوبولوجية التي يسببها التغاير باستخدام ظروف صعبة بشكل مقصود للأنواع التي من المحتمل مواجهتها عند تحليل البيانات الحقيقية.

بالنسبة لعملية covarion الثابتة ، قمنا بمحاكاة بيانات التسلسل باستخدام نموذج Tuffley and Steel (1998). في ظل هذه الظروف ، كان ML المتماثل غير متحيز واستعاد الشجرة الصحيحة بدقة عالية (الشكل 3أ التين التكميلي. S3 ، المواد التكميلية عبر الإنترنت). كانت دقة نموذج covarion هي نفسها دقة النموذج المتماثل الأبسط. لم تدعم معايير اختيار النموذج عدة فئات لطول الفروع في ظل هذه الظروف.

لمحاكاة تحولات المعدل المترابطة ، قمنا بتقسيم المواقع على ((AB) ، (CD)) نسالة إلى 50٪ متغير ثابت و 50٪ متغير. في السلالتين A و C ، يتم تحرير نصف المواقع غير المتغيرة من الاختيار وتصبح متغيرة العدد المقابل من المواقع المتغيرة سابقًا يصبح ثابتًا في نفس الأنساب (الشكل 3)ب ). في ظل هذه الظروف ، كانت النماذج المتماثلة منحازة بشدة ، وكان أداء نموذج covarion أكثر سوءًا. في المقابل ، كان النموذج المختلط أكثر دقة بشكل كبير من النماذج المتماثلة وكان غير متحيز ، حيث كان يؤدي تقريبًا مثل MLحقيقية.

لتقييم الآثار المحتملة للتغيرات في النسب الخاصة بالنسب للمواقع الثابتة ، قمنا بمحاكاة البيانات الخاصة بتطور ((AB) و (CD)) ، مع احتواء السلالات A و C على 50 ٪ من المواقع الثابتة ، في حين أن السلالتين B و D كان لهما فقط 25٪ (شكل 3ج ). كان نموذج طول الفرع المختلط أكثر دقة من الطرق الأخرى في ظل هذه الظروف ، في حين كانت النماذج المتماثلة منحازة بشدة لصالح طوبولوجيا جاذبية الفروع الطويلة. كان نموذج covarion أقل دقة بكثير من النماذج المتماثلة.

تظهر هذه النتائج أن تحليل طول الفرع المختلط يمكن أن يحسن جودة السلالات المستنتجة في ظل مجموعة متنوعة من الظروف عندما تتطور التسلسلات بشكل غير متجانس. في المقابل ، كان نموذج covarion أقل دقة من النماذج المتماثلة الأبسط في بعض الحالات ولم يكن أكثر دقة من النماذج المتماثلة حتى عندما تتطابق بدقة مع الظروف التطورية الحقيقية.

تحليل التسلسل التجريبي

على الرغم من أن عمليات المحاكاة يمكن أن تحدد التأثيرات المحتملة للنمط غير المتجانس على دقة النشوء والتطور ، فإن الاختبار الحقيقي لأي طريقة هو مدى دقة إعادة بناء العلاقات التطورية الصحيحة من بيانات التسلسل الحقيقي. لتحديد ما إذا كان نموذج طول الفرع المختلط يمكن أن يحسن دقة الأنساب المستنبطة من التسلسلات التجريبية ، قمنا بتحليل 3 مجموعات بيانات يُعتقد أن التغاير فيها يسبب خطأ في التطور.

أولاً ، قمنا بتحليل مجموعة بيانات EF1 & # x003b1 من Inagaki et al. (2004). أظهرت التحليلات السابقة أنه عندما يتم الاستدلال على نسالة حقيقيات النوى من هذه البيانات باستخدام نموذج تطوري متماثل ، يتم تجميع Microsporidia بشكل مصطنع مع مجموعة Archaebacterial الخارجية (شجرة MA) بدلاً من الفطريات بشكل صحيح (MF ، انظر الشكل 4)أ ). تُظهر التحليلات السابقة أيضًا أن الإزالة المنهجية للمواقع التي تظهر تغيرات قوية في المعدل عبر انقسام البكتيريا البدائية / حقيقيات النوى تقلل من الدعم للوضع غير الصحيح للميكروسبوريديا ، مما يشير إلى أن الانتظام غير المتجانسة قد يكون مسؤولًا جزئيًا على الأقل عن هذه القطعة الأثرية للتطور (Inagaki et al. 2004).

يستعيد نموذج طول الفرع المختلط مجموعة MF الصحيحة من بيانات تسلسل EF1 & # x003b1. (أ) تظهر شجرة MF الصحيحة على اليسار ، وتظهر شجرة MA غير صحيحة على اليمين ، مع أطوال الفروع التي يستدل عليها ML باستخدام نموذج JTT + gamma. (ب) تم رسم الفرق في درجات AIC بين كل نموذج والنموذج مع الحد الأدنى من AIC لطراز JTT + gamma مع فئات طول الفرع 1 & # x020137. تم تقدير طوبولوجيا الشجرة بواسطة ML بشكل منفصل لكل نموذج. يشير السهم إلى النموذج مع الحد الأدنى من نقاط AIC ، وهو النموذج المحدد بواسطة AIC. (ج) يتم رسم نسبة احتمالية السجل لشجرة MF إلى شجرة MA للنماذج التي تحتوي على عدد متزايد من فئات طول الفرع ، حيث تشير نسب lnL السلبية إلى دعم شجرة MA غير الصحيحة والقيم الإيجابية التي تشير إلى دعم شجرة MF الصحيحة. تم تقييم أهمية الدعم لأفضل شجرة في كل حالة باستخدام قيم p اختبار الاتحاد الأفريقي بافتراض أن كل نموذج معروض على اليمين. يشير السهم إلى النموذج المحدد بواسطة AIC.

لتحليل مجموعة بيانات EF1 باستخدام نموذج طول الفرع المختلط ، استخدمنا بحثًا طوبولوجيًا غير مقيد استنادًا إلى التلدين المحاكي (انظر المواد والطرق) لاستنتاج نسالة ML بافتراض نماذج مختلطة مع فئات طول الفرع 1 & # x020137. تم تحديد أفضل عدد من الفئات مناسب & # x02014 واستنتاج الهيكل الناتج & # x02014 باستخدام AIC و BIC. قدمت AIC دعمًا قويًا جدًا لعدم تجانس طول الفرع ، حيث اختارت 6 كأفضل عدد مناسب من فئات طول الفرع مع وزن Akaike & # x0003e0.99 (شكل 4)ب الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت). اختار BIC نموذج covarion مع دعم قوي (وزن BIC & # x0003e0.99).

دعم النموذج المختلط الذي حددته AIC بقوة شجرة MF الصحيحة على سلالة نسالة MA (ص& # x02009 = & # x020090.021 ، شكل. 4ج ). كلما تم التقليل من عدد فئات طول الفرع ، تحول الدعم لصالح شجرة MA. إن المبالغة في تقدير مدى تعقيد النموذج قللت من الدعم للتطور الصحيح ولكنها لم تحبذ الشجرة غير الصحيحة. استعاد نموذج covarion ، الذي كان يفضله BIC ، شجرة MA غير الصحيحة وقدم دعمًا ضئيلًا (الاحتمال الخلفي & # x0003c0.05) لشجرة MF الصحيحة.

لقد أثيرت مخاوف من أن AIC قد تبالغ بشكل منهجي في تقدير تعقيد النموذج (Hurvich and Tsai 1989 Alfaro and Huelsenbeck 2006) يمكن أن يكون BIC متحيزًا لصالح نموذج بسيط للغاية (Weakliem 1999). To determine the accuracy of AIC and BIC in this case, we simulated protein sequence data of the same length as the original data (349 aa) using the JTT + gamma model with 4 branch length classes𠅊 model simpler than the one inferred by AIC𠅊nd parameter values estimated from the original data (see supplementary fig. S4, Supplementary Material online). We found that AIC was slightly conservative, selecting the correct number of branch length classes in 75% of trials the number of classes was underestimated as 2 in the remaining 25% and was never overestimated. In contrast, BIC was strongly biased, selecting a 2-category model from 93% of replicates and a 1-category model in the remaining cases. These results show that an AIC/mixed model approach can improve phylogenetic accuracy in real data analysis. BIC and the covarion model were inferior strategies under these conditions.

To determine if incorporating heterotachy is responsible for the improved phylogenetic accuracy of the mixed model, we performed partitioned analyses, with partitions inferred using the ML tree assuming a 6-category mixed model. We calculated the posterior probability of each branch length class for each site in the data set (see Materials and Methods). Most of the sites were decisively categorized with high posterior probability ( fig. 5 ): 93% of sites were unambiguously categorized with posterior probability greater than 0.9 88% of sites were categorized with posterior probability greater than 0.95 and 81% of sites were categorized with greater than 0.99 posterior probability. We used a variety of posterior probability cutoffs to generate strongly supported partitions sites with posterior probability less than the cutoff were excluded ( fig. 6 ). We found that using a high posterior probability cutoff to classify sites on the MF tree resulted in support for the correct phylogeny, indicating that partitioning sites based on mixed model analysis is sufficient to recover the correct tree. These results are consistent with the hypothesis that the mixed model is capturing an important aspect of EF1α evolution however, it is impossible to rule out heterogeneity in other aspects of the evolutionary process—such as shifts in relative transition rates𠅊s contributing to the improved performance of the mixed model.

Mixed model analysis of EF1α data partitions sites into branch length categories. We plot the posterior probability that each site in the alignment evolved according to each set of branch lengths inferred using a 6-category mixed branch length model (inferred branch lengths shown to the left of each graph). The number above each tree indicates the inferred proportion of sites expected to evolve according to those branch lengths. The tree topology is the same as the MF tree in figure 4أ the Microsporidia clade has been placed at the bottom for space.

Partitioning sites based on mixed branch length analysis recovers the correct MF tree from EF1α data. The log-likelihood ratio of the MF tree to the MA tree is plotted for a partitioned analysis, with sites categorized into groups based on posterior probabilities calculated from a 6-category mixed branch length analysis. Support for the correct MF tree or the incorrect MA tree is indicated by positive or negative lnL values, respectively. NC indicates that no cutoff was used each site was placed in the category having the highest posterior probability.

To determine whether our results obtained using EF1α sequences can be generalized to other data, we analyzed 2 additional data sets: the 16-taxon plastid/eubacterial Rpo data of Lockhart et al. (2005) and a 5-taxon multigene data set derived from the study of bilaterian phylogeny by Philippe, Lartillot, and Brinkmann (2005). Both data sets have been shown to produce artifactual phylogenies. In the case of the Rpo data, MP incorrectly groups green algal plastids with the nonphotosynthetic bacteria outgroup rather than as a sister group to red algae ( fig. 7أ ). The bilaterian data overwhelmingly support a basal position for nematodes when taxon sampling is poor ( fig. 7ب ). Improving taxon sampling and removing genes with accelerated evolutionary rates shift support in favor of a nematode + insect clade (Philippe, Lartillot, and Brinkmann 2005). For each data set, we identified the best-fit evolutionary model using AIC and inferred the ML tree using simulated annealing. Support in favor of the correct phylogeny versus the incorrect tree was calculated using the log-likelihood ratio (lnL).

The mixed branch length model fits both empirical data sets better than a homotachous model and increases support for the correct phylogeny ( fig. 7ج ). Extremely strong support was observed for choosing a mixed model with 3 and 5 classes, respectively, for the Rpo and bilaterian data. For Rpo, the mixed model improved support for the correct phylogeny from a lnL ratio of 5.8—using a homotachous model—to 18.6 (a 𾌀,000-fold improvement in the likelihood ratio). For the bilaterian data, the mixed model reduced support for the incorrect tree versus the correct phylogeny from �.9 to �.0. These results, together with the analysis of EF1α, suggest that the mixed branch length model is likely to be a generally useful strategy for improving phylogenetic accuracy. In some cases—such as the bilaterian example—the mixed model is not sufficient to completely overcome strong topological biases, presumably due to other types of model violations (Lartillot et al. 2007) or inadequate taxon sampling.


Known issues

&lsquoPurists&rsquo will likely notice that there are some issues with the above suggestions. In particular, when you collapse branches or convert small/negative branch lengths to zero-length branches, this has the effect of shortening the tip-to-node distance for the adjacent branch. The difference doesn&rsquot get added back in. So, if you are working with an ultrametric time tree (e.g. output from a previous BEAST analysis), the above manipulations will yield a final tree that is technically, and by an ever so slight margin, non-ultrametric. If the tree of interest wasn&rsquot ultrametric to begin with (e.g. it was from RAxML), then the resulting tree simply will not preserve the overall branch lengths.

The good news is that, after you fix negative branch lengths in your BEAST starting tree, and assuming that you 1) have your starting tree properly specified in your xml input file and 2) the tree fits any calibration priors, your BEAST analysis should start without being impeded by these kinds of errors. Of course, the manipulations I&rsquove discussed above will also fix graphical errors caused by negative branch lengths. OK, I hope the above helps you get your BEAST analyses running full speed ahead when you encounter negative branch length issues.


أشجار النشوء والتطور

ما هي شجرة النشوء والتطور؟
شجرة النشوء والتطور هي تمثيل مرئي للعلاقة بين الكائنات الحية المختلفة ، تظهر المسار عبر الزمن التطوري من سلف مشترك إلى أحفاد مختلفة. يمكن أن تمثل الأشجار علاقات تتراوح من تاريخ الحياة بأكمله على الأرض ، وصولاً إلى الأفراد في مجموعة سكانية.
يوضح الرسم البياني أدناه شجرة من 3 أصناف (التصنيف الفردي هو وحدة تصنيفية يمكن أن تكون نوعًا أو جينًا).

مصطلحات أشجار النشوء والتطور

هذه شجرة متشعبة. تسمى الخطوط العمودية الفروع، تمثل أ النسب، و العقد حيث يتباعدون ، ويمثلون حدث انتواع من سلف مشترك. يسمى الجذع عند قاعدة الشجرة في الواقع جذر. تمثل عقدة الجذر أحدث سلف مشترك من جميع الأصناف الممثلة على الشجرة. يتم تمثيل الوقت أيضًا ، بدءًا من الأقدم في الأسفل إلى الأحدث في الأعلى. ما تخبرنا به هذه الشجرة تحديدًا هو أن الصنف A والأصنف B مرتبطان ارتباطًا وثيقًا ببعضهما البعض أكثر من الصنف C. مجموعة من الأصناف تشمل سلفًا مشتركًا و الكل من نسله يسمى أ كليد. ويقال أيضا أن يكون الكليد أحادي. مجموعة تستبعد واحدًا أو أكثر أحفاد يكون مجففة مجموعة تستبعد السلف المشتركيقال أن يكون r متعدد النوى.

تُظهر الصورة أدناه العديد من الخلايا أحادية اللون (الصف العلوي) مقابل الأشجار متعددة الخلايا (أسفل اليسار) أو الأشجار شبه الحركية (أسفل اليمين).

يركز الفيديو أدناه على المصطلحات ويستكشف بعض المفاهيم الخاطئة حول قراءة الأشجار:

المفاهيم الخاطئة وكيفية قراءة شجرة النشوء والتطور بشكل صحيح

قد تكون قراءة الأشجار محيرة. من الأخطاء الشائعة قراءة نصائح الأشجار والاعتقاد بأن ترتيبها له معنى. في الشجرة أعلاه ، الأقرب بالنسبة للصنف C ليس الصنف B. كلاهما بعيدان عن الصنف C أو مرتبطان بهما. . ما يهم هو ترتيب التفرع على طول محور الوقت. يوضح الرسم التوضيحي أدناه أنه يمكن للمرء تدوير الفروع وعدم التأثير على بنية الشجرة ، مثل الكثير من الأجهزة المحمولة المعلقة:

تعليق الطيور المحمولة بواسطة تشارلي هاربر

قد يكون من الصعب أيضًا التعرف على كيفية قيام الأشجار بنمذجة العلاقات التطورية. شيء واحد يجب تذكره هو أن أي شجرة تمثل مجموعة فرعية صغيرة من شجرة الحياة.

بالنظر إلى الشجرة المكونة من 5 أصناف فقط (بدون فروع منقطة) ، فمن المغري الاعتقاد بأن الصنف S هو الأكثر & # 8220 بدائية & # 8221 أو يشبه إلى حد كبير السلف المشترك الذي تمثله عقدة الجذر ، لأنه لا توجد عقد إضافية بين S و الجذر. ومع ذلك ، كان هناك بلا شك العديد من الفروع من هذا النسب خلال مسار التطور ، ومعظمها أدى إلى انقراض الأصناف (يُعتقد أن 99٪ من جميع الأنواع انقرضت) ، والعديد منها إلى الأصناف الحية (مثل الخط المنقط الأرجواني) وهي مجرد لا يظهر في الشجرة. ما يهم إذن هو المسافة الإجمالية على طول المحور الزمني (المحور الرأسي ، في هذه الشجرة) & # 8211 التصنيف S تطورت لمدة 5 ملايين سنة ، وهي نفس المدة الزمنية مثل أي من الأصناف الأربعة الأخرى. عندما يتم رسم الشجرة ، مع المحور الزمني العمودي ، فإن المحور الأفقي لا معنى له ، ويعمل فقط على فصل الأصناف وأنسابها. لذلك لم يعد أي من الأصناف الحية حاليًا & # 8220primitive & # 8221 ولا أكثر & # 8220 متقدمًا & # 8221 أكثر من أي من الأنواع الأخرى التي تطورت جميعها لنفس المدة الزمنية من سلفهم المشترك الأخير.

يسمح لنا المحور الزمني أيضًا بقياس المسافات التطورية كميًا. المسافة بين A و Q هي 4 ملايين سنة (تطورت A لمدة 2 مليون سنة منذ انفصالهما ، و Q تطورت أيضًا بشكل مستقل عن A لمدة 2 مليون سنة بعد الانقسام). المسافة بين A و D هي 6 ملايين سنة ، منذ انفصالهما عن سلفهما المشترك قبل 3 ملايين سنة.

يمكن أن يكون لأشجار النشوء والتطور أشكال مختلفة & # 8211 قد تكون موجهة بشكل جانبي ، أو مقلوبة (الأحدث في الأسفل) ، أو قد تكون الفروع منحنية ، أو قد تكون الشجرة نصف قطرية (الأقدم في المركز). بغض النظر عن كيفية رسم الشجرة ، فإن الأنماط المتفرعة تنقل جميعًا نفس المعلومات: الأصل التطوري وأنماط الاختلاف.

يقوم هذا الفيديو بعمل رائع في شرح كيفية تفسير العلاقة بين الأنواع باستخدام الأشجار ، بما في ذلك وصف بعض الأشياء الشائعة غير صحيح طرق قراءة الأشجار:

بناء أشجار النشوء والتطور

يمكن استخدام العديد من أنواع البيانات المختلفة لبناء أشجار النشوء والتطور ، بما في ذلك البيانات المورفولوجية ، مثل السمات الهيكلية ، وأنواع الأعضاء ، والترتيبات الهيكلية المحددة والبيانات الجينية ، مثل تسلسل الحمض النووي للميتوكوندريا ، وجينات الحمض النووي الريبي الريبوزومي ، وأي جينات ذات أهمية.

تُستخدم هذه الأنواع من البيانات لتحديد التماثل ، مما يعني التشابه بسبب الأصل المشترك. هذه ببساطة فكرة أنك ترث سمات من والديك ، يتم تطبيقها فقط على مستوى الأنواع: كل البشر لديهم أدمغة كبيرة وإبهام متقابل لأن أسلافنا فعلوا جميع الثدييات تنتج اللبن من الغدد الثديية لأن أسلافهم فعلوا ذلك.

تُبنى الأشجار على مبدأ البخل ، وهي الفكرة القائلة بأن النمط الأكثر احتمالاً هو النمط الذي يتطلب أقل قدر من التغييرات. على سبيل المثال ، من المرجح أن تنتج جميع الثدييات الحليب لأنها جميعًا ورثت غددًا ثديية من سلف مشترك أنتج اللبن من الغدد الثديية ، مقابل مجموعات متعددة من الكائنات الحية التي تتطور كل منها بشكل مستقل عن الغدد الثديية.


حدود الأشجار النشوء والتطور

It may be easy to assume that more closely related organisms look more alike, and while this is often the case, it is not always true. If two closely related lineages evolved under significantly varied surroundings, it is possible for the two groups to appear more different than other groups that are not as closely related. For example, the phylogenetic tree in Figure 3 shows that lizards and rabbits both have amniotic eggs whereas, frogs do not. Yet lizards and frogs appear more similar than lizards and rabbits.

الشكل 3: An organism that lacked a vertebral column roots this ladder-like phylogenetic tree of vertebrates. At each branch point, scientists place organisms with different characters in different groups based on shared characteristics.

Another aspect of phylogenetic trees is that, unless otherwise indicated, the branches do not account for length of time, only the evolutionary order. In other words, a branch’s length does not typically mean more time passed, nor does a short branch mean less time passed— unless specified on the diagram. For example, in Figure 3, the tree does not indicate how much time passed between the evolution of amniotic eggs and hair. What the tree does show is the order in which things took place. Again using Figure 3, the tree shows that the oldest trait is the vertebral column, followed by hinged jaws, and so forth. Remember that any phylogenetic tree is a part of the greater whole, and like a real tree, it does not grow in only one direction after a new branch develops. Thus, for the organisms in Figure 3, just because a vertebral column evolved does not mean that invertebrate evolution ceased. It only means that a new branch formed. Also, groups that are not closely related, but evolve under similar conditions, may appear more phenotypically similar to each other than to a close relative.


شاهد الفيديو: طريقة تجعل اي شجرة صغيرة سريعة في النمو.. زيادة حجم الأشجار بسرعة (كانون الثاني 2022).