معلومة

13.2: نموذج التنويع المعتمد على الدولة - علم الأحياء


تشمل النماذج التي سننظر فيها في هذا الفصل تطور السمات وتنويع النسب المرتبط بها. في أبسط الحالات ، يمكننا النظر في نموذج حيث يكون للحرف حالتان ، 0 و 1 ، وتعتمد معدلات التنويع على هاتين الحالتين. نحتاج إلى نمذجة التحولات بين هذه الحالات ، وهو ما يمكننا القيام به بطريقة مماثلة لما فعلناه في الفصل السابع باستخدام نموذج ماركوف المستمر للوقت. نعبر عن هذا النموذج باستخدام معلمتين للسعر ، معدل آجل ف01 ومعدل عكسي ف10.

نحن الآن نأخذ في الاعتبار فكرة أن معدلات التنويع قد تعتمد على حالة الشخصية. نفترض أن الأنواع ذات الحالة الشخصية 0 لها معدل انتواع معين (λ0) ومعدل الانقراض (ميكرومتر0) ، وأن الأنواع في 1 لها معدلات مختلفة محتملة من كلا النوعين (λ1) والانقراض (ميكرومتر1). أي عندما تتطور الشخصية ، فإنها تؤثر على معدل الانتواع و / أو انقراض السلالات. وهكذا ، لدينا نموذج من ستة متغيرات (ماديسون وآخرون ، 2007). نحن نفترض أن سلالات الوالدين تلد بناتًا بنفس حالة الشخصية ، أي أن حالات الشخصية لا تتغير عند الانتواع.

من السهل محاكاة التطور تحت قيادتنا نموذج التنويع المعتمد على الدولة. نحن نسير بنفس الطريقة التي فعلناها مع نماذج المواليد والوفيات ، من خلال رسم أوقات الانتظار ، لكن أوقات الانتظار هذه يمكن أن تكون فترات انتظار لتغير حالة الشخصية التالية ، أو حدوث انتواع ، أو انقراض. على وجه الخصوص ، تخيل أن هناك ن الأنساب موجودة في الوقت المناسب ر، وذلك ك من هذه الأنساب في الحالة 0 (و نك في الحالة 1). سيتبع وقت انتظار الحدث التالي توزيعًا أسيًا بمعامل معدل:

[ρ = k (q_ {01} + λ_0 + μ_0) + (n - k) (q_ {10} + λ_1 + μ_1) label {13.1} ]

تقول هذه المعادلة أن المعدل الإجمالي للأحداث هو مجموع الأحداث التي يمكن أن تحدث للسلالات ذات الحالة 0 (تغيير الحالة إلى 1 ، أو الانتواع ، أو الانقراض) والأحداث المماثلة التي يمكن أن تحدث للأنساب بالحالة 1. بمجرد أن نحصل على وقت انتظار ، يمكننا تعيين نوع حدث اعتمادًا على الاحتمالات. على سبيل المثال ، احتمال أن يكون الحدث عبارة عن حالة شخصية تتغير من 0 إلى 1 هو:

[p_ {q_ {01}} = (n ⋅ q_ {01}) / ρ التسمية {13.2} ]

واحتمال أن يكون الحدث هو انقراض سلالة مع حالة الحرف 1 هو:

[p_ {μ_1} = dfrac {(n - k) ⋅μ_1} {ρ} label {13.3} ]

وهكذا بالنسبة للأحداث الأربعة الأخرى المحتملة.

بمجرد أن ننتقي حدثًا بهذه الطريقة ، يمكننا تعيينه عشوائيًا لإحدى السلالات في الحالة المناسبة ، مع احتمال اختيار كل سلالة بشكل متساوٍ. ثم ننتقل إلى الأمام في الوقت المناسب حتى نحصل على مجموعة بيانات بالحجم المطلوب أو بعمق الوقت الإجمالي.

يظهر مثال محاكاة في الشكل 13.1. كما ترون ، في ظل هذه المعلمات النموذجية ، يكون تأثير حالات الشخصية على التنويع واضحًا بسهولة. في القسم التالي سنكتشف كيفية استخراج تلك المعلومات من بياناتنا.

الشكل 13.1. محاكاة التنويع المعتمد على الشخصية. تمت محاكاة البيانات وفقًا لنموذج حيث يكون معدل التنويع للحالة صفر (أحمر) أقل بكثير من معدل الحالة 1 (أسود ؛ معلمات النموذج q01 = 110 = 0.05 ، λ0 = 0.2، λ1 = 0.8 ، ميكرولتر0 = μ1 = 0.05). يمكن إعادة استخدام الصورة بواسطة المؤلف بموجب ترخيص CC-BY-4.0.


التنويع المعتمد على الدولة مع HiSSE

BiSSE و MuSSE هما نهجان قويان لاختبار ارتباط الشخصية مع عدم تجانس معدل التنويع. ومع ذلك ، فقد ثبت أن BiSSE عرضة لتحديد ارتباط إيجابي بشكل خاطئ عندما ترتبط تحولات معدل التنويع بشخصية غير مدرجة في النموذج (Maddison and FitzJohn 2015 Rabosky and Goldberg 2015). يتمثل أحد الأساليب لتقليل إمكانية ربط حرف ما بشكل خاطئ مع عدم تجانس معدل التنويع في دمج شخصية ثانية غير ملحوظة في النموذج (بمعنى آخر.، نموذج الانقراض والانقراض التابع للدولة المخفية (HiSSE) انظر على سبيل المثال Beaulieu و O’Meara (2016)). تمثل التغييرات في حالة الشخصية غير المرصودة تغييرات معدل تنويع الخلفية التي لا ترتبط بالحرف المنحني. انظر للحصول على نظرة عامة تخطيطية لنموذج HiSSE ، والجدول 2 للحصول على شرح لمعلمات نموذج HiSSE. فلنقم الآن بإعداد تحليل HiSSE وتشغيله في RevBayes.

سنبقي هذا البرنامج التعليمي موجزًا ​​ونفترض أنك عملت من خلال التنويع المعتمد على الدولة باستخدام BiSSE و MuSSE.

نظرة عامة تخطيطية لنموذج HiSSE. كل سلالة لها حالة ثنائية ملحوظة مرتبطة بها: الحالة 0 (الأزرق) أو الحالة 1 (الأحمر). علاوة على ذلك ، هناك حرف ثنائي غير مُلاحظ (مخفي) بالحالتين A أو B. يصف نموذج HiSSE بشكل مشترك تطور كلا الحرفين ، يجب أن يكون النسب في واحدة من أربع حالات مختلفة: 0A ، 0B ، 1A ، أو 1 ب. نحن نقدر معدلات الانتواع والانقراض منفصلة لكل من هذه الدول الأربع. لاحظ أنه تمامًا مثل BiSSE يمكن أن يمتد بسهولة إلى MuSSE ، RevBayes يسمح لك بتوسيع نماذج HiSSE إلى ما بعد الأحرف الثنائية الملاحظة وغير المراقبة.


القسم 13.2: نموذج التنويع المعتمد على الدولة

تشمل النماذج التي سننظر فيها في هذا الفصل تطور السمات وتنويع النسب المرتبط بها. في أبسط الحالات ، يمكننا النظر في نموذج حيث يكون للحرف حالتان ، 0 و 1 ، وتعتمد معدلات التنويع على هاتين الحالتين.

نحتاج إلى نمذجة التحولات بين هذه الحالات ، وهو ما يمكننا القيام به بطريقة مماثلة لما فعلناه في الفصل السابع باستخدام نموذج ماركوف المستمر للوقت. نعبر عن هذا النموذج باستخدام معلمتين للسعر ، معدل آجل ف01 ومعدل عكسي ف10 .

نحن الآن نأخذ في الاعتبار فكرة أن معدلات التنويع قد تعتمد على حالة الشخصية. نفترض أن الأنواع ذات الحالة الشخصية 0 لها معدل انتواع معين ( λ0 ) ومعدل الانقراض ( ميكرومتر0 ) ، وأن الأنواع في 1 لها معدلات مختلفة محتملة من كلا النوعين ( λ1 ) والانقراض ( ميكرومتر1 ). أي عندما تتطور الشخصية ، فإنها تؤثر على معدل الانتواع و / أو انقراض السلالات. وهكذا ، لدينا نموذج من ستة متغيرات (ماديسون وآخرون ، 2007). نحن نفترض أن سلالات الوالدين تلد بناتًا بنفس حالة الشخصية ، أي أن حالات الشخصية لا تتغير عند الانتواع.

من السهل محاكاة التطور في ظل نموذج التنويع المعتمد على الدولة. نحن نسير بنفس الطريقة التي فعلناها مع نماذج المواليد والوفيات ، من خلال رسم أوقات الانتظار ، لكن أوقات الانتظار هذه يمكن أن تكون فترات انتظار لتغير حالة الشخصية التالية ، أو حدوث انتواع ، أو انقراض. على وجه الخصوص ، تخيل أن هناك ن الأنساب موجودة في الوقت المناسب ر ، وذلك ك من هذه الأنساب في الحالة 0 (و نك في الحالة 1). سيتبع وقت انتظار الحدث التالي توزيعًا أسيًا بمعامل معدل:

تقول هذه المعادلة أن المعدل الإجمالي للأحداث هو مجموع الأحداث التي يمكن أن تحدث للسلالات ذات الحالة 0 (تغيير الحالة إلى 1 ، أو الانتواع ، أو الانقراض) والأحداث المماثلة التي يمكن أن تحدث للأنساب بالحالة 1. بمجرد أن نحصل على وقت انتظار ، يمكننا تعيين نوع حدث اعتمادًا على الاحتمالات. على سبيل المثال ، احتمال أن يكون الحدث عبارة عن حالة شخصية تتغير من 0 إلى 1 هو:

واحتمال أن يكون الحدث هو انقراض سلالة مع حالة الحرف 1 هو:

وهكذا بالنسبة للأحداث الأربعة الأخرى المحتملة.

بمجرد اختيار حدث بهذه الطريقة ، يمكننا تعيينه عشوائيًا إلى إحدى السلالات في الحالة المناسبة ، مع احتمال اختيار كل سلالة بشكل متساوٍ. ثم ننتقل إلى الأمام في الوقت المناسب حتى نحصل على مجموعة بيانات بالحجم المطلوب أو بعمق الوقت الإجمالي.

يظهر مثال محاكاة في الشكل 13.1. كما ترون ، في ظل هذه المعلمات النموذجية ، يكون تأثير حالات الشخصية على التنويع واضحًا بسهولة. في القسم التالي سنكتشف كيفية استخراج تلك المعلومات من بياناتنا.

الشكل 13.1. محاكاة التنويع المعتمد على الشخصية. تمت محاكاة البيانات وفقًا لنموذج حيث يكون معدل التنويع للحالة صفر (أحمر) أقل بكثير من معدل الحالة 1 (معلمات النموذج الأسود ف01 = 110 = 0.05 , λ0 = 0.2 , λ1 = 0.8 , ميكرومتر0 = ميكرومتر1 = 0.05). يمكن إعادة استخدام الصورة بواسطة المؤلف بموجب ترخيص CC-BY-4.0.


ملفات وروابط أخرى

  • APA
  • اساسي
  • هارفارد
  • فانكوفر
  • مؤلف
  • BIBTEX
  • RIS

في: علم الأحياء النظامي ، المجلد. 68 ، رقم 2 ، 03.2019 ، ص. 317-328.

مخرجات البحث: المساهمة في المجلة ›المقال› مراجعة الأقران

T1 - الكشف عن اعتماد التنويع على سمات متعددة من أشجار النشوء والتطور وبيانات السمات

N1 - تم دعم هذا العمل مالياً من قبل Consejo Nacional de Ciencia y Tecnologia (CVU 385304 LH-A.) والمنظمة الهولندية للبحث العلمي (منحة NWO-VICI الممنوحة لـ RSE) وكلية العلوم والهندسة ومعهد جرونينجن علوم الحياة التطورية في جامعة جرونينجن (برنامج الحياة التكيفية PVE).

N2 - يمكن تحديد تنوع الأنواع من خلال العديد من المتغيرات المختلفة ، بما في ذلك سمات السلالات المتنوعة. يحتوي إطار الانتواع والانقراض المعتمد على الدولة (SSE) على طرق لاكتشاف اعتماد التنويع على هذه السمات. لتحليل السمات ذات الحالات المتعددة ، تم تطوير MuSSE (الانتواع والانقراض الذي يعتمد على حالات متعددة). ومع ذلك ، فقد ثبت أن MuSSE ونماذج SSE الأخرى تعطي نتائج إيجابية خاطئة ، لأنها لا تستطيع فصل معدلات التنويع التفاضلي عن اعتماد التنويع على السمات المرصودة. الطريقة التي تم تقديمها مؤخرًا HiSSE (الانتواع والانقراض المعتمدين على الحالة المخفية) تحل هذه المشكلة عن طريق السماح لحالة مخفية بالتأثير على معدلات التنويع. لسوء الحظ ، لا يسمح HiSSE بسمات ذات أكثر من حالتين ، وربما الأكثر إثارة للاهتمام ، العمل المتزامن لسمات متعددة على التنويع. هنا ، نقدم حزمة R (SecSSE: العديد من الأنواع المختبرة والمخفية المعتمدة على الدول والانقراض) التي تجمع بين ميزات HiSSE و MuSSE لاستنتاج التنويع المعتمد على الحالة في وقت واحد عبر اثنين أو أكثر من السمات أو الحالات التي تم فحصها (ملحوظة) أثناء المحاسبة عن دور السمة المخفية (الخفية) المحتملة. علاوة على ذلك ، قامت SecSSE أيضًا بتحسين الوظائف عند مقارنتها بـ "الوالدين". أولاً ، يسمح للسمة المرصودة أن تكون في حالتين أو أكثر في وقت واحد ، وهو أمر مفيد على سبيل المثال عندما يكون الصنف عموميًا أو عندما تكون الحالة الدقيقة غير معروفة بدقة. ثانيًا ، يوفر الاحتمال الصحيح عند شرط عدم الانقطاع ، والذي تم تنفيذه بشكل غير صحيح في HiSSE ونماذج SSE الأخرى. لتوضيح طريقتنا ، قمنا بتطبيق SecSSE على سبع دراسات سابقة استخدمت MuSSE ، ووجدنا أنه في خمس حالات من أصل سبع ، كانت الاستنتاجات المستخلصة على أساس MuSSE سابقة لأوانها. نحن نختبر باستخدام عمليات المحاكاة ما إذا كان SecSSE يضحّي بالقوة الإحصائية لتجنب مشكلة الخطأ من النوع الأول المرتفع لـ MuSSE ، لكننا نجد أن هذا ليس هو الحال: بالنسبة لغالبية عمليات المحاكاة حيث تؤثر السمات المرصودة على التنويع ، يكتشف SecSSE ذلك.

AB - يمكن تحديد تنوع الأنواع من خلال العديد من المتغيرات المختلفة ، بما في ذلك سمات السلالات المتنوعة. يحتوي إطار الانتواع والانقراض المعتمد على الدولة (SSE) على طرق لاكتشاف اعتماد التنويع على هذه السمات. لتحليل السمات ذات الحالات المتعددة ، تم تطوير MuSSE (الانتواع والانقراض الذي يعتمد على حالات متعددة). ومع ذلك ، فقد ثبت أن MuSSE ونماذج SSE الأخرى تعطي نتائج إيجابية خاطئة ، لأنها لا تستطيع فصل معدلات التنويع التفاضلي عن اعتماد التنويع على السمات المرصودة. الطريقة التي تم تقديمها مؤخرًا HiSSE (الانتواع والانقراض المعتمدين على الحالة المخفية) تحل هذه المشكلة عن طريق السماح لحالة مخفية بالتأثير على معدلات التنويع. لسوء الحظ ، لا يسمح HiSSE بسمات ذات أكثر من حالتين ، وربما الأكثر إثارة للاهتمام ، العمل المتزامن لسمات متعددة على التنويع. هنا ، نقدم حزمة R (SecSSE: العديد من الأنواع المختبرة والمخفية المعتمدة على الدول والانقراض) التي تجمع بين ميزات HiSSE و MuSSE لاستنتاج التنويع المعتمد على الحالة في وقت واحد عبر اثنين أو أكثر من السمات أو الحالات التي تم فحصها (ملحوظة) أثناء المحاسبة عن دور السمة المخفية (الخفية) المحتملة. علاوة على ذلك ، قامت SecSSE أيضًا بتحسين الوظائف عند مقارنتها بـ "الوالدين". أولاً ، يسمح للسمة المرصودة أن تكون في حالتين أو أكثر في وقت واحد ، وهو أمر مفيد على سبيل المثال عندما يكون الصنف عموميًا أو عندما تكون الحالة الدقيقة غير معروفة بدقة. ثانيًا ، يوفر الاحتمال الصحيح عند شرط عدم الانقراض ، والذي تم تنفيذه بشكل غير صحيح في HiSSE ونماذج SSE الأخرى. لتوضيح طريقتنا ، قمنا بتطبيق SecSSE على سبع دراسات سابقة استخدمت MuSSE ، ووجدنا أنه في خمس حالات من أصل سبع ، كانت الاستنتاجات المستخلصة على أساس MuSSE سابقة لأوانها. نحن نختبر باستخدام عمليات المحاكاة ما إذا كان SecSSE يضحّي بالقوة الإحصائية لتجنب مشكلة الخطأ من النوع الأول المرتفع لـ MuSSE ، لكننا نجد أن هذا ليس هو الحال: بالنسبة لغالبية عمليات المحاكاة حيث تؤثر السمات الملحوظة على التنويع ، يكتشف SecSSE ذلك.


تعمل نماذج الحالة المخفية على تحسين ملاءمة مناهج التنويع المعتمدة على الدولة باستخدام الأشجار التجريبية ، بما في ذلك النماذج الجغرافية الحيوية

تم مؤخرًا انتقاد نماذج الانتواع والانقراض المعتمدة على الحالة (SSE) نظرًا لارتفاع معدلات النتائج "الإيجابية الخاطئة" ، وقد دعا العديد من الباحثين إلى تجنب نماذج SSE لصالح مناهج أخرى "غير بارامترية" أو "شبه بارامترية" . يوفر نهج نمذجة ماركوف المخفية (HMM) حلاً جزئيًا لقضايا ملاءمة النموذج التي تم اكتشافها باستخدام نماذج SSE. إن إدراج "الحالات المخفية" يمكن أن يفسر عدم تجانس المعدل الذي لوحظ في السلالات التجريبية ويسمح باكتشاف الإشارات الحقيقية للتنويع المعتمد على الدولة أو تحولات التنويع بشكل مستقل عن السمة محل الاهتمام. ومع ذلك ، فإن اعتماد HMM في فئات أخرى من نماذج SSE قد أعاقته التحديات التفسيرية لما تمثله "الحالة المخفية" بالضبط ، والتي نوضحها هنا. نوضح أن نماذج HMM جنبًا إلى جنب مع نهج متوسط ​​النموذج تفسر بشكل طبيعي السمات المخفية عند فحص التأثير ذي المعنى لـ "محرك" التنويع المشتبه به. نقوم أيضًا بتوسيع HMM ليشمل نموذج الانتواع والانقراض المعتمد على الحالة الجغرافية (GeoSSE). نحن نختبر فعالية امتداد "GeoHiSSE" الخاص بنا مع كل من عمليات المحاكاة ومجموعة البيانات التجريبية. بشكل عام ، نظهر أن الحالات المخفية هي إطار عام يمكنه بشكل عام التمييز بين التأثيرات غير المتجانسة للتنويع المنسوب إلى الطابع المحوري.

الكاتب الاشتراكات

تصورت JMB و BCO نهج ماركوف الخفي المطبق على نماذج SSE. تم تصميم عمليات المحاكاة DSC و BCO و JMB ، والنماذج المشتقة ، ومتوسط ​​النموذج المنفذ ورمز R. أجرى DSC عمليات المحاكاة. أجرت JMB تحليلات تجريبية. كتب DSC و BCO و JMB المخطوطة.


تعمل نماذج الحالة المخفية على تحسين مناهج التنويع المعتمدة على الدولة ، بما في ذلك النماذج الجغرافية الحيوية

تم مؤخرًا انتقاد نماذج الانتواع والانقراض المعتمدة على الدولة نظرًا لارتفاع معدلات النتائج "الإيجابية الخاطئة". دعا العديد من الباحثين إلى تجنب نماذج SSE لصالح مناهج "nonparametric" أو "semiparametric" الأخرى. يوفر نهج نمذجة ماركوف المخفية (HMM) حلاً جزئيًا لقضايا ملاءمة النموذج التي تم اكتشافها باستخدام نماذج SSE. إن إدراج "الحالات المخفية" يمكن أن يفسر عدم تجانس المعدل الذي لوحظ في السلالات التجريبية ويسمح بالكشف الموثوق به عن التنويع المعتمد على الدولة أو تحولات التنويع بشكل مستقل عن السمة محل الاهتمام. ومع ذلك ، فقد أعاق اعتماد HMM التحديات التفسيرية لما تمثله "الحالة المخفية" بالضبط ، والتي نوضحها هنا. نوضح أن HMMs جنبًا إلى جنب مع نهج متوسط ​​النموذج يفسر بشكل طبيعي السمات المخفية عند فحص التأثير ذي المعنى لـ "محرك" التنويع المشتبه به. نقوم أيضًا بتوسيع HMM ليشمل نموذج الانتواع والانقراض المعتمد على الحالة الجغرافية (GeoSSE). نحن نختبر فعالية امتداد "GeoHiSSE" الخاص بنا مع كل من عمليات المحاكاة ومجموعة البيانات التجريبية. بشكل عام ، نظهر أن الحالات المخفية هي إطار عام يمكنه التمييز بين التأثيرات غير المتجانسة للتنويع المنسوب إلى شخصية محورية.

الجدول S1: وصف السيناريوهات وقيم المعلمات المستخدمة لمحاكاة البيانات.

الجدول S2: 17 نموذجًا إضافيًا مستخدمة في الدراسة التجريبية للصنوبريات.

الجدول S3: وصف السيناريوهات وقيم المعلمات المستخدمة لمحاكاة أشجار النشوء والتطور وتوزيعات النطاق ضمن نموذج GeoSSE + الاستئصال.

الشكل S1: مخطط معدلات الانتقال بين فئات المعدل (RC0 إلى RC4) المستخدم لسيناريوهات المحاكاة مع فئات معدل متعددة (Sims B و C و D).

الشكل S2: نسبة السلالات المنتشرة على الأشجار التي تمت محاكاتها في إطار السيناريوهين E و F.

الشكل S3: ملخص لدعم النموذج للسيناريوهات المحاكاة من "أ" إلى "د".

الشكل S4: ملخص لدعم النموذج للسيناريوهات المحاكاة من E إلى H.

الشكل S5: دقة تقديرات معدل الدوران والانقراض لسيناريوهات المحاكاة من A إلى D.

الشكل S6: دقة تقديرات التنويع الصافي لسيناريوهات المحاكاة من أ إلى د.

الشكل S7: نتائج معدلات التنويع الصافي النسبية وأوزان نموذج Akaike (AICw) لسيناريوهات المحاكاة B و C.

الشكل S8: توزيع أوزان Akaike لمجموعة النموذج المجهزة لسيناريوهات المحاكاة ext_A to ext_D.

الشكل S9: توزيع قيم المعلمات عبر 100 محاكاة مكررة لكل من السيناريوهات ext_A إلى ext_D.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


تعمل نماذج الحالة المخفية على تحسين مناهج التنويع المعتمدة على الدولة ، بما في ذلك النماذج الجغرافية الحيوية

تم مؤخرًا انتقاد نماذج الانتواع والانقراض المعتمدة على الدولة نظرًا لارتفاع معدلات النتائج "الإيجابية الخاطئة". دعا العديد من الباحثين إلى تجنب نماذج SSE لصالح الأساليب الأخرى "اللامعلمية" أو "شبه المعلمية". يوفر نهج نمذجة ماركوف المخفية (HMM) حلاً جزئيًا لقضايا ملاءمة النموذج التي تم اكتشافها باستخدام نماذج SSE. إن إدراج "الحالات المخفية" يمكن أن يفسر عدم تجانس المعدل الذي لوحظ في السلالات التجريبية ويسمح بالكشف الموثوق به عن التنويع المعتمد على الدولة أو تحولات التنويع بشكل مستقل عن السمة محل الاهتمام. ومع ذلك ، فقد أعاق اعتماد HMM التحديات التفسيرية لما تمثله "الحالة المخفية" بالضبط ، والتي نوضحها هنا. نوضح أن HMMs جنبًا إلى جنب مع نهج متوسط ​​النموذج يفسر بشكل طبيعي السمات المخفية عند فحص التأثير ذي المعنى لـ "محرك" التنويع المشتبه به. نقوم أيضًا بتوسيع HMM ليشمل نموذج الانتواع والانقراض المعتمد على الحالة الجغرافية (GeoSSE). نحن نختبر فعالية امتداد "GeoHiSSE" الخاص بنا مع كل من عمليات المحاكاة ومجموعة البيانات التجريبية. بشكل عام ، نظهر أن الحالات المخفية هي إطار عام يمكنه التمييز بين التأثيرات غير المتجانسة للتنويع المنسوب إلى شخصية محورية.

الجدول S1: وصف السيناريوهات وقيم المعلمات المستخدمة لمحاكاة البيانات.

الجدول S2: 17 نموذجًا إضافيًا مستخدمة في الدراسة التجريبية للصنوبريات.

الجدول S3: وصف السيناريوهات وقيم المعلمات المستخدمة لمحاكاة أشجار النشوء والتطور وتوزيعات النطاق ضمن نموذج GeoSSE + الاستئصال.

الشكل S1: مخطط معدلات الانتقال بين فئات المعدل (RC0 إلى RC4) المستخدمة لسيناريوهات المحاكاة مع فئات معدل متعددة (Sims B و C و D).

الشكل S2: نسبة السلالات المنتشرة على الأشجار التي تمت محاكاتها في إطار السيناريوهين E و F.

الشكل S3: ملخص لدعم النموذج للسيناريوهات المحاكاة من "أ" إلى "د".

الشكل S4: ملخص لدعم النموذج للسيناريوهات المحاكاة من E إلى H.

الشكل S5: دقة تقديرات معدل الدوران والانقراض لسيناريوهات المحاكاة من A إلى D.

الشكل S6: دقة تقديرات التنويع الصافي لسيناريوهات المحاكاة من أ إلى د.

الشكل S7: نتائج معدلات التنويع الصافي النسبية وأوزان نموذج Akaike (AICw) لسيناريوهات المحاكاة B و C.

الشكل S8: توزيع أوزان Akaike لمجموعة النموذج المجهزة لسيناريوهات المحاكاة ext_A to ext_D.

الشكل S9: توزيع قيم المعلمات عبر 100 محاكاة مكررة لكل من السيناريوهات ext_A إلى ext_D.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


قارن تقديرات الأسعار

قارن المعدلات المقدرة عندما يكون وقت النشاط هو الشخصية المحورية مقابل عندما تكون العزلة هي الشخصية التابعة. يمكنك القيام بذلك عن طريق الفتح على حد سواء الملفات في نفس نافذة التتبع. إذا تمكنت من إعطاء جميع المعلمات نفس الاسم ، فمن الممكن مقارنة التقديرات في نافذة التتبع من خلال تمييز كلا الملفين.

استكشف تقديرات البارامترات المختلفة. هل هناك اختلاف؟ هل نفس الشيء؟

لماذا تعتقد أنك قد ترى هذا النمط؟


مراجع

فريلينج إم ، سكانلون إم جي ، فاولر جي إي. التجزئة والوظائف الفرعية بعد ازدواجية الجينوم: الآليات التي تحرك محتوى الجينات وعواقبها. العملة الجينية Opin Dev. 201535: 110-8. https://doi.org/10.1016/j.gde.2015.11.002.

Soltis PS ، Soltis DE. أحداث WGD القديمة كمحركات للابتكارات الرئيسية في كاسيات البذور. Biol النبات بالعملة. 201630: 159-65. https://doi.org/10.1016/j.pbi.2016.03.015.

Tank DC ، Eastman JM ، Pennell MW ، Soltis PS ، Soltis DE ، Hinchliff CE ، et al. الإشعاعات المتداخلة ونبض تنويع كاسيات البذور: غالبًا ما تتبع معدلات التنويع المتزايدة مضاعفات الجينوم الكاملة. فيتول جديد. 2015207 (2): 454–67. https://doi.org/10.1111/nph.13491.

Van de Peer Y، Mizrachi E، Marchal K. الأهمية التطورية لتعدد الصبغيات. نات ريف جينيت. 201718 (7): 411-24. https://doi.org/10.1038/nrg.2017.26.

Zhang K ، Wang XW ، Cheng F. تعدد الصبغيات النباتية: الأصل والتطور وتأثيرها على تدجين المحاصيل. نبات البستنة ياء 20195: 231-9.

Cheng F و Wu J و Cai X و Liang J و Freeling M و Wang X. احتفاظ الجينات والتجزئة والاختلافات الجينية في النباتات متعددة الصيغ الصبغية. نباتات نات. 20184: 258–68.

جاكسون إس ، تشن ZJ. اللدونة الجينومية والتعبير عن تعدد الصبغيات. بيول نبات أوبي بالعملة. 201013 (2): 153-9. https://doi.org/10.1016/j.pbi.2009.11.004.

ريني بيفيلد إس ، جونج إل ، غالاغر جي بي ، ويندل جيه إف. استمرار الجينومات الفرعية في القطن القديم بعد 60 عامًا من التطور. مول بيول إيفول. 201532 (4): 1063–71. https://doi.org/10.1093/molbev/msv001.

Cheng F و Sun C و Wu J و Schnable J و Woodhouse MR و Liang JL وآخرون. التنظيم اللاجيني لهيمنة الجينوم بعد تضاعف الجينوم الكامل في براسيكا رابا. علم النبات الجديد. 2016211: 288-99.

Li AL و Liu DC و Wu J و Zhao XB و Hao M و Geng SF وآخرون. تكشف mRNA ونسخة RNA الصغيرة عن رؤى حول التنظيم المتماثل الديناميكي للتغاير متعدد الصبغيات في القمح السداسي الصبغية الناشئ. الخلية النباتية. 201426 (5): 1878-900. https://doi.org/10.1105/tpc.114.124388.

Thomas BC ، Pedersen B ، Freeling M. بعد tetraploidy في أحد أسلاف نبات الأرابيدوبسيس ، تمت إزالة الجينات بشكل تفضيلي من أحد المتجانسين تاركًا مجموعات غنية في الجينات الحساسة للجرعة. الدقة الجينوم. 200616 (7): 934–46. https://doi.org/10.1101/gr.4708406.

Wang JL ، Tian L ، Lee HS ، Wei NE ، Jiang HM ، Watson B ، وآخرون. تنظيم الجين غير المضاف على نطاق الجينوم في أرابيدوبسيس ألوتيترابلويدس. علم الوراثة. 2006172 (1): 507-17. https://doi.org/10.1534/genetics.105.047894.

الجزائر EI، Edger PP. جين فرعي واحد يحكمهم جميعًا: الآليات الأساسية لهيمنة الجينوم. Biol النبات بالعملة. 202054: 108-13. https://doi.org/10.1016/j.pbi.2020.03.004.

Freeling M ، Woodhouse MR ، Subramaniam S ، Turco G ، Lisch D ، Schnable JC. طفرات التجزئة والعواقب المماثلة لآليات إزالة الحمض النووي القابل للاستغناء أو الأقل تعبيرًا في النباتات. Biol النبات بالعملة. 201215: 131-9.

Edger PP و Smith R و McKain MR و Cooley AM و Vallejo-Marin M و Yuan YW وآخرون. هيمنة الجينوم الفرعي في هجين متعدد الأنواع ، متعدد الصبغيات الاصطناعية ، و 140 عامًا من الزهرة أحادية الصيغ الصبغية الجديدة المكونة بشكل طبيعي. الخلية النباتية. 201729 (9): 2150–67. https://doi.org/10.1105/tpc.17.00010.

Cheng F و Wu J و Fang L و Sun SL و Liu B و Lin K وآخرون. تجزئة الجينات المتحيزة والتعبير الجيني السائد بين الجينومات الفرعية لـ براسيكا رابا. بلوس واحد. 20127 (5): e36442. https://doi.org/10.1371/journal.pone.0036442.

فايفر إم ، كوجلر كغ ، ساندفي إس آر ، زان بج ، رودي إتش ، هفيدستن تي آر ، وآخرون. تفاعل الجينوم في نسخة الحبوب لقمح الخبز سداسي الصبغيات. علم. 2014345 (6194): 1250091. https://doi.org/10.1126/science.1250091.

Bird KA ، VanBuren R ، Puzey JR ، Edger PP. أسباب وعواقب هيمنة الجينوم في الأنواع الهجينة والبوليبويدات الحديثة. فيتول جديد. 2018220 (1): 87-93. https://doi.org/10.1111/nph.15256.

شلهوب ب ، دينوود إف ، ليو سي ، باركين إيب ، تانغ إتش بي ، وانغ إكس واي ، وآخرون. تطور الصيغ الصبغية المبكرة في ما بعد العصر الحجري الحديث napus براسيكا جينوم البذور الزيتية. علم. 2014345 (6199): 950-3. https://doi.org/10.1126/science.1253435.

ليفين دا ، سولتيس دي. العوامل التي تعزز استمرار تعدد الصبغيات وتنويعها وتحد من الانتواع ثنائي الصيغة الصبغية خلال فترة K-Pg. Biol النبات بالعملة. 201842: 1–7. https://doi.org/10.1016/j.pbi.2017.09.010.

سلمان مينكوف أ ، سباث إن ، مايروز آي. ازدواجية الجينوم الكامل كعامل رئيسي في تدجين المحاصيل. NatPlants. 20162 (8). https://doi.org/10.1038/nplants.2016.115.

Vanneste K، Maere S، Van de Peer Y. متشابكة في قسمين: انفجار الجينوم المزدوج في نهاية العصر الطباشيري وعواقب تطور النبات. شركة Philos Trans R Soc B Biol Sci. 2014369 (1648): 20130353. https://doi.org/10.1098/rstb.2013.0353.

ليتش أر ، ليتش آي جيه. اللدونة الجينومية وتنوع النباتات متعددة الصبغيات. علم. 2008320 (5875): 481–3. https://doi.org/10.1126/science.1153585.

Cheng F و Sun RF و Hou XL و Zheng HK و Zhang FL و Zhang YY وآخرون. يرتبط الاختيار المتوازي للجينوم بتنويع النمط المورفولوجي وتدجين المحاصيل المتقاربة في براسيكا رابا و براسيكا أوليراسيا. نات جينيه. 201648 (10): 1218–24. https://doi.org/10.1038/ng.3634.

Renny-Byfield S، Rodgers-Melnick E، Ross-Ibarra J. تجزئة الجينات ووظيفتها في الجينات الفرعية القديمة للذرة. مول بيول إيفول. 201734 (8): 1825–32. https://doi.org/10.1093/molbev/msx121.

وانج إم ، تو إل ، لين إم ، لين زد ، وانج بي ، يانج كيو ، وآخرون. اختيار الجينوم غير المتماثل والاختلاف التنظيمي لرابطة الدول المستقلة أثناء تدجين القطن. نات جينيه. 201749 (4): 579–87. https://doi.org/10.1038/ng.3807.

Liu YC و Du HL و Li PC و Shen YT و Peng H و Liu SL et al. عموم جينوم فول الصويا البري والمزروع. زنزانة. 2020182: 162.

Song JM و Guan ZL و Hu JL و Guo CC و Yang ZQ و Wang S et al. تكشف ثمانية جينومات عالية الجودة عن بنية الجينوم الشاملة وتمايز النمط البيئي لـ napus براسيكا. نباتات نات. 20206: 34.

Yang X ، Lee WP ، Ye K ، Lee C. جينوم مرجعي واحد غير كافٍ. جينوم بيول. 201920 (1): 104. https://doi.org/10.1186/s13059-019-1717-0.

Yu JY و Golicz AA و Lu K و Dossa K و Zhang YX و Chen JF وآخرون. نظرة ثاقبة على التطور والخصائص الوظيفية لتجميع الجينوم الشامل من سلالات السمسم والأصناف الحديثة. التكنولوجيا الحيوية النباتية J.201917: 881-92.

Zhang L و Cai X و Wu J و Liu M و Grob S و Cheng F et al. محسّن براسيكا رابا مرجع الجينوم عن طريق تسلسل جزيء واحد وتقنيات التقاط التشكل الكروموسوم. Res البستنة. 20185 (1): 50. https://doi.org/10.1038/s41438-018-0071-9.

Alonge M ، Wang X ، Benoit M ، Soyk S ، Pereira L ، Zhang L ، et al. الآثار الرئيسية للتنوع البنيوي الواسع على التعبير الجيني وتحسين المحاصيل في الطماطم. زنزانة. 2020182: 145-61 e123.

جولش آ ايه ، باير بي ، باركر جي سي ، إدجر بي بي ، كيم إتش ، مارتينيز بي إيه ، إت آل. نبات محصول مهم من الناحية الزراعية براسيكا أوليراسيا. نات كومون. 20167 (1): 13390. https://doi.org/10.1038/ncomms13390.

Hubner S و Bercovich N و Todesco M و Mandel JR و Odenheimer J و Ziegler E et al. يُظهر تحليل الجينوم الشامل لعباد الشمس أن التهجين غيّر محتوى الجين ومقاومة الأمراض. نباتات نات. 20195 (1): 54-62. https://doi.org/10.1038/s41477-018-0329-0.

ماريتي إل ، جنسن جي إم ، بيترسن بي ، سيبيسين جان ، ليو سي ، فيليسن بي ، وآخرون. التسلسل و من جديد تجميع 150 جينومًا من الدنمارك كمرجع سكاني. طبيعة سجية. 2017548: 87.

Medini D ، Donati C ، Tettelin H ، Masignani V ، Rappuoli R. الجينوم الميكروبي. العملة الجينية Opin Dev. 200515 (6): 589-94. https://doi.org/10.1016/j.gde.2005.09.006.

Tettelin H و Masignani V و Cieslewicz MJ و Donati C و Medini D و Ward NL وآخرون. تحليل الجينوم لعزلات ممرضة متعددة من Streptococcus agalactiae: الآثار المترتبة على الميكروبات "عموم الجينوم". Proc Natl Acad Sci U S A. 2005102 (39): 13950-5. https://doi.org/10.1073/pnas.0506758102.

Gao L و Gonda I و Sun HH و Ma QY و Bao K و Tieman DM et al. يكشف جينوم الطماطم عن جينات جديدة وأليل نادر ينظم نكهة الفاكهة. نات جينيه. 201951: 1044.

Zhao Q و Feng Q و Lu HY و Li Y و Wang A و Tian QL وآخرون. يسلط تحليل عموم الجينوم الضوء على مدى التباين الجينومي في الأرز المزروع والبرية. نات جينيه. 201850: 279.

Jiao WB ، Schneeberger K. تكشف التجميعات على مستوى الكروموسوم لجينومات متعددة من نبات الأرابيدوبسيس عن نقاط ساخنة لإعادة الترتيب مع ديناميكيات تطورية متغيرة. نات كومون. 202011 (1): 989. https://doi.org/10.1038/s41467-020-14779-y.

Gordon SP و Contreras-Moreira B و Woods DP و Marais DLD و Burgess D و Shu SQ وآخرون. يرتبط التباين الواسع في محتوى الجين في جينوم Brachypodium distachyon الشامل ببنية السكان. نات كومون. 20178 (1): 2184. https://doi.org/10.1038/s41467-017-02292-8.

Nagaharu U. تحليل الجينوم في براسيكا مع إشارة خاصة إلى التكوين التجريبي لـ قيلولة وطريقة الإخصاب الغريبة. Jpn J Bot. 19357: 389-452.

وانغ إكس دبليو ، وانغ هرتز ، وانغ جي ، صن آر إف ، وو جي ، ليو سي ، وآخرون. جينوم أنواع المحاصيل متوسطة الصبغية براسيكا رابا. نات جينيه. 201143 (10): 1035 –1157. https://doi.org/10.1038/ng.919.

Cheng F ، Mandakova T ، Wu J ، Xie Q ، Lysak MA ، Wang XW. فك شفرة جينوم الأسلاف ثنائي الصيغة الصبغية من الهكسابويد المتوسط براسيكا رابا. الخلية النباتية. 201325 (5): 1541–54. https://doi.org/10.1105/tpc.113.110486.

Lye ZN ، Purugganan MD. تباين رقم النسخ في التدجين. اتجاهات نباتية. 201924 (4): 352–65. https://doi.org/10.1016/j.tplants.2019.01.003.

وو J ، ووي K ، وتشنغ إف ، ولي إس ، وانغ كيو ، وتشاو J ، وآخرون. تباين InDel يحدث بشكل طبيعي في BraA.FLC.b (BrFLC2) المرتبطة باختلاف وقت الإزهار في براسيكا رابا. بيول مصنع بيول. 201212 (1): 151. https://doi.org/10.1186/1471-2229-12-151.

Belser C و Istace B و Denis E و Dubarry M و Baurens FC و Falentin C et al. تجميعات على نطاق الكروموسوم لجينومات النبات باستخدام قراءات طويلة وخرائط بصرية. نباتات نات. 20184 (11): 879–87. https://doi.org/10.1038/s41477-018-0289-4.

لي PR ، Su TB ، Zhao XY ، Wang WH ، Zhang DS ، Yu YJ ، Bayer PE ، Edwards D ، Yu SC ، Zhang FL. تجميع جينوم pak choi بدون عنوان ومقارنته بجينومات الملفوف الصيني الرئيسي والبذور الزيتية الصفراء. التكنولوجيا الحيوية النباتية ج. 2021. https://doi.org/10.1111/pbi.13522.

Boutte J ، Maillet L ، Chaussepied T ، Letort S ، Aury JM ، Belser C ، et al. يكشف تباين حجم الجينوم وعلم الجينوم المقارن عن تنوع داخل النوع في براسيكا رابا. علوم النبات الأمامية. 202011. https://doi.org/10.3389/fpls.2020.577536.

Dudchenko O و Batra SS و Omer AD و Nyquist SK و Hoeger M و Durand NC et al. من جديد ينتج عن تجميع جينوم Aedes aegypti باستخدام Hi-C سقالات بطول الكروموسوم. علم. 2017356 (6333): 92-5. https://doi.org/10.1126/science.aal3327.

Cai X و Wu J و Liang J و Lin R و Zhang K و Cheng F et al. محسّن براسيكا أوليراسيا يكشف تجميع JZS عن تغيير كبير في ديناميكيات LTR-RT في أنماط مختلفة. Theor Appl Genet. 2020133 (11): 3187–99. https://doi.org/10.1007/s00122-020-03664-3.

Sun SL و Zhou YS و Chen J و Shi JP و Zhao HM و Zhao HN وآخرون. ترتيب الجينات غير المحدد على نطاق واسع والاختلافات الهيكلية الجينية بين Mo17 وجينومات الذرة الأخرى. نات جينيه. 201850: 1289.

Teale WD و Paponov IA و Palme K. Auxin في العمل: إرسال الإشارات والنقل والتحكم في نمو النبات وتطوره. بيول ريف مول خلية نات. 20067 (11): 847-59. https://doi.org/10.1038/nrm2020.

Murat F ، Louis A ، Maumus F ، Armero A ، Cooke R ، Quesneville H ، et al. فهم تطور الكرنب من خلال إعادة بناء جينوم الأجداد. جينوم بيول. 201516 (1): 262. https://doi.org/10.1186/s13059-015-0814-y.

Cheng F, Liang JL, Cai CC, Cai X, Wu J, Wang XW. Genome sequencing supports a multi-vertex model for Brassiceae species. Curr Opin Plant Biol. 201736:79–87. https://doi.org/10.1016/j.pbi.2017.01.006.

Liu SY, Liu YM, Yang XH, Tong CB, Edwards D, Parkin IAP, Zhao MX, Ma JX, Yu JY, Huang SM, et al. ال براسيكا أوليراسيا genome reveals the asymmetrical evolution of polyploid genomes. نات كومون. 20145(3930):3930. https://doi.org/10.1038/ncomms4930.

Perumal S, Koh CS, Jin L, Buchwaldt M, Higgins EE, Zheng C, et al. A high-contiguity براسيكا نيجرا genome localizes active centromeres and defines the ancestral Brassica الجينوم. Nat Plants. 20206(8):929–41. https://doi.org/10.1038/s41477-020-0735-y.

Zhang X, Yue Z, Mei S, Qiu Y, Yang X, Chen X, et al. أ من جديد genome of a Chinese radish cultivar. Horticultural Plant J. 20151:155–64.

Gao LW, Lyu SW, Tang J, Zhou DY, Bonnema G, Xiao D, et al. Genome-wide analysis of auxin transport genes identifies the hormone responsive patterns associated with leafy head formation in Chinese cabbage. Sci Rep. 20177:42229. https://doi.org/10.1038/srep42229.

Schnable JC, Springer NM, Freeling M. Differentiation of the maize subgenomes by genome dominance and both ancient and ongoing gene loss. Proc Natl Acad Sci U S A. 2011108(10):4069–74. https://doi.org/10.1073/pnas.1101368108.

Paterson AH, Wendel JF, Gundlach H, Guo H, Jenkins J, Jin DC, et al. Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres. طبيعة سجية. 2012492:423.

Emery M, Willis MMS, Hao Y, Barry K, Oakgrove K, Peng Y, et al. Preferential retention of genes from one parental genome after polyploidy illustrates the nature and scope of the genomic conflicts induced by hybridization. PLoS Gen. 201814(3):e1007267. https://doi.org/10.1371/journal.pgen.1007267.

Byrne ME. Networks in leaf development. Curr Opin Plant Biol. 20058(1):59–66. https://doi.org/10.1016/j.pbi.2004.11.009.

Husbands AY, Chitwood DH, Plavskin Y, Timmermans MCP. Signals and prepatterns: new insights into organ polarity in plants. تطوير الجينات. 200923(17):1986–97. https://doi.org/10.1101/gad.1819909.

Kidner CA, Timmermans MCP. Mixing and matching pathways in leaf polarity. Curr Opin Plant Biol. 200710(1):13–20. https://doi.org/10.1016/j.pbi.2006.11.013.

Townsley BT, Sinha NR. A new development: evolving concepts in leaf ontogeny. Ann Rev Plant Biol. 201263:535–62.

Ge Y, Ramchiary N, Wang T, Liang C, Wang N, Wang Z, et al. Mapping quantitative trait loci for leaf and heading-related traits in chinese cabbage (Brassica rapa L. ssp pekinesis). Horticulture Environ Biotechnol. 201152:494–501.

Inoue T, Kubo N, Kondo T, Hirai M. Detection of quantitative trait loci for heading traits in Brassica rapa using different heading types of Chinese cabbage. J Horticultural Sci Biotechnol. 201590(3):311–7. https://doi.org/10.1080/14620316.2015.11513188.

Allen GC, Flores-Vergara MA, Krasnyanski S, Kumar S, Thompson WF. A modified protocol for rapid DNA isolation from plant tissues using cetyltrimethylammonium bromide. نات بروتوك. 20061:2320–5.

Pendleton M, Sebra R, Pang AW, Ummat A, Franzen O, Rausch T, et al. Assembly and diploid architecture of an individual human genome via single-molecule technologies. طرق نات. 201512(8):780–6. https://doi.org/10.1038/nmeth.3454.

Grob S, Schmid MW, Grossniklaus U. Hi-C Analysis in Arabidopsis Identifies the KNOT, a Structure with Similarities to the flamenco Locus of ذبابة الفاكهة. خلية مول. 201455:678–93.

Zimin AV, Puiu D, Luo MC, Zhu TT, Koren S, Marcais G, et al. Hybrid assembly of the large and highly repetitive genome of Aegilops tauschii, a progenitor of bread wheat, with the MaSuRCA mega-reads algorithm. الدقة الجينوم. 201727(5):787–92. https://doi.org/10.1101/gr.213405.116.

Waterhouse RM, Seppey M, Simao FA, Manni M, Ioannidis P, Klioutchnikov G, et al. BUSCO applications from quality assessments to gene prediction and phylogenomics. مول بيول إيفول. 201835:543–8.

Durand NC, Shamim MS, Machol I, Rao SSP, Huntley MH, Lander ES, et al. Juicer provides a one-click system for analyzing loop-resolution Hi-C experiments. Cell Syst. 20163(1):95–8. https://doi.org/10.1016/j.cels.2016.07.002.

Robinson JT, Turner D, Durand NC, Thorvaldsdottir H, Mesirov JP, Aiden EL. Juicebox.js provides a cloud-based visualization system for Hi-C data. Cell Syst. 20186:256.

Kurtz S, Phillippy A, Delcher AL, Smoot M, Shumway M, Antonescu C, et al. Versatile and open software for comparing large genomes. جينوم بيول. 20045(2):R12. https://doi.org/10.1186/gb-2004-5-2-r12.

Ou S, Su W, Liao Y, Chougule K, Agda JRA, Hellinga AJ, et al. Benchmarking transposable element annotation methods for creation of a streamlined, comprehensive pipeline. جينوم بيول. 201920(1):275. https://doi.org/10.1186/s13059-019-1905-y.

Tarailo-Graovac M, Chen N. Using RepeatMasker to identify repetitive elements in genomic sequences. Curr Protoc Bioinformatics. 2009Chapter 4(Unit 4):10.

Besemer J, Borodovsky M. GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses. الدقة الأحماض النووية. 200533(Web Server):W451–4. https://doi.org/10.1093/nar/gki487.

Birney E, Clamp M, Durbin R. GeneWise and genomewise. الدقة الجينوم. 200414(5):988–95. https://doi.org/10.1101/gr.1865504.

Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nat Biotechnol. 201129(7):644–U130. https://doi.org/10.1038/nbt.1883.

Haas BJ, Delcher AL, Mount SM, Wortman JR, Smith RK, Hannick LI, et al. Improving the أرابيدوبسيس genome annotation using maximal transcript alignment assemblies. الدقة الأحماض النووية. 200331(19):5654–66. https://doi.org/10.1093/nar/gkg770.

Haas BJ, Salzberg SL, Zhu W, Pertea M, Allen JE, Orvis J, et al. Automated eukaryotic gene structure annotation using EVidenceModeler and the Program to Assemble Spliced Alignments. جينوم بيول. 20089(1):R7. https://doi.org/10.1186/gb-2008-9-1-r7.

Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D, et al. InterPro: the integrative protein signature database. الدقة الأحماض النووية. 200937(Database):D211–5. https://doi.org/10.1093/nar/gkn785.

Emms DM, Kelly S. OrthoFinder: phylogenetic orthology inference for comparative genomics. جينوم بيول. 201920(1):238. https://doi.org/10.1186/s13059-019-1832-y.

Chen CJ, Chen H, Zhang Y, Thomas HR, Frank MH, He YH, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data. Mol Plant. 202013:1194–202.

Xu Z, Wang H. LTR_FINDER: an efficient tool for the prediction of full-length LTR retrotransposons. الدقة الأحماض النووية. 200735(Web Server):W265–8. https://doi.org/10.1093/nar/gkm286.

Ou SJ, Jiang N. LTR_retriever: a highly accurate and sensitive program for identification of long terminal repeat retrotransposons. نبات فيزيول. 2018176(2):1410–22. https://doi.org/10.1104/pp.17.01310.

Katoh K, Kuma K, Toh H, Miyata T. MAFFT version 5: improvement in accuracy of multiple sequence alignment. الدقة الأحماض النووية. 200533(2):511–8. https://doi.org/10.1093/nar/gki198.

Talavera G, Castresana J. Improvement of phylogenies after removing divergent and ambiguously aligned blocks from protein sequence alignments. Syst Biol. 200756(4):564–77. https://doi.org/10.1080/10635150701472164.

Stamatakis A. RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. المعلوماتية الحيوية. 201430(9):1312–3. https://doi.org/10.1093/bioinformatics/btu033.

Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L, et al. A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w(1118) iso-2 iso-3. Fly. 20126(2):80–92. https://doi.org/10.4161/fly.19695.

Chen SF, Zhou YQ, Chen YR. Gu J: fastp: an ultra-fast all-in-one FASTQ preprocessor. المعلوماتية الحيوية. 201834:884–90.

Li H ، Durbin R. محاذاة قراءة قصيرة سريعة ودقيقة مع تحويل Burrows-Wheeler. المعلوماتية الحيوية. 200925(14):1754–60. https://doi.org/10.1093/bioinformatics/btp324.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. The sequence alignment/map format and SAMtools. المعلوماتية الحيوية. 200925(16):2078–9. https://doi.org/10.1093/bioinformatics/btp352.

Eggertsson HP, Jonsson H, Kristmundsdottir S, Hjartarson E, Kehr B, Masson G, et al. Graphtyper enables population-scale genotyping using pangenome graphs. نات جينيه. 201749:1654.

Kronenberg ZN, Fiddes IT, Gordon D, Murali S, Cantsilieris S, Meyerson OS, et al. High-resolution comparative analysis of great ape genomes. علم. 2018360:1085.

Garrison E, Siren J, Novak AM, Hickey G, Eizenga JM, Dawson ET, et al. Variation graph toolkit improves read mapping by representing genetic variation in the reference. Nat Biotechnol. 201836:875.

Goel M, Sun HQ, Jiao WB, Schneeberger K. SyRI: finding genomic rearrangements and local sequence differences from whole-genome assemblies. جينوم بيول. 201920(1):277. https://doi.org/10.1186/s13059-019-1911-0.

Kim D, Landmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements. طرق نات. 201512(4):357–U121. https://doi.org/10.1038/nmeth.3317.

Kovaka S, Zimin AV, Pertea GM, Razaghi R, Salzberg SL, Pertea M. Transcriptome assembly from long-read RNA-seq alignments with StringTie2. جينوم بيول. 201920(1):278. https://doi.org/10.1186/s13059-019-1910-1.

Marcais G, Delcher AL, Phillippy AM, Coston R, Salzberg SL, Zimin A. MUMmer4: A fast and versatile genome alignment system. PLoS Computat Biol. 201814(1):e1005944. https://doi.org/10.1371/journal.pcbi.1005944.

Li H. Minimap2: pairwise alignment for nucleotide sequences. المعلوماتية الحيوية. 201834:3094–100.

Cheng F, Wu J, Fang L, Wang XW. Syntenic gene analysis between Brassica rapa and other Brassicaceae species. علوم النبات الأمامية. 20123. https://doi.org/10.3389/fpls.2012.00198.

Akey JM, Zhang G, Zhang K, Jin L, Shriver MD. Interrogating a high-density SNP map for signatures of natural selection. الدقة الجينوم. 200212(12):1805–14. https://doi.org/10.1101/gr.631202.

Xu X, Liu X, Ge S, Jensen JD, Hu FY, Li X, et al. Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes. Nat Biotechnol. 201230(1):105–U157. https://doi.org/10.1038/nbt.2050.

Sabeti PC, Varilly P, Fry B, Lohmueller J, Hostetter E, Cotsapas C, et al. Genome-wide detection and characterization of positive selection in human populations. طبيعة سجية. 2007449(7164):913–U912. https://doi.org/10.1038/nature06250.

Danecek P, Auton A, Abecasis G, Albers CA, Banks E, DePristo MA, et al. The variant call format and VCFtools. المعلوماتية الحيوية. 201127(15):2156–8. https://doi.org/10.1093/bioinformatics/btr330.

Cai X, Chang L, Zhang T, Chen H, Zhang L, Lin R, et al. Impacts of allopolyploidization and structural variation on intraspecific diversification in Brassica rapa. Dataset NCBI. 2021 https://www.ncbi.nlm.nih.gov/bioproject/PRJNA730930.

Zhang Z, Zhao WM, Xiao JF, Bao YM, Wang F, Hao LL, et al. Database resources of the BIG Data Center in 2019. Nucleic Acids Res. 201947:D8–D14.

Cai et al. Genome assemblies and annotations of Brassica rapa accessions. 2021. https://doi.org/10.6084/m9.figshare.14571297.v1.

مراجعة التاريخ

The review history is available as Additional file 6.

معلومات مراجعة الأقران

Wenjing She was the primary editor of this article and managed its editorial process and peer review in collaboration with the rest of the editorial team.


Hidden state models improve state-dependent diversification approaches, including biogeographical models

The state-dependent speciation and extinction (SSE) models have recently been criticized due to their high rates of “false positive” results. Many researchers have advocated avoiding SSE models in favor of other “nonparametric” or “semiparametric” approaches. The hidden Markov modeling (HMM) approach provides a partial solution to the issues of model adequacy detected with SSE models. The inclusion of “hidden states” can account for rate heterogeneity observed in empirical phylogenies and allows for reliable detection of state-dependent diversification or diversification shifts independent of the trait of interest. However, the adoption of HMM has been hampered by the interpretational challenges of what exactly a “hidden state” represents, which we clarify herein. We show that HMMs in combination with a model-averaging approach naturally account for hidden traits when examining the meaningful impact of a suspected “driver” of diversification. We also extend the HMM to the geographic state-dependent speciation and extinction (GeoSSE) model. We test the efficacy of our “GeoHiSSE” extension with both simulations and an empirical dataset. On the whole, we show that hidden states are a general framework that can distinguish heterogeneous effects of diversification attributed to a focal character.

Table S1: Description of scenarios and parameter values used to simulate the data.

الجدول S2: Additional 17 models used in empirical study of conifers.

الجدول S3: Description of scenarios and parameter values used to simulate phylogenetic trees and range distributions under the GeoSSE+extirpation model.

الشكل S1: Scheme of the transition rates between rate classes (RC0 to RC4) used for the simulation scenarios with multiple rate classes (Sims B, C, and D).

الشكل S2: Proportion of widespread lineages on trees simulated under scenarios E and F.

Figure S3: Summary of model support for simulated scenarios A to D.

Figure S4: Summary of model support for simulated scenarios E to H.

Figure S5: Accuracy of turnover and extinction fraction estimates for simulations scenarios A to D.

Figure S6: Accuracy of net diversification estimates for simulations scenarios A to D.

Figure S7: Results for relative net diversification rates and Akaike model weights (AICw) for simulation scenarios B and C.

Figure S8: Distribution of Akaike weights for the model set fitted to simulation scenarios ext_A to ext_D.

Figure S9: Distribution of parameter values across 100 simulation replicates for each of the scenarios ext_A to ext_D.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


شاهد الفيديو: الصف الثاني عشر المسار العلمي 2 الأحياء تدريبات على الانتخاب الطبيعي (كانون الثاني 2022).