معلومة

7.5: محاكاة نموذج Mk على شجرة - علم الأحياء


يمكننا أيضًا استخدام المعادلات أعلاه لمحاكاة التطور تحت نموذج Mk أو نموذج Mk الممتد على شجرة (Felsenstein 2004). سيعتمد توزيع حالات الشخصية على شكل شجرة النشوء والتطور (كل من طوبولوجيا وأطوال الفروع) جنبًا إلى جنب مع معلمات نموذجنا لتطور الشخصية.

نرسم أولاً حالة شخصية أولية في جذر الشجرة. هناك عدة طرق شائعة للقيام بذلك. على سبيل المثال ، يمكننا إما أن نستخلص من التوزيع الثابت أو من التوزيع الذي تكون فيه كل حالة شخصية متساوية في الاحتمال. في حالة نموذج Mk القياسي ، فهذه هي نفسها. على سبيل المثال ، إذا كنا نحاكي التطور تحت Mk مع ك = 2 ، ثم حدد 0 و 1 لكل منهما احتمال 1/2 عند الجذر. يمكننا استخلاص حالة الجذر من التوزيع ذي الحدين صسرأره0 = 0.5.

بمجرد أن نحصل على حالة شخصية للجذر ، فإننا نحاكي التطور على طول كل فرع في الشجرة. نبدأ مع الفرعين (عادة فرعين) ينزلان من الجذر. ثم ننتقل إلى أعلى الشجرة ، فرعًا تلو الآخر ، حتى نصل إلى الأطراف.

يمكننا فهم هذه الخوارزمية جيدًا من خلال التفكير فيما يحدث على كل فرع من فروع الشجرة ، ثم توسيع هذه الخوارزمية لتشمل جميع الفروع (كما هو موضح أعلاه). لكل فرع ، نحسب أولاً ص(ر) ، مصفوفة احتمالية الانتقال ، بالنظر إلى طول الفرع ونموذج التطور الخاص بنا كما تم تلخيصه بواسطة س وطول الفرع ر. ثم نركز على صف ص(ر) الذي يتوافق مع حالة الحرف في بداية الفرع. على سبيل المثال ، دعنا نفكر في نموذج Mk الأساسي ذي الحالتين مع ف = 0.5. سوف نسمي الحالتين 0 و 1. يمكننا الحساب ص(ر) لفرع بطول ر = 3 كـ:

(مكافئ 7.16)

$$ mathbf {P} (t) = e ^ { mathbf {Q} t} = exp ( begin {bmatrix} -0.5 & 0.5 0.5 & -0.5 end {bmatrix} cdot 3) = start {bmatrix} 0.525 & 0.475 0.475 & 0.525 end {bmatrix} $$

إذا بدأنا بحالة الحرف 0 في بداية هذا الفرع ، فسنركز على الصف الأول من هذه المصفوفة. نريد أن ينتهي بنا الأمر عند الحالة 0 مع احتمال 0.525 والتغيير إلى الحالة 1 مع احتمال 0.475. نرسم مرة أخرى انحرافًا عشوائيًا منتظمًا ش، واختر الحالة 0 إذا كانت 0 ≤ ش <0.525 واذكر 1 إذا 0.525 ≤ ش <1. إذا بدأنا بحالة شخصية مختلفة ، فسنستخدم صفًا مختلفًا في المصفوفة. إذا كان هذا فرعًا داخليًا في الشجرة ، فإن كلا النوعين الابنة يرثان حالة الشخصية التي اخترناها فورًا بعد الانتواع - ولكن قد يتباعدان بعد فترة وجيزة! بتكرار هذا على طول كل فرع في الشجرة ، نحصل على مجموعة من حالات الشخصية عند أطراف الشجرة. هذا هو ثم ناتج المحاكاة لدينا.

اثنين من التفاصيل الإضافية هنا جديرة بالملاحظة. أولاً ، إجراء محاكاة الأحرف في نموذج Mk الممتد مطابق لتلك المذكورة أعلاه ، باستثناء أن حساب الأسس المصفوفة أكثر تعقيدًا مما هو عليه في نموذج Mk القياسي. ثانيًا ، إذا كنت تحاكي شخصية بها أكثر من حالتين ، فإن إجراء رسم رقم عشوائي يختلف قليلاً3.

يمكننا تطبيق هذا النهج لمحاكاة تطور انعدام الأطراف في الحرشفات. أدناه ، أقدم نتائج ثلاث عمليات محاكاة من هذا القبيل. تختلف هذه المحاكاة قليلاً عما أصفه أعلاه لأنها تأخذ في الاعتبار جميع التغييرات في الشجرة ، بدلاً من حالات الأحرف فقط في العقد والنصائح ؛ لكن النموذج (والمدير) هو نفسه. يمكنك أن ترى أن النموذج يترك بصمة على نمط التغييرات في الشجرة ، ويمكنك أن تتخيل أن المرء قد يكون قادرًا على إعادة بناء النموذج باستخدام نهج مقارن نسبي. بالطبع ، عادةً ما نعرف فقط حالات الطرف ، وعلينا إعادة بناء التغييرات على طول الفروع في الشجرة. سنناقش تقدير المعلمات لنماذج Mk و Mk الموسعة في الفصل التالي.

الشكل 7.4. تطور محاكى للشخصية على شجرة نسالة من السكوامات (من براندلي وآخرون 2008) تحت نموذج Mk بمعدلات متساوية مع معدلات انتقال بطيئة وسريعة وغير متماثلة (من اليمين إلى اليسار). في جميع الحالات الثلاث ، افترضت أن سلف الحراشف كانت له أطراف. يمكن إعادة استخدام الصورة بواسطة المؤلف بموجب ترخيص CC-BY-4.0.


لعبة العثة المقلية

الهدف: محاكاة التغيرات في أعداد الفراشات بسبب التلوث والافتراس ، ولاحظ كيف يمكن أن تتغير الأنواع بمرور الوقت.

اذهب إلى: https://askabiologist.asu.edu/peppered-moths-game/play.html واقرأ كل قسم قبل أن تلعب اللعبة ، وأجب عن الأسئلة كما تذهب.

العثة يتخلله

1. أين يعيش العث المرقط؟ ______________________________________________

2. كيف تنجو يرقات العثة من الحيوانات المفترسة؟ _________________________________________

3. ماذا تفعل الفراشات في الشتاء؟ ______________________________________

4. ما هو لون & quottypica & quot نسخة من العث؟ _________________________

ما لون نسخة & quotcarbonaria & quot؟ _______________________________

5. كيف تنجو العثة البالغة من الافتراس؟ _________________________________________

الانتقاء الطبيعي

6. ماذا كانت الثورة الصناعية؟ _____________________________________________

7. ما سبب تغير لون العث؟ ______________________________

8. ما هو الانتقاء الطبيعي؟ _______________________________________________________

9. لماذا يكون للعث الداكن ميزة؟ ___________________________________________

دكتور Kettlewell

10. ما هو عالم الحشرات؟ ________________________________________________________

11. كيف يختبر العلماء النظريات؟ ____________________________________________________

12. توقع الدكتور Kettlewelll أن الغابات النظيفة سيكون لها _____________ عث ملون ، والغابات الملوثة سيكون لها __________ عثة ملونة.

13. كيف اختبر Kettlewell فرضيته؟ ________________________________________________

14. كيف حددت Kettlewell ما إذا كانت العث تعيش لفترة أطول من غيرها؟ _____________________________________

العب اللعبة

15. أكمل جدول البيانات للغابة المضيئة والغابة المظلمة.

التحليل النهائي

16. اشرح كيف يزيد لون العث أو يقلل من فرص بقائها على قيد الحياة.

17. شرح مفهوم الانتقاء الطبيعي باستخدام العث كمثال.

18. توقع ما سيحدث إذا لم تكن هناك حيوانات مفترسة في الغابة. هل تغيرت ألوان العثة؟ لما و لما لا؟

19 - بدأت الجهود المبذولة للحد من التلوث في وقت لاحق من هذا القرن. إذا تم تقليل التلوث بالقرب من المصانع ، فماذا سيحدث للون العث؟ اشرح اجابتك.

20. تم تضمين تجربة Kettlewell في معظم نصوص علم الأحياء كمثال على تطور يحدث. كيف نعلم أن العث قد تطور؟

/> هذا العمل مرخص بموجب رخصة المشاع الإبداعي Attribution-NonCommercial-ShareAlike 4.0 International License.


7.5: محاكاة نموذج Mk على شجرة - علم الأحياء

ثم للجري من هذا البرطمان:

هذا يتطلب Java 1.7 للترجمة والتشغيل. يُستخدم الخيار -Xmx1G لزيادة تخصيص الذاكرة. قد يحتاج هذا إلى زيادة أكبر مع أحجام أكبر للمضيف. يقوم الخيار -XX: + UseSerialGC بتبديل جامع القمامة الافتراضي في Java إلى شيء يعمل بكفاءة أكبر مع Antigen.

يمكن رؤية القيم الافتراضية للمعلمات في Parameters.java. عند التشغيل ، يبحث البرنامج عن ملف parameters.yml ويقوم بتحميلها ديناميكيًا ، والكتابة فوق الإعدادات الافتراضية.

ستنتج المحاكاة سلاسل زمنية للانتشار الخاص بالمنطقة ووقوعها على التسلسلات الزمنية الخارجية. ستقوم أيضًا بأخذ عينات من الفيروسات بشكل دوري وإخراج مواقعها الجغرافية ومستضداتها إلى أطراف خارجية وشجرة تربط هذه العينات بالفروع الخارجية. يحتوي هذا الملف على أزواج من الفيروسات ، الطفل والوالد ، يمثلان العقد في علم الأنساب. القيم المتوسطة هي الإخراج إلى الخارج.

إذا كان لديك Mathematica ، فيمكنك إنشاء عدد من الأرقام من هذا الإخراج عن طريق تشغيل تحليل مستضد الكمبيوتر المحمول. nb.

مطلوب -Xmx1G ، لأنه كنموذج فردي ، متطلبات الذاكرة عادة ما تكون كبيرة جدًا. يتطلب كل مضيف 40 بايت من الذاكرة على الأقل ، بالإضافة إلى 8 بايت لكل نمط ظاهري مسجل في تاريخه المناعي. إذا كان معدل الهجوم السنوي 15٪ وعمر المضيف 30 عامًا ، فسيكون متوسط ​​حجم تاريخ المناعة عند التوازن 4.5 مرجعًا. هذا يعطي استخدام الذاكرة: حجم السكان × 76 بايت. مع 7.5 مليون مضيف (مستخدم في المعلمات الافتراضية) ، يساوي 570 ميجابايت.

بالإضافة إلى المضيفين وتاريخ المناعة ، تتعقب المحاكاة أنساب الفيروس من خلال VirusTree. يصعب تحديد ملف تعريف هذا ، وسيزداد باستمرار في استخدام الذاكرة طوال فترة المحاكاة. باستخدام المعلمات الافتراضية ، يأخذ VirusTree 5.5 ميجا بايت في نهاية عام تمت محاكاته وقد يصل إلى 110 ميجا بايت في نهاية 20 سنة محاكاة افتراضية.


شون جو

دكتور جو ، أستاذ. جاء إلى جامعة ولاية أيوا كأستاذ مساعد في عام 1998 ، وتمت ترقيته إلى أستاذ مشارك (مع منصب) في عام 2002 ، وإلى أستاذ كامل (مع منصب) في عام 2006. يعمل الدكتور جو في هيئة تحرير "علم الوراثة الجزيئي و Evolution "، و" Journal of Experimental Zoology B ". حصل الدكتور جو على جائزة الأستاذ دوبونت الشاب المرموقة عام 2001. ركزت المجموعة البحثية للدكتور جو على الجينوميات المقارنة والتطورية والبيولوجيا الحاسوبية وتطور بيولوجيا الأنظمة. نشر الدكتور جو ومجموعته أكثر من 100 ورقة بحثية.

وصف البحث

ركز بحثه على (1) الأساليب الإحصائية لعلم الجينوم التطوري لفهم تعقيد الجينوم ، و (2) تحليل الجينوم المقارن عالي الإنتاجية. إنجازات مجموعتنا البحثية هي: تطوير الأساليب الإحصائية وبرامج المعلوماتية الحيوية للتنبؤ بالاختلاف الوظيفي لعائلة البروتين ، والتحليل الإحصائي لاختلاف التعبير بين الجينات المكررة ، والنمذجة الإحصائية لاكتساب الجينات وفقدانها أثناء التطور الجيني. تحليل جينومات الكائنات الحية النموذجية عبر الأنواع ، من الخمائر والنباتات والفقاريات إلى الرئيسيات. في الآونة الأخيرة ، يستكشف بحثنا المجال الجديد لبيولوجيا الأنظمة والتطور: فهم تعدد التغذية الجيني ، والقوة الوراثية ، وتعقيد الجينوم ، وتطور شبكة الجينات.


يتفوق تحليل بايزي باستخدام نموذج احتمالية بسيط على البخل لتقدير نسالة من البيانات المورفولوجية المنفصلة

على الرغم من إدخال الأساليب القائمة على الاحتمالية لتقدير أشجار النشوء والتطور من بيانات النمط الظاهري ، يظل البخل هو المعيار الأمثل الأكثر استخدامًا لبناء الأشجار من البيانات المورفولوجية المنفصلة. ومع ذلك ، فقد كان معروفًا منذ عقود أن هناك مناطق ذات مساحة حل يكون فيها البخل مقدرًا ضعيفًا لطوبولوجيا الأشجار. توجد العديد من تطبيقات البرامج للنماذج المستندة إلى الاحتمالات لتقدير نسالة من البيانات المورفولوجية المنفصلة ، خاصة بالنسبة لنموذج Mk لتطور الشخصية المنفصلة. نستكشف هنا فعالية تقدير بايز للتطور ، باستخدام نموذج Mk ، في ظل ظروف شائعة في دراسات علم الأحافير. باستخدام البيانات المحاكاة ، نصف الأداء النسبي للبخل ونموذج Mk في ظل مجموعة من الظروف الواقعية التي تتضمن سيناريوهات شائعة للبيانات المفقودة وعدم تجانس المعدل.

بيان تضارب المصالح

تضارب المصالح: أعلن المؤلفون أنه لا توجد مصالح متنافسة.

الأرقام

الشكل 1. الشجرة المستخدمة في عمليات المحاكاة.

الشكل 1. الشجرة المستخدمة في عمليات المحاكاة.

تم الحصول على هذه الشجرة من بيانات نمطية جزيئية مجمعة ...

الشكل 2. مخطط يمثل مختلف المفقودين ...

الشكل 2. مخطط يمثل توزيعات البيانات المفقودة المختلفة.

الأعمدة تمثل الشخصيات. في أسماء الأصناف ...

الشكل 3. النتائج من عمليات المحاكاة مع ...

الشكل 3. النتائج من عمليات المحاكاة بمعدل واحد لتطور الشخصية.

Bayesian-Mk يتفوق على البخل ...

الشكل 4. في مجموعات البيانات ذات الأحرف ...

الشكل 4. في مجموعات البيانات مع عدم تجانس معدل الأحرف وبدون بيانات مفقودة ، Bayesian-Mk ...

الشكل 5. آثار البيانات المفقودة ...

الشكل 5. آثار البيانات المفقودة تختلف مع معدل تطور الشخصية.


الانتعاش الأحفوري المعتمد على النسب

يمكن إنشاء التباين في معلمات استعادة الأحافير عبر السلالات أو الأنواع المختلفة باستخدام الوظيفة sim.trait.values. ناتج الوظيفة هو متجه لقيم السمات المحاكاة التي يمكن استخدامها لتحديد معامل المعدل في sim.fossils.poisson أو معلمات PD و DT و PA في بيئة sim.fossils.en.

يمكن محاكاة قيم السمات لكائن معين أو كائن تصنيف. إذا تم توفير الوظيفة مع كائن phylo ، يتم محاكاة قيم السمات بافتراض أن التفرع المتفرع وقيم السمات المحاكاة يتم إخراجها لكل حافة بالترتيب الذي تظهر به في إطار بيانات كائن phylo. إذا كان للشجرة أيضًا حافة جذر (الشجرة $ root.edge) ، فإن الإدخال الأول في المتجه سيتوافق مع الإدخال الأول في المتجه. إذا تم توفير الوظيفة مع كائن تصنيف ، يتم إخراج قيم السمات المحاكاة لكل نوع بالترتيب الذي تظهر به في إطار بيانات كائن التصنيف.

نموذج استعادة الأحافير المرتبطة تلقائيًا

في ظل النموذج المرتبط تلقائيًا ، تتطور السمات على طول الأنساب وفقًا لعملية الحركة البراونية ، حيث يتم تحديد قوة العلاقة بين القيم الأصلية والقيم التابعة بواسطة المعلمة ( nu ) (وسيطة الوظيفة v). يتم استخلاص قيم السمات الجديدة من التوزيع اللوغاريتمي الطبيعي ، حيث يكون المتوسط ​​مساويًا لقيمة السلف ويكون التباين دالة لـ ( nu ) والنوع أو مدة الحافة. إذا كانت ( nu ) صغيرة ، فستكون القيم الصغيرة أكثر تشابهًا بين الأصل والأحفاد ، وإذا كانت ( nu ) تساوي صفرًا ، فستكون جميع قيم السمات متساوية. هذا هو النموذج الموصوف في Heath وآخرون. (2014) وهو ما يعادل نموذج الساعة المريح المترابط تلقائيًا الموصوف في Kishino وآخرون. (2001) .

نموذج الاسترداد الأحفوري المستقل

في ظل النموذج المستقل ، يتم رسم قيمة سمة جديدة لكل نوع من أي توزيع صالح يحدده المستخدم. لكي تكون الوظيفة صالحة ، عليها فقط إرجاع قيمة واحدة.

البيئة واستعادة الأحافير المعتمدة على النسب

يمكن أيضًا تمرير قيم النسب المحددة التي تم إنشاؤها باستخدام sim.trait.values ​​إلى الوظيفة sim.fossils.environment لتحديد معلمات PD و DT و PA.


سد فجوة الشبكة

يعد ملء الثغرات خطوة مهمة في إعادة بناء GEM الذي يحول شبكة مسودة إلى شبكة يمكنها إنتاج الكتلة الحيوية في البيئة المحددة (الجدول 4). فكرة ملء الفراغ - أن المعرفة المفقودة في التمثيل الغذائي قد تتطلب خوارزميات لتحديد التفاعلات الغائبة في تمثيل مسار معين ، ولكن من المحتمل وجودها في الكائن الحي - كانت موجودة منذ الأيام الأولى لنمذجة الشبكة الأيضية [107]. تمت مراجعة خوارزميات ملء الفجوات بشكل عام سابقًا [108] ، ولكن باختصار ، فهي تستخدم قاعدة بيانات عالمية للتفاعلات المحتملة لزيادة شبكة التمثيل الغذائي الحالية بهدف تمكين حالات النمو الممكنة ، على سبيل المثال ، عن طريق توصيل المستقلبات المسدودة. نحن هنا نركز على عدم اليقين المرتبط بهذه العملية. ملء الثغرات غير مؤكد بطبيعته لأن التفاعلات المضافة بشكل عام لا تدعمها الأدلة الجينية. علاوة على ذلك ، يمكن في كثير من الأحيان العثور على حلول متعددة لتلبية نفس مشكلة سد الفجوة. بسبب عدم اليقين هذا ، من المعروف أن الخوارزميات الأساسية لملء الثغرات غير دقيقة إلى حد ما [109] ، مما دفع إلى إجراء مقارنة معيارية مؤخرًا على شبكات التمثيل الغذائي المتدهورة عشوائيًا لتسليط الضوء على التباين في أداء ملء الثغرات [110]. علاوة على ذلك ، تحتوي العديد من نماذج الأحجار الكريمة على تناقضات كبيرة حتى بعد تطبيق مناهج سد الثغرات ، ويعد تحديدها مهمًا لضمان دقة النموذج [111].

دفع عدم اليقين في حلول سد الثغرات إلى تطوير مناهج احتمالية مختلفة لدمج البيانات وتحديد أولويات الحلول. كان أحد الابتكارات المبكرة في خوارزميات ملء الثغرات الاحتمالية هو تطوير طريقة لتقييم إضافة التفاعلات لملء الفجوات بناءً على شبكة بايز بما في ذلك التماثل المتسلسل ، والتشغيل ، والمعلومات المستندة إلى المسار [112]. نهج مماثل هو استخدام الأوزان الاحتمالية أثناء عملية ملء الفراغ ، بحيث أن التفاعلات الأكثر احتمالية تحمل عقوبة أقل عند إضافتها إلى شبكة التمثيل الغذائي. تعد خوارزمية CROP مثالاً لسد الفجوة استنادًا إلى بيانات النمط الظاهري للنمو والتي تنفذ أوزانًا استنادًا إلى مصادر مختلفة للأدلة ، بما في ذلك الأدلة التجريبية المنسقة يدويًا والمسارات المعروفة بأنها مرتبطة بالكائن الحي والديناميكا الحرارية والتقديرات الاحتمالية لوظيفة الإنزيم [113 ]. تم تطوير نهج احتمالي آخر لترجمة تجانس التسلسل إلى احتمال وجود تفاعل استقلابي في شبكة أيضية معينة (تمت مناقشتها في قسم "شرح الجينوم") ويمكن بعد ذلك استخدام هذه الاحتمالات كأوزان احتمالية أثناء إجراء ملء الفجوة [ 44 ، 45].

إلى جانب طرق سد الثغرات الاحتمالية ، تم تطوير مناهج المجموعات لتمثيل عدم اليقين في حلول ملء الفجوات كمجموعة من الأحجار الكريمة الممكنة لسد الثغرات. طريقة مبكرة في هذا المجال تقليم شبكة أيضية عالمية لتحديد الحد الأدنى من الحلول المحلية لملء الفجوات التي تتوافق مع البيانات التجريبية [114]. في هذا النهج ، يتم إنشاء مجموعة من شبكات التمثيل الغذائي عن طريق التعيين العشوائي للترتيب الذي يتم به تشذيب التفاعلات من شبكة التمثيل الغذائي العالمية الأصلية. وهناك طريقة تجميع مماثلة قائمة على التقليم ، MIRAGE ، تتضمن بالإضافة إلى ذلك التعبير الجيني والتطور العرقي عند ترجيح الترتيب الذي يتم به إزالة التفاعلات [115]. تم تطوير فكرة سد فجوة المجموعة بشكل كامل من خلال نهج يستخدم بيانات النمط الظاهري للنمو بترتيب عشوائي لتوليد مجموعة من حلول سد الفجوة [116]. عن طريق التغيير العشوائي للتسلسل الذي تم فيه تقديم بيانات النمط الظاهري للنمو إلى خوارزمية ملء الفجوة ، أنشأ Biggs و Papin مجموعة من شبكات التمثيل الغذائي التي تتفق بشكل متساو مع البيانات المعطاة. أظهرت هذه الدراسة أيضًا أن استخدام نتيجة ملء الفراغ في المجموعة يمكن أن يكون أكثر دقة من استخدام النتائج الفردية ، أو نتيجة عالمية مملوءة بالفجوات في وقت واحد. يتم تنفيذ نهج إضافي لسد الثغرات في طريقة CarveMe. يولد CarveMe مجموعات من النماذج المملوءة بالفجوات عن طريق تعيين أوزان عشوائية للتفاعلات بدون دليل جيني [43].

أخيرًا ، طرق ملء الفجوات الآلية محدودة أساسًا بقاعدة (قواعد) البيانات الأساسية للتفاعلات الأيضية التي يستخدمونها [117 ، 118]. وبالتالي ، يمكن أن يكون لعدم اليقين في مجموعة قواعد البيانات هذه تأثير كبير على أداء سد الثغرات. يعد هذا قيدًا رئيسيًا عند النظر في مدى تعقيد الكون الأيضي الحقيقي وحقيقة أننا على الأرجح لا نعرف التعليقات التوضيحية المناسبة لجميع التفاعلات الأيضية. في ضوء هذا القيد ، تم تطوير عدد من الطرق للتنبؤ بالتفاعلات الأيضية المحتملة بناءً على قواعد التفاعل العامة. تمت مراجعة العديد من هذه الأساليب سابقًا في سياق التنبؤ بمسارات التخليق الحيوي للمركبات المستهدفة [25 ، 119 ، 120]. أحد الأساليب السابقة ، إطار BNICE ، يوسع الكون الأيضي من خلال تعلم قواعد التفاعل العامة من تفاعل KEGG [121]. تم استخدام هذا الإطار لاحقًا لتطوير قواعد بيانات MINE و ATLAS للمركبات الممكنة نظريًا والتفاعلات الأنزيمية ، على التوالي [122،123،124]. يقترح BNICE أيضًا أرقام EC ثلاثية المستويات للتفاعلات الافتراضية ، والتي يمكن أن توجه اكتشاف البروتينات المرتبطة بتفاعلات de novo. العدد النظري للتفاعلات في ATLAS الموسع أعلى بأكثر من 10 أضعاف من عدد التفاعلات في KEGG ، مما يشير إلى أن عددًا كبيرًا من التحولات الكيميائية غير المتوقعة قد تكون متورطة في عملية التمثيل الغذائي. بينما نكافح مع عدم اليقين في إعادة بناء الشبكة الأيضية ، يمكن أن تساعدنا طرق de novo مثل هذه في معالجة المجهول وتقديم رؤى مثيرة غير متوقعة. من الآن فصاعدًا ، سيمكن الجمع بين الأساليب الاحتمالية والتجميعية لتكامل البيانات والتنبؤ برد فعل de novo توليد شبكات التمثيل الغذائي المملوءة بالفجوات والتي تمثل عدم اليقين ويمكن استخدامها بشكل أفضل لتوجيه صقل النموذج.


نتائج

المحاكاة

في جميع تحليلاتنا ، أظهرت طرق علم الوراثة المتنافسة دقة أكبر عند إعادة بناء البيانات من الشجرة المتماثلة مقارنة بالبيانات من الشجرة غير المتماثلة. بالنسبة لمجموعات البيانات المستمدة من شجرة التوليد غير المتكافئة ، تفوقت تطبيقات Bayesian و Maximum Likability لنموذج Mk على البخل من حيث الدقة (الجدول 1).

بايزي غير متماثل ML غير متماثل البخل غير المتماثل متماثل بايزي متماثل ML البخل متماثل
100 حكم الأغلبية 29 (23–35) 47 (31–59) 35 (27–48.02) 7 (1–25) 7 (1–43.05) 7 (1–26)
100 ≥ 50٪ دعم الفرع 29 (23–35) 30 (24–34) 30 (26–32) 7 (1–25) 7 (2–24.02) 9 (3–27)
350 حكم الأغلبية 20 (12–30) 25 (13–55) 28 (18–37) 1 (1–15.02) 1 (1–23) 1 (1–15.02)
350 ≥ 50٪ دعم الفرع 20 (12–30) 20 (14–31) 24 (19–30) 1 (1–15.02) 1 (1–15) 1 (1–17)
1000 حكم الأغلبية 9 (3–26) 11 (3–43) 18 (9–30) 1 (1–3.02) 1 (1–5) 1 (1–3.02)
1000 50٪ دعم فرع 9 (3–26) 10 (4–27) 17 (10–28) 1 (1–3.02) 1 (1–4) 1 (1–4)

كانت قيم الدعم للعقد أعلى بشكل عام عندما أعيد بناء العقد بدقة ، وكان هذا أكثر وضوحًا في تحليلات مجموعات البيانات التي تم إنشاؤها من الشجرة غير المتماثلة مقارنة بتلك المستمدة من شجرة التوليد المتماثلة (الشكل 1). أعادت طرق بايز بناء أكبر عدد من العقد الدقيقة وكان لها دعم أعلى لهذه العقد مقارنة بالعقد غير الدقيقة ، والعقد الدقيقة التي تم استعادتها بالطرق البديلة.

آثار النظر في قيم الدعم

أنتج كل من تطبيق الاحتمالية القصوى لنموذج Mk والبخل أشجارًا بدقة متزايدة بعد انهيار العقد التي تدعم & lt 50٪. بالنسبة للشجرة غير المتماثلة ، تتداخل دقة الاحتمالية القصوى والتطبيقات البايزية لنموذج Mk ، لكن البخل هو الطريقة الأقل دقة (الأشكال 2-4-2-4 ، الجدول 1). تم الحصول على نتائج مماثلة من تحليل البيانات المستمدة من شجرة التوليد المتماثلة (الجدول 1). لكل من الأشجار المتماثلة وغير المتماثلة ، تزداد الدقة مع حجم مجموعة البيانات ، وتحقق تطبيقات Bayesian و Maximum Likitality Mk دقة عالية جدًا في مجموعات البيانات التي تحتوي على 1000 حرف.

تم حل أشجار الإجماع على قاعدة أغلبية Bayesian بشكل عام أكثر من أشجار الدعم بنسبة 50 ٪ التي تم الحصول عليها من طوبولوجيا الاحتمالية القصوى التي تقدر أن أشجار الدعم بنسبة 50 ٪ المقدرة باستخدام البخل كانت الأكثر تحفظًا (الجدول 2). لوحظ هذا الاتجاه أيضًا في نتائج تحليلات مجموعات بيانات 100 حرف المستمدة من شجرة التوليد المتماثلة. ومع ذلك ، أسفرت جميع الطرق عن حل أكثر اكتمالاً بنسبة 50٪ من أشجار الدعم استنادًا إلى مجموعات بيانات مكونة من 350 و 1000 حرف.

بايزي غير متماثل ML غير متماثل البخل غير المتماثل متماثل بايزي متماثل ML البخل متماثل
100 حكم الأغلبية 8 (1–15) 30 (30–30) 16 (2–28) 27 (7–30) 30 (30–30) 27 (6.98–30)
100 ≥ 50٪ دعم الفرع 8 (1–15) 6 (1–12) 3 (1–7) 27 (7–30) 26 (7.98–30) 22 (4.98–28)
350 حكم الأغلبية 19 (4–25) 30 (30–30) 24 (4–30) 30 (16–30) 30 (30–30) 30 (16–30)
350 ≥ 50٪ دعم الفرع 19 (4–25) 15 (4–23) 9 (2–15) 30 (16–30) 30 (16–30) 30 (14–30)
1000 حكم الأغلبية 26.5 (8–30) 30 (30–30) 28 (7.98–30) 30 (28–30) 30 (30–30) 30 (28–30)
1000 50٪ دعم فرع 26.5 (8–30) 25 (8–29) 17 (4.98–24) 30 (28–30) 30 (28–30) 30 (27.98–30)

يحل تنفيذ Bayesian Mk عددًا أكبر من العقد الصحيحة في جميع التحليلات (الشكل 1) ، وهي تتمتع بدعم أعلى مقارنةً بتطبيق الاحتمالية القصوى والبخل (الشكل 5). ومع ذلك ، بشكل عام ، يحل تطبيق Bayesian عقدًا غير دقيقة أكثر مما يفعله تطبيق Maximum Likossible Mk أو البخل. الدعم المتوسط ​​للعقد الصحيحة أعلى في Bayesian ، على عكس تحليلات الاحتمالية القصوى ، عبر جميع أحجام مجموعات البيانات ، وهذا الاتجاه واضح بشكل خاص في الأشجار غير المتماثلة (الشكل 1). يعد الدعم المتوسط ​​للعقد الصحيحة أعلى منه بالنسبة للعقد غير الصحيحة في الأشجار المشتقة من تنفيذ Bayesian Mk ، وعلى جميع الطرق (الشكل 1). الدعم البايزي أعلى للعقد غير الصحيحة مقارنة بالاحتمالية القصوى والبخل (الشكل 1). هناك اختلاف واضح في مستويات دعم العقد الصحيحة وغير الصحيحة في أشجار Bayesian ، حيث تحقق العقد الصحيحة عمومًا دعمًا أكبر من 80٪ والعقد غير الصحيحة تظهر دعمًا أقل من 80٪. بتطبيق حد 80٪ لأحجام مجموعة البيانات 350 وما فوق ، يحل تنفيذ Bayesian Mk العقد الصحيحة فقط (الشكل 1) لا يتطابق تطبيق Maximum Likability Mk والبخل مع هذا المستوى من الدعم.

البيانات التجريبية

كانت هناك اختلافات جوهرية بين الهياكل التجريبية المشتقة من تطبيق Maximum Lik الممكنة Mk وإطار البخل ، قبل وبعد انهيار العقد بدعم 50٪ (الأشكال 6 ، 7 O'Reilly) وآخرون. 2017 ، التين S1 ، S2). أظهرت مجموعات البيانات الأصغر أكبر الاختلافات في الهيكل ووضع الأصناف الرئيسية سواء تم حساب الدعم عن طريق انهيار العقد المدعومة بشكل سيئ أم لا.

بالنسبة لمجموعات البيانات الأصغر ، كان هناك تطابق بين الهياكل المقدرة بأساليب مختلفة بعد انهيار العقد المدعومة بشكل سيئ. كوليندروبلاكسمن ساتون وآخرون. (2012) ، لم يكن مدعومًا باعتباره تاجًا رخويًا بأي طريقة عند انهيار العقد المدعومة بنسبة 50٪ (الشكل 6). هذا يتناقض مع تقارب تاج الرخويات كوليندروبلاكس في الحد الأقصى من الاحتمالية المقدرة Mk والأشجار الأكثر شحًا (الشكل 6). لوحظ نمط مماثل في الطوبولوجيا المقدرة من بيانات Hilton & Bateman (2006). دعم كل من تنفيذ الاحتمالية القصوى لنموذج Mk وإطار البخل فرضية الأنثوفيت في الأشجار المثلى ذات الصلة. بعد انهيار العقد مع دعم & lt بنسبة 50٪ ، أسفرت كلتا الطريقتين عن طوبولوجيا أكثر توافقًا مع شجرة إجماع حكم الأغلبية البايزية ، مع اتحاد متعدد الأطراف ، ولكن دون التفريق بين ، عاريات البذور ، وسراخس البذور ، وكاسيات البذور (O'Reilly وآخرون. 2017 ، شكل. S1).

كان انهيار العقد المدعومة بشكل سيئ في الأشجار المقدرة من مجموعات البيانات التجريبية تأثيرًا أقل على وضع الأصناف الرئيسية في مجموعات البيانات التي تحتوي على عدد أكبر من الأحرف. ضمن شجرة إجماع حكم الأغلبية التي تم الحصول عليها من تطبيق Bayesian لنموذج Mk ، نياصور تم حلها في تعدد مع الكتل الرئيسية للديناصورات (Saurischia ، Ornithischia ولكن انظر Baron وآخرون. 2017) ، كما أظهره نيسبيت وآخرون. ( 2013 ). نياسوروس تم حله أيضًا كعضو في Dinosauria في تقدير Maximum Likability Mk والأشجار الأكثر شحًا ، لم يتأثر هذا الاستنتاج بانهيار العقد مع دعم أقل من 50 ٪ من التمهيد (الشكل 7). ومع ذلك ، كانت هناك تغييرات في اليقين من التنسيب نياساورس بعد تقييم الدعم ، الانهيار من عضوية Theropoda إلى Saurischia في تحليلات Maximum Likability Mk ، ومن Theropoda إلى Dinosauria في تحليلات البخل. لم يسترد تطبيق Maximum Likability Mk ولا البخل Saurischia أو Ornithischia أو Theropoda أو Sauropoda ، على الرغم من أن هذه الواجهات تم حلها من خلال تنفيذ Bayesian Mk (الشكل 7). يظهر نمط مماثل في إعادة تحليل مجموعة البيانات من Luo وآخرون. (2015). تم حل جميع الأشجار ، قبل وبعد احتساب الدعم في الهيكل النهائي Haramiyavia خارج التاج - Mammalia والمتعدد الحبيبات (O'Reilly وآخرون. 2017 ، شكل. S2).

تحليلات أصغر مجموعة بيانات (34 حرفًا ، 48 تصنيفًا) ، من Sutton وآخرون. (2012) ، استعاد سبع عقد فقط في شجرة إجماع قاعدة الأغلبية Bayesian ، ولكن تم تحقيق المزيد من الدقة في تقدير Maximum Likential Mk (32 عقدة) والأشجار الأكثر شحًا (17 عقدة). بعد انهيار العقد المدعومة بشكل سيئ ، تم تحقيق مستوى مماثل من الدقة من خلال جميع الطرق: تطبيق Mk الاحتمالية القصوى (8 عقد) والبخل (6 عقد). يتناقض هذا مع النتائج التي تم الحصول عليها من تحليلات مجموعات البيانات التجريبية الأخرى الأكبر حجمًا حيث ، بعد انهيار العقد بدعم أقل من 50٪ ، أدى تنفيذ Bayesian Mk باستمرار إلى إنتاج أشجار بأعلى دقة: نمط معاكس لذلك الذي شوهد بالمقارنة مع أفضل الأشجار المشتقة من الطرق الثلاث للاستدلال النشوء والتطور (الجدول 3).

بايزي أقصى احتمال البخل
ساتون (34 تصنيفًا ، 48 حرفًا) الشجرة المثلى 7 32 17
الشجرة المنهارة 7 8 6
هيلتون (48 تصنيفًا ، 82 حرفًا) الشجرة المثلى 28 46 38
الشجرة المنهارة 28 15 13
Nesbitt (82 تصنيفًا ، 413 حرفًا) الشجرة المثلى 72 80 72
الشجرة المنهارة 72 63 47
لو (114 نوعًا ، 497 حرفًا) الشجرة المثلى 92 112 109
الشجرة المنهارة 92 69 69

معلومة اضافية

مساهمات المؤلفين

أجرى SK العديد من قياسات تنشيط الإشارة النهائية وتجارب حركة الخلايا السرطانية ، كما كتب مسودات المخطوطة الأولية. قام SH ببناء أشجار القرار بالإضافة إلى التحكم في الجودة في البيانات التي ساهم بها في الأفكار الأولية والكتابة. أجرى SW تجارب تتبع الخلية المفردة وساهم في التصميم التجريبي وكتابة المخطوطة. أجرى الذكاء الاصطناعي قياسات تنشيط الإشارة الأولية في الخلايا الليفية ، وشكل أصول المشروع. قدمت DAL و AW التوجيه العام ، والمفهوم الأولي للمشروع ، ودمج الجوانب المتنوعة ، ووضع اللمسات الأخيرة على الاتصالات. راجع جميع المؤلفين البيانات وساهموا في التفسيرات. يوافق جميع المؤلفين على المخطوطة المقدمة.

سراب خريت ، سامبسا أوتانييمي ساهم في هذا العمل بشكل متساوٍ.


لا تتعارض عمليات إعادة البناء البايزية والاحتمالية للتطور الوراثي للسمات المورفولوجية عند أخذ عدم اليقين في الاعتبار: تعليق على Puttick وآخرون آل

بوتيك وآخرون. (2017 بروك. R. Soc. ب284، 20162290 (doi: 10.1098 / rspb.2016.2290)) أجرى دراسة محاكاة لمقارنة الدقة بين طرق استنتاج السلالات من الشخصيات المورفولوجية المنفصلة. أفادوا أن تنفيذ بايزي لنموذج Mk (Lewis 2001 النظام. بيول.50، 913-925 (doi: 10.1080 / 106351501753462876)) كان الأكثر دقة (ولكن بدقة منخفضة) ، بينما كان تنفيذ الاحتمالية القصوى (ML) لنفس النموذج أقل دقة. واختتموا بالدعوة بقوة إلى أن تطبيقات Bayesian لنموذج Mk يجب أن تكون الطريقة الافتراضية لتحليل مثل هذه البيانات. بينما نقدر محاولة المؤلفين للتحقيق في دقة طرق التحليل البديلة ، فإن استنتاجهم يستند إلى مقارنة غير مناسبة لتقدير نقطة ML ، والتي لا تأخذ بعين الاعتبار الثقة ، مع إجماع Bayesian ، الذي يدمج مصداقية التقدير في شجرة الملخص. . باستخدام المحاكاة ، نوضح أن تقديرات ML و Bayesian متطابقة عندما تنعكس الثقة والمصداقية بشكل نسبي في أشجار الملخص ، وهي نتيجة متوقعة من النظرية الإحصائية. لذلك نحن نختلف مع استنتاجات بوتيك وآخرون. ويعتبرون أن وصفهم لأي طريقة افتراضية ليس له أساس من الصحة. بدلاً من ذلك ، نوصي بالحذر والمراعاة المتعمقة للنموذج أو الطريقة التي يتم تطبيقها على مجموعة البيانات المورفولوجية.

الكلمات الدالة: احتمال بايزي مورفولوجيا علم الأحافير نسالة.

بيان تضارب المصالح

نعلن أنه ليس لدينا مصالح متنافسة.

الأرقام

الدقة الطوبولوجية لـ ML مقابل ...

الدقة الطوبولوجية لـ ML مقابل عمليات إعادة البناء Bayesian للمقارنة الأكثر تعارضًا التي تم تحديدها ...


شاهد الفيديو: الجهاز الهضمي رحلة الطعام الهضم والإمتصاص (كانون الثاني 2022).