معلومة

كيفية حساب انحدار اللياقة الفردية على النمط الظاهري الفردي


ضع في اعتبارك مجموعة سكانية منظمة في مجموعات من فردين. تتبع تفاعلات الأفراد معضلة سجين مضاف:

start {array} {c | c | c |} & C & D hline text {Cooperate (} C text {)} & b -c & -c hline text {Defect (} D text {)} & b & 0 hline end {array} حيث $ b $ هي الفائدة و $ c $ هي التكلفة. المكافآت للاعب على اليسار. أحتاج إلى حساب انحدار اللياقة الفردية على النمط الظاهري الفردي ، $ beta (w_i، p_i) $ ، حيث $ p_i = 0 $ إذا عيوب $ i $ و $ p_i = 1 $ إذا كان $ i $ يتعاون. لاحظ أنني بحاجة لحساب الانحدار داخل المجموعات وليس بين المجموعات.

اعتقدت أن الطريقة الصحيحة لحساب $ beta (w_i، p_i) $ ستكون تغيير استراتيجية الفرد المحوري مع الحفاظ على إستراتيجية الفرد الآخر ثابتة (فكرت في أن يصبح الفرد الآخر بيئة للبؤرة فرد). نظرًا لأن التحول إلى التعاون يتسبب في خسارة الفرد $ -c $ في لياقته (إذا حافظنا على إستراتيجية الفرد الآخر ثابتة) ، فقد اعتقدت أن $ beta (w_i، p_i) = -c $. لكن لدهشتي ، $ beta (w_i، p_i) = -b -c $. لتوضيح السبب ، رسم McElreath & Boyd ("النماذج الرياضية للتطور الاجتماعي" ، ص 242) الرسم البياني التالي:

لنفترض أن $ V (X | Y) $ هو عائد الفرد $ X $ عندما يتفاعل مع $ Y $ (بمعنى آخر ، $ X $ هو الشخص المحوري ؛ $ Y $ هو الفرد الآخر). أفهم أن McElreath و Boyd قاما بحساب معامل الانحدار عن طريق حساب $ V (C | D) - V (D | C) $ --- مقابل $ V (C | C) - V (D | C) $ ، حيث أنت تحافظ على إستراتيجية الفرد الآخر ثابتة. سؤالي هو لماذا هذه هي الطريقة الصحيحة لحساب $ beta (w_i، p_i) $.


لست متأكدًا من فهمي للسؤال. اعلمني اذا كان هذا مفيدا لك.

الحالة: N = 2 ، التكرار = 0.5

لنفترض أن تكرار أولئك الذين يتعاونون هو 0.5. ميل خط الانحدار (الذي يساوي R.squared 1 لأن لدينا نقاط بيانات أكبر من درجات الحرية) هو حسب التعريف $ frac { Delta w} { Delta p} $. لقد حددت $ Delta p = 1 $. ما هو $ Delta w $ إذن؟

حسنًا ، بالنظر إلى أن أحدهما يتعاون والعيب الآخر (كما هو موضح في حقيقة أن تواتر المتعاونين هو 0.5) ، فسيحصل أحدهم على مكافأة متعاون يواجه منشقًا والآخر سيحصل على مكافأة من المنشق تواجه متعاون. المتعاون لديه لياقة بدنية قدرها w_0 + b $ والهارق له لياقة من $ w_0 - c $. أعتقد أنك قد أخطأت في قراءة مصفوفة المكافآت. لمعرفة مدى لياقة شخص لديه إستراتيجية $ i $ عند مواجهة شخص لديه إستراتيجية $ j $ ، ستنظر إلى هذا المردود في الصف $ i $ والعمود $ j $.

لذلك ، $ Delta w = (w_0 - c) - (w_0 + b) = - (b + c) = -b - c $ ، ومن ثم يكون الميل $ frac { Delta w} { Delta p} = frac {-bc} {1} = - b -c $

الحالة: N> 2 ، التكرار = 0.5

في مثل هذه الحالة سيكون منحدر الانحدار بالضرورة أقل من $ -bc $ لأن بعض المتعاونين سيقابلون متعاونين آخرين ، مما يزيد من لياقتهم (= زيادة النقاط على الجانب الأيمن من الرسم البياني الخاص بك) وسيواجه بعض المنشقين عوائق أخرى ، تقليل لياقتهم (= خفض النقاط على الجانب الأيسر من الرسم البياني الخاص بك)

في التوازن

التوازن الوحيد المستقر هو عندما يكون تواتر المتعاونين 0. في مثل هذه الحالة ، لا يوجد تباين ولا يمكننا حتى التحدث عن الانحدار.

استنتاج

المنحدر ليس بالضرورة $ -b-c $. إنه $ -b-c $ للحالة الخاصة جدًا حيث يكون لدينا شخصان ، أحدهما يتعاون والآخر معيب. في أي سيناريو آخر ، يكون المنحدر $ s $ للانحدار أقل. بشكل أكثر تحديدًا ، المنحدر $ s $ للانحدار لأي $ N $ ولأي $ freq $ هو $ 0 =


أعتقد أن هذا هو خطأي. يمكن كتابة $ w_i $ بدلالة $ p_i $ بالطريقة التالية (لاحظ أن $ p_i $ يمكنه افتراض قيمتين فقط ، 0 و 1):

$ w_i (0) = w_0 + كيلوبايت $

$ w_i (1) = w_0 -c + (k-1) ب $

حيث $ w_0 $ هو اللياقة الأساسية و $ k $ هو عدد المؤثرين في المجموعة (لذلك ، $ k $ يمكن أن يكون 0 ، 1 ، أو 2). عندما نحسب $ beta (w_i، p_i) $ ، فإن السؤال الذي نحاول الإجابة عليه هو "لمجموعة معينة في المجتمع ، ما هو معامل الانحدار $ beta (w_i، p_i) $؟ ". هذا يعني أن $ k $ يجب أن يكون ثابتًا ، وإلا فإننا سنأخذ بعين الاعتبار أفرادًا من مجموعات مختلفة.

$ بيتا (w_i، p_i) = w_i (1) - w_i (0) $

$ بيتا (w_i، p_i) = -b -c $

لكي يكون $ beta (w_i، p_i) $ مساويًا لـ $ -c $ ، نحتاج إلى النظر في عائد المتعاونين من مجموعات مختلفة.


متابعة للمعادلة Remi.b المقترحة في تعليق أدناه ، يمكننا كتابة معامل الانحدار لسكان منظم في مجموعات من الأفراد $ n $. اكثر تحديدا،

$ w_i (0) = w_0 + [k / (n-1)] b $

$ w_i (1) = w_0 -c + [(k-1) / (n-1)] b $

مع هذه التعريفات ، نحصل عليها

$ بيتا (w_i، p_i) = w_i (1) - w_1 (0) $

$ بيتا (w_i، p_i) = -c - b / (n-1) $


R- تربيع

R-Squared (R & sup2 أو معامل التحديد) هو مقياس إحصائي في نموذج الانحدار الذي يحدد نسبة التباين في المتغير التابع الذي يمكن تفسيره بواسطة المتغير المستقل المتغير المستقل المتغير المستقل هو إدخال أو افتراض أو محرك التي تم تغييرها من أجل تقييم تأثيرها على متغير تابع (النتيجة). . بعبارة أخرى ، يوضح r-squared مدى ملاءمة البيانات لنموذج الانحدار (جودة الملاءمة).

الشكل 1. ناتج الانحدار في MS Excel

يمكن أن يأخذ R-squared أي قيم بين 0 إلى 1. على الرغم من أن المقياس الإحصائي يوفر بعض الأفكار المفيدة فيما يتعلق بنموذج الانحدار ، يجب ألا يعتمد المستخدم فقط على المقياس في تقييم النموذج الإحصائي. لا يكشف الشكل عن معلومات حول علاقة السببية بين المتغير المستقل والمتغير التابع المتغير التابع المتغير التابع هو متغير ستتغير قيمته اعتمادًا على قيمة متغير آخر يسمى المتغير المستقل. في .

بالإضافة إلى ذلك ، فإنه لا يشير إلى صحة نموذج الانحدار. لذلك ، يجب على المستخدم دائمًا استخلاص استنتاجات حول النموذج من خلال تحليل مربع r مع المتغيرات الأخرى في النموذج الإحصائي.

تفسير R-Squared

التفسير الأكثر شيوعًا لـ r-squared هو مدى ملاءمة نموذج الانحدار للبيانات المرصودة. على سبيل المثال ، يكشف مربع r بنسبة 60٪ أن 60٪ من البيانات تتلاءم مع نموذج الانحدار. بشكل عام ، يشير مربع r الأعلى إلى ملاءمة أفضل للنموذج.

ومع ذلك ، فليس الحال دائمًا أن يكون مربع r المرتفع جيدًا لنموذج الانحدار. تعتمد جودة المقياس الإحصائي على العديد من العوامل ، مثل طبيعة المتغيرات المستخدمة في النموذج ، ووحدات قياس المتغيرات ، وتحويل البيانات المطبق. وبالتالي ، في بعض الأحيان ، يمكن أن يشير مربع r المرتفع إلى مشاكل نموذج الانحدار.

بشكل عام ، يعد الرقم المنخفض لمربع r علامة سيئة للنماذج التنبؤية. ومع ذلك ، في بعض الحالات ، قد يظهر النموذج الجيد قيمة صغيرة.

لا توجد قاعدة عامة حول كيفية دمج المقياس الإحصائي في تقييم النموذج. سياق التجربة أو التنبؤ أعلى طرق التنبؤ. في هذه المقالة ، سنشرح أربعة أنواع من طرق التنبؤ بالإيرادات التي يستخدمها المحللون الماليون للتنبؤ بالإيرادات المستقبلية. مهم للغاية ، وفي سيناريوهات مختلفة ، يمكن أن تختلف الرؤى من المقياس.

كيف تحسب R- تربيع

صيغة حساب R-squared هي:

أين:

  • SSتراجعهو مجموع المربعات بسبب الانحدار (شرح مجموع المربعات)
  • SSالمجموعهو المجموع الكلي للمربعات

على الرغم من أن أسماء المربعات و ldquosum بسبب الانحدار & rdquo و & ldquototal مجموع المربعات & rdquo قد تبدو مربكة ، إلا أن معاني المتغيرات واضحة.

مجموع المربعات الناتجة عن الانحدار يقيس مدى جودة تمثيل نموذج الانحدار للبيانات التي تم استخدامها للنمذجة. يقيس المجموع الكلي للمربعات التباين في البيانات المرصودة (البيانات المستخدمة في نمذجة الانحدار).

قراءات ذات صلة

CFI هي المزود الرسمي لمحلل النمذجة المالية والتثمين (FMVA) والتجارة لتصبح محللًا معتمدًا للنمذجة المالية والتثمين (FMVA) ومحلل التقييم والنمذجة المالية (FMVA) من CFI وستساعدك شهادة التسجيل على اكتساب الثقة التي تحتاجها في التمويل الخاص بك مسار مهني مسار وظيفي. سجل اليوم! برنامج شهادة ، مصمم لتحويل أي شخص إلى محلل مالي على مستوى عالمي.

لمواصلة التعلم وتطوير معرفتك بالتحليل المالي ، نوصي بشدة باستخدام موارد CFI الإضافية أدناه:

  • مفاهيم الإحصاء الأساسية للمالية. علاوة على ذلك ، يمكن أن تساعد مفاهيم الإحصاء المستثمرين على المراقبة
  • تحليل الانحدار تحليل الانحدار تحليل الانحدار هو مجموعة من الأساليب الإحصائية المستخدمة لتقدير العلاقات بين متغير تابع وواحد أو أكثر من المتغيرات المستقلة.
  • أنواع التحليل المالي أنواع التحليل المالي يتضمن التحليل المالي استخدام البيانات المالية لتقييم أداء الشركة وتقديم توصيات حول كيفية تحسينها في المستقبل. ينفذ المحللون الماليون عملهم بشكل أساسي في Excel ، باستخدام جدول بيانات لتحليل البيانات التاريخية وعمل توقعات أنواع التحليل المالي

شهادة المحلل المالي

كن محللًا معتمدًا للنمذجة المالية والتثمين (FMVA) وقم بالتسجيل كن محللًا معتمدًا للنمذجة المالية والتثمين (FMVA) ومحلل النمذجة المالية والتثمين (FMVA) وشهادة التسجيل من CFI ستساعدك على اكتساب الثقة التي تحتاجها في مهنتك المالية. سجل اليوم! من خلال إكمال دروس النمذجة المالية وبرنامج التدريب على الإنترنت من CFI & rsquos!


النظرية المحايدة لتاريخ الحياة والتنوع الفردي في مكونات اللياقة البدنية

يمكن أن يختلف الأفراد داخل السكان اختلافًا جوهريًا في مدى حياتهم ونجاحهم الإنجابي طوال حياتهم ، لكن مثل هذا التباين الفردي المدرك في مكونات اللياقة البدنية لا يحتاج إلى أن يعكس اختلافات اللياقة الوراثية الكامنة المرئية للانتقاء الطبيعي. ومع ذلك ، فإن علماء الأحياء يجادلون عمومًا بأن الاختلافات الكبيرة في مكونات اللياقة البدنية من المحتمل أن تكون قابلة للتكيف ، وهي ناتجة عن التطور وتحركه عن طريق الانتقاء الطبيعي. لفحص هذه الحجة ، نستخدم صيغًا فريدة لحساب التباين الدقيق في مدى الحياة وفي النجاح الإنجابي مدى الحياة بين الأفراد الذين لديهم معدلات حيوية (نمطية وراثية) متطابقة (بافتراض نمط وراثي مشترك لجميع الأفراد). هؤلاء الأفراد لديهم لياقة متطابقة ولكنهم يختلفون بشكل كبير في مكونات اللياقة البدنية الفردية الخاصة بهم. نوضح على سبيل المثال أن الفروق المحسوبة والتوزيع المحاكي المقابل لمكونات اللياقة البدنية تتطابق مع تلك التي لوحظت في التجمعات الحقيقية. بالطبع ، من المتوقع أن تختلف المعدلات الحيوية (الجينية) في السكان الحقيقيين بكميات صغيرة ولكنها مهمة تطوريًا بين الطرز الجينية ، لكننا نظهر أن هذه الاختلافات تزيد بشكل طفيف من التباينات في مكونات اللياقة البدنية. نستنتج أن الاختلافات الملحوظة في مكونات اللياقة البدنية من المحتمل أن تكون محايدة تطوريًا ، على الأقل إلى الحد الذي لا يمكن فيه تمييزها عن التوزيعات الناتجة عن العمليات المحايدة. النتائج المهمة للتباين المحايد الكبير هي كما يلي: من المرجح أن تكون التوريث لمكونات اللياقة البدنية صغيرة (وهذا هو الحال في الواقع) ، سيكون من الصعب قياس الاختلافات الانتقائية الصغيرة في تاريخ الحياة ، وسيتم تضخيم تأثيرات الانجراف العشوائي في المجموعات الطبيعية من خلال الفروق الكبيرة بين الأفراد.

بيان تضارب المصالح

الكتاب تعلن أي تضارب في المصالح.

الأرقام

النجاح التناسلي مدى الحياة ( العلوي ...

النجاح التناسلي مدى الحياة ( العلوي ) والتوزيع مدى الحياة ( أدنى ) ل…


بعض الانتقادات للمقاربة السياقية وعدد قليل من المقترحات

ال النهج السياقي هو إطار عمل بارز للتفكير في اختيار المجموعة. هنا ، أسلط الضوء على الغموض حول ماهية النهج السياقي. بعد ذلك ، أناقش المقتضيات الإشكالية التي ينطوي عليها النهج السياقي فيما يتعلق بالعمليات التي يتم اعتبارها اختيارًا للمجموعة - تستلزم إزعاجًا أكثر مما يُلاحظ عادةً. ومع ذلك ، فإن نسخة Sober و Wilson من نهج السعر، وهو البديل الرئيسي للنهج السياقي ، يمثل إشكالية أيضًا: فهو يؤدي إلى مفارقة لا تحظى بالتقدير الكافي تسمى مشكلة اختيار التلاشي وبالتالي يولد الحساب النوعي الخاطئ لما إذا كان اختيار المجموعة يحدث في مجموعة معينة من الحالات. رداً على ذلك ، أقوم بتطوير حساب لاختيار المجموعة يمكنه التعامل مع الأمثلة المضادة لكل من النهج السياقي ونهج السعر. ثم أناقش الدور الذي يمكن أن يستمر التحليل السياقي في لعبه في مناقشة اللياقة الفردية وتطور التمثيل الغذائي.

هذه معاينة لمحتوى الاشتراك ، والوصول عبر مؤسستك.


كيفية حساب انحدار اللياقة الفردية على النمط الظاهري الفردي - علم الأحياء

لقد طلبت ترجمة آلية لمحتوى محدد من قواعد البيانات الخاصة بنا. يتم توفير هذه الوظيفة لراحتك فقط ولا يُقصد بها بأي حال من الأحوال أن تحل محل الترجمة البشرية. لا تقدم BioOne ولا مالكو وناشر المحتوى ، وهم يتنصلون صراحةً من مسؤوليتهم ، أي تعهدات أو ضمانات صريحة أو ضمنية من أي نوع ، بما في ذلك ، على سبيل المثال لا الحصر ، الإقرارات والضمانات فيما يتعلق بوظيفة ميزة الترجمة أو دقة أو اكتمال الترجمات.

لا يتم الاحتفاظ بالترجمات في نظامنا. يخضع استخدامك لهذه الميزة والترجمات لجميع قيود الاستخدام الواردة في شروط وأحكام استخدام موقع BioOne.

النمط الظاهري الفردي والقرابة ووقوع زواج الأقارب في عصافير سونغ

جين إم ريد ، 1 ، * بيتر أركيزي ، 2 لوكاس إف كيلر 3

1 1 كلية العلوم البيولوجية ، مبنى علم الحيوان ، جامعة أبردين ، شارع تيليدرون ، أبردي
2 3 مركز لبحوث الحفظ التطبيقية ، علوم الغابات ، 2424 مين مول ، الجامعة البريطانية
3 4 متحف Zoologisches ، جامعة & # 228t Z & # 252rich ، Winterthurerstrasse 190 ، 8057 Z & # 252rich ، سويسرا

يتضمن PDF و HTML ، عند توفره

هذه المقالة متاحة فقط لـ مشتركين.
انها ليست متاحة للبيع الفردي.

غالبًا ما يتم تقدير عبء زواج الأقارب ، وهو معلمة رئيسية في البيئة التطورية ، من خلال تراجع اللياقة (أو السمات ذات الصلة) على معامل زواج الأقارب بين أفراد المجتمع. يفترض هذا النهج أن زواج الأقارب يحدث بشكل عشوائي فيما يتعلق بالقدرة الذاتية للفرد على إنتاج ذرية مناسبة قد تكون الأحمال المقدرة متحيزة عن طريق التباين بين زواج الأقارب والجودة الفردية. ومع ذلك ، نادرًا ما يتم التحقق من صحة هذا الافتراض. اختبرنا ما إذا كانت القرابة الملحوظة للفرد مع رفيقه الاجتماعي (ومن ثم درجة زواج الأقارب التي شارك فيها الفرد) مرتبطة بسمات نمطية محددة من المحتمل أن تشير إلى الجودة الفردية في عصافير الأغنية التي تعيش بحرية Melospiza melodia. الذكور (وإلى حد ما الإناث) الذين تفقسوا في وقت مبكر ضمن مجموعتهم ، كان لديهم طائر أقصر ، تربوا في وقت مبكر خلال عامهم الأول ، أو نجوا من سنوات أقل مقترنة بأصحاب أقرباء ، وبالتالي أنتجوا نسلًا فطريًا نسبيًا. نشأت هذه الارتباطات لأن الذكور ذوي الأنماط الظاهرية المحددة كانوا أكثر ارتباطًا بالسكان الإناث (وبالتالي أكثر عرضة للاقتران بأقارب أقرب في إطار الاقتران العشوائي) ، ولأن الذكور الذين لديهم أنماط ظاهرية محددة يقترنون بأقارب أقرب مما كان متوقعًا. يمكن أن تؤدي مثل هذه الارتباطات إلى تحيز أحمال زواج الأقارب المقدرة ، ويجب أخذها في الاعتبار في التحليلات الجينية الكمية للتباين الظاهري في السكان التي يحدث فيها زواج الأقارب.

جين إم ريد ، وبيتر أركيس ، ولوكاس إف كيلر "النمط الظاهري الفردي ، والقرابة ، ووقوع زواج الأقارب في عصافير سونغ" ، التطور 62 (4) ، 887-899 ، (1 أبريل 2008). https://doi.org/10.1111/j.1558-5646.2008.00335.x

تم الاستلام: 19 آب (أغسطس) 2007 تاريخ القبول: 8 كانون الثاني (يناير) 2008 تاريخ النشر: 1 نيسان (أبريل) 2008

هذه المقالة متاحة فقط لـ مشتركين.
انها ليست متاحة للبيع الفردي.


أفضل الممارسات في قياس الاستجابة التنافسية والأثر التنافسي

عند إجراء دراسات طولية مثل الاختيار متعدد المستويات ودراسات مقياس النبات ، فإن توقيت قياس السمات أمر بالغ الأهمية يفترض الباحثون أن السمات تؤثر على اللياقة البدنية. خلال عمر الأفراد ، قد نتعرف على الأحداث التي يمكن أن تؤثر فيها قيم السمات على اللياقة البدنية ، على سبيل المثال ، قد يؤدي زيادة الطول في الأعشاب إلى تقليل البقاء في فصل الشتاء ، ولكن الطول يمكن أن يزيد من جذب الملقحات. في تحليل اختيار النمط الظاهري ، يجب قياس السمات قبل بدء بعض حلقات الاختيار (بالمعنى أرنولد ووادي 1984 أ ، ب) وقياس اللياقة المأخوذ بعد حلقة الاختيار هذه. بالنسبة لتأثيرات العمر ، يتم قياس اللياقة في نهاية العمر ، ويجب قياس السمات في وقت مبكر من عمر الأفراد. من الناحية المثالية ، الاستثناءات الوحيدة هي سمات مثل عدد الفقرات في الثعابين أو طول تحت الجلد والتي لا تتغير لاحقًا في عمر الأفراد.

بالنسبة للنباتات ، يعد قياس السمات التنافسية قبل حلقة الاختيار أمرًا بالغ الأهمية. تتمثل إحدى عواقب المنافسة غير المتكافئة فوق الأرض في تضخيم التباين في الحجم ، حيث تنمو النباتات الأكبر بسرعة أكبر من النباتات الصغيرة ، في عملية تسمى الهيمنة والقمع (Weiner 1985). يمكن للاختلافات الصغيرة نسبيًا في الأداء في وقت مبكر من الحياة أن تؤثر على اللياقة البدنية مدى الحياة في المدرجات الكثيفة على الرغم من أنها لا تؤثر على لياقة النباتات المزروعة بمفردها (Schmitt & Ehrhardt 1990). الحجم هو سمة تنافسية محتملة ، ولكن تضخيم التباين في الحجم قد يؤدي إلى تحيز طرق الانحدار نحو الحجم باعتباره السمة التنافسية الأولية عندما يتم قياس السمات بعد حلقة الاختيار. يمكن لمقاربات الانحدار تقدير ما إذا كان الحجم الأكبر يؤدي إلى الفوز في المنافسة. ولكن عندما يتم قياس الحجم بعد حلقة الانتقاء عند المنافسة ، فعندئذ ، على الأقل جزئيًا ، يتم عكس السببية بحيث يؤدي الفوز في المنافسة إلى تكديس حجم أكبر.

أظهرت دراسة واحدة على الأقل أن هناك حلقة محتملة من الاختيار للمنافسة تحدث عندما كانت النباتات صغيرة جدًا. ناجاشيما (1999) يتبع نمو النباتات الفردية داخل المدرجات الكثيفة ألبوم Chenopodium، قياس الارتفاع على فترات زمنية متعددة. من هذه النتائج ، تمكنت من تحديد ثلاث مراحل متميزة من المنافسة (الشكل 2). في المرحلة الأولى ، لا تتنافس النباتات بعد على الموارد ، كما يتضح من الارتباطات الإيجابية بين ارتفاعات الهدف والجيران. قد تشير هذه الارتباطات الإيجابية إلى اختلاف الموائل الدقيقة المحلية ، ولكن من المحتمل أن تنتج عن استجابات استطالة الساق إلى انخفاض نسبة R / FR التي تحدث قبل التظليل من قبل الجيران (Ballare وآخرون. 1987). في المرحلة الثانية ، تتنافس النباتات ، كما يتضح من الارتباطات السلبية بين ارتفاع الهدف وارتفاع الجوار. يتزايد ارتباط الرتبة بين الارتفاع والارتفاع النهائي ولكنه لم يثبت بعد عند 1. هذه هي المرحلة التي تحدث فيها الهيمنة والقمع. تنتهي المرحلة الثانية عندما تغلق المظلة ويتم إصلاح ارتباط الترتيب للارتفاع النهائي عند 1. المرحلة الثالثة هي التوحيد ، مع زيادة الفائزين بشكل متزايد ، ويبقى الخاسرون بالحجم نفسه أو يموتون. أدت زيادة كثافة الحامل إلى تسريع معدل انتقال الحامل إلى المرحلة الثانية ، لكنها لم تغير كيفية تنافس النباتات. في هذه الدراسة ، بدأت المرحلة الثانية ، حلقة اختيار الارتفاع ، عندما كان طول النباتات 20 سم ، على الرغم من أن الارتفاع النهائي لهذا النوع كان 2 متر.

ربما كانت حلقة الاختيار للمنافسة في هذه الدراسة مبكرة جدًا ومنفصلة جدًا لأن مصانع الدراسة كانت تتنافس إلى حد كبير فوق الأرض. يمكن النظر إلى المنافسة فوق الأرض على أنها عملية تؤدي إلى إنشاء تسلسل هرمي للحجم للنباتات التي تنمو في حوامل أحادية النوع متساوية العمر. في وقت مبكر من النمو ، تظهر النباتات توزيعًا طبيعيًا للحجم ، ولكن بمرور الوقت ، تصبح المجموعات غير متماثلة بشكل متزايد ، مع وجود عدد قليل من النباتات الكبيرة والعديد من النباتات الصغيرة (Obeid، Machin & Harper 1967 Ford 1975). تتنافس النباتات في الحجم غير المتماثل للضوء ، مع النباتات الأطول القادرة على الحصول على مزيد من الضوء والظلال على حد سواء ، مما يؤدي إلى حصول النباتات الأطول على كمية كبيرة بشكل غير متناسب من الضوء. يتناقض هذا مع المنافسة تحت الأرض ، حيث يُفترض عادةً أن القدرة التنافسية تحت الأرض متناسبة مع الحجم ، على الرغم من أن البعض قد وجد دليلاً على المنافسة غير المتكافئة (Schwinning & Weiner 1998).

التحدي الآخر هو تحديد نمط التنافس بين السكان حيث تهيمن المنافسة تحت الأرض ، تمامًا كما فعل Nagashima (1999) للمنافسة فوق الأرض. هل هناك حلقة اختيار حاسمة للمنافسة تحت الأرض؟ من المحتمل ألا تكون المياه والمغذيات موارد اتجاهية بالطريقة التي يكون بها الضوء ، وبالتالي فإن المنافسة أكثر تناسقًا في الحجم تحت الأرض منها فوق الأرض (Schwinning & Weiner 1998). تحتاج النباتات إلى الاستمرار في استكشاف التربة للحصول على الماء والمواد المغذية من خلال زراعة جذور جديدة. كيف يمكن أن يغير ذلك المسار الزمني وإنشاء تسلسل هرمي للحجم الثابت؟ قد يكون هذا التسلسل الهرمي أكثر مرونة في التنافس المتماثل الحجم ، وبالتالي ستكون النباتات قيد الاختيار باستمرار للحصول على قدرة تنافسية أكبر. في بعض الظروف ، حيث تكون الموارد الموجودة تحت الأرض محدودة ولكن الكثافة عالية ، فإن القدرة التنافسية الأكبر تحت الأرض للحصول على الموارد قد تسمح للنباتات بالحصول على موارد كافية للنمو فوق الأرض والفوز بالسباق إلى قمة المظلة. بعد ذلك ، يمتلك النبات ما يكفي من الكتلة الحيوية لزراعة المزيد من الجذور والاستمرار في الفوز في منافسة تحت الأرض أيضًا (Cahill 1999). ولكن إذا كانت الكثافة منخفضة ، فقد تكون جميع التفاعلات الحاسمة تحت الأرض.


مناقشة

تقترح هذه الدراسة بنية جينية تعتمد على الاختيار بين المشرف والعامل الكامنة في "تكوين" سمة معقدة (الشكل 7). على وجه التحديد ، غالبًا ما يتم التحكم في سمة ما بشكل مباشر من قبل عدد كبير من العمال ، ويتم التحكم في التعبير عنها بواسطة مشرفين من نوعين: يساعد المشرفون المنسقون في تنظيم العدد الكبير من العمال في عدد صغير من وحدات التعبير المشترك بحيث يقوم كل عامل على حدة له علاقة قوية بالسمة (ومن ثم يمكن تحديدها بواسطة ا-الاستراتيجية) على النقيض من ذلك ، يؤدي كل من المشرفين غير المنسقين الذين يتمتع كل منهم بملف تنظيمي فريد إلى عدم وجود تعبير مشترك بين العمال بحيث لا يُظهر العمال الفرديون أي ارتباط يمكن تتبعه مع السمة (وبالتالي مقاومة ا-إستراتيجية). القضية الحاسمة هنا هي أنه يجب تعيين المشرفين المنسقين و / أو الحفاظ عليهم عن طريق الاختيار الطبيعي ، في حين أن المشرفين غير المنسقين قد يتطورون بشكل محايد دون قيود انتقائية.

المشرف - العامل - المعتمد على الاختيار - بنية الجينات الكامنة وراء تكوين السمة. من خلال الانتقاء الطبيعي ، يتم تعيين المشرفين المنسقين / الاحتفاظ بهم لتنظيم العاملين 50 في أربع وحدات تعبير مشترك ، بحيث يُظهر كل عامل ارتباطًا قويًا بالسمة. عندما يكون الاختيار غائبًا ، يتم التحكم في العمال 50 حصريًا من قبل مشرفين غير منسقين وبالتالي يعبرون بشكل مستقل. نتيجة لذلك ، يُظهر جميع العمال ارتباطًا ضعيفًا بالسمة.

المشرف - العامل - المعتمد على الاختيار - بنية الجينات الكامنة وراء تكوين السمة. من خلال الانتقاء الطبيعي ، يتم تعيين المشرفين المنسقين / الاحتفاظ بهم لتنظيم العاملين 50 في أربع وحدات تعبير مشترك ، بحيث يُظهر كل عامل ارتباطًا قويًا بالسمة. عندما يكون الاختيار غائبًا ، يتم التحكم في العمال 50 حصريًا من قبل مشرفين غير منسقين وبالتالي يعبرون بشكل مستقل. نتيجة لذلك ، يُظهر جميع العمال ارتباطًا ضعيفًا بالسمة.

هناك عدد قليل من القضايا تحتاج إلى توضيح. أولاً ، نظرًا لتوافر البيانات ، استخدمنا مستوى الرنا المرسال لتمثيل نشاط الجين ودرسنا الصفات المورفولوجية فقط لخميرة الكائن وحيدة الخلية. مزيد من الجهود ضرورية لاختبار عمومية النتائج التي توصلنا إليها في الأنظمة الأخرى. بالإضافة إلى ذلك ، على الرغم من أن بنية الجينات مخصصة لوصف تكوين سمة معقدة ، إلا أنه ليس من الواضح بسهولة كيف يمكن تطبيقها على المجموعات الطبيعية المتأثرة بالتغيرات الجينية الدائمة. ثانيًا ، تعتبر بنية الجينات المشرف-العامل تبسيطًا مفرطًا للهيكل التنظيمي الكامن وراء سمة معقدة: ينظم المشرف فقط بعض العمال ويتم تنظيم العامل فقط من قبل بعض المشرفين أيضًا ، ويتم تجاهل التفاعلات بين المشرفين وبين العمال. بالإضافة إلى ذلك ، نلاحظ أن السؤال عما إذا كان الجين الفردي مشرفًا أم عاملًا ليس مشرفًا ذا مغزى وأن العاملين كمجموعتين جينيتين هما الأكثر أهمية في سياق P-استراتيجية و ا- الإستراتيجية التي يتم من خلالها تحديد كل منهم. اعتمد الانقسام بين المشرفين الملاحظين والعاملين في الدراسة الحالية على العتبات الإحصائية الصارمة المستخدمة في استراتيجيتي البحث. ومع ذلك ، على الرغم من التأكيد هنا على الاستبعاد المتبادل للمشرفين والعاملين ، فإننا لا ننكر حقيقة أن بعض الجينات ، مثل الجينات الثلاثة الغنية بالمعلومات الموجودة في الشكل 1 د ، يمكن أن تكون حساسة لكليهما. P-استراتيجية و ا-إستراتيجية. هذا أيضًا يفسر جزئيًا النجاحات العرضية في الدراسات دون النظر في بنية الجينات المقترحة. ومع ذلك ، فإننا نستخلص استنتاجين رئيسيين قويين: 1) بالنسبة للسمة التي يتحكم فيها عدد كبير من العمال ، يمكن تتبع العمال الفرديين عبر ا-الاستراتيجية فقط عندما يتم تنظيمها في عدد محدود من وحدات التعبير المشترك 2) يتطلب التعبير / التنسيق المشترك للعمال عوامل عابرة (مشرفون منسقون) يجب تعيينهم و / أو الحفاظ عليهم عن طريق الانتقاء الطبيعي. الاستنتاج الأول ، كما أوضحنا من قبل ، يمثل قاعدة إحصائية. الاستنتاج الثاني يمثل قاعدة للتطور ، لأنه بدون قيود انتقائية ، فإن أي تنسيق في نظام حي من شأنه أن يتدهور.

إن الهندسة الجينية للمشرف - العامل لوصف تكوين سمة تتناول بشكل مباشر التحدي الثالث الذي أثير في بداية المقالة. بالنسبة للتحديين المتبقيين ، نبدأ من التحدي الثاني بزاويتين: الزاوية الأولى تدور حول الجينات السلبية التي تنتجها ص-إستراتيجية. ص- يجب أن تعتمد الإستراتيجية على الإحصائيات لاختبار الفرضية الصفرية بأن الجين المتحور / المضطرب ليس له أي تأثير على السمة البؤرية. ومع ذلك ، لا يبدو أن هذه الفرضية الصفرية مناسبة لنظام خلوي ترتبط فيه جميع الجينات ببعضها البعض للتأثير على جميع السمات (Fisher 1999). بشكل ثابت ، يشير التوزيع المستمر والتوزيع على شكل الجرس لتأثيرات حذف الجينات ، كما في الشكل 5 ب و ج ، بالنسبة للغالبية العظمى من سمات الخميرة ، إلى أن تأثيرات الحذف تختلف كميًا وليس نوعيًا. وبالتالي ، فإن ممارسة العمل ص- لا تتمثل الإستراتيجية في فصل الجينات ذات التأثيرات عن تلك التي ليس لها تأثيرات ، بل هي فصل الجينات ذات التأثيرات الكبيرة عن الجينات ذات التأثيرات الصغيرة. في حين أن الجينات ذات التأثيرات الطفرية الكبيرة يمكن أن تكون ذات قيمة عملية أكثر ، فإن الجينات ذات التأثيرات الطفرية الصغيرة ، مثل العمال ، يمكن أن تفسر المزيد من التباين في السمات وتوفر فهمًا آليًا مباشرًا. باعتبارها "المعيار الذهبي" في الدراسات الجينية ص- تعكس الاستراتيجية وجهة نظر الاختزالية الكلاسيكية على نظام حي ، مع الاعتقاد بأن الكل هو مجموع كل الأجزاء المكسورة. حان الوقت لتبني طريقة عرض الأنظمة من خلال تضمين نشاط جميع الجينات لفهم التباين الكلي.

لمزيد من إظهار السلبيات الخاطئة لـ ص-الاستراتيجية استفدنا من العدد الهائل من العلاقات الجينية والسمات المتاحة في هذه الدراسة. ما هو نموذجي ص- الاستراتيجية ستفعل ، قارنا عددًا معينًا (50) من الخلايا الفردية لطافرة حذف جين معين مع نفس العدد من الخلايا من النوع البري. اكتشفنا عددًا كبيرًا من تأثيرات الحذف المهمة وغير المهمة في ظل القطع الإحصائي ص & lt 0.001 (انظر المواد والطرق). كما هو متوقع ، مع زيادة حجم تأثير الحذف ، زاد تردد الإشارات الهامة بشكل كبير (الشكل 8 أ). لقياس المدى الذي تكون فيه الإشارات غير المهمة عبارة عن سلبيات كاذبة ، قمنا بتصميم محاكاة. على وجه التحديد ، قمنا بتعديل قيم السمات لجميع الخلايا من النوع البري (حتى 16000) عن طريق إضافة حجم تأثير معين لتشكيل الخاليا الكاذبة ، ثم قمنا بمقارنة 50 خلية من الخلايا الكاذبة المختارة عشوائيًا بمجموعة من 50 خلية من النوع البري تم اختيارها عشوائيًا ضمن نفس الإعداد الإحصائي (انظر المواد والطرق). بالنسبة للسمات المختلفة التي تم فحصها ، اكتشفنا فروقًا مهمة وغير مهمة ، والتي تمثل تباين العينات من الملوثات الزائفة التي لها اختلافات حقيقية عن الأنواع البرية. بعبارة أخرى ، فإن الإشارات غير المهمة بين الخواص الكاذبة والأنواع البرية تمثل سلبيات خاطئة ص-إستراتيجية. ومن المثير للاهتمام ، أن نسبة الإشارات المهمة إلى الإشارات غير المهمة التي لوحظت بالنسبة للخلايا الكاذبة كانت مشابهة إلى حد كبير لتلك الخاصة بطفرات حذف الجينات الحقيقية (الشكل 8 ب) ، مما يشير إلى أن الإشارات غير المهمة للطفرات الحقيقية يمكن تفسيرها بشكل جيد من خلال السلبيات الكاذبة.

يمكن تفسير الإشارات غير المهمة إحصائيًا بشكل جيد من خلال السلبيات الخاطئة لـ ص-إستراتيجية. (أ) إن نسبة ملاحظة الفروق المهمة بين 50 خلية متحولة و 50 خلية من النوع البري هي دالة لأحجام تأثير الطفرات. (ب) تتشابه نسبة الإشارات المهمة لطفرات الحذف الجيني الحقيقية مع تلك الموجودة في المحاكاة الكاذبة التي لها اختلافات حقيقية عن النوع البري ، مما يشير إلى أن الإشارات المتبقية غير المهمة يمكن تفسيرها بشكل جيد من خلال السلبيات الزائفة لـ ص-إستراتيجية. نظرنا فقط في أحجام تأثير ض = 0–0.77 ، والتي تغطي 50٪ من البيانات مع ض & gt 0 في توزيع غاوسي قياسي. يشتمل المربع وشريط الخطأ على 50٪ و 90٪ من البيانات المشتقة من 100 مكررة ، على التوالي.

يمكن تفسير الإشارات غير المهمة إحصائيًا بشكل جيد من خلال السلبيات الخاطئة لـ ص-إستراتيجية. (أ) إن نسبة ملاحظة الفروق المهمة بين 50 خلية متحولة و 50 خلية من النوع البري هي دالة لأحجام تأثير الطفرات. (ب) تتشابه نسبة الإشارات المهمة لطفرات الحذف الجيني الحقيقية مع تلك الموجودة في المحاكاة الكاذبة التي لها اختلافات حقيقية عن النوع البري ، مما يشير إلى أن الإشارات المتبقية غير المهمة يمكن تفسيرها بشكل جيد من خلال السلبيات الزائفة لـ ص-إستراتيجية. نظرنا فقط في أحجام تأثير ض = 0–0.77 ، والتي تغطي 50٪ من البيانات مع ض & gt 0 في توزيع غاوسي قياسي. يشتمل المربع وشريط الخطأ على 50٪ و 90٪ من البيانات المشتقة من 100 مكررة ، على التوالي.

الزاوية الأخرى تتعلق بالجينات الإيجابية التي ينتجها ص-إستراتيجية. تميل هذه الجينات إلى أن تكون مشرفًا على سمة. في حين يتم تعيين المشرفين المنسقين / الاحتفاظ بهم عن طريق الاختيار ، قد يكون المشرفون غير المنسقين في كثير من الأحيان من أصل سلبي ويتطورون في ظل قيود انتقائية قليلة. من غير الواضح كيف سيعمل مشرف غير منسق تم الكشف عنه في المختبر في الطبيعة. ستكون الإجابة على هذا السؤال حاسمة لفهم سبب استخدام عدد محدود جدًا من الجينات لدفع تطور نمط ظاهري معين في الطبيعة حتى عندما يتأثر النمط الظاهري بعدد كبير من الجينات (Stern and Orgogozo 2009). Thus, the field of molecular genetics, which has long been dominated by mechanistic perspectives, would make more sense in the light of evolution. This notion reminds us of a recently proposed idea that the genetic effects of a gene could be attributed to either the native functions that are built/maintained by natural selection or the “spurious” functions that are created by the given genetic manipulation ( He 2016).

The last to-be-discussed challenge is about the ا-strategy. As we have demonstrated, ا-strategy will perform well only for fitness-coupled traits in which the workers are coordinated. In other words, for a trait determined by many workers, the effect of individual workers on the trait will appear stable only when the workers are coordinated to form functional modules/pathways. Suppose there is a trait controlled by ten workers that each have two functional statuses, on or off. The absence of coordination across the ten workers would lead to a total of 2 10 = 1,024 different functional statuses underlying the trait, and the effect of an individual worker would be always epistatic to the other workers. Thus, context-dependent findings, a major confounding factor in current molecular cell biology ( Freedman et al. 2015), appear to be an unavoidable outcome of the lack of selective constraints, which leads to the lack of coordination.

In summary, we studied the gene–expression–trait relationships from the perspective of trait making, and showed that the genes found for a trait are often decoupled from the expressions underlying the trait, and that the expressions underlying a trait are tractable only if they are coordinated by natural selection. The second issue reminds biologists of a simple fact: The order of a living system relies on natural selection and the lack of selection inevitably leads to disorder, and the internal order and disorder determine the success of the external research efforts. This notion has special implications to human biology because selection is inefficient in humans due to the small effective population size ( Lynch and Conery 2003) and because aging-associated diseases or traits are often of little fitness relevance but of high interest to researchers ( Finch 2010 Lopez-Otin et al. 2013). One may argue that the disorder is exactly the challenges we need to address, but the lack of selective constraints predicts that it might be ad hoc phenomena sensitive to genetic backgrounds ( Mackay 2014). A robust discussion of both the necessity and the strategy for studying such phenomena is needed.


An exact form of the breeder's equation for the evolution of a quantitative trait under natural selection

Starting with the Price equation, I show that the total evolutionary change in mean phenotype that occurs in the presence of fitness variation can be partitioned exactly into five components representing logically distinct processes. One component is the linear response to selection, as represented by the breeder's equation of quantitative genetics, but with heritability defined as the linear regression coefficient of mean offspring phenotype on parent phenotype. The other components are identified as constitutive transmission bias, two types of induced transmission bias, and a spurious response to selection caused by a covariance between parental fitness and offspring phenotype that cannot be predicted from parental phenotypes. The partitioning can be accomplished in two ways, one with heritability measured before (in the absence of) selection, and the other with heritability measured after (in the presence of) selection. Measuring heritability after selection, though unconventional, yields a representation for the linear response to selection that is most consistent with Darwinian evolution by natural selection because the response to selection is determined by the reproductive features of the selected group, not of the parent population as a whole. The analysis of an explicitly Mendelian model shows that the relative contributions of the five terms to the total evolutionary change depends on the level of organization (gene, individual, or mated pair) at which the parent population is divided into phenotypes, with each frame of reference providing unique insight. It is shown that all five components of phenotypic evolution will generally have nonzero values as a result of various combinations of the normal features of Mendelian populations, including biparental sex, allelic dominance, inbreeding, epistasis, linkage disequilibrium, and environmental covariances between traits. Additive genetic variance can be a poor predictor of the adaptive response to selection in these models. The narrow-sense heritability sigma2A/sigma2P should be viewed as an approximation to the offspring-parent linear regression rather than the other way around.


الملخص

Gut bacteria can affect key aspects of host fitness, such as development, fecundity, and lifespan, while the host, in turn, shapes the gut microbiome. However, it is unclear to what extent individual species versus community interactions within the microbiome are linked to host fitness. Here, we combinatorially dissect the natural microbiome of ذبابة الفاكهة سوداء البطن and reveal that interactions between bacteria shape host fitness through life history tradeoffs. Empirically, we made germ-free flies colonized with each possible combination of the five core species of fly gut bacteria. We measured the resulting bacterial community abundances and fly fitness traits, including development, reproduction, and lifespan. The fly gut promoted bacterial diversity, which, in turn, accelerated development, reproduction, and aging: Flies that reproduced more died sooner. From these measurements, we calculated the impact of bacterial interactions on fly fitness by adapting the mathematics of genetic epistasis to the microbiome. Development and fecundity converged with higher diversity, suggesting minimal dependence on interactions. However, host lifespan and microbiome abundances were highly dependent on interactions between bacterial species. Higher-order interactions (involving three, four, and five species) occurred in 13–44% of possible cases depending on the trait, with the same interactions affecting multiple traits, a reflection of the life history tradeoff. Overall, we found these interactions were frequently context-dependent and often had the same magnitude as individual species themselves, indicating that the interactions can be as important as the individual species in gut microbiomes.

In 1927, Steinfeld (1) reported that germ-free flies live longer than their microbially colonized counterparts, suggesting that bacteria hinder host fitness. This observation, that the microbiome can impact aging, has been replicated in flies and vertebrates (2, 3). However, a decrease in lifespan does not necessarily indicate a negative impact on the host. Organisms in their environment are selected for their fitness, which is a function of lifespan, fecundity, and development time (4). Life history tradeoffs allow local adaptation. For instance, by increasing fecundity at the expense of lifespan (5 ⇓ –7), an organism can use either short or long generation times to achieve equal fitness. These observations set up two major questions: What is the role of an individual bacterial species versus interactions between them in determining host lifespan, and how is the microbiome effect on lifespan related to overall host fitness?

Identifying the host effects of specific bacteria has been difficult, in part, due to high gut diversity but also because interactions between bacteria can depend on context (8). Nonadditive effects of more than two variables are called higher-order interactions, and they indicate that interactions depend on context. For example, a bacterium may produce a specific B-vitamin in response to its neighbors (9, 10). This response may impact the host, and host feedbacks can mitigate or exacerbate changes in the microbial community (11). However, specific examples may be misleading, as the true complexity of a gut microbiome has never been exhaustively quantified. Thus, it remains an outstanding challenge to reverse-engineer the interaction networks that characterize microbiome/host effects relative to host interactions with individual bacterial species. Doing so would allow us to address the role of microbial community complexity in shaping host fitness. However, quantifying the set of all possible interactions of ن species is a combinatorial problem involving 2 ن distinct bacterial communities. كما ن approaches the diversity of the mammalian gut with hundreds of species, this challenge becomes experimentally unfeasible.

The gut microbiome of the fruit fly ذبابة الفاكهة سوداء البطن is an effective combinatorial model because as few as five species of bacteria consistently inhabit the gut of wild and laboratory flies (12 ⇓ –14), yielding 2 5 possible combinations of species. Because early work on the fruit fly microbiome suggested that it is a transient community consisting only of recently ingested bacteria (15), we set up our experiments to maintain bacterial colonization through frequent ingestion. However, newer studies demonstrate that a modified fly diet as well as specific bacterial strains make for a persistent gut microbiome (16, 17), suggesting similarities with higher organisms. Here, we isolated the five core laboratory fly gut bacteria species in culture: Lactobacillus plantarum (Lp), Lactobacillus brevis (Lb), Acetobacter pasteurianus (Ap), Acetobacter tropicalis (في)، و Acetobacter orientalis (Ao). These fermentative lactic acid bacteria and acetic acid bacteria commonly occur in the wild fly gut (14, 18, 19), where they can maintain a stable association (16, 17). We constructed germ-free flies by surface-sterilizing the embryos and reinoculated the newly emerged adult flies via continuous association with defined flora using established protocols (17, 20). We made the 32 possible combinations of the five bacterial species and then quantified the microbiome composition and resultant host phenotypes of (أنا) development time, (ii) reproduction, and (iii) lifespan to determine the relationship between gut microbe interactions and host fitness. We tested to what extent the presence and abundance of individual bacterial species account for the fly physiology phenotypes we measured.

Finally, we introduce a mathematical framework to deconstruct microbiome/host complexity by making a conceptual analogy between the bacterial species interactions and genetic epistasis (21, 22). This approach revealed significant context-dependent interactions between two, three, four, and five species that have large impacts on host physiology, contributing to differential life history strategies.


المواد والأساليب

Genomic Data.

Autosomal genotype data were aggregated from two published studies (9, 10), and all original data files are publicly available through Dryad. The Fitak et al. data (9) were lifted over to CanFam3.1, then merged with Hayward et al. data (10) using PLINK (49). There were 210 sites that failed the lift over and 24,739 sites identified by PLINK as allele flips between Hayward and Fitak data. We retained sites that were present in 90% of individuals across the two data sets, which resulted in 117,288 sites of the 118,077 sites in the Fitak (∼99%) data and ∼73% of the 160,725 sites in the Hayward data being retained. SNPRelate (50) was used to perform PCA (الملحق SI, Fig. S1), identify duplicate individuals, and compute relatedness between individuals. Duplicate individuals and potential hybrid individuals were removed from the data set. The final data set contained 4,414 breed dogs, 327 village dogs, and 380 wolves. Code for merging data and final files are available on GitHub.

AKC Data.

We used AKC registration data from 1926 to 2005 to compute breed popularity. These data were curated from previous work (51) and contain information for ∼150 recognized breeds. To compute popularity through time, we dropped the first entry for each breed, as this number potentially reflects older dogs and new litters, then used the remaining data as the total number of new registrants per year. The popularity score is the integral from the second entry through 2005 (available on GitHub).

OMIA Data.

We downloaded all “Likely Causal” variants listed on OMIA. The “Likely Causal” criteria is met if there is at least one publication to be listed where the variant is associated with a disorder. If a variant had been identified in multiple breeds, it was counted in each breed. We were able to use all the genic coordinates from the “Likely Causal” category of variants from OMIA because we do not require that the causal variant is present in our data. The total number of causal variants per breed was downloaded from OMIA and is available here: https://github.com/jaam92/DogProject_Jaz/tree/master/LocalRscripts/OMIA.

Detecting IBD Segments.

To identify IBD segments, we used the software IBDSeq. (52) on its default settings. We set the minimum IBD segment length to 4cM, as that is the suggested length to reliably detect IBD segments in genotype data when using IBDSeq. We restricted to unrelated individuals, defined as being no closer than third-degree relatives, because IBDSeq only considers that individuals have only zero or one haplotype IBD.

Detecting ROH.

VCFTools, which implements the procedure from Auton et al. (53), was used to discover ROH in all individuals. We only kept ROH that contained at least 50 SNPs, were at least 100 kb long, and where SNP coverage was within one SD of mean SNP coverage across all remaining ROH. A file that contains the final ROH and scripts for running quality control can be found here: https://github.com/jaam92/DogProject_Jaz/tree/master/LocalRscripts/ROH. We also detected ROH using PLINK (reference الملحق SI) to assess the concordance of our results.

Computing IBD and ROH Scores.

We computed each population’s IBD and ROH scores using an approach similar to that of Nataksuka et al. (54). A population’s IBD score was calculated by computing the total length of all IBD segments between 4 and 20 cM and normalizing by the sample size. A population’s ROH score was computed using all ROH that passed quality control and normalizing by the sample size.

Association Test and Effect Size Estimates.

For these analyses, we only used the subset of breed-dog data from Hayward et al. where we had phenotype information (10), allowing us to follow the same strict requirements for each clinical phenotype as originally done. For breed-specific analyses, we required there to be at least 10 cases and 10 controls per breed. For the “all breed” analyses, we include all individuals combined in the same analysis, rather than conducting a meta-analysis of all the results from the individual breed analyses. If there were more cases than controls, in either the breed-specific or all-breed analyses, the cases were down sampled to match the sample size of controls (reference الملحق SI, Table S1 for sample sizes).

We computed the association between FROH and each trait using a general linear mixed model, specifically a logistic mixed model, which is implemented in the R package GMMAT (55). Following the protocol from Hayward et al. (10), we did not include covariates in the association test and included the SNP-based or ROH-based kinship matrix as a random effect in the model to control for population stratification due to covariation of the amount of ROH per breed with the incidence of the phenotype in the breed. ص values were determined using a Wald test with a significance threshold of ص = 0.05. Note, we use nominal ص values in the manuscript and الملحق SI, these are not corrected for multiple testing (reference الملحق SI, SI Text for rationale). For more details on clinical-trait ascertainment see ref. 10. We generated the kinship matrix two different ways: 1) using the R package PC-Relate (56) on the SNP genotype matrix, and 2) by computing the total amount of the genome within an ROH that is shared between two individuals (SR), S R = ∑ j = 1 i X G j .

Here, X G j ∈ <0, 1>and equals 1 if the genotype (جي) at the ي th site falls within an ROH shared by both individuals and equals 0 otherwise. SR was computed for each pair of individuals and bounded between 0 (no sharing) and 1 (complete sharing) as follows: S R B O U N D = S R − m i n ( S R ) m a x ( S R ) − m i n ( S R ) ,

where the max amount of sharing in the equation above is the total length of the autosome and minimum is smallest SR value in base pairs. Results reported in the main text are for SRBOUND. We also compared these results to those when not using a kinship or ROH matrix (الملحق SI, Fig. S13).

Identifying Depletions of ROH.

To find the number of genes expected to contain at least one exon without an ROH, the ROH in each individual were permuted to a new location on the same chromosome using BEDTools shuffle (57). Next, we created a bed file containing the permuted ROH locations, intersected this file with the exon locations from CanFam3.1, and counted the number of genes with at least one exon where we did not observe any overlap with an ROH. To control for edge effects along the chromosomes, we concatenated all 38 chromosomes into a single chromosome with a total length equivalent to the sum of all the autosome lengths. As such, the shuffled locations of ROH could occur at the ends of chromosomes. We repeated our permutation test 10,000 times to create a null distribution. ال ص value was computed as the proportion of permuted datasets with as many or more genes with an exon not overlapping an ROH relative to what was seen empirically (27 genes).

To examine the overlap between genes lacking ROH and CCRs from Havrilla et al. (38), we used BEDTools (57) to intersect non-ROH with the top 10% (90th percentile) of CCRs and exon ranges for CanFam3.1 (31), which came from Ensembl (58). Then, we tabulated the total number of genes where there was at least one exon where we never observed any overlap (including partial overlap) with an ROH (non-ROH genes) and the converse (ROH genes), as well as the count of whether these non-ROH and ROH genes fell within a CCR. Significance of the ratio of non-ROH genes relative to ROH genes within a CCR was assessed using Fisher’s exact test. We computed the expected number of non-ROH genes within the 90th percentile CCRs by randomly sampling an equal number of genes from the entire gene set and intersecting the randomly sampled genes with CCRs. We repeated this random sampling of genes 100,000 times to build the null distribution and computed a ص value as the proportion of sets of the 27 genes that had at least 23 genes containing an exon in the 90th percentile of CCR genes.


شاهد الفيديو: الفيديو الثاني نموذج الاستجابة المتدرجة Graded Response Model نظرية الاستجابة للمفردة متعددة البدائل (كانون الثاني 2022).