معلومة

مقارنة صحيحة للتعبير الجيني بين عدة جينات في عدة خطوط خلوية


لدينا بيانات التعبير الجيني (نتائج التعبير الجيني Affimetrix mRNA) لعدة خطوط خلوية ، على مجموعة من الجينات. سيكون هدفنا أن نكون قادرين على مقارنة التعبير الجيني النسبي للجينات عبر خطوط الخلايا المختلفة.

تتضمن الطريقة التي فكرنا بها حتى الآن حساب نوع من المتوسط ​​المعتمد على الجينات (التعبير عن جين معين عبر جميع الخطوط) وتطبيع بيانات التعبير لدينا ، مجمعة حسب الجين ، بناءً على ذلك. ومع ذلك ، لسنا متأكدين من أن هذه طريقة صالحة للحصول على بيانات التعبير النسبي من مجموعة البيانات الخاصة بنا ، خاصة حتى نتمكن من مقارنة البيانات من عدة أسطر.

هل تبدو هذه استراتيجية صحيحة؟ كيف يتم هذا التطبيع عادة؟ هل يجب أن نفعل شيئًا مختلفًا للحصول على مقارنة أفضل؟

شكرا جزيلا!


هذه ليست مهمة سهلة ، لأن هناك العديد من العوامل التي يجب أن تأخذها في الاعتبار. أولاً ، هناك اختلافات داخل المقالة كظروف مختلفة قليلاً لكل مجموعة من المسابير للتكرار. بعد ذلك ، هناك اختلافات بين الاختبارات ، مثل الاختلافات في شرائح المصفوفة وما إلى ذلك ، تتناول هذه الورقة ("تحليل بيانات التعبير الجيني للمصفوفة الدقيقة") مزيدًا من التفاصيل.

ما يمكنك فعله أيضًا هو مراجعة Researchgate ، وأعتقد أن هناك المزيد من الأشخاص الذين يتمتعون بخبرة كبيرة في هذا المجال.


إذا جاءت بياناتك من معمل واحد وكان تطبيع بروتوكول gcrma القياسي طريقة جيدة للاستخدام (ويأتي مع حزمة affy R) ؛ إذا كانت المصفوفات من أنواع U133A أو HGU133plus2 ، فقد تكون RMA المجمدة طريقة جيدة للاستخدام. أخيرًا يمكنك التحقق من تأثيرات الدُفعات والتحكم فيها باستخدام ComBat واستخدام بيانات التعبير المصحح.


سؤال جيد! لسوء الحظ ، لا توجد إجابة صحيحة.
كل هذا يتوقف على ما هي احتياجاتك التجريبية. تتضمن كلتا الطريقتين تعداء إدخال الجين الأجنبي (الهدف) إلى الخلايا. في الخلايا المنقولة بشكل عابر ، لا يندمج الحمض النووي الغريب في جينوم المضيف وبالتالي لا يتكاثر ويفقد في النهاية خلال دورات انقسام الخلية على مدار عدة أيام. تعد العدوى العابرة جيدة إذا كان لديك متطلبات صغيرة نسبيًا لـ rAb وإذا كنت في حاجة إليها بسرعة. ينتج عن التعبير الجيني العابر إنتاج AB المؤتلف قصير المدى ، عادةً من 6 إلى 10 أيام من نقطة تعداء الحمض النووي. عادةً ما تحقق خلايا HEK293 معدلات تعداء أعلى وعوائد أعلى مع PEI وهي غير مكلفة وتؤدي إلى انخفاض تكاليف الإنتاج الإجمالية.
يبدأ تعداء العدوى المستقر أيضًا بشكل عابر ولكن من خلال عملية الاختيار والتضخيم الدقيق ، يتم إنشاء مستنسخات مستقرة. في الخلايا المنقولة بشكل ثابت ، يصبح الجين الغريب جزءًا من جينوم المضيف وبالتالي يتم نسخه. تعبر أحفاد هذه الخلايا المصابة بالعدوى أيضًا عن الجين الغريب ، مما يؤدي إلى خط خلية منقولة بشكل ثابت. نظرًا لأن تعداء الخلايا المستقرة عملية أطول وأكثر صعوبة ، فهي عملية لإنتاج rAb على نطاقات أكبر. أثناء عملية الاختيار الأولية عندما تكون كميات البحث من rAbs كافية (10-1000 مجم) ، يلزم وجود طرق سريعة لإنتاج rAb وبالتالي يتم استخدام تعبير عابر على نطاق واسع بشكل روتيني. لإنتاج الأجسام المضادة العلاجية على نطاق واسع ، يعتبر التعبير الجيني المستقر هو الخيار المفضل لأنه يسمح بمزيد من الاتساق في العملية والتحكم في جودة المنتج النهائي.

يتم تكوين الأجسام المضادة المؤتلفة في المختبر باستخدام تقنية الحمض النووي المؤتلف. يتم عزل جينات الجسم المضاد من المصدر المناسب أو توليفها بناءً على معلومات التسلسل. ثم يتم استنساخها في نواقل التعبير للتعبير في نظام تعبير مناسب. يتم إنتاج rAbs كاملة الطول في نظام تعبير للثدييات نظرًا لقدراتها الفائقة على التعديل بعد الترجمة. ميزة أخرى لنظام الثدييات هي انخفاض خطر الاستمناع الذي يمكن أن ينشأ من أنماط غير بشرية للارتباط بالجليكوزيل. يتم إنتاج rAbs باستخدام تقنية التعبير العابر أو المستقر.


خلفية

تنص العقيدة المركزية للبيولوجيا الجزيئية على أن "الحمض النووي يصنع البروتينات" مما يشير إلى وجود علاقة مباشرة بين الرنا المرسال ومستويات البروتين. هذه العلاقة المفترضة هي الأساس للعديد من تجارب تحديد الملفات النصية ، والتي غالبًا ما تستند إلى تحليل ميكروأري لتحديد الجينات التي يتم تنظيمها صعودًا وهبوطًا في ظل الظروف العادية أو المرضية. الافتراض الأساسي هو أن الاختلافات في مستويات الرنا المرسال تتجلى في أنماط ظاهرية مختلفة نتيجة للاختلافات في مستويات البروتين. وفقًا لذلك ، تم العثور على الارتباطات بين التعبير التفاضلي لـ mRNAs محددة والبروتينات المقابلة في العديد من الدراسات [1] ، والتي ثبت أن العديد منها لها صلة بيولوجية واضحة [2 ، 3]. وجدت العديد من الدراسات أيضًا ارتباطات عامة مهمة بين مستويات الحمض النووي الريبي ومستويات البروتين [4-10] ، وعادةً ما تستخدم بيانات عن وفرة الحمض النووي الريبي المكتسبة من منصات مثل المصفوفات الدقيقة والتحليل التسلسلي للتعبير الجيني (SAGE) ، جنبًا إلى جنب مع بيانات وفرة البروتينات المقابلة المشتقة من تحليلات قياس الطيف الكتلي (MS).

كانت الاستنتاجات الرئيسية المستخلصة من هذه الدراسات هي أن هناك ارتباطات عامة مهمة بين مستويات أنواع الحمض النووي الريبي ومنتجات البروتين المقابلة ، ولكن أيضًا تباينًا كبيرًا في هذه الارتباطات. على سبيل المثال ، وجد Lu et al ارتباطات مهمة بين مستويات RNA والبروتين 0.66 و 0.48 في كائنين بسيطين أحادي الخلية (الخميرة و الإشريكية القولونية [8]) ، ولكن الدلائل تشير إلى أن عدد البروتينات لكل نسخة تختلف بشكل كبير. في الدراسة المذكورة ، تم استخدام بيانات MS ومصنف مدرب للحصول على تقديرات دقيقة لوفرة البروتين في العينات المعقدة ، واستخدمت المصفوفات الدقيقة لتحديد مستويات الحمض النووي الريبي ، واستخدمت منتجات 346 و 437 جينًا في الخميرة و بكتريا قولونية تحليلات الارتباط ، على التوالي. علاوة على ذلك ، في دراسة نُشرت في عام 1999 ، قام Gygi et al بالتحقيق في 150 جينًا باستخدام بيانات SAGE و 2D-gels و MS ، ووجدوا ارتباطًا قدره 0.91 لجميع الجينات التي تم تحليلها ، ولكن عندما تم استبعاد عدد قليل من منتجات RNA المعبر عنها بشكل كبير والبروتين. انخفض إلى 0.36 [7].

وبالمثل ، في تحليل لخطوط خلايا NCI-60 استنادًا إلى RNA ومصفوفات بروتين المرحلة العكسية ، وجد Shankavaram وآخرون ارتباطًا متوسطًا مهمًا بين مستويات RNA والبروتين ، وأظهروا أن الارتباطات كانت أقوى إلى حد كبير بالنسبة لبعض فئات الجينات من غيرها. ]. ووجدوا أيضًا أن توزيع معاملات الارتباط ثنائي النسق لمجموعة واحدة من المنتجات الجينية متوسط ​​ارتباط 0.71 ، بينما كان لدى مجموعة أخرى ارتباط متوسط ​​قدره 0.28. علاوة على ذلك ، أشار تحليل إثراء موضوع علم الوجود الجيني إلى أن الجينات ذات الارتباطات العالية كانت متورطة بشكل أساسي في صيانة العمليات الخلوية والخصائص الهيكلية. أظهر Greenbaum وآخرون أيضًا أن منتجات الجينات المرتبطة بخصائص معينة ، مثل مؤشرات التكيف العالية لـ Codon (CAI) و / أو الإشغال الريبوزومي ، يبدو أن لها ارتباطات أعلى بكثير مع البروتينات المقابلة من المجموعة الرئيسية للمنتجات الجينية [11].

وهكذا ، تم الحصول على بيانات مثيرة للاهتمام حول درجات الارتباط بين الرنا المرسال ومستويات البروتين في الكائنات الحية المختلفة ، وتم اكتشاف اختلافات مثيرة للاهتمام في هذا الصدد بين مجموعات مختلفة من الجينات. ومع ذلك ، على الرغم من أن مرض التصلب العصبي المتعدد يمكن أن يوفر بيانات كمية ، فقد كان عنق الزجاجة في تحليلات أعداد كبيرة من المنتجات الجينية. ومن ثم ، على الرغم من تحليل عدة مئات من المنتجات الجينية في بعض الدراسات المذكورة ، إلا أنها لا تزال تغطي نسبًا صغيرة من إجمالي الجينومات التي تم تحليلها ، لذلك يجب التعامل مع الاستنتاجات العامة ببعض الحذر. وبالتالي ، لم يتم بعد تحديد الأنماط العامة للارتباط بين الرنا المرسال ومستويات البروتين بشكل كامل ، مما أثار تساؤلات حول صحة مقارن mRNA على نطاق واسع وتنميط التعبير البروتيني ، والأنماط العالمية الحقيقية للعلاقات بين مستويات mRNAs والبروتينات المشفرة بواسطة محدد. الجينات لا يزال يتعين توضيحها. لذلك ، في محاولة لمقارنة مستويات الرنا المرسال والبروتين على نطاق أوسع ، قمنا بتحليل ملفات تعريف التعبير عن الحمض النووي الريبي والبروتين ، باستخدام بيانات مجموعة الحمض النووي الريبي (كدنا) وبيانات صفيف أوليجو بالاقتران مع البيانات الكيميائية المناعية ، في 23 خطًا من الخلايا البشرية


نتائج

التعبير الجيني حسب النوع

يتضمن تحليل البيانات لدينا ثلاث مجموعات بيانات RNA-seq أحادية الخلية للبويضة ، ولكل منها ثلاث عينات: بيانات أسماك الزرد التي تم إنشاؤها بواسطة مجموعتنا (ZF) ، ومجموعة البيانات البشرية 1 (H1) [12] ومجموعة البيانات البشرية 2 (H2) [13] . في الشكل 1 ، نعرض توزيع النصوص لكل مليون (TPM) لكل عينة من العينات التسع المستخدمة في تحليلنا. كما هو متوقع ، أظهرت معظم الجينات تعبيرًا منخفضًا جدًا أو عدم وجود تعبير في المتوسط ​​75 و 65 و 45٪ من الجينات لديها صفر TPM ، و 87 و 80 و 61٪ من الجينات لديها أقل من TPM واحد في H1 و H2 و ZF على التوالي. كانت النسبة الأصغر من الجينات ذات التعبير القليل أو معدوم في الزرد ترجع إلى انخفاض عدد الجينات الخادعة المحددة في جينوم الزرد ، والتي تميل إلى الحصول على مهام قراءة منخفضة. في البيانات التكميلية (الملف التكميلي 1) ، نقوم بتفكيك توزيع TPM لكل من العينات التسع (3 عينات تأتي كل منها من مجموعات البيانات الثلاثة) بناءً على 46 و 30 نوعًا من الجينات الموصوفة في الإنسان وسمك الزرد ، على التوالي.

توزيع النصوص لكل مليون (TPM) للعينات التسع المستخدمة في تحليلنا: يتم تقسيم قيم TPM إلى خمس فترات زمنية لكل عينة ويتم عرض عدد الجينات في كل فترة. يشار إلى التكرارات البيولوجية بأحرف صغيرة ، أ ، ب ، ج. يتبع ترتيب العينة مجموعتي البيانات البشرية (H1 و H2) متبوعين بمجموعة بيانات أسماك الزرد (ZF)

حوالي 88 ٪ من وفرة الجينات تأتي من جينات ترميز البروتين في الإنسان (90 ٪ لمجموعات بيانات H1 و 86 ٪ لمجموعات بيانات H2) ، بينما في الزرد ، هذه النسبة حوالي 79 ٪. في الإنسان ، تأتي معظم وفرة الجينات غير المشفرة من الحمض النووي الريبي الريبوزومي للميتوكوندريا (Mt-rRNAs) والـ RNAs طويلة المدى غير المشفرة (lincRNAs). في أسماك الزرد ، تكون وفرة lincRNA أقل أهمية حيث تأتي معظم وفرة الجينات غير المشفرة من Mt-rRNAs و rRNAs (ملف إضافي 1).

التعبير الجيني المتعامد

هناك 18388 زوجًا جينيًا متعامدًا محددًا بين الكائنات الحية في قاعدة بيانات Ensembl. تتضمن أزواج الجينات هذه تعيينات من متعدد إلى كثير ، أي أن جينًا بشريًا واحدًا قد يكون متعامدًا لأكثر من جين واحد من أسماك الزرد وقد يكون هناك أكثر من جين بشري متعامد لنفس جين الزرد. تشتمل أزواج الجينات المتعامدة البالغ عددها 18388 على 13963 جينًا بشريًا و 16546 جينًا لأسماك الزرد. تصنف قاعدة بيانات Ensembl أزواج الجينات المتعامدة على أنها تقويم تقويمي عالي الثقة ومنخفض الثقة. هناك 9809 زوجًا جينيًا متعامدًا عالي الثقة بين الكائنات الحية ، ويشتمل هذا التعيين على 9020 جينًا بشريًا و 9495 جينة من أسماك الزرد. في الشكل 2 ، نلخص أنواع الجينات المشاركة في رسم خرائط تقويم العظام ومستويات ثقتها. ما يقرب من 60 ٪ من جينات ترميز البروتين البشري لها جين متعامد من أسماك الزرد.

أنواع الجينات التي تشكل زوجًا متعامدًا بين الإنسان وسمك الزرد

من أجل تحديد التعبير عن الجينات المتعامدة بين الكائنين ، حددنا أولاً الجينات "المعبر عنها" في مجموعة البيانات على أنها الجينات التي لها قيمة TPM أعلى من واحد في جميع التكرارات البيولوجية الثلاثة المستخدمة في مجموعة البيانات. نتج عن ذلك 5753 و 9917 و 12383 جينًا تم التعبير عنها في مجموعات البيانات H1 و H2 و ZF ، على التوالي. كان هناك 5443 جينًا شائعًا في قوائم الجينات المعبر عنها لمجموعتي البيانات البشرية التي تظهر

95٪ تداخل بينهما. قمنا بعد ذلك بتقسيم الجينات المعبر عنها في كل مجموعة بيانات إلى 10 كميات ، أي أن القيمة الأولى تتكون من أعلى 10٪ من الجينات الأكثر تعبيرًا في مجموعة البيانات ، وما إلى ذلك. قارنا الجينات في كل مجموعة بيانات عبر أزواج من مجموعات البيانات ، وهو ما قمنا به يسمى "التعيين الكمي". في الشكل 3 ، نعرض نتائج التعيين لكل من المقارنات الزوجية الثلاثة وفي البيانات التكميلية (الملف التكميلي 2) ، نعرض الجينات في كل خلية من الخلايا الموضحة في الشكل 3 مع التعليقات التوضيحية المقابلة ، إشارة مستوى العينة القيم و z-scores. أثناء التعيين الكمي بين مجموعات البيانات البشرية وأسماك الزرد ، نظرنا فقط في الجينات التقويمية عالية الثقة التي تحتفظ بالحالات التي تقدم تعيينات متعدد إلى كثير كما هو موضح أعلاه.

التعيين الكمي بين أزواج مجموعات البيانات: (أ) H1 مقابل ZF، (ب) H2 مقابل ZF و (ج) H1 مقابل H2. لكل رسم خرائط ، تُظهر خريطة الحرارة عدد الجينات الشائعة في كل كمية. عبر تعيينات الكائن الحي (أ و ب) ، الصف 11: الجينات التي يتم التعبير عنها في سمك الزرد ، لها أخصائي تقويم ذو ثقة عالية في الإنسان ، ولكن لا يتم التعبير عنها في الصف 12 البشري: الجينات التي يتم التعبير عنها في سمكة الزرد ولكن ليس لها أخصائي تقويم عالي الثقة في العمود البشري 11: الجينات التي يتم التعبير عنها في الإنسان ، لها أخصائي تقويم عالي الثقة في سمك الزرد ، ولكن لا يتم التعبير عنها في الزرد العمود 12: الجينات التي يتم التعبير عنها في الإنسان ولكن ليس لديها تقويم تقويم عالي الثقة في الزرد. لرسم خرائط H1-H2 ، يحدد الصف / العمود 11 الجينات التي يتم التعبير عنها في مجموعة واحدة فقط من مجموعات البيانات. لكل مقياس ، نعرض أيضًا متوسط ​​قيمة TPM الموضحة في أشرطة قيمة البيانات بخلفية صفراء. في (د) ، نلخص التداخل بين أعلى 30٪ من المعبر عنها بدرجة عالية (3 × 3 الزاوية اليسرى العلوية للتعيينات الكمية في أ و ب) الجينات التي تعتبر أخصائيو تقويم عالية الثقة عبر الكائنين لمجموعات البيانات H1 و H2

يُظهر التعيين الكمي بين H1 و H2 أن التشابه بنسبة 95٪ بين مجموعتي الجينات يتبع أيضًا نفس توزيع TPM حيث يتم ملاحظة أرقام التعيين الكبيرة على طول قطري (الشكل 3 ج). لذلك ، لا نرى فقط تداخلًا كبيرًا بين الجينات المعبر عنها في مجموعتي البيانات البشرية ، ولكن يتم التعبير عن هذه الجينات أيضًا في نفس المستويات النسبية تقريبًا في مجموعتي البويضات ، مما يؤكد جودة مجموعات البيانات. تشير نتائجنا للتعيينات عبر الكائنات الحية إلى أن أكثر من 50 ٪ من الجينات المعبر عنها في البويضة البشرية لها تقويم تقويم يتم التعبير عنه أيضًا في بويضة الزرد: 3174 لـ H1 و 5057 لـ H2 (البيانات غير معروضة). عندما يتم أخذ خبراء تقويم العظام ذوي الثقة العالية في الاعتبار فقط ، فإن هذه الأرقام تنخفض إلى 2314 لـ H1 و 3657 لـ H2 ، وهو ما يمثل

40٪ من الجينات المعبر عنها في البويضات البشرية (الشكل 3 أ ، ب). ومع ذلك ، الأهم من ذلك ، أن هذه الجينات تتركز في المنطقة العلوية اليسرى من خريطة الحرارة لرسم الخرائط الكمية. بعبارة أخرى ، تُظهر نسبة أعلى من الجينات التي يتم التعبير عنها بشكل كبير في كلا الكائنين تقويمًا عاليًا للثقة مقارنة بالجينات الأقل تعبيرًا. على سبيل المثال ، عند مقارنة H1 بـ ZF ، يتم توزيع الجينات التقويمية عالية الثقة 2314 إلى 10 × 10 = 100 خلية رسم خرائط كمية (الشكل 3 أ). لذلك ، في المتوسط ​​، نتوقع

23 جينة لتكون في كل خلية لتوزيع عشوائي. ومع ذلك ، فإن الخلية العلوية اليسرى ، والتي تمثل الجينات الموجودة ضمن أعلى 10٪ في مجموعتي البيانات وهما أطباء تقويم ذوو ثقة عالية ، على سبيل المثال ، بها 113 جينًا. هذا حدث مهم للغاية (ص & lt 10-21 ، اختبار فيشر الدقيق) يوضح أن الجينات التقويمية عالية الثقة يتم التعبير عنها بشكل متزامن بشكل كبير في بويضات الكائنات الحية.

ملاحظة مماثلة تنطبق على H2. من بين 3657 جينًا تم التعبير عنها في H2 مع أخصائي تقويم عالي الثقة في أسماك الزرد التي يتم التعبير عنها أيضًا في ZF ، فإن 151 جينة في أعلى 10 ٪ في الكائنات الحية (ص & LT 10-25). لا تنطبق أهمية الحدوث هذه فقط على الخلية العلوية اليسرى في التعيين الكمي ولكن للمنطقة العلوية اليسرى أيضًا. على سبيل المثال ، إذا ركزنا على الزاوية العلوية اليسرى 3 × 3 من نتائج التعيين الكمي ، أي الجينات التقويمية عالية الثقة التي يتم التعبير عنها في أعلى 30٪ في كل من الكائنات الحية ، فإننا نرى 425 جينًا معينًا لـ H1 (ص & lt 10-12) وتم تعيين 668 جينًا لـ H2 (ص & LT 10-14). من ناحية أخرى ، من الجينات التي يتم التعبير عنها في البويضة البشرية ولديها أخصائي تقويم عالي الثقة في الزرد (2812 لـ H1 و 4524 لـ H2 الشكل. 3 أ ، ب) ، لم يتم التعبير عن حوالي الخمس فقط في بيضة الزرد (575 لـ H1 و 997 لـ H2 الشكل 3 أ ، ب). تشكل الجينات التي يتم التعبير عنها في البويضة البشرية والتي لديها أخصائي تقويم عالي الثقة في أسماك الزرد العدد الإجمالي للجينات البشرية "الفريدة" في التعيين الكمي الذي يمتد على الصفوف 1-10 والأعمدة 1-11. من بين هؤلاء ، الجينات البشرية الفريدة في العمود 11 هي تلك التي لم يتم التعبير عنها في سمك الزرد (الشكل 3 أ ، ب الملف التكميلي 2).

جينات متعامدة متطابقة للغاية

أظهرت الجينات 425 و 668 التي تعتبر أخصائي تقويم عالي الثقة بين الكائنين وظهرت في أعلى 30٪ من فئة التعبير لـ ZF وكذلك لمجموعات البيانات H1 و H2 ، على التوالي ،

93 ٪ تداخل ، أو 397 جينًا (الشكل ثلاثي الأبعاد ، الملف التكميلي 3). استنادًا إلى متوسط ​​TPM للعينات التسع ، نعرض في الجدول 1 أعلى 25 جينة من أصل 397 جينًا نسميها "جينات متقابلة للغاية." في هذا الجدول ، نعرض فقط الممثل الأعلى لمجموعة الجينات ، على سبيل المثال ، "سيتوكروم سي أوكسيديز المشفر بالميتوكوندريا" أو "بروتين الريبوسوم".

من أجل تقييم التشابه بين مجموعات البيانات الثلاث ، أجرينا التجميع الهرمي وتحليل المكونات الرئيسية (PCA) للعينات التسع باستخدام 397 من الجينات المتعامدة المتوافقة للغاية. تُظهر النتائج الموضحة في الشكل 4 أن مجموعتي البيانات البشريتين أكثر تشابهًا مع بعضهما البعض مقارنةً بمجموعة بيانات أسماك الزرد. ومع ذلك ، لا يختلف هذا التشابه اختلافًا كبيرًا لأن ارتفاع التفرع الهرمي بين مجموعتي البيانات البشرية يكاد يكون كبيرًا مثل التفرع بين مجموعات البيانات البشرية وأسماك الزرد. يتضح هذا أيضًا في مخطط PCA نظرًا لأن مجموعات البيانات الثلاث تكاد تكون متساوية البعد عن بعضها البعض. لم يُبلغ تحليل ANOSIM الخاص بنا عن اختلاف كبير بين أزواج مجموعات البيانات (R

0.8, ص & lt 0.1) بينما ظلت المقارنة ثلاثية الاتجاهات كبيرة (R = 0.93 ، ص & lt 0.005). ولوحظت نتيجة مماثلة في تحليل أدونيس (الزوجي R 2

0.71, ص & lt 0.1 ثلاثي الاتجاه R 2 = 0.87 ، ص & lt 0.005). على الرغم من أنها من كائن حي مختلف ، إلا أن المسافة بين مجموعة بيانات أسماك الزرد ومجموعتي البيانات البشرية لم تكن مختلفة كثيرًا عن المسافة بين مجموعتي البيانات البشرية. تشير هذه النتائج إلى أنه بناءً على الجينات المتعامدة المتوافقة للغاية ، تظهر البويضات الزرد والبويضات البشرية تشابهًا نسبيًا حيث لا يتم توضيح الاختلافات العضوية المتوقعة.

عينة تشابه بين البويضات: (أ) المجموعات الهرمية و (ب) تحليل المكونات الرئيسية (PCA) من 9 عينات باستخدام 397 من الجينات المتعامدة المتوافقة للغاية. في (ب) ، يظهر التباين في النسبة المئوية الموضح بواسطة كل جهاز كمبيوتر بين قوسين

التحليل الوظيفي للجينات المتعامدة

استخدمنا Ingenuity® Pathway Analysis (IPA) (Ingenuity Systems ، Redwood City ، CA) لتحليل 397 من الجينات المتعامدة المتوافقة بدرجة كبيرة والتحقيق في المسارات الكنسية ، والتأثيرات النهائية (الوظائف) ، والمنظمين المنبعين ، وتأثيرات المنظم ، وشبكات التفاعل. يتم فهرسة نتائج IPA الكاملة في البيانات التكميلية (ملف إضافي 3). في الشكل 5 ، نقدم أعلى الأعضاء في كل فئة جنبًا إلى جنب مع الوظائف المرتبطة بها ، وهو ملخص تم إنشاؤه بواسطة IPA يدمج الفئات التفصيلية ذات الأهمية القصوى الواردة في الملف التكميلي 3. في البيانات التكميلية ، نقدم مسار إشارات EIF2 ، نتائج منظم المنبع لـ MYCN و HNF4A ، جنبًا إلى جنب مع الجزيئات المستهدفة ، وشبكة تفاعل جيني واحدة تسلط الضوء على الجينات المشاركة في التطور الجنيني (الأشكال التكميلية 1 و 2 و 3 و 4).

ملخص نتائج IPA على أساس 397 جينة تقويمية متطابقة للغاية. أ, ب أهم الوظائف الحيوية والمسارات الكنسية الأكثر إثراءً التي تم تحديدها بواسطة IPA. تمثل الأشرطة عدد الجينات في الفئة الوظيفية أو المسار المتعارف عليه (المحور y الأساسي) ويمثل الخط البرتقالي أهمية الفئة أو المسار في -Log (ص-القيمة) (المحور ص الثانوي). ج منظمات المنبع التي تستهدف جزءًا كبيرًا من الجينات في قائمة المدخلات. تمت الإشارة إلى حالات التنشيط المستنتجة للمنظمين بناءً على التعبير المرصود لأهدافهم (على سبيل المثال ، قد يشير التعبير المتزايد في الأهداف التي يسببها المنظم إلى حالة "تنشيط" للجهة التنظيمية). N / A تعني حالة تنشيط غير حاسمة للجهة المنظمة. د عدد الجينات والوظائف البيولوجية الناشئة في شبكات التفاعل المستنتج التي تتضمن جينات المدخلات. ه مجموعات من المنظمين مع مجموعة جينات مستهدفة مجمعة تُظهر إثراءًا متوافقًا في الوظائف البيولوجية. تمثل القضبان العدد الإجمالي للجينات المستهدفة من قبل كل مجموعة من المنظمين. في كل شريط ، يتم ملاحظة الوظائف البيولوجية التي يتم إثرائها بشكل كبير بواسطة الجينات المستهدفة

قمنا أيضًا بتحليل 397 جينة تقويمية شديدة التوافق باستخدام قاعدة بيانات EpiFactors [14] لاستنتاج أدوارها في التنظيم اللاجيني. في الجدول 2 ، قمنا بإدراج الـ 36 جينًا التي تم تحديدها في EpiFactors على أنها ذات وظيفة جينية. في البيانات التكميلية (الملف التكميلي 3) ، نقوم بإدراج النتائج التفصيلية لتحليل EpiFactors.

توصيف مجموعة بيانات البويضات الفردية

من أجل تحديد التشابه الوظيفي في مجموعات البيانات الثلاث بغض النظر عن علم تقويم العظام ، أجرينا تحليلًا مقارنًا على مستوى الأنظمة. لهذا الغرض ، حددنا الجينات "المعبر عنها بشدة" في كل مجموعة بيانات على أنها الجينات التي لها درجة z (بناءً على قيمة TPM المسجلة للجينات "المعبر عنها") أكبر من 1.5 في اثنين من التكرارات الثلاثة في كل دراسة. نتج عن ذلك 460 H1 و 761 H2 و 901 من جينات ZF (ملف إضافي 4) ومجموعتي البيانات البشرية تحتويان على 384 (

84٪) جينات معبر عنها بدرجة عالية مشتركة.

قمنا بتحليل كلٍ من قوائم الجينات الثلاث المعبر عنها بشكل كبير بشكل منفصل مع قاعدة البيانات الخاصة بالتعليقات التوضيحية والتصور والاكتشاف المتكامل (DAVID v6.8) [15] لتحديد مسارات موسوعة كيوتو المخصبة للجينات والجينومات (KEGG) [16] والعملية البيولوجية (BP) والوظيفة الجزيئية (MF) والمكون الخلوي (CC) فئات الأنطولوجيا الجينية (GO) [17]. يتم تضمين النتائج التفصيلية في البيانات التكميلية (ملف إضافي 4). في الشكل 6 ، نسرد نتائج تحليل مسار تخصيب KEGG. أشارت نتائجنا إلى أن مجموعتي البيانات البشرية أظهرت تشابهًا شديدًا كما هو متوقع علاوة على ذلك ، كان هناك تشابه كبير بين مجموعات بيانات الزرد والإنسان أيضًا. في المتوسط ​​، تم إثراء حوالي 65 ٪ من الفئات المخصبة بشكل كبير في مجموعة بيانات أسماك الزرد بشكل كبير في مجموعات البيانات البشرية.

مسارات KEGG المخصبة بشكل كبير استنادًا إلى التحليل الوظيفي لـ DAVID باستخدام الجينات التي يتم التعبير عنها بشكل كبير في مجموعات البيانات الفردية. تمثل الأشرطة عدد الجينات المعبر عنها بدرجة عالية في المسار لكل مجموعة بيانات

التعبير الجيني الخاص بالبويضات

على الرغم من أننا نلاحظ توافقًا كبيرًا في الجينات المعبر عنها بشكل كبير عند النظر في الجينات المتعامدة ، فمن الممكن أن يتم التعبير عن الجينات المهمة وظيفيًا ، على سبيل المثال ، الجينات المهمة في التطور المبكر ، عند مستويات أقل في البويضة. لقد حددنا سابقًا الجينات الخاصة بالبويضات البشرية من خلال مقارنة البويضات الطورية الثانية بمرجع يتكون من مزيج من إجمالي الحمض النووي الريبي من 10 أنسجة بشرية طبيعية مختلفة لا تشمل المبيض [18]. يمكن التعبير عن هذه الجينات بكميات أقل عند النظر في جميع الجينات المعبر عنها في البويضة ، ولكن قد تظل لها أهمية وظيفية.

استكشفنا التعبير عن تلك الجينات الخاصة بالبويضات البشرية ، والتي تم تعيينها لـ 3493 معرّفًا فريدًا لجينات المجموعة ، في جميع مجموعات البيانات الثلاثة من خلال تحديدها على الخرائط الكمية الموضحة في الشكل 3 أ ، ب (الشكل التكميلي 5 ، الملف التكميلي 5). من أصل 3493 جينًا خاصًا بالبويضات البشرية ، 2403 (

87 ٪) تم التعبير عنها أيضًا في H1 و H2 على التوالي. من بين هؤلاء 3493 جينًا بشريًا ، 2864 (

82٪) لديهم ثقة عالية في تقويم العظام في أسماك الزرد و 2251 (

تم التعبير عن 79 ٪) من هذه الجينات البالغ عددها 2864 في أسماك الزرد (أي كانت قيمة TPM أكبر من 1 في جميع التكرارات الثلاثة).

أشارت نتائجنا إلى أن النسبة المئوية للجينات التقويمية ، للجينات المهمة وظيفيًا ، تجاوزت بشكل كبير النسبة المئوية للجينات التقويمية الإجمالية بين الكائنات الحية (

60٪). علاوة على ذلك ، فإن الجينات المهمة وظيفيًا المتعامدة يتم التعبير عنها أيضًا بشكل متزامن بشكل كبير في الكائنين ، وهو ما ينطبق أيضًا على النسخة الكاملة. على سبيل المثال ، احتوت الجينات المتعامدة المهمة وظيفيًا الموجودة في أعلى 3 مستويات من مستويات التعبير في كلا الكائنات الحية (أي أعلى منطقة 3 × 3 من خرائط الحرارة الموضحة في الشكل التكميلي 5)

تم التعبير عن 24٪ من الجينات المتعامدة المهمة وظيفيًا في كل من الكائنات الحية لـ H1 و H2 على التوالي. كانت كلتا الملاحظات ذات دلالة إحصائية (اختبار فيشر الدقيق ص- القيم & lt 10-14 و & lt 10-16 لـ H1 و H2 على التوالي). ومع ذلك ، كانت هناك جينات مهمة وظيفيًا ولكن تم التعبير عنها بمستويات منخفضة في كائنين من الكائنات الحية ، مثل الجينات المتعامدة التي تقع خارج منطقة 3 × 3 الأعلى من خرائط الحرارة في الشكل التكميلي 5. ومع ذلك ، على الرغم من أن بعضها عند مستويات منخفضة ، إلا أن عددًا كبيرًا أظهرت مجموعة فرعية من الجينات المهمة للتطور المبكر (أكثر من 80 ٪ في المتوسط) تقويم العظام والتعبير المتوافق بين الكائنات الحية.


نتائج

لمعالجة مشكلة الضعف الإقليمي مع تطور المرض ، مع الأخذ في الاعتبار أيضًا مدى تعقيد مرض الزهايمر ، أجرينا مقارنة كبيرة على مستوى الجينوم للتعبير الجيني CA1 و CA3 في دماغ الأفراد المصابين بمرض الزهايمر المتقدم والضوابط غير المصابين بالخرف باستخدام Illumina المصفوفات الدقيقة البشرية HT-12. كان الغرض من تصميم هذه الدراسة متعدد الجوانب: أولاً ، تحديد الجينات التي تظهر ارتباطًا بالمناطق المعرضة للإصابة بمرض الزهايمر ثانيًا ، لتحديد العلاقة بين المنطقة والمرض باستخدام التعبير الجيني ثالثًا ، لتجميع نتائج العديد من الدراسات السابقة. من التصميم المتباين الذي يأتي بنتائج غير متسقة على ما يبدو رابعًا ، لتحديد كيفية تغير تكوين أنواع الخلايا في قرن آمون مع تقدم الزهايمر الخامس ، لتحديد الجينات التي تميز العلامات المبكرة والمسبقة لتطور مرض الزهايمر ، وأخيرًا ، لتوفير مورد للتعبير الجيني للعلماء المهتمين. تم إيداع البيانات التي تمت مناقشتها في هذا المنشور في GEO الخاص بـ NCBI [21] ويمكن الوصول إليها من خلال رقم الانضمام إلى سلسلة GEO GSE29378.

لتقليل احتمالية التحيز الجماعي ، تمت مطابقة عينات الدماغ من الأفراد المصابين بمرض الزهايمر المتوسط ​​إلى الحاد (مجموعة المرض N = 17) حسب الجنس والعمر وفاصل ما بعد الوفاة (PMI) مع الأفراد الذين يظهرون القليل من العجز الإدراكي أو لا يعانون منه (مجموعة التحكم N = 16) ، قدر الإمكان (الجدول 1 ، ملف إضافي 1). علاوة على ذلك ، تم توزيع العينات بشكل عشوائي على المصفوفات الدقيقة للحد من تأثيرات الدُفعة. لا يكشف التجميع البسيط للمصفوفات عن عوامل مربكة مهمة: تجمع العينات حسب الفرد ، ولكن ليس حسب الدُفعة أو بنك الدماغ أو الموقع على المصفوفة أو PMI أو الجنس أو العمر (الشكل S1 في ملف إضافي 6). باستثناء بروتينات الصدمة الحرارية ، لم تظهر أي من فئات GO إثراءًا كبيرًا للجينات المعبر عنها تفاضليًا مع الدُفعة أو بنك الدماغ أو الموقع على المصفوفة أو PMI ، مما يشير أيضًا إلى أن نتائجنا يتم التحكم فيها بشكل صحيح لعوامل مربكة محتملة.

يتم التعبير عن الجينات تفاضليًا مع المرض أو المنطقة

حددنا أولاً الجينات التي أظهرت تعبيرًا تفاضليًا مع تطور المرض (الجينات "المتغيرة بالمرض") في CA1 و CA3 بشكل منفصل ، ثم قمنا بتعليق قوائم الجينات هذه باستخدام EASE [23]. في CA1 ، وجدنا أن الجينات المرتبطة بالنقل المتشابك وإشارات الخلية الخلوية تميل إلى إظهار تعبير منخفض مع AD ، بينما تميل الجينات المرتبطة بموت الخلايا وتكاثر الخلايا إلى إظهار تعبير متزايد (الجدول 2 للحصول على قائمة كاملة من الجينات المعبر عنها تفاضليًا ، انظر الملف الإضافي 2). حددت EASE أيضًا مسارين محددين يظهران زيادة التعبير مع تقدم AD - سلسلة MAPKKK ومسار إشارات عامل النمو المحول ß. كلاهما سبق أن تورط في تقدم AD [35 ، 36]. شوهدت تغييرات مماثلة في CA3 ومع ذلك ، فهي أقل دراماتيكية (الشكل S2A في الملف الإضافي 6) ، وهو ما يتوافق مع الضعف الأقل (الحماية النسبية) لهذه المنطقة للتنكس العصبي المرتبط بمرض الزهايمر مقارنةً بـ CA1.

حددنا بعد ذلك الجينات المخصبة إما في CA1 أو CA3 (جينات "المنطقة المخصبة") في الضوابط. نظرًا لأنه تم جمع كلتا المنطقتين من أقسام نسيج متطابقة ، مما أدى إلى إزالة مصدر رئيسي للتنوع ، فقد حددنا جينات معبر عنها تفاضليًا أكثر من التحليل المرتبط بالمرض. نجد أن قائمة الجينات المخصبة في CA3 تُظهر تمثيلاً زائداً للجينات المشاركة في الانتقال المشبكي ، وربط بروتين الهيكل الخلوي ، والتخليق الحيوي للكوليسترول (الجدول 2 ، ملف إضافي 2). في حالة الجينات المخصبة CA1 ، نجد التمثيل الزائد للجينات المتعلقة بنقل الإشارة ، والاستجابة المناعية ، وحركة الخلية (الجدول 2 ، ملف إضافي 2). ومن المثير للاهتمام أننا وجدنا أيضًا المخصب في الميتالوثايونين ، وهي مجموعة من البروتينات المرتبطة بالمعادن الثقيلة التي سبق أن تورطت في الشيخوخة ومرض الزهايمر [37]. عندما نجري تحليل إثراء المنطقة المتطابق في المجموعة AD ، نرى نتائج مماثلة كما هو الحال مع عناصر التحكم ، ومع ذلك ، فإن عددًا أقل من الجينات يفي بالأهمية (الشكل S2B في ملف إضافي 6). يتوافق هذا التوهين في الجينات المخصبة بالمنطقة مع المرض مع النتائج السابقة في نقص التروية [30] ، ولا يرجع إلى التباين المتزايد في عينات الزهايمر ، حيث لا تختلف الانحرافات المعيارية للجينات المعبر عنها تفاضليًا في الضوابط عنها في الزهايمر.

لتحديد الجينات التي أظهرت أهم تغيرات في التعبير الجيني ، قمنا بتحسين قوائمنا الخاصة بالجينات المعدلة بالمرض والمُغَزَّزة بالمنطقة ، من خلال تضمين الجينات ذات التغيير الطي و gt1.4 أولاً ، ثم فرز كل قائمة حسب ص- القيمة (يتم عرض الجينات العشرة الأولى لكل مقارنة في الجدول 3). من المعروف بالفعل أن العديد من هذه الجينات لها دور في مرض الزهايمر. على سبيل المثال ، ارتبطت المستويات العالية من α1-antichymotrypsin (منتج بروتين SERPINA3) في بلازما الدم بزيادة خطر الإصابة بالخرف [38]. وبالمثل ، تم العثور على S100A6 لإظهار زيادة التعبير في كل من المادة البيضاء وكذلك مجموعة فرعية من الخلايا النجمية التي تحيط لويحات الأميلويد في كل من البشر ونموذجين من الفئران المعدلة وراثيًا للإصابة بمرض الزهايمر ، مما يشير إلى أن هذا الجين قد يلعب دورًا في أمراض الأعصاب ميلادي [39].

أخيرًا ، أكدنا الاتجاه و FC لثمانية من هذه الجينات شديدة التغير أو المخصبة بالمنطقة بواسطة qRT-PCR (جينات المواد والأساليب بالخط العريض في الجدول 3) ، وبالتالي التحقق من صحة المقطع العرضي لنتائج ميكروأري لدينا بواسطة مستقل طريقة.

في السيليكو يظهر التحقق التوافق بين دراسات ميكروأري لمرض الزهايمر

واحدة من القضايا الرئيسية مع تحليلات ميكروأري ، بشكل عام ومع الزهايمر بشكل خاص ، هو الافتقار الواضح للاتفاق بين الدراسات ذات التصميم المماثل الذي يتم التعبير عن الجينات بشكل مختلف ، مما أدى إلى حدوث ارتباك وغموض في هذا المجال. لمعالجة هذه المشكلة ، قمنا بتقييم مدى اتساق نتائجنا مقارنة بالدراسات السابقة التي وجدت إما جينات خاصة بالمنطقة تحت السيطرة أو جينات متغيرة المرض في CA1 ، عن طريق قياس عدد هذه الجينات التي تغيرت في الاتجاه الذي تنبأت به نتائجنا. قمنا أولاً بمقارنة نتائجنا الإقليمية بدراستين سابقتين للحُصين - واحدة على الفئران [29] والأخرى على الإنسان [31]. عندما نقوم بتضمين الجينات فقط في دراستنا إما بالتعبير العالي (متوسط ​​التعبير & GT1000) أو مستويات عالية من التعبير التفاضلي (ص & lt 0.005) ، وبالتالي تحسين فصل الإشارة عن الضوضاء ، وجدنا اتفاقًا مثاليًا تقريبًا بين دراستنا وكلا الدراستين السابقتين (الشكل 1 أ). حتى عندما نخفض عتبة ما نعتبره جينات معبر عنها تفاضليًا (ص & lt 0.05) وجدنا مستوى عالٍ جدًا من الاتفاق (86٪). يتم عرض أمثلة محددة للاتفاق بين الدراسات في الشكل 1 ب. كعنصر تحكم إضافي ، قمنا بمقارنة نتائجنا مع نتائج أطلس ميكروأري حديث للتعبير الجيني للدماغ البشري [40] ، وإيجاد ارتباط كبير لتغيرات الطية CA3 / CA1 (R = 0.44 ، ص

0) ، جنبًا إلى جنب مع العديد من الجينات المشتركة المخصبة بالمنطقة في كلتا الدراستين (الشكل 1 ج الشكل S3 في ملف إضافي 6 ملف إضافي 3). وبالمثل ، عندما نقارن نتائج المرض لدينا بدراسة سابقة لـ CA1 في تشغيل AD باستخدام تصميم مماثل [3] ، نجد توافقًا كبيرًا ، لا سيما عند تضمين الجينات المعبر عنها بشكل كبير والتي يتم التعبير عنها بشكل تفاضلي فقط (الشكل 1 د الشكل S4 في ملف إضافي 6).

نتائج التعبير التفاضلي متوافقة مع الدراسات السابقة. (أ) تظهر الجينات التي تظهر تخصيب CA1 أو CA3 في دراسات سابقة لمرض الزهايمر إثراءً مماثلاً في هذه الدراسة (Lein وآخرون. [29] ، توريس مونيوز وآخرون. (TM) [31]). يُظهر المحور الصادي النسبة المئوية للجينات بنتائج متسقة بين الدراسات. يُظهر المحور السيني المجموعة الفرعية من الجينات المستخدمة: EXP ، "معبر للغاية" (متوسط ​​التعبير و GT1000) SIG ، تعبير تفاضلي "مهم" (ص & lt 0.05) إشارة كبيرة جدًا ، تعبير تفاضلي "شديد الأهمية" (ص & lt 0.005). (ب) مثال على الفأر فى الموقع تم استنساخ التهجين للجينات الشائعة المخصبة CA1 و CA3 من Allen Mouse Brain Atlas (Allen Institute for Brain Science، © 2009 [67]). تمثل الأشرطة مستويات التعبير النسبي في CA1 و CA3 في بياناتنا. تظهر أشرطة الخطأ الخطأ المعياري. (ج) جينات المنطقة المخصبة الشائعة في هذه الدراسة وفي أطلس دماغ آلن البشري [68]. تتوافق النقاط مع نسبة متوسط ​​CA3 مقابل تعبير CA1 في كلتا الدراستين على مقياس log2. راجع أيضًا الشكل S3 في ملف إضافي 6. (د) تظهر الجينات ارتباطات مماثلة للمرض (كما تم قياسها بمرحلة براك) بين هذه الدراسة ودراسة سابقة لتصميم مماثل [3]. يُظهر المحور الصادي ارتباط هذا المقياس عبر الجينات بين الدراسات. المحور السيني المسمى كما في (أ) (الكل ، جميع الجينات). يتم تقديم البيانات المقابلة لجميع الجينات في الشكل الداخلي والشكل S4 في ملف إضافي 6. (هـ) تميل الجينات التي تظهر تغيرًا كبيرًا في المرض في CA1 في ثلاث دراسات سابقة أيضًا إلى التغيير في نفس الاتجاه مع مرض الزهايمر في هذه الدراسة (بلالوك وآخرون. [3] ، كولانجيلو وآخرون. (كولانج) [4] ، ليانغ وآخرون. [20]). تمثل الأشرطة مستوى الاتساق بين نتائجنا والقائمة المصنفة للجينات المعبر عنها تفاضليًا (المحور الصادي). متوسط ​​رتبة الجينات (المحور السيني) مقاييس من 0.5 (نتائج معاكسة تمامًا) إلى 0.5 (متسقة تمامًا) مع فرصة = 0 (انظر المواد والطرق). ص-القيم: *ص & lt 0.05 ** ص & lt 0.006 ، *** ص & lt 0.00001 ، **** ص & اللفتنانت 10-45. (F) تميل الجينات التي تظهر إثراءًا كبيرًا للمنطقة في السيطرة في ثلاث دراسات سابقة إلى إظهار إثراء إقليمي مماثل في هذه الدراسة. وضع الملصقات كما في (هـ) (Newrzella وآخرون. (نيوير) [30]).

قمنا بعد ذلك بتوسيع هذه التحليلات لتشمل جميع الجينات ، بما في ذلك تلك التي تحتوي على تعبير تفاضلي هامشي أكثر بكثير ، في ما مجموعه ست دراسات: ثلاث دراسات تقيم التغييرات مع تقدم AD في CA1 (الشكل 1 هـ) [3 ، 4 ، 20] وثلاثة تجد CA1- و الجينات المخصبة CA3 في السيطرة على الحصين (الشكل 1 و) [29-31]. لقد صنفنا جميع جيناتنا من أكثر جينات CA1 إثراءً إلى أكثرها إثراءً بـ CA3 (أو تلك التي تتناقص مع AD إلى تلك الأكثر زيادة) ، ثم قارننا قوائم الجينات المعبر عنها تفاضليًا من الدراسات السابقة إلى قوائمنا المرتبة (المواد وطرق). بالنسبة إلى 9 مقارنات من أصل 12 ، وجدنا أن توزيع الجينات قد تحول بشكل كبير في الاتجاه المتوقع للتداخل ، وفي المقارنات الثلاثة الأخرى كان اتجاه التغيير لا يزال صحيحًا ، لكنه لم يصل إلى الأهمية (الشكل 1 هـ ، و). بعبارة أخرى ، فإن الجينات المقدمة على أنها غنية بـ CA3 في الدراسات السابقة من المرجح أن يكون لها تعبير أعلى في CA3 أكثر من CA1 في هذه الدراسة ، وبالمثل بالنسبة للأنماط الظاهرية الأخرى. وهكذا وبالرغم من الاختلافات العديدة في التصاميم التجريبية بين الدراسات فإن هذا في السيليكو يشير التحقق من الصحة إلى وجود توافق كبير وغير مقدَّر سابقًا بين الدراسات الجينومية الوظيفية المتعلقة بمرض الزهايمر. تسلط هذه التحليلات الضوء لأول مرة على العديد من الجينات والمسارات الشائعة في التسبب في مرض الزهايمر ، مما يُظهر درجة من التقارب لم يتم تقديرها جيدًا من قبل.

يحدد التفاعل بين المنطقة والمرض العوامل المرتبطة بالضعف الانتقائي

بالإضافة إلى تحديد الجينات المعبر عنها تفاضليًا مع المرض والمنطقة بشكل منفصل ، يمكننا أيضًا تقييم التفاعل بين المرض والمنطقة. بالنظر إلى الطبيعة شديدة التعقيد وغير المتجانسة لمرض الزهايمر ، فمن المحتمل أن تعرض المنطقة لمرض الزهايمر يعتمد جزئيًا على التعبير عن أعداد كبيرة من الجينات بمستويات متفاوتة قليلاً. لمعالجة هذه المشكلة ، كررنا مقارنات التعبير التفاضلي ، هذه المرة دون فصل إما CA1 عن CA3 في تحليلنا للجينات المعدلة بالمرض ، أو التحكم عن AD في تحليلنا للجينات المخصبة بالمنطقة. وجدنا أن الجينات المخصبة في CA3 من المرجح أن تُظهر أيضًا تعبيرًا منخفضًا مع تقدم AD ، بينما من المحتمل أيضًا أن تظهر الجينات المخصبة في CA1 تعبيرًا متزايدًا مع تقدم AD (الشكل 2 أ). على سبيل المثال ، بينما NCALD يُظهر انخفاضًا في التعبير عن مرض الزهايمر في منطقتي الدماغ ، ولم تنخفض مستويات التعبير عن هذا الجين في CA3 في ميلادي حتى دون مستويات CA1 في السيطرة ، في حين أن العكس صحيح بالنسبة لـ GNG5 (الشكل 2 ب). تتوافق نتائجنا مع الفرضية القائلة بأن مناطق الدماغ التي تتمتع بحماية نسبية من أمراض الزهايمر ستميل أيضًا إلى إظهار توقيع تعبير جيني أقل شذوذًا في الأساس. يتم تقديم قائمة بجميع الجينات التي تظهر تعبيرًا تفاضليًا كبيرًا مع كل من المنطقة والمرض في ملف إضافي 4.

يوفر تصميم الدراسة لكل منطقة على حدة رؤى جديدة لمرض الزهايمر. (أ) يتم رسم إحصائيات المنطقة (المحور السيني) والمرض (المحور الصادي) لكل جين (نقطة) ، جنبًا إلى جنب مع الخط الأنسب. وجدنا علاقة كبيرة بين المرض والمنطقة. يتم عرض عدد هذه الجينات المعبر عنها تفاضليًا مع كل من المنطقة والمرض (الزوايا الأربعة) باللون الرمادي ، مع ص- القيم التي تمثل أهمية الإثراء (باللون الرمادي الداكن) أو الاستنفاد (بخط مائل). تتوافق الخطوط المتقطعة مع تعبير تفاضلي كبير (ص & lt 0.05). (ب) الجينات التمثيلية لكل نمط من أنماط التعبير الجيني حسب المنطقة. يتم عرض المخططات الصندوقية لمستويات التعبير الجيني (المحور الصادي) لكل مجموعة من المجموعات الأربع (المحور السيني): CA1 في التحكم (C1) ، و CA3 في التحكم (C3) ، و CA1 في AD (A1) ، و CA3 في AD (A3). (ج) تُظهر جينات الضعف الأربعة تعبيرًا أعلى في CA1 من CA3 كما تزداد أيضًا مع AD بدرجة أكبر في CA1 مقارنة بـ CA3. وضع العلامات كما في (ب). (د) تُظهر جينات الحماية الثلاثة تعبيرًا أعلى في CA3 من CA1 ويزيد أيضًا مع AD بدرجة أكبر أو ينخفض ​​مع AD إلى درجة أصغر في CA3 مقارنة بـ CA1. لاحظ أن هناك مجسين مهمين لـ UNC13C. وضع العلامات كما في (ب).

للعثور على الجينات التي قد تلعب دورًا في الضعف النسبي لـ CA1 أو حماية CA3 ، أخذنا في الاعتبار الاختلاف النسبي في تغير الطية مع المرض بين مناطق الدماغ هذه. يجب تفسير التسميات الخاصة بنا لجينات "الحماية" و "الضعف" بحبة من الملح ، نظرًا لأن دراسات التحقق المصممة بعناية ضرورية لإظهار العلاقة السببية التي ينطوي عليها المصطلح. تم تطبيق مثل هذه الاستراتيجية سابقًا بنجاح في اكتشاف الجينات المحتملة ذات الصلة بالمرض في مرض الزهايمر [12] والجينات الجديدة الواقية من الأعصاب في الخرف الجبهي الصدغي [41]. وبشكل أكثر تحديدًا ، نتوقع أن يكون لجينات الضعف مستويات تعبير أعلى في CA1 من CA3 وأيضًا لزيادة التعبير إلى حد أكبر في المرض ، في حين يجب أن تظهر الجينات الوقائية النمط المعاكس. بشكل عام ، وجدنا أربعة مرشحين لجينات الضعف المفترضة (ABCA1, MT1H, PDK4 ، RHOBTB3 الشكل 2 ج) وثلاثة مرشحين لجينات الحماية المفترضة (FAM13A1 ، LINGO2 ، UNC13C الشكل 2 د) استيفاء هذه المعايير (المواد والأساليب). ارتبط اثنان من جينات الضعف الأربعة لدينا سابقًا بمرض الزهايمر: MT1H هو عضو في عائلة بروتينات الميتالوثيونين المنظمة للزنك التي تمت مناقشتها سابقًا ، بينما ABCA1 هو منظم رئيسي للكوليسترول يمكن أن يؤثر على تراكم وترسبات الأميلويد (تمت مراجعته في [42]). علاوة على ذلك ، زيادة التعبير عن ABCA1 مع زيادة شدة مرض الزهايمر تم قياسه وظيفيًا وعصبيًا [43]. على الرغم من عدم وجود أي من الجينات الواقية للأعصاب لها دور معروف في مرض الزهايمر ، فقد ارتبط اثنان منها بالحماية العصبية أو اللدونة في سياقات أخرى: لغة 2 ارتبطت بخطر الإصابة بمرض باركنسون وعمر ظهورها [44] ، في حين UNC13C هو جين مرشح للدونة العصبية في الفترة الحرجة في القشرة البصرية [45].

أخيرًا ، للتحقق من صحة التعبير عن UNC13C، أديناها فى الموقع التهجين على الأنسجة من ثلاثة حصين بشري إضافي يظهر عدم وجود أمراض ، معتدلة ، وعالية وفقًا لمراحل Braak و Braak (الشكل S5 في ملف إضافي 6). تمشيا مع مجسات ميكروأري لهذا الجين ، فإن التعبير عن UNC13C يُظهر زيادة التعبير في CA3 بالنسبة إلى CA1 في أنسجة AD مقارنةً بالتحكم. تسلط هذه النتائج الضوء على أهمية تضمين المناطق ذات المستويات المختلفة من الضعف في الدراسات النسخية للسماح بإجراء تقييمات جينية أكثر شمولاً للمرض.

تفسير الاختلافات في نوع الخلية التي تحدث مع تطور المرض

كان أحد المتغيرات المحتملة التي نرغب في استكشافها هو دور اختلافات نوع الخلية الكامنة وراء تغييرات التعبير التفاضلي. على سبيل المثال ، مع التنكس العصبي سيكون هناك فقدان للخلايا العصبية ، وزيادة في الخلايا الدبقية ، وتسلل محتمل للخلايا الالتهابية. لمعالجة هذه المشكلة ، أنشأنا نموذجًا خطيًا يقيس التعبير التفاضلي مع المنطقة والمرض ، والذي يأخذ أيضًا في الاعتبار أربعة أنواع رئيسية من الخلايا في الدماغ باستخدام الانحدار الخطي (المواد والطرق). اخترنا الجينات المستخدمة على نطاق واسع في الأدبيات كعلامات ، والتي تم تصنيفها أيضًا على أنها جينات محورية في دراسات النسخ السابقة للدماغ البشري [14 ، 25] (على الرغم من أننا نلاحظ أن جين علامة الاختيار لا يحدث فرقًا كبيرًا في النتائج). كتحذير ، نشير إلى أن هذا النموذج الخطي يتجاهل العلاقات داخل الذات والنتيجة ص- يجب تفسير القيم فقط على أنها وصفية مقارنة بالمقاييس الاستنتاجية.

بعد حساب نوع الخلية ، وجدنا أن ما يقرب من 60 ٪ من الجينات المعبر عنها تفاضليًا لا تزال مهمة (الشكل S6 في الملف الإضافي 6) ، وأن معظم فئات GO نفسها من الجدول 2 لا تزال تُظهر إثراءًا كبيرًا ، وإن كان بدرجة أقل. تشير هذه النتيجة إلى أنه مع مساهمات متساوية نسبيًا ، فإن الجينات المعبر عنها تفاضليًا في تحليلنا تميز ظاهرتين مختلفتين: أولاً ، هناك اختلافات في تكوين الخلايا بين المناطق وحالات المرض - وهي نتيجة سنناقشها على نطاق واسع في سياق WGCNA أدناه - و ثانيًا ، تظهر العديد من الجينات تغييرات مهمة في التعبير حتى بعد حساب التغييرات في تكوين الخلية. من المحتمل أن تمثل هذه الفئة الثانية مجموعة فرعية من الجينات المعبر عنها تفاضليًا والتي تحدد المسارات الخلوية المختلة ، والتي نفترض أنها تشمل أهم تغييرات التعبير الجيني ، وتشمل جميع الجينات من الجدول 3. تشير هذه النتائج إلى أن تحليلات المصفوفة الدقيقة القياسية للأنسجة غير المتجانسة يمكنها تحديد الجينات بدقة تتعلق بمسارات خلل وظيفية داخل الخلايا لمعظم الجينات التي يتم التعبير عنها بشكل تفاضلي للغاية ، ولكن هناك حاجة إلى تحليلات أكثر تعقيدًا لمعالجة تكوين نوع الخلية لغالبية هذه الجينات.

يكشف WGCNA عن تغييرات التعبير المرتبطة بالأمراض لأنواع الخلايا الرئيسية

لاستكمال تحليلات التعبير التفاضلي التقليدية ومواصلة استكشاف الفيزيولوجيا المرضية لمرض الزهايمر من منظور الأنظمة ، أجرينا WGCNA على عيناتنا (المواد والطرق). وجدنا 19 وحدة من الجينات المعبر عنها بشكل كبير (الشكل S7 في ملف إضافي 6 ، انظر الملف الإضافي 5 للحصول على معلومات أكثر تحديدًا عن الوحدة النمطية وانظر الشكل S8 في الملف الإضافي 6 لرسوم الوحدة النمطية). كما هو الحال مع دراسات WGCNA السابقة لأنسجة المخ [14 ، 25 ، 46] ، تتوافق العديد من هذه الوحدات مع أنواع الخلايا والمكونات الخلوية الأساسية (الجدول 4). يُظهر كل جين محدد مستخدم في نموذجنا الخطي اتصالًا عاليًا في وحدة مطابقة لنوع الخلية نفسه ، مما يؤكد أن الجينات للوحدة الخطية الخاصة بنا قد تم اختيارها بشكل مناسب. علاوة على ذلك ، لكل نوع خلية رئيسي ، نجد وحدات مرتبطة بسمات ذات صلة بمرض الزهايمر. على سبيل المثال ، تُظهر وحدات eigengenes النمطية للعديد من الوحدات النمطية المرتبطة بالخلايا العصبية انخفاضًا في التعبير لدى الأفراد المصابين بمرض الزهايمر مقارنةً بعناصر التحكم غير المصابة بالخرف (الشكل 3 أ). تميل الوحدات النجمية إلى أن يكون لها النمط المعاكس ، مما يُظهر زيادة التعبير في AD (الشكل 3 ب). بالإضافة إلى ذلك ، نجد وحدة واحدة غنية جدًا بعلامات oligodendrocyte (الوحدة الحمراء) ، والتي لا تُظهر خصوصية المنطقة أو المرض ، ولكنها الوحدة الوحيدة التي ترتبط ارتباطًا إيجابيًا بالعمر في عناصر التحكم (الشكل 3 ج). وجدنا أيضًا أن إحدى الوحدات التي تميز الخلايا الدبقية الصغيرة (الوحدة ذات اللون الأخضر الفاتح) تُظهر زيادة كبيرة في التعبير في عناصر التحكم غير المصابة بالخرف في مرحلة براك 2 مقارنةً بعناصر التحكم في مرحلة براك 1 (الشكل ثلاثي الأبعاد) ، مما يشير إلى وجود علاقة بين تنشيط الخلايا الدبقية الصغيرة وعلم أمراض تاو ، حتى في حالة عدم وجود أعراض مرض الزهايمر. أخيرًا ، كعنصر تحكم منهجي ، قمنا بتقييم أنماط التعبير لجين المحور العلوي لكل وحدة نمطية من الخلايا باستخدام مورد Allen Mouse Brain Atlas [47]. نجد أنه في الماوس يبدو أن كل جين محوري يميز نوع الخلية الصحيح ، مما يوفر دليلًا إضافيًا على أن توصيفات الوحدة لدينا صالحة (الشكل 4).

وحدات لنوع الخلية ترتبط بالأنماط الظاهرية ذات الصلة بالأمراض. (ميلادي) وحدات تمثيلية لأربعة أنواع رئيسية من الخلايا - الخلايا العصبية الهرمية (أ) ، الخلايا النجمية (ب) ، الخلايا الدبقية قليلة التغصن (ج) ، الخلايا الدبقية الصغيرة (د) - يظهر كل منها ارتباطًا مهمًا بسمة ذات صلة بالمرض. في العمود الأول ، يتم قياس ارتباط الوحدة بالمنطقة والمرض باستخدام Bayes ANOVA. يتم عرض مخططات الصندوق لكل مجموعة من المجموعات الأربع (المحور السيني ، ووضع العلامات كما في الشكل 2 ب). في العمود الثاني ، يتم قياس ارتباط الوحدة بمرحلة Braak في عناصر التحكم باستخدام a ر-اختبار. يتم عرض المخططات الصندوقية لمراحل Braak (Stg) من 1 و 2. في العمود الثالث ، يتم عرض ارتباط Pearson بين تعبير الوحدة والعمر ، جنبًا إلى جنب مع الخط الأنسب. يمثل المحور y في جميع الحالات تعبير eigengene للوحدة النمطية. ص- القيم: +، 0.05 & ltص & lt 0.1 ** ، ص & lt 0.007 *** ، ص & lt 0.0004. في العمود الرابع ، الماوس فى الموقع تم استنساخ التهجين للجين المحوري العلوي في كل وحدة من أطلس ألين ماوس برين (Allen Institute for Brain Science ، © 2009 ، متاح من [67]). يبدو أن هذه الجينات تحدد أنواع الخلايا المناسبة ، على الرغم من عدم رؤية خصوصية المنطقة على أي حال. لاحظ أن PPAP2B هو الجين المحور العلوي لوحدة نجمية مختلفة (سماوي فاتح).

يتم تأكيد معظم الجينات التي تظهر زيادة التعبير مع مرحلة Braak باستخدام qRT-PCR. (أ) تُظهر المخططات الصندوقية مستويات التعبير (المحور الصادي) لخمسة من الجينات العليا معبرًا عنها تفاضليًا مع مرحلة براك في التحكم (المحور السيني). ص- تم قياس قيم التعبير التفاضلي باستخدام أ ر-اختبار (**، ص & lt 0.003 *** ، ص & lt 0.0004). (ب) تم حساب تغييرات الطية (المحور الصادي) لكل من هذه الجينات بين مرحلتي Braak من 1 و 2 باستخدام ثلاث طرق (المحور السيني): ميكروأري (M) ، qRT-PCR للأنسجة من الحصين (HP) ، و qRT-PCR من الأنسجة من القشرة الأمامية (ج). تم تصنيف الجينات على أنها مؤكدة (تغيير طية القراد & gt1.2) ، هامشي (علامة ناقص 1.1 & lt تغيير أضعاف & lt 1.2) ، وغير مؤكد (تغيير أضعاف عرضية & lt1.1).

علامات الخلايا الدبقية الصغيرة هي مؤشرات مبكرة لعلم أمراض تاو

لمزيد من فحص الارتباط بين الخلايا الدبقية الصغيرة وعلم أمراض تاو المبكر ، حددنا الجينات التي أظهرت أكبر زيادة في التعبير بين مرحلتي Braak من 1 و 2 باستخدام ر-اختبار ، هذه المرة بما في ذلك عينات CA1 و CA3 معًا لزيادة القدرة الإحصائية. بشكل عام ، وجدنا 490 جينًا مهمًا ، بما في ذلك العديد من الجينات في الوحدة "الدبقية الصغيرة" ذات اللون الأخضر الفاتح و GT60 من فئة GO "الاستجابة الدفاعية" (ص & LT 10-18). للتحقق من صحة نتائجنا ، أجرينا qRT-PCR ، بإضافة عنصري تحكم جديدين إلى تحليلنا (ملف إضافي 1). من الجينات الخمسة الإضافية التي تم اختبارها ، تم التحقق من صحة ثلاثة (الشكل 4). ثم كررنا التحليل على القشرة الأمامية من نفس الأفراد ، ووجدنا أن أربعة من هذه الجينات تم التحقق من صحتها (الشكل 4). نظرًا لأن NFTs لم تتشكل بعد في CA3 أو القشرة الأمامية بواسطة مرحلة Braak 2 وتم عزلها فقط في CA1 [13] ، فإن هذه النتيجة تشير إلى أن تنشيط الخلايا الدبقية الصغيرة ينتشر في جميع أنحاء الدماغ قبل علم أمراض NFT ، وبالتالي قد يكون أحد المؤشرات الأولى لمرض الزهايمر. تقدم.

لا تشير هذه النتيجة ، في حد ذاتها ، إلى وجود ارتباط بين NFTs والدبق الدبقي: وبدلاً من ذلك تشير إلى أن علم الأمراض NFT في المنطقة عبر القناة العصبية والتفعيل النظامي الدبقية الصغيرة هما حدثان مبكران قبل ظهور الأعراض. لتحديد الارتباط الذي قد يوجد ، إن وجد ، بين NFTs و الخلايا الدبقية الصغيرة ، قمنا بتحليل البيانات من دراسة منشورة للطبقة 2 من الخلايا العصبية للجزيرة النجمية في القشرة المخية الداخلية في موضوعات ذات المرحلة المتوسطة من AD (رقم انضمام GEO GSE4757) [19]. في هذه الدراسة ، تم استخدام تشريح مجهري لالتقاط الليزر لجمع 1000 خلية عصبية تحمل NFTs و 1000 خلية عصبية طبيعية من نفس الأشخاص العشرة. من هذه البيانات ، حصلنا على قائمة الجينات التي تم تنظيمها في الخلايا العصبية التي تحمل NFTs. من بين أفضل 25 جينًا تم تنظيمها بشكل كبير في الخلايا العصبية الحاملة لـ NFT وأيضًا تم التعبير عنها بشكل مفرط في عناصر تحكم Braak في المرحلة 2 (ص & lt 0.03 جدول S6 في ملف إضافي 6) ، وجدنا أن 20 في الوحدة ذات اللون الأخضر الفاتح (الدبقية الصغيرة) ، بما في ذلك 5 محاور (الشكل 5). تشير هذه النتائج معًا إلى أن تنشيط الخلايا الدبقية الصغيرة يحدث في وقت مبكر من تطور مرض الزهايمر ويرتبط بـ NFTs بالإضافة إلى أمراض الأميلويد.

ترتبط الجينات في الوحدة الدبقية الصغيرة بأمراض NFT المبكرة. يتم عرض أفضل 250 تفاعلًا جينيًا للوحدة ذات اللون الأخضر الفاتح كما تم قياسها بواسطة التداخل الطوبولوجي. تمثل النقاط الأكبر جينات المحور مع ما لا يقل عن 15 اتصالًا. يتم تنظيم الجينات الدائرية بشكل كبير في الخلايا العصبية الحاملة لـ NFT (ص & lt 0.03) وأيضًا تم التعبير عنها بشكل مفرط في عناصر تحكم Braak المرحلة 2 (ص & lt 0.03). تم اختيار طول كل سطر وموضع كل عقدة بشكل تعسفي بواسطة VisANT لتسليط الضوء على بنية الشبكة. يتم أيضًا تقديم أفضل 25 جينًا بناءً على عضوية الوحدة.


مناقشة

مع تولي RNAseq تدريجيًا كأداة مفضلة لتنميط التعبير ، تواجه تقنية microarray معركة صعبة للبقاء على صلة. لم تتخلى شركات Microarray مثل Affymetrix و Agilent عن تقنية ميكروأري. بدلاً من ذلك ، يتم إنتاج مصفوفات أكثر قابلية للتخصيص وذات دقة أعلى للتنافس على حصة السوق. ستطيل هذه الاستراتيجيات من عمر تقنية ميكروأري ، لكنها لن تغير استبدالها الحتمي بتقنية RNAseq.

يختار بعض الباحثين RNAseq بدلاً من microarray دون فهم شامل للاختلافات بين الطرق. لا تزال تقنية microarray تتمتع بالعديد من المزايا مقارنة بـ RNAseq. تتمثل إحدى المزايا في أن التعقيد الأقل المطلوب للتحليل. قد يعتمد اختيار طريقة التطبيع المناسبة لمنصة على العديد من المتغيرات. بالنسبة لبيانات المصفوفة الدقيقة ، خاصة لمنصات Affymetrix و Agilent ، فإن إحدى أكثر طرق التطبيع المقبولة هي RMA. للكشف عن الجينات المعبر عنها تفاضليًا ، يُقبل اختبار t البسيط في معظم السيناريوهات لبيانات المصفوفات الدقيقة. من ناحية أخرى ، تم تقديم نماذج أكثر تعقيدًا للتعامل مع جينات RNAseq غير المعبر عنها مثل ذات الحدين السالب: DESeq [29] و edgeR [26] و baySeq [30] و NBPseq [31] وتوزيع Poisson: TSPM [ 32] ، DEGseq [33]. كانت هناك العديد من الدراسات [27] [28] [34] [35] في محاولة لمقارنة طرق مختلفة للتطبيع ومقارنة الجينات التفاضلية لبيانات RNAseq. في الدراسة التي أجراها ديليس وآخرون. [27] ، من خلال المحاكاة ، وجد المؤلفون أن DESeq [29] و edgeR [26] قادران على الحفاظ على معدل إيجابي خاطئ معقول دون أي فقدان للطاقة. في دراسة منفصلة قام بها Kvam وآخرون ، أوصى المؤلفون baySeq و DESeq و edgeR. روبلز وآخرون. المقترح باستخدام مجموعة من الحزم المتعددة قد يتغلب على قابلية التحيز المحتملة لحزمة معينة لمجموعة بيانات معينة ذات أهمية [28]. في أحدث دراسة أجراها Soneson et al. اقترح المؤلفون استخدام تركيبة فريدة من الحزم الموجودة مع LIMMA [36] والتي كان أداؤها جيدًا في ظل العديد من الظروف. لكن هذا النهج يتطلب ما لا يقل عن 3 عينات لكل حالة للحصول على القوة الكافية لاكتشاف أي جينات معبر عنها تفاضليًا. وأشار المؤلفون أيضًا إلى أن نظام SAMseq غير المعتمد [37] كان من بين الأفضل أداءً. ومع ذلك ، نظرًا للتغير المطلوب للأهمية الإحصائية بواسطة SAMseq كان أقل من العديد من الطرق الأخرى ، فقد يكون للجينات المعبر عنها تفاضليًا التي حددها SAMseq أهمية بيولوجية أقل. حتى الآن ، لم يتم التوصل إلى توافق في الآراء بشأن أفضل نهج لتحليل بيانات RNAseq.

تحليل ميكروأري هو وقت أكثر وفعالية من حيث التكلفة أكثر من تحليل بيانات RNAseq. يتراوح حجم الملف الخام النموذجي لبيانات ميكروأري من 10 ميجا بايت إلى 100 ميجا بايت بينما يتراوح حجم ملف بيانات RNAseq الخام من 5 جيجا بايت إلى 10 جيجا بايت مع مساحة إضافية مطلوبة لإجراء تحليل البيانات. لتحديد الجين المعبر عنه تفاضليًا بشكل كبير من البيانات الأولية باستخدام ميكروأري سيستغرق ساعات فقط لـ RNAseq ، سيستغرق الأمر أيامًا إلى أسابيع اعتمادًا على حجم العينة. باختصار ، على الرغم من أن التكلفة الحالية لأداء تنميط التعبير باستخدام ميكروأري و RNAseq قابلة للمقارنة ، فإن تكلفة تحليل وتخزين بيانات RNAseq أعلى بكثير من تكلفة بيانات المصفوفة الدقيقة. ومع ذلك ، مع تقدم أجهزة الحوسبة ونضج خوارزميات تحليل RNAseq ، نتوقع أن تتضاءل مزايا المصفوفات الدقيقة ببطء.

على الرغم من أن تقنية Microarray في النهاية لا يمكنها التنافس مع RNAseq لتحديد ملامح التعبير ، إلا أنها لا تزال مفيدة للغاية لأغراض التنميط الجيني. تكلف مصفوفات التنميط الجيني exome التي تم تقديمها مؤخرًا بواسطة Illumina و Affymetrix أقل بكثير من تكلفة تسلسل exome. تكلف حبة Exome BeadChip البشرية من Illumina 45 دولارًا فقط لكل مجموعة مقارنة بـ500-1000 دولار لكل تسلسل exome. حتى مع وجود قيود على قائمة SNP المحددة مسبقًا ، تُفضل شريحة exome لدراسات الارتباط واسعة النطاق للجينوم (GWAS) نظرًا للسعر الذي يمكن التحكم فيه بشكل أكبر.

مع تلاشي تقنية Microarray ببطء في التاريخ ، لا تزال الكمية الهائلة من بيانات تعبير microarray التي جمعها الباحثون على مدار العقد الماضي ذات قيمة كبيرة لاستخراج البيانات. تم تنظيم غالبية بيانات المصفوفات الدقيقة وتخزينها في قواعد بيانات متاحة للجمهور. يحتوي Gene Expression Omnibus (GEO) على بيانات تعبير عن 848178 عينة عبر 2720 مجموعة بيانات ، ويحتوي ArrayExpress على 988372 اختبارًا عبر 34148 تجربة. لا تزال قواعد بيانات المصفوفات الدقيقة هذه تقدم دعماً هاماً ومعلومات للباحثين في جميع أنحاء العالم كل يوم.

تظهر نتائجنا أنه لا ينبغي مقارنة بيانات تعبير ميكروأري ثنائي القناة مباشرة ببيانات تعبير RNAseq بسبب مخططات الكشف المختلفة. يحتوي ميكروأري أحادي القناة على توافق جيد جدًا مع بيانات تعبير RNAseq. ولوحظ اتفاق معقول بين قوائم الجينات المعبر عنها تفاضليًا بشكل كبير والتي تم تحديدها بواسطة تقنيات ميكروأري وقناتين RNAseq ، ومع ذلك ، من الجينات المهمة التي تم تحديدها بواسطة كل من RNAseq والمصفوفة الدقيقة ثنائية القناة ، كان لدى حوالي 1.2 ٪ من الجينات اتجاه معاكس لتغيير الطية. يمكن أن يكون سبب هذا التناقض خطأ عشوائي أو اختلافات التطبيع أو عدم التجانس في العينات. في سيناريو مراقبة هذا التناقض ، سيكون من الصعب للغاية تحديد الطريقة التي يجب الوثوق بها ، خاصةً عندما يكون الاختلاف ناتجًا عن عدم تجانس العينة. وبالتالي ، نوصي بتشغيل طرق تحليل متعددة مثل حزمة الموصل الحيوي LIMMA [36] للمصفوفة الدقيقة ، والطرق القائمة على حساب القراءة مثل DESeq [29] و edgeR [26] و baySeq [30] لاختيار الجينات الموثوقة. إذا كان التناقض لا يزال غير قابل للحل ، فيجب إجراء طريقة Wetlab مثل RT-PCR للتحقق من صحتها. على الرغم من أن نسبة عدم الاتساق هذه صغيرة جدًا ، إلا أنها تسبب بعض القلق وتستدعي مزيدًا من الدراسة. بمقارنة طرق تطبيع RPKM و RSEM ، وجدنا تناسقًا جيدًا على مستوى الجينات ومعدل تناسق جيد على مستوى exon.ومع ذلك ، فإن طرق تطبيع RPKM و RSEM كانت ذات تناسق ضعيف بالنسبة للإكسونات القصيرة مقارنة بالإكسونات الطويلة ، ويرجع ذلك جزئيًا إلى محدودية قدرة تقنية التسلسل على اكتشاف exons القصيرة والصعوبة الناتجة عن القياس الكمي الصحيح للتعبير عن تلك exons القصيرة. تُظهر كل من قيمة التعبير المطلق من بيانات ميكروأري أحادية القناة وقيمة تغيير الطية من بيانات ميكروأري ثنائية القناة توافقًا أكثر قليلاً مع نتيجة RPKM من نتيجة RSEM ، مما قد يشير إلى أن طريقة RPKM أكثر دقة من طريقة RSEM في تقدير التعبير الجيني .

لقد قدمنا ​​أكبر دراسة مقارنة بتعبير ميكروأري و RNAseq أجريت حتى الآن. نظرًا لحجم العينة الكبير ، ستكون نتائجنا أكثر تحديدًا من الدراسات السابقة حول هذا الموضوع. ليس هناك من ينكر أن RNAseq يحل محل ميكروأري بوتيرة سريعة. ومع ذلك ، لا يزال هناك باحثون لم ينتقلوا بعد من ميكروأري إلى RNAseq. تقدم دراستنا دليلًا قاطعًا على أن RNAseq يمكن بالفعل أن يحل محل ميكروأري من حيث تحليل التعبير. علاوة على ذلك ، تُظهر دراستنا أيضًا أن النتائج المستمدة من بيانات المصفوفات الدقيقة جديرة بالثقة. لا يزال بإمكان الكمية الهائلة من بيانات المصفوفات الدقيقة المتراكمة على مدار السنوات العشر الماضية والمخزنة في مستودعات مثل GEO و ArrayExpress أن تعمل كمصادر ممتازة لاستخراج البيانات.


مقارنة بين التعبير الجيني خلال المراحل المبكرة لتجديد الأطراف بين استدامة التجدد المتساهلة وقاصرة التجديد أكسولوتل المتحولة

إبسولوتل (Ambystoma Mexicanum) السمندل ، وهو من البرمائيات القلبية ، يتمتع بقدرة تجديدية استثنائية لاستعادة الطرف المبتور بالكامل طوال فترة استدامة المرحلة اليرقية طويلة الأمد. على النقيض من ذلك ، عندما يتم تحفيز إبسولوتل تجريبيًا على التحول ، يكون التوهين في الكفاءة التجديدية للطرف ملحوظًا. هنا ، سعينا إلى تمييز الملامح البروتينية للمراحل المبكرة من تكوين بلاستيما من قنفذ البحر النيوتيني والمتحول بعد بتر الأطراف عن طريق تقنية LC-MS / MS. قمنا بتحديد ما مجموعه 714 بروتينًا لها قيمة p & lt 0.01 معدلة مع FC أكبر أو يساوي 2 بين حالتين. كشف تحليل المكون الرئيسي عن تكتل واضح بين عينات النيوتينية والمتحولة في 7 أيام بعد البتر. تم تحديد مجموعة مختلفة من البروتينات على أنها معبر عنها بشكل تفاضلي في جميع النقاط الزمنية (1 و 4 و 7 أيام بعد البتر مقابل اليوم 0) لمراحل استدامة المرحلة اليرقية والمتحولة. على الرغم من أن تحليلات الإثراء الوظيفي تؤكد وجود مسارات مشتركة بين المراحل التجديدية وغير التجديدية ، إلا أن تكاثر الخلايا والمسارات المرتبطة بتنظيمها ، والمسارات المرتبطة بالجهاز المناعي والأنسجة العضلية ومسارات إعادة تشكيل وتدهور ECM تم تمثيلها بمعدل مختلف بين كلتا المرحلتين. للتحقق من صحة نتائج البروتينات وتقديم دليل على الارتباط المفترض بين نشاط الجهاز المناعي وإمكانات التجدد ، تم إجراء qRT-PCR للجينات المحددة.


توافر البيانات والمواد

تم تقديم بيانات تسلسل MPRA وبيانات تسلسل الحمض النووي الريبي الجينومي من هذه الدراسة إلى NCBI Gene Expression Omnibus (GEO http://www.ncbi.nlm.nih.gov/geo/) تحت رقم الانضمام GSE140574 [58]. جميع البرامج النصية المطلوبة لإعادة إنتاج هذا العمل متاحة على GitHub على https://github.com/kmattioli/2019__cis_trans_MPRA ويتم أرشفتها على Zenodo على https://doi.org/10.5281/zenodo.3862824 [59]. الكود مفتوح المصدر وتم إصداره بموجب ترخيص MIT.


أساليب

زراعة الخلايا

تم الحصول على كواشف زراعة الخلايا من شركة Gibco Thermo Fisher Scientific (بيزلي ، المملكة المتحدة) ، ما لم يُذكر خلاف ذلك. تمت زراعة خطوط خلايا سرطان الثدي البشرية ZR-751 و MCF-7 و MDA-MB-231 في وسط Dulbecco المعدل النسر (DMEM) مع 10 ٪ من مصل العجل الجنيني (FCS) ، 50 U مل - 1 بنسلين و 50 ملغ مل - 1 ستربتومايسين وحضنت عند 37 درجة مئوية في جو رطب مع 5 ٪ CO2. تمت المصادقة على خطوط الخلايا التي تم الحصول عليها من مجموعة الثقافة الأمريكية (معايير LGC ، Teddington ، المملكة المتحدة) عن طريق التكرار الترادفي القصير (STR) التنميط الذي تم إجراؤه في Health England (Porton Down ، Salisbury ، المملكة المتحدة). جميع عينات الحمض النووي لخطوط الخلايا التي تم اختبارها مطابقة 9 من 9 أليلات أساسية تم اختبارها في الحمض النووي من عينات خط الخلية المعروفة التي تؤكد هويتها. تم إجراء جميع التجارب باستخدام الخلايا ، مع الحفاظ على رقم مرور منخفض من هذه المخزونات المجمدة.

تشعيع الخلايا وتطوير خطوط الخلايا المقاومة للإشعاع

تم تشعيع الخلايا باستخدام نظام الأشعة السينية بخزانة Faxitron 43855D (شركة Faxitron X-ray Corporation ، IL ، الولايات المتحدة الأمريكية). تم تطوير خطوط الخلايا المقاومة للإشعاع (MCF-7 RR و ZR-751 RR و MDA-MB-231 RR) من خطوط الخلايا الأبوية الخاصة بها (MCF-7 و ZR-751 و MDA-MB-231) عن طريق التعرض الأسبوعي للكسور المفردة من الإشعاع. أعقب الجرعة الأولية من 2 جراي جرعات أسبوعية إضافية من 0.5 جراي لمدة 12 أسبوعًا. خلال هذه الفترة ، تلقت الخلايا جرعة إشعاع إجمالية قدرها 57 غراي. تم الحفاظ على الخلايا بعد ذلك بجرعات أسبوعية إضافية من 5 غراي.

مقايسة انتشار السلفورودامين ب (SRB)

تم زرع الخلايا في 96 طبقًا جيدًا (500 خلية / بئر) وحضنت لمدة 24 ساعة. عولجت الخلايا بالأدوية أو تعرضت للإشعاع وثبتت بين 24 و 144 ساعة بعد العلاج بإضافة 50 ميكرولتر بارد 25٪ حمض ثلاثي كلورو أسيتيك (سيغما الدريتش ، المملكة المتحدة) لكل بئر عند 4 درجات مئوية لمدة ساعة واحدة. تم غسل الأطباق في H.2O ، وعندما يجف ، تمت إضافة 50 ميكرولتر من صبغة SRB (0.4٪ SRB مذاب في 1٪ حمض أسيتيك جليدي (VWR International)) إلى كل بئر وحضنت لمدة 30 دقيقة. تم غسل الألواح 4 مرات في 1٪ حمض أسيتيك جليدي ، وعند الجفاف ، تمت إضافة 150 ميكرولتر من 10 ملي مولار من محلول Tris-NaOH (درجة الحموضة 10.5) إلى كل بئر. تم تحضين الأطباق على شاكر لمدة 60 دقيقة. تم قياس الكثافة البصرية عند 540 نانومتر باستخدام مقياس الطيف الضوئي Biohit BP800 (Biohit Ltd. ، المملكة المتحدة) وبرنامج Wallac 1420 Manager (PerkinElmer ، المملكة المتحدة). تركيزات النصف المثبطة القصوى (IC50 القيم) باستخدام حزمة GraphPad prism 7.

مقايسة تكوين المستعمرة (CF)

تم زرع الخلايا في ألواح بحجم 75 مم (1 × 10 3 خلايا / لوحة) واحتضانها لمدة 24 ساعة قبل العلاج الإشعاعي. بمجرد تكوين المستعمرات المرئية (حوالي 50 خلية لكل مستعمرة) في المجموعة الضابطة غير المعالجة (حوالي 10-14 يومًا بعد البذر) ، تم غسل الألواح مرتين في برنامج تلفزيوني قبل تثبيت الخلايا مع إضافة 5 مل من 1،9 ثنائي ميثيل - ملح مزدوج كلوريد الزنك الميثيلين الأزرق (سيجما الدريتش ، المملكة المتحدة). بعد 45 دقيقة ، تم غسل الأطباق وتركها تجف في الهواء قبل عد الطوائف. تم إجراء التحليل عن طريق حساب كفاءات الطلاء وكسور البقاء على قيد الحياة لألواح التحكم والمعالجة [8].

فحوصات الخدش (المهاجرة)

تم زرع الخلايا في 6 لوحات جيدة بكثافة لتحقيق التقاء 100 ٪ بعد 24 ساعة. تم إجراء فحوصات الخدش كما هو موضح سابقًا [9]. تم إضافة 0.1 ٪ من الوسائط المكملة بالمصل إلى كل بئر. تم التقاط صور تباين الطور للخلية أحادية الطبقة (Axiovert DS100 ، هدف × 5) أثناء الترحيل بحد أقصى 48 ساعة بعد الصفر. في كل نقطة زمنية ، تم حساب المنطقة الخالية من الخلايا المهاجرة باستخدام برنامج FIJI وتم التعبير عنها كنسبة مئوية من منطقة الخدش الأولية.

تشكيل الأجسام الشبه الكروية متعددة الخلايا (MTS)

تم نقل تعليق خلية واحدة لكل خط خلية من قارورة T175 (حوالي 15 × 10 6 خلايا) إلى دورق دوار (قارورة سبينر سيلكونترول ، إنتجرا ، سويسرا) تحتوي على 100 مل من DMEM الروتيني ووضعها على منصة محرك مغناطيسي (Cellspin) ، انتيغرا ، سويسرا). تم تطوير MTS على مدار 7 أيام في ظروف الحضانة العادية.

مقايسة الغزو ثلاثي الأبعاد باستخدام الأجسام الشبه الكروية للورم متعدد الخلايا

تمت إزالة MTS واحد مع 500 ميكرولتر من مزيج الكولاجين (الجليد البارد 0.1 ٪ حمض الخليك المرشح ، نوع مصفوفة الخلية 1-A (Alphalabs) ، 0.22 M NaOH (Sigma-Aldrich ، المملكة المتحدة) ، FCS و 10x DMEM (Sigma-Aldrich ، المملكة المتحدة) بتركيزات 45 و 25 و 10 و 10 و 10٪ على التوالي) وتوضع في صفيحة 24 بئر. تم تحضين الثقافات لمدة ساعة واحدة للسماح ببلمرة الكولاجين ثم تمت إضافة 500 ميكرولتر روتيني DMEM إلى كل بئر. تم التقاط صور تباين الطور (هدف Axiovert DS100 ، × 5) على فترات منتظمة حتى 120 ساعة بعد البذر. تم قياس غزو MTS باستخدام ماكرو FIJI الذي طوره ماثيو بيرسون (مصدر التصوير المتقدم IGMM ، جامعة إدنبرة) في كل نقطة زمنية وتم التعبير عنه كنسبة مئوية من منطقة MTS الأولية.

تقييم تأثيرات الإشعاع على تنشيط المسار

تم زرع الخلايا في ألواح بحجم 75 مم (1.0 × 10 6 خلايا / لوحة) واحتضانها لمدة 24 ساعة. تم تجويع الخلايا في المصل لمدة ساعتين وتعرضت لإشعاع 2 غراي قبل خضوعها لجمع التحلل الروتيني عند 0 و 5 و 10 و 30 دقيقة بعد الإشعاع. تم تجميد Lysates المفاجئ على الجليد الجاف وتخزينه عند -70 درجة مئوية لتحليل اللطخة الغربية.

عزل البروتين والكشف عنه

تم تحضير محللات الخلية الكاملة كما هو موصوف سابقًا [10] وتم تحديد تركيز البروتين باستخدام مقايسة حمض البيسينشونينيك (BCA). تم فصل كميات متساوية من البروتين بواسطة رحلان هلام بولي أكريلاميد الصوديوم (SDS) ونقلها إلى غشاء نقل Immobilon-P (Millipore). تم استخدام محلول Ponceau S لتصور نطاقات البروتين وتأكيد حظر أغشية التحميل المتساوية باستخدام Odyssey Blocking Buffer (LI-COR Biosciences ، المملكة المتحدة) (1: 1 مع PBS) لمدة ساعة واحدة ، قبل الحضانة طوال الليل عند 4 درجات مئوية مع الأجسام المضادة الأولية ( الجدول 1). تم الكشف عن الإشارات باستخدام IRDye 800CW (Li-Cor، 926–32،210، 1: 10،000) و IRDye 680LT (Li-Cor 926–68،021، 1: 10،000) مع مصور Li-Cor Odyssey. تم تجريد الأغشية المطلوبة لإعادة الفحص باستخدام NewBlot PVDF Stripping Buffer (LI-COR Biosciences ، المملكة المتحدة).

الكيمياء الهيستولوجية المناعية (IHC) والكيمياء المناعية (ICC)

تم تنفيذ IHC على MTS ثابت الفورمالين. تم نزع الكافيين من العينات وترطيبها واسترجاع المستضدات (الجدول 1). تم تثبيط نشاط بيروكسيداز داخلي المنشأ بنسبة 3٪ H2ا2 محلول (داكو ، المملكة المتحدة) لمدة 10 دقائق وتم حظر تلطيخ الأجسام المضادة غير المحددة باستخدام Total Protein Block (Dako ، المملكة المتحدة) لمدة 10 دقائق. تم تحضين الأجسام المضادة الأولية لمدة ساعة واحدة (الجدول 1). تمت إضافة قطرة واحدة من البوليمر المسمى Envision (داكو ، المملكة المتحدة) لمدة 30 دقيقة ، قبل إضافة DAB ومخزن الركيزة (1:50) (داكو ، المملكة المتحدة) إلى كل قسم لمدة 10 دقائق.

تم إجراء ICC على الخلايا المزروعة في شرائح الغرفة (2 شريحة غرفة البئر ، Lab-Tek II ، مستلزمات المختبرات العلمية ، المملكة المتحدة) المصنفة لتحقيق التقاء ما يقرب من 80 ٪ في 24 ساعة. تم إصلاح الخلايا في الأسيتون البارد (500 ميكرولتر / غرفة) لمدة 10 دقائق عند 4 درجات مئوية ، ثم غسلها مرتين في برنامج تلفزيوني لمدة 10 دقائق. نفس البروتوكول الموصوف لـ MTS IHC ، من إضافة H.2ا2 الحل ، ثم تم اتباعه.

تمت مواجهة جميع الشرائح في الهيماتوكسيلين ، وتم تجفيفها وتركيبها باستخدام غطاء تثبيت باستخدام DXP mountant (Sigma-Aldrich ، المملكة المتحدة). تم مسح الشرائح ضوئيًا باستخدام ماسح ضوئي للشرائح NanoZoomer ER (Hamamatsu Photonics ، المملكة المتحدة) وتم عرضها باستخدام برنامج NanoZoomer Digital Pathology.

تعداء سيرنا

تم زرع الخلايا في 96 أو 6 أطباق جيدة (500 أو 2 × 10 5 خلية لكل بئر ، على التوالي) في وسط بدون مضادات حيوية وحضنت طوال الليل لتحقيق التقاء 30-50٪. تم نقل الخلايا وفقًا لبروتوكول الشركة المصنعة باستخدام DharmaFECT 1 Transfection Reagent (Dharmacon) مع الهدف بالإضافة إلى ERα siRNA (J-103401-12) (GE Healthcare Dharmacon) بتركيز 25 نانومتر.

استخراج الحمض النووي الريبي وتحليل التعبير الجيني كامل النسخ

تم زرع الخلايا في ألواح بحجم 75 مم (3.0 × 10 6 خلايا / لوحة) واحتضانها لمدة 24 ساعة. تم تجويع الخلايا في المصل لمدة ساعتين ثم تعرضت للإشعاع 0 أو 2 Gy. تم جمع كريات تصل إلى 1 × 10 7 خلايا عن طريق التربسين عند 0 و 2 و 8 ساعات بعد الإشعاع ، وتم تجميدها على الجليد الجاف وتخزينها عند - 70 درجة مئوية لاستخراج الحمض النووي الريبي لاحقًا. تم استخراج Total RNA من الخلايا باستخدام RNeasy Mini Kit باستخدام تقنية QIAshredder (UK Qiagen ، Ltd). تم اتباع بروتوكول الشركة المصنعة لتنقية إجمالي الحمض النووي الريبي من الخلايا الحيوانية باستخدام تقنية الدوران. تم قياس عينات الحمض النووي الريبي المستخرجة وتقييمها لوجود الملوثات باستخدام NanoDrop TM Spectrophotometer ND1000 (Thermo Fischer Scientific). تم إنشاء أعداد قراءة كاملة لتعبير الجينوم باستخدام تقنية تسلسل Lexogen QuantSeq 3 ′ FWD على خلية تدفق Illumina تم مسحها ضوئيًا باستخدام نظام Illumina HiScanSQ (مرفق البحوث السريرية في إدنبرة ، جامعة إدنبرة). تم إنشاء قراءات NGS تجاه ذيل poly (A) وقراءة 1 تعكس بشكل مباشر تسلسل mRNA. فشلت عينة ZR-751 2 h و 2 Gy في التسلسل وتمت إزالتها من التحليل الإضافي. تم إنشاء رقم تكامل الحمض النووي الريبي (RIN) لكل عينة لتقييم جودة الحمض النووي الريبي (Agilent Bioanalyzer) ، وكان لجميع العينات قيم RIN أعلى من 9.7 (ملف إضافي 1: الجدول S1). تمت معالجة ملفات FASTQ لبيانات عدد القراءة الأولية مسبقًا باستخدام برنامج تحليل NGS عالي الأداء الموصى به من شركة Lexogen والذي نفذ تقليم ذيل بولي (A) ومواءمته مع الجينوم المرجعي Consortium Human genome بناء 38 الجينوم المرجعي باستخدام Spliced ​​Transcripts Alignment to الخوارزمية المرجعية (STAR) [11]. قبل التحليل ، تم تحويل البيانات log2 وتوحيدها كميًا في برامج وحزم R (موصل حيوي) [12]. تم استخدام هذه البيانات النسخية الأولية فقط للتحليلات التي تركز على المسار الخاضعة للإشراف لأغراض إنشاء الفرضيات وتم التحقق من صحة كل تحليل لاحقًا عن طريق التجارب المعملية. تم إجراء تحليل الخرائط الحرارية والعنقودية باستخدام برنامج TM4 MeV (عارض التجارب المتعددة) [13]. تم إجراء تجميع الخرائط الحرارية باستخدام ارتباط بيرسون بمتوسط ​​الارتباط. لتكامل بيانات التعبير الجيني مع مجموعات البيانات العامة ، تم إجراء تصحيح لتأثيرات دفعة التكامل في R باستخدام ComBat كما هو موضح سابقًا [14 ، 15]. تم إجراء التجميع الهرمي لخطوط الخلايا الأبوية و RR باستخدام قائمة منشورة من الجينات التي يشير ملف تعريفها إلى الأنواع الفرعية الجوهرية لسرطان الثدي (القاعدية ، الشبيهة بالعادة ، Her2 ، Luminal A و Luminal B) [16]. تم إجراء تعيين العينات الفردية لأنواع فرعية جوهرية باستخدام جينيفو حزمة R [17]. جينيفو تنفذ خوارزمية توقع عينة واحدة (SSP) وهي أقرب مصنف للنقطة الوسطى. تم تحديد النقط الوسطى التي تمثل الأنواع الفرعية الجزيئية لسرطان الثدي من خلال المجموعات الهرمية باستخدام نفس قائمة الجينات الجوهرية التي استخدمناها لتحليل الكتلة في هذه الدراسة. جميع مجموعات البيانات التي تم إنشاؤها و / أو تحليلها أثناء الدراسة الحالية متاحة في NCBI's Gene Expression Omnibus [18] ويمكن الوصول إليها من خلال رقم الانضمام إلى سلسلة GEO GSE120798.

الكيمياء النسيجية المناعية والتحليل الإحصائي

تم استخدام برنامج تحليل الصور QuPath الإصدار 0.1.2 [19] لتحليل تعبير البروتين المستهدف ki67 و ERα. تم استخدام ANOVA ثنائي الاتجاه مع اختبار المقارنات المتعددة من Holm-Sidak لاختبار الفروق بين مجموعتين في اختبارات CF و SRB والغزو والهجرة وتجارب اللطخة الغربية. غير زوجي (ذيلان) ر-تم استخدام اختبار لتقييم الفروق بين مجموعتين في تحليل المدينة العالمية للخدمات الإنسانية. ص قيم & lt 0.05 اعتبرت ذات دلالة إحصائية. يتم عرض البيانات على أنها متوسط ​​± SEM مع جميع التحليلات والرسوم البيانية الإحصائية التي تم إنشاؤها باستخدام GraphPad Prism 7. يتم توفير نظرة عامة على العينات المضمنة في كل تجربة (بما في ذلك خط الخلية والنقاط الزمنية والمعالجات وعدد التكرارات) في ملف إضافي 2: الجدول S2.


نتائج ومناقشة

لم يتم العثور على الجينات معبرًا عنها في أي منهما D. simulans أو في D. melanogaster

تم قياس مستويات التعبير بشكل فردي لـ 10 أنماط وراثية من D. simulans ولعينة مجمعة من 10 طرز وراثية من D. melanogaster. على رقائق Affymetrix ، يتم تمثيل كل جين بواسطة عدة مجسات فريدة من نوعها. يتم إعادة بناء مستوى التعبير الجيني من إشارات التهجين العديدة من جميع المجسات لكل جين (De Gregorio et al. 2001) ، مما يقلل من تأثير الاختلاف المتسلسل. من بين 13966 سمة على الرقاقة ، كان 5108 جينًا غائبًا في كلا النوعين ، وتم اكتشاف 972 جينًا فقط في D. melanogaster، تم اكتشاف 1179 جينًا فقط في D. simulans، و 6707 جينات في كلا النوعين. الجينات معبر عنها فقط في D. melanogaster تم فرزها حسب متوسط ​​مستوى النص المرصود بتنسيق D. melanogaster. الجينات الـ 25 المشروحة مع أعلى تعبير في D. melanogaster معروضة في الجدول 1. يتم عرض الجينات المتبقية البالغ عددها 947 في الجدول 1 في المواد التكميلية على الإنترنت.

لماذا لا نكتشف النسخ للجينات المذكورة أعلاه في D. simulans؟ بالنظر إلى أن متواليات oligonulceotide على شريحة Affymetrix مصممة من أجل D. melanogaster، من الممكن أن الجينات التي تم تحديدها على أنها ذات تباين عالي في التعبير هي ، في الواقع ، تهجين بشكل سيء إلى الشريحة بسبب اختلاف التسلسل بين D. melanogaster و D. simulans. هناك العديد من الأدلة التي تجادل ضد هذا التفسير عبر العينة ، على الرغم من أنه لا شك أنه صحيح بالنسبة لبعض الجينات. الأهم من ذلك ، أن برنامج Affymetrix يحسب قيم التعبير كدالة لنسبة "التطابق التام" بين مسبار قليل النوكليوتيد وتسلسل cDNA بالنسبة إلى "عدم التطابق" المتعمد ، وليس كقيمة مطلقة. وبالتالي يجب أن تكون هذه النسبة قوية لتغير التسلسل بين الأنواع في مكان آخر في تسلسل قليل النوكليوتيد. علاوة على ذلك ، فإن التكاثر بين النوعين متطابق تقريبًا (0.94 بوصة D. melanogaster و 0.95 بوصة D. simulans [ارى المواد والأساليب). وبالتالي ، إذا توقعنا أن يظهر خطأ التهجين كضوضاء عشوائية في العينة ، فلا يوجد دليل على وجود اختلاف بين الأنواع للضوضاء. أخيرًا ، كما هو موضح أدناه ، معدل الاستبدال الصامت دي اس غير مرتبط بتقديرنا لاختلاف التعبير بين الجينات. لأن تسلسل D. simulans الجينوم قد بدأ بالفعل (سي إتش لانغلي ، الاتصال الشخصي) ، ستكون فرضية الاختلاف في التسلسل قابلة للاختبار مباشرة في المستقبل.

بدلاً من ذلك ، قد يتم إسكات الجينات المذكورة أعلاه أو تقليل تنظيمها في D. simulans. لقد قيل أن الجينات المضاعفة تكتسب وظائف جديدة (Lynch and Force 2000) ، في حين أن الجينات الموجودة مسبقًا تصبح أقل أهمية من كونها غير أساسية أو عفا عليها الزمن (Wagner and Schwenk 2000 Yang، Gu، and Li 2003). هنا ، نسأل ما إذا كان التعبير في D. simulans غالبًا ما يكون غائبًا عن الجينات غير المعروفة بأهميتها في D. melanogaster. عقود عديدة من التحليل الجيني D. melanogaster قد أسفرت عن قائمة الجينات التي طفرات لها تأثيرات مظهرية قوية - الجينات المشروحة (AGs). بقية الجينات التي نسميها لم يتم شرحها بشكل مباشر بعد (NAGs). إذا كانت هناك جينات غير أساسية في ذبابة الفاكهة، لن يتم تمثيلهم بين AGs ، لكن سيتم تمثيلهم بين NAGs. نفترض أن NAGs ستواجه ، في المتوسط ​​، قيود اختيار أقل ، أي أن مستوى نصها وتسلسلها سيتطوران بشكل أسرع. في المقابل ، نتوقع نسبة أكبر من NAGs (ونسبة أصغر من AGs) بين الميزات التي يتم الكشف عن تعبيرها فيها د.ميلانوجاستر ولكن ليس في D. simulans بالمقارنة مع الجينات المعبر عنها في كلا النوعين. كما هو متوقع ، كان تمثيل AGs ناقصًا بشكل ملحوظ بين الجينات دون تعبير يمكن اكتشافه في D. simulans بالمقارنة مع الجينات الموجودة في كلا النوعين (13.8٪ مقابل 18.7٪ ، χ 2 = 11.06). وبالتالي ، فإن التعبير عن الجينات ذات الطفرات ذات التأثير الكبير يتباعد بشكل أبطأ من التعبير عن الجينات غير المشروحة بعد.

ومن المثير للاهتمام أن الجينين اللذين لهما أعلى تعبير في D. melanogaster، بالإضافة إلى اثنين من الجينات الإضافية من الجدول 1 ، لهما وظيفة خاصة بالخصيتين. من المتوقع التطور السريع للجينات الخاصة بالخصيتين بين الأنواع لأسباب متعددة. غالبًا ما يكون عقم الذكور الهجين هو الآلية الأولى لعزلة ما بعد التزاوج التي تتطور أثناء الانتواع بسبب الانحسار الجزئي لعدم توافق مولر-دوبزانسكي ، وتطور أسرع للكروموسوم X ، وتطور أسرع للجينات المشاركة في تكوين الحيوانات المنوية ، أو مجموعات من هذه الآليات (Orr and Turelli 2001 ). علاوة على ذلك ، فإن التطور المشترك العدائي بين الجنسين ، حيث يتلاعب الذكور بالإناث في وضع البيض المتسارع بعد التزاوج لزيادة لياقة الذكور إلى أقصى حد على حساب لياقة الإناث وتطور الإناث مقاومة للتلاعب الذكوري لتعظيم لياقتهم الخاصة ، يجب أن يدفع التطور الأسرع للتكاثر المرتبط وظائف (هولندا ورايس 1999). تشمل الأمثلة الأخرى لهذا التأثير الاختلاف المتسارع في التسلسل (Swanson and Vacquier 2002) ، وتباعد التعبير (Ranz et al. 2003). يمكن تفسير الاختلاف السريع في التسلسل لبروتينات الارتباط بالرائحة من خلال مشاركتها في التكيف مع البيئة الجديدة أو في اختيار التزاوج (Hekmat-Scafe et al. 2002 Vogt 2002). أخيرًا ، الجينات المشاركة في دفاع المضيف من الطفيليات (مثل نخرية) تتباعد بشكل أسرع نتيجة لآليات Red Queen (Begun and Whitley 2002). تمت أيضًا دراسة اختلاف تسلسل الجينات الأخرى من الجدول 1: ankyrins (Maine و Lissemore و Starmer 1995) ومثبطات بروتين السيرين (Okuyama و Tachida و Yamazaki 1997) وكازين كيناز (Kalmykova و Dobritsa و Gvozdev 1997) . تجدر الإشارة إلى أن الدراسة الأخيرة تضمنت التطور السريع للوظيفة الجديدة ، الكازين كيناز ، من سو(سانت) منطقة الكروموسوم Y.

للوهلة الأولى ، العدد الأكبر من الجينات ذات التعبير القابل للاكتشاف في D. simulans ولكن ليس في D. melanogaster (1،172) مفاجأة. في الواقع ، إذا أدى الاختلاف في التسلسل إلى تقليل إشارة التهجين ، D. melanogaster يجب أن تظهر الجينات بشكل مفرط في كثير من الأحيان أكثر من غير المعبر عنها. أحد التفسيرات هو أنه بالنسبة للجينات ذات مستوى النسخ القريب من عتبة الاكتشاف ، فإن قوة الاكتشاف (العثور على مصفوفة واحدة على الأقل باستخدام المكالمة "الحالية" [انظر المواد والأساليب]) أعلى بكثير في D. simulans من في D. melanogaster نظرًا لوجود عدد أكبر من المصفوفات لـ 10 أضعاف لـ D. simulans. في الواقع ، من بين 1172 ميزة تم اكتشافها في D. simulans، تم اكتشاف 453 في واحدة بالضبط من التكرارات ، و 475 إضافية موجودة في أقل من 20٪ من المصفوفات. كان هناك فقط 53 ميزة تم اكتشافها باستمرار (أكثر من 50٪ من الوقت) في D. simulans (انظر الجدول 2 في المواد التكميلية عبر الإنترنت للحصول على قائمة كاملة بالجينات) التي لم يتم اكتشافها في D. melanogaster. أي منهم تم إيقاف تشغيله حقًا D. melanogaster يصعب استنتاجه في تصميم هذه الدراسة.

الاختلاف بين مستويات نسخ الجينات المعبر عنها في كلا النوعين

بالنسبة للجينات البالغ عددها 6707 الموجودة في كلا النوعين ، فإن متوسط ​​التعبير في D. melanogaster يرتبط ارتباطًا وثيقًا بمتوسط ​​التعبير في D. simulans (الشكل 1 ، كانت مستويات النسخ مرتبطة ارتباطًا وثيقًا بين الجينات ص 2 = 0.87, ص & lt 0.0001). ومع ذلك ، كان الاختلاف في مستويات التعبير بين الأنواع كبيرًا (باستخدام نموذج ANOVA الموضح في المواد والأساليب) لـ 2294 جينًا من أصل 6707: لـ 1760 جينًا على المستوى ص & lt 0.05 (باللون الأزرق في الشكل 1) ، كان هناك 478 جينًا إضافيًا مهمًا عند عتبة 0.001 (أزرق فاتح ملون في الشكل 1) ، و 56 سمة مهمة على مستوى Bonferroni ص & lt 7.46 × 10 6 (أي تصحيح Bonferroni 0.05 / 6707 واللون الأحمر في الشكل 1). تم إجراء اختبارات الأهمية على متوسط ​​الفروق حيث تم توحيد كل شريحة فردية إلى المتوسط. وبالتالي ، يتم التخلص من الاختلاف الكلي في قوة إشارة التهجين كمصدر للاختلافات بينهما D. simulans و D. melanogaster. لذلك ، تعتبر الجينات مهمة لاختبار الاختلاف إذا كان لديهم تعبير موحد أعلى مقدّر في D. melanogaster من في D. simulans أو التعبير المعياري الأدنى بتنسيق D. melanogaster من في D. simulans. من بين الجينات المهمة بواسطة Bonferroni ، كان 43 منها أعلى في D. melanogaster و 13 كانت أعلى في D. simulans في ص & lt 0.001 و 176 و 282 على التوالي وفي ص & lt 0.05 و 680 و 1،080 على التوالي. وبالتالي ، لم تكن الجينات المهمة عمومًا نتيجة للتعبير المعياري المنخفض بشكل غير متناسب في D. simulans، كما هو متوقع إذا كان اختلاف التعبير مجرد قطعة أثرية للتباعد التسلسلي.

يتم سرد AGs الهامة باستخدام معايير Bonferroni في الجدول 2. يمكن العثور على القائمة الكاملة للجينات ونتائج تحليلات ANOVA في الجدول 3 من المواد التكميلية عبر الإنترنت. ومن المثير للاهتمام ، أن الاختلاف في التسلسل للعديد من الجينات المهمة على مستوى Bonferroni ، أو أقربائها المقربين ، قد تمت دراسته من قبل عبر التسلسل: ATP synthase (Wang et al. 2002) ، ATPase (Rand and Kann 1996 Garvey and Malcolm 2000) ، بروتينات ربط الرائحة (Hekmat-Scafe et al. 2002 Vogt 2002) ، وكازين كيناز (Kalmykova ، Dobritsa ، و Gvozdev 1997). قد تكون الاختلافات في وفرة النسخ ناتجة عن (1) تغيير مستوى التعبير بسبب الطفرات في مناطق المروج للجين ، (2) تغيير مستوى التعبير بسبب تطور عوامل النسخ ، (3) مستوى التعبير يبقى دون تغيير ولكن النسيج حيث التعبير يحدث موسعًا أو متقلصًا ، أو (4) يظل مستوى التعبير دون تغيير ولكن توقيت التعبير قد اختلف بين الأنواع. لا تسمح لنا البيانات المتاحة حاليًا بالتمييز بين هذه الفرضيات.

التباين الجيني في مستويات التعبير

فحص الأنماط الجينية المتعددة في D. simulans في التكرارات سمحت لنا بتقدير التباين الجيني لمستوى النسخ داخل الأنواع. من بين 6707 سمة تم فحصها ، تم العثور على 1136 جينًا مختلفًا بشكل كبير بين الخطوط على المستوى ص & lt 0.05 ، 218 إضافية عند المستوى ص & lt 0.001 و 39 جينًا على المستوى ص & lt 7.46 × 10 6 (انظر الجدول 3 للجينات المشروحة في هذه المجموعة). كان التباين الجيني للعديد من هذه الجينات ، أو متماثلاتها ، قيد التحقيق سابقًا ، بما في ذلك التوبولين (Akashi، Kilman، and Eyre-Walker 1998 Nielsen and Raff 2002) ، السيتوكرومات P450 (هالستروم ، ماجنوسون ، ورامل 1982) ، الإسترات (بوبلي ، Imasheva ، و Lazebnyi 1994) ، وبروتينات الغدة الإضافية (راجع Clark et al. [1995] و Cirrera and Aguade [1997]).

وفرة نسخ جينات معينة في D. simulans قد يكون تحت اختيار الاستقرار أو الاتجاه أو الموازنة. يجب أن تظهر الجينات التي يكون تعبيرها تحت الانتقاء المستقر تباينًا جينيًا منخفضًا داخل الأنواع وتقليل الاختلاف في التعبير بين الأنواع. التعبير عن الجينات تحت الاختيار الاتجاهي في D. simulans يجب أن تختلف عن D. melanogaster مع إظهار اختلاف جيني منخفض في D. simulans. قد تكون الجينات ذات الاختلاف الواسع في التعبير داخل الأنواع ولكن الاختلاف المتواضع في التعبير بين الأنواع قيد الاختيار المتوازن. قد يكون اختيار الاستقرار أو الاتجاه أو الموازنة نتيجة مباشرة لاختيار نشاط البروتين الخلوي أو نتيجة غير مباشرة لاختيار حجم العضو (أي زيادة في عدد الخلايا) ، على الرغم من ثبات مستوى التعبير لكل نواة. أخيرًا ، قد تتباعد وتختلف الجينات تحت الانتقاء. قد يكون الانتقاء المريح نتيجة لانخفاض النشاط الجيني لكل خلية (True and Haig 2001). بينما تنتظر نماذج التطور الجزيئي الواضحة للعبارات المذكورة أعلاه مزيدًا من التطوير ، يمكننا مقارنة تنوع التعبير وتباعده لتحديد الجينات التي ربما تنتمي إلى الفئات الأربع المختلفة. نحن نرسم الخط ومكونات تباين الأنواع و F الإحصائيات في الشكل 2. يشير الشكل L المذهل للتوزيع (لكن انظر سوكال [1976]) إلى أن غالبية الجينات لا تتباعد ولا تتغير (الشكل 2 ، أسفل اليسار بالقرب من الأصل أو عند الأصل ، باللون الأسود). من المرجح أن يتم التحكم في مستوى تعبيرهم إلى حد كبير عن طريق تنقية الاختيار. تشير الجينات التي لا تتباعد أثناء إظهار دليل على التباين غير المحدد (أسفل اليمين ، اللون الأحمر) إلى تباين تكيفي محتمل أو اختيار موازنة. مجموعة أخرى من الجينات - منخفضة في التباين داخل النوعي ولكنها متباينة بين الأنواع (أعلى اليسار ، باللون الأزرق) - هي جينات تكيف مرشحة أو جينات انتواع. أخيرًا ، قد يتم إثراء الجينات التي لها اختلافات داخل الأنواع وفيما بينها (لون أزرق فاتح) لتلك التي تخضع للاختيار المريح.

كإجراء رسمي لتحديد الجينات تحت الاختيار الاتجاهي والموازنة ، استخدمنا F- إحصائية للأنواع التي تم تجميع الجينات حسب أكبر أو أصغر نسبة من متوسط ​​مجموع المربعات للأنواع (MSمحيط) إلى متوسط ​​مجموع المربعات للخط (MSخط). بالنسبة للقيم الكبيرة لهذه النسبة ، يكون التفسير مباشرًا. هذه هي الجينات التي يكون فيها اختلاف التعبير أكبر بكثير مما هو متوقع ، نظرًا لتعدد أشكال التعبير عنها ، وبالتالي فهي تتباعد بشكل تكيفي بين الأنواع أو هي جينات انتواع في حد ذاتها (الجدول 2). الجينات ذات النسبة الأقل من مرض التصلب العصبي المتعددمحيط ل MSخط مرشحين للتنوع التكيفي داخل الأنواع أو لموازنة الاختيار (الجدول 4). ميتالوثيونين و أصلع سبق أن تورطت في التباين الطبيعي لحساسية المعادن (Symonds and Gibson 1992 Posthuma and Vanstraalen 1993) ولعدد الشعيرات (Long et al. 1996 Lyman and Mackay 1998) ، مع التفاعل بين الجين والبيئة المقترح للمساهمة في الفصل بين المواد الطبيعية الأليلات.

مقارنة التسلسل وتباعد التعبير

كيف ترتبط التعبير والتباعد التسلسلي؟ خارج التسلسل D. simulans لخصها Betancourt و Presgraves (2002) ، تم تمثيل 237 جينًا في مجموعة Affymetrix ، وتم التعبير عن 195 في نوع واحد على الأقل ، من بينها 156 موجودة في كلا النوعين. بالنسبة للمجموعة الأخيرة ، قمنا بربط الاختلاف في مستوى النص الذي تم قياسه بثلاث طرق: الفرق المطلق في مستويات النص (الشكل 3).أ) ، مكون تباين الأنواع (الشكل 3ب)، و F- إحصائية لاختلاف مستوى التعبير بين الأنواع (الشكل 3ج) مع الاختلاف في مرادف (دي اس) وغير مجهول (dN) المواقع. لا تغير البدائل المترادفة تسلسل الأحماض الأمينية ومن المتوقع أن تكون محايدة تقريبًا (Akashi 1995) وبالتالي ، فإن هذه البدائل تتراكم بسرعة بين الأنواع. لم نجد أي علاقة ذات دلالة إحصائية بين تعبير الاختلاف و دي اس (الاختلاف في مستوى النص 0.03 ، ص = 0.67 مكون التباين −0.06 ، ص = 0.94 F-إحصائية 0.06 ، ص = 0.45). في المقابل ، لاحظنا وجود علاقة إيجابية بين اختلاف التعبير والبدائل غير المرادفة ، والتي تغير البروتينات وبالتالي من المتوقع أن تكون تحت اختيار أقوى من البدائل المترادفة (الاختلاف في مستوى النص 0.17 ، ص = 0.0029 مكون التباين 0.22 ، ص = 0.0056 F-إحصائية 0.06 ، ص = 0.44). لاحظ أنه بالنسبة للجينات التي تمت دراستها هنا ، فإن نسبة البدائل المرادفة إلى غير المرادفة هي تقريبًا 5: 1 (Betancourt and Presgraves 2002) ، في حين أن عدد المواقع المرادفة للمواقع غير المرادفة هو تقريبًا 1: 2 (Hedrick 2000). وبالتالي ، فإن الاختلاف في التسلسل الكلي بين الأنواع يحكمه الاختلاف المرادف. نظرًا لأن الاختلاف المرادف يظهر غير مرتبط بتباعد التعبير ، فإننا نستنتج أنه من غير المحتمل أن يكون للتباعد الكلي في التسلسل تأثير ساحق على تقدير مستوى التعبير (انظر المواد والأساليب لمزيد من التفسيرات). ومع ذلك ، لا يمكننا استبعاد احتمال أن يساهم اختلاف التسلسل في ملاحظاتنا.

أكثر الجينات تباينًا هي تلك التي تظهر في نوع واحد ولكن ليس في نوع آخر. ستكون المقارنة الأولية للجينات المعبر عنها في كلا النوعين أقل من قيمة الارتباط ، لأننا نتجاهل أسرع الجينات تباعدًا ، تلك التي لديها مستويات نصية وُجد أنها "غائبة" في أحد النوعين. قمنا بفحص سلوك المقدرين بعناية (انظر المواد والأساليب) ثم شرع في دراسة العلاقة بين dN و دي اس مع مجموعة الجينات الكاملة (ن = 195). كما هو متوقع ، تم تعزيز حجم التأثير الذي نلاحظه ، على الرغم من أن نفس الاتجاه العام واضح. يظل الاختلاف في مستوى النص غير مرتبط بـ دي اس (الاختلاف في مستوى النص 0.05 ، ص = 0.43 مكون التباين 0.03 ، ص = 0.68 F-إحصائية −0.01 ، ص = 0.84) ، في حين أن الارتباطات مع dN أصبح أقوى بكثير (الاختلاف في مستوى النص 0.42 ، ص & lt 0.0001 مكون التباين 0.48 ، ص & lt 0.0001 F-إحصائية 0.22 ، ص = 0.0018).

نحن نفترض أن كلاهما dN والتباعد على مستوى التعبير تحكمهما أنظمة انتقائية مماثلة. يتم تمثيل البدائل غير المجهولة بشكل مفرط في الجينات التي يكون الانتقاء فيها مسترخياً أو في الجينات الخاضعة للاختيار الاتجاهي (Fay، Wyckoff، and Wu 2002 Smith and Eyre-Walker 2002). إذا تم تخفيف قيود الاختيار ، فإن الطفرات التي تؤثر على كل من تسلسل البروتين والتعبير تتراكم (بما في ذلك في الجينات التنظيمية المنبع). نتوقع بعد ذلك أن نرى تباعدًا قويًا في التسلسل في المواقع والتعبيرات غير المجهولة ، بالإضافة إلى تباين وفير داخل النوعية في تسلسل الجينات والتعبير. في المقابل ، إذا تم تحديد نشاط المنتج الجيني المتزايد ، فسيتم إصلاح الطفرات التي تغير الأحماض الأمينية وتؤثر على التعبير بشكل تفضيلي. ثم نتوقع القوة dN والتباعد في التعبير ولكن القليل من الاختلاف غير المحدد والتعبير غير المحدد (Hudson، Kreitman، and Aguadé 1987 Fay، Wyckoff، and Wu 2002 Smith and Eyre-Walker 2002). مزيد من العمل ضروري لمعالجة الإسهامات النسبية للتعبير وتباعد تسلسل البروتين في الاختيار.

لقد حددنا مجموعة من الجينات سريعة التطور بين الأنواع وثيقة الصلة. يسمح لنا حساب تباين النسخ غير المحدد باختيار الجينات التي يتم تفسير تطورها السريع عن طريق الانتقاء الطبيعي بدلاً من الاسترخاء في الاختيار (الجدول 2). لأن جزءًا كبيرًا من dN قابل للتكيف (Fay و Wyckoff و Wu 2002 Smith و Eyre-Walker) ويرتبط اختلاف التعبير بـ dN، يبدو من المحتمل أن جزءًا كبيرًا من اختلاف التعبير قابل للتكيف أيضًا.


شاهد الفيديو: نظرة من الجين للكروموسوم (كانون الثاني 2022).