معلومة

كيف نجمع بين تحليل إثراء مجموعة الجينات والتكتل الهرمي؟


أود معرفة كيفية الجمع بين تحليل إثراء مجموعة الجينات والتكتل الهرمي. الدافع وراء هذا المزيج هو احتمال تجاوز عدد كبير جدًا من رموز مجموعة الجينات لسرطان الدم عتبة أهمية القيمة p. نحن نستخدم حزمة R لتحليل إثراء مجموعة الجينات سريع التقريب (GSEA) مع عنوان URL ، https://github.com/ctlab/fgsea.

بعد تحليل الإثراء السريع لمجموعة الجينات في قائمة مرتبة من رموز الجينات مع إحصاءات مختلفة للتعبير ، نحتاج على وجه التحديد إلى تحديد رموز مجموعة الجينات التي تنتمي إلى مجموعة وظيفية مشتركة باستخدام وظيفة hclust للغة R المخصصة للتجميع الهرمي الخاضع للإشراف مع المسافة الإقليدية بين الميزات في الوقت المناسب ، على سبيل المثال 15 دقيقة أو أقل.

نقلاً عن كتاب Alan Moses 2017 ، "النمذجة الإحصائية والتعلم الآلي للبيولوجيا الجزيئية" ، "Clustering مخصص لتحليل البيانات الاستكشافية ، وبالتالي لا يحتوي حقًا على إطار عمل قوي لاختبار الفرضيات". توفر حزمة R الجديدة ClusterProfiler تحليل إثراء لـ مجموعات الجينات كما ورد في عنوان URL هذا ، http://guangchuangyu.github.io/2015/05/use-clusterprofiler-as-an-universal-enrichment-analysis-tool/

حقيقة أن معظم مقاييس الجودة الموجودة في الأدبيات قد تم تصميمها لتقييم المجموعات غير المتداخلة ، حتى عندما تكون معظم مشاكل الحياة الواقعية مصممة بشكل أفضل باستخدام خوارزميات التجميع المتداخلة ، يتم تحليلها بالتفصيل في الورقة التالية وأطروحة الدكتوراه بجامعة تكساس

ورقة أكاديمية: CICE-BCubed: مقياس تقييم جديد لتداخل خوارزميات التجميع. متاح من: https://www.researchgate.net/publication/260421976_CICE-BCubed_A_New_Evaluation_Measure_for_Overlapping_Clustering_Algorithms [تم الاطلاع في 16 أبريل / نيسان 2017].

و

https://repositories.lib.utexas.edu/bitstream/handle/2152/ETD-UT-2010-08-2022/KRUMPELMAN-DISSERTATION.pdf؟sequence=1&isAllowed=y

بما أنني مبتدئ في هذا النوع من أبحاث المعلوماتية الحيوية ، يرجى تصحيح أي أخطاء في بيان مشكلتي.


يمكنك تجربة Enrichr لتحليل التخصيب. في صفحة "النتائج" يمكنك استخدام عرض Clustergram. أو يمكنك تحميل نتائجك إلى Clustergrammer نفسها.


أخبرني أستاذ جامعي صاعد من معهد ماساتشوستس للتكنولوجيا الآن أن مخطط البركان مع المحور الرأسي 1og (قيمة p) يمكن في كثير من الحالات تصور المجموعات المتداخلة بشكل مختلف حيث تأتي قيم p من تحليل إثراء مجموعة الجينات ،


الحدود في علم الأورام

انتماءات المحرر والمراجعين هي الأحدث التي يتم توفيرها في ملفات تعريف بحث Loop وقد لا تعكس موقفهم في وقت المراجعة.



مشاركه فى

الملخص

يلعب التحليل المستقل عن التصنيف دورًا أساسيًا في تحليل المجتمع الميكروبي. يعد التجميع الهرمي أحد أكثر الأساليب المستخدمة على نطاق واسع لإيجاد وحدات تصنيف تشغيلية ، وهو الأساس للعديد من التحليلات النهائية. تحتوي معظم الخوارزميات الحالية على مساحة تربيعية وتعقيدات حسابية ، وبالتالي لا يمكن استخدامها إلا للمشكلات الصغيرة أو متوسطة الحجم. نقترح خوارزمية جديدة قائمة على التعلم عبر الإنترنت تعالج في وقت واحد مسائل المساحة والحساب للعمل السابق. الفكرة الأساسية هي تقسيم مساحة التسلسل إلى مجموعة من المساحات الفرعية باستخدام شجرة تقسيم تم إنشاؤها باستخدام مقياس كاذب ، ثم تنقيح بنية التجميع بشكل متكرر في هذه الفراغات الفرعية. تعتمد التقنية على طرق جديدة للبحث السريع عن أقرب زوج وإدراج ديناميكي فعال وحذف عقد الشجرة. لتجنب الحساب الشامل للمسافات الزوجية بين المجموعات ، فإننا نمثل كل مجموعة من التسلسلات كتسلسل احتمالي ، ونحدد مجموعة من العمليات لمحاذاة هذه التسلسلات الاحتمالية وحساب المسافات الجينية بينها. نقدم تحليلات للفضاء والتعقيد الحسابي ، ونوضح فعالية خوارزمية جديدة باستخدام مجموعة بيانات ميكروبيوتا الأمعاء البشرية مع أكثر من مليون تسلسل. تعرض الخوارزمية الجديدة تعقيدًا زمنيًا ومكانًا شبه خطي يمكن مقارنته بخوارزميات التجميع الاستدلالية الجشعة ، مع تحقيق دقة مماثلة لخوارزمية التجميع الهرمي القياسية.


كيف نجمع بين تحليل إثراء مجموعة الجينات والتكتل الهرمي؟ - مادة الاحياء

يشمل عدم التجانس داخل الورم في الأورام الخبيثة اللمفاوية اختيار الأحداث الجينية والتنظيم اللاجيني لبرامج النسخ. تتعرض مجموعات الخلايا الورمية المرتبطة بالنسخة بشكل غير ثابت للتحرير المناعي والتكيفات الأيضية داخل البيئات الدقيقة للأنسجة المختلفة. لا تزال كيفية تأثير خلايا اللحمة المتوسطة الخاصة بالأنسجة على تنويع استنساخ الليمفوما العدوانية غير معروفة.

أساليب

الجمع فى الموقع تحليلات النمط المناعي الكمي وتسلسل الحمض النووي الريبي (RNA) قمنا بالتحقيق في عدم التجانس داخل الورم والتعديلات اللحمية المتوسطة المحددة المرتبطة بـ A20 المنتشر كبير الخلايا الليمفاوية B (DLBCL) الخلايا البذر من بيئات الأنسجة الدقيقة المختلفة. علاوة على ذلك ، قمنا بتمييز ميزات التكوُّن الجلدي المرتبط بالورم الليمفاوي في عينات DLBCL البشرية باستخدام التنميط المكاني الرقمي ، وأثبتنا علاقتها بالمتغيرات ذات الصلة بالتنبؤ ، مثل MYC.

الموجودات

لقد وجدنا أن البيئة المكروية للأنسجة تلقي تأثيرًا ذا صلة على مشهد النسخ A20 الذي يؤثر أيضًا على برامج الاستجابة لضرر Myc و DNA. لتوسيع نطاق التحقيق ليشمل الفئران التي تعاني من نقص البروتين في الخلايا ، SPARC ، وهو عامل تنبؤ اللحمي في DLBCL البشري ، أظهرنا بصمة مناعية مختلفة على خلايا A20 وفقًا للسد. سبارك الكفاءة. من خلال التنميط المكاني الرقمي لـ 87 جينًا مناعيًا وسديًا في مناطق DLBCL العقدي البشرية التي تتميز بتكوين اللحمة المتوسطة المختلفة ، نظهر عدم التجانس داخل الآفات الناتج عن سياقات اللحمة المتوسطة المتنوعة والتأثير على الوسط اللحمي والمناعة.

ترجمة

توفر دراستنا دليلًا تجريبيًا على أن البيئة المكروية اللحمية تولد محددات طوبولوجية لعدم التجانس داخل الورم في DLBCL تتضمن مسارات نسخية رئيسية مثل تعبير Myc وبرامج الاستجابة للضرر ونقاط التفتيش المناعية.

التمويل

تم دعم هذه الدراسة من قبل المؤسسة الإيطالية لأبحاث السرطان (AIRC) (منح 15999 و 22145 إلى C. Tripodo) ومن جامعة باليرمو.


نتائج

فحص DEGs في ccRCC

بعد البحث في مجموعات بيانات GEO بالكلمتين الرئيسيتين "Obesity" و "Clear Cell Renal Cell Carcinoma" (ccRCC) ، تم استخدام مجموعة بيانات GSE46699 التي تتضمن التعديلات الجزيئية المتعلقة بالتدخين والسمنة في ccRCC لمزيد من التحليل. تمت مقارنة التعبير الجيني بين عينات الورم من السمنة ضد. المرضى غير البدينين للتعرف على جينات الورم المرتبطة بالسمنة. بالإضافة إلى ذلك ، قارنا التعبير الجيني في الورم ضد. عينات الأنسجة شبه السرطانية من المرضى الذين يعانون من كل من ccRCC والسمنة لتحديد الجينات التي ترتبط بـ ccRCC. يتم عرض DEGs التي تم الحصول عليها من هذين التحليلين كخرائط حرارية ومخططات بركان في شكل 1. تم التعبير عن اثني عشر جينًا بشكل تفاضلي في كلا التحليلين ، بما في ذلك 8 جينات منظمة و 4 جينات منظمة.

الشرح الوظيفي وإثراء مسار KEGG لـ DEGs

تم إجراء تحليل GO وإثراء مسار KEGG على مجموعتي DEGs لمواصلة استكشاف العمليات البيولوجية المحتملة في ccRCC (الشكل 2). أشار تحليل GO إلى أن DEGs تلعب أدوارًا في عملية تقويض بيروكسيد الهيدروجين ، وبناء الكائن خارج الخلية ، وهجرة الكريات البيض (الشكل 2 أ ، ب). استنادًا إلى تحليل إثراء مسار KEGG ، كان المسار الأكثر أهمية هو "Phagosome" المسارات المهمة الأخرى التي تضمنت "مسار إشارات HIF-1" و "جزيئات التصاق الخلية" (CAMs) (الشكل 2 ج ، د). أظهر التجميع الهرمي أن DEGs يمكن أن تميز أنسجة RCC من الأنسجة الطبيعية (الشكل 3).

التحقق من صحة DEGs

تم التحقق من صحة 12 DEGs باستخدام بيانات المرضى من GEPIA ، وهي أداة تحليل تنميط التعبير الجيني عبر الإنترنت. كانت مستويات التعبير لـ 12 DEGs مختلفة بشكل كبير في أنسجة ccRCC مقارنة بالأنسجة شبه السرطانية الطبيعية (الشكل 4). علاوة على ذلك ، من بين 12 DEGs ، كان هناك 5 جينات مرتبطة إحصائيًا بنظام التشغيل IGHA1 و IGKC كانت مرتبطة سلبًا بنظام التشغيل ، و MAOA, MUC20 و TRPM3 كانت مرتبطة بشكل إيجابي مع نظام التشغيل (الشكل 5). أظهر مستوى التعبير عن هذه DEGs الخمسة في مراحل مختلفة من ccRCC اتجاهات مماثلة في التعبير عن كليهما IGHA1 و IGKC تم رفعها في المراحل اللاحقة (المرحلة الثالثة والرابعة) من ccRCC حيث ينخفض ​​معدل البقاء على قيد الحياة بشكل كبير ، بينما MAOA, MUC20 و TRPM3 انخفض التعبير في المراحل اللاحقة من ccRCC (الشكل 6).


الجيل القادم من تحليل بيانات التسلسل

يقوم فريق المعلومات الحيوية لمجموعة Phalanx Biotech بمعالجة بيانات Illumina HiSeq و MiSeq و NextSeq باستخدام خطوط أنابيب NGS الجاهزة والتي تنتج حزم تحليل قياسية ومخصصة. يرجى إلقاء نظرة على المحتوى تحت كل فئة للحصول على معلومات حول نوع التحليلات التي يمكننا تقديمها. لمشاريع NGS المخصصة ، يرجى الاتصال بنا لمناقشة ما تريد رؤيته.

تسلسل mRNA (تحليل التعبير الجيني)

  • مراقبة جودة البيانات والتصفية
  • التحليل الإحصائي للجينات المعبر عنها تفاضليًا
  • علم الوجود الجيني وتحليل إثراء المسار
  • تحليل المكونات الرئيسية
  • مراقبة جودة البيانات والتصفية
  • تحليل نمط التعبير عن miRNAs المعروفة
  • تحديد miRNAs الجديدة
  • التحليل الإحصائي لل miRNAs المعبر عنها تفاضليًا
  • الهدف التنبؤ بال miRNAs الجديدة والمعروفة
  • علم الوجود الجيني وتحليل إثراء المسار للجينات المستهدفة ميرنا
  • تحليل المكونات الرئيسية

جمعية نسخة دي نوفو

  • مراقبة جودة البيانات والتصفية
  • تجميع النصوص
  • تحديد نص معروف ورواية
  • تحليل التعبير الجيني التفاضلي
  • علم الوجود الجيني وتحليل إثراء المسار
  • تحليل المكونات الرئيسية
  • رواية تنبؤ lncRNA
  • تحليل التعبير lncRNA التفاضلي
  • أعلى / أسفل تيار lncRNAs المحددة لجينات معينة
  • التنبؤ قبل ميرنا
  • مراقبة جودة البيانات والتصفية
  • عدد القراءات الأولية ، عدد القراءات التي تجتاز مراقبة الجودة ، عدد وحدات التصنيف التشغيلي (OTUs)
  • تكوين الأنواع وتحليل الوفرة
  • تعقيد عينة واحدة (تنوع ألفا)
  • اختلافات التعقيد بين العينات المختلفة (تنوع بيتا ، عينات 2)
  • تحليل المكون الرئيسي (عينات 3)
  • تجميع تكوين الأنواع بين العينات (عينات 3)
  • مراقبة جودة البيانات والتصفية
  • يقرأ محاذاة إلى الجينوم المرجعي
  • تحليل الذروة (ذروة الطول والعمق)
  • الشرح التوضيحي الذروة (توزيع الذروة ، علم الوجود الجيني وتحليل المسار للجين ذي الصلة الذروة)
  • تحديد القمم التفاضلية بين العينات
  • شرح توضيحي للقمم التفاضلية (توزيع الذروات التفاضلية ، تحليل GO و Pathway للجين ذي الصلة الذروة التفاضلية)
  • تحليل الحافز
  • مراقبة جودة البيانات والتصفية
  • يقرأ المحاذاة إلى الجينوم المرجعي البشري
  • الاتصال والتعليق التوضيحي SNP
  • التحقق من صحة SNP والمقارنة
  • التنبؤ الوظيفي لـ SNPs
  • استدعاء InDel والتعليق التوضيحي
  • التحقق من صحة InDel والمقارنة


البيانات الأولية لمجموعة TCGA هي بيانات تعداد القراءة الطبيعية (RNA-seq) لـ 18379 جينًا لـ 173 مريضًا من مرضى AML وكانت بياناتهم السريرية متاحة للجمهور على https://figshare.com/s/7c683384c6e2add08262 (معرّف figshare: 13585235). كان التعبير الجيني والبيانات السريرية لـ 405 مريضًا من مرضى AML (تم تنزيلهم من مجموعة بيانات OHSU) المستخدمة للتحقق من صحة تحليل البقاء في دراستنا متاحة للجمهور على https://figshare.com/s/7c683384c6e2add08262 (figshare ID: 13585235).

جامعة أوريغون للصحة والعلوم

موسوعة كيوتو للجينات والجينوم

تحليل شبكة الارتباط الموزون

نسبة خلايا نخاع العظم

الوحدة الشاملة المرتبطة بالبقاء 1

الوحدة الشاملة المرتبطة بالبقاء 2


مراجع

هاناهان د ، واينبرغ را. بصمات السرطان: الجيل القادم. زنزانة. 2011144 (5): 646–74.

Michalopoulos GK. مبادئ تجديد الكبد ونموه الاتزان. كومبر فيسيول. 20133 (1): 485-513.

Ozaki M. الآليات الخلوية والجزيئية لتجديد الكبد: تكاثر ونمو وموت وحماية خلايا الكبد. خلية سيمين ديف بيول. 2020100: 62-73.

Tang F و Barbacioru C و Wang Y و Nordman E و Lee C و Xu N وآخرون. mRNA-Seq تحليل كامل النسخ لخلية واحدة. طرق نات. 20096 (5): 377–82.

Tabula Muris Consortium التنسيق العام التنسيق اللوجستي جمع الأعضاء ومعالجتها إعداد المكتبة وتسلسلها ، وآخرون. تقوم النسخ أحادية الخلية المكونة من 20 عضوًا من الفئران بإنشاء Tabula Muris. طبيعة سجية. 2018562 (7727): 367–72.

هان إكس ، تشو زد ، فاي إل ، صن إتش ، وانغ آر ، تشن واي ، وآخرون. بناء منظر طبيعي للخلية البشرية على مستوى الخلية الواحدة. طبيعة سجية. 2020581: 303-9.

هان إكس ، وانغ آر ، تشو واي ، فاي إل ، صن إتش ، لاي إس ، وآخرون. رسم خرائط أطلس خلية الماوس بواسطة microwell-Seq. زنزانة. 2018172 (5): 1091-1107 e17.

راماشاندران ف ، ماتشيت كي بي ، دوبي آر ، ويلسون-كاناموري جونيور ، هندرسون نورث كارولاينا. تقنيات الخلية الواحدة في علم الكبد: رؤى جديدة في بيولوجيا الكبد وتسبب المرض. نات القس Gastroenterol Hepatol. 202017: 457–72.

Ganz T. Hepcidin ، المنظم الرئيسي لاستقلاب الحديد ووسيط فقر الدم الناتج عن الالتهاب. دم. 2003102 (3): 783-8.

تورتي إس في ، تورتي إف إم. الحديد والسرطان: المزيد من الخامات ليتم تعدينها. نات ريف السرطان. 201313 (5): 342-55.

Vela D ، Vela-Gaxha Z. التنظيم التفاضلي للهيبسيدين في الأنسجة السرطانية وغير السرطانية وآثارها السريرية. إكسب مول ميد. 201850 (2): e436.

Shen Y و Li X و Su Y و Badshah SA و Zhang B و Xue Y وآخرون. يساهم تنظيم HAMP في الإصابة بسرطان الخلايا الكبدية العدوانية عبر آلية تتوسط فيها مسار كيناز 1 / STAT3 المعتمد على Cyclin4. التشخيصات (بازل). 20199 (2): 48.

Michels K و Nemeth E و Ganz T و Mehrad B. Hepcidin ودفاع المضيف ضد الأمراض المعدية. بلوس باثوج. 201511 (8): e1004998.

Ramakrishnan L و Pedersen SL و Toe QK و West LE و Mumby S و Casbolt H وآخرون. ينظم محور Hepcidin / Ferroportin تكاثر خلايا العضلات الملساء في الشريان الرئوي. مندوب علوم .20188 (1): 12972.

دا هوانغ دبليو ، شيرمان بي تي ، ليمبيكي را. تحليل منهجي وتكاملي لقوائم الجينات الكبيرة باستخدام موارد DAVID للمعلوماتية الحيوية. نات بروتوك. 20094 (1): 44-57.

اتحاد GTEx. علم الجينوم البشري. التحليل التجريبي للتعبير الوراثي عن الأنسجة (GTEx): تنظيم الجينات المتعددة الأنسجة في البشر. علم. 2015348 (6235): 648-60.

Tomczak K، Czerwinska P، Wiznerowicz M. أطلس جينوم السرطان (TCGA): مصدر لا حصر له للمعرفة. كونتيمب أونكول (بوزن). 201519 (1A): A68-77.

Lee H، Palm J، Grimes SM، Ji HP. The Cancer Genome Atlas Clinical Explorer: واجهة الويب والجوال لتحديد ارتباطات المحرك الجينومي السريري. جينوم ميد. 20157: 112.

Gong T و Zhang C و Ni X و Li X و Li J و Liu M وآخرون. أطلس متعدد الأوميات تم حله بمرور الوقت لكبد الفأر النامي. الدقة الجينوم. 202030 (2): 263-75.

كو إس ، راسل جو ، مولينا إل إم ، مونغا إس بي. أسلاف الكبد ودونة الخلايا البالغة في إصابة الكبد وإصلاحه: المعروف وغير المعروف. Annu القس باتول. 202015: 23-50.

Satija R ، Farrell JA ، Gennert D ، Schier AF ، Regev A. إعادة البناء المكاني لبيانات التعبير الجيني أحادي الخلية. Nat Biotechnol. 201533 (5): 495-502.

هي J و Zuo Q و Hu B و Jin H و Wang C و Cheng Z وآخرون. يعمل RNA LINC01093 الجديد غير المشفر الخاص بالكبد على منع تطور سرطان الكبد عن طريق التفاعل مع IGF2BP1 لتسهيل تحلل GLI1 mRNA. ليت السرطان. 2019450: 98-109.

Liu H، Zhang L، Wang P. العامل المكمّل Hrelated 3 overexpression يؤثر على انتشار سرطان الخلايا الكبدية وموت الخلايا المبرمج. مندوب مول ميد .201920 (3): 2694-702.

Sanjurjo L و Amezaga N و Aran G و Naranjo-Gomez M و Arias L و Armengol C et al. محور CD5L / AIM-CD36 البشري: محفز الالتهام الذاتي الجديد في البلاعم التي تعدل الاستجابات الالتهابية. الالتهام الذاتي. 201511 (3): 487-502.

تريندر إم ، بويد ج إتش ، برونهام إل آر. التنظيم الجزيئي لمستويات الدهون في البلازما أثناء الالتهاب الجهازي والإنتان. ليبيدول بالعملة. 201930 (2): 108-16.

Kraal G ، van der Laan LJ ، Elomaa O ، Tryggvason K. مستقبلات الضامة MARCO. الميكروبات تصيب. 20002 (3): 313-6.

هاريسون را. المسار السليم: "مسار تنشيط بديل" أم "حلقة تضخيم حرجة" لتنشيط C3 و C5؟ سيمين إمونوباثول. 201840 (1): 15–35.

MacParland SA و Liu JC و Ma XZ و Innes BT و Bartczak AM و Gage BK وآخرون. يكشف تسلسل الحمض النووي الريبي أحادي الخلية للكبد البشري عن مجموعات بلاعم داخل الكبد متميزة. نات كومون. 20189 (1): 4383.

Ma L و Hernandez MO و Zhao Y و Mehta M و Tran B و Kelly M et al. يدفع التنوع البيولوجي للخلايا السرطانية إلى إعادة برمجة البيئة المكروية في سرطان الكبد. الخلايا السرطانية. 201936 (4): 418-430 e6.

Lim HY و Sohn I و Deng S و Lee J و Jung SH و Mao M et al. التنبؤ بالبقاء الخالي من الأمراض في سرطان الخلايا الكبدية عن طريق التنميط الجيني للتعبير. آن سورج أونكول. 201320 (12): 3747–53.

Brissot P، Pietrangelo A، Adams PC، de Graaff B، McLaren CE، Loreal O. Haemochromatosis. نات ريف ديس برايمرز. 20184: 18016.

Sebastiani G، Wilkinson N، Pantopoulos K. الاستهداف الدوائي لمحور الهيبسيدين / الفيروبورتين. فارماكول الجبهة. 20167: 160.


نتائج

تعديلات التعبير الجيني المعتمدة على الوقت في خط خلايا سرطان المعدة MKN74 المعالجة بـ E. faecalis

تم تحليل بيانات التعبير الجيني بالكامل عن طريق الانحدار الخطي لتحديد تغييرات التعبير الجيني بين يوم التحكم الأول ، واليوم المصاب الأول ، ومجموعات اليوم الخامس المصابة من خلايا سرطان المعدة البشري MKN74. وفقًا للنتائج ، هناك 138 جينًا يقابل 165 مجموعة مسبار بقيمة انحراف معياري أعلى من 1.0 ، ص قيمة أقل من 0.05 ، وبيرسون ر أظهرت القيمة أعلى من 0.99 تغييرًا مهمًا إحصائيًا في التعبير. لمزيد من التحليلات ، ركزنا على هذه الجينات التي غيرت تنوع التعبير بين المجموعات. في الوقت المعتمد E. faecalis- المجموعات المعالجة ، كانت 10 مجموعات مجسات مرتبطة بشكل إيجابي ومُنظَّمة ، و 155 مجموعة مجسات كانت مرتبطة سلبًا ومُنظَّمة (الجدول التكميلي 1).

أظهر التحليل العنقودي الهرمي تغيرات في الجينات بين 3 مجموعات معينة في اليوم الأول للسيطرة ، واليوم الأول المصاب ، واليوم الخامس المصاب. النتائج التي تم تحديدها على أنها 155 من مجموعات التحقيق كانت مرتبطة بشكل سلبي ، وتم التعبير عنها بشكل كبير في مجموعة التحكم في اليوم الأول ، وانخفض التعبير في يوم الإصابة مجموعة واحدة وما إلى ذلك في مجموعة اليوم الخامس المصابة. وعلى العكس من ذلك ، كانت 10 من مجموعات المجسات مرتبطة بشكل إيجابي ، وتم التعبير عن انخفاض في مجموعة التحكم في اليوم الأول ، وزاد التعبير في اليوم الأول المصاب وما إلى ذلك في مجموعة اليوم الخامس المصابة. تم تصور أفضل 50 جينًا في الشكل وتم إعطاء الباقي كبيانات تكميلية (الشكل 1) (الأشكال التكميلية 1 ، 2 ، 3). لذلك ، كانت هناك جينات متغيرة بشكل كبير بين المجموعات الضابطة والمجموعات المعالجة.

تجميع هرمي لـ 138 جينًا مهمًا إحصائيًا / 165 مجموعة مسبار في المجموعات الثلاث المحددة. يكشف التحليل عن تعابير حساسة منخفضة (أخضر) ، ومتوسط ​​(أسود) ، وتعبيرات عالية (أحمر) لـ 138 جينًا ليوم التحكم الأول ، واليوم الأول المصاب ، واليوم الخامس المصاب. تم إعطاء أفضل 50 جينًا في الشكل

التغيرات الجينية بسبب العلاج ب E. faecalis

لتحديد ما إذا كان هذا التغيير في التعبير ناتجًا عن E. faecalis أو السرطان نفسه ، تحليلات التباين و ر تم إجراء الاختبار بين مجموعات يوم التحكم 5 ومجموعات اليوم 5 المصابة 138 جينًا / 165 بيانات تعبير مجموعة التحقيق. لتحليل تغيير التعبير الجيني بشكل أفضل ، تم اختيار مجموعة طويلة المدى "مصاب باليوم 5" لتحليل التباين و ر اختبار. وبالتالي ، فإن 12 جينة ذات دلالة إحصائية (NDC80 ، NCAPG ، CENPA ، KIF23 ، BUB1B ، BUB1 ، CASC5 ، KIF2C ، CENPF ، SPC25 ، SMC4 ، KIF20A) المقابلة 15 مجموعة مسبار مع انحراف معياري أعلى من 1.0 و a ر اختبار ص تم تحديد قيمة أقل من 0.01 (الجدول 1) (الشكل التكميلي 4).

في تحليل الانحدار الخطي ، وجد أن كل هذه الجينات الـ 12 مرتبطة بشكل سلبي وغير منظمة. يوضح الشكل 2 التغييرات في التعبير عن هذه الجينات الـ 12 على أساس الوقت بين يوم التحكم 1 واليوم المصاب 1 واليوم المصاب 5 (الشكل 2). لقد ثبت أن التعبيرات الجينية تتناقص مع تقدم عملية العدوى في كل هذه الجينات الـ 12.

اثنا عشر جينًا / 15 مجموعة مسبار تظهر انخفاضًا ملحوظًا في التنظيم بعد العلاج بالعدوى الحية. تم الكشف عن تغييرات ذات دلالة إحصائية بين يوم التحكم 1 ، واليوم 1 المصاب ، واليوم 5 المصاب لجميع مجموعات التحقيق

بناء الشبكة وتحديد الجينات الرئيسية المرشحة باستخدام التفاعل الجيني

تم إجراء تحليل الشبكة باستخدام Cytoscape لإثبات الارتباط البيولوجي لهذه الجينات الـ 12 التي انخفض تعبيرها من اليوم الأول إلى اليوم الخامس أثناء الإصابة. كما يتضح من الشكل ، فقد تبين أن الجينات الـ 12 التي حددناها لها علاقة شبكة قوية بين بعضها البعض ومع الجينات المرشحة الأخرى (الشكل 3). يضيء خط الربط بين الجينات شبكة هذه الجينات. يحدد سمك خط الربط قوة اتصال الجينات ذات الصلة. على سبيل المثال ، يمثل خط الربط بين NCAPG و SMC4 أحد أكثر الخطوط سمكًا. يشير هذا إلى أن الارتباط المتكون بين هذه الجينات قد تم تحديده ليكون أقوى من خلال الدراسة بشكل أكثر وضوحًا. بالإضافة إلى ذلك ، تشير العقد السوداء إلى الجينات المستهدفة التي قدمها المؤلفون. من ناحية أخرى ، توضح العقد الرمادية الجينات المرتبطة بالجينات التي يحددها تطبيق GeneMANIA.

تحليل شبكة 12 جينًا ذات دلالة إحصائية. يوضح الشكل أن هذه الجينات الـ 12 لديها اتصال شبكة قوي (Cytoscape). يضيء خط الربط بين الجينات شبكة الجينات. يحدد سمك خط الربط قوة اتصال الجينات ذات الصلة. يشير هذا إلى أن الارتباط المتكون بين هذه الجينات قد تم تحديده ليكون أقوى من خلال الدراسة بشكل أكثر وضوحًا. بالإضافة إلى ذلك ، تشير العقد السوداء إلى الجينات المستهدفة التي قدمها المؤلفون. من ناحية أخرى ، توضح العقد الرمادية الجينات المرتبطة بالجينات التي يحددها تطبيق GeneMANIA. حجم العقد يرتبط ارتباطًا مباشرًا بالنتيجة

الإثراء الوظيفي للجينات والارتباطات مع المسارات

تم إجراء تحليل مسار العمليات البيولوجية باستخدام برنامج DAVID للكشف عن علاقة هذه الجينات الـ 12 بالوظائف والمسارات الخلوية وفهم معناها الجديد. تم تحديد المسارات الأربعة المهمة مثل دورة الخلية ، واستقلاب بيريميدين ، وإصلاح عدم التطابق ، ومسار إشارات P53 المرتبط بـ 12 جينًا أثناء التعرض لـ E. faecalis. إن علاقة هذه المسارات بتطور السرطان ، مثل أهمية دورة الخلية في خلايا سرطان المعدة ، واضحة جدًا (الجدول 2).

مجموعات الجينات المخصبة بشكل كبير و ES ، NES ، NOM ص القيمة ، FWER ص القيمة و FDR ف القيمة الممثلة في الجدول التكميلي 2. وفقًا لـ GSEA ، تم العثور على نقطة تفتيش دورة الخلية وكذلك مجموعة الجينات الخاصة بنقطة تفتيش دورة الخلية الانقسامية على أنها مرتبطة بشكل كبير بالجينات الموجودة في البيانات. ترتبط مجموعات الجينات هذه بتحليل المسار في الجدول 2 ودراسات أخرى مؤكدة. كانت الجينات المخصبة هي NCD80 و BUB1 و BUB1B و CENPF في هاتين المجموعتين من الجينات.

أيضًا ، أظهر الشكل 4 مخطط مجموعة الجينات لنقطة تفتيش دورة الخلية. أظهر هذا الرسم البياني جينات ذات NCD80 و BUB1 و BUB1B و CENPF المخصب في مجموعة يوم التحكم 5 ، والتي تسمى أيضًا مرتبطة بشكل إيجابي. من ناحية أخرى ، تم تنظيم نفس الجينات وارتباطها سلبًا في مجموعة اليوم الخامس المصابة. تم الحصول على نفس النتائج لمجموعة الجينات نقطة تفتيش دورة الخلية الانقسامية (الشكل 5).

تم تمثيل مخطط تخصيب نقطة تفتيش دورة الخلية. يشير الخط الأسود المستقيم إلى الجينات المخصبة في المجموعات. يحتوي الجزء الأحمر على الجينات التي ترتبط ارتباطًا إيجابيًا بمجموعة اليوم 5 الضابطة وتم تنظيمها في يوم التحكم 5. في الوقت الحالي ، يتضمن الخط الأزرق الجينات ذات التنظيم المنخفض أو بعبارة أخرى التي تخضع للتنظيم السلبي والتي تنتمي إلى اليوم 5 المصاب

تم تمثيل مخطط تخصيب نقطة تفتيش دورة الخلية الانقسامية. يشير الخط الأسود المستقيم إلى الجينات المخصبة في المجموعات. يحتوي الجزء الأحمر على الجينات التي ترتبط ارتباطًا إيجابيًا بمجموعة اليوم الخامس الضابطة وتم تنظيمها في يوم التحكم 5. وفي الوقت الحالي ، يتضمن الخط الأزرق الجينات المنظمة أو التي تخضع للتنظيم السلبي والتي تنتمي إلى اليوم الخامس المصاب


المواد والأساليب

يتم تقسيم الإجراء إلى ثلاثة أجزاء متميزة ، كما هو موضح في المربع 1. الجزء الأول هو إنشاء شبكة BCI المتكاملة. الجزء الثاني هو تحليل النمط الظاهري لتحديد التفاعلات غير المنظمة. الجزء الثالث هو تحليل التخصيب وتسجيل الجينات. تم إجراء المقارنة المعيارية ضد ثلاثة أورام ليمفاوية من الخلايا البائية مع آفات سرطانية معروفة ، وضد عينات خط خلية راموس التي تم تحفيز CD40. يتم تلخيص الخطوات الثلاث أدناه. يتوفر وصف أكثر تفصيلاً في المعلومات التكميلية.

تجميع الشبكة

إن BCI عبارة عن شبكة تفاعلية مختلطة تتكون من تفاعلات البروتين والبروتين (PP) والبروتين والحمض النووي (PD) في سياق الخلية B البشرية (Lefebvre وآخرون، 2007). يتضمن الأول كلاً من تفاعلات البروتين المعقدة والتفاعلات العابرة ، مثل تلك التي تدعم مسارات الإشارات. تم تحسين هذه الشبكة منذ ذلك الحين (C Lefebvre وآخرون، قيد التحضير) لتضمين تفاعلات ما بعد الترجمة الإضافية التي تنبأت بها خوارزمية MINDy (Wang وآخرون، 2006). تتضمن هذه التفاعلات تلك الحالات التي يتم فيها تعديل قدرة عامل النسخ (TF) على تنظيم هدفه (أهدافه) (T) بواسطة بروتين ثالث (M) (على سبيل المثال ، كيناز منشط). يتم إنشاء BCI باستخدام أدلة "المعيار الذهبي" من قواعد البيانات المنسقة ، من خلال تطبيق مصنف Naïve Bayes لدمج عدد كبير من الأدلة التجريبية والحاسوبية. يتم استخلاص الأدلة من عدة مصادر ، بما في ذلك التنقيب عن الأدب من GeneWays (Rzhetsky وآخرون، 2004) ، وإثراء عزر ربط عامل النسخ ، والتفاعلات التقويمية من الكائنات الحية النموذجية ، وخوارزميات الهندسة العكسية ، بما في ذلك ARACNe (Basso وآخرون.، 2005 مارغولين وآخرون، 2006) و MINDy للتفاعلات التنظيمية وما بعد الترجمة ، على التوالي. تم إنشاء نسبة احتمالية (LR) لكل مصدر دليل باستخدام مجموعات المعايير الذهبية الإيجابية والسلبية. يتم بعد ذلك دمج LRs الفردية في LR عالمي لكل تفاعل. عتبة مقابلة لاحتمال لاحق صتم استخدام ⩾0.5 لتأهيل التفاعلات على أنها حاضرة أو غائبة. انظر المعلومات التكميلية للحصول على تفاصيل كاملة عن الطريقة.

تحليل عدم التنظيم

تم إجراء التحليل باستخدام خلاصة وافية كبيرة تضم أكثر من 200 ملف تعريف لتعبير ميكروأري في الخلايا البائية (BCGEP) ، بما في ذلك الأنسجة الأولية وكذلك عينات خط الخلية ، المتوفرة في NIH Gene Expression Omnibus (GSE2350). تم تهجين العينات في هذه المجموعة إلى Affymetrix HG-U95Av2 GeneChip ®. بعد تصفية التحقيقات غير المفيدة (تلك التي تحتوي على أقل من متوسط ​​50 ومعامل تباين أقل من 0.3 في BCGEP) ، بقي 7907 للتحليل. تم إجراء التجميع الهرمي لتحديد مجموعات النمط الظاهري المتجانسة نسبيًا المناسبة لهذا التحليل. تضمنت الأنماط الظاهرية المعيارية الثلاثة المستخدمة BL (26 عينة نقية وغير منقاة) و FL (ست عينات منقية) و MCL (ثماني عينات منقاة). تضمنت الأنماط الظاهرية الأخرى الممثلة في مجموعة البيانات هذه المركز الجرثومي (GC) ، والساذجة (N) ، والذاكرة (M) ، و CLL من مجموعات فرعية متحولة (CLL-mut) وغير مطورة (CLL-unmut) ، ورم الغدد الليمفاوية B-cell المنتشر (DLCL) ، وسرطان الغدد الليمفاوية الانصباب الأولي (PEL). يمكن رؤية قائمة بالأنماط الظاهرية السرطانية التي تم تحليلها في الجدول الثاني. لتحليل اضطراب CD40 ، تم استخدام مجموعة من 24 عينة خط خلية راموس محفزة بـ CD40 على خلفية 43 عينة راموس.

لكل نمط ظاهري ، تم تحليل كل تفاعل BCI بالتسلسل لتحديد ما إذا كان يمكن تصنيفها إما على أنها GoC أو LoC أو بدون تغيير (NC). اعتمد الاختبار على تقدير MI بين ملامح التعبير للجينين في التفاعل. MI هو مقياس نظري للمعلومات للاعتماد الإحصائي ، وهو صفر إذا وفقط إذا كان متغيرين مستقلين إحصائيًا. تم حسابه باستخدام تقدير نواة Gaussian (Margolin وآخرون، 2006). على وجه التحديد ، قمنا باختبار ما إذا كان MI زاد (LoC) أو انخفض (GoC) عندما تمت إزالة العينات المقابلة للنمط الظاهري المحدد من الخلاصة الكاملة (المستخدمة لحساب الخلفية MI). تم حساب التوزيع الفارغ لتقييم الأهمية الإحصائية لتغيير MI كدالة لخلفية MI وعدد العينات التي تمت إزالتها. مزيد من التفسيرات التفصيلية لأحداث LoC و GoC موضحة في المربع 1. انظر التفاصيل الكاملة في المعلومات التكميلية.

التهديف

تم تسجيل الجينات من خلال إثراء شبكة جوارها المباشر في تفاعلات GoC / LoC ، باستخدام اختبار فيشر الدقيق. على وجه التحديد ، لكل من LoC و GoC ، اثنان جزئي ص- تم حساب القيم بشكل منفصل ، بناءً على عدد التفاعلات غير المنظمة التي شارك فيها الجين بشكل مباشر أو كان يعدل داخل جواره المباشر. عالمي ص-تم حساب القيمة على أنها حاصل ضرب الأجزاء الأربعة ص-القيم. يمكن رؤية جميع إجماليات الدرجات في المعلومات التكميلية ، حيث تكون النتيجة هي السجل السلبي للعامة ص-القيمة.

المرجعية

قمنا بقياس أداء هذا النهج باستخدام ثلاثة أنماط ظاهرية للورم الليمفاوي مشروحة جيدًا ، حيث تم الإبلاغ عن الآفة السرطانية في الأدبيات. هؤلاء هم BL (MYC)، FL (BCL2) و MCL (BCL1/CCND1). تمت مقارنة نتائج تحليلنا مع تحليل التعبير التفاضلي التقليدي باستخدام أ ر-اختبار. كل ر- تم حساب الاختبار باستخدام البيانات المحولة log2 وأخذ كل نمط ظاهري مقابل نظيره الطبيعي (BL / GC و FL / GC و MCL / N + M) ، مع تطبيق تصحيح ويلش لمجموعات العينات ذات الأحجام المختلفة.

تم تنفيذ هذا النهج أيضًا ضد عينات خط خلية راموس ، حيث تم استخدام CD40- كان مسار الإشارات مضطربًا كيميائيًا حيويًا (إما عن طريق الزراعة المشتركة مع CD40 الخلايا الليفية المنتجة للرابط ، أو باستخدام جسم مضاد خاص بـ CD40). تم حساب التخصيب لأعلى جينات مسجلة مقابل مجموعة مرجعية مكونة من 41 جينًا لمسار إشارات CD40 باستخدام GSEA (Subramanian وآخرون، 2005). تم إنشاء هذه المجموعة المرجعية باستخدام اثنين CD40 مجموعات متاحة في قاعدة بيانات التواقيع الجزيئية ، أو MSigDB ، المتاحة مع GSEA (http://www.broad.mit.edu/gsea/msigdb/). تمت مقارنة هذه النتائج أيضًا بتحليل التعبير التفاضلي (نفس الإجراء على النحو الوارد أعلاه ، مع CD40- محفز ضد غير محفز). تم حساب تخصيب أفضل 25 جينًا في كلتا الحالتين من خلال اختبار فيشر الدقيق.

تم إجراء تصور الشبكة أيضًا لإنشاء وحدات مرضية بناءً على الجينات التي سجلت أعلى درجات في كل نمط ظاهري. تم إنتاج هذه التصورات باستخدام حزمة برامج Cytoscape (http://www.cytoscape.org/) (شانون وآخرون، 2003). تم حساب تخصيب مسارات خلوية محددة باستخدام GSEA في قائمة المجسات الأعلى مرتبة في كل نمط ظاهري ، ومقارنتها مع هذه التصورات.


شاهد الفيديو: الوراثه من الأب 7 صفات ينقلها الأب حتما بالوراثة لأولاده ستفاجئك الصفه السابعه فعلا! (كانون الثاني 2022).