معلومة

7.16: الجينوميات البيئية - علم الأحياء


7.16: علم الجينوم البيئي

معهد علم الجينوم البيئي

زملاء IWA هم من المهنيين المعترف بهم الذين قدموا مساهمات بارزة في قطاع المياه الوطني والإقليمي ، وكذلك في IWA https://iwa-network.org/news/iwa-announce-2020-fellows-and-distinguished-fellows/ زملاء ESA هم أعضاء قدموا مساهمات بارزة في مجالات العلوم المتعلقة بالبيئة. تم اختيار الدكتور زو لمساهماته الكبيرة في تطوير ونضج البيئة الميكروبية.

الفائز بجائزة ASM Environmental Research 2018.

تم الاعتراف بالدكتور تشو كعالم بارز مع إنجازات بحثية متميزة أدت إلى تحسين فهمنا للميكروبات في البيئة ، بما في ذلك البيئات المائية والأرضية والجوية من قبل الأكاديمية الأمريكية لعلم الأحياء الدقيقة.

باحث مقتبس للغاية 2018 و 2019 و 2020

كل عام ، تحدد Clarivate ™ الباحثين الأكثر نفوذاً في العالم - القلائل المختارين الذين استشهد بهم أقرانهم بشكل متكرر على مدار العقد الماضي. في عام 2020 ، حصل أقل من 6200 ، أو حوالي 0.1 ٪ ، من الباحثين في العالم ، في 21 مجالًا بحثيًا وعبر مجالات متعددة ، على هذا التميز الحصري. ينتمي الدكتور زو إلى مجموعة النخبة هذه المشهود لها بتأثيره البحثي الاستثنائي ، والذي يتجلى من خلال إنتاج العديد من الأوراق البحثية التي تم الاستشهاد بها بدرجة عالية والتي تحتل المرتبة الأولى بنسبة 1٪ من خلال الاستشهادات الميدانية والسنة في Web of Science ™ لمدة ثلاث سنوات متتالية الآن .

دكتور. ZHOU متلقي من ERNEST ORLANDO LAWRENCE AWARD

تُمنح جائزة إرنست أورلاندو لورانس للعلماء والمهندسين الأمريكيين الاستثنائيين الذين يجرون أبحاثًا تدعم مهمة وزارة الطاقة. تم اختيار مدير IEG ، Jizhong Zhou ، كواحد من تسعة متلقين في عام 2015. Jizhong (Joe) Zhou (جامعة أوكلاهوما) - تم تكريم العلوم البيولوجية والبيئية لإنجازاته البارزة في الجينوميات البيئية والإيكولوجيا الميكروبية ، بما في ذلك تطوير تقنيات الميتاجينوميات المبتكرة للعلوم البيئية ، والاكتشافات الرائدة لفهم ردود الفعل والآليات والمبادئ الأساسية للنظم الميكروبية استجابة للتغير البيئي ، والقيادة التحويلية لتوضيح الشبكات البيئية الميكروبية وربط التنوع البيولوجي الميكروبي بوظائف النظام البيئي.

R & ampD 100 من اليسار إلى اليمين: الدكتور ليو وو ، والدكتور جيزونغ زو ، والدكتور جوي فان نوستراند ، والدكتور زيلي هي

روابط سريعة


محتويات

تم استخدام مصطلح "metagenomics" لأول مرة بواسطة Jo Handelsman ، و Jon Clardy ، و Robert M. Goodman ، و Sean F. Brady ، وآخرون ، وظهر لأول مرة في النشر في عام 1998. [5] يشير مصطلح metagenome إلى فكرة أن مجموعة من الجينات يمكن تحليل التسلسل من البيئة بطريقة مماثلة لدراسة جينوم واحد. في عام 2005 ، قام Kevin Chen و Lior Pachter (باحثان في جامعة كاليفورنيا ، بيركلي) بتعريف الميتاجينوميات بأنها "تطبيق تقنية الجينوميات الحديثة دون الحاجة إلى عزل الأنواع الفردية وزراعتها في المختبر". [6]

يبدأ التسلسل التقليدي بثقافة خلايا متطابقة كمصدر للحمض النووي. ومع ذلك ، كشفت الدراسات الميتاجينومية المبكرة أنه من المحتمل وجود مجموعات كبيرة من الكائنات الحية الدقيقة في العديد من البيئات التي لا يمكن استزراعها وبالتالي لا يمكن ترتيب تسلسلها. ركزت هذه الدراسات المبكرة على متواليات الرنا الريبوزومي 16S (الرنا الريباسي) التي تكون قصيرة نسبيًا ، وغالبًا ما يتم حفظها داخل الأنواع ، وتختلف عمومًا بين الأنواع. تم العثور على العديد من متواليات الرنا الريباسي 16S التي لا تنتمي إلى أي أنواع مستزرعة معروفة ، مما يشير إلى وجود العديد من الكائنات الحية غير المعزولة. كشفت هذه المسوحات لجينات RNA الريبوزومية المأخوذة مباشرة من البيئة أن الأساليب القائمة على الزراعة تجد أقل من 1 ٪ من الأنواع البكتيرية والبدئية في العينة. [2] يأتي الكثير من الاهتمام بعلم الميتاجينوميات من هذه الاكتشافات التي أظهرت أن الغالبية العظمى من الكائنات الحية الدقيقة قد مرت دون أن يلاحظها أحد من قبل.

تم إجراء العمل الجزيئي المبكر في هذا المجال بواسطة نورمان آر بيس وزملائه ، الذين استخدموا تفاعل البوليميراز المتسلسل لاستكشاف تنوع تسلسلات الحمض النووي الريبي الريبوزومي. [7] أدت الأفكار المكتسبة من هذه الدراسات المتقدمة إلى اقتراح بيس فكرة استنساخ الحمض النووي مباشرة من العينات البيئية في وقت مبكر من عام 1985. [8] أدى ذلك إلى التقرير الأول لعزل واستنساخ الحمض النووي السائب من عينة بيئية ، والذي نشره بيس وزملاؤه في عام 1991 [9] بينما كان بيس يعمل في قسم علم الأحياء في جامعة إنديانا. ضمنت جهود كبيرة أن هذه لم تكن إيجابية كاذبة PCR ودعمت وجود مجتمع معقد من الأنواع غير المستكشفة. على الرغم من أن هذه المنهجية كانت مقصورة على استكشاف جينات الترميز غير البروتينية المحفوظة للغاية ، إلا أنها دعمت الملاحظات المبكرة القائمة على التشكل الميكروبي بأن التنوع كان أكثر تعقيدًا بكثير مما كان معروفًا عن طريق طرق الزراعة. بعد ذلك بوقت قصير ، أبلغ هيلي عن العزلة الميتاجينومية للجينات الوظيفية من "مكتبات الحيوانات" التي تم إنشاؤها من ثقافة معقدة للكائنات البيئية التي نمت في المختبر على أعشاب مجففة في عام 1995. [10] بعد مغادرة مختبر بيس ، واصل إدوارد ديلونغ عمله في هذا المجال و نشر أعمالًا أرست إلى حد كبير الأساس للتطور البيئي استنادًا إلى تسلسل التوقيع 16S ، بدءًا من بناء مجموعته للمكتبات من العينات البحرية. [11]

في عام 2002 ، استخدم Mya Breitbart و Forest Rohwer وزملاؤهم التسلسل البيئي للبنادق (انظر أدناه) لإظهار أن 200 لتر من مياه البحر تحتوي على أكثر من 5000 فيروس مختلف. [12] أظهرت الدراسات اللاحقة أن هناك أكثر من ألف نوع فيروسي في البراز البشري وربما مليون فيروسات مختلفة لكل كيلوغرام من الرواسب البحرية ، بما في ذلك العديد من العاثيات. في الأساس ، كانت جميع الفيروسات في هذه الدراسات من الأنواع الجديدة. في عام 2004 ، قام جين تايسون وجيل بانفيلد وزملاؤه في جامعة كاليفورنيا ، بيركلي ومعهد الجينوم المشترك بتسلسل الحمض النووي المستخرج من نظام تصريف المناجم الحمضية. [13] نتج عن هذا الجهد الجينوم الكامل ، أو شبه الكامل ، لحفنة من البكتيريا والجراثيم العتيقة التي قاومت سابقًا محاولات استزراعها. [14]

ابتداءً من عام 2003 ، قاد كريج فنتر ، قائد المشروع الموازي الممول من القطاع الخاص لمشروع الجينوم البشري ، الحملة العالمية لأخذ عينات المحيطات (GOS) ، حيث طاف حول العالم وجمع عينات ميتاجينية طوال الرحلة. يتم ترتيب جميع هذه العينات باستخدام تسلسل البندقية ، على أمل تحديد جينومات جديدة (وبالتالي كائنات جديدة). وجد المشروع التجريبي ، الذي تم إجراؤه في بحر سارجاسو ، الحمض النووي لما يقرب من 2000 نوع مختلف ، بما في ذلك 148 نوعًا من البكتيريا لم يسبق لها مثيل. [15] طاف فنتر حول العالم واستكشف الساحل الغربي للولايات المتحدة تمامًا ، وأكمل رحلة استكشافية لمدة عامين لاستكشاف بحر البلطيق والبحر الأبيض المتوسط ​​والبحر الأسود. كشف تحليل البيانات الميتاجينومية التي تم جمعها خلال هذه الرحلة عن مجموعتين من الكائنات الحية ، واحدة تتكون من أصناف تتكيف مع الظروف البيئية لعيد أو مجاعة ، والثانية تتكون من عدد أقل نسبيًا ولكن أكثر وفرة وعلى نطاق واسع من الأصناف المكونة أساسًا من العوالق. [16]

في عام 2005 ، نشر ستيفان سي شوستر وزملاؤه في جامعة ولاية بنسلفانيا التسلسل الأول لعينة بيئية تم إنشاؤها باستخدام تسلسل عالي الإنتاجية ، وفي هذه الحالة تسلسل حراري متوازي على نطاق واسع طورته 454 Life Sciences. [17] ظهرت ورقة بحثية أخرى في وقت مبكر في هذا المجال في عام 2006 من قبل روبرت إدواردز ، فورست روهير ، وزملائهم في جامعة ولاية سان دييغو. [18]

كان استعادة تسلسلات الحمض النووي التي تزيد عن بضعة آلاف من الأزواج الأساسية من العينات البيئية أمرًا صعبًا للغاية إلى أن سمحت التطورات الحديثة في التقنيات البيولوجية الجزيئية ببناء مكتبات في الكروموسومات الاصطناعية البكتيرية (BACs) ، والتي وفرت نواقل أفضل للاستنساخ الجزيئي. [20]

تحرير ميتاجينوميكس البندقية

ساعد التقدم في المعلوماتية الحيوية ، وتحسينات تضخيم الحمض النووي ، وانتشار القوة الحسابية إلى حد كبير في تحليل تسلسل الحمض النووي المستعاد من العينات البيئية ، مما سمح بتكييف تسلسل البنادق مع عينات ميتاجينوم (المعروف أيضًا باسم بندقية ميتاجينوم كاملة أو تسلسل WMGS). يستخدم هذا النهج لتسلسل العديد من الكائنات الحية الدقيقة المستزرعة والجينوم البشري ، ويقوم بشكل عشوائي بقص الحمض النووي ، وتسلسل العديد من المتواليات القصيرة ، وإعادة بنائها في تسلسل إجماعي. يكشف تسلسل البندقية عن الجينات الموجودة في العينات البيئية. تاريخيًا ، تم استخدام مكتبات النسخ لتسهيل هذا التسلسل. ومع ذلك ، مع التقدم في تقنيات التسلسل عالي الإنتاجية ، لم تعد خطوة الاستنساخ ضرورية ويمكن الحصول على عوائد أكبر لبيانات التسلسل بدون هذه الخطوة التي تتطلب عمالة مكثفة. توفر الميتاجينوميات البنادق الرشاشة معلومات حول كل من الكائنات الحية الموجودة وما هي عمليات التمثيل الغذائي الممكنة في المجتمع. [21] نظرًا لأن جمع الحمض النووي من البيئة لا يخضع للرقابة إلى حد كبير ، فإن الكائنات الحية الأكثر وفرة في العينة البيئية يتم تمثيلها بشكل كبير في بيانات التسلسل الناتجة. لتحقيق التغطية العالية اللازمة لحل الجينوم لأعضاء المجتمع الذين يعانون من نقص التمثيل ، هناك حاجة إلى عينات كبيرة ، غالبًا ما تكون باهظة. من ناحية أخرى ، فإن الطبيعة العشوائية لتسلسل البنادق تضمن أن العديد من هذه الكائنات ، والتي من شأنها أن تمر دون أن يلاحظها أحد باستخدام تقنيات الاستزراع التقليدية ، سيتم تمثيلها على الأقل ببعض مقاطع التسلسل الصغيرة. [13]

تحرير تسلسل عالي الإنتاجية

ميزة تسلسل الإنتاجية العالية هي أن هذه التقنية لا تتطلب استنساخ الحمض النووي قبل التسلسل ، وإزالة أحد التحيزات الرئيسية والاختناقات في أخذ العينات البيئية. استخدمت الدراسات الميتاجينومية الأولى التي أجريت باستخدام التسلسل عالي الإنتاجية التسلسل الحراري المتوازي 454. [17] هناك ثلاث تقنيات أخرى تُطبق بشكل شائع على أخذ العينات البيئية وهي آلة الجينوم الشخصي Ion Torrent ، و Illumina MiSeq أو HiSeq ونظام أبلايد بيوسيستمز SOLiD. [22] هذه التقنيات لتسلسل الحمض النووي تولد شظايا أقصر من نظام سانجر لتسلسل أيون تورنت PGM و 454 تسلسل حراري ينتج عادة

400 نقطة أساس ، تنتج Illumina MiSeq قراءات 400-700 نقطة في البوصة (اعتمادًا على ما إذا كانت خيارات النهاية المزدوجة مستخدمة) ، وتنتج SOLiD قراءات 25-75 نقطة أساس. [23] تاريخيًا ، كانت أطوال القراءة هذه أقصر بكثير من طول قراءة تسلسل سانجر النموذجي

750 نقطة أساس ، ولكن تقنية Illumina تقترب بسرعة من هذا المعيار. ومع ذلك ، يتم تعويض هذا القيد من خلال عدد أكبر بكثير من قراءات التسلسل. في عام 2009 ، تولد metagenomes المتسلسلة بالحرارة 200-500 ميجا قاعدة ، وتولد منصات Illumina حوالي 20-50 جيجا بايت ، ولكن هذه المخرجات زادت بأعداد كبيرة في السنوات الأخيرة. [24]

يجمع نهج ناشئ بين تسلسل البندقية والتقاط التشكل الكروموسوم (Hi-C) ، والذي يقيس قرب أي تسلسلين DNA داخل نفس الخلية ، لتوجيه تجميع الجينوم الميكروبي. [25] تقنيات تسلسل القراءة الطويلة ، بما في ذلك PacBio RSII و PacBio Sequel من Pacific Biosciences ، و Nanopore MinION ، GridION ، PromethION من Oxford Nanopore Technologies ، هي خيار آخر للحصول على قراءات طويلة لتسلسل البنادق التي يجب أن تسهل عملية التجميع. [26]

البيانات الناتجة عن تجارب الميتاجينوميات هائلة وصاخبة بطبيعتها ، وتحتوي على بيانات مجزأة تمثل ما يصل إلى 10000 نوع. [1] أنتج تسلسل ميتاجينوم كرش البقر 279 جيجا بايت ، أو 279 مليار زوج قاعدي من بيانات تسلسل النوكليوتيدات ، [28] بينما حدد كتالوج الجينات الميكروبيوم في الأمعاء البشرية 3.3 مليون جين تم تجميعها من 567.7 جيجا بايت من بيانات التسلسل. [29] يمثل جمع المعلومات البيولوجية المفيدة وتنظيمها واستخراجها من مجموعات البيانات بهذا الحجم تحديات حسابية كبيرة للباحثين. [21] [30] [31] [32]

تحرير التصفية المسبقة للتسلسل

تتطلب الخطوة الأولى في تحليل البيانات الميتاجينومية تنفيذ بعض خطوات التصفية المسبقة ، بما في ذلك إزالة المتواليات الزائدة عن الحاجة ومنخفضة الجودة وتسلسلات الأصل المحتمل لحقيقة النواة (خاصة في metagenomes من أصل بشري). [33] [34] تشمل الطرق المتاحة لإزالة تسلسل الحمض النووي الجيني حقيقيات النواة الملوثة Eu-Detect و DeConseq. [35] [36]

تحرير التجميع

بيانات تسلسل الحمض النووي من المشاريع الجينومية والميتاجينومية هي نفسها بشكل أساسي ، لكن بيانات التسلسل الجيني توفر تغطية أعلى بينما البيانات الميتاجينومية عادةً ما تكون غير زائدة عن الحاجة. [31] علاوة على ذلك ، فإن الاستخدام المتزايد لتقنيات التسلسل من الجيل الثاني مع أطوال قراءة قصيرة يعني أن الكثير من البيانات الميتاجينومية المستقبلية ستكون عرضة للخطأ. هذه العوامل مجتمعة تجعل تجميع القراءات الميتاجينومية في الجينوم أمرًا صعبًا وغير موثوق به. يحدث الاختلال في التجميع بسبب وجود تسلسلات الحمض النووي المتكررة التي تجعل التجميع صعبًا بشكل خاص بسبب الاختلاف في الوفرة النسبية للأنواع الموجودة في العينة. [37] يمكن أن تتضمن اختلالات التجميع أيضًا توليفة من متواليات من أكثر من نوع واحد في كونتيجس كيميري. [37]

هناك العديد من برامج التجميع ، يمكن لمعظمها استخدام معلومات من علامات النهاية المزدوجة من أجل تحسين دقة التجميعات. تم تصميم بعض البرامج ، مثل Phrap أو Celera Assembler ، لاستخدامها في تجميع جينومات مفردة ولكنها مع ذلك تنتج نتائج جيدة عند تجميع مجموعات البيانات الميتاجينومية. [1] تم تحسين البرامج الأخرى ، مثل مجمّع Velvet ، للقراءات الأقصر الناتجة عن تسلسل الجيل الثاني من خلال استخدام الرسوم البيانية لـ de Bruijn. [38] [39] يسمح استخدام الجينوم المرجعي للباحثين بتحسين تجميع أكثر أنواع الميكروبات وفرة ، ولكن هذا النهج مقيد بمجموعة فرعية صغيرة من الشعب الميكروبية التي تتوفر لها الجينومات المتسلسلة. [37] بعد إنشاء التجميع ، فإن التحدي الإضافي هو "التفكك الميتاجينومي" ، أو تحديد التسلسل الذي يأتي من أي الأنواع في العينة. [40]

تحرير التنبؤ الجيني

تستخدم خطوط أنابيب التحليل Metagenomic طريقتين في شرح مناطق الترميز في contigs المجمعة. [37] النهج الأول هو تحديد الجينات بناءً على التماثل مع الجينات المتوفرة بالفعل للجمهور في قواعد بيانات التسلسل ، عادةً عن طريق عمليات البحث بلاست. يتم تنفيذ هذا النوع من النهج في برنامج MEGAN4. [41] الثانية ، البداية، يستخدم السمات الجوهرية للتسلسل للتنبؤ بمناطق الترميز بناءً على مجموعات التدريب الجيني من الكائنات الحية ذات الصلة. هذا هو النهج الذي تتبعه برامج مثل GeneMark [42] و GLIMMER. الميزة الرئيسية لـ البداية التنبؤ هو أنه يمكّن من اكتشاف مناطق الترميز التي تفتقر إلى المتماثلات في قواعد بيانات التسلسل ، ومع ذلك ، فإنه يكون أكثر دقة عندما تكون هناك مناطق كبيرة من الحمض النووي الجيني المتجاور المتاحة للمقارنة. [1]

تنوع الأنواع تحرير

توفر الشروح الجينية "ماذا" ، بينما توفر قياسات تنوع الأنواع "من". [43] من أجل ربط تكوين المجتمع ووظيفته في الميتاجينومات ، يجب إهمال التسلسلات. Binning هي عملية ربط تسلسل معين بكائن حي. [37] في binning القائم على التشابه ، تُستخدم طرق مثل BLAST للبحث السريع عن علامات التطور أو التسلسلات المماثلة في قواعد البيانات العامة الحالية. يتم تنفيذ هذا النهج في MEGAN. [44] أداة أخرى ، PhymmBL ، تستخدم نماذج ماركوف المحرفة لتعيين القراءات. [1] MetaPhlAn و AMPHORA هما طريقتان تستندان إلى علامات فريدة خاصة بالكليد لتقدير الوفرة النسبية للكائنات الحية مع تحسين الأداء الحسابي. [45] أدوات أخرى ، مثل mOTUs [46] [47] و MetaPhyler ، [48] تستخدم جينات الواسمات العالمية لتوصيف الأنواع بدائية النواة. باستخدام ملف تعريف mOTUs ، من الممكن تحديد الأنواع التي لا تحتوي على جينوم مرجعي ، وتحسين تقدير تنوع المجتمع الميكروبي. [47] الأساليب الحديثة ، مثل SLIMM ، تستخدم تغطية قراءة الجينوم المرجعي الفردي لتقليل النتائج الإيجابية الكاذبة والحصول على وفرة نسبية موثوقة. [49] في التجميع القائم على التركيب ، تستخدم الطرق السمات الجوهرية للتسلسل ، مثل ترددات قليل النوكليوتيد أو تحيز استخدام الكودون. [1] بمجرد إهمال التسلسلات ، من الممكن إجراء تحليل مقارن للتنوع والثراء.

تكامل البيانات تحرير

يُعد الكم الهائل من بيانات التسلسل المتزايدة بشكل كبير تحديًا شاقًا معقدًا بسبب تعقيد البيانات الوصفية المرتبطة بمشاريع الميتاجينوم. تتضمن البيانات الوصفية معلومات مفصلة حول الجغرافيا ثلاثية الأبعاد (بما في ذلك العمق أو الارتفاع) والخصائص البيئية للعينة ، والبيانات المادية حول موقع العينة ، ومنهجية أخذ العينات. [31] هذه المعلومات ضرورية لضمان إمكانية تكرارها ولتمكين التحليل النهائي. نظرًا لأهميتها ، تتطلب البيانات الوصفية ومراجعة البيانات التعاونية وتنظيمها تنسيقات بيانات موحدة موجودة في قواعد البيانات المتخصصة ، مثل قاعدة بيانات الجينوم على الإنترنت (GOLD). [50]

تم تطوير العديد من الأدوات لدمج البيانات الوصفية وبيانات التسلسل ، مما يسمح بالتحليلات المقارنة لمجموعات البيانات المختلفة باستخدام عدد من المؤشرات البيئية. في عام 2007 ، أصدر فولكر ماير وروبرت إدواردز وفريق في مختبر أرغون الوطني وجامعة شيكاغو التعليق التوضيحي السريع Metagenomics باستخدام خادم تكنولوجيا النظام الفرعي (MG-RAST) وهو مورد مجتمعي لتحليل مجموعة بيانات الميتاجينوم. [51] اعتبارًا من يونيو 2012 تم تحليل أكثر من 14.8 تيراباسات (14 × 10 12 قاعدة) من الحمض النووي ، مع أكثر من 10000 مجموعة بيانات عامة متاحة مجانًا للمقارنة داخل MG-RAST. أكثر من 8000 مستخدم قدم الآن ما مجموعه 50000 ميتاجينوم إلى MG-RAST. يوفر نظام الجينومات الميكروبية المتكاملة / الميتاجينومات (IMG / M) أيضًا مجموعة من الأدوات للتحليل الوظيفي للمجتمعات الميكروبية بناءً على تسلسل الميتاجينوم الخاص بها ، بناءً على جينومات العزلة المرجعية المتضمنة في نظام الجينوم الميكروبي المتكامل (IMG) والموسوعة الجينومية لـ مشروع البكتيريا والأركيا (GEBA). [52]

كانت إحدى الأدوات المستقلة الأولى لتحليل بيانات بندقية ميتاجينوم عالية الإنتاجية هي MEGAN (محلل الجينوم MEta). [41] [44] تم استخدام النسخة الأولى من البرنامج في عام 2005 لتحليل السياق الميتاجينومي لتسلسلات الحمض النووي التي تم الحصول عليها من عظم الماموث. [17] استنادًا إلى مقارنة BLAST بقاعدة بيانات مرجعية ، تقوم هذه الأداة بتنفيذ كل من التصنيف والوظيفة binning ، عن طريق وضع القراءات على العقد الخاصة بتصنيف NCBI باستخدام خوارزمية بسيطة للأصل المشترك (LCA) أو على عقد SEED أو تصنيفات KEGG ، على التوالي. [53]

مع ظهور أدوات التسلسل السريع وغير المكلف ، أصبح نمو قواعد بيانات تسلسل الحمض النووي الآن أسيًا (على سبيل المثال ، قاعدة بيانات NCBI GenBank [54]). هناك حاجة إلى أدوات أسرع وفعالة لمواكبة التسلسل عالي الإنتاجية ، لأن الأساليب القائمة على BLAST مثل MG-RAST أو MEGAN تعمل ببطء لتعليق العينات الكبيرة (على سبيل المثال ، عدة ساعات لمعالجة مجموعة بيانات / عينة صغيرة / متوسطة الحجم [55]). وهكذا ، ظهرت مؤخرًا المصنفات فائقة السرعة ، بفضل الخوادم القوية ذات الأسعار المعقولة. يمكن لهذه الأدوات إجراء التعليقات التوضيحية التصنيفية بسرعة عالية للغاية ، على سبيل المثال CLARK [56] (وفقًا لمؤلفي CLARK ، يمكنها تصنيف "32 مليون قراءة ميتاجينومية قصيرة في الدقيقة" بدقة. بهذه السرعة ، يمكن معالجة مجموعة بيانات / عينة كبيرة جدًا من مليار قراءة قصيرة في حوالي 30 دقيقة.

مع تزايد توافر العينات التي تحتوي على الحمض النووي القديم وبسبب عدم اليقين المرتبط بطبيعة تلك العينات (تلف الحمض النووي القديم) ، تم توفير أداة سريعة قادرة على إنتاج تقديرات تشابه متحفظة. وفقًا لمؤلفي FALCON ، يمكنه استخدام عتبات مريحة وتعديل المسافات دون التأثير على أداء الذاكرة والسرعة.

تعديل الميتاجينوميات المقارن

يمكن أن توفر التحليلات المقارنة بين الميتاجينومات نظرة ثاقبة إضافية على وظيفة المجتمعات الميكروبية المعقدة ودورها في صحة المضيف. [58] يمكن إجراء مقارنات زوجية أو متعددة بين metagenomes على مستوى تكوين التسلسل (مقارنة محتوى GC أو حجم الجينوم) ، أو التنوع التصنيفي ، أو المكمل الوظيفي. يمكن إجراء مقارنات بين التركيبة السكانية والتنوع الوراثي على أساس 16S وجينات واصمات النشوء والتطور الأخرى ، أو - في حالة المجتمعات منخفضة التنوع - عن طريق إعادة بناء الجينوم من مجموعة البيانات metagenomic. [59] يمكن إجراء المقارنات الوظيفية بين metagenomes من خلال مقارنة التسلسلات مع قواعد البيانات المرجعية مثل COG أو KEGG ، وجدولة الوفرة حسب الفئة وتقييم أي اختلافات للأهمية الإحصائية. [53] يؤكد هذا النهج المتمحور حول الجينات على المكمل الوظيفي لـ تواصل اجتماعي ككل بدلاً من المجموعات التصنيفية ، ويظهر أن المكملات الوظيفية متشابهة في ظل ظروف بيئية مماثلة. [59] وبالتالي ، فإن البيانات الوصفية المتعلقة بالسياق البيئي للعينة الميتاجينومية مهمة بشكل خاص في التحليلات المقارنة ، لأنها توفر للباحثين القدرة على دراسة تأثير الموطن على بنية المجتمع ووظيفته. [1]

بالإضافة إلى ذلك ، استخدمت العديد من الدراسات أيضًا أنماط استخدام قليل النوكليوتيد لتحديد الاختلافات عبر المجتمعات الميكروبية المتنوعة. تتضمن أمثلة هذه المنهجيات نهج الوفرة النسبية للديوكليوتيدات بواسطة Willner et al. [60] ونهج HabiSign لغوش وآخرون. [61] أشارت هذه الدراسة الأخيرة أيضًا إلى أنه يمكن استخدام الاختلافات في أنماط استخدام رباعي النوكليوتيدات لتحديد الجينات (أو القراءات الميتاجينومية) الناشئة من موائل معينة. بالإضافة إلى ذلك ، تكتشف بعض الطرق مثل TriageTools [62] أو Compareads [63] قراءات متشابهة بين مجموعتين من مجموعات القراءة. يعتمد مقياس التشابه الذي يطبقونه على القراءات على عدد من الكلمات المتطابقة في الطول ك مشتركة بين أزواج من القراءات.

يتمثل الهدف الرئيسي في علم الميتاجينوميات المقارنة في تحديد المجموعة (المجموعات) الميكروبية المسؤولة عن منح خصائص محددة لبيئة معينة. ومع ذلك ، نظرًا لوجود مشكلات في تقنيات التسلسل ، يجب حساب العناصر الأثرية كما هو الحال في metagenomeSeq. [30] وقد ميز البعض الآخر التفاعلات الميكروبية بين المجموعات الميكروبية المقيمة. تم تطوير تطبيق تحليل ميتاجينومي مقارن قائم على واجهة المستخدم الرسومية يسمى Community-Analyzer بواسطة Kuntal et al. [64] والتي تنفذ خوارزمية تخطيط الرسم البياني القائمة على الارتباط والتي لا تسهل فقط التصور السريع للاختلافات في المجتمعات الميكروبية التي تم تحليلها (من حيث تركيبتها التصنيفية) ، ولكنها توفر أيضًا رؤى حول التفاعلات المتأصلة بين الميكروبات التي تحدث فيها. وتجدر الإشارة إلى أن خوارزمية التخطيط هذه تتيح أيضًا تجميع metagenomes بناءً على أنماط التفاعل المحتملة بين الميكروبات بدلاً من مجرد مقارنة قيم الوفرة للمجموعات التصنيفية المختلفة. بالإضافة إلى ذلك ، تنفذ الأداة العديد من الوظائف التفاعلية المستندة إلى واجهة المستخدم الرسومية التي تمكن المستخدمين من إجراء تحليلات مقارنة قياسية عبر الميكروبيوم.

استقلاب المجتمع تحرير

في العديد من المجتمعات البكتيرية ، الطبيعية أو المهندسة (مثل المفاعلات الحيوية) ، هناك تقسيم كبير للعمل في التمثيل الغذائي (Syntrophy) ، حيث تكون نفايات بعض الكائنات الحية مستقلبات للآخرين. [65] في أحد هذه الأنظمة ، المفاعل الحيوي الميثاني المنشأ ، يتطلب الاستقرار الوظيفي وجود عدة أنواع تركيبية (Syntrophobacterales and Synergistia) تعمل معًا من أجل تحويل الموارد الخام إلى نفايات مستقلب بالكامل (الميثان). [66] باستخدام دراسات الجينات المقارنة وتجارب التعبير مع المصفوفات الدقيقة أو البروتينات البروتينية ، يمكن للباحثين تجميع شبكة أيضية تتجاوز حدود الأنواع. تتطلب مثل هذه الدراسات معرفة تفصيلية حول أي نسخ من البروتينات يتم ترميزها من خلال أي الأنواع وحتى من خلال أي سلالات من أي نوع. لذلك ، تعد المعلومات الجينومية للمجتمع أداة أساسية أخرى (مع المستقلبات والبروتيوميات) في السعي لتحديد كيفية نقل المستقلبات وتحويلها من قبل المجتمع. [67]

تحرير Metatranscriptomics

تسمح Metagenomics للباحثين بالوصول إلى التنوع الوظيفي والتمثيل الغذائي للمجتمعات الميكروبية ، لكن لا يمكنها إظهار أي من هذه العمليات نشطة. [59] استخراج وتحليل مرنا الميتاجينومي ( metatranscriptome) معلومات عن التنظيم والتعبير لمحات عن المجتمعات المعقدة. بسبب الصعوبات التقنية (نصف العمر القصير للـ mRNA ، على سبيل المثال) في جمع الحمض النووي الريبي البيئي ، كان هناك عدد قليل نسبيًا فى الموقع دراسات ما وراء النسخ للمجتمعات الميكروبية حتى الآن. [59] على الرغم من اقتصارها في الأصل على تقنية المصفوفات الدقيقة ، فقد استخدمت دراسات الترانسكريبتوميكس تقنيات النسخ لقياس تعبير الجينوم الكامل وتقدير المجتمع الميكروبي ، [59] الذي استخدم لأول مرة في تحليل أكسدة الأمونيا في التربة. [68]

تحرير الفيروسات

التسلسل الميتاجينومي مفيد بشكل خاص في دراسة المجتمعات الفيروسية. نظرًا لأن الفيروسات تفتقر إلى علامة سلالات عالمية مشتركة (مثل 16S RNA للبكتيريا والعتائق ، و 18S RNA لحقيقية النواة) ، فإن الطريقة الوحيدة للوصول إلى التنوع الجيني للمجتمع الفيروسي من عينة بيئية هي من خلال الميتاجينوميات. يجب أن توفر metagenomes الفيروسية (تسمى أيضًا الفيروسات) المزيد والمزيد من المعلومات حول التنوع الفيروسي والتطور. [69] [70] [71] [72] [73] على سبيل المثال ، أظهر خط أنابيب ميتاجينومي يسمى Giant Virus Finder أول دليل على وجود فيروسات عملاقة في صحراء مالحة [74] وفي الوديان الجافة في أنتاركتيكا. [75]

تمتلك Metagenomics القدرة على تعزيز المعرفة في مجموعة متنوعة من المجالات. يمكن أيضًا تطبيقه لحل التحديات العملية في الطب والهندسة والزراعة والاستدامة والبيئة. [31] [76]

تحرير الزراعة

التربة التي تنمو فيها النباتات مأهولة بالمجتمعات الميكروبية ، مع وجود غرام واحد من التربة يحتوي على حوالي 10 9-10 10 خلايا ميكروبية والتي تضم حوالي غيغا بايت واحد من معلومات التسلسل. [77] [78] تعد المجتمعات الميكروبية التي تعيش في التربة من أكثر المجتمعات التي يعرفها العلم تعقيدًا ، ولا تزال غير مفهومة على الرغم من أهميتها الاقتصادية. [79] تؤدي اتحادات الميكروبات مجموعة متنوعة من خدمات النظم البيئية الضرورية لنمو النبات ، بما في ذلك تثبيت النيتروجين في الغلاف الجوي ، ودورة المغذيات ، وقمع الأمراض ، وعزل الحديد والمعادن الأخرى. [80] يتم استخدام استراتيجيات الميتاجينوميات الوظيفية لاستكشاف التفاعلات بين النباتات والميكروبات من خلال دراسة الزراعة المستقلة لهذه المجتمعات الميكروبية. [81] [82] من خلال السماح بإلقاء نظرة ثاقبة على دور أعضاء المجتمع غير المستزرعون أو النادرون سابقًا في دورة المغذيات وتعزيز نمو النبات ، يمكن أن تساهم مناهج الميتاجينوم في تحسين اكتشاف الأمراض في المحاصيل والثروة الحيوانية وتكييف الممارسات الزراعية المحسنة التي تحسن صحة المحاصيل من خلال الاستفادة من العلاقة بين الميكروبات والنباتات. [31]

تحرير الوقود الحيوي

الوقود الحيوي هو وقود مشتق من تحويل الكتلة الحيوية ، كما هو الحال في تحويل السليلوز الموجود في سيقان الذرة ، وعشب التبديل ، والكتلة الحيوية الأخرى إلى إيثانول السليلوز. [31] تعتمد هذه العملية على اتحادات ميكروبية (رابطة) تحول السليلوز إلى سكريات ، يليها تخمير السكريات إلى إيثانول. تنتج الميكروبات أيضًا مجموعة متنوعة من مصادر الطاقة الحيوية بما في ذلك الميثان والهيدروجين. [31]

يتطلب التفكيك الفعال على نطاق صناعي للكتلة الحيوية إنزيمات جديدة ذات إنتاجية أعلى وتكلفة أقل. [28] تسمح المناهج الميتاجينومية لتحليل المجتمعات الميكروبية المعقدة بالفحص المستهدف للإنزيمات ذات التطبيقات الصناعية في إنتاج الوقود الحيوي ، مثل هيدروليسات الغليكوزيد. [83] علاوة على ذلك ، فإن معرفة كيفية عمل هذه المجتمعات الميكروبية أمر مطلوب للسيطرة عليها ، وعلم الجينات هو أداة رئيسية في فهمهم. تسمح المناهج الميتاجينومية بإجراء تحليلات مقارنة بين الأنظمة الميكروبية المتقاربة مثل تخمير الغاز الحيوي [84] أو العواشب الحشرية مثل حديقة الفطريات لنمل قاطع الأوراق. [85]

تحرير التكنولوجيا الحيوية

تنتج المجتمعات الميكروبية مجموعة واسعة من المواد الكيميائية النشطة بيولوجيًا التي تُستخدم في المنافسة والتواصل. [80] تم اكتشاف العديد من الأدوية المستخدمة اليوم في الأصل في الميكروبات ، أدى التقدم الأخير في تعدين الموارد الوراثية الغنية للميكروبات غير القابلة للزراعة إلى اكتشاف جينات وأنزيمات ومنتجات طبيعية جديدة. [59] [86] سمح تطبيق الميتاجينوميات بتطوير السلع والمواد الكيميائية الدقيقة ، الكيماويات الزراعية والمستحضرات الصيدلانية حيث يتم الاعتراف بشكل متزايد بفوائد التوليف الكيرالي المحفز بالإنزيم. [87]

يتم استخدام نوعين من التحليل في التنقيب البيولوجي للبيانات الميتاجينومية: الفرز المدفوع بالوظيفة لسمة معبر عنها ، والفحص المدفوع بالتسلسل لتسلسل الحمض النووي محل الاهتمام. [88] يسعى التحليل القائم على الوظيفة إلى تحديد الحيوانات المستنسخة التي تعبر عن سمة مرغوبة أو نشاط مفيد ، متبوعًا بالتوصيف الكيميائي الحيوي وتحليل التسلسل. هذا النهج مقيد بتوافر شاشة مناسبة ومتطلبات التعبير عن السمة المرغوبة في الخلية المضيفة. علاوة على ذلك ، فإن معدل الاكتشاف المنخفض (أقل من واحد لكل 1000 استنساخ تم فحصه) وطبيعته كثيفة العمالة يحدان من هذا النهج. [89] في المقابل ، يستخدم التحليل المدفوع بالتسلسل تسلسلات الحمض النووي المحفوظة لتصميم بادئات تفاعل البوليميراز المتسلسل لفحص الحيوانات المستنسخة لتسلسل الاهتمام. [88] بالمقارنة مع الأساليب القائمة على الاستنساخ ، فإن استخدام نهج التسلسل فقط يقلل بشكل أكبر من حجم العمل على مقاعد البدلاء المطلوب. يؤدي تطبيق التسلسل المتوازي على نطاق واسع أيضًا إلى زيادة كبيرة في كمية بيانات التسلسل التي يتم إنشاؤها ، والتي تتطلب خطوط أنابيب تحليل المعلومات الحيوية عالية الإنتاجية. [89] النهج القائم على التسلسل للفحص مقيد بنطاق ودقة وظائف الجينات الموجودة في قواعد بيانات التسلسل العامة. في الممارسة العملية ، تستفيد التجارب من مزيج من الأساليب الوظيفية والقائمة على التسلسل بناءً على الوظيفة محل الاهتمام ، وتعقيد العينة المراد فحصها ، وعوامل أخرى. [89] [90] مثال على نجاح استخدام علم الميتاجينوميات كتقنية حيوية لاكتشاف العقاقير موضَّح بمضادات الملاسيدين الحيوية. [91]

تحرير البيئة

يمكن أن توفر Metagenomics رؤى قيمة في البيئة الوظيفية للمجتمعات البيئية. [92] يشير التحليل الجيني للتحالف البكتيري الموجود في التغوط لأسود البحر الأسترالية إلى أن براز أسد البحر الغني بالمغذيات قد يكون مصدرًا مهمًا للمغذيات للنظم البيئية الساحلية. وذلك لأن البكتيريا التي يتم طردها في وقت واحد مع التغوط بارعة في تكسير العناصر الغذائية في البراز إلى شكل متوفر بيولوجيًا يمكن تناوله في السلسلة الغذائية. [93]

يمكن أيضًا استخدام تسلسل الحمض النووي على نطاق أوسع لتحديد الأنواع الموجودة في جسم مائي ، [94] الحطام المرشح من الهواء ، أو عينة من الأوساخ ، أو حتى براز الحيوانات. [95] هذا يمكن أن يحدد نطاق الأنواع الغازية والأنواع المهددة بالانقراض ، وتتبع التجمعات الموسمية.

تحرير المعالجة البيئية

يمكن أن تحسن Metagenomics استراتيجيات لرصد تأثير الملوثات على النظم البيئية ولتنظيف البيئات الملوثة. Increased understanding of how microbial communities cope with pollutants improves assessments of the potential of contaminated sites to recover from pollution and increases the chances of bioaugmentation or biostimulation trials to succeed. [96]

Gut microbe characterization Edit

Microbial communities play a key role in preserving human health, but their composition and the mechanism by which they do so remains mysterious. [97] Metagenomic sequencing is being used to characterize the microbial communities from 15–18 body sites from at least 250 individuals. This is part of the Human Microbiome initiative with primary goals to determine if there is a core human microbiome, to understand the changes in the human microbiome that can be correlated with human health, and to develop new technological and bioinformatics tools to support these goals. [98]

Another medical study as part of the MetaHit (Metagenomics of the Human Intestinal Tract) project consisted of 124 individuals from Denmark and Spain consisting of healthy, overweight, and irritable bowel disease patients. The study attempted to categorize the depth and phylogenetic diversity of gastrointestinal bacteria. Using Illumina GA sequence data and SOAPdenovo, a de Bruijn graph-based tool specifically designed for assembly short reads, they were able to generate 6.58 million contigs greater than 500 bp for a total contig length of 10.3 Gb and a N50 length of 2.2 kb.

The study demonstrated that two bacterial divisions, Bacteroidetes and Firmicutes, constitute over 90% of the known phylogenetic categories that dominate distal gut bacteria. Using the relative gene frequencies found within the gut these researchers identified 1,244 metagenomic clusters that are critically important for the health of the intestinal tract. There are two types of functions in these range clusters: housekeeping and those specific to the intestine. The housekeeping gene clusters are required in all bacteria and are often major players in the main metabolic pathways including central carbon metabolism and amino acid synthesis. The gut-specific functions include adhesion to host proteins and the harvesting of sugars from globoseries glycolipids. Patients with irritable bowel syndrome were shown to exhibit 25% fewer genes and lower bacterial diversity than individuals not suffering from irritable bowel syndrome indicating that changes in patients' gut biome diversity may be associated with this condition.

While these studies highlight some potentially valuable medical applications, only 31–48.8% of the reads could be aligned to 194 public human gut bacterial genomes and 7.6–21.2% to bacterial genomes available in GenBank which indicates that there is still far more research necessary to capture novel bacterial genomes. [99]

In the Human Microbiome Project (HMP), gut microbial communities were assayed using high-throughput DNA sequencing. HMP showed that, unlike individual microbial species, many metabolic processes were present among all body habitats with varying frequencies. Microbial communities of 649 metagenomes drawn from seven primary body sites on 102 individuals were studied as part of the human microbiome project. The metagenomic analysis revealed variations in niche specific abundance among 168 functional modules and 196 metabolic pathways within the microbiome. These included glycosaminoglycan degradation in the gut, as well as phosphate and amino acid transport linked to host phenotype (vaginal pH) in the posterior fornix. The HMP has brought to light the utility of metagenomics in diagnostics and evidence-based medicine. Thus metagenomics is a powerful tool to address many of the pressing issues in the field of Personalized medicine. [100]

Infectious disease diagnosis Edit

Differentiating between infectious and non-infectious illness, and identifying the underlying etiology of infection, can be quite challenging. For example, more than half of cases of encephalitis remain undiagnosed, despite extensive testing using state-of-the-art clinical laboratory methods. Metagenomic sequencing shows promise as a sensitive and rapid method to diagnose infection by comparing genetic material found in a patient's sample to databases of all known microscopic human pathogens and thousands of other bacterial, viral, fungal, and parasitic organisms and databases on antimicrobial resistances gene sequences with associated clinical phenotypes.


30. Describe the process of Southern blotting. Southern Blotting is used to find DNA sequences. Fragments are separated on gel, incubated with probes to check for the sequence of interest, and transf .

  • أنت هنا: & # 160
  • الصفحة الرئيسية
  • مظلة
  • كتب مدرسية
  • بيو 581
  • 35 Review Questions

يستند هذا النص إلى Openstax Biology لدورات AP ، المؤلفين المساهمين الكبار Julianne Zedalis ، مدرسة Bishop في La Jolla ، كاليفورنيا ، John Eggebrecht ، المؤلفون المساهمون بجامعة كورنيل Yael Avissar ، كلية رود آيلاند ، Jung Choi ، معهد جورجيا للتكنولوجيا ، Jean DeSaix ، University of North Carolina at Chapel Hill، Vladimir Jurukovski، Suffolk County Community College، Connie Rye، East Mississippi Community College، Robert Wise، University of Wisconsin، Oshkosh

هذا العمل مُرخص بموجب ترخيص Creative Commons Attribution-NonCommercial 4.0 Unported License بدون قيود إضافية


شاهد الفيديو: علم الأحياء النمائي التطوري. الأحياء. علوم الأحياء والبيئة (كانون الثاني 2022).