معلومة

(الويب) للبحث عن مسارات التمثيل الغذائي / الإشارات

(الويب) للبحث عن مسارات التمثيل الغذائي / الإشارات



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أبحث عن تطبيق حيث يمكنك العثور على مسارات عن طريق اختيار مادة كيميائية تحدث فيه.

لذلك ، على سبيل المثال ، يؤدي اختيار 6-phosphogluconolactone إلى إظهار مسار فوسفات البنتوز أو أي مسار آخر يحدث كمنتج وسيط.

قد يكون نفس الشيء ممكنًا للغدد الصماء أو أي إشارات أخرى. الكائن المستهدف هو الإنسان.

هل يوجد شيء مثل هذا؟


KEGG http://www.genome.jp/kegg/kegg2.html

GLAMM http://glamm.lbl.gov/

اضطررت إلى الاقتطاع إلى جلوكونولاكتون لجعل البحث يعمل في كلتا الحالتين.


AlzPathway: خريطة شاملة لمسارات إشارات مرض الزهايمر

مرض الزهايمر (AD) هو السبب الأكثر شيوعًا للخرف بين كبار السن. لتوضيح الآلية المرضية لمرض الزهايمر ، تراكمت آلاف التقارير. ومع ذلك ، فإن معرفة مسارات الإشارات في مجال AD لم يتم تجميعها كقاعدة بيانات من قبل.

وصف

هنا ، قمنا ببناء خريطة مسار متاحة للجمهور تسمى "AlzPathway" والتي تقوم بعمل فهرس شامل لمسارات الإشارات في مجال AD. لقد قمنا بجمع أكثر من 100 مقالة مراجعة متعلقة بميل AD ، وقمنا برعايتها يدويًا ، وقمنا ببناء خريطة مسار AD باستخدام CellDesigner. يتكون AlzPathway حاليًا من 1347 جزيئًا و 1070 تفاعلًا في الخلايا العصبية ، وحاجز الدم في الدماغ ، وخلايا ما قبل المشبكي ، وخلايا ما بعد المشبكي ، والخلايا النجمية ، والخلايا الدبقية وتوضعها الخلوي. يتوفر AlzPathway كخريطة SBML (لغة ترميز بيولوجيا الأنظمة) لـ CellDesigner وخريطة الصورة عالية الدقة. يتوفر AlzPathway أيضًا كخدمة ويب (خريطة عبر الإنترنت) استنادًا إلى نظام Payao ، وهو عبارة عن منصة خدمة ويب تعاونية قائمة على المجتمع لتنظيم نموذج المسار ، مما يتيح التحديثات المستمرة من قبل باحثي AD.

الاستنتاجات

AlzPathway هي أول خريطة شاملة لمسارات إشارات AD داخل الخلايا وخارجها والتي يمكن أن تمكن من فك الشفرات الآلية للإصابة بمرض الزهايمر. يمكن الوصول إلى خريطة AlzPathway على الموقع http://alzpathway.org/.


المسارات الأيضية

تعرف على كيفية مشاركة البروتين في المسارات الخلوية المختلفة.

ابحث في مجموعة واسعة من الخرائط الديناميكية لخرائط مسار التمثيل الغذائي الكلاسيكي وتوصيل الإشارات.

ابحث عن مجموعة تضم أكثر من 205 قاعدة بيانات للمسار / الجينوم.

اعثر على معلومات عن البروتينات والجينات المتورطة مباشرة في استقلاب التحلل البيولوجي.

يُستخدم لإنشاء الشبكات المنطقية وإعادة بنائها وتحليلها.

فهم العلاقة بين المسارات والتعبير الجيني.

اعثر على معلومات حول تفاعلات البروتين الكيميائي.

إجراء شرح جيني شامل ، وتحليل بيانات التعبير ، ورسم خرائط المسار البيولوجي ، ومهام الجينوميات الوظيفية الأخرى.

ابحث عن معلومات عن التعبير الجيني للنبات استجابة لمسببات الأمراض والتغيرات البيئية.

ابحث عن معلومات حول التفاعلات الجينية الكمية في الخميرة.

اعثر على معلومات حول مسارات التمثيل الغذائي الاصطناعية.

ابحث عن المسار البيولوجي والمعلومات الجينومية للاضطرابات المرتبطة بالدهون.

ابحث عن معلومات حول شبكات الجينات ، مثل المسارات الأيضية ومسارات تحويل الإشارات.

تحليل التجارب القائمة على الطفرات وتوليف الشبكات الجينية.

ابحث عن معلومات شاملة عن الأيض البشري ونواتج الأيض.

اعثر على معلومات حول مسارات تفاعل الإنزيم.

يوفر شرحًا توضيحيًا وظيفيًا للجينات من خلال مقارنات بلاست مقابل قاعدة بيانات KEGG GENES المنسقة يدويًا.

واجهة رسومية جديدة لمجموعة KEGG من قواعد البيانات ، خاصة لمعلومات الأنظمة في قواعد بيانات PATHWAY و BRITE.

ابحث في مجموعة من خرائط المسار حول التمثيل الغذائي ونقل الإشارات وتنظيم الجينات والعمليات الخلوية.

أداة قائمة على الويب لتصور البيانات التجريبية في سياق المسارات البيولوجية.

علق مجموعة من متواليات النيوكليوتيدات أو البروتينات بمصطلحات KEGG Orthology وحدد المسارات التي تحدث بشكل متكرر أو المخصب إحصائيًا بشكل كبير بين التسلسلات المطلوبة.

اعثر على معلومات حول مسارات التمثيل الغذائي.

ابحث عن معلومات عن المركبات الكيميائية وتفاعلاتها في المسارات البيولوجية.

أدوات على الإنترنت لأبحاث الدهون.

ابحث عن تسلسل البروتين والشروح المرتبطة بالدهون.

ابحث عن معلومات شاملة عن تعديل RNA.

العثور على أنماط في البيانات الأيضية.

علق نواتج الأيض في بيانات قياس الطيف الكتلي عالية الدقة.

العثور على معلومات حول العلاقات الأيضية في شبكات التمثيل الغذائي.

ابحث عن معلومات حول المسارات البيولوجية والإنزيمات في الكائنات الحية المختلفة (النباتات والميكروبات بشكل أساسي).

تصور شبكات التمثيل الغذائي عالية الدقة.

تحليل قدرات التخليق الحيوي لشبكات التمثيل الغذائي.

توقع المسارات ذات الصلة في الشبكات البيوكيميائية.

ابحث عن معلومات حول أنظمة المسارات الأيضية من قواعد بيانات أنظمة بيولوجية متعددة في مكان واحد.

تصفح وابحث عن البروتينات بناءً على وظائفها البيولوجية.

اعثر على معلومات حول شبكات التمثيل الغذائي.

قواعد البيانات لتحليل الأحداث والمسارات الحالة للبروتين.

تفسير بيانات التعبير الجيني التي تم الحصول عليها من تجارب ميكروأري.

ابحث عن قاعدة البيانات والأدوات ذات الصلة بدراسة المسار البيولوجي من قائمة الموارد الشاملة هذه.

البحث عن معلومات المسار البيولوجي العامة وتصورها.

ابحث عن معلومات وراثية ووظيفية متكاملة عن الجينات البيروكسيسومية في الإنسان والخميرة.

تطبيق لرسم خرائط الجينات بدائية النواة والبروتينات المقابلة لشبكات تنظيم الجينات والتمثيل الغذائي الشائعة.

تحليل كيفية ارتباط قائمة الجينات ببعضها البعض.

اعثر على معلومات شاملة عن المسار البيولوجي من مورد منسق للمسارات الأساسية وردود الفعل في علم الأحياء البشري.

اعثر على معلومات حول توضيح المسار واكتشاف المسار في علم الأيض ، وعلم النسخ ، والبروتينات ، وبيولوجيا الأنظمة.

إجراء تحليل بيولوجيا لنظم Pseudomonas.

انظر إلى بنية البروتين من منظور يجند وموقع الارتباط.

ابحث عن بيانات EST من مجموعة واسعة من حقيقيات النوى.

توقع منطق التمثيل الغذائي.

ابحث عن المعلومات المنسقة حول التقويض الميكروبي والتحولات الحيوية ذات الصلة ، في المقام الأول عن الملوثات البيئية.

اعثر على معلومات حول مسارات النسخ.

أداة لتصور المسار والتحرير والتنبؤ والبناء.

تحديد المسارات ومجموعات الجينات المرتبطة بالسمات.

يدعم نظام مكتبة العلوم الصحية العلوم الصحية في جامعة بيتسبرغ.

& نسخة 1996-2014 نظام مكتبة العلوم الصحية ، جامعة بيتسبرغ. كل الحقوق محفوظة.
اتصل بمسؤول الموقع


أساليب

يتم تضمين عدة خطوات لاحقة في إنشاء نماذج أولية من مسارات KEGG. تم وصف كل هذه الخطوات بالتفصيل في الأقسام التالية وتم تصويرها على أنها مخطط انسيابي في الشكل & # x200B الشكل 1 1.

توليد نماذج بيولوجيا الأنظمة من مسارات KEGG. يوضح المخطط الانسيابي جميع الخطوات الرئيسية التي ينطوي عليها إنشاء نماذج بيولوجيا الأنظمة الأولية من مسارات KEGG. تتطلب الطريقة بأكملها مصدرين: مسار KEGG بتنسيق KGML والوصول إلى قواعد بيانات KEGG الأخرى ، على سبيل المثال ، عبر KEGG API. تتضمن خطوات المعالجة المسبقة ، الموضحة في الأعلى ، بشكل أساسي إزالة العقد غير المناسبة ومعالجة التفاعلات. خطوة مهمة هي إزالة الإدخالات المكررة. ومع ذلك ، تتطلب بعض الخطوات الإضافية معلومات حول هذه التكرارات (على سبيل المثال ، عند استخدام حزمة امتداد التخطيط لـ SBML) وبالتالي ، فهي ليست دائمًا جزءًا من المعالجة المسبقة ويمكن إجراؤها في مرحلة لاحقة. اعتمادًا على تنسيق الإخراج المطلوب ، يتم تنفيذ خطوات معالجة منفصلة تتضمن التحويل المناسب والتعليق التوضيحي للنموذج الأولي.

لغة ترميز KEGG (KGML)

يستخدم KEGG تنسيق KGML لتشفير مساراته [16]. لكل مسار ، يوجد مسار مرجعي عام مشتق لعدد كبير من الكائنات الحية المختلفة. تتوافق جميع العقد في هذه المسارات بشكل أساسي مع البروتينات والجزيئات الصغيرة والمسارات أو المجمعات المرجعية الأخرى ويتم ترميزها كمدخلات في KGML. تحتوي هذه الإدخالات على سمة النوع التي تحدد طبيعتها بشكل أكبر. بالإضافة إلى ذلك ، قد يكون لديهم سمة رسومات ضرورية لتصورات المسار. الإدخالات المقابلة للمجموعات تحتوي على مكونات تشير إلى إدخالاتها المضمنة.

إلى جانب الإدخالات ، تحدد KGML التفاعلات ، التي تحتوي على ركائز ومنتجات تُعد بشكل أساسي مراجع للإدخالات المقابلة. المعلومات الإضافية الوحيدة التي يتم تقديمها للتفاعلات هي سمة النوع ، والتي تكون إما & # x02018reversible & # x02019 أو & # x02018irreversible & # x02019. علاوة على ذلك ، يحدد KEGG العلاقات ، والتي تعتبر مهمة بشكل أساسي لتصور مسارات الإشارة. تحتوي العلاقات على اتصالات شبكة بين إدخالين ، مثل & # x0201cA phosphorylates B & # x0201d ، أو & # x0201cA يثبط B & # x0201d لكنها لا توفر معلومات كافية للتحويلات لإكمال التفاعلات الكيميائية الحيوية.

المعالجة المسبقة وتصحيح المشكلات في إدخال KGML

قبل تحويل مسارات KEGG إلى لغات النمذجة الأخرى ، يجب تصحيح العديد من المشكلات في خطوات المعالجة المسبقة مباشرةً على إدخال KGML. تتضمن هذه العمليات التي تتضمن إضافة أو إزالة الإدخالات من مستند KGML ، بالإضافة إلى معالجة التفاعلات المضمنة. التحويل الفعلي إلى النماذج مستقل عن تلك الخطوات ويتم إجراؤه بعد المعالجة المسبقة. لإنشاء نماذج موثوقة ، قد يرغب المرء في إزالة الروابط إلى خرائط المسارات الأخرى من المستند. خرائط المسار المشار إليها ليست حالات مادية وبالتالي يجب تجاهلها في بعض برامج محاكاة النماذج. ومع ذلك ، قد تكون مطلوبة لمسارات الربط المتبادل. علاوة على ذلك ، قد يكون الأيتام (أي الإدخالات غير الموجودة في ردود الفعل أو العلاقات) عديمة الفائدة في بعض مناهج النمذجة وبالتالي يمكن أيضًا إزالتها. تعتبر التفاعلات الكيميائية الحيوية الصحيحة خطوة مهمة نحو بناء نماذج التمثيل الغذائي. تتطلب التفاعلات المحددة في KGML معالجة مسبقة كبيرة لترجمتها بشكل موثوق إلى SBML أو BioPAX. غالبًا ما تحتوي مسارات KGML على كائنات تفاعل XML مفردة تشير إلى عدة تفاعلات كيميائية حيوية مختلفة في قاعدة بيانات KEGG REACTION. يجب تفكيك هذه التفاعلات المجمعة إلى كائنات تفاعل منفصلة في مستند XML ، من أجل الحصول على نموذج يحتوي على تفاعلات كيميائية حيوية متوازنة وصحيحة. نظرًا لأن المعلومات المقدمة في KGML محدودة ، يجب الاستعلام عن KEGG API لمزيد من خطوات التصحيح. من واجهة برمجة تطبيقات KEGG ، يتم استرداد معلومات حول قابلية عكس التفاعل ، بالإضافة إلى معادلة التفاعل ، بما في ذلك جميع الركائز والمنتجات والمحفزات والمعلومات المتكافئة. يتم شرح قابلية الانعكاس مباشرة على التفاعل ، ويجب تخزين المعلومات المتكافئة في فئات منفصلة ، والتي يتم ترجمتها لاحقًا إلى تنسيق الإخراج المطلوب. يتم استخدام المعادلة للتحقق من عدم وجود مشاركين في التفاعل. لكن مجرد مقارنة جميع معرفات KEGG الموجودة في KGML بمعادلة التفاعل ليست كافية. يتكون KEGG من العديد من قواعد البيانات المنفصلة التي تحتوي على معلومات حول المركبات والعقاقير والجليكان وما إلى ذلك. لذلك ، قد يحتوي مركب واحد على معرفات KEGG متعددة ، على سبيل المثال ، واحد في KEGG COMPOUND وآخر في KEGG DRUG. تحدد معادلات التفاعل معرفًا واحدًا فقط لكل مشارك ، وهو أي من جميع المعرفات المتاحة لكائن ما. لذلك ، من الضروري إجراء المزيد من الاستعلامات إلى KEGG API لجلب جميع المرادفات لجميع المعرفات. الآن ، من الممكن مقارنة جميع المواد المتفاعلة بمكونات المسار ، والتحقق من المشاركين في التفاعل المفقود وإضافة تلك إلى KGML في النهاية. مطلوب طريقة مماثلة للتحقق من وجود إنزيمات مفقودة (على سبيل المثال ، معدّلات التفاعل) & # x02014 نستخدم أرقام لجنة الإنزيم (أرقام EC) للتحقق من وجود إنزيمات مفقودة.

يمكن إجراء خطوة معالجة أولية مهمة أخيرة قبل تحويل المسارات إلى النماذج. تستخدم قاعدة بيانات KEGG معلومات حول تقويم العظام لتوفير خرائط مسار لكائنات مختلفة. يتم شرح الإنزيمات والتفاعلات المحفزة باستخدام أرقام EC ، والتي تكون مستقلة عن الكائنات الحية الفعلية. في بعض الحالات ، يؤدي هذا إلى وجود إنزيمات مشروحة أو إدخالات في KGML ، والتي لا يُعرف أي مثيل مادي لها في الكائن الحي الحالي محل الاهتمام. بمعنى آخر ، ربما لا يكون الإدخال موجودًا في الكائن الحالي أو لم يتم إثبات وجوده بعد. لتصور هذه المعلومات ، يقوم KEGG بتغيير لون الخلفية لتلك العقد المتعامدة إلى اللون الأبيض. يجب أيضًا إزالة هذه العقد من أجل الحصول على نماذج خاصة بالكائن الحي.

التوازن الذري للتفاعلات

بعد خطوة المعالجة المسبقة الموصوفة ، يحتوي مستند KGML على تفاعلات غير مجمعة وكاملة ، والتي تم شرح المعادلة والقياس الكيميائي لها. باستخدام KEGG API ، يمكن جلب الصيغة الكيميائية لكل مركب ، والمشاركة في التفاعل. باستخدام هذه المعلومات مع القياس المتكافئ ، من الممكن حساب ومقارنة جميع الذرات على جانب الركيزة والمنتج. هناك بعض الخصائص الأخرى التي يجب أخذها في الاعتبار: يتم استخدام عام & # x02018R & # x02019 أحيانًا على جانب الركيزة والمنتج للإشارة إلى أي بديل. متغيرات مثل ن و نيستخدم KEGG +1 لإنشاء تفاعلات عامة أكثر. خلال اختباراتنا ، اكتشفنا بعض الحالات البسيطة ، حيث كان H + أو P + مفقودًا ، ولكن أيضًا في بعض الحالات الأخرى ، حيث كانت الذرات المتعددة (على سبيل المثال ، 2 C و 3 H و 1 P) مفقودة. لا يُنصح بتصحيح هذه المشكلات تلقائيًا ، لأن المكونات الحقيقية المفقودة غير معروفة. على سبيل المثال ، إذا كان P + مفقودًا على جانب الركيزة ، فقد تكون المركبات الأكبر مفقودة في أي جانب من جوانب التفاعل. تشمل احتمالات فقدان المكونات على كلا الجانبين ATP & # x02192 ADP و NADPH & # x02192 NADH وغيرها الكثير. لذلك ، يُلحق تطبيقنا نتيجة فحص كل ذرة كتعليق على كل تفاعل وقد يتعين على الباحثين تصحيح التفاعلات يدويًا مع الذرات المفقودة.

تحويل وتعليق وثيقة KGML

يمكن الآن استخدام مستند KGML المكتمل والمصحح لإنشاء النماذج. لذلك ، يلزم إجراء تحويلات إلى BioPAX و SBML و SBML-Qual والعديد من التنسيقات الأخرى. عادة ، يجب تهيئة مثيل النموذج ويجب إضافة جميع الإدخالات إلى النموذج. يجب توخي الحذر في هذه الخطوة ، لأنه قد توجد نسخ متعددة من الإدخال في مستند KGML واحد. عادة ، كل نسخة رسومية تحفز ردود فعل مختلفة. ولكن بالنسبة لنماذج بيولوجيا الأنظمة ، يجب إنشاء عنصر واحد فقط لجميع النسخ ، مما يمثل اتحادًا لجميع الإدخالات المتطابقة ماديًا. علاوة على ذلك ، تحدد KGML نوع إدخال يسمى & # x02018reaction & # x02019 ، والذي لا يجب تحويله إلى كيان مادي في النموذج الناتج. اعتمادًا على لغة النمذجة ، يجب تحويل ردود الفعل أو العلاقات أو كليهما إلى التنسيق المختار.

إلى جانب خطوات التحويل هذه ، هناك حاجة لعمليات إضافية من أجل تسهيل جهود النمذجة الإضافية من قبل الباحثين. يتضمن ذلك التعليقات التوضيحية والتعليقات الشاملة لجميع العناصر. ومن ثم ، تضاف إلى النموذج مصطلحات علم الوجود الجيني ، التي تصف العناصر ووظائفها ، وكذلك المعرفات لعدد كبير من قواعد البيانات الأخرى للجينات ، والبروتينات ، والتفاعلات ، والمعلومات الهيكلية ، والجزيئات الصغيرة ، وما إلى ذلك. بمزيد من التفصيل ، تمت إضافة المعرفات إلى Entrez Gene و OMIM و Ensembl و UniProt و ChEBI و DrugBank و Gene Ontology و HGNC و PubChem و 3DMET و NCBI Taxonomy و PDBeChem و GlycomeDB و LipidBank وأرقام EC (تسمية الإنزيم) وقواعد بيانات KEGG المختلفة GENE ، GLYCAN ، رد الفعل ، مركب ، دواء ، ممر ، تقويم العظام). إلى جانب هذه المراجع التبادلية ، تمت إضافة تعليقات توضيحية مفيدة أخرى يمكن قراءتها بواسطة الإنسان والآلة ، على سبيل المثال ، رموز الجينات الرسمية ، والمرادفات ، والأوصاف التي يمكن قراءتها من قبل الإنسان ، والروابط إلى المزيد من الموارد أو التصورات ، والصيغة الكيميائية والوزن الجزيئي للجزيئات الصغيرة.

يعد التعليق التوضيحي للنماذج خطوة مهمة ، لأن عمليات المحاكاة على البيانات الحقيقية أو أدوات تصور البيانات التجريبية البسيطة تتطلب معرفات فريدة لتعيين البيانات التجريبية على بنية المسار. إذا كانت النماذج توفر بنية بيانات بسيطة مع تسميات ، ولكن لا توجد معرفات مرجعية ، فلا يمكن استخدامها بالاقتران مع البيانات التجريبية.

KEGG إلى BioPAX

اليوم ، المستوى 3 هو أحدث مستوى من BioPAX. لكن المستوى 2 لا يزال شائعًا وهناك بعض هياكل البيانات في المستوى 3 غير المتوفرة في المستوى 2. لذلك ، يلزم وجود محولات منفصلة لـ BioPAX المستوى 2 والمستوى 3. بادئ ذي بدء ، يجب إنشاء نموذج BioPAX ويجب إضافة كائن مسار ، يتوافق مع إدخال KGML ، إلى النموذج. بعد ذلك ، يتم تحديد العديد من التعليقات التوضيحية والمراجع التبادلية لهذا المسار. يتضمن ذلك ، على سبيل المثال ، الكائن الحي ، والمراجع التبادلية لقواعد البيانات الأخرى ، ومصطلحات علم الوجود الجيني لتحديد وظيفة المسار & # x02019s. تتضمن الخطوة التالية تعيين كل عنصر من عناصر KGML إلى عنصر BioPAX المقابل. يعطي الشكل & # x200B الشكل 2 نظرة عامة على هذه التعيينات.

هيكل فئة مبسط ورسم خرائط من KGML إلى BioPAX. يوضح الشكل التعيين الأولي لـ KGML لمثيلات فئة BioPAX. تحدد سمة النوع لكل إدخال كيفية ترجمته (انظر الجدول & # x200B الجدول 1). 1). تُترجم التفاعلات التي يتم تحفيزها بواسطة الإنزيمات إلى التحفيز ، بينما تُترجم التفاعلات غير المحفزة مباشرةً إلى التفاعلات الكيميائية الحيوية. تتم ترجمة العلاقات بشكل مختلف ، اعتمادًا على النوع الفرعي والكيانات المشاركة ومستوى BioPAX المختار (انظر الجدول & # x200B الجدول 2). 2). للحفاظ على الوضوح ، لا يتضمن الشكل المعلومات الموجودة في BioPAX المستوى 2 ، التحكم والتحويل يرثان من التفاعل المادي. علاوة على ذلك ، يتكون الحفاز من عنصرين: عنصر تحكم وعنصر خاضع للتحكم. لأغراضنا ، يعتبر جهاز التحكم دائمًا إنزيمًا ويتم التحكم فيه عبارة عن تفاعل كيميائي حيوي. وبالمثل ، يمكن ترجمة علاقات KGML إلى عنصر تحكم ينظم إما التحويل أو نموذج رد الفعل.

بعد الحصول على نموذج المسار الأولي ، فإن الخطوة التالية هي إنشاء عناصر BioPAX لكل إدخال KGML. تعتمد هذه الترجمة بشكل أساسي على نوع إدخال KGML وهي مدرجة بالتفصيل في الجدول & # x200B Table1. 1. يتم تجميع الإدخالات التي لها نفس المعرف (نسخ رسومية لنفس العنصر) في مثيل واحد ويتم إنشاء عنصر BioPAX واحد فقط لهؤلاء. اعتمادًا على عنصر BioPAX الذي تم إنشاؤه للتو ، هناك حاجة إلى مزيد من خطوات التعليق التوضيحي. بالنسبة للمركبة es ، نحتاج إلى إضافة كل مكوناتها. بالنسبة إلى الجزيئات الصغيرة ، نضيف الوزن الجزيئي والصيغة الكيميائية إلى حقول BioPAX المقابلة ، مما يسهل خطوات النمذجة الإضافية. لكل عنصر ، تتم إضافة إشارات مرجعية إلى قواعد البيانات الأخرى والمزيد من التعليقات التوضيحية كما هو موضح في القسم السابق.

الجدول 1

مثيلات BioPAX وشروط SBO المقابلة لأنواع إدخال KGML

نوع الإدخالعنصر BioPAXمصطلح SBO
مجمع جزيء صغير 247 (مادة كيميائية بسيطة)
إنزيم بروتين 252 (سلسلة بولي ببتيد)
الجين بروتين 252 (سلسلة بولي ببتيد)
تقويم العظام بروتين 252 (سلسلة بولي ببتيد)
مجموعة مركب 253 (معقد غير تساهمي)
خريطةمسار552 (التعليق التوضيحي المرجعي)

يوضح هذا الجدول تحويل إدخالات KGML إلى BioPAX أو SBML. يعتمد التحويل على سمة نوع إدخال KGML. بالنسبة لـ BioPAX ، يتم تهيئة مثيلات فئة مختلفة. تتضمن التحويلات إلى SBML دائمًا إنشاء نوع بمصطلح SBO المحدد لكل إدخال KGML. تنص مواصفات KGML على أن الإدخال من النوع & # x02018gene & # x02019 & # x0201c هو منتج جيني (غالبًا بروتين) & # x0201d. بالإضافة إلى ذلك ، فإن a & # x02018group & # x02019 & # x0201c عبارة عن مجموعة من المنتجات الجينية (معظمها مركب بروتيني) & # x0201d [16]. للتوافق مع إصدارات KGML السابقة ، النوع المهمل & # x02018genes & # x02019 يتوافق مع & # x02018group & # x02019 منذ KGML v0.6.1. علاوة على ذلك ، لم يتم سرد إدخالات من النوع & # x02018reaction & # x02019 في الجدول ، ولكن تمت مناقشتها في قسم منفصل.

تتوافق تفاعلات KEGG دائمًا مع التفاعلات الكيميائية الحيوية. وبالتالي ، فإن التفاعل الكيميائي الحيوي هو بنية البيانات المناسبة لتلك التفاعلات ويتم إنشاء مثيل واحد من هذه الفئة لكل تفاعل KGML. إذا تم شرح الإنزيمات المحفزة ، يتم إنشاء مثيل تحفيز. يعمل هذا التحفيز على تحفيز الإنزيمات كعنصر تحكم والتفاعل الكيميائي الحيوي كعنصر خاضع للتحكم. يتم شرح التفاعل مع اتجاه التفاعل وإذا كان قابلاً للعكس أم لا. علاوة على ذلك ، يتم شرح قياس العناصر المتكافئة لكل مشارك ، بالإضافة إلى أرقام EC لجميع الإنزيمات المحفزة. حتى إلى التفاعلات ، تتم إضافة معلومات داعمة يمكن قراءتها من قبل الإنسان ، مثل معادلة التفاعل ، والمسارات الأخرى التي يحدث فيها هذا التفاعل أيضًا ، ووصفًا عامًا. بالإضافة إلى ذلك ، تتم إضافة نتيجة فحص توازن الذرة كتعليق إضافي ، جنبًا إلى جنب مع معلومات شاملة عن الذرات الموجودة على جانب الركيزة ، والتي توجد في جانب المنتج والفرق بينهما.

إلى جانب التفاعلات الكيميائية الحيوية ، تدعم BioPAX أيضًا أنواعًا أخرى من العلاقات بين الكيانات. وتشمل هذه العناصر العالمية ، مثل التحويل أو التفاعلات الجزيئية ، والتي تكون ملائمة لترجمة علاقات KEGG العامة التي لا توفر الكثير من المعلومات. تشكل العلاقات من النوع & # x02018activation & # x02019، & # x02018inhibition & # x02019 or & # x02018missing reaction & # x02019 أمثلة على مثل هذه الترجمات العامة. الفرق بين هذين هو أنه يمكن استخدام التحويلات لتحديد مصدر وهدف ، في حين أن MolecularInteraction s (وهو نفس التفاعل المادي في BioPAX المستوى 2) لا يحتوي إلا على مجموعة واحدة من الكيانات المشاركة. يمكن تحويل علاقات KEGG الأخرى إلى فئات تفاعل BioPAX أكثر تحديدًا. يتم استخدام التجميع المركب ، على سبيل المثال ، للتعبير عن ارتباط بين عناصر متعددة ، ولكن أيضًا لفصل العناصر. ومع ذلك ، يتطلب استخدام هذه الفئة أن يكون المنتج أو الركيزة المحددة (في التفكيك) مركبًا. إذا لم يتم استيفاء هذه المتطلبات ، يتم استخدام تحويل عام. يتم ترجمة العلاقات التي تتضمن تعديل البروتين بشكل مناسب إلى BioPAX من خلال إنشاء عمليات مضبوطة. يتضمن ذلك إنشاء عنصر تحكم يحتوي على عملية ووحدة تحكم تنظم هذه العملية. يستخدم هذا لترجمة العلاقات التي تصف ، على سبيل المثال ، الفسفرة.

تحقيقا لهذه الغاية ، يتم إنشاء تحويل ، والذي يحتوي على البروتين غير الفسفوري كمصدر ومتغير فسفوري كهدف. يتم التحكم في هذا التحويل عن طريق مثيل وحدة التحكم التي تحتوي على البروتين المتحكم.

في BioPAX المستوى 3 ، يتم إجراء بعض التحسينات الإضافية على الترجمات ، مثل ترميز الفسفرة أو تعديلات أخرى عن طريق إضافة ميزة تعديل إلى كيان. علاوة على ذلك ، يمكن تشفير تعبير البروتين باستخدام TemplateReaction. يستخدم هذا النوع من التفاعل لوصف إنتاج الحمض النووي الريبي أو البروتين من تسلسل القالب. يتم تنظيم هذه العملية من خلال تنظيم TemplateReactionReaction الذي يحتوي في الغالب على عامل النسخ كمنظم. في KEGG ، يتم تحديد ذلك بعلاقة تحتوي على عامل النسخ كمصدر والبروتين كهدف والمصطلح & # x02018expression & # x02019 كنوع فرعي.

يتم إنشاء InteractionVocabulary لكل علاقة مترجمة تحدد نوع التفاعل كمصطلح مفردات مضبوطة وسلسلة يمكن للبشر قراءتها. لهذا الغرض ، يتم استخدام مصطلحات من علم الوجود في بيولوجيا الأنظمة (SBO) [17] ، وعلم الوجود الجيني (GO) [18] وأنطولوجيا التفاعلات الجزيئية (MI) [19]. يُشار أيضًا إلى تعديلات البروتين بواسطة SequenceModificationVocabulary في BioPAX المستوى 3 ، والذي يستخدم مصطلحات من علم أنماط تعديل البروتين (MOD) [20]. يوضح الجدول & # x200B الجدول 2 2 بالتفصيل ، كيف يتم تحويل كل علاقة ، وأي مصطلحات الأنطولوجيا يتم استخدامها.

الجدول 2

مثيلات BioPAX ومصطلحات الأنطولوجيا المقابلة للأنواع الفرعية لعلاقة KGML

نوع العلاقة الفرعيعنصر BioPAXمصطلح SBOمصطلح MIمصطلح GO
التنشيط التحويل والتحكم 170 (تحفيز) لا أحدلا أحد
كبت التحويل والتحكم 169 (منع) لا أحدلا أحد
التعبير TemplateReaction ، - التنظيم 170 (تحفيز) لا أحد10467
قمع TemplateReaction ، - التنظيم 169 (منع) لا أحدلا أحد
تأثير غير مباشر التحويل 344 (تفاعل جزيئي) لا أحدلا أحد
تغيير الدولة التحويل 168 (التحكم) لا أحدلا أحد
ربط / ارتباط مجمع مجمع 177 (الربط غير التساهمي) 914 5488
التفكك مجمع مجمع 180 (تفكك) لا أحدلا أحد
التفاعل المفقود التفاعل الجزيئي 396 (عملية غير مؤكدة) لا أحدلا أحد
الفسفرة التحويل والتحكم 216 (فسفرة) 217 16310
نزع الفسفرة التحويل والتحكم 330 (نزع الفسفرة) 203 16311
الارتباط بالجليكوزيل التحويل والتحكم 217 (ارتباط بالجليكوزيل) 559 70085
التواجد في كل مكان التحويل والتحكم 224 (انتشار) 220 16567
مثيلةالتحويل والتحكم214 (مثيلة)21332259

يوضح هذا الجدول كيفية التعامل مع العلاقات أثناء التحويل إلى BioPAX أو SBML. التحويل يعتمد على النوع الفرعي لكل علاقة. لكل نوع فرعي ، يتم تحديد عنصر BioPAX المقابل ، وكذلك المصطلحات من الأنطولوجيا المختلفة. عند التحويل إلى BioPAX ، يتم شرح جميع المصطلحات كمثيل لمفردات InteractionVocabulary ، بينما يحتوي انتقال SBML على حقل لمصطلح SBO ويتم إضافة المصطلحات الأخرى كمفردات مسيطر عليها عند الانتقال. يرجى ملاحظة أن بعض عناصر BioPAX تخضع لشروط معينة والبعض الآخر يحتاج إلى استبداله بفئات أكثر عمومية في BioPAX المستوى 2 ، بسبب الاختلافات في كلا الإصدارين. يرجى مراجعة قسم KEGG إلى BioPAX لمزيد من التفاصيل.

KEGG إلى SBML

على الرغم من أنه ليس أحدث إصدار من SBML ، لا يزال المستوى 2 الإصدار 4 مستخدمًا في العديد من التطبيقات ، وبالتالي ، يجب دعمه لتحويل النماذج الأيضية. يقدم أحدث إصدار من SBML المستوى 3 حزم توسعة ويلزم تضمين النماذج النوعية (الجودة) والمجموعات ومعلومات التخطيط في المستند ، والتي تعتبر ضرورية لنمذجة مسارات الإشارات. للوهلة الأولى ، يبدو أن تحويل KGML إلى SBML بسيط. هذا مقترح أيضًا من خلال مخطط التعيين ، الموضح في الشكل & # x200B الشكل 3. 3. لكن في SBML ، لا يتم التمييز بين أنواع العلاقات أو الإدخال المختلفة باستخدام مثيلات فئة مختلفة ، كما هو الحال في BioPAX ، ولكن باستخدام أزواج قيمة السمات الخاصة ، مثل مصطلحات SBO. يحدد KEGG الإدخالات ونوع الإدخال ، والذي يحدد ما إذا كان الإدخال يتوافق مع بروتين أو جزيء معقد أو صغير أو خريطة مسار مرجعية أو نوع آخر. يوفر BioPAX فئات مختلفة للتمييز بين تلك الأنواع. SBML ، على غرار KGML ، يحتوي فقط على فئة تسمى الأنواع لترميز كل هذه الإدخالات. يجب تحديد نوع النوع باستخدام مصطلحات من أنظمة بيولوجيا الوجود (SBO) [17]. يتم تنظيم شروط SBO هذه بشكل هرمي ويجب استخدام شروط SBO فقط من الكيان & # x02018material & # x02019 لتشفير الكيانات. يوضح الجدول & # x200B Table1 1 ، ما هي مصطلحات SBO الأكثر ملاءمة لتشفير إدخالات KGML المختلفة. علاوة على ذلك ، كما هو الحال في ترجمات BioPAX ، من المهم تجميع نسخ رسومية من نفس الإدخالات في عنصر واحد وإنشاء عنصر نوع واحد فقط لهذا الإدخال. لجعل النموذج قابلاً للاستخدام لمزيد من التطبيقات ، تمت إضافة التعليقات التوضيحية والمراجع الشاملة لقواعد البيانات الأخرى ، باستخدام مصطلحات موحدة للمفردات (CV) ومعرفات MIRIAM [21 ، 22]. علاوة على ذلك ، يتم إضافة وصف ومرادفات مختلفة ورقم CAS والصيغة الكيميائية وصورة مرجعية (الصيغة الهيكلية للمركبات وصورة خريطة المسار للمسارات) والوزن الجزيئي والكتلة كتعليق توضيحي يمكن قراءته من قبل الإنسان ، إذا كان ذلك متاحًا.

هيكل فئة مبسط ورسم خرائط من KGML إلى SBML. يتضمن هذا التعيين نماذج SBML النوعية (الجودة) وحزم توسعة المجموعات. يتم ترميز معظم الخصائص كسمات على الفئات الفعلية. توفر الجداول & # x200B الجداول 1 1 و & # x200B و 2 2 مزيدًا من التفاصيل حول ترجمة الإدخالات والعلاقات. يمكن لـ SBML التعامل مع التفاعلات فقط. لذلك ، فإن مؤهل SBML مطلوب لتشفير العلاقات بشكل صحيح. تتطلب حزمة الامتداد هذه طرازها الخاص. بعد ذلك ، يجب تكرار نموذج SBML الأساسي وكل نوع للحصول على نموذج نوعي بما في ذلك العلاقات المترجمة. علاوة على ذلك ، يمكن استخدام حزمة تمديد المجموعات للترميز المناسب للمجموعات في SBML.

المجموعات غير مدعومة من قبل SBML-core. لتشفير إدخالات من النوع & # x02018group & # x02019 في SBML المستوى 3 ، يمكن للمرء استخدام حزمة ملحقات المجموعات [23]. لتشفير المجموعات في SBML قبل المستوى 3 ، فإن الطريقة الوحيدة هي التعليقات التوضيحية ، على سبيل المثال عن طريق إضافة مصطلح CV مع مؤهل BQB_IS_ENCODED_BY أو BQB_HAS_PART الذي يحدد محتويات المجموعة. في أي حال ، يجب أيضًا استخدام مصطلح SBO ، والذي يميز هذا النوع على أنه مركب من عدة أنواع أخرى.

يتم تحويل تفاعلات KEGG إلى تفاعلات SBML مع شروط SBO الصحيحة للركائز (SBO: 0000015) والمنتجات (SBO: 0000011). إذا كان التفاعل قابلاً للعكس ، فيجب تطبيق مصطلح SBO العام المتفاعل (SBO: 0000010) على جميع المشاركين في التفاعل. بالإضافة إلى ذلك ، يتم شرح قابلية الانعكاس على التفاعل نفسه ويتم شرح قياس العناصر المتفاعلة على جميع المشاركين في التفاعل. يتم تضمين الإنزيمات المحفزة على أنها ModifierSpeciesReference و CV ، التي تشير إلى معرف تفاعل KEGG بالإضافة إلى جميع المسارات التي يحدث فيها هذا التفاعل. تتضمن التعليقات التوضيحية التي يمكن قراءتها من قبل الإنسان على التفاعل تعريف التفاعل والمعادلة وإشارة إلى معادلة التفاعل كصورة HTML ونتيجة فحص توازن الذرة (أي إذا كانت هناك ذرات مفقودة في التفاعل).

العلاقات مطلوبة لتشفير مسارات الإشارات ولكن لا يمكن تضمينها بشكل صحيح في SBML الأساسي. لا توجد بنية تشفر ، على سبيل المثال ، & # x0201cA ينشط B & # x0201d & # x02014 يمكننا فقط إضافة ردود فعل إلى SBML. بالنسبة إلى SBML المستوى 3 ، فإن حزمة تمديد النماذج النوعية (النوعية) المقترحة مؤخرًا تحل هذه المشكلة [24]. تم تصميم هذا الامتداد للنمذجة النوعية ويسمح بنمذجة العلاقات التي لا يمكن وصفها بالتفصيل. وبالتالي ، لتشفير علاقات KEGG ، يتعين علينا تحويل النموذج إلى نموذج نوعي وإنشاء انتقال نوعي لكل علاقة. يتم تعيين مصطلح SBO ، على النحو الوارد في الجدول & # x200B Table2 ، 2 ، للانتقال لتحديد نوعه. تمت إضافة مصطلح GO ، المذكور في نفس الجدول ، كمصطلح CV في الانتقال.

المزيد من خصائص KGML

إدخالات KGML التي هي ردود فعل

تسمح مواصفات KGML بإدخال نوع يسمى & # x02018reaction & # x02019. يمكن استخدام هذا ، على سبيل المثال ، للسماح للعلاقة بالإشارة إلى رد فعل. في الواقع ، تسمح KGML فقط بأن تكون الإدخالات أهدافًا للعلاقات ولكن يمكن استخدام هذه التركيبات لتخفيف القيود. ومع ذلك ، يسمح BioPAX بطبيعة الحال بالتفاعلات للإشارة إلى التفاعلات الأخرى كمصادر أو أهداف. وبالتالي ، لا يتم إبطال بنية المستند إذا تم تحويل الإدخالات من النوع & # x02018reaction & # x02019 إلى تفاعلات حقيقية في BioPAX ويتم استبدال كل استخدام لهذا الإدخال باستخدام تفاعل BioPAX.

في SBML ، يتم تحويل هذه الإدخالات أيضًا إلى تفاعلات. لم يتم إنشاء أنواع للإدخالات من النوع & # x02018reaction & # x02019 في SBML-core. بالنسبة إلى مؤهل SBML ، فإن المواصفات لها متطلبات مماثلة لـ KGML: يجب أن تحتوي جميع الانتقالات على أنواع نوعية كمصادر أو أهداف. Therefore, for SBML-qual the translation is similar to the source KGML and a qualitativeSpecies with adequate annotation is created for entries with type ‘reaction’.

Relations of subtype 𠆌ompound’

Some KGML documents include reactions and exclusively relations of subtype 𠆌ompound’. These compound-relations are mostly relations between enzymes and compounds. KEGG states that this compound is “shared with two successive reactions […]” [16]. In other words, these relations are copies of reactions that have been created by KEGG for the sake of better graphical representation of the pathway. Thus, translating both, the reactions and the compound-relations, would yield duplicated information.

Documents with glycans instead of compounds

Sometimes, KGML specifies glycans as reaction participants instead of compounds. Actually, there is nothing wrong with this, except that the KEGG API often returns reaction equations with compound identifiers and some attributes, such as chemical formula or molecular weight, are exclusively available for compounds. This leads to reactions that are erroneously detected as incorrect or to missing chemical formulas. Therefore, if a synonymous compound identifier is available for a KEGG glycan or another KEGG database identifier that contains synonyms in KEGG COMPOUND, it is advisable to fetch and internally work with the compound identifier. Otherwise, it is very likely that duplicates of the same entries but with different identifiers are created in a model and some relationships are not correctly resolved.

Implementation and availability

All described methods are implemented in the second release of KEGGtranslator (since version 2.2). The application uses and includes Paxtools, a Java™ library for working with BioPAX that facilitates building and writing the internal BioPAX data structure (http://www.biopax.org/paxtools.php). To establish the SBML data structure, KEGGtranslator uses the Java™ library JSBML [25] and supports SBML Level 2 Version 4 [26] and SBML Level 3 Version 1 [27].

KEGGtranslator is implemented in Java™, provides an interactive, user-friendly and easy-to-use graphical user interface (GUI), and is freely available under the LGPL version 3 license from http://www.cogsys.cs.uni-tuebingen.de/software/KEGGtranslator/. KGML pathways can be downloaded automatically from within KEGGtranslator. The application can convert KEGG pathways from KGML files to BioPAX Level 2, BioPAX Level 3, SBML (core), SBML (qual), or SBML-core and -qual in one model. If desired, graphical representations can be created in SBGN, SIF, GML, GraphML, JPG and some other formats. Furthermore, many options are provided that control the described (pre-) processing of KEGG conversions and allow users to customize the generated models to meet a great number of different requirements.


مناقشة

Here, we introduced gapseq —a new tool for metabolic pathway analysis and genome-scale metabolic network reconstruction. The novelty of gapseq lies in the combination of (i) a novel reaction prediction that is based both on genomic sequence homology as well as pathway topology, (ii) a profound curation of the reaction and transporter database to prevent thermodynamically infeasible reaction cycles, and (iii) a reaction evidence score-oriented gap-filling algorithm. In order to scrutinise gapseq metabolic models, we compared the models’ network structures and predictions with large-scale experimental data sets, which were retrieved from publicly available databases. Furthermore, the ability of gapseq to predict bacterial phenotypes was compared to two other commonly used automatic reconstruction methods, namely, CarveMe [30] and ModelSEED [33] (Table 1). ModelSEED is also implemented in the KBASE online software platform [66].

Crucial large-scale benchmarking of metabolic models

The quality of genome-scale metabolic networks can be assessed by comparing model predictions with experimental physiological data. The protocol by Thiele and Palsson (2010) for the reconstruction of genome-scale metabolic networks recommends the quality assessment and manual network curation using data for (i) known secretion products (e.g. fermentation end products), (ii) single gene deletion mutant growth phenotypes (i.e. gene essentiality), and (iii) the utilisation of carbon/energy sources [22]. Tools for the automatic reconstruction of metabolic networks should also make use of such physiological data whenever available for benchmarking. Here, we tested our gapseq approach on the basis of all three recommended phenotypic data and compared the performance with CarveMe and ModelSEED. Additionally, we included two novel benchmark tests: The comparison of model predictions with (iv) the activity of specific enzymes known from experimental studies [45] and (v) metabolic interactions among microorganisms in a multi-species community within an anaerobic environment (food web). Across all five benchmark tests, we could show that gapseq outperformed CarveMe and ModelSEED in terms of sensitivity while achieving specificity scores that are comparable to the other two tools (Fig. 6).

Publicly available genome sequences of microorganisms, which can be subject for automated metabolic network reconstruction are massively increasing in number due to continuing advances in high-quality and high-throughput sequencing technologies [21]. This development is further fuelled by the increasing number of genome assemblies from metagenomic material [67]. In contrast, standardised phenotypic data for microorganisms remains a bottleneck for the validation of automated metabolic network reconstruction pipelines such as gapseq . As consequence, it is crucial for the future development of automated network reconstruction software to include possibly all available phenotypic data for benchmarking, especially data from non-model organisms. To benchmark gapseq in relation to CarveMe and ModelSEED using phenotypic data from mainly non-model organisms, we retrieved phenotypic data of enzyme activity for more than 3000 organisms and carbon source utilisation for more than 500 organisms from online databases, which is, to our knowledge, the yet largest phenotypic data set used for validation of automatically reconstructed metabolic networks. In this validation approach gapseq achieved the highest prediction accuracy among all three tools tested (Fig. 1, Table 1).

Hence, those results suggest that gapseq is a powerful new tool for the automated reconstruction of genome-scale metabolic network models. Moreover, the underlying reference protein sequences as well as the pathway database can readily be updated using online resources, which makes gapseq flexible to include future developments and findings in microbial metabolic physiology.

Automated network reconstructions for community modelling

While single organisms can be considered as the building blocks of microbial communities, individual metabolic models of organisms are the building blocks of in silico microbial community simulations. Therefore, genome-scale metabolic models are increasingly applied to predict the function of multi-species microbial communities [68–70]. To correctly infer metabolic interaction networks between different organisms, it is important that individual models accurately predict nutrient utilisation (e.g. carbon source) and metabolic end products (e.g. fermentation products). In this study, the benchmarks for carbon source utilisation and fermentation end product identity indicated that gapseq has the highest prediction performance compared to other reconstruction tools (Figs. 1 and 3).

To illustrate the applicability of gapseq -reconstructed metabolic models for the simulation of multi-species community metabolism, we generated models for microbial strains from the gut microbiota and simulated their growth in a shared environment. Without further curation, the community simulation reproduced important hallmarks of intestinal anaerobic food webs [50, 53]. Above all, short-chain fatty acids (SCFA) were predicted to be the primary end products of fermentation. This prediction is important to represent intestinal metabolism, because SCFA are crucially involved in host physiology by affecting regulatory response in intestinal and immune cells [71, 72]. Furthermore, the simulation accurately predicted the exchange of metabolites between different members of the microbial community (Fig. 4). Cross-feeding of metabolites and the formation of anaerobic food chains have been associated with a healthy microbiome [11, 73]. For instance, the cross-feeding of lactate has been reported to be vital for the early establishment of a healthy gut microbiota in infants [73]. Accordingly we observed the exchange of lactate between different bacterial species in the community simulations (Fig. 4) and involved known lactate producers (e.g. المكورات المعوية البرازية) and consumers (e.g. Megasphaera elsdenii). This example illustrates that we are able to predict key features of the anaerobic food web within the gastrointestinal microbiota using gapseq models. In addition to the ability to accurately model metabolic processes within existing microbial communities, gapseq will further promote the potential of metabolic modelling to predict how complex microbial communities can be modulated by targeted interventions. Specific interventions, which could for instance be predicted, are the introduction of new species to the community (i.e. probiotics) or microbiome-modulating compounds (prebiotics) to the environment. Predictions of potential intervention strategies which target the microbiome are of vast relevance for biomedical research. Furthermore, metabolic interactions between microbiome members are difficult to detect in vivo due to the simultaneous production and uptake of metabolites. Thus, in silico predictions of metabolite cross-feeding interactions are highly valuable for hypothesis generation about the function and dynamics of microbial communities.

Taken together, the results obtained with gapseq suggest, that metabolic models which are reconstructed using gapseq are promising starting points to construct ecosystem-scale models of inter-species biochemical processes and to predict targeted strategies to modulate microbiome structure and function.

Pathway analysis of microbial communities

The construction of genome-scale metabolic models is based on metabolic networks that are inferred from genomic sequences in the context of biochemical databases [22]. Although the reconstruction of metabolic networks is closely related to the prediction of metabolic pathways, metabolic modelling and pathway analysis are often treated separately [74]. In gapseq , the prediction of metabolic pathways is intrinsically tied to the reconstruction of metabolic networks and gap-filling. In addition, reaction, transporter, and pathway predictions can also be used to evaluate the functional capacities of microorganisms without the need of metabolic modelling. As an example for metabolic pathway analysis, we compared the predicted energy metabolism of two large microbial communities that occur in soil and the human gut. We could show that the predicted distribution of pathways differ between both communities based on the habitat, which usually accommodates the members of the respective community. Gut microorganisms showed a less versatile energy metabolism and a specialisation towards fermentation pathways, which lead to the formation of acetate, hydrogen, and lactate. Variations in pathways distributions between both communities may be explained by distinct evolutionary histories. The habitat of the diverse group of soil microorganisms more likely represents an open ecosystem, whereas the gut microbiome is directly constraint by a multi-cellular host that potentially affect microbial phenotypic traits [75]. In general, metabolic modelling should be accompanied by the analysis of pathways based on statistical methods [74] to compensate for additional assumptions, which are introduced in constraint-based metabolic flux modelling [4].

Limitations and outlook

gapseq requires 1–2 h for the reconstruction of a single model, whereas ModelSEED and CarveMe operate faster (10 min) on a standard desktop computer. Nonetheless, CarveMe needs as input gene sequences (protein or nucleotide), which has to be predicted first, and ModelSEED works as a web service, which can complicate the handling of large-scale reconstruction projects. In gapseq , pathways were predicted based on topology and sequence homology searches. However, the assignment of enzymatic function from sequence comparisons has been shown to potentially miss protein domain structures and thus can cause false annotations [76, 77]. In addition, gapseq employs many resources to find potential sequences for reactions in pathway databases. Together this might explain why although gapseq performed better than other methods on predicting positive phenotypes (function present), it went head to head with regard to negative phenotype predictions (function not present). CarveMe takes a different approach when inferring function by taking care of functional regions (protein domains) [78], resulting in orthologous groups [79], which results in a slightly better specificity (true negative phenotype predictions) in benchmarks (Fig. 6). Future developments of gapseq will address orthologous groups by using multiple inference methods. The integration of functional predictions coming from phylogenetic inference without the need of genomic sequences [80] might also be promising for further developments of gapseq . Moreover, future versions of gapseq will address challenges that we identified in the course of the evaluation tests presented in this study. For instance, Gene-Protein-Reaction (GPR) association predictions will be improved by incorporating new computational methods in protein complex detection [81].


Metabolism Pathways

Metabolism refers to all chemical reactions that happen inside organisms to sustain their lives, including but not limited to digestion. Metabolic processes convert food to energy that cells then use to perform bodily functions, to build proteins, fats, and other important molecules, and to dispose of waste. Numerous signaling pathways are involved in metabolism, including the AKT and GSK3 signaling pathways.

AKT Signaling Pathway

Akt is a serine/threonine kinase that is involved in mediating various biological responses, such as inhibition of apoptosis.

GSK3 Signaling

GSK3 is a ubiquitously expressed, highly conserved serine/threonine protein kinase found in all eukaryotes.

Antibodies Resource Library

Access a targeted collection of scientific application notes, methods, and cell signaling charts.


الاستنتاجات

In this study, the most comprehensive metabolome, hormone, and transcriptome analyses investigated petal colour transitions in L. japonica. Analyses of key candidate genes, metabolites and hormones highlighted the effects of carotenoids, anthocyanins and endogenous hormones this enabled us to clarify the regulatory mechanisms underlying the transitions. Based on our results and previously published studies, we provide a conceptual model for the regulatory network of the transitions in L. japonica (Fig. 6). In this model, the existing chlorophyll/carotenoid balance is disturbed during flower development. Overall, the content of total chlorophylls decreased in WF_Pe and YF_Pe, along with low expression of chlorophyll synthesis genes and high expression of chlorophyll degradation genes, resulting in green colour loss with flower development. In contrast, although the content of total carotenoids first dropped in WF_Pe, it then rapidly accumulated from WF_Pe to YF_Pe, in sync with the increase in the expression of genes related to carotenoid biosynthesis. The ten highest concentrations carotenoids were detected in YF_Pe, and the top four carotenoids were α-carotene, zeaxanthin, violaxanthin and γ-carotene, which are major contributors to yellow color of YF_Pe. It was also found that a few anthocyanins differentially accumulated during flower development, indicating that they may assist with to vivid colour of GB_Pe and YF_Pe. Meanwhile, this developmental process is regulated by endogenous hormones. These variations in key pigment and hormone-mediated signalling pathway-related genes, pigments and hormones promote petal colour transitions from green to white and then to yellow in L. japonica.

Schematic of changes in the regulatory genes and metabolites in petal color- transition in L. japonica


Karp PD, Paley S, Romero P: The Pathway Tools Software. Bioinformatics. 2002, 18 (Suppl 1): S225-S232.

Miecnik B, Scheideier M, Hackl H, Hartler J, Sanchez-Cabo F, Trajanoski Z: Pathway Explorer: web service for visualizing high-throughput expression data on biological pathways. Nucl Acids Res. 2005, 33: W633-W637. 10.1093/nar/gki391

Ludermann A, Weicht D, Selbig J, Kopka J: PaVESy: Pathway Visualization and Editing System. Bioinformatics. 2004, 20: 2841-2844. 10.1093/bioinformatics/bth278

Sorokin A, Paly K, Selkov A, Demin O, Dronov S, Ghazai P, Goryanin I: The Pathway Editor: A tool for managing complex biological networks. IBM J Res & Dev. 2006, 50: 561-573.

Shulaev V: Metabolomics technology and bioinformatics. Briefings in Bioinformatics. 2006, 7: 128-139. 10.1093/bib/bbl012

Junker BH, Klukas C, Schreiber F: VANTED: A system for advanced data analysis and visualization in the context of biological networks. BMC Bioinformatics. 2006, 7: 109-121. 10.1186/1471-2105-7-109

Baitaluk M, Sedova M, Ray A, Gupta A: Biological Networks: visualization and analysis tool for system for systems biology. الدقة الأحماض النووية. 2006, 34: W466-W471. 10.1093/nar/gkl308

Wenk M: The emerging field of lipidomics. Nat Rev Drug Discov. 2005, 4: 594-610. 10.1038/nrd1776

Schmelzer K, Fahy E, Subramaniam S, Dennis E: The LIPID MAPS initiative in lipidomics. Meth Enzymol. 2007, 432: 169-181.

Fahy E, Cotter D, Byrnes RW, Sud M, Maer A, Li J, Nadeau D, Zhau Y, Subramaniam S: Bioinformatics for lipidomics. Meth Enzymol. 2007, 432: 247-273. full_text

Kanehisa M, Goto S: KEGG: Kyoto Encyclopedia of Genes and Genomes. الدقة الأحماض النووية. 2000, 28: 27-30. 10.1093/nar/28.1.27

Byrnes RW, Fahy E, Subramaniam S: A laboratory information management system for high throughput experimental lipidomics: Minimal information required for the analysis of lipidomics experiments (MIALE). J Assoc Laboratory Automation. 2007, 12: 230-238. 10.1016/j.jala.2007.04.002.

Raetz CH, Garrett TA, Reynolds CM, Shaw WA, Moore JD, Smith DC, Ribeiro RA, Murphy RC, Ulevitch RJ, Fearns C, Riechart D, Glass CK, Benner C, Subramaniam S, Harkewicz R, Bowers-Gentry RC, Buczynski MW, Cooper JA, Deems RA, Dennis EA: Purification and properties of Escherichia coli Kdo2-lipid A, a defined endotoxin that activates macrophages via TLR-4. J Lipid Res. 2006, 47: 1097-1111. 10.1194/jlr.M600027-JLR200

Ross PL, Huang YN, Marchese JN, Williamson B, Parker K, Hattan S, Khainovski N, Pillai S, Dey S, Daniels S, Purkayastha S, Juhasz P, Martin S, Bartlet-Jones M, He F, Jacobson A, Pappin DJ: Multiplexed protein quantitation in خميرة الخميرة using amine-reactive isobaric tagging reagents. Mol Cell Proteomics. 2004, 3: 1154-1169. 10.1074/mcp.M400129-MCP200

LIPID Metabolites and Pathways Strategy. http://www.lipidmaps.org

LIPID Metabolites and Pathways Strategy Pathway Editor download page and tutorial. http://www.lipidmaps.org/pathways/pathwayeditor.html

Bornstein BJ, Keating SM, Jouraku A, Hucka M: LibSBML: an API Library for SBML. Bioinformatics. 2008, 24: 880-881. 10.1093/bioinformatics/btn051

The Systems Biology Markup Language. http://sbml.org/Main_Page

Gamma E, Helm R, Johnson R, Vlissides J: Design Patterns: Elements of Reusable Object-Oriented Software. 1995, Addison-Wesley: Reading, Massachusetts

Sud M, Fahy E, Cotter D, Brown A, Dennis EA, Glass CK, Merrill AH, Murphy RC, Raetz CR, Russell DW, Subramaniam S: LMSD: LIPID MAPS structure database. الدقة الأحماض النووية. 2007, 35: D527-532. 10.1093/nar/gkl838

Fahy E, Subramaniam S, Brown HA, Glass CK, Merrill AH, Murphy RC, Raetz CR, Russell DW, Seyama Y, Shaw W: A comprehensive classification system for lipids. J Lipid Res. 2005, 46: 839-862. 10.1194/jlr.E400004-JLR200

Maglott D, Ostell J, Pruitt KD, Tatusova T: Entrez Gene: gene-centered information at NCBI. الدقة الأحماض النووية. 2007, 35: D26-D31. 10.1093/nar/gkl993

Hucka M, Bolouri H, Finney A, Sauro H, Doyle JHK, Arkin A, Bornstein B, Bray D, Cornish-Bowden A, Cuellar A, Dronov S, Ginkel M, Gor V, Goryanin I, Hedley W, Hodgmean T, Hunter P, Juty N, Kasberger J, Kremling A, Kummer U, Le Novere N, Loew L, Lucio D, Mendes P, Mjolsness E, Nakayama Y, Nelson M, Nielsen P, Sakurada T, Schaff J, Shapiro B, Shimizu T, Spence H, Stelling J, Takashi K, Tomita M, Wagner J, Wang J: The systems biology markup language (SBML): a medium for representation and exchange of biochemical network models. Bioinformatics. 2003, 9: 524-532. 10.1093/bioinformatics/btg015.

Bergmann FT, Sauro HM: Comparing simulation results of SBML capable simulators. Bioinformatics. 2008, 24: 1963-5. 10.1093/bioinformatics/btn319

Le Novere N, Finney A, Hucka M, Bhalla US, Campagne F, Collado-Vides J, Crampin EJ, Halstead M, Klipp E, Mendes P, Nielsen P, Sauro H, Shapiro BE, Snoep JL, Spence HD, Wanner BL: Minimum information requested in the annotation of biochemical models (MIRIAM). Nat Biotechnol. 2005, 23: 1509-15. 10.1038/nbt1156

Laibe C, Le Novere N: MIRIAM Resources: tools to generate and resolve robust cross-references in Systems Biology. BMC Systems Biology. 2007, 1: 58- 10.1186/1752-0509-1-58

Krank J, Murphy RC, Barkley RM, Duchoslav E, McAnoy A: Qualitative analysis and quantitative assessment of changes in neutral glycerol lipid molecular species within cells. Meth Enzymol. 2007, 432: 1-20. full_text

Harkewicz R, Hartvigsen K, Almazan F, Dennis EA, Witztum JL, Miller YI: Cholesteryl ester hydroperoxides are biologically active components of minimally oxidized LDL. J بيول كيم. 2008, 283: 10241-10251. 10.1074/jbc.M709006200

Biological Pathways Exchange. http://www.biopax.org

The Gene Ontology Consortium: Gene Ontology: tool for the unification of biology. طبيعة الجينات. 2000, 25: 25-29. 10.1038/75556


Using lipidomics analysis to determine signalling and metabolic changes in cells

Advances in mass spectrometry have facilitated the development of lipidomics.

Developments in lipidomics analysis software were slow but successful packages are now developed.

There is a paucity of analytical packages facilitating biological interpretation of lipidomics.

Here we present a novel systematic pathway analysis approach to lipidomics.

Recent advances in lipidomics tools and software assist in the identification and quantification of lipid species detected by mass spectrometry. By integrating mass spectrometric lipid data into mapped pathways and databases, an entire network of lipid species which both demonstrates the complexity of lipid structures and biochemical interactions can be constructed. Here we demonstrate lipidomics analysis at both systematic and molecular levels. This review focuses on four points: how lipid data can be collected and processed with the support of tools, software and databases how lipidomic analysis is performed at the molecular level how to integrate data analysis into a biological context how the results of such analysis predict enzyme activities and potential sites for therapeutic interventions or manipulation of enzyme activities.


ملخص

The initiation of a signaling pathway is a response to external stimuli. This response can take many different forms, including protein synthesis, a change in the cell&rsquos metabolism, cell growth, or even cell death. Many pathways influence the cell by initiating gene expression, and the methods utilized are quite numerous. Some pathways activate enzymes that interact with DNA transcription factors. Others modify proteins and induce them to change their location in the cell. Depending on the status of the organism, cells can respond by storing energy as glycogen or fat, or making it available in the form of glucose. A signal transduction pathway allows muscle cells to respond to immediate requirements for energy in the form of glucose. Cell growth is almost always stimulated by external signals called growth factors. Uncontrolled cell growth leads to cancer, and mutations in the genes encoding protein components of signaling pathways are often found in tumor cells. Programmed cell death, or apoptosis, is important for removing damaged or unnecessary cells. The use of cellular signaling to organize the dismantling of a cell ensures that harmful molecules from the cytoplasm are not released into the spaces between cells, as they are in uncontrolled death, necrosis. Apoptosis also ensures the efficient recycling of the components of the dead cell. Termination of the cellular signaling cascade is very important so that the response to a signal is appropriate in both timing and intensity. Degradation of signaling molecules and dephosphorylation of phosphorylated intermediates of the pathway by phosphatases are two ways to terminate signals within the cell.


شاهد الفيديو: محاضرة فديوية تفاعلية عن المسار الحرج الحسابات الامامية والخلفية (أغسطس 2022).