معلومة

7.13 ب: شرح الجينوم - علم الأحياء


شرح الجينوم هو تحديد وفهم العناصر الجينية للجينوم المتسلسل.

أهداف التعلم

تحديد شرح الجينوم

النقاط الرئيسية

  • بمجرد تسلسل الجينوم ، يجب تحليل جميع التسلسلات لفهم ما تعنيه.
  • يعد تحديد الجينات في الجينوم ، وهيكل الجينات ، والبروتينات التي تقوم بتشفيرها ، أمرًا ضروريًا للتعليق التوضيحي.
  • بمجرد شرح الجينوم ، يتم إجراء مزيد من العمل لفهم كيفية تفاعل جميع المناطق المشروحة مع بعضها البعض.

الشروط الاساسية

  • انفجار: في المعلوماتية الحيوية ، أداة البحث عن المحاذاة المحلية الأساسية ، أو بلاست ، هي خوارزمية لمقارنة معلومات التسلسل البيولوجي الأولية ، مثل تسلسل الأحماض الأمينية لبروتينات مختلفة أو نيوكليوتيدات تسلسل الحمض النووي.
  • في السيليكو: في محاكاة الكمبيوتر أو في الواقع الافتراضي

مشاريع الجينوم هي مساعي علمية تهدف في النهاية إلى تحديد تسلسل الجينوم الكامل لكائن ما (سواء كان حيوانًا أو نباتًا أو فطرًا أو بكتيريا أو عتيقًا أو كائنًا أوليًا أو فيروسًا). يعلقون على الجينات المشفرة للبروتين وغيرها من الميزات المهمة المشفرة بالجينوم. يتضمن تسلسل الجينوم للكائن الحي تسلسل الحمض النووي الجماعي لكل كروموسوم في الكائن الحي. بالنسبة للبكتيريا التي تحتوي على كروموسوم واحد ، يهدف مشروع الجينوم إلى تحديد تسلسل هذا الكروموسوم.

بمجرد تسلسل الجينوم ، يجب أن يتم شرحه لفهمه. التعليق التوضيحي (بغض النظر عن السياق) هو ملاحظة تمت إضافتها عن طريق الشرح أو التعليق. منذ الثمانينيات ، خلقت البيولوجيا الجزيئية والمعلوماتية الحيوية الحاجة إلى شرح الحمض النووي. شرح الحمض النووي أو شرح الجينوم هو عملية تحديد مواقع الجينات وجميع مناطق الترميز في الجينوم وتحديد ما تفعله هذه الجينات.

شرح الجينوم هو عملية إرفاق المعلومات البيولوجية بالتسلسلات. يتكون من خطوتين رئيسيتين: تحديد العناصر في الجينوم ، وهي عملية تسمى التنبؤ الجيني ، وربط المعلومات البيولوجية بهذه العناصر. تحاول أدوات التعليقات التوضيحية التلقائية تنفيذ كل ذلك عن طريق تحليل الكمبيوتر ، بدلاً من التعليق التوضيحي اليدوي (المعروف أيضًا باسم التنظيم) الذي يتضمن الخبرة البشرية. من الناحية المثالية ، تتعايش هذه الأساليب وتكمل بعضها البعض في نفس خط أنابيب التعليقات التوضيحية (العملية). يستخدم المستوى الأساسي للتعليق التوضيحي بلاست للعثور على أوجه التشابه ، ثم التعليق على الجينوم بناءً على ذلك. ومع ذلك ، يتم في الوقت الحاضر إضافة المزيد والمزيد من المعلومات الإضافية إلى نظام التعليقات التوضيحية. تسمح المعلومات الإضافية للمعلقين اليدويين بفك التناقضات بين الجينات التي أعطيت نفس التعليق التوضيحي. تستخدم بعض قواعد البيانات معلومات سياق الجينوم ودرجات التشابه والبيانات التجريبية وتكامل الموارد الأخرى لتوفير شروح الجينوم من خلال نهج الأنظمة الفرعية الخاصة بهم. تعتمد قواعد البيانات الأخرى على كل من مصادر البيانات المنسقة بالإضافة إلى مجموعة من أدوات البرامج المختلفة في خط أنابيب شرح الجينوم الآلي.

يتكون التعليق التوضيحي الهيكلي من تحديد العناصر الجينومية: ORFs وتوطينها ، وبنية الجينات ، ومناطق الترميز ، وموقع الأشكال التنظيمية. يتكون التعليق التوضيحي الوظيفي من إرفاق المعلومات البيولوجية بالعناصر الجينية: الوظيفة الكيميائية الحيوية ، والوظيفة البيولوجية ، والتنظيم المتضمن والتفاعلات ، والتعبير.

قد تتضمن هذه الخطوات تجارب بيولوجية وفي تحليل سيليكو. تستخدم المناهج القائمة على علم الجينوميات المعلومات من البروتينات المعبر عنها ، والتي غالبًا ما تكون مشتقة من قياس الطيف الكتلي ، لتحسين شروح الجينوميات. تم تطوير مجموعة متنوعة من الأدوات البرمجية للسماح للعلماء بمشاهدة ومشاركة تعليقات الجينوم. شرح الجينوم هو التحدي الرئيسي التالي لمشروع الجينوم البشري ، الآن بعد أن اكتملت إلى حد كبير تسلسل الجينوم للإنسان والعديد من الكائنات الحية النموذجية. غالبًا ما يوصف تحديد مواقع الجينات وعناصر التحكم الجينية الأخرى على أنه تحديد "قائمة الأجزاء" البيولوجية للتجميع والتشغيل الطبيعي للكائن الحي. لا يزال العلماء في مرحلة مبكرة من عملية تحديد قائمة الأجزاء وفهم كيفية "انسجام جميع الأجزاء معًا. "


رفيق: أداة جديدة لتوليد وتصور التعليقات التوضيحية لجينومات الطفيليات

ماذا يحدث إذا تم إنشاء الكثير من جينومات الطفيليات لمحاربة الأمراض وتوليد اللقاحات والأدوية ، لكن لا أحد يستطيع مقارنة تلك الجينومات؟ أجاب ساشا شتاينبيس وتوماس أوتو على هذا السؤال في هذه المدونة ، المنشورة في الأصل على موقع معهد ويلكوم ترست سانجر.

شهد العقد الماضي تحسينات هائلة في التسلسل الجيني والتجميع ، والآن أصبح الباحثون قادرين على الحصول على تسلسل جينوم مثالي تقريبًا للبكتيريا وحقيقيات النوى الصغيرة في وقت قصير وبتكلفة منخفضة نسبيًا. إن صنع مجموعات جيدة بسعر رخيص ممكن حتى بالنسبة لمختبرات الأبحاث الصغيرة مكّن من إضفاء الطابع الديمقراطي على التسلسل وأسفر عن العديد من مسودات الجينومات الجديدة ، بما في ذلك العديد من جينومات الطفيليات الجديدة. ينعكس هذا الاتجاه في عدد متزايد من الأدوات المتاحة للتجميع المتسلسل (& gt60 بحلول عام 2016).

ومع ذلك ، فإن مشكلة إنشاء شروح معيارية عالية الجودة لهذه الكائنات ، أي مواقع ووظائف الجينات والميزات الأخرى ذات الصلة ، لا تزال قائمة. يعد توفر التعليقات التوضيحية المفصلة والكاملة أمرًا أساسيًا لتمكين التحليلات المقارنة بين الأنواع اللاحقة لتحديد الاختلافات بين الأنواع أو السلالات الفردية.

ومن الأمثلة على هذه الاختلافات فقدان أو اكتساب الجينات والوظائف المشتركة و / أو الخاصة بالأنواع. في عالم البكتيريا ، توجد أدوات برمجية للتعليق السريع على الجينوم ، ولكن حتى الآن كان ما يعادل الطفيليات مفقودًا.

ولكن حتى إذا كانت مسودة التجميع متاحة ، فإنها تظل سلسلة غير مفهومة من البيانات دون أي معنى علمي بدون تعليق توضيحي.

تقديم أداة برمجية جديدة

استجابةً لهذه الحاجة ، قمنا بتطوير Companion ، وهي أداة برمجية جديدة وخادم ويب لإنشاء تعليقات توضيحية شاملة لجينومات الطفيليات في وقت قصير جدًا ، مع الاستفادة من المعلومات التي نعرفها بالفعل عن الأنواع ذات الصلة.

تشمل ميزات Companion الفريدة تصور جودة التجميع ، ومقارنة محتوى الجينات بالجينوم المرجعي بالإضافة إلى تسليم الملفات التي يمكن إرسالها بسهولة إلى قواعد البيانات العامة مثل أرشيف النيوكليوتيدات الأوروبي (ENA).

إضفاء المعنى العلمي للبيانات

ولكن حتى إذا كانت مسودة التجميع متاحة ، فإنها تظل سلسلة غير مفهومة من البيانات دون أي معنى علمي بدون تعليق توضيحي. للاستفادة منها ، يحتاج المرء إلى معرفة مواقع الجينات المشفرة للبروتين وغير المشفرة ، وما هي وظائفها.

على الرغم من أن العثور على هذه يمثل تحديًا قديمًا تتوفر له أدوات محددة ، إلا أن مهمة اكتشاف الجينات لا تزال مشكلة مفتوحة. أقل من التعليقات التوضيحية المثالية ، أي نماذج الجينات المفقودة أو الموصوفة بشكل خاطئ أو الموصوفة جزئيًا فقط بالإضافة إلى ارتباطات الوظائف الخاطئة ، قد تؤثر بشدة على أي نوع من التحليل النهائي.

ومع ذلك ، فقد أظهر الواقع أنه لا يتم الحصول على أفضل النتائج إلا من خلال استخدام أدوات متعددة بالتوازي ، متبوعًا بالتعامل اليدوي.

أخيرًا ، في حين أنه شرط للنشر ، فإن تقديم ملفات التعليقات التوضيحية إلى قواعد البيانات مثل ENA عادة ما يمثل تحديًا ، حيث يجب اتباع المصطلحات المحددة.

كيف يمكن رفيق يستخدم؟

لمساعدة مجتمع الطفيليات في التغلب على تلك المشكلات ، قمنا بتطوير برنامج Companion (COMp Integrated Parasite ANnotatION) كمصدر مجاني للاستخدام العام. على الرغم من توفره بشكل أساسي كخادم ويب ، إلا أنه يمكن أيضًا تثبيته محليًا للتعليق على الجينومات التي لا يمكن تشغيلها عبر الإنترنت.

بالنسبة للجمهور المستهدف الرئيسي من علماء الطفيليات ، نقدم بساطة غير مسبوقة في التعليق التوضيحي: فقط قم بتحميل التجميع ، وحدد الأنواع المرجعية ذات الصلة من مجموعتنا المكونة من 62 جينومًا للطفيليات ، واضغط على زر.

بعد 4-6 ساعات (اعتمادًا على جودة التجميع والحجم المرجعي) ، يتم إرسال بريد إلكتروني يوجه المستخدم إلى الجينوم المشروح. يوفر المصاحب إحصائيات أساسية مثل عدد الجينات وكثافة الجينات ونسبة كل قاعدة T و C و G و A في الحمض النووي وما إلى ذلك ، ولكن أيضًا - والأكثر إثارة للاهتمام - النتائج المقارنة الأولى مثل شجرة النشوء والتطور التي توضح حديثًا شرح توضيحي الأنواع الأخرى ، أو المحتوى الجيني المتعلق بالمرجع. كما يمكن ملاحظة جودة التجميع ، وكذلك إعادة الترتيب على نطاق واسع ، بسهولة في المخططات الدائرية التي يتم إنشاؤها تلقائيًا. إذا كان المستخدم سعيدًا بالنتيجة ، فيمكن الآن تحميلها بسهولة إلى ENA ، وهي عملية كانت تمثل مجهودًا كبيرًا آخر في الماضي. بالطبع يمكن أيضًا أن يكون التعليق التوضيحي الذي تم إنشاؤه بواسطة Companion بمثابة نقطة انطلاق جيدة للتنظيم اليدوي اللاحق.

استخدام رفيق

كانت أول حالة استخدام رئيسية هي استخدام Companion لتوضيح العديد من الجينومات الحركية الجديدة ، بما في ذلك 12 Leishmania بالإضافة إلى المثقبية ، جنبًا إلى جنب مع الجينوم Crithidia و Endotrypanum ، ومعظمها متاح من TriTrypDB.

يقوم Companion بإنشاء مسودة شرح توضيحي عالي الجودة يمكن بسهولة إرساله إلى قواعد البيانات لتمكين المجتمع من التعلم من تلك الطفيليات المتسلسلة.

منذ إطلاق Companion للجمهور في أوائل عام 2016 ، قمنا بإحصاء أكثر من 120 تعليقًا توضيحيًا من جميع أنحاء العالم ، مع تزايد شعبيتها. في هذه المرحلة ، نود أن نشكر فريق أنظمة البنية التحتية لمعهد Wellcome Trust Sanger لصيانة الخادم. لقد أثبت الرفيق أنه متعدد الاستخدامات: على الرغم من أن الغرض الرئيسي من Companion هو شرح الجينومات الكاملة ، فقد أبلغ المستخدمون أنهم في بعض الأحيان يستخدمونه فقط لمكوِّن تواصل الكروموسوم الزائف ، وهي وظيفة نادرة أيضًا كتطبيق ويب.

يتم تنفيذ Companion باستخدام أحدث التقنيات: نظام إدارة سير العمل Nextflow لتنظيم خط الأنابيب ، ومجموعة أدوات تحليل جينوم GenomeTools للبرمجة النصية منخفضة المستوى ، ونظام تطوير ريلز لخادم الويب. جميع الأكواد متاحة بموجب ترخيص مجاني مفتوح المصدر.

في الختام ، يقوم المصاحب بإنشاء مسودة شرح توضيحي عالي الجودة يمكن بسهولة إرساله إلى قواعد البيانات لتمكين المجتمع من التعلم من تلك الطفيليات المتسلسلة. كما أنه يوفر مخرجات مختلفة تسمح للمستخدم بمقارنة الجينوم المشروح حديثًا بالمرجع ، مما قد يؤدي إلى الاتجاهات الأولى لمزيد من البحث.

يمكن العثور على مزيد من المعلومات على GitHub. تم قبول الورقة ذات الصلة مؤخرًا في مشكلة خادم الويب الخاص بـ Nucleic Acid Research (PMID: 27105845). سيركز التحسين الحالي للبرنامج على توسيع استخدامه ليشمل الجينومات الفطرية.


آي جينومز

العديد من هذه الملفات بتنسيق tar.gz. لاستخراج الملفات على نظام Windows ، استخدم 7zip في وضع المسؤول.

إن iGenomes عبارة عن مجموعة من التسلسلات المرجعية وملفات التعليقات التوضيحية للكائنات التي يتم تحليلها بشكل شائع. تم تنزيل الملفات من Ensembl أو NCBI أو UCSC. تم تغيير أسماء الكروموسومات لتكون بسيطة ومتسقة مع مصدر التنزيل. يتوفر كل iGenome كملف مضغوط يحتوي على تسلسلات وملفات شرح لبنية جينومية واحدة لكائن حي.

لمزيد من المعلومات ، راجع نظرة عامة على iGenomes وسجل التغيير.

hg19 –لا توجد ملفات تعليقات توضيحية.

    - يحتوي على أحدث ملفات التعليقات التوضيحية. استخدم مع وحدات LRM DNA Amplicon Analysis v1.1 و v2.0 –Use with LRM DNA Amplicon Analysis module v1.0
اتصل بنا
دعم فني
شارك مع الدعم الفني

احصل على إرشادات حول مشاركة سطح المكتب أثناء العمل مع الدعم الفني.

دعم آخر
اتصل بنا
دعم فني
[email protected]
دعم آخر
للاستخدام البحثي فقط

ليس للاستخدام في إجراءات التشخيص باستثناء ما هو مذكور على وجه التحديد.

تقنيات مبتكرة

هدفنا في Illumina هو تطبيق تقنيات مبتكرة لتحليل التباين الجيني والوظيفة ، مما يجعل الدراسات الممكنة التي لم يكن من الممكن تخيلها حتى قبل بضع سنوات فقط. من المهم بالنسبة لنا تقديم حلول مبتكرة ومرنة وقابلة للتطوير لتلبية احتياجات عملائنا. بصفتنا شركة عالمية تضع قيمة عالية للتفاعلات التعاونية ، والتسليم السريع للحلول ، وتوفير أعلى مستوى من الجودة ، فإننا نسعى جاهدين لمواجهة هذا التحدي. تعمل تقنيات التسلسل والصفيف المبتكرة من Illumina على تعزيز التقدم الرائد في أبحاث علوم الحياة ، والجينوميات الانتقالية والمستهلكين ، والتشخيص الجزيئي.


حاشية. ملاحظة

التعليق التوضيحي اختياري لجينوم GenBank حقيقية النواة والجينومات بدائية النواة. ومع ذلك ، إذا اخترت الإرسال مع تعليق توضيحي ، فإن الميزات المدرجة أدناه هي الحد الأدنى المطلوب من التعليقات التوضيحية ، على الرغم من وجود العديد من الميزات الإضافية التي يمكن تضمينها. نأمل أن يتطور التعليق التوضيحي الموجود على أي جينوم بمرور الوقت حيث يُعرف المزيد عن علم الأحياء. في مراجعة شرح الجينوم حقيقية النواة ، يسعى NCBI جاهدًا للتأكد من أن التعليق التوضيحي متسق طوال فترة التقديم وعند مقارنته بعمليات إرسال الجينوم الأخرى. كما نسعى جاهدين لتقديم المعلومات التي تمثل تمثيلًا دقيقًا لعلم الأحياء المعروف. لفعل هذا، نحتاج مساعدتك. يرجى الانتباه بعناية لتعليمات الشرح المقدمة هنا والرجاء مراجعة جميع التعليقات التوضيحية قبل إرسال الجينوم الخاص بك. يتم شرح العديد من الجينومات بواسطة برامج التنبؤ التلقائي ، وبما أن هذه البرامج ترتكب أخطاء ، فالأمر متروك لنا جميعًا لمحاولة التأكد من أن المعلومات المقدمة دقيقة قدر الإمكان. يتم تقديم ملخص للتعليق التوضيحي المطلوب أدناه ، ولكن يرجى أيضًا الرجوع إلى إرشادات التعليقات التوضيحية التفصيلية للحصول على توقعاتنا بشأن التعليقات التوضيحية.

الشرح المطلوب

مناطق ترميز البروتينات المعروفة

ميزات الجينات

يُعرَّف الجين بأنه منطقة ذات أهمية بيولوجية تم تخصيص اسم لها. دائمًا ما تكون ميزات الجينات فترة زمنية واحدة ، ويجب أن يغطي موقعها فترات زمنية لجميع الميزات ذات الصلة مثل المروجين ومواقع ربط polyA. يجب أن تتبع أسماء الجينات قواعد التسمية القياسية للكائن الحي المعين. على سبيل المثال ، تبدأ أسماء جينات الفأرة بحرف كبير ، وتكون الأحرف المتبقية صغيرة. يرجى الرجوع إلى تعليمات الشرح التفصيلية لمزيد من المعلومات حول الجينات.

Locus_tag

يُعد locus_tag معرفًا جينيًا منهجيًا يتم تعيينه لكل جين. يجب أن يكون locus_tag فريدًا لكل جين في الجينوم. يجب أن يكون لكل مشروع جينوم (أي كل الكروموسومات) نفس بادئة locus_tag الفريدة للتأكد من أن locus_tag محددة لمشروع جينوم معين ، وهذا هو السبب في أننا نطلب تسجيل بادئة locus_tag. بالإضافة إلى ذلك ، قد يكون للجينات أيضًا أسماء وظيفية كما هو محدد في الأدبيات العلمية. على سبيل المثال ، KCS_0001 هو معرف الجين النظامي ، بينما Abc5 هو اسم الجين الوظيفي. يجب أن تتكون بادئة locus_tag من 3 إلى 12 حرفًا أبجديًا رقميًا ويجب ألا يكون الحرف الأول رقمًا. بالإضافة إلى ذلك ، فإن بادئات locus_tag حساسة لحالة الأحرف. يتبع البادئة locus_tag بشرطة سفلية ثم رقم تعريف أبجدي رقمي فريد داخل الجينوم المحدد. بخلاف الشرطة السفلية المفردة المستخدمة لفصل البادئة عن رقم التعريف ، لا يمكن استخدام أحرف خاصة في locus_tag. اقرأ المزيد عن locus_tags والاستخدام المقصود منها. يرجى الرجوع إلى إرشادات التعليقات التوضيحية التفصيلية حول كيفية دمج locus_tags في جدول التعليقات التوضيحية.

ميزات CDS (منطقة الترميز)

تُستخدم ميزة CDS لتحديد منطقة ترميز البروتين. يجب أن تحتوي جميع ميزات CDS على مؤهل منتج (اسم بروتين) ومعرّف بروتين ومعرّف نصي. بالنسبة للمنتج ، استخدم اسمًا موجزًا ​​وليس وصفًا أو عبارة. بدلاً من ذلك ، يمكن الإشارة إلى أسماء البروتين بنفس رمز الجين المقابل باستخدام الأحرف الكبيرة المناسبة للكائن الحي. في الحالات التي لا يكون فيها البروتين معروفًا ، استخدم "بروتين افتراضي" كاسم منتج. نوصي باستخدام "البروتين الافتراضي" لأن هذا سيسمح بإلحاق معرف locus_tag باسم المنتج في سطور ملخص BLAST و Entrez. تحتوي إرشادات التعليقات التوضيحية التفصيلية الخاصة بنا على إرشادات وأمثلة حول تسمية البروتينات الخاصة بك بالإضافة إلى تضمين مؤهلات CDS الإضافية مثل أرقام EC ووظائف البروتين والملاحظات الوصفية والتشابه.

معرّف_بروتين

يجب على المرسل تخصيص رقم تعريف لجميع البروتينات. يستخدم NCBI هذا الرقم لتتبع البروتينات عند تحديث التسلسلات. يُشار إلى هذا الرقم في الجدول بواسطة مؤهل CDS protein_id ، ويجب أن يكون بالتنسيق gnl | dbname | string ، حيث dbname هو إصدار من اسم المختبر الذي تعتقد أنه سيكون فريدًا (على سبيل المثال ، SmithUCSD) ، والسلسلة هي الفريدة البروتين SeqID المعين من قبل المرسل.

يتم استخدام معرّف البروتين للتتبع الداخلي في قاعدة البيانات الخاصة بنا ، لذلك من المهم ألا يتكرر معرّف البروتين الكامل (dbname + SeqID) بواسطة مركز الجينوم. لاحظ أنه عند معالجة عمليات إرسال WGS ، يتم تغيير اسم dbname في protein_id تلقائيًا إلى "WGS: XXXX" ، حيث XXXX هو بادئة رقم الانضمام للمشروع. يرجى الاطلاع على تعليمات مفصلة للتعليقات التوضيحية.

ميزات مرنا

يجب أن يشتمل المرسل على ميزة mRNA لكل CDS مترجم وأن يوسع ميزة الجين لتشمل mRNA بأكمله. بالإضافة إلى ذلك ، يجب أن يكون للـ mRNA نفس اسم المنتج ، معرف_بروتين ومعرف_نسخة مثل CDS المقابل. يمكن أن تكون كل ميزة mRNA إما جزئية أو كاملة. إذا لم تكن هناك معلومات UTR ، فسيوافق موقع mRNA على موقع CDS الخاص به ، لكن mRNA سيكون جزئيًا عند نهايتيه 5 'و 3'. إذا كان mRNA جزئيًا ، فاجعل الجين جزئيًا.

تحتوي إرشادات التعليقات التوضيحية التفصيلية الخاصة بنا على أمثلة لتضمين ميزات mRNA الكاملة والجزئية.

معرّف_نسخة

يجب أن يشتمل المرسل أيضًا على مؤهل transcript_id. يتم استخدام transcript_id للتتبع الداخلي في قاعدة البيانات الخاصة بنا ، لذلك من المهم تضمين معرّف transcript_id كمؤهل لكل من CDS و mRNA المقابل. يجب أن يكون كل transcript_id فريدًا ومختلفًا عن معرف_بروتين. يرجى الاطلاع على تعليمات مفصلة للتعليقات التوضيحية.


قم بتشغيل table2asn للتعليق على التسلسلات

هذا هو نفس مفهوم إنشاء ملفات .sqn مع ملفات .tbl كمدخلات ، باستثناء:

[2] قم بتضمين هذه الوسائط في سطر الأوامر:

دعوى متى تدرج
-J -c w دائما
-euk عندما يكون الكائن من حقيقيات النوى
-locus-tag-prefix & lttext & gt إذا لم تكن locus_tags في ملف gff. قيمة "النص" هي بادئة locus_tag المسجلة.
-الفجوات- min & ltinteger & gt الحد الأدنى لعدد Ns في صف يمثل فجوة
-الفجوات- غير معروف & ltinteger & GT العدد الدقيق لـ Ns في صف يمثل فجوة بطول غير معروف تمامًا
الدليل على ارتباط التسلسلات على جانبي الفجوات. الأكثر شيوعًا ، "النهايات المزدوجة" أو "المحاذاة"
-يساعد استخدام الطباعة والوصف والحجج من البرنامج

[أ] لتضمين الجينات بشكل صحيح ، يجب أن تكون locus_tag موجودة في ملف .gff (في العمود 9 من كل جين) أو مضافًا بتضمين "-locus-tag-prefix XXXX" في سطر الأوامر (حيث يكون XXXX هو بادئة locus_tag المسجلة لهذا الجينوم).

[ب] إذا كان الكائن هو بدائيات النوى ، فقم بتضمين الكود الجيني في سطر الأوامر [gcode = 11].

table2asn -M n -J -cw -t template.sbt -gaps-min 10 -l paired-end -locus-tag-prefix XXXX -j "[organism = Escherichia coli] [strain = abcd] [gcode = 11]" -i fasta_file -f gff_file -o output_file.sqn -Z

  • معلومات المصدر والشفرة الجينية موجودة في سطر الأوامر ، وليس ملف فاستا
    • يتم توفير الكائن الحي والسلالة وسيتم سحب بقية المعلومات من BioSample المقابل
    • قم دائمًا بتضمين الكود الجيني ، [gcode = 11] ، لضمان التعرف على أكواد البدء البديلة

    table2asn -M n -J -cw -euk -t template.sbt -gaps-min 10 -l paired-end -j "[organism = Loa loa] [عزل = F231]" -i fasta_file -f gff_file -o output_file. sqn -Z

    • معلومات المصدر موجودة في سطر الأوامر ، وليس ملف fasta
      • يتم توفير الكائن الحي والعزلة وسيتم سحب بقية المعلومات من BioSample المقابل

      [هـ] استخدم الحجج المناسبة لموقفك. (لمعلوماتك ، "table2asn -help" ستطبع جميع الوسائط)

      [3] تحقق من إخراج تقرير التحقق من الصحة والتناقض وإصلاح المشكلات

      • تحقق من ملف .stats لمعرفة عدد الأخطاء الموجودة في ملفات .val وخطورتها ونوعها. يجب إصلاح جميع الأخطاء والرفض. سيؤدي وجود الأخطاء إلى إبطاء المعالجة. راجع أخطاء التحقق من صحة الجينوم للحصول على إرشادات. تواصل مع [email protected] لطرح أي أسئلة حول ناتج التحقق. أثناء المعالجة قد تكون هناك بعض الأسئلة حول جوانب أخرى من التقديم.
      • تحقق من ملف .dr لمعرفة نتائج تقرير التناقض. دائمًا ما تكون الفئات المسبوقة بـ FATAL غير مقبولة ويجب إصلاحها. بعض الفئات إعلامية. يجب فحص التقارير التي لم يتم تمييزها على أنها قاتلة لتحديد ما إذا كانت تمثل عيوبًا توضيحية تحتاج إلى تصحيح أو ما إذا كانت مقبولة بسبب بيولوجيا الجينوم. انظر إلى أمثلة تقرير التناقض وتفسيرات للإرشاد. اكتب إلى [email protected] وأرسل ملف discrep بأسئلة حول هذا التقرير.
      • تتضمن بعض الأخطاء الشائعة
        • فادح: MISSING_GENES. يحدث هذا عادةً بسبب عدم تضمين locus_tag. تأكد من أن locus_tag موجودة إما بتضمينها في ملف GFF في العمود 9 من كل جين أو بتضمين "locus-tag-prefix XXXX" (حيث XXXX هي بادئة locus_tag المسجلة للجينوم) في سطر الأوامر.
        • فادح: BACTERIAL_PARTIAL_NONEXTENDABLE_PROBLEMS. إذا كان هذا جينومًا حقيقيًا للنواة ، فيمكنك تجاهل هذا الخطأ. إذا كان هذا جينوم بدائية النواة ، فيجب أن يبدأ كل CDS وينتهي بكودونات بداية وإيقاف صالحة ، على التوالي ، أو أن يكون جزئيًا ويمتد إلى نهاية التسلسل أو يتاخم فجوة داخل تسلسل السقالة. ومع ذلك ، يجب أن تضيف تعليقًا توضيحيًا باستخدام pseudo = true أي جينات "مكسورة" ولكن لا يُعتقد أنها جينات خادعة. هذه هي الجينات التي لا تقوم بتشفير الترجمة المتوقعة ، على سبيل المثال بسبب رموز التوقف الداخلية أو رموز البداية أو الإيقاف المفقودة ، وغالبًا ما تكون ناجمة عن مشاكل في التسلسل و / أو التجميع.

        [4] قم بإرسال ملفات .sqn الخالية من الأخطاء عبر بوابة التقديم ، وفقًا للإرشادات المعتادة.


        1 إجابة 1

        دعنا نحاول الإجابة على الأجزاء الثلاثة لسؤالك.

        التسلسل الطريقة العامة هي نفسها. التسلسل هو مجرد تسلسل. ولكن بالنسبة لكل تسلسل فردي ، هناك عوامل يجب مراعاتها والبروتوكولات التي يجب اختيارها. أحد الأشياء المهمة هو أنك قد ترغب في قراءات طويلة نسبيًا للتعامل مع التكرارات والحجم الكبير العام لجينومات النبات. للحصول على قراءات طويلة ، تحتاج إلى تسلسلات طويلة من الحمض النووي للإدخال. لذلك قد ترغب في اتباع بروتوكول مناسب للحمض النووي النباتي عالي الوزن الجزيئي. قد يكون ذلك صعبًا ، لأن الحمض النووي للنبات قد يكون من الصعب استخراجه بناءً على النبات والأنسجة التي لديك ، لأنه من السهل جدًا "كسر" جدار الخلية في البداية. بعد ذلك ، يكون التسلسل العام. على الرغم من ذلك ، كما قلت سابقًا ، يمكنك اختيار القراءات الطويلة (PacBio) و / أو التغطية الجيدة. إذا لم يكن ذلك ممكنًا على الإطلاق ، فقد تختار القيام بالتسلسل المستهدف والتقاط الإكسوم بالكامل فقط (أو الجينات التي تهتم بها فقط) لتقليل التكلفة وتعقيد التحليل.

        المجسم الآن ربما تكون قد جمعت الكثير من التسلسل والتسلسل الطويل المحتمل أيضًا. هناك العديد من الأدوات التي يمكنك استخدامها للتجميع وعمومًا يمكنك استخدام نفس الشيء للنباتات التي قد ترغب في استخدامها على سبيل المثال لتجميع الجينوم البشري. أحد الأمثلة التي تعمل بشكل جيد على جينومات النباتات الكبيرة هو MaSuRCA ، والآخر هو Allpaths-LG. هناك بعض المجمعات المصممة للتعامل مع التكرارات الطويلة ، ولكن في كثير من الأحيان تقوم فقط بالتجميع ثم محاولة اكتشاف مناطق التكرار لاحقًا ، على سبيل المثال عن طريق تحسين تجميع قراءة البندقية بقراءات طويلة من تقنية أخرى.

        حاشية. ملاحظة هذا واحد بالتأكيد لديه أدوات محددة لجينوم النبات. حسنًا ، جينومات كبيرة. الشيء الرئيسي في التعليق التوضيحي هو العثور على الجينات المحتملة ومقارنتها بقواعد البيانات للتعليق عليها بوظيفة. النباتات تفعل لصق ويمكن أن يكون للنباتات إنترونات طويلة ، حتى منها بما في ذلك التكرارات الطويلة. أحد الأمثلة على برامج التنبؤ الجيني الذي يعمل على النباتات هو أغسطس ، ولكن بالنسبة لبعض الكائنات الحية النموذجية ، هناك حتى خطوط أنابيب وأدوات خاصة بالكائن الحي لهذه المهمة. وبالطبع ، في جزء قاعدة البيانات ، ستختار الاعتماد على قاعدة بيانات خاصة بالمصنع (إذا كنت لا تستخدم NCBI-NR على أي حال). يمكن أن تكون هذه أيضًا أنواعًا أو جنسًا محددًا مثل تلك التي تجدها في مشروع TAIR (Arapidopsis).

        TLDR: الأمر معقد في الواقع. من ناحية ، هناك حاجة إلى أدوات وقواعد بيانات محددة ، ومن ناحية أخرى قد تسير بشكل جيد مع الأدوات القياسية ، ولكن سيتعين عليك تكييف المعلمات ، والقيام بخطوات إضافية قبل المعالجة أو بعدها وما إلى ذلك.


        جودة تسلسل الحمض النووي - Phred - يوفر اتصالًا أساسيًا وعرض كروماتوجرام وتقييم عالي الجودة لمنطقة التسلسل والعرض التقديمي لما يصل إلى خمسة تسلسلات في وقت واحد.

        تجميع التسلسل - لا تحتاج إلى برنامج التجميع الخاص بك عندما يمكنك استخدام:

        EGassember - محاذاة ودمج أجزاء التسلسل الناتجة عن تسلسل البندقية أو نسخ الجينات (EST) من أجل إعادة بناء المقطع أو الجين الأصلي (المرجع: A. Masoudi-Nejad et al. 2006. Nucl. Acids Res. 34: W459-462).

        مجمع CGE 1.2 - يجمع بيانات Illumina ، 454 ، SOLid و Ion Torrent (المرجع: Larsen MV ، وآخرون. J. Clin. Micobiol. 2012. 50(4): 1355-1361).
        CGE SPAdes 3.9 - يجمع بيانات Illumina و Ion Torrent (المرجع: S. Nurk et al. Research in Computational Molecular Biology: pp 158-170).

        CAP3 (PBIL، فرنسا ) ، (المرجع: Huang، X. & amp Madan A. 1999. Genome Res. 9: 868-877) وهنا.
        مجمع CAP EST (Istituto FIRC di Oncologia Molecolare ، إيطاليا) - أقصى طول للتسلسل لكل سلسلة هو 30 كيلو بايت - أقصى عدد للتسلسلات 10 كيلو بايت

        يوفر موقع الويب MicroScope (المستضاف في Genoscope) بيئة لتعليقات الخبراء وعلم الجينوم المقارن. مشروع الجينوم: الشرح والتحليلات المقارنة لتسلسل الجينوم النهائي أو المسودة. بالنسبة للتسلسلات المشروحة مسبقًا ، فإنها تدمج فقط التعليقات التوضيحية من قسم الجينوم الكامل NCBI RefSeq. مشروع Metagenome: الشرح والتحليلات المقارنة للتسلسلات الميتاجينومية المجمعة. حاليًا ، يمكنهم دمج مجموعات البيانات التي تقل عن 20 ميجا بايت من contigs لكل حاوية.

        NanoPipe - تم تطويره مع مراعاة خصوصيات تقنيات تسلسل MinION ، مما يوفر معلمات المحاذاة المعدلة وفقًا لذلك. نطاق الأنواع / التسلسلات المستهدفة للمحاذاة غير محدود ، وتساعد صفحة الاستخدام الوصفية لـ NanoPipe المستخدم على النجاح في تحليل NanoPipe. تحتوي النتائج على إحصائيات المحاذاة وتسلسل الإجماع وبيانات تعدد الأشكال وتصور المحاذاة. (المرجع: Shabardina V et al. (2019) Gigascience 8 (2). بيي: giy169).


        COV2HTML: أداة تصور وتحليل لبيانات تسلسل الجيل التالي البكتيري (NGS) لعلماء الحياة ما بعد الجينوم - تسمح بإجراء كل من تصور التغطية وتحليل محاذاة NGS التي يتم إجراؤها على الكائنات بدائية النواة (البكتيريا والعاقمات). فهو يجمع بين عمليتين: أداة تقوم بتحويل خرائط NGS الضخمة أو ملفات التغطية إلى ملفات تغطية خفيفة محددة تحتوي على معلومات عن العناصر الجينية وواجهة تصور تسمح بتحليل البيانات في الوقت الفعلي مع تكامل اختياري للنتائج الإحصائية. (المرجع: Monot M. et al. 2014. OMICS 18(3): 184-95).

        DCA فرق وقهر محاذاة تسلسل متعددة ( جامعة بيليفيلد ، ألمانيا) - هو برنامج لإنتاج محاذاة متسلسلة متعددة ومتزامنة سريعة وعالية الجودة من الأحماض الأمينية أو الحمض النووي الريبي أو تسلسل الحمض النووي. (المرجع: Brinkmann، G. et al. البرمجة الرياضية 79: 71-97, 1997).

        PhageTerm - عبارة عن حزمة برامج سريعة وسهلة الاستخدام يمكن استخدامها لتحديد نهاية العاثية ووضع التعبئة والتغليف من بيانات NGS المجزأة عشوائيًا. إنه جزء من حزمة Galaxy ، ويمكن العثور عليه في الدليل & quotNGS: Mapping & quot. المثالي هو أنك تريد إجابة آلية. (المرجع: Garneau JR، et al. 2017. Sci Rep. 7(1):8292).

        QUAST - أداة تقييم الجودة لتقييم ومقارنة مجموعات الجينوم. تعمل هذه الأداة على تحسين برامج مقارنة التجميع الرائدة بأفكار جديدة ومقاييس الجودة. يمكن لـ QUAST تقييم التجميعات مع كل من الجينوم المرجعي ، وكذلك بدون مرجع. تنتج QUAST العديد من التقارير والجداول الموجزة والمؤامرات لمساعدة العلماء في أبحاثهم وفي منشوراتهم. (المرجع: A. Gurevich et al. 2013. Bioinformatics، 29(8): 1072 و ndash1075). ملحوظة. هذا الخادم اعتبارًا من أبريل 2020 ، ولكن هناك آمال في إعادة الاتصال بالإنترنت (انظر هنا لتنزيلات البرامج).

        أخطاء التسلسل: - إذا كان تسلسل الحمض النووي الخاص بك لا يتطابق مع تسلسل البروتين المتوقع ، يمكنك التحقق من وجود أخطاء في GeneWise (EMBL-EBI) الذي يقارن تسلسل البروتين بتسلسل الحمض النووي الجيني ، مما يسمح بإدخال أخطاء في الإنترونات وتحويل الإطارات. تشمل البرامج الأخرى:

        FrameD (المرجع: T. Schliex وآخرون 2003. Nucl. Acids Res. 31: 3738-3741)
        AMIGene - شرح توضيحي للجينات الميكروبية (المرجع: Bocs S et al. (2003) الدقة الأحماض النووية. 13(31): 3723-3726).
        مسار :: الترجمة الخلفية للبروتين والمواءمة - يعالج مشكلة إيجاد تماثلات البروتين البعيدة حيث يكون الاختلاف نتيجة طفرات واستبدال الإطارات. بالنظر إلى تسلسلين لبروتين الإدخال ، تقوم الطريقة ضمنيًا بمحاذاة جميع الأزواج الممكنة من تسلسلات الحمض النووي التي تشفرها ، عن طريق معالجة تمثيلات الرسوم البيانية الفعالة للذاكرة لمجموعة كاملة من تسلسلات الحمض النووي المفترضة لكل بروتين. (المرجع: G & icircrdea M et al. 2010. خوارزميات البيولوجيا الجزيئية 5:)

        In-silico.com (د. جوزيبا بيكاندي وزملاؤه بكلية الصيدلة بجامعة إقليم الباسك) - يسمح في السيليكو التجارب بما في ذلك تضخيم PCR النظري ، AFLP-PCR ، تحليل التقييد والرحلان الكهربي للهلام النبضي [PFGE] مع جينومات البكتريا و archael الموجودة في قاعدة البيانات العامة.

        NCBI بدائية النواة خط أنابيب التعليقات التوضيحية التلقائي. سيؤدي هذا إلى وضع تعليقات توضيحية على الجينوم البكتيري بالكامل وسيوفر لك ملف تقديم الترتر. ملحوظة. إن NCBI Phage Automatic Annotation Pipeline قيد التطوير.

        RAST (التعليق التوضيحي السريع باستخدام تقنية النظام الفرعي) هي خدمة مؤتمتة بالكامل لتعليق الجينومات البكتيرية والأثرية. يوفر شروحًا عالية الجودة للجينوم لهذه الجينومات عبر شجرة النشوء والتطور بأكملها. يتطلب التسجيل. (المرجع: Aziz، RK et al. 2008. BMC Genomics 9:75.).

        أداة BASys Bacterial Annotation Tool - تدعم هذه الأداة الرائعة التعليقات التوضيحية التلقائية المتعمقة للتسلسلات الجينومية البكتيرية. يقبل بيانات تسلسل الحمض النووي الخام وقائمة اختيارية لمعلومات تحديد الجينات (Glimmer) ويوفر تعليقًا توضيحيًا نصيًا شاملاً وإخراج صورة مرتبطة تشعبيًا. تستخدم BASys & gt30 برامج لتحديد 60 حقلاً فرعيًا للتعليقات التوضيحية لكل جين ، بما في ذلك اسم الجين / البروتين ، ووظيفة GO ، ووظيفة COG ، والمشابهات المحتملة وتقويم العظام ، والوزن الجزيئي ، والنقطة الكهربية ، وبنية التشغيل ، والتوطين تحت الخلوي ، وببتيدات الإشارة ، ومناطق الغشاء ، والبنية الثانوية ، هيكل ثلاثي الأبعاد وردود الفعل والمسارات. (المرجع: G.H. Van Domselaar et al. 2005. Nucl. Acids Res. 33(مشكلة خادم الويب): W455-W459).

        MicroScope - (CEA ، Institut de G & eacutenomique - Genoscope ، فرنسا) عبارة عن نظام أساسي لتحليل الجينوم الميكروبي للتعليقات التوضيحية والتحليل الذي يوفر إمكانية الوصول إلى مجموعة واسعة من الأدوات بما في ذلك تحليل COG والجينوميات المقارنة. (المرجع: Vallenet D et al. (2017) Nucleic Acids Res. 45 (د 1): D517-D528). يتطلب التسجيل.

        MAKER Web Annotation Service (MWAS) عبارة عن خط أنابيب لتعليقات الجينوم سهل التكوين ويمكن الوصول إليه عبر الويب. الغرض من ذلك هو السماح لمجموعات البحث التي تحتوي على كميات صغيرة إلى متوسطة من تسلسل الجينوم حقيقية النواة وبدائية النواة (أي استنساخ BAC ، والجينومات الكاملة الصغيرة ، وبيانات التسلسل الأولية ، وما إلى ذلك) للتعليق على بياناتها وتحليلها بشكل مستقل وإنتاج مخرجات يمكن تحميلها في قاعدة بيانات الجينوم. (المرجع: Holt، C. & amp Yandell، M. 2011. BMC Bioinformatics 12:491).

        MITOS - تم تصميم خط أنابيب لتوفير شرح توضيحي متسق وعالي الجودة لتسلسل جينومات الميتوكوندريا الميتازوان. نوضح أن نتائج MITOS تطابق RefSeq و MitoZoa من حيث تغطية التعليقات التوضيحية وجودتها. في الوقت نفسه ، نتجنب التحيزات والتضارب في التسميات والأخطاء المطبعية الناشئة عن استراتيجيات التنظيم اليدوي. (المرجع: M. Bernt et al. 2013. علم الوراثة الجزيئي وتطور الأمبير 69:313-319).

        جينساس - الجنرالome سمعادلة أملاحظة سerver - يوفر موقعًا إلكترونيًا شاملاً بواجهة رسومية واحدة لتشغيل العديد من أدوات التعليقات التوضيحية الهيكلية والوظيفية ، مما يتيح التصور والمعالجة اليدوية لتسلسلات الجينوم. يمكن للمستخدمين تحميل التسلسلات في حساباتهم وتشغيل برامج التنبؤ الجيني ، وعمليات البحث عن البروتين المتماثل ، وخريطة ESTs ، وتحديد التكرارات ، و ORFs و SSR مع إعدادات المعلمات المخصصة. يتم عرض كل تحليل على مسارات منفصلة للواجهة الرسومية مع مسارات تحرير مخصصة لتحديد التعليق التوضيحي النهائي للميزات وإنشاء ملفات gff3 للتحميل إلى متصفحات الجينوم مثل GBrowse. يمكن إضافة برامج إضافية بسهولة باستخدام هذا البرنامج القائم على دروبال.

        الخامسإيرال جيenome االترددات اللاسلكية ررأس (VIGOR) - يدعم التنبؤ بميزة الإنتاجية العالية والتعليقات التوضيحية. تستخدم VIGOR إستراتيجية خارجية وتتميز بحساسية وخصوصية أكبر من 98٪ لجينومات RNA الفيروسية التي اختبرناها. تشمل الميزات الخاصة بالجينوم التي حددتها VIGOR تغييرات الإطارات ، والانزلاق الريبوزومي ، وتحرير الحمض النووي الريبي ، وإيقاف قراءة الكودون ، والجينات المتداخلة ، والجينات المضمنة ، ومواقع الانقسام الببتيد الناضج. القدرة على التنميط الجيني للأنفلونزا والفيروسات العجلية مدمجة في البرنامج.
        (المرجع: S. Wang et al. 2011. BMC Bioinformatics 2010، 11:451)

        فلان (فلوريداش ANتدوين) هو خادم ويب NCBI للتعليق التوضيحي للجينوم لفيروس الأنفلونزا هو أداة يوفرها المستخدم لفيروس الإنفلونزا A أو تسلسل فيروسات الأنفلونزا B. يمكنه التحقق والتنبؤ بتسلسل البروتين المشفر بواسطة تسلسل إنفلونزا المدخلات. (المرجع: Y. Bao et al. 2007. Nucleic Acids Res. Web Server issue) 35: W280-W284.)

        كبجافاس ( جمرحباصالاخير جيenome أنوتاتيون الخامسisualization أnalysis و GenBank سأداة ubmission) - تتيح شرحًا دقيقًا لجينوم البلاستيدات الخضراء ، وإنشاء خرائط دائرية ، وتوفير نتائج تحليل مفيدة للجينوم المشروح ، وإنشاء ملفات يمكن إرسالها إلى GenBank مباشرة. (المرجع: C. Liu et al. 2012. BMC Genomics 13: 715)

        جيenome أملاحظة تيالفدية يوtility (GATU) يعلق على الجينوم بناءً على جينوم مرجعي وثيق الصلة. يتم تفجير البروتينات / الببتيدات الناضجة للجينوم المرجعي مقابل الجينوم ليتم شرحها من أجل العثور على الجينات / الببتيدات الناضجة في الجينوم المراد شرحها (المرجع: T. Tcherepano v et al. 2006. BMC Genomics 7:150.)

        BioGPS (معهد سكريبس للأبحاث ، الولايات المتحدة الأمريكية) - عبارة عن بوابة للتعليقات التوضيحية الجينية وقفة واحدة تؤكد على قابلية المستخدم للتخصيص وقابلية التوسع في المجتمع ، وهي بوابة للتعليقات التوضيحية الجينية قابلة للتخصيص ومورد كامل للتعلم عن وظيفة الجينات والبروتينات.

        باجل (معهد جرونينجن للعلوم الجزيئية الحيوية والتكنولوجيا الحيوية ، هارين ، هولندا) - سيحدد من ملف GenBank الموجود أو غير المقدم وجود البكتيريا بناءً على قاعدة بيانات تحتوي على معلومات عن البكتريوسينات المعروفة والجينات المجاورة المشاركة في نشاط البكتريوسين. موقع بديل للبكتريوسينات هو BACTIBASE وهو مستودع بيانات من الببتيدات الطبيعية المضادة للميكروبات البكتيريوسين. ارى . LABioicin إذا كنت مهتمًا بموضوع بكتيريا حمض اللاكتيك (LAB) وبكترياها.

        ميكيك (MIجينوم كروبيال التحقق منer) - يتيح التحقق السريع من مجموعات الجينات المشروحة وتحولات الإطارات في الجينومات البكتيرية المنشورة مسبقًا ، أو الجينومات التي يمتلك المستخدم ملفًا بها * .gbk. يمكن اعتبار هذه الأداة كخطوة أولية قبل خطوة إعادة الشرح الوظيفي للتحقق بسرعة من الجينات المفقودة أو المشروحة بشكل خاطئ. لقد عملت بشكل جيد مع جينومات العاثيات من 43-135 كيلو بايت. (المرجع: S. Cruveiller et al. 2005. Nucl. Acids Res. 33: W471- W479).

        WebGeSTer - Geنوم ستعليب ل تيرminators - برنامج بحث النهاية المفضل لدي تم تمكينه أخيرًا على الويب. يرجى ملاحظة أنه إذا كنت ترغب في تحليل البيانات من ملف * .gbk ، فأنت بحاجة إلى استخدام برنامج التحويل الخاص بهم & quotGenBank2GeSTer & quot أولاً. يتم إنتاج وصف كامل لكل فاصل بما في ذلك رسم تخطيطي بواسطة هذا البرنامج. هذا الموقع مرتبط بقاعدة بيانات واسعة النطاق من المحطات النصية في الجينوم البكتيري (WebGeSTer DB) (المرجع: Mitra A. et al. 2011. Nucl. Acids Res. 39 (إصدار قاعدة البيانات): D129-35).

        ريبكس: ضلعأوسويتش السابقplorer - المسح الضوئي و lt40kb DNA للجينات المحتملة (المرتبطة بـ BLASTP) وعدة مئات من العناصر التنظيمية ، بما في ذلك المحولات الريبية. إذا نقرت على & quotsearch عن المخففات & quot ، فستجد مواد إنهاء ومضادات. يعرض الجينات المكلومة وتحليل بيريت بلاست في NCBI (المرجع: C. Abreu-Goodger & amp E. Merino.2005. Nucl. Acids Res. 33: W690-W692).

        tRNAs: tRNAscan-SE - حساس بشكل لا يصدق ويوفر أيضًا مخططات هيكلية ثانوية لجزيئات الحمض النووي الريبي (المرجع: Schattner، P. et al. 2005. Nucleic Acids Res. 33: W686-689). بدلاً من ذلك ، استخدم ARAGORN (المرجع: Laslett، D. & amp Canback. 2004. Nucleic Acids Research 32:11-16).
        تسلسل الاختبار.

        LTR_Finder - هو برنامج فعال لإيجاد retrotranspsons كامل الطول LTR في تسلسل الجينوم. يقتصر حجم ملف الإدخال الآن على 50 ميجا بايت (المرجع: Z. Xu & amp H. Wang. 2007. Nucl. Acids Res.35(مشكلة خادم الويب): W265-W268).
        RTAnalyzer - يعثر على الينقولات العكسية ويكتشف تواقيع التحويل الرجعي L1 (المرجع: JF. Lucier et al. 2007. Nucl. Acids Res. 35(مشكلة خادم الويب): W269-W274

        MG- راست (مetagenome رأبيد أNnotation باستخدام سubsystem تيechnology) هي خدمة مؤتمتة بالكامل لتعليق عينات الميتاجينوم. يوفر شرحًا توضيحيًا لشظايا التسلسل وتصنيفها النشئي وإعادة بناء التمثيل الغذائي الأولي.توفر الخدمة أيضًا وسائل لمقارنة تصنيفات النشوء والتطور وعمليات إعادة البناء الأيضية للميتاجينومات (المرجع: F.Meyer et al. 2008. BMC Bioinformatics 9: 386).

        يمكن استخدام البرامج الأربعة التالية للتنبؤ ببروتينات الملتهمة:

        PVPred (المرجع: Ding H et al (2014) Mol Biosyst 10(8): 2229-2235).
        PHPred (المرجع: Ding H (2016) Computers Biol Med 71: 156 و ndash161).
        PVP-SVM (المرجع: Manavalan B et al. (2018) Front Microbiol 9: 476).
        PVPred-SCM (المرجع: Charoenkwan P et al. (2020) الخلايا 9 (2) بيي: E353.

        أصل تكرار الكروموسوم:

        يعد Ori-Finder و Ori-Finder 2 - منصات مفيدة لتحديد وتحليل أصول النسخ المتماثل (oriCs) في الجينوم البكتيري والأثرى ، على التوالي. (المرجع: Luo H et al. (2019) معلومات حيوية موجزة 20(4): 1114-1124). يرجى ملاحظة أنه تم استخدام هذه الأدوات لإنشاء DoriC - قاعدة بيانات لأصول النسخ المتماثل في جينومات بدائية النواة بما في ذلك الكروموسومات والبلازميدات. (المرجع: Luo H & amp Gao F (2019) Nucleic Acids Res. 47 (د 1): D74-D77).

        تتمثل إحدى مشكلات GenBank في أن العلماء لا يقومون بتحديث بيانات الإرسال الخاصة بهم ولا يصححون الأخطاء. يرجع هذا جزئيًا إلى الكسل ولكنه أيضًا يرجع إلى حقيقة أن GenBank ، في معظم الحالات ، غير راغب في قبول إصدار جديد من ملف Sequin. Tbl2asn هو برنامج سطر أوامر يقوم بأتمتة إنشاء سجلات التسلسل لتقديمها إلى GenBank ، ولكن من وجهة نظري ، ليس من السهل استخدامه. البرنامج الوحيد عبر الإنترنت هو GenBank 2 Sequin الذي لا يقوم فقط بإنشاء ملف Sequin (* .sqn) ، ولكن أيضًا من خمسة أعمدة & quotAnnotation Table & quot (* .tbl). يمكن إرسال هذا جنبًا إلى جنب مع تسلسل الحمض النووي بتنسيق Fasta إلى GenBank عبر البريد الإلكتروني ([email protected]). في حالة عدم وجوده ، أوصي باستخدام البرنامج النصي perl gbf2tbl.pl للتنزيل هنا.


        PlasmidFinder 1.3 - يتعرف على البلازميدات في عزلات البكتيريا المتسلسلة الكلية أو الجزئية. تستخدم الطريقة BLAST لتحديد النسخ المتماثلة للبلازميدات التي تنتمي إلى مجموعات عدم التوافق الرئيسية (Inc) المعوية. كمدخلات ، يمكن للطريقة استخدام كل من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة. انظر أيضًا pMLST (المرجع: Carattoli A et al. 2014. Antimicrob. Agents Chemother. 58: 3895-903)

        يمكن استخدام PHACTS لتصنيف نمط حياة العاثية بسرعة (معتدل أو معتدل). كل ما هو مطلوب هو بروتينات العاثية المراد تصنيفها وستتنبأ PHACTS بنمط حياة تلك العاثية وتعيد قيمة الثقة لهذا التوقع. (المرجع: K. McNair et al. 2012. Bioinformatics 28: 614-618).

        SpeciesFinder 1.0.0 تحديث (الجامعة التقنية الدنماركية) - يتنبأ بأنواع البكتيريا من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات متسلسلة قصيرة. يعتمد التنبؤ على جين 16S rRNA.

        CSI Phylogeny 1.1 (Call SNPs & amp Infer Phylogeny) - يستدعي SNPs ، يرشح SNPs ، يقوم بالتحقق من الموقع ويستنتج نسالة بناءً على المحاذاة المتسلسلة للجودة العالية * SNPs. (المرجع: Kaas، RS et al. PLoS ONE 2014 9: e104984.)

        يتنبأ KmerFinder 2.0 & ndash بأنواع البكتيريا من الجينومات المجمعة مسبقًا ، الكاملة أو الجزئية ، وقراءات التسلسل القصيرة. يعتمد التنبؤ على عدد k-mers المتزامنة (سلاسل فرعية من النيوكليوتيدات في بيانات تسلسل الحمض النووي ، في هذه الحالة 16-mers) بين جينومات البكتيريا المرجعية في قاعدة بيانات والجينوم الذي يوفره المستخدم. (المرجع: Hasman H et al. 2013. J Clin Microbiol. 52:139-146)

        VIOLIN: فحص اللقاحات وشبكة المعلومات عبر الإنترنت - تتيح سهولة المعالجة والمقارنة والتحليل للبيانات البحثية المتعلقة باللقاح عبر مختلف مسببات الأمراض البشرية ، ومن المتوقع أن يصبح VIOLIN مصدرًا مركزيًا لمعلومات اللقاح وأن يزود الباحثين في العلوم الأساسية والسريرية ببيانات منسقة و أدوات المعلوماتية الحيوية لبحوث اللقاحات وتطويرها. VBLAST: بحث مخصص لأبحاث اللقاحات يسمح بإستراتيجيات بحث متنوعة ضد 77 جينومًا لـ 34 من مسببات الأمراض. (المرجع: He، Y. et al. 2014. Nucleic Acids Res. 42 (مشكلة في قاعدة البيانات): D1124-32).

        MLST 1.8 (MultiLocus Sequence Typing) - تعمل حاليًا فقط مع الجينومات المجمعة و contigs (المرجع: Larsen MV et al. 2012. J. Clin. Micobiol. 50: 1355-1361).

        ECFfinder - عوامل سيجما للوظيفة خارج الهيولى (ECF) - أكبر مجموعة من عوامل سيجما البديلة - تمثل الآلية الأساسية الثالثة لنقل الإشارات البكتيرية ، مع حوالي ستة منظمات من هذا القبيل في المتوسط ​​لكل جينوم بكتيري. جنبا إلى جنب مع عوامل مكافحة سيغما المماثلة ، فإنها تمثل تصميمًا معياريًا للغاية يسهل بشكل أساسي نقل إشارة الغشاء. (المرجع: Staron A et al. (2009) Mol Microbiol 74(3): 557-581).

        BacWGSTdb - مصمم لرصد ظهور وانتشار مسببات الأمراض البكتيرية الهامة. بالتفصيل ، يخدم غرضين معينين: الكتابة وتتبع أمبير. يشير الأول إلى التنميط الجيني المتكامل في كل من الكتابة التسلسلية التقليدية متعددة المواضع (MLST) ومستوى كتابة تسلسل الجينوم الكامل (WGST). يشير الأخير إلى تتبع المصدر (أي العثور على عزلات متشابهة للغاية) وفقًا لنتيجة الكتابة ويعزل المعلومات المخزنة في BacWGSTdb. (المرجع: Z. Ruan 7 Y. Feng، Nucleic Acids Research. 2016 44 (د 1): D682-D687).

        سيستر: سألمونيلا أنان سإليكو تييبينغ رesource - (وكالة الصحة العامة الكندية ، مختبر الأمراض الحيوانية المنشأ المنقولة بالغذاء) هو مورد للمعلومات الحيوية للترجمة السريعة في بيانات السيليكو لطرق فرعية متعددة للسالمونيلا من مسودة تجميعات الجينوم البكتيري. بالإضافة إلى إجراء التنبؤ المصلي عن طريق التنميط الجيني ، يدمج هذا المورد تحليلات الكتابة القائمة على التسلسل لـ: Multi-Locus Sequence Typing (MLST) و MLST الريبوسومي (rMLST) و MLST الجينومي الأساسي (cgMLST). يوصى باستخدام Google Chrome ، حيث يتم دعم Firefox أيضًا ولكن تصورات SVG داخل هذا التطبيق قد لا تكون سريعة الاستجابة. Internet Explorer غير مدعوم.

        FSFinder2 (Fالتحول السريع سشرعي Finder) - تشارك عملية تغيير الإطارات الريبوزومية المبرمجة في التعبير عن جينات معينة من مجموعة واسعة من الكائنات الحية مثل الفيروسات والبكتيريا وحقيقيات النوى بما في ذلك الإنسان. في نظام تغيير الإطارات المبرمج ، يتحول الريبوسوم إلى إطار بديل في موقع معين استجابة لإشارة خاصة في الحمض النووي الريبي messanger. يلعب نظام Frameshift المبرمج دورًا في تكوين الجسيمات الفيروسية ، والتحكم الذاتي ، والأنشطة الأنزيمية البديلة. إن الانزياح العام للإطار هو انزياح إطار -1 ، حيث يزيح الريبوسوم نيوكليوتيد واحد في اتجاه المنبع. تتكون العناصر الرئيسية لـ -1 تغيير الإطارات من موقع زلق ، حيث يغير الريبوسوم إطارات القراءة ، وهيكل RNA محفز مثل العقدة الكاذبة أو الحلقة الجذعية الموجودة في عدد قليل من النيوكليوتيدات في اتجاه مجرى النهر. +1 تغيير الإطارات أقل شيوعًا من -1 تغيير الإطارات ولكن يتم ملاحظتها في الكائنات الحية المتنوعة.

        InBase ، قاعدة بيانات وتسجيل Intein - يتم تعريف ربط البروتين على أنه استئصال تسلسل البروتين المتداخل (INTEIN) من طليعة البروتين والربط المصاحب لشظايا البروتين المرافقة (EXTEINS) لتشكيل بروتين مضيف خارجي ناضج و intein الحرة (بيرلر 1994). ينتج عن تضفير البروتين رابطة ببتيد أصلية بين exteins المربوطة. هذا موقع قاعدة بيانات يسمح بتحليل بلاست. (المرجع: Perler، F.B. 2002. Nucleic Acids Res. 30: 383-384).

        P2RP (البروتينات التنظيمية بدائية النواة المتوقعة) - يمكن للمستخدمين إدخال تسلسل الحمض الأميني أو الحمض النووي الجيني ، ويتم فحص البروتينات المتوقعة فيه لامتلاك مجالات ربط الحمض النووي و / أو مجالات النظام المكونة من مكونين. يتم تصنيف RPs المحددة بهذه الطريقة إلى عائلات ، مشروحة بشكل لا لبس فيه. (المرجع: Barakat M، et al. 2013. BMC Genomics 14:269).

        P2CS (أنظمة بدائية النواة ثنائية المكونات) هي مورد شامل لتحليل الأنظمة ثنائية المكونات بدائية النواة (TCS). تتكون TCS من مستقبلات هيستيدين كيناز (HK) ومنظم استجابة شريك (RR) وتتحكم في سلوكيات بدائية النواة المهمة. يمكن البحث عنها باستخدام BLASTP. (المرجع: P. Ortet et al. 2015. Nucl. Acids Res. 43 (D1): D536-D541).

        تحليل COG - جاللمعان ارثولوجي جيroups - تم إنشاء قاعدة بيانات بروتين COG من خلال مقارنة البروتينات المتوقعة والمعروفة في جميع الجينومات الميكروبية المتسلسلة تمامًا لاستنتاج مجموعات من أخصائيي تقويم العظام. يتكون كل COG من مجموعة من البروتينات التي وجدت أنها متعامدة عبر ثلاثة سلالات على الأقل ومن المحتمل أنها تتوافق مع مجال قديم محفوظ (CloVR). تشمل المواقع التي تقدم هذا التحليل ما يلي:

        WebMGA (المرجع: S. Wu et al. 2011. BMC Genomics 12:444)، RAST (المرجع: Aziz RK وآخرون 2008. BMC Genomics 9:75) ، و BASys (بأكتيري أملاحظة سمرجع ystem: Van Domselaar GH et al. 2005. الأحماض النووية الدقة. 33(مشكلة خادم الويب): W455-459.) و JGI IMG (أناتكامل مميكروبي جيenomes المرجع: Markowitz VM et al. 2014. نوكل. الدقة الأحماض. 42: D560-D567. )

        مواقع أخرى:

        EggNOG - قاعدة بيانات للمجموعات المتعامدة والتعليق التوضيحي الوظيفي الذي ينشأ نتحت الإشراف ارثولوجي جيroups (NOGs) من الجينوم الكامل ، ثم يطبق خط أنابيب توصيف وتحليل شامل لعائلات الجينات الناتجة. (المرجع: Powell S et al. 2014. Nucleic Acids Res. 42 (D1): D231-D239

        OrthoMCL - هي خوارزمية أخرى لتجميع البروتينات في مجموعات تقويمية بناءً على تشابه تسلسلها. تستغرق العملية عادة ما بين 6 و 72 ساعة (المرجع: Fischer S et al. 2011. Curr Protoc Bioinformatics الفصل 6: الوحدة 6.12.1-19).

        KAAS (كبيضة أأوتوماتيكي أملاحظة سerver) شرحًا توضيحيًا وظيفيًا للجينات عن طريق مقارنات BLAST أو GHOST مقابل قاعدة بيانات KEGG GENES المنسقة يدويًا. تحتوي النتيجة على مهام KO (KEGG Orthology) ومسارات KEGG التي تم إنشاؤها تلقائيًا. (المرجع: Moriya Y et al. 2007. Nucleic Acids Res. 35(مشكلة خادم الويب): W182-185).

        ResFinder (مكتشف الجينات المقاومة لمضادات الميكروبات المكتسبة) - يستخدم بلاست لتحديد جينات مقاومة مضادات الميكروبات المكتسبة في بيانات الجينوم الكامل. كمدخلات ، يمكن أن تستخدم الطريقة كلاً من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة. تم اختباره باستخدام 1411 جينة مقاومة مختلفة مع هوية 100٪. (المرجع: Zankari E et al. 2012. J Antimicrob Chemother. 67:2640-2644)

        ARG-ANNOT (أntibiotic رمقاومة جيENE-ANNOTation) هي أداة جديدة تم إنشاؤها للكشف عن جينات مقاومة المضادات الحيوية (AR) الموجودة والمفترضة في الجينوم البكتيري. يستخدم ARG-ANNOT برنامج انفجار محلي في برنامج Bio-Edit يسمح للمستخدم بتحليل التسلسلات بدون واجهة ويب (المرجع: Gupta، S.K. et al. 2014. Antimicrob Agents Chemother. 58: 212 & ndash220).

        بطاقة ( جشامل أntibiotic رمقاومة دatabase) - مجموعة منظمة بدقة من محددات المقاومة المعروفة والمضادات الحيوية المرتبطة بها ، والتي نظمتها نماذج اكتشاف الجينات المقاومة للمضادات الحيوية (ARO) ونماذج اكتشاف الجينات AMR (المرجع: Jia، B. et al. 2017. Nucleic Acids Research، 45: D566-573).

        MEGARes - عبارة عن قاعدة بيانات منظمة يدويًا لمقاومة مضادات الميكروبات وهيكل التعليقات التوضيحية التي توفر أساسًا لتطوير المصنفات الدورية عالية الإنتاجية والتحليل الإحصائي الهرمي للبيانات الضخمة (المرجع: Lakin، S.N .. وآخرون. 2017. Nucleic Acids Research، 45: D574-D580).

        BacMet (مضادالبكالوريامبيد حيوي وأمبير التقىal Resistance Genes Database) - قاعدة بيانات للجينات المقاومة للمبيدات الحيوية والمعادن ذات المحتوى الموثوق به للغاية. في الإصدار 1.1 من BacMet ، تحتوي قاعدة البيانات المؤكدة تجريبياً على 704 جينة مقاومة ، بينما تحتوي قاعدة البيانات المتوقعة على 40556 جينة مقاومة (المرجع: Pal، C. et al. 2014. Nucleic Acids Research، 42: D737-743).

        تعليق توضيحي متخصص - كريسبر (تكرارات متقطعة قصيرة متباعدة بشكل منتظم ومتباعدة):

        CRISPRfinder - يتيح الكشف السهل عن CRISPRs في البيانات المنتجة محليًا والتشاور مع CRISPRs الموجودة في قاعدة البيانات. كما أنه يعطي معلومات عن وجود الجينات المرتبطة بـ CRISPR عندما يتم شرحها على هذا النحو. . (المرجع: I. Grissa et al. 2007. Nucl. Acids Res. 35 (مشكلة خادم الويب): W52-W57).

        CRISPRmap - توفر نظرة ثاقبة سريعة ومفصلة حول الحفظ المتكرر والتنوع لكل من الأنظمة البكتيرية والأثرية. وهو يتألف من أكبر مجموعة بيانات لـ CRISPRs حتى الآن وتمكّن تحليلات المجموعات المستقلة الشاملة لتحديد عائلات التسلسل المحفوظة ، والزخارف الهيكلية المحتملة لـ endoribonucleases ، والعلاقات التطورية. (المرجع: S.J. Lange et al. 2013. Nucleic Acids Research، 41: 8034-8044).

        CRISPI: قاعدة بيانات تفاعلية CRISPR - تتضمن مجموعة كاملة من الجينات المرتبطة بـ CRISPR (CAS). واجهة ويب سهلة الاستخدام مع العديد من الأدوات والوظائف الرسومية تسمح للمستخدمين باستخراج النتائج ، والعثور على كريسبر في التسلسلات الشخصية أو حساب تشابه التسلسل مع الفواصل (المرجع: روسو سي وآخرون 2009. المعلوماتية الحيوية. 25: 3317 & ndash3318).

        هدف CRISPR - الذي يتنبأ بالأهداف الأكثر ترجيحًا لـ CRISPR RNAs. يمكن استخدام هذا لاكتشاف الأهداف في البيانات الجينومية أو الميتاجينومية المتسلسلة حديثًا. (المرجع: Biswas A et al. 2013. RNA Biol. 10:817-827).

        CRISPy-web - هي أداة ويب سهلة الاستخدام تعتمد على CRISPy لتصميم sgRNAs لأي جينوم ميكروبي يوفره المستخدم. يسمح CRISPy-web للباحثين باختيار منطقة من الجينوم الخاص بهم بشكل تفاعلي للبحث عن sgRNAs المحتملة. بعد التحقق من التطابقات المحتملة خارج الهدف ، يتم عرض تسلسلات sgRNA الناتجة بيانياً ويمكن تصديرها إلى ملفات نصية. (المرجع: K. Blin et al. 2016. Synthetic and Systems Biotechnology 1 (2): 118-121).

        التعليق التوضيحي المتخصص - محددات الفوعة: هذا ذو أهمية خاصة لأولئك الذين يعملون على العاثيات للعلاج

        فيرولينس فايندر (الجامعة التقنية الدنماركية) & - تحديد جينات الفوعة. تستخدم الطريقة بلاست لتحديد جينات الفوعة المعروفة في الإشريكية القولونية. يتم توسيع الطريقة لتشمل أيضًا جينات الفوعة لـ المكورات المعوية و المكورات العنقودية الذهبية. كمدخلات ، يمكن أن تستخدم الطريقة كلاً من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة.

        ClanTox: مصنف للسموم الحيوانية القصيرة - يتنبأ بما إذا كان كل تسلسل يشبه السموم ويوفر قائمة مرتبة بالمرشحين الذين تم توقعهم بشكل إيجابي وفقًا للثقة الإحصائية. لكل بروتين ، يتم تقديم معلومات إضافية بما في ذلك وجود إشارة الببتيد ، وعدد بقايا السيستين والتعليقات التوضيحية الوظيفية المرتبطة بها. (المرجع: G. Naamati et al. 2009. Nucleic Acids Res. 37 (مشكلة خادم الويب): W363 & ndashW368).

        t3db قاعدة بيانات Toxin and Toxin Target - تجمع بيانات مفصلة عن السموم مع معلومات شاملة عن هدف السموم. تحتوي قاعدة البيانات حاليًا على 3053 سمًا مرتبطة بـ 1،670 سجلًا مستهدفًا للسموم المقابلة. يحتوي كل سجل للسموم (ToxCard) على أكثر من 50 حقلاً من البيانات ويحتوي على معلومات مثل الخصائص والوصفات الكيميائية وقيم السمية والتفاعلات الجزيئية والخلوية والمعلومات الطبية. (المرجع: Lim E et al. 2010. Nucleic Acids Res. 38 (إصدار قاعدة البيانات): D781-786).

        TAfinder 2.0 - هي أداة قائمة على الويب لتحديد مواقع مضادات السموم من النوع الثاني في الجينوم البكتيري (المرجع: Xie Y et al. (2018) Nucleic Acids Res. 46(D1): D749-D753).

        قاعدة بيانات DBETH للسموم الخارجية البكتيرية للبشر هي قاعدة بيانات للتسلسلات والهياكل وشبكات التفاعل والنتائج التحليلية لـ 229 سمًا خارجيًا ، من 26 جنسًا بكتيريًا مختلفًا ممرضًا بشريًا. يتم تصنيف جميع السموم إلى 24 فئة مختلفة من السموم. الهدف من DBETH هو توفير قاعدة بيانات شاملة للسموم الخارجية البكتيرية المسببة للأمراض البشرية. (المرجع: Chakraborty A et al. 2012. Nucleic Acids Res. 40 (مشكلة في قاعدة البيانات): D615-620).

        VFDB - قاعدة بيانات متكاملة وشاملة لعوامل الفوعة لمسببات الأمراض البكتيرية (بما في ذلك الكلاميديا ​​والميكوبلازما). (المرجع: L.H. Chen et al. 2012. Nucleic Acids Res. 40 (مشكلة في قاعدة البيانات): D641-D645).

        PAIDB (بنسلفانياالنشأة أناافتراء دآتابase) - تعد جزر الإمراضية (PAIs) وجزر المقاومة (REIs) مفتاحًا لتطور مسببات الأمراض ويبدو أنها تلعب أدوارًا تكميلية في عملية العدوى البكتيرية. في حين أن العناصر المؤثرات العقلية تعزز تطور المرض ، فإن العناصر المتفاعلة (REI) تمنح ميزة اللياقة للمضيف ضد العديد من العوامل المضادة للميكروبات. يحدد برنامج ثانوي ، PAI Finder ، مناطق تشبه PAI أو مناطق تشبه REI في استعلام متعدد التسلسلات. (المرجع: S.H Yoon et al. 2015. Nucl. Acids Res. 43 (D1): D624-D630).

        IslandViewer - يتضمن أداة تصور الجينوم التفاعلي الجديدة ، IslandPlot ، وعامل الفوعة الموسع ، وجين مقاومة مضادات الميكروبات ، وشروح الجينات المرتبطة بمسببات الأمراض ، بالإضافة إلى متماثلات هذه الجينات في الجينومات وثيقة الصلة. والجدير بالذكر أن الجينومات غير المكتملة مقبولة كمدخلات في IslandViewer 3 ، على الرغم من أنها تحث المستخدمين بشدة على استخدام جينومات كاملة كلما أمكن ذلك. (المرجع: B.K. Dhillon et al. 2015. Nucl. Acids Res. 43 (W1): W104-W108).

        قاعدة بيانات الغجر - قاعدة بيانات مفتوحة قابلة للتحرير حول العلاقة التطورية للفيروسات والعناصر الوراثية المتنقلة (MGEs Ty3 / Gypsy و Retroviridae و Ty1 / Copia و Bel / Pao LTR retroelements و Caulimoviridae الفيروسات القهقرية للنباتات) والتكرارات الجينية الأخرى. مجهزة لعمليات البحث BLAST و HMM. (المرجع: Llorens، C et al. 2011. Nucl. Acids Res. 39(ملحق 1): D70-D74).

        بانداوكس (مقلاة جينوم داتاباس للعناصر الجينية توكسic to Bacteria) - هي قاعدة بيانات للجينات والمناطق بين الجينات التي لا يمكن استنساخها في E. coli ، للمساعدة في اكتشاف المضادات الحيوية الجديدة والجينات الوظيفية المفيدة من الناحية التقنية الحيوية. إنه مصمم أيضًا لتحسين كفاءة هندسة التمثيل الغذائي. وشملت ميزة البحث بلاست. (المرجع: Mitai G & amp Sorek R. 2012. Bioengineered، 3: 218-221.)

        مستكشف العوامل الممرضة (يتنبأ بإمكانيات مسببة للأمراض) & ndash استنادًا إلى جينومات كاملة من 513 بكتيريا تم شرحها على أنها غير مسببة للأمراض البشرية و 372 بكتيريا تم شرحها على أنها مسببات الأمراض البشرية ، وقد تم إنشاء قاعدة بيانات لعائلات البروتين ، والتي إما مرتبطة بشكل أساسي بمسببات الأمراض أو مع مسببات الأمراض. ثم يتم استخدام قاعدة البيانات هذه للتنبؤ بإمكانية البكتيريا المسببة للأمراض. كمدخلات ، يمكن للطريقة استخدام كل من الجينومات المجمعة مسبقًا أو الكاملة أو الجزئية ، وقراءات التسلسل القصير من أربع منصات تسلسل مختلفة. (المرجع: Cosentino S et al. 2013. PLoS ONE 8: e77302)

        VirulentPred - هي طريقة تعتمد على SVM للتنبؤ بتسلسل البروتينات البكتيرية الفتاكة ، والتي يمكن استخدامها لفحص البروتينات الخبيثة في البروتينات. جنبا إلى جنب مع البروتينات الخبيثة التي تم التحقق منها تجريبيا ، تم التنبؤ بالعديد من متواليات البروتين المفترضة وغير المشروحة والافتراضية لتكون بروتينات خبيثة عالية الدرجات من خلال طريقة التنبؤ. (المرجع: Garg A & amp Gupta G. 2008. BMC Bioinformatics 9: 62).

        يعد نظام إفراز النوع الثالث (T3SS) آلية أساسية للتفاعل بين المضيف والممرض في عملية العدوى. تُعرف البروتينات التي يتم إفرازها من خلال آلة T3SS للعديد من البكتيريا سالبة الجرام باسم مؤثرات T3SS (T3SEs).يمكن أن تكون هذه إما موضعية تحت خلوية في المضيف ، أو تكون جزءًا من طرف إبرة T3SS الذي يتفاعل مباشرة مع الغشاء المضيف لجلب مؤثرات أخرى إلى الخلية المستهدفة. يمثل T3SEdb مثل هذا الجهد لتجميع قاعدة بيانات شاملة لجميع T3SEs المحددة تجريبياً والمفترضة في موقع يمكن الوصول إليه عبر الويب. البحث بلاست متاح. (المرجع: Tay DM et al. 2010. BMC Bioinformatics. 11 ملحق 7: S4).

        تأثير (جامعة فيينا ، النمسا وجامعة ميونخ التقنية ، ألمانيا) - إفراز البروتين البكتيري هو آلية الضراوة الرئيسية للبكتيريا التكافلية والممرضة ، ومن ثم يتم نقل البروتينات المستجيبة من العصارة الخلوية البكتيرية إلى الوسط خارج الخلية أو مباشرة إلى الخلية المضيفة حقيقية النواة. توفر البوابة الفعالة تنبؤات محسوبة مسبقًا على المؤثرات البكتيرية في جميع الجينومات المسببة للأمراض والتعايشية المتاحة للجمهور بالإضافة إلى إمكانية أن يتنبأ المستخدم بالمؤثرات في بيانات تسلسل البروتين الخاص.

        خادم SIEVE هو أداة ويب عامة للتنبؤ بالمؤثرات المفرزة من النوع الثالث. يسجل خادم SIEVE المؤثرات المُفرزة المحتملة من جينومات مسببات الأمراض البكتيرية بأنظمة إفراز من النوع الثالث باستخدام نموذج تم تعلمه من البروتينات المُفرزة المعروفة. يتطلب خادم SIEVE فقط متواليات البروتين من البروتينات ليتم فحصها ويعيد احتمالية متحفظة بأن كل بروتين مدخل هو عامل إفراز من النوع الثالث. (المرجع: McDermott JE et al. 2011. Infect Immun. 79:23-32).

        T3SE - توقع مؤثر نظام الإفراز من النوع الثالث (المرجع: L & oumlwer M، & amp Schneider G. 2009. PLoS One. 4:e5917. خطأ في: PLoS One. 20094 (7).

        تم إنشاء Phage_Finder - لتحديد مناطق النبضة في الجينوم البكتيري المكتمل. باستخدام مجموعة بيانات اختبار مكونة من 42 جينومًا بكتيريًا تم التعرف على نواتجها يدويًا ، Phage_Finder وجدت 91٪ من المناطق ، مما أدى إلى 7٪ نفاثات إيجابية كاذبة و 9٪ نفاثات سلبية كاذبة. توقع البحث في 302 جينوم بكتيري كامل وجود 403 منطقة نفاذية مفترضة ، تمثل 2.7 ٪ من إجمالي الحمض النووي البكتيري. كشف تحليل مواقع الارتباط المفترضة البالغ عددها 285 أن الحمض الريبي النووي النقال أهداف للتكامل بشكل متكرر أكثر بقليل (33٪) من المناطق الجينية (31٪) أو داخل الجين (28٪) ، بينما تم استهداف tmRNAs في 8٪ من المناطق. (المرجع: D.E. Fouts. 2006. Nucleic Acids Res. 34: 5839 & ndash5851).

        Prophinder - هي الأداة المستخدمة للكشف عن العاثيات في الجينوم البكتيري. حدد ملف GenBank بتنسيق.

        PHAST (PHAجنرال الكتريك سالبحث تيool) - تم تصميمه لتحديد وتعليق وعرض متواليات النبضة بشكل سريع ودقيق داخل الجينوم البكتيري أو البلازميدات. يقبل إما بيانات تسلسل الحمض النووي الخام أو البيانات المنسقة جزئيًا من GenBank وينفذ بسرعة عددًا من مقارنات قاعدة البيانات بالإضافة إلى خطوات تحديد ميزة phage & ldquocornerstone & rdquo لتحديد موقع وتعليق وعرض تسلسل Prophage و Prophage الميزات. بالنسبة لأدوات تحديد العقاقير الأخرى ، فإن PHAST أسرع بما يصل إلى 40 مرة وأكثر حساسية بنسبة تصل إلى 15٪. كما أنه قادر على معالجة كل من بيانات تسلسل الحمض النووي الخام وملفات Genbank والتعليق عليها ، وتوفير جداول توضيحية غنية حول ميزات Prophage و prophage & ldquoquality & rdquo والتمييز بين Prophage السليم وغير الكامل. ينشئ PHAST أيضًا رسومات تفاعلية وقابلة للتنزيل وعالية الجودة تعرض جميع مكونات العاثيات المحددة في كل من العروض الجينومية الدائرية والخطية. علاوة على ذلك ، تشير الاختبارات إلى أن PHAST دقيق أو أكثر دقة قليلاً من جميع أدوات اكتشاف العاثيات المتاحة ، مع حساسية 85.4٪ و قيمة تنبؤية إيجابية 94.2٪. (المرجع: Zhou، Y. et al. 2011. Nucl. Acids Res. 39(ملحق 2): W347-W352).

        PHASTER PHAجنرال الكتريك سالبحث تيأول همعزز رelease - هو ترقية مهمة لـ PHAST من أجل التحديد السريع والتعليق التوضيحي لتسلسل البروفاج داخل الجينومات والبلازميدات البكتيرية. العديد من التحسينات على البرامج والتحسينات الكبيرة للأجهزة جعلت PHASTER أسرع وأكثر كفاءة وجاذبية بصريًا وأكثر سهولة في الاستخدام. على وجه الخصوص ، أصبح PHASTER الآن أسرع بمقدار 4.3 مرة من PHAST. (المرجع: D. Arndt et al. Nucleic Acids Res. 2016 44 (W1):W16-21).

        Prophage Hunter - يوفر خدمة ويب شاملة لاستخراج جينومات العاثيات من الجينوم البكتيري ، وتقييم نشاط العاثيات ، وتحديد العاثيات ذات الصلة بالتطور ، والتعليق على وظيفة بروتينات العاثيات. (المرجع: Song W et al. (2019) Nucleic Acids Res 47 (W1): W74 & ndashW80).

        IslandViewer - يدمج طريقتين للتنبؤ بتكوين التسلسل GI SIGI-HMM و IslandPath-DIMOB ، وطريقة واحدة للتنبؤ بالمؤشر GI IslandPick (المرجع: Langille et al. 2008. BMC Bioinformatics 9: 329).

        PAIDB (السلطة الفلسطينيةالنشأة أناافتراء دآتابase) بذل جهد لجمع PAIs المعروفة واكتشاف مناطق PAI المحتملة في الجينومات الكاملة بدائية النواة. جزر الإمراضية (PAIs) هي عناصر وراثية متميزة لمسببات الأمراض التي تشفر عوامل ضراوة مختلفة. (المرجع: Yoon SH et al. 2007. Nucleic Acids Res. 35 (مشكلة في قاعدة البيانات): D395-D400).

        يمكن لـ MTGIpick تحديد الجزر الجينومية من جينوم واحد ، بدون معلومات مشروحة عن الجينوم أو معرفة مسبقة من مجموعات البيانات الأخرى. في عمليات المحاكاة مع الأجزاء الغريبة من الجينوم الاصطناعي والحقيقي ، أبلغت MTGIpick عن نتائج قوية عبر تجارب مختلفة (المرجع: Dai Q et al. (2018) موجز Bioinform 19(3): 361-373).


        SyntTax - هو خادم ويب يربط التركيب بالتصنيف بدائية النواة. يشتمل SyntTax على شجرة تصنيف هرمية كاملة تتيح الوصول السهل إلى جميع بدائيات النوى المتسلسلة بالكامل (العتائق والبكتيريا). يمكن اختيار الكائنات الحية المفردة أو المتعددة على أساس نسبها عن طريق اختيار عقد الرتبة المقابلة في الشجرة. هذا هو المفضل لدي من بين برامج synteny (المرجع: Oberto J. 2013. BMC Bioinformatics. 14:4). تم إنشاء النتائج أدناه باستخدام عامل سيغما الصدمة الحرارية (RpoH) من السالمونيلا التيفية ضد ال بسيودوموناداليس.

        خادم Cinteny لتحديد Synteny وتحليل إعادة ترتيب الجينوم (A. U. Sinha & amp J. Meller ، جامعة سينسيناتي ، الولايات المتحدة الأمريكية) - يمكن استخدام هذا الخادم للعثور على مناطق مخلوطة عبر جينومات متعددة وقياس مدى إعادة ترتيب الجينوم باستخدام مسافة الانعكاس كمقياس. يمكنك إنشاء مشروع وتحميل بياناتك الخاصة أو العمل مع بيانات بدائيات النوى أو حقيقيات النوى المحملة مسبقًا.

        SimpleSynteny - يوفر خط أنابيب لتقييم تركيب مجموعة محددة مسبقًا من أهداف الجينات عبر جينومات الكائن الحي المتعددة. تم التركيز على سهولة الاستخدام ، ولا يُطلب من المستخدمين سوى تقديم ملفات FASTA للجينومات والجينات التي تهمهم. ثم تقوم SimpleSynteny بتوجيه المستخدم من خلال عملية تكرارية لاستكشاف الجينوم وتخصيصه بشكل فردي قبل دمجها في شكل نهائي عالي الدقة. (المرجع: Veltri D et al. 2016. Nucleic Acids Res. 44 (مشكلة خادم الويب): W41 و ndashW45).

        بوابة Synteny - يمكن لمستخدمي الجينوم حقيقية النواة بسهولة (1) إنشاء كتل تركيبية بين أنواع متعددة باستخدام محاذاة مسبقة الصنع في قاعدة بيانات مستعرض جينوم UCSC ، (2) تصور وتنزيل العلاقات المخلوية كصور عالية الجودة ، (3) تصفح الكتل التركيبية باستخدام الجينات المعلومات و (4) تنزيل تفاصيل الكتل التركيبية لاستخدامها كمدخلات للتحليلات المستندة إلى المصب ، وكل ذلك في واجهة سهلة الاستخدام قائمة على الويب. (المرجع: Lee J et al. 2016. الأحماض النووية Res 44 (W1): W35 و ndashW40).

        AutoGRAPH هو خادم ويب متكامل للتحليل الجينومي المقارن متعدد الأنواع. وهي مصممة لإنشاء وتصور خرائط تركيبية بين نوعين أو ثلاثة أنواع ، وتحديد وعرض العلاقات الكبيرة والصغيرة بين الأنواع ، ولإبراز نقاط التوقف التطورية.
        ينشئ خادم الويب خرائط تركيبية عن طريق المقارنة الزوجية لأوامر العلامة / المرساة بين كروموسوم مرجعي وواحد أو اثنين من الجينوم المختبرين. يسمح للمستخدمين بتصور وتمييز العديد من الميزات: الأجزاء المحفوظة (CS) ، والأجزاء المحفوظة المطلوبة (CSO) ونقاط التوقف. (المرجع: Derrien T et al. 2007. المعلوماتية الحيوية 23:498-499).

        سيبيليا (جامعة كاليفورنيا سان دييغو ، الولايات المتحدة الأمريكية) - هي أداة للعثور على الكتل التركيبية في العديد من الجينومات الميكروبية وثيقة الصلة باستخدام الرسوم البيانية التكرارية لـ Bruijn. على عكس معظم الأدوات الأخرى ، يمكن لـ Sibelia العثور على كتل تركيبية تتكرر داخل الجينوم بالإضافة إلى الكتل المشتركة بواسطة جينومات متعددة. إنه يمثل الكتل التركيبية في هيكل هرمي مع طبقات متعددة ، كل منها يمثل مستوى مختلف من الحبيبات.

        يساعدك Kablammo في إنشاء تصورات تفاعلية لنتائج بلاست من متصفح الويب الخاص بك. ابحث عن المحاذاة الأكثر إثارة للاهتمام ، وقم بسرد المعلمات التفصيلية لكل منها ، وقم بتصدير صورة متجهية جاهزة للنشر. سهل الاستخدام بشكل لا يصدق - إليك نتائج مقارنة BLASTN بـ الإشريكية العاثيات T1 (استعلام) و ADB-2. (المرجع: Wintersinger JA et al. المعلوماتية الحيوية 31:1305-1306).


        M1CR0B1AL1Z3R - هو متجر & # 39 وقفة واحدة & # 39 لإجراء تحليلات بيانات الجينوميات الميكروبية عبر واجهة مستخدم رسومية بسيطة. بعض الميزات التي تم تنفيذها في M1CR0B1AL1Z3R هي: (1) استخراج إطارات القراءة المفتوحة المفترضة وتحليل الجينوميات المقارن لمحتوى الجين (2) استخراج مجموعات تقويمية وتحليل توزيع حجمها (3) تحليل أنماط حضور وغياب الجين (4) إعادة بناء النشوء والتطور. شجرة بناءً على المجموعة المتعامدة المستخرجة (v) لاستنتاج اختلاف محتوى GC بين السلالات. يسهل M1CR0B1AL1Z3R استخراج وتحليل العشرات من الجينومات البكتيرية باستخدام تقنيات متقدمة. (المرجع: Avram O et al. (2019) Nucleic Acids Res. 47 (W1): W88-W92).

        GeneOrder 4.0 (د. سيتو ، المعلوماتية الحيوية والبيولوجيا الحاسوبية ، جامعة جورج ميسون ، الولايات المتحدة الأمريكية) تم تصميمه بحيث يمكن استخدامه لمقارنة ترتيب الجينات بين جينومين بكتيريين (المرجع: Mahadevan P. & amp Seto D. 2010. ملاحظات أبحاث BMC 3:41).
        CoreGenes (D. Seto & amp P. Mahadevan، Bioinformatics & amp Computational Biology ، جامعة جورج ميسون ، الولايات المتحدة الأمريكية) - إحصاء العدد الإجمالي للجينات المشتركة بين الجينومين اللذين تتم مقارنتهما يعرض القيمة المئوية للجينات المشتركة مع جينوم معين يحدد الجينات الفريدة الموجودة في زوج من البروتينات. CoreGenes 3.5 هو خادم CoreGenes الدفعي. لقد استخدمت على نطاق واسع هذه المجموعة من الموارد في تصنيف الفيروسات البكتيرية.

        إذا كان لديك ملف gbk لعثة لم يتم إيداعها في GenBank بعد ، يمكنك استخدام هذه التعليمات لتحويل بياناتك إلى تنسيق CoreGenes لاستخدامها هنا.

        WebACT - هذا هو إصدار الويب من ACT (أداة مقارنة Artemis) وهو عارض مقارنة تسلسل الحمض النووي استنادًا إلى Artemis (المرجع: 21: 3422 - 3423 قم بزيارة صفحة قاعدة بيانات EMBL-EBI وحدد EMBL و & quot نموذج الاستعلام القياسي & quot لتحديد رقم انضمام EMBL للتسلسل الذي تهتم به.

        بانسيك (تشاد لينج ، وكالة الصحة العامة الكندية) - مجموعة أدوات لتحليل الجينوم & # 39pan & # 39 لمجموعة من المتواليات الجينومية. يتكون الجينوم الشامل للأنواع البكتيرية من الجينوم الأساسي ومجموعة الجينات الإضافية ، وهذا الأخير يسمح للمجموعات السكانية الفرعية للكائن الحي بالتكيف مع بيئات معينة. يتضمن ذلك Novel Region Finder ، والذي سيجد تسلسلات فريدة لسلالة أو مجموعة من السلالات فيما يتعلق بسلالة أخرى أو مجموعة سلالات. يحدد تحليل الجينوم الشامل الجينوم الشامل بين التسلسلات الخاصة بك ويجد تعدد الأشكال في الجينوم الأساسي ويحدد توزيع المناطق الجينومية الملحقة. يحدد محدد الارتباط المواقع التي تقدم أفضل تمييز بين مجموعة البيانات الخاصة بك. (المرجع: Laing، C. et al. 2010. BMC Bioinformatics. 11: 461).

        PARIGA - يُمكِّن المستخدمين من إجراء عمليات بحث BLAST الكل مقابل الكل على مجموعتين من التسلسلات المحددة من قبل المستخدم. علاوة على ذلك ، نظرًا لأنه يخزن مخرجات BLAST في قاعدة بيانات كائنات متسلسلة بيثون ، يمكن تصفية النتائج وفقًا لعدة معايير في الوقت الفعلي ، دون إعادة تشغيل العملية وتجنب جهود البرمجة الإضافية. (المرجع: Orsini M. et al. 2013. PLoS One 8(5):e62224).

        إدغار (همناسب دإطار atabase للمقارنة جيenome أnalyses باستخدام نقاط بلاست رatios) - تم تصميم EDGAR لإجراء مقارنات الجينوم تلقائيًا بأسلوب إنتاجي مرتفع ويمكن استخدامه في الجينوم الأساسي وتحليل الجينوم الشامل والمفرد وبناء مخطط Venn. (المرجع: Blom J. et al. 2009. BMC Bioinformatics 10: 154).

        OrthoVenn - هو خادم ويب لمقارنة الجينوم على نطاق واسع والتعليق التوضيحي للمجموعات المتعامدة عبر أنواع متعددة. يوفر تغطية للفقاريات والميتازوا والطلائعيات والفطريات والنباتات والبكتيريا للمقارنة بين المجموعات المتعامدة ويدعم أيضًا تحميل تسلسل البروتين المخصص من الأنواع المحددة من قبل المستخدم. يتم عرض مخطط Venn التفاعلي والتهم الموجزة والملخصات الوظيفية للانفصال والتقاطع بين المجموعات المشتركة بين الأنواع كجزء من نتيجة OrthoVenn. يتضمن OrthoVenn أيضًا عروض متعمقة للمجموعات باستخدام أدوات تحليل التسلسل المختلفة. علاوة على ذلك ، فإنه يحدد مجموعات متعامدة من جينات نسخة واحدة ويسمح بالبحث المخصص عن مجموعات من جينات معينة من خلال الكلمات الرئيسية أو بلاست. (المرجع: Y. Yang et al. 2015. Nucl. Acids Res. 43 (W1): W78-W84). وجدت هنا أيضا.

        BEACON هي أداة برمجية تقارن التعليقات التوضيحية لجينوم معين من طرق التعليقات التوضيحية المختلفة (AMs). يستخدم تنسيق GenBank كمدخلات ويستمد التعليقات التوضيحية الموسعة (EA) جنبًا إلى جنب مع سرد التعليقات التوضيحية الأصلية من AMs الفردية. (المرجع: Kalkatawi M، BMC Genomics .201516(1): 1-8).

        العاني (أverage نأوكليوتيد أناdentity) الآلة الحاسبة - تقدر متوسط ​​هوية النوكليوتيدات باستخدام أفضل النتائج (ANI أحادي الاتجاه) وأفضل النتائج المتبادلة (ANI ثنائية الاتجاه) بين مجموعتي بيانات جينومية. عادةً ما تكون قيم ANI بين جينومات نفس النوع أعلى من 95٪ (على سبيل المثال ، Escherichia coli). لا يمكن الوثوق بالقيم التي تقل عن 75٪ ، ويجب استخدام AAI بدلاً من ذلك. تدعم هذه الأداة كلاً من الجينومات الكاملة والمسودة (mult-fasta). (المرجع: Goris J et al. 2007. Int J Syst Evol Microbiol. 57 (نقطة 1): 81-91).

        متوسط ​​حاسبة هوية النوكليوتيدات (ANI) - تستخدم حاسبة ANI الخاصة بهم خوارزمية OrthoANIu ، وهي تكرار محسّن لخوارزمية OrthoANI الأصلية ، والتي تستخدم USEARCH بدلاً من BLAST (المرجع: Yoon، S.H et al. (2017). Antonie van Leeuwenhoek. 110:1281 و ndash1286).

        فيريديك (فيرنحن أنانتيرجينوم ديموقف جالكولاتور C. Moraru ، معهد الكيمياء وبيولوجيا البيئة البحرية ، ألمانيا) - يتضمن المستوى الأول من تصنيف العاثيات بواسطة ICTV حساب هوية تسلسل الحمض النووي الشاملة بين فيروسين. تحسب هذه الأداة الجديدة المسافات / أوجه التشابه بين الجينومات بين جينومات الملتهمة. لتشغيله ، قم بتحميل ملف فاستا واحد به جميع جينومات العاثيات ذات الأهمية ، وأنشئ مشروعًا واضغط على تشغيل. احفظ معرّف المشروع الذي سيتم عرضه عند إنشاء المشروع. ستحتاج إليها للوصول إلى البيانات إذا كانت الحسابات تستغرق وقتًا طويلاً.

        GGDC (جيenome-To-جيenome دistance جalculator) - يوفر طرقًا لاستنتاج مسافات الجينوم الكامل القادرة جيدًا على محاكاة تهجين الحمض النووي DNA (DDH). القيم المحسوبة باستخدام GGDC تعطي ارتباطًا أفضل إلى حد ما مع قيم DDH للمختبر الرطب من الطرق البديلة مثل & quotANI & quot. يمكن أن تتعامل وظائف المسافات هذه أيضًا مع الجينوم المنخفض بشكل كبير ومناطق التسلسل المتكرر. بعضها قوي جدًا أيضًا ضد الأجزاء المفقودة من المعلومات الجينومية (بسبب تسلسل الجينوم غير المكتمل). وبالتالي ، يمكن استخدام خدمة الويب هذه لتحديد الأنواع القائمة على الجينوم. (المرجع: Meier-Kolthoff JP et al. 2013. BMC Bioinformatics 14: 60).

        POGO-DB - استنادًا إلى انفجارات الجينوم الكامل المكثفة حسابيًا ، يوفر POGO-DB العديد من المقاييس على الجينوم الزوجي: (أ) متوسط ​​هوية الأحماض الأمينية لجميع ضربات الانفجار ثنائية الاتجاه الأفضل التي غطت ما لا يقل عن 70٪ من التسلسل وكان بها 30 النسبة المئوية للهوية التسلسلية (ب) السيولة الجينية التي تقدر التشابه في محتوى الجين بين جينومين (ج) عدد أخصائيي تقويم العظام المشتركين بين جينومين (على النحو المحدد بمعيارين) (د) الهوية الزوجية لأكثر جينات الرنا الريباسي 16S تشابهًا (هـ) الهوية المزدوجة لـ 73 جينًا واصمًا إضافيًا محفوظًا عالميًا (تم تحديدها من قبلنا على الأقل في 90 ٪ من جميع الجينومات). (المرجع: Lan Y et al. 2014. Nucl. Acids Res. 42 (D1): D625-D632).

        فيكتور (السادسروس جlassification و تيبناء ري اnline رesource Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen Gmب). تقارن خدمة الويب هذه بين الفيروسات البكتيرية والبدئية (& quotphages & quot) باستخدام تسلسل الجينوم أو البروتينات. تضمنت النتائج أشجار النشوء والتطور التي تم استنتاجها باستخدام طريقة جينوم-بلاست للتطور عن بعد (GBDP) ، مع دعم الفروع ، بالإضافة إلى اقتراحات للتصنيف على مستوى الأنواع والجنس والأسرة. (يمكن تطبيق الخدمة على أنواع أخرى من الفيروسات أيضًا ، ولكن لم يتم اختبارها بعد في هذا الصدد.) قم بتحميل ملفات FASTA و / أو ملفات GenBank و / أو معرفات انضمام GenBank. (المرجع: JP Meier-Kolthoff & amp M G & oumlker. 2017. المعلوماتية الحيوية 33(21): 3396 و ndash3404).

        VIRFAM مكرس للتعرف على وحدات الرأس والعنق والذيل وجينات recombinase في جينومات الملتهمة. يمكنك استخدام هذا الخادم للبحث عن متماثلات بعيدة لعائلات بروتينية معينة ضمن تسلسلات بروتينية للعاثيات. المدخلات: تسلسلات البروتين التي تقوم بها & rsquore الخاصة بك من الملتهمة تشمل شجرة النشوء والتطور مع وضع الفيروس الخاص بك. (المرجع: Lopes A et al. Nucleic Acids Res. (2010) 38(12): 3952-62).

        الباحث - هو أداة للتعلم العميق لتحديد تسلسل الملتهمة بدون مرجع. يسمح الباحث بالاكتشاف السريع للعاقمات في مجموعات البيانات المتسلسلة والتمايز النظيف لتسلسل العاثيات عن تلك البكتيرية ، حتى بالنسبة للعاقمات ذات التشابه البسيط في التسلسل مع عائلات العاثيات الراسخة. نحن نتحقق بشكل شامل من قدرة الباحث على التعرف على العاثيات غير المعروفة واستخدام الباحث للكشف عن العاثيات المجهولة ، وبعضها شديد التباين عن عائلات العاثيات المعروفة. (المرجع: Auslander N et al. (2020) doi.org/10.1101/2020.04.04.025783)

        VipTree - يولد & quot؛ شجرة بروتينية & quot؛ من تسلسل الجينوم الفيروسي استنادًا إلى أوجه التشابه في تسلسل الجينوم على نطاق واسع المحسوبة بواسطة tBLASTx. تم تطوير مفهوم الشجرة البروتينية الأصلية (على سبيل المثال ، & quotthe Phage Proteomic Tree & rdquo) بواسطة Rohwer and Edwards، 2002. الشجرة البروتينية هي مخطط شجر يكشف عن علاقات التشابه الجينومي العالمي بين عشرات ومئات وآلاف من الفيروسات. لقد ثبت أن المجموعات الفيروسية المحددة في شجرة بروتينية تتوافق جيدًا مع التصنيفات الفيروسية الراسخة. (المرجع: Nishimura Y et al. (2017) المعلوماتية الحيوية 33: 2379 و ndash2380).

        ميغا (ميكروبيال جيالتعدادات أtlas) - خادم ويب يسمح بتصنيف تسلسل جينومي للاستعلام غير معروف ، كامل أو جزئي ، مقابل جميع الأصناف المصنفة تصنيفياً مع تسلسل الجينوم المتاح ، بالإضافة إلى المقارنات مع الجينومات الأخرى ذات الصلة بما في ذلك الجينومات غير المزروعة ، بناءً على متوسط ​​النيوكليوتيد الكلي للجينوم ومفاهيم هوية الأحماض الأمينية (ANI / AAI).(المرجع: Rodriguez-R et al (2018) أبحاث الأحماض النووية 46 (W1): W282-W288).

        خادم CGView - هو أداة الجينوم المقارنة للجينومات الدائرية التي تسمح بتصور معلومات ميزة التسلسل في سياق نتائج تحليل التسلسل. يتم توفير تسلسل الجينوم للبرنامج بتنسيق FASTA أو GenBank أو EMBL أو تنسيق خام. يمكن أيضًا تقديم ما يصل إلى ثلاثة تسلسلات مقارنة (أو مجموعات تسلسل) بتنسيق FASTA. يستخدم خادم CGView BLAST لمقارنة تسلسل الجينوم بتسلسل المقارنة ، ثم يقوم بتحويل النتائج وأي معلومات ميزة متاحة (من GenBank أو EMBL أو ملف GFF اختياري) أو معلومات التحليل (من ملف GFF اختياري) إلى ملف عالي خريطة رسومية عالية الجودة تعرض تسلسل الجينوم بأكمله ، أو عرض مكثف لمنطقة الاهتمام. تتوفر عدة خيارات لتحديد كيفية إجراء مقارنات بلاست ، وللتحكم في كيفية عرض النتائج (المرجع: Grant JR & amp Stothard P. 2008. Nucleic Acids Res. 36 (مشكلة خادم الويب): W181-184)

        ياينا صبدائية النواة جيenome الخامسiewer (JPGV) - من ملف مسطح GenBank (* .gbk) يولد مخططات خطية أو دائرية بما في ذلك محتوى GC ، وانحراف GC ، وفائض البيورين ، وفائض الكيتو ، إذا كان ذلك مطلوبًا. يسمح أيضًا بتحليل بلاست مقابل الجينومات ذات الصلة. يتطلب التسجيل المجاني.

        GenomeVx - يجعل خرائط جينومات الميتوكوندريا والبلاستيدات الخضراء والبلازميدات الكبيرة قابلة للتحرير وذات جودة النشر. توضح هذه الخرائط موقع الجينات والسمات الصبغية بالإضافة إلى مقياس الموقع. يأخذ البرنامج كمدخلات إما مواضع ميزة أولية أو سجلات GenBank. في الحالة الأخيرة ، يتم استخراج الميزات وتلوينها تلقائيًا ، ويتم تقديم مثال على ذلك. الإخراج بتنسيق Adobe Portable Document Format (PDF) ويمكن تحريره بواسطة برامج مثل Adobe Illustrator. (المرجع: G. Conant & amp K. Woolfe.2008. Bioinformatics 24:861-862).

        myGenomeBrowser - هي بيئة قائمة على الويب توفر لعلماء الأحياء طريقة لبناء مستعرضات الجينوم الخاصة بهم والاستعلام عنها ومشاركتها. تم تصميم هذه الأداة ، المبنية على JBrowse ، لمنح المستخدمين مزيدًا من الاستقلالية مع تبسيط وتقليل تدخل مسؤولي النظام. لقد قاموا بتوسيع الميزات الأساسية لمتصفح الجينوم للسماح للمستخدمين بالاستعلام عن بياناتهم وتحليلها ومشاركتها. (المرجع: S. Carrere & amp J. Gouzy. المعلوماتية الحيوية (2017) 33 (8): 1255-1257).

        DNAPlotter - هو تطبيق Java تفاعلي لتوليد تمثيلات دائرية وخطية للجينوم. من خلال الاستفادة من مكتبات Artemis لتوفير طريقة سهلة الاستخدام للتحميل في ملفات التسلسل (EMBL و GenBank و GFF) بالإضافة إلى البيانات من قواعد البيانات العلائقية ، فإنه يقوم بتصفية الميزات المهمة لعرضها على مسارات منفصلة يمكن للمستخدم تحديدها. يمكن استخدامه لإنتاج صور بجودة النشر للأوراق أو صفحات الويب (المرجع: Carver، T. et al. 2008. Bioinformatics 25:119-120)

        جينويز (مركز تحليل التسلسل البيولوجي ، الجامعة التقنية الدنماركية) ينتج ارتفاعات جينوم خطية أو دائرية مثل الموجودة أدناه. لديهم أسماء جاهزة لمعظم البكتيريا ، ولكن عن طريق تحميل البيانات المخصصة بتنسيق GenBank (.gbk) ، يمكن للمرء أن يصنع رسمًا تخطيطيًا خاصًا يوضح الخصائص الجينية والفيزيائية للجينوم الخاص بك.

        OrganellarGenomeDRAW - عبارة عن مجموعة من الأدوات البرمجية التي تمكن المستخدمين من إنشاء عروض مرئية عالية الجودة لكل من تسلسل الجينوم التوضيحي الدائري والخطي المقدم كملفات GenBank أو أرقام الوصول. على الرغم من قبول جميع أنواع تسلسلات الحمض النووي كمدخلات ، فقد تم تحسين البرنامج على وجه التحديد لتصوير ميزات الجينوم العضوي بشكل صحيح. يسهل الامتداد الأخير تخطيط بيانات التعبير الجيني الكمي ، مثل بيانات النسخ أو وفرة البروتين ، مباشرة على خريطة الجينوم (المرجع: Lohse M ، وآخرون. 2013. Nucleic Acids Res. 41(مشكلة خادم الويب): W575-81).

        PlasmaDNA - بدءًا من تسلسل الحمض النووي الأساسي ، يبحث PlasmaDNA عن مواقع التقييد وإطارات القراءة المفتوحة وتسلسلات التلدين التمهيدي والمجالات الشائعة المختلفة. يمكن للمستخدم توسيع قواعد البيانات بسهولة لتلائم احتياجات الاستنساخ الأكثر شيوعًا. يمكن لـ PlasmaDNA إدارة متواليات متعددة وتمثيلها بيانياً في نفس الوقت ، وتحتفظ بالذاكرة المتراكمة في نهاية التسلسلات إن وجدت. هذا يعني أنه من الممكن هضم الأجزاء فعليًا ، وإضافة نواتج الهضم إلى المشروع ، وربط الأجزاء معًا بأطراف متوافقة لإنشاء التسلسلات الجديدة. حزمة ممتازة للبلازميدات. (المرجع: Angers-Loustau A et al. 2007. BMC Mol Biol.2007 8:77).

        GSDraw (خادم رسم هيكل الجينات) هو خادم ويب لعائلة الجينات لرسم مخططات تخطيطية لبنية الجينات. يمكن للمستخدمين إرسال تسلسل الجينوم ، CDS والنسخ. يستخدم GSDraw هذه المعلومات للحصول على بنية الجينات ، والعنصر البروتيني ، وشجرة علم الوراثة ، ثم رسم مخطط لها. (المرجع: Wang Y، et al. 2013. Nucleic Acids Res. 41 (إصدار قاعدة البيانات): D1159-66).

        GECA هي أداة سهلة الاستخدام لتمثيل منظمة exon / intron الجيني وتسليط الضوء على التغييرات في بنية الجينات بين أعضاء عائلة الجينات. يعتمد على محاذاة البروتين ، مكتملًا بتحديد الإنترونات الشائعة في الجينات المقابلة باستخدام CIWOG. تنتج GECA تمثيلًا رسوميًا رئيسيًا يُظهر المجموعة المتوافقة الناتجة من الهياكل الجينية ، حيث يتم قياس exons. الميزة المهمة والأصلية لـ GECA هي أنها تجمع بين هذه الهياكل الجينية مع عرض رمزي يبرز تشابه التسلسل بين الجينات اللاحقة. تجدر الإشارة إلى أن هذا المزيج من بنية الجينات مع مؤشرات التشابه بين الجينات ذات الصلة يسمح بالتعرف السريع على الأحداث المحتملة لكسب أو فقدان الإنترونات ، أو يشير إلى التعليقات التوضيحية الهيكلية الخاطئة. يتم إنشاء صورة الإخراج بتنسيق رسومات شبكة محمولة يمكن استخدامها في المنشورات العلمية. (المرجع: Fawal N، et al. 2012. Bioinformatics 28:1398-9).

        GeneDesign - هو مورد ممتاز لتصميم الجينات الاصطناعية. يتضمن أدوات لتحسين الكودون وإزالة مواقع التقييد (المرجع: Richarson، S.M. et al. 2006. Genome Research 16: 550-556)

        Orphelia - Orphelia هي أداة ميتاجينومية لإيجاد ORF للتنبؤ بجينات ترميز البروتين في تسلسل DNA بيئي قصير مع أصل غير معروف للتطور. تعتمد Orphelia على نهج التعلم الآلي المكون من مرحلتين والذي تم تقديمه مؤخرًا من قبل مجموعتنا. بعد الاستخراج الأولي لـ ORFs ، تُستخدم المميزات الخطية لاستخراج الميزات من ORFs. بعد ذلك ، تجمع الشبكة العصبية الاصطناعية بين الميزات وتحسب احتمال الجين لكل ORF في جزء. تحسب الإستراتيجية الجشعة مزيجًا محتملًا من ORFs عالية الدرجات مع قيود التداخل. (المرجع: K.J. Hoff et al.2009. Nucl. Acids Res. 37(مشكلة خادم الويب: W101-W105).

        WebMGA هو خادم ويب قابل للتخصيص لتحليل ميتاجينومي سريع يتضمن أكثر من 20 أداة شائعة الاستخدام للتحليلات مثل استدعاء ORF ، وتجميع التسلسل ، ومراقبة جودة القراءات الأولية ، وإزالة القطع الأثرية والتلوثات التسلسلية ، والتحليل التصنيفي ، والتعليقات التوضيحية الوظيفية وما إلى ذلك. جميع الأدوات خلف WebMGA للتشغيل بالتوازي على مجموعة أجهزة الكمبيوتر المحلية الخاصة بنا. (المرجع: Wu S، et al. 2011. BMC Genomics. 12:444).

        يعد خادم MG-RAST (خادم Metagenomics RAST) نظامًا أساسيًا للتحليل الآلي لميتاجينوم يوفر رؤى كمية للمجموعات الميكروبية بناءً على بيانات التسلسل. يوفر الخادم في المقام الأول التحميل ، ومراقبة الجودة ، والتعليقات التوضيحية الآلية والتحليل لعينات بندقية الصيد بدائية النواة. (المرجع: Wilke A، et al. 2016. Nucleic Acids Res. 44 (د 1):D590-4).

        يسمح التخصيص التصنيفي الشامل لـ MetaBin للتسلسلات الميتاجينومية (مختبر المعلوماتية الحيوية المتكاملة ، RIKEN ، اليابان) بخادم الويب والبرنامج المستقل بتعيين أسرع وأكثر دقة لقراءات التسلسل الفردية والمزدوجة ذات الأطوال المختلفة (& ge45 bp) التي تم الحصول عليها من كل من Sanger والتالي منصات تسلسل الجيل. لديه برنامج تعليمي.

        AmphoraNet - يستخدم 31 جينة ترميز بكتيرية و 104 بروتين أثرى من أجل التنميط الجينومي والجيني. معظم هذه الجينات عبارة عن جينات أحادية النسخ ، لذلك فإن AmphoraNet مناسب لتقدير التركيب التصنيفي للمجتمعات البكتيرية والأثرية من بيانات تسلسل بندقية ميتاجينوم. (المرجع: Kerepesi C، et al. 2014. جين. 533:538-40).

        METAGENassist - يسمح للمستخدمين بأخذ بيانات التعداد البكتيري من مواقع بيئية مختلفة أو مضيفين بيولوجيين مختلفين ، وإجراء تحليلات إحصائية شاملة متعددة المتغيرات على البيانات. يمكن إجراء هذه التحليلات متعددة المتغيرات باستخدام تسميات نمطية مصنفة أو تم إنشاؤها تلقائيًا وتصور باستخدام مجموعة متنوعة من الأدوات الرسومية عالية الجودة. يمكن اشتقاق بيانات التعداد البكتيري من بيانات 16S rRNA أو تسلسل بندقية NextGen أو حتى تقنيات الزراعة الميكروبية التقليدية. يتضمن تعليمي. (المرجع: Arndt D، et al. 2012. Nucleic Acids Res. 40(مشكلة خادم الويب): W88-95).

        في الوقت الحقيقي Metagenomics (دكتور روبرت إدواردز ، جامعة ولاية سان دييغو ، الولايات المتحدة الأمريكية) - هي الثورة القادمة في شرح الميتاجينوم: معالجة البيانات في الوقت الحقيقي وتحليلها. يمكنك أخيرًا إضافة تعليق توضيحي إلى metagenome في الوقت الفعلي ، دون انتظار. يمكنك تحميل البيانات الخاصة بك لتحليلها. يقبلون ملفات fasta أو fastq ، ويمكنك توفير بيانات مضغوطة بتنسيق zip أو gzip.

        EBI Metagenomics (EMBL-EBI) - عبارة عن خط أنابيب آلي لتحليل وأرشفة البيانات الميتاجينومية التي تهدف إلى توفير رؤى حول التنوع الوراثي بالإضافة إلى الإمكانات الوظيفية والاستقلابية للعينة. يمكنك بحرية تصفح جميع البيانات العامة في المستودع. تحدد الخدمة تسلسلات الرنا الريباسي ، باستخدام rRNASelector ، وتجري التحليل التصنيفي على الرنا الريباسي 16S باستخدام Qiime. يتم تقديم القراءات المتبقية للتحليل الوظيفي لتسلسلات ترميز البروتين المتوقعة باستخدام مورد تحليل تسلسل InterPro. تستخدم InterPro نماذج تشخيصية لتصنيف التسلسلات إلى العائلات والتنبؤ بوجود مجالات ومواقع مهمة وظيفيًا. من خلال استخدام هذا المورد ، تقدم الخدمة بديلاً قويًا ومتطورًا لتحليلات الميتاجينومية الوظيفية القائمة على بلاست. يتم أرشفة البيانات المقدمة إلى خدمة EBI Metagenomics تلقائيًا في أرشيف النيوكليوتيدات الأوروبي (ENA). يتم توفير أرقام الدخول لبيانات التسلسل.

        Kaiju - هو تصنيف تصنيفي سريع وحساس ل metagenomics يأخذ تسلسلات النيوكليوتيدات بتنسيق FASTA أو FASTQ المضغوط. يتم تعيين القراءات مباشرة إلى الأصناف باستخدام تصنيف NCBI وقاعدة بيانات مرجعية لتسلسلات البروتين من الجينوم البكتيري والبدئي والفيروسي. بشكل افتراضي ، يستخدم Kaiju إما الجينوم الكامل المتاح من NCBI RefSeq أو المجموعة الميكروبية الفرعية لقاعدة بيانات البروتين غير الزائدة عن الحاجة التي يستخدمها NCBI BLAST. يترجم Kaiju القراءات إلى تسلسلات الأحماض الأمينية ، والتي يتم البحث عنها بعد ذلك في قاعدة البيانات باستخدام بحث رجعي معدل على تنفيذ فعال للذاكرة لتحويل Burrows-Wheeler ، والذي يعثر على أقصى تطابق دقيق (MEMs) ، مما يسمح اختياريًا بعدم التطابق في محاذاة البروتين. (المرجع: Menzel P et al. 2016. (Nat. Commun. 7:11257)

        PhyloPythiaS - عبارة عن مصنف سريع ودقيق قائم على التسلسل يعتمد على التركيب الذي يستخدم العلاقات الهرمية بين الكتل. يمكن إجراء التخصيصات التصنيفية مع خادم الويب باستخدام نموذج عام ، أو باستخدام نماذج خاصة بالعينة يمكن للمستخدمين تحديدها وإنشائها. تسمح العديد من أوضاع التصور التفاعلية وتنسيقات التنزيل المتعددة بتحليل سريع ومريح ومعالجة نهائية للتعيينات التصنيفية. (المرجع: Patil KR، et al. 2012. PLoS One. 7:e38581).

        Virtual Metagenome - خادم ويب لإعادة بناء metagenomes من تسلسل 16S rRNA. طريقة جديدة لإعادة البناء السريع والفعال للميتاجينوم الافتراضي في المجتمعات الميكروبية البيئية دون استخدام التسلسل الجيني على نطاق واسع. نوضح هذا النهج باستخدام تسلسل الجينات 16S rRNA التي تم الحصول عليها من تغيير طبيعة تحليل الرحلان الكهربائي للهلام المتدرج ، المعين إلى الجينومات المتسلسلة بالكامل ، لإعادة بناء المنظمات الافتراضية التي تشبه الميتاجينوم. (المرجع: Okuda S، et al. 2012. Nat Commun. 3:1203.)

        MetaPhlAn2 (الإصدار 2.0.0) - هي أداة حسابية لتحديد تكوين المجتمعات الميكروبية (البكتيريا والعتيقات وحقيقيات النوى والفيروسات) من بيانات تسلسل بندقية ميتاجينوم مع دقة مستوى الأنواع. كما أنه قادر على تحديد سلالات معينة وتتبع السلالات عبر العينات لجميع الأنواع. يسمح بتخصيصات تصنيفية لا لبس فيها ، وتقدير دقيق للوفرة النسبية للكائنات الحية ، ودقة على مستوى الأنواع للبكتيريا ، والعتائق ، وحقيقيات النوى والفيروسات. (المرجع: Segata N، et al. 2012. طرق الطبيعة 8: 811 و ndash814).

        CoMet-Universe و [مدش] خادم ويب للتحليل المقارن للميتاجينوم على أساس تواقيع مجال البروتين. بدءًا من تحميل تسلسلات الحمض النووي الخاصة بك ، يقوم خط أنابيب CoMet بتنفيذ جميع الخطوات اللازمة لتحليل ميتاجينوم شامل بما في ذلك التنبؤ الجيني ، واكتشاف مجال البروتين باستخدام Pfam 27 ، والتنميط الأيضي بناءً على مسارات KEGG وتقدير وفرة الأصناف عبر جميع مجالات الحياة والفيروسات. (المرجع: A & szlighauer KP et al. Int J Mol Sci. 2014 15(7):12364-78).

        16S Classifier - هي أداة لتصنيف تصنيفي سريع ودقيق لمناطق متغيرة للغاية 16S rRNA في مجموعات البيانات metagenomic. في مجموعات البيانات الميتاجينومية الحقيقية ، أظهرت دقة تصل إلى 99.7٪ على مستوى الشعبة ودقة تصل إلى 99.0٪ على مستوى الجنس. (المرجع: N. Chaudhary et al. 2015. PLoS One 10(2): e0116106). يمكن الوصول إليها أيضًا هنا

        ديناتلاس (DNA2.0 Inc. ، الولايات المتحدة الأمريكية) - مكان لكل ما تبذلونه من التسلسلات. قم باستيراد جميع التركيبات بسهولة بما في ذلك Genbank و Gene Designer و Excel و Word وأي تنسيق مستند إلى النص تقريبًا. يقوم DNA Atlas على الفور بتحليل ملفات التحميل الخاصة بك واستنتاج ما إذا كان كل تسلسل عبارة عن ميزة أو بنية أو مادة أولية أو DNA أو حمض أميني. قم بتحميل الميزات والأدوات التمهيدية لتراها مشروحة في التسلسلات الخاصة بك. شاهد على الفور التركيبات التي تم شرحها من خلال قائمتنا المنسقة التي تضم أكثر من 1000 ميزة ، أو أضف خاصتك. استخدم بحث التسلسل المستند إلى BLAST لمحاذاة التسلسلات الخاصة بك ومقارنتها بسرعة. صنفهم باستخدام العلامات - من مواقع المجمد إلى بيانات التوصيف. (يتطلب التسجيل).

        سوبرفي (تشاد لينج وأمبير فيك غانون ، وكالة الصحة العامة الكندية) هي أداة عبر الإنترنت للجينوميات التنبؤية لـ الإشريكية القولونية. تدمج المنصة أدوات التحليل وبيانات تسلسل الجينوم للجميع المتاحة للجمهور بكتريا قولونية الجينوم ويسهل تحميل تسلسل الجينوم الجديد من المستخدمين في ظل إعدادات عامة أو خاصة. يوفر SuperPhy تحليلات في الوقت الفعلي لآلاف تسلسلات الجينوم بناءً على البيانات الوصفية للسلالة ، بما في ذلك السياق الجغرافي المكاني والتطور.

        تسمية العاثية: هذا ذو أهمية قصوى لأعضاء مجتمع الفيروسات البكتيرية لتسمية العاثيات المعزولة حديثًا بشكل مناسب. أفضل مكان للبدء هو & quot كيفية تسمية وتصنيف Phage: دليل غير رسمي. & quot (المرجع: Adriaenssens E & amp Brister JR. 2017. الفيروسات 9(4). pii: E70) التي سأضيف إليها النقاط التالية (أ) يرجى التحقق من أن الاسم الذي تقترحه لم يتم استخدامه بالفعل ، و (ب) لا تقم بتسمية البكتيريا المعوية الخاصة بك من عاثية & oslash1234 أو Enterobacteria phage 2017 / ABC_567 منذ هذه الأسماء غير متوافقة مع إنشاء أنواع جديدة وأصناف أجناس من قبل اللجنة الدولية لتصنيف الفيروسات (ICTV). لمعرفة ما إذا كان اسمك المقترح فريدًا ، استشر:

        فحص اسم Phage (ستيفن أبيدون ، جامعة ولاية أوهايو ، الولايات المتحدة الأمريكية) - لمعرفة ما إذا كان & # 39your & # 39 phage موجودًا حاليًا في الباحث العلمي من Google أو كتب Google أو PubMed أو حتى Bacteriophage Names 2000.

        CPT Phage Name Search (مركز تقنية Phage في جامعة Texas A & ampM University)


        LABGeM

        LABGeM هو فريق للمعلومات الحيوية من UMR 8030 Genomics Metabolics ، وهو الهيكل البحثي الأساسي لـ Genoscope (مركز التسلسل الوطني) ، وهو الآن جزء من البنية التحتية France Génomique.

        البيانات الجينومية المستمدة من تقنيات التسلسل الفعلي ذات أهمية محدودة على هذا النحو ، وبالإضافة إلى ذلك ، فإن هذا التدفق من البيانات يميل إلى زيادة عدد الجينات التي لا تزال وظائفها غير معروفة تمامًا. الهدف الرئيسي لفريق البحث لدينا هو استخراج المعرفة البيولوجية من الكائنات بدائية النواة من خلال تطوير أدوات المعلوماتية الحيوية التي تدمج مصادر متنوعة للغاية: بيانات التسلسل الخام ، ونتائج في السيليكو أدوات التحليل ، البيانات المستمدة من قواعد البيانات العامة أو المحددة ، بيانات omics مثل البيانات النصية ، البروتينية ، الأيضية ، والبيانات الفينومية. يتم توفير هذه الأدوات والبيانات بشكل عام من خلال MicroScope ، وهي منصة متكاملة مخصصة لشروح الجينوم الميكروبي والتحليل المقارن MicroScope ، والتي تقدم خدمة مجانية للمجتمع العلمي لدمج الجينوم الجديد (meta).
        تتركز الأنشطة العلمية لـ LABGeM على تحليل المعلوماتية الحيوية (والإحصاء الحيوي)
        الجينوم الميكروبي (ميتا): ديناميات وتطور الجينوم البكتيري ، الشرح الوظيفي للجينومات (الفوقية) ، التخصيص التصنيفي للبيانات الميتاجينومية

        التمثيل الغذائي البكتيري وبيولوجيا نظام أمبير: التنبؤ ، تنظيم ومقارنة شبكات التمثيل الغذائي ، التحقيق في & # 8216orphan & # 8217 الإنزيمات ، اكتشاف أنشطة إنزيمية جديدة. تشارك أنشطة البحث والتطوير هذه في أحد موضوعات البحث الرئيسية لـ UMR "استقلاب الجينوم": توضيح استقلاب بدائيات النوى من خلال اكتشاف تفاعلات كيميائية جديدة يحفزها العالم الحي.

        من خلال المشاريع البحثية المتنوعة ، الداخلية أو التي يتم إجراؤها في تعاون وطني أو دولي ، نركز على التطبيقات البيولوجية في المجالات التالية: علم الأوبئة والصحة ، والبيولوجيا البيئية والتكنولوجيا الحيوية (الأخضر والأبيض).


        7.13 ب: شرح الجينوم - علم الأحياء

        يشير الالتفاف الفائق للحمض النووي إلى الالتفاف الزائد أو السفلي لشريط الحمض النووي ، وهو تعبير عن الضغط الواقع على هذا الشريط. يعد الالتواء الفائق مهمًا في عدد من العمليات البيولوجية ، مثل ضغط الحمض النووي. بالإضافة إلى ذلك ، فإن بعض الإنزيمات مثل topoisomerases قادرة على تغيير طوبولوجيا الحمض النووي لتسهيل وظائف مثل تكرار الحمض النووي أو النسخ. تُستخدم التعبيرات الرياضية لوصف الالتفاف الفائق من خلال مقارنة الحالات الملفوفة المختلفة بالحمض النووي المرخّص على شكل ب.

        بنية فائقة الالتواء للحمض النووي الدائري: هذا هو هيكل فائق الالتفاف من جزيئات الحمض النووي الدائرية ذات التواء منخفض. لاحظ أنه تم حذف الطبيعة الحلزونية لمزدوج الحمض النووي من أجل الوضوح.

        كقاعدة عامة ، فإن الحمض النووي لمعظم الكائنات الحية يكون سلبياً للغاية.

        في مقطع حلزوني مزدوج & # 8220 من B-DNA ، يلتف الخيطان حول المحور الحلزوني مرة واحدة كل 10.4 إلى 10.5 زوجًا أساسيًا من التسلسل. إضافة أو طرح التقلبات ، كما تفعل بعض الإنزيمات ، يفرض إجهادًا. إذا تم إغلاق جزء من الحمض النووي تحت إجهاد الالتواء في دائرة من خلال ربط طرفيه ثم السماح له بالتحرك بحرية ، فإن الحمض النووي الدائري سوف يتحول إلى شكل جديد ، مثل شكل بسيط ثمانية. مثل هذا الالتواء هو ملف فائق.

        الشكل الثامن البسيط هو أبسط ملف فائق ، وهو الشكل الذي يفترضه الحمض النووي الدائري لاستيعاب واحد أكثر من اللازم أو قليل جدًا من التقلبات الحلزونية.سيظهر فصوص الشكل الثامن مستديران إما في اتجاه عقارب الساعة أو عكس اتجاه عقارب الساعة فيما يتعلق ببعضهما البعض ، اعتمادًا على ما إذا كان اللولب قد انتهى أم لا. لكل التفاف حلزوني إضافي يتم استيعابها ، ستُظهر الفصوص دورانًا إضافيًا حول محورها.

        نادرًا ما يتم استخدام شكل الاسم & # 8220supercoil & # 8221 في سياق طوبولوجيا الحمض النووي. بدلاً من ذلك ، يُشار إلى الالتواءات العالمية للحمض النووي الدائري ، مثل دوران الفصوص الثمانية أعلاه ، على أنها الالتواء. يوضح المثال أعلاه أن الالتواء والتلوى قابلان للتحويل. & # 8220Supercoiling & # 8221 هي خاصية رياضية مجردة تمثل مجموع الالتواء والتلوى. الالتواء هو عدد المنعطفات الحلزونية في الحمض النووي ، والتلوي هو عدد المرات التي يتقاطع فيها اللولب المزدوج على نفسه (هذه هي الملفات الفائقة).

        تكون التقلبات الحلزونية الإضافية إيجابية وتؤدي إلى الالتواء الفائق الإيجابي ، بينما يؤدي الالتواء الطرحي إلى الالتواء الفائق السلبي. العديد من إنزيمات توبويزوميراز تستشعر الالتفاف الفائق وتقوم إما بتوليدها أو تبديدها لأنها تغير طوبولوجيا الحمض النووي. الحمض النووي لمعظم الكائنات الحية ملفوف بشكل سلبي.

        جزئيًا لأن الكروموسومات قد تكون كبيرة جدًا ، قد تعمل الأجزاء الموجودة في المنتصف كما لو كانت نهاياتها مثبتة. نتيجة لذلك ، قد لا يتمكنون من توزيع الالتواء الزائد على بقية الكروموسوم أو امتصاص الالتواء للتعافي من الالتواء السفلي - قد تصبح المقاطع شديدة الالتواء ، بمعنى آخر. ردا على الالتفاف الفائق ، سوف يتحملون قدرًا من التواء ، تمامًا كما لو كانت نهاياتهم ملتصقة.

        يشكل الحمض النووي فائق الالتواء هيكلين ، وهما plectoneme أو حلقي ، أو مزيج من الاثنين. سينتج جزيء الحمض النووي فائق الالتفاف سلبًا إما حلزونًا أعسرًا ذي بداية واحدة ، أو لولبًا حلقيًا ، أو حلزونًا لليدًا ثنائي البداية مع حلقات طرفية ، plectoneme. عادة ما تكون Plectonemes أكثر شيوعًا في الطبيعة ، وهذا هو الشكل الذي ستتخذه معظم البلازميدات البكتيرية. بالنسبة للجزيئات الأكبر ، من الشائع أن تتشكل الهياكل الهجينة - يمكن أن تمتد حلقة على حلقي إلى plectoneme. إذا امتدت جميع الحلقات الموجودة على الحلقي ، فإنها تصبح نقطة فرع في البنية البكتونية.

        أهمية الالتفاف الفائق للحمض النووي

        يعد الالتفاف الفائق للحمض النووي مهمًا لتعبئة الحمض النووي داخل جميع الخلايا. نظرًا لأن طول الحمض النووي يمكن أن يكون آلاف المرات من الخلية ، فإن تغليف هذه المادة الجينية في الخلية أو النواة (في حقيقيات النوى) يعد إنجازًا صعبًا. يقلل اللف المفرط للحمض النووي من المساحة ويسمح بتعبئة المزيد من الحمض النووي. في بدائيات النوى ، تكون اللفائف الفائقة للدم هي السائدة ، بسبب الكروموسوم الدائري وكمية صغيرة نسبيًا من المادة الوراثية. في حقيقيات النوى ، يوجد الالتفاف الفائق للحمض النووي على مستويات عديدة من كلٍّ من اللفائف الفائقة البكتونية والملف اللولبي ، مع إثبات أن الالتفاف اللولبي الفائق هو الأكثر فاعلية في ضغط الحمض النووي. يتم تحقيق الالتفاف اللولبي الفائق باستخدام الهستونات لتشكيل ألياف 10 نانومتر. يتم لف هذه الألياف أيضًا في ألياف 30 نانومتر ، ثم يتم لفها على نفسها عدة مرات أكثر.

        يتم زيادة تغليف الحمض النووي بشكل كبير أثناء أحداث الانقسام النووي مثل الانقسام أو الانقسام الاختزالي ، حيث يجب ضغط الحمض النووي وفصله إلى الخلايا الوليدة. المكثفات والتماسكات هي صيانة هيكلية لبروتينات الكروموسوم (SMC) التي تساعد في تكثيف الكروماتيدات الشقيقة وربط السنترومير بالكروماتيدات الشقيقة. تحفز بروتينات SMC هذه الملفات الفائقة الإيجابية.

        مطلوب أيضًا الالتواء الفائق لتخليق الحمض النووي والحمض النووي الريبي. نظرًا لأنه يجب فك الحمض النووي لعمل بوليميراز الحمض النووي الريبي والحمض النووي الريبي ، فسوف ينتج عن ذلك لفائف فائقة. سيتم التخلص من المنطقة التي تسبق مجمع البوليميراز ، ويتم تعويض هذا الضغط بفائق موجبة قبل المجمع. خلف المجمع ، يتم لف الحمض النووي وستكون هناك لفائف سالبة تعويضية. من المهم أن نلاحظ أن التوبويزوميراز مثل DNA gyrase (النوع الثاني Topoisomerase) تلعب دورًا في تخفيف بعض الإجهاد أثناء تخليق DNA و RNA.


        الملخص

        جوزة الهند (كوكوس نوسيفيرا L.) ، وهو مصدر مهم للزيوت النباتية والمغذيات والأغذية الوظيفية ومواد الإسكان ، ويوفر المواد الخام لمجموعة من الصناعات التي تعمل في صناعة مستحضرات التجميل والصابون والمنظفات والدهانات والورنيش والمستحلبات ، من بين منتجات أخرى. يلعب النخيل دورًا حيويًا في الحفاظ على استدامة النظم الزراعية للنظم الإيكولوجية الهشة للجزر والمناطق الساحلية في المناطق الاستوائية وتعزيزها. في هذه الدراسة ، نقدم جينوم صنف قزم جوز الهند "Chowghat Green Dwarf" (CGD) من الهند ، الذي يمتلك مقاومة معززة لمرض الجذور (الذبول). باستخدام القراءات القصيرة من منصة Illumina HiSeq 4000 والقراءات الطويلة من منصة Pacific Biosciences RSII ، قمنا بتجميع مشروع تجميع الجينوم بسعة 1.93 جيجا بايت. يتم توزيع الجينوم على 26،855 سقالة ، مع 81.56 ٪ من الجينوم المجمع موجود في سقالات ذات أطوال أطول من 50 كيلو بايت. حوالي 77.29٪ من الجينوم يتكون من عناصر قابلة للنقل ومتكررة. أسفر التنبؤ الجيني عن 51،953 جينًا ، والتي عند التصفية الصارمة ، استنادًا إلى مسافة تحرير التعليقات التوضيحية ، نتج عنها 13707 جينة ، والتي تم ترميزها لـ 11181 بروتينًا. من بين هؤلاء ، جمعنا أدلة على مستوى النص لما مجموعه 6828 جينًا متوقعًا استنادًا إلى بيانات RNA-Seq من أنسجة جوز الهند المختلفة ، نظرًا لأنها قدمت نسخًا مجمعة داخل إحداثيات شرح الجينوم. تم اكتشاف ما مجموعه 112 موقعًا متكررًا مرتبطًا بالنيوكليوتيدات وغنيًا بالليوسين ، ينتمون إلى ست فئات. لقد قمنا أيضًا بتجميع وتعليق جينومات CGD البلاستيدات الخضراء والميتوكوندريا. يجب أن يثبت توافر جينوم جوز الهند القزم أنه لا يقدر بثمن لاستنتاج أصل أصناف جوز الهند القزم ، وتشريح الجينات التي تتحكم في عادة النبات ولون الفاكهة ، والتكاثر السريع لتحسين الصفات الزراعية.


        شاهد الفيديو: مشروع الجينوم البشري (كانون الثاني 2022).