معلومة

مجموعتان من الكروموسوم وخرج التسلسل


لدى البشر مجموعتان من الكروموسومات غير متصلين في كل خلية. هل انا صائب؟

أفترض أنه أثناء تسلسل الحمض النووي ، يجب أن تكون كلتا المجموعتين متسلسلة ويجب تقديم المخرجات بترتيب ما - على سبيل المثال ، مجموعة الأب متبوعة بالأم أو العكس ، على الرغم من أنه قد لا يكون من الممكن معرفة أيهما أب وأيهما أم .

(أعلم أن هناك أنواعًا مختلفة من تقنيات التسلسل وقد تختلف المخرجات اعتمادًا على التقنية. أنا أتحدث هنا عن الحالة العامة). حاولت توضيح هذا السؤال بنفسي. ولكن قد يكون هذا أمرًا أساسيًا بحيث لا يبدو أن أحدًا يتطرق إلى هذا الجانب.


هذا مشابه جدًا لأسئلتك السابقة ، لكن من الواضح أنك لا تفهم التفسيرات التي نقدمها ، لذلك سأحاول مرة أخرى ، من خلال تقديم شرح (آمل ألا يكون تقنيًا للغاية) لكيفية عمل الجيل التالي من التسلسل الجيني. لتجنب الالتباس ، سنفترض أننا نعمل مع عينات بشرية.

أولاً ، يتم جمع العديد من الخلايا الفردية (يعتمد الرقم على التطبيق ، ويمكن أن يتراوح من خلية واحدة إلى ملايين أو أكثر) ، ويتم جمع الحمض النووي الخاص بهم. تدمر هذه العملية الخلايا ، ويتم خلط جميع نسخ كل الكروموسومات معًا. كما هو مذكور في سؤالك الآخر ، هناك لا توجد طريقة ممكنة لتحديد التسلسل الكروموسومي للأم وأيهما الأبوي. لا يفكر العلماء عادة في هذا الأمر.

بعد ذلك ، يتم تنقية عينة الحمض النووي التي تم جمعها وتقسيمها إلى قطع صغيرة ، ثم ربطها بمحولات معينة لتسميتها لتفاعل التسلسل. ثم يتم تضخيم العينة في PCR قياسي لإنشاء مادة أولية أكثر وفرة بعدة مرات من ذي قبل. هذه مكتبة DNA.

أخيرًا ، العينة جاهزة للتسلسل. ما سيحدث بالضبط بعد ذلك يعتمد على جهاز التسلسل الذي تستخدمه - Illumina أو Ion Torrent أو 454 أو SOLiD هي العلامات التجارية الأكثر استخدامًا للأدوات. داخل كل علامة تجارية ، Illumina على سبيل المثال ، هناك عدة أنواع مختلفة من التسلسل.

ومع ذلك ، سوف نتجاهل كل ذلك ونحصل على المخرجات مباشرة - تنتج الأداة ملفًا يتكون من "قراءات" من التفاعل. هذه القراءات عبارة عن تسلسلات DNA تتكون من As و Ts و Gs و Cs - "الأحرف" (المعروفة أيضًا باسم "القواعد") للحمض النووي. تختلف أطوال القراءات باختلاف التكنولوجيا والأداة ، بشكل عام في نطاق 100 إلى 700 قاعدة. على الرغم من ذلك ، يمكن لآلة واحدة - PacBio RS II - إنتاج قراءات عالية الجودة تصل إلى 14000 قاعدة ، على الرغم من أنها غير منتشرة على نطاق واسع على حد علمي.

هنا يأتي دور أجهزة الكمبيوتر. تتداخل القراءات الفردية مع بعضها البعض بدرجات متفاوتة ، اعتمادًا على جودة المعلومات التي تبحث عنها وما إذا كنت تبحث عن أحداث نادرة أم لا ، مثل مجموعة صغيرة من الخلايا المتحولة المأخوذة من ورم غير متجانس. لأغراضنا ، سنقول إن تشغيل التسلسل أدى إلى تداخل بمقدار 25 ضعفًا ، مما يعني أن كل قاعدة في تسلسل الحمض النووي الأصلي للمتبرع بالعينة قد تم تسلسلها بمعدل 25 مرة مختلفة. يمكن لأجهزة الكمبيوتر بعد ذلك "محاذاة" التسلسلات ، إما فيما بينها فقط ، بدون قالب ، أو بشكل أكثر شيوعًا ، إلى قالب تسلسل موجود مسبقًا ، مثل الجينوم المرجعي. في النهاية ، سيخرج الكمبيوتر تسلسلين - الشريط الأمامي والخلفي العكسي (على الرغم من أنك عادةً ما تختار خيطًا واحدًا فقط ، وتستخدم الشريط العكسي للتحقق من الأخطاء). هذا التسلسل هو معدل تسلسل الكروموسوم ، أو منطقة أخرى من الحمض النووي المستهدف.

من ويكيميديا ​​كومنز: Mapping Reads.png "> SNPs) ، الحذف ، الإدراج ، إلخ. في حالة SNP (يُنطق" snip ") ، يحتوي أليل واحد من الجين على تسلسل واحد على كروموسوم واحد (دعنا نقول ATTCجيTAAC) بينما يحتوي أليل آخر من الجين على الكروموسوم الآخر على تغيير أحادي القاعدة (ATTC)تيTAAC ، على سبيل المثال ، حيث جي تم تغييره إلى تي).

النقطة التي تتعلق مباشرة بسؤالك هي: التسلسل النهائي الذي يظهر في النهاية بعد كل مشاحنات الكمبيوتر هو تسلسل واحد مع مناطق معينة قد تختلف من كروموسوم إلى كروموسوم ، أو خلية إلى خلية في العينة الأصلية. هنالك مستحيل لتحديد ما إذا كان جي في مثالنا أعلاه كان على كروموسوم الأم أو الأب. هنالك أيضا لا توجد طريقة لمعرفة ما إذا كان هناك 20000 قاعدة أسفل الخط ، هناك طفرة أخرى على نفس الكروموسوم مثل جي، لأنه لا توجد قراءة واحدة يمكنها (حاليًا) أن تمتد على هذا الطول بالكامل. قد تكون لديك فرصة جيدة لتحديد ما إذا كانت الطفرة الأخرى ، على سبيل المثال ، تبعد 300 قاعدة ، لأن العديد من التقنيات يمكنها أداء قراءة عالية الجودة أطول من ذلك ، لذلك عليك فقط العثور على الفردي التي تحتوي على كليهما المواقف.

أعلم أن هذا كان طويلًا بعض الشيء ، لكن آمل أن أتمكن من الإجابة على سؤالك.


تم نشر المسودة الأولى للجينوم البشري في عام 2003 كنتيجة لمشروع الجينوم البشري (HGP) - وهي مبادرة أدت إلى تسلسل ما يقرب من ثلاثة مليارات زوج أساسي من الحمض النووي.

منذ ذلك الحين ، أصبحت تقنية التسلسل أكثر تقدمًا ، وأصبح من الممكن الآن التسلسل بسرعة أكبر وبتكلفة أقل. وقد أدى ذلك إلى المزيد من البرامج الطموحة لاكتشاف المزيد عن الجينوم البشري ، مثل مشروع 100000 جينوم في المملكة المتحدة.

على الرغم من أن HGP قام بتسلسل جزء كبير من الجينوم ، لا تزال هناك فجوات في التسلسل ، وعلى الرغم من إحراز تقدم في الفترة الفاصلة ، تظل مناطق الجينوم غير محددة.


مجموعتان من الكروموسوم ومخرجات التسلسل - علم الأحياء

يركض سلسلة من سطر الأوامر مثل هذا:
المدخل الرئيسي للبرنامج هو ملف BAM به تعيينات قراءة RNA-Seq والتي يجب فرزها حسب موقعها الجيني (على سبيل المثال Accept_hits.bam ملف تم إنتاجه بواسطة TopHat أو إخراج HISAT2 بعد فرزها وتحويلها باستخدام samtools كما هو موضح أدناه).

ملفات الإدخال

نتج الملف عن الأمر أعلاه (alns.sorted.bam) كمدخل لـ StringTie.

يجب أن تحتوي كل محاذاة قراءة مقسمة (أي محاذاة عبر تقاطع واحد على الأقل) في ملف SAM للإدخال على العلامة XS للإشارة إلى الخيط الجينومي الذي أنتج الحمض النووي الريبي (RNA) الذي تم منه تسلسل القراءة. تتضمن المحاذاة التي تم إنتاجها بواسطة TopHat و HISAT2 (عند التشغيل بخيار --dta) هذه العلامة بالفعل ، ولكن إذا كنت تستخدم مخطط قراءة مختلفًا ، فيجب عليك التحقق من تضمين علامة XS هذه للمحاذاة المقسمة.

ملاحظة: تأكد من تشغيل HISAT2 باستخدام الخيار --dta للمحاذاة ، وإلا ستعاني نتائجك.

كخيار ، يمكن توفير ملف تعليق مرجعي بتنسيق GTF / GFF3 إلى StringTie. في هذه الحالة ، ستفضل StringTie استخدام هذه الجينات "المعروفة" من ملف التعليقات التوضيحية ، وبالنسبة للجينات التي يتم التعبير عنها فإنها ستحسب التغطية وقيم TPM و FPKM. سينتج أيضًا نصوصًا إضافية لحساب بيانات RNA-seq التي لا يغطيها (أو يشرحها) التعليق التوضيحي. لاحظ أنه إذا لم يتم استخدام الخيار -e ، فيجب تغطية النصوص المرجعية بالكامل بالقراءات حتى يتم تضمينها في إخراج StringTie. في هذه الحالة ، ستتم أيضًا طباعة النصوص الأخرى التي تم تجميعها من البيانات بواسطة StringTie وغير موجودة في الملف المرجعي.

ملاحظة: نوصي بشدة بتقديم تعليق توضيحي إذا كنت تقوم بتحليل جينوم مشروح جيدًا ، مثل الإنسان أو الماوس أو الكائنات الحية النموذجية الأخرى.

ملفات الإخراج

  1. الإخراج الرئيسي لـ Stringtie هو ملف GTF يحتوي على النصوص المجمعة
  2. وفرة الجينات بتنسيق محدد بعلامات جدولة
  3. النصوص المغطاة بالكامل والتي تتطابق مع التعليق التوضيحي المرجعي ، بتنسيق GTF
  4. الملفات (الجداول) المطلوبة كمدخلات في Ballgown ، والتي تستخدمها لتقدير التعبير التفاضلي
  5. في وضع الدمج ، ملف GTF مدمج من مجموعة من ملفات GTF

وصف قيم كل عمود:

  • seqname: يشير إلى الكروموسوم أو كونتيج أو سقالة لهذا النص. هنا النص المُجمع موجود على الكروموسوم X.
  • مصدر: مصدر ملف GTF. نظرًا لأن هذا المثال تم إنتاجه بواسطة StringTie ، فإن هذا العمود يعرض ببساطة "StringTie".
  • خاصية: نوع الميزة مثل exon و transcript و mRNA و 5'UTR).
  • بداية: بدء موضع الميزة (exon ، نسخة ، إلخ) ، باستخدام فهرس يستند إلى 1.
  • نهاية: وضع نهاية الميزة ، باستخدام فهرس على أساس 1.
  • نتيجة: درجة الثقة في النسخة المجمعة. لا يتم استخدام هذا الحقل حاليًا ، ويبلغ StringTie عن قيمة ثابتة قدرها 1000 إذا كان النص يحتوي على اتصال بحزمة محاذاة للقراءة.
  • ساحل: إذا كان النص موجودًا على الشريط الأمامي ، "+". إذا كان النص موجودًا على الشريط العكسي ، "-".
  • الإطار: إطار أو مرحلة من ميزات CDS. لا تستخدم StringTie هذا الحقل وتقوم ببساطة بتسجيل ".".
  • صفات: قائمة مفصولة بفاصلة منقوطة لأزواج قيمة العلامة ، وتوفر معلومات إضافية حول كل ميزة. اعتمادًا على ما إذا كان المثيل عبارة عن نسخة أو exon وما إذا كان النص يتطابق مع ملف التعليق التوضيحي المرجعي الذي يوفره المستخدم ، سيختلف محتوى حقل السمات. تصف القائمة التالية السمات المحتملة الموضحة في هذا العمود:
    • gene_id: معرف فريد لجين واحد ونسخه الفرعية وإكسوناته استنادًا إلى اسم ملف المحاذاة.
    • transcript_id: معرّف فريد لنسخة واحدة وإكسوناتها الفرعية بناءً على اسم ملف المحاذاة.
    • exon_number: معرّف فريد لـ exon واحد ، بدءًا من 1 ، ضمن نسخة معينة.
    • Reference_id: معرِّف النص في التعليق التوضيحي للمرجع (اختياري) الذي تطابقته المثيل.
    • ref_gene_id: gene_id في التعليق التوضيحي المرجعي (اختياري) الذي تطابقه المثيل.
    • ref_gene_name: اسم الجين في التعليق التوضيحي المرجعي (اختياري) المطابق للمثيل.
    • cov: متوسط ​​التغطية لكل قاعدة للنسخة أو exon.
    • FPKM: أجزاء لكل كيلو قاعدة من النص لكل مليون زوج قراءة. هذا هو عدد أزواج القراءات المتوافقة مع هذه الميزة ، والتي تم تسويتها من خلال العدد الإجمالي للأجزاء المتسلسلة (بالملايين) وطول النص (بالكيلوباس).
    • TPM: النصوص لكل مليون. هذا هو عدد النسخ من هذا الجين المعين الذي تم تطبيعه أولاً حسب طول الجين ، ثم من خلال عمق التسلسل (بالملايين) في العينة. يمكن العثور هنا على شرح مفصل ومقارنة بين TPM و FPKM ، وتم تعريف TPM بواسطة B. Li و C.Dewey هنا.
    • العمود 1 / معرف الجينات: يأتي معرف الجين من التعليق التوضيحي المرجعي المزود بخيار -G. إذا لم يتم توفير مرجع ، فسيتم استبدال هذا الحقل ببادئة الاسم لنصوص الإخراج (-l).
    • العمود 2 / اسم الجين: يحتوي هذا الحقل على اسم الجين في التعليق التوضيحي المرجعي المزود بخيار -G. إذا لم يتم توفير مرجع ، فسيتم ملء هذا الحقل بـ "-".
    • العمود 3 / المرجعي: اسم التسلسل المرجعي الذي تم استخدامه في محاذاة القراءات. يكافئ العمود الثالث في محاذاة .SAM.
    • العمود 4 / ساحل: تشير "+" إلى أن الجين موجود على الشريط الأمامي ، "-" للشريط العكسي.
    • العمود 5 / يبدأ: موضع بدء الجين (مؤشر قائم على 1).
    • العمود 6 / نهاية: موضع نهاية الجين (فهرس قائم على 1).
    • العمود 7 / تغطية: تغطية الجين لكل قاعدة.
    • العمود 8 / FPKM: مستوى التعبير الطبيعي في وحدات FPKM (انظر القسم السابق).
    • العمود 9 / TPM: مستوى التعبير الطبيعي بوحدات RPM (انظر القسم السابق).

    3. النصوص المغطاة بالكامل التي تطابق نصوص التعليقات التوضيحية المرجعية (بتنسيق GTF)

    إذا تم تشغيل StringTie باستخدام الخيار -C & ltcov_refs.gtf & gt (يتطلب -G & ltreference_annotation & gt) ، فإنه يُرجع ملفًا يحتوي على جميع النصوص في التعليق التوضيحي المرجعي المغطاة بالكامل ، من النهاية إلى النهاية ، عن طريق القراءة. تنسيق الإخراج هو ملف GTF كما هو موضح أعلاه. يتوافق كل سطر من GTF مع جين أو نسخة في التعليق التوضيحي المرجعي.

    4. ملفات جدول الإدخال

    إذا تم تشغيل StringTie باستخدام الخيار -B ، فإنه يقوم بإرجاع ملف جدول إدخال Ballgown ، والذي يحتوي على بيانات التغطية لجميع النصوص. يتم وضع ملفات جدول الإخراج في نفس الدليل مثل إخراج GTF الرئيسي. تحتوي هذه الجداول على هذه الأسماء المحددة: (1) e2t.ctab ، (2) e_data.ctab ، (3) i2t.ctab ، (4) i_data.ctab ، و (5) t_data.ctab. يمكن العثور على وصف تفصيلي لكل من هذه المدخلات الخمسة المطلوبة في Ballgown على موقع Ballgown ، على هذا الرابط.

    5. وضع الدمج: دمج GTF

    إذا تم تشغيل StringTie باستخدام الخيار --merge ، فإنه يأخذ قائمة بملفات GTF / GFF كإدخال ويدمج / يجمع هذه النصوص في مجموعة غير مكررة من النصوص. تنشئ هذه الخطوة مجموعة موحدة من النصوص لجميع العينات لتسهيل الحساب النهائي للمستويات المعبر عنها تفاضليًا لجميع النصوص بين الظروف التجريبية المختلفة. الإخراج عبارة عن ملف GTF مدمج مع جميع نماذج الجينات المدمجة ، ولكن بدون أي نتائج رقمية على التغطية و FPKM و TPM. بعد ذلك ، باستخدام GTF المدمج ، يمكن لـ StringTie إعادة تقدير الوفرة عن طريق تشغيلها مرة أخرى باستخدام الخيار -e في المجموعة الأصلية لملفات المحاذاة ، كما هو موضح في الشكل أدناه.

    تقييم تجميعات النص

    طريقة بسيطة للحصول على مزيد من المعلومات حول النصوص التي تم تجميعها بواسطة StringTie (ملخص الجينات وعدد النسخ ، الرواية مقابل المعروفة وما إلى ذلك) ، أو حتى إجراء التتبع الأساسي للأشكال الإسوية المجمعة عبر العديد من تجارب RNA-Seq ، هو استخدام برنامج gffcompare . يمكن العثور على معلومات الاستخدام الأساسية وخيارات التنزيل لهذا البرنامج على صفحة أدوات GFF.

    تحليل التعبير التفاضلي

    1. لكل عينة RNA-Seq ، قم بتعيين القراءات إلى الجينوم باستخدام HISAT2 باستخدام --dta اختيار. يوصى بشدة باستخدام معلومات التعليقات التوضيحية المرجعية عند تعيين القراءات ، والتي يمكن تضمينها إما في فهرس الجينوم (تم إنشاؤه باستخدام --ss و - إكسون الخيارات ، راجع دليل HISAT2) ، أو يتم توفيرها بشكل منفصل في وقت التشغيل (باستخدام ملف - معروف-splicesite-infile خيار HISAT2). يجب فرز إخراج SAM لكل تشغيل HISAT2 وتحويله إلى BAM باستخدام سامتولس كما هو موضح أعلاه.
    2. لكل عينة RNA-Seq ، قم بتشغيل StringTie لتجميع محاذاة القراءة التي تم الحصول عليها في الخطوة السابقة ، يوصى بتشغيل StringTie مع الخيار -G إذا كان التعليق التوضيحي المرجعي متاحًا.
    3. تشغيل StringTie مع --دمج من أجل إنشاء مجموعة غير زائدة عن الحاجة من النصوص التي لوحظت في أي من عينات RNA-Seq التي تم تجميعها مسبقًا. ال سلسلة - دمج يأخذ الوضع كإدخال قائمة بجميع ملفات النصوص المجمعة (بتنسيق GTF) التي تم الحصول عليها مسبقًا لكل عينة ، بالإضافة إلى ملف تعليق مرجعي (-G الخيار) إذا كان متاحًا.
    4. لكل عينة RNA-Seq ، قم بتشغيل StringTie باستخدام -ب / -ب و -e خيارات لتقدير وفرة النص وإنشاء جداول تغطية للقراءة لـ Ballgown. الخيار -e غير مطلوب ولكنه موصى به لهذا التشغيل من أجل إنتاج تقديرات وفرة أكثر دقة لنصوص الإدخال. سيأخذ كل تشغيل StringTie في هذه الخطوة كمدخلات محاذاة القراءة المفروزة (ملف BAM) التي تم الحصول عليها في الخطوة 1 للعينة المقابلة و -G الخيار مع النصوص المدمجة (ملف GTF) التي تم إنشاؤها بواسطة سلسلة - دمج في الخطوة 3. يرجى ملاحظة أن هذه هي الحالة الوحيدة التي يكون فيها ملف -G لا يتم استخدام الخيار مع تعليق توضيحي مرجعي ، ولكن مع مجموعة النصوص العامة والمدمجة كما لوحظ في جميع العينات. (هذه الخطوة تعادل صانع الجدول الخطوة الموضحة في خط أنابيب Ballgown الأصلي.)
    5. يمكن الآن استخدام Ballgown لتحميل جداول التغطية التي تم إنشاؤها في الخطوة السابقة وإجراء تحليلات إحصائية مختلفة للتعبير التفاضلي ، وإنشاء المؤامرات وما إلى ذلك.

    يمكن متابعة سير عمل تحليل التعبير التفاضلي البديل والأسرع إذا لم يكن هناك اهتمام بالأشكال الإسوية الجديدة (أي النصوص المجمعة الموجودة في العينات ولكنها مفقودة من التعليق التوضيحي المرجعي) ، أو إذا تم استهداف مجموعة معروفة جيدًا من النصوص ذات الأهمية من قبل التحليلات. يحتوي هذا البروتوكول المبسط على 3 خطوات فقط (كما هو موضح أدناه) لأنه يتجاوز التجميع الفردي لكل عينة RNA-Seq و "دمج النص" خطوة. يحاول سير العمل المبسط هذا تقدير وتحليل التعبير عن مجموعة معروفة من النصوص على النحو الوارد في ملف التعليق التوضيحي المرجعي ملف.

    حزمة R IsoformSwitchAnalyzeR يمكن استخدامها لتعيين أسماء الجينات للنصوص التي تم تجميعها بواسطة StringTie ، والتي يمكن أن تكون مفيدة بشكل خاص في الحالات التي يتعذر فيها على StringTie أداء هذه المهمة بشكل غير قابل للطرح.
    يمكن استخدام وظيفة importIsoformExpression () + importRdata () للحزمة لاستيراد بيانات التعبير والتعليقات التوضيحية إلى R. أثناء هذا الاستيراد ، ستحاول الحزمة تنظيف التعليقات التوضيحية ذات الشكل الإسوي واستعادتها حيثما أمكن ذلك. من كائن switchAnalyzeRlist الناتج ، IsoformSwitchAnalyzeR يمكن الكشف عن مفاتيح الشكل الإسوي جنبًا إلى جنب مع العواقب الوظيفية المتوقعة. يمكن استخدام وظيفة extractGeneExpression () للحصول على مصفوفة التعبير الجيني (عدد القراءة) لتحليلها باستخدام أدوات أخرى.
    يمكن العثور على مزيد من المعلومات وأمثلة التعليمات البرمجية هنا.

    استخدام StringTie مع DESeq2 و edgeR

    DESeq2 و edgeR هما حزمتان شائعتان للموصلات الحيوية لتحليل التعبير التفاضلي ، والتي تأخذ كمدخلات مصفوفة من أعداد القراءة المعينة لميزات جينومية معينة (على سبيل المثال ، الجينات). نحن نقدم برنامج نصي بلغة بايثون (prepDE.py، أو إصدار Python 3: prepDE.py3 ) التي يمكن استخدامها لاستخراج معلومات عدد القراءة مباشرة من الملفات التي تم إنشاؤها بواسطة StringTie (يتم تشغيلها بامتداد -e معامل).

    prepDE.py تستمد أعداد قراءة افتراضية لكل نص من قيم التغطية المقدرة بواسطة StringTie لكل نص ، باستخدام هذه الصيغة البسيطة: reads_per_transcript = التغطية * transcript_len / read_len

    • أحد الخيارات هو توفير مسار إلى دليل يحتوي على جميع نماذج الدلائل الفرعية ، بنفس بنية ملف ثوب الكرة الدليل في ورقة بروتوكول StringTie استعدادًا لـ Ballgown. بشكل افتراضي (لا -أنا الخيار) ، سيبحث البرنامج النصي في الدليل الحالي عن جميع المجلدات الفرعية التي تحتوي على ملفات .gtf فيها ، كما في هذا المثال:
    • بدلاً من ذلك ، يمكن للمرء تقديم ملف نصي يسرد نماذج من المعرفات والمسارات الخاصة بكل منها (sample_lst.txt).

    استعمال: prepDE.py [خيارات]
    يُنشئ ملفي CSV يحتويان على مصفوفات تعداد الجينات والنصوص ، باستخدام قيم التغطية الموجودة في إخراج السلسلة النصية- e

    خيارات:
    -h ، - مساعدة إظهار رسالة المساعدة هذه والخروج
    -i INPUT ، --input = INPUT ، --in = INPUTمجلد يحتوي على جميع نماذج الدلائل الفرعية ، أو ملف نصي به معرف العينة والمسار إلى ملف GTF الخاص به في كل سطر [افتراضي:. ]
    ز- زأين يتم إخراج مصفوفة عدد الجينات [افتراضي: gene_count_matrix.csv]
    -t تيمكان إخراج مصفوفة عدد النسخ [افتراضي: transcript_count_matrix.csv]
    - l الطول ، - الطول = الطولمتوسط ​​طول القراءة [الافتراضي: 75]
    -p نمط ، - نمط = نمطتعبير عادي يحدد نماذج الدلائل الفرعية
    -c ، - العنقودما إذا كان سيتم تجميع الجينات التي تتداخل مع معرفات جينية مختلفة ، وتجاهل الجينات ذات نمط معرف الجينات (انظر أدناه)
    -s STRING ، --string = STRINGإذا تم استخدام بادئة مختلفة لمعرفات الجينات المعينة بواسطة StringTie [افتراضي: MSTRG]
    -k KEY، --key = KEYif clustering ، ما هي البادئة التي يجب استخدامها لمعرفات الجينات المعينة بواسطة هذا البرنامج النصي [افتراضي: prepG]
    - أسطورة = أسطورةإذا كان التجميع ، حيث يتم إخراج نصوص تعيين ملف وسيلة الإيضاح إلى معرفات الجينات المعينة [افتراضي: legend.csv]

    يمكن بعد ذلك استيراد مصفوفات العد هذه (ملفات CSV) إلى R لاستخدامها بواسطة DESeq2 و edgeR (باستخدام DESeqDataSetFromMatrix و DGEList وظائف ، على التوالي).

    البروتوكول: استخدام StringTie مع DESeq2

    بالنظر إلى قائمة GTFs ، التي أعيد تقديرها عند الدمج ، يمكن للمستخدمين اتباع البروتوكول أدناه لاستخدام DESeq2 لتحليل التعبير التفاضلي. لتوليد GTFs من القراءات الأولية ، اتبع ورقة بروتوكول StringTie (حتى خطوة Ballgown).


    الظروف الصحية المتعلقة بالتغيرات الكروموسومية

    ترتبط الشروط الكروموسومية التالية بالتغيرات في بنية أو عدد نسخ الكروموسوم x.

    46 ، XX اضطراب الخصية لتطور الجنس

    46 ، XX اضطراب الخصية في النمو الجنسي هو حالة يكون فيها الأفراد الذين لديهم اثنين من الكروموسومات X في كل خلية ، وهو النمط الموجود عادة في الإناث ، مظهرًا ذكوريًا. في معظم الأفراد المصابين باضطراب الخصية 46 ، XX في النمو الجنسي ، تنتج الحالة عن التبادل غير الطبيعي للمادة الوراثية بين الكروموسومات (الانتقال). يحدث هذا التبادل كحدث عشوائي أثناء تكوين الخلايا المنوية في والد الشخص المصاب. يؤثر الانتقال على الجين المسؤول عن تطور الجنين إلى ذكر ( SRY الجين). ال SRY يقع الجين ، الذي يوجد عادةً في الكروموسوم Y ، في غير مكانه في هذا الاضطراب ، دائمًا تقريبًا على كروموسوم X. يحمل الجنين الكروموسوم X الذي يحمل SRY سيتطور الجين كذكر على الرغم من عدم وجود كروموسوم Y.

    48 ، متلازمة XXXY

    متلازمة 48 ، XXXY هي حالة كروموسومية عند الأولاد والرجال تسبب إعاقة ذهنية وتأخرًا في النمو واختلافات جسدية وعدم القدرة على إنجاب الأطفال البيولوجيين (العقم). تنتج هذه الحالة عن وجود كروموسومين X إضافيين في كل خلية. الأولاد والرجال المصابون بمتلازمة 48 ، XXXY لديهم كروموسوم Y المفرد المعتاد بالإضافة إلى ثلاث نسخ من الكروموسوم X ، ليصبح المجموع 48 كروموسومًا في كل خلية.

    يؤثر وجود نسخ إضافية من جينات متعددة على الكروموسوم X في العديد من جوانب التطور ، بما في ذلك التطور الجنسي قبل الولادة وعند البلوغ. يعمل الباحثون على تحديد الجينات التي تساهم في الاختلافات الجسدية والنمائية المحددة التي تحدث مع متلازمة 48 ، XXXY.

    يتم وصف متلازمة 48 ، XXXY أحيانًا على أنها أحد أشكال متلازمة كلاينفيلتر (الموضحة أدناه). ومع ذلك ، فإن سمات متلازمة 48 ، XXXY تميل إلى أن تكون أكثر حدة من تلك الخاصة بمتلازمة كلاينفيلتر وتؤثر على أجزاء أكثر من الجسم. نظرًا لأن الأطباء والباحثين قد تعلموا المزيد عن الاختلافات بين اضطرابات الكروموسومات الجنسية ، فقد بدأوا في اعتبارها شروطًا منفصلة.

    48 ، متلازمة XXYY

    متلازمة 48 ، XXYY هي حالة كروموسومية تسبب العقم ، واضطرابات النمو والسلوك ، وغيرها من المشاكل الصحية لدى الأولاد والرجال المصابين. تحدث هذه الحالة بسبب وجود كروموسوم X إضافي وكروموسوم Y إضافي في خلايا الذكر. تتداخل المواد الجينية الإضافية من الكروموسوم X مع التطور الجنسي للذكور ، مما يمنع الخصيتين من العمل بشكل طبيعي ويقلل من مستويات هرمون التستوستيرون (هرمون يوجه النمو الجنسي للذكور) في الذكور البالغين والمراهقين. تساهم النسخ الإضافية من الجينات من المناطق الصبغية الزائفة من الكروموسومات X و Y الزائدة في ظهور علامات وأعراض متلازمة 48 ، XXYY ، ومع ذلك ، لم يتم تحديد الجينات المحددة.

    49، متلازمة XXXXY

    متلازمة 49 ، XXXXY هي حالة صبغية عند الأولاد والرجال تسبب إعاقة ذهنية وتأخرًا في النمو (خاصة في الكلام واللغة) والاختلافات الجسدية والعقم. تنتج هذه الحالة عن وجود ثلاثة كروموسومات X إضافية في كل خلية. الأولاد والرجال الذين يعانون من متلازمة 49 ، XXXXY لديهم كروموسوم Y المفرد المعتاد بالإضافة إلى أربع نسخ من الكروموسوم X ، ليصبح المجموع 49 كروموسومًا في كل خلية.

    يؤثر وجود نسخ إضافية من جينات متعددة على الكروموسوم X في العديد من جوانب التطور ، بما في ذلك التطور الجنسي قبل الولادة وعند البلوغ. يعمل الباحثون على تحديد الجينات التي تساهم في الاختلافات الجسدية والنمائية المحددة التي تحدث مع متلازمة 49 ، XXXXY.

    توصف متلازمة 49 ، XXXXY أحيانًا بأنها أحد أنواع متلازمة كلاينفيلتر (الموضحة أدناه). ومع ذلك ، فإن سمات متلازمة 49 ، XXXXY تميل إلى أن تكون أكثر حدة من تلك الخاصة بمتلازمة كلاينفيلتر وتؤثر على أجزاء أكثر من الجسم. نظرًا لأن الأطباء والباحثين قد تعلموا المزيد عن الاختلافات بين اضطرابات الكروموسومات الجنسية ، فقد بدأوا في اعتبارها شروطًا منفصلة.

    انسداد الأمعاء الزائف

    الانسداد المعوي الزائف ، وهو حالة تتميز بضعف الموجات المنسقة لتقلصات العضلات التي تنقل الطعام عبر الجهاز الهضمي (التمعج) ، يمكن أن تحدث بسبب التغيرات الجينية التي تنطوي على الكروموسوم X.

    يعاني بعض الأفراد الذين يعانون من انسداد كاذب في الأمعاء من طفرات أو مضاعفات أو حذف للمادة الوراثية على الكروموسوم X الذي يؤثر على FLNA الجين. يساعد البروتين المنتج من هذا الجين ، فيلامين أ ، على تكوين شبكة متفرعة من الخيوط تسمى الهيكل الخلوي ، والتي تعطي بنية للخلايا وتسمح لها بتغيير الشكل والتحرك.

    يعتقد الباحثون أن التغيرات في الكروموسوم X تؤثر على FLNA يضعف الجين وظيفة بروتين فيلامين أ. تشير الدراسات إلى أن ضعف وظيفة فيلامين أ يؤثر على شكل الخلايا في العضلات الملساء في الجهاز الهضمي أثناء النمو قبل الولادة ، مما يتسبب في حدوث تشوهات في طبقات هذه العضلات. تبطن العضلات الملساء الأعضاء الداخلية التي تتقلص وتسترخي دون أن يتم التحكم فيها بوعي. في الجهاز الهضمي ، قد تتداخل الطبقات غير الطبيعية لهذه العضلات مع التمعج.

    حذف أو ازدواجية المادة الوراثية التي تؤثر على FLNA يمكن أن يشمل الجين أيضًا الجينات المجاورة على الكروموسوم X. قد تفسر التغييرات في الجينات المجاورة بعض العلامات والأعراض الأخرى ، مثل التشوهات العصبية وميزات الوجه غير العادية ، التي تحدث في بعض الأفراد المصابين.

    متلازمة كلاينفلتر

    متلازمة كلاينفيلتر هي حالة صبغية لدى الأولاد والرجال يمكن أن تؤثر على التطور البدني والفكري. وهو ناتج عن نسخة إضافية من الكروموسوم X. يمتلك الأولاد والرجال المصابون بمتلازمة كلاينفيلتر كروموسوم Y المفرد المعتاد بالإضافة إلى نسختين من الكروموسوم X ، ليصبح المجموع 47 كروموسومًا في كل خلية (47 ، XXY).

    يؤثر وجود نسخة إضافية من الجينات على الكروموسوم X في العديد من جوانب التطور ، بما في ذلك التطور الجنسي قبل الولادة وعند البلوغ. يعمل الباحثون على تحديد الجينات التي تساهم في الاختلافات الجسدية والنمائية المحددة التي يمكن أن تحدث مع متلازمة كلاينفيلتر.

    يمتلك بعض الأشخاص الذين يعانون من سمات متلازمة كلاينفيلتر كروموسوم X إضافي في بعض خلاياهم فقط ، وتحتوي الخلايا الأخرى على كروموسوم X واحد وكروموسوم Y واحد. في هؤلاء الأفراد ، توصف الحالة بأنها متلازمة كلاينفيلتر الفسيفسائية (46 ، XY / 47 ، XXY). قد يعاني الأولاد والرجال المصابون بمتلازمة كلاينفيلتر الفسيفسائية من علامات وأعراض أكثر اعتدالًا من أولئك الذين لديهم كروموسوم X إضافي في جميع خلاياهم ، اعتمادًا على نسبة الخلايا التي تحتوي على الكروموسوم الإضافي.

    توصف أحيانًا عدة حالات ناتجة عن وجود أكثر من كروموسوم جنسي إضافي في كل خلية على أنها متغيرات لمتلازمة كلاينفيلتر. تشمل هذه الحالات متلازمة 48 ، متلازمة XXXY و 49 ، متلازمة XXXXY (كلاهما موصوف أعلاه). تميل سمات هذه الاضطرابات إلى أن تكون أكثر حدة من تلك الخاصة بمتلازمة كلاينفيلتر وتؤثر على أجزاء أكثر من الجسم. نظرًا لأن الأطباء والباحثين قد تعلموا المزيد عن الاختلافات بين اضطرابات الكروموسومات الجنسية ، فقد بدأوا في اعتبارها شروطًا منفصلة.

    صغر العين مع متلازمة عيوب الجلد الخطية

    يتسبب حذف المادة الوراثية في منطقة من الكروموسوم X تسمى Xp22 في صغر العين مع متلازمة عيوب الجلد الخطية. تتميز هذه الحالة بعيون صغيرة أو ضعيفة النمو (صغر العين) وعلامات جلدية خطية غير عادية على الرأس والرقبة.

    تشتمل منطقة Xp22 على جين يسمى HCCS، والذي يحمل تعليمات لإنتاج إنزيم يسمى سينسيز هولوسيتوكروم ج من النوع. يساعد هذا الإنزيم في إنتاج جزيء يسمى السيتوكروم ج. يشارك السيتوكروم ج في عملية تسمى الفسفرة المؤكسدة ، والتي من خلالها تولد الميتوكوندريا أدينوسين ثلاثي الفوسفات (ATP) ، مصدر الطاقة الرئيسي للخلية. كما أنه يلعب دورًا في التدمير الذاتي للخلايا (موت الخلايا المبرمج).

    حذف مادة وراثية تتضمن HCCS يمنع الجين إنتاج إنزيم سينسيز من النوع هولوسيتوكروم ج. في الإناث (اللواتي لديهن كروموسومان X) ، تنتج بعض الخلايا كمية طبيعية من الإنزيم بينما لا تنتج الخلايا الأخرى أيًا منها. يؤدي الانخفاض الكلي الناتج في كمية هذا الإنزيم إلى ظهور علامات وأعراض صغر العين مع متلازمة عيوب الجلد الخطية.

    في الذكور (الذين لديهم كروموسوم X واحد فقط) ، يتضمن الحذف HCCS ينتج عن الجين خسارة كاملة لإنزيم سينثيز من النوع c هولوسيتوكروم. يبدو أن نقص هذا الإنزيم قاتل في وقت مبكر جدًا من التطور ، لذلك لا يولد أي ذكر تقريبًا مصابًا بصغر العين مع متلازمة عيوب الجلد الخطية. تم التعرف على عدد قليل من الأفراد المصابين بمظهر ذكوري ولديهم اثنين من الكروموسومات X.

    يمكن أن تؤدي كمية مخفضة من إنزيم سينسيز من النوع c من النوع هولوسيتوكروم إلى إتلاف الخلايا عن طريق إضعاف قدرتها على توليد الطاقة. بالإضافة إلى ذلك ، بدون إنزيم سينسيز من النوع c هولوسيتوكروم ، قد لا تكون الخلايا التالفة قادرة على الخضوع للاستماتة. قد تموت هذه الخلايا بدلاً من ذلك في عملية تسمى النخر الذي يسبب الالتهاب ويتلف الخلايا المجاورة. خلال التطور المبكر ، قد يؤدي هذا الضرر المنتشر للخلايا إلى تشوهات العين والجلد التي تتميز بها صغر العين مع متلازمة عيوب الجلد الخطية.

    متلازمة ثلاثية إكس

    تنتج متلازمة ثلاثية إكس (تسمى أيضًا 47 أو XXX أو التثلث الصبغي X) عن نسخة إضافية من الكروموسوم X في كل خلية من خلايا الأنثى. تمتلك الإناث المصابات بمتلازمة ثلاثية إكس ثلاثة كروموسومات X ، ليصبح المجموع 47 كروموسومًا لكل خلية. يمكن أن ترتبط نسخة إضافية من الكروموسوم X بقامة طويلة وتأخر في النمو ومشاكل في التعلم وميزات أخرى لدى بعض الفتيات والنساء.

    تمتلك بعض الإناث المصابات بمتلازمة ثلاثية إكس كروموسوم X إضافي في بعض خلاياهن فقط. تسمى هذه الظاهرة 46 ، XX / 47 ، XXX فسيفساء.

    تم التعرف على الإناث التي لديها أكثر من نسخة إضافية من كروموسوم X (48 ، XXXX أو 49 ، XXXXX) ، ولكن هذه التغييرات الكروموسومية نادرة. مع زيادة عدد الكروموسومات الجنسية الإضافية ، تزداد أيضًا مخاطر مشاكل التعلم والإعاقة الذهنية والعيوب الخلقية وغيرها من المشكلات الصحية.

    متلازمة تيرنر

    تنتج متلازمة تيرنر عندما يوجد كروموسوم X طبيعي واحد في خلايا أنثى ويكون الكروموسوم الجنسي الآخر مفقودًا أو يتغير هيكليًا. تؤثر المادة الوراثية المفقودة على النمو قبل الولادة وبعدها ، مما يؤدي إلى قصر القامة وخلل المبيض وخصائص أخرى لمتلازمة تيرنر.

    يعاني حوالي نصف الأفراد المصابين بمتلازمة تيرنر من أحادية الصبغي X (45 ، X) ، مما يعني أن كل خلية في جسم الفرد تحتوي على نسخة واحدة فقط من الكروموسوم X بدلاً من الكروموسومات الجنسية المعتادة. يمكن أن تحدث متلازمة تيرنر أيضًا إذا كان أحد الكروموسومات الجنسية مفقودًا جزئيًا أو أعيد ترتيبه بدلاً من أن يكون غائبًا تمامًا.

    تعاني بعض النساء المصابات بمتلازمة تيرنر من تغير في الكروموسومات في بعض خلاياهن فقط ، وهو ما يُعرف باسم الفسيفساء. تحتوي بعض الخلايا على اثنين من الكروموسومات الجنسية المعتادة (إما اثنين من الكروموسومات X أو كروموسوم X واحد وكروموسوم Y واحد) ، بينما تحتوي الخلايا الأخرى على نسخة واحدة فقط من الكروموسوم X. يُقال إن النساء المصابات بمتلازمة تيرنر التي تسببها فسيفساء الكروموسوم X (45 ، X / 46 ، XX أو 45 ، X / 46 ، XY) مصابات بمتلازمة تيرنر الفسيفسائية.

    لم يحدد الباحثون أي الجينات الموجودة على الكروموسوم X مسؤولة عن معظم سمات متلازمة تيرنر. ومع ذلك ، فقد حددوا جينًا واحدًا يسمى شوكس هذا مهم لنمو العظام ونموها. ال شوكس يقع الجين في المناطق الكاذبة من الكروموسومات الجنسية. من المحتمل أن يتسبب فقدان نسخة واحدة من هذا الجين في قصر القامة وتشوهات الهيكل العظمي لدى النساء المصابات بمتلازمة تيرنر.

    Acrogigantism المرتبطة بالكروموسوم X

    يؤدي ازدواج كمية صغيرة من المادة الوراثية على الكروموسوم X إلى حدوث تضخم الغدة الدرقية المرتبط بالكروموسوم X (X-LAG) ، والذي يتميز بنمو سريع بشكل غير طبيعي يبدأ في مرحلة الرضاعة أو الطفولة المبكرة. قد يعاني الأفراد المصابون من هذه الحالة نتيجة تضخم الغدة النخامية أو تطور ورم غير سرطاني في الغدة (يسمى الورم الحميد في الغدة النخامية). الغدة النخامية هي غدة صغيرة في قاعدة الدماغ تنتج هرمونات تتحكم في العديد من وظائف الجسم المهمة ، بما في ذلك هرمون النمو الذي يساعد على نمو الجسم مباشرة. تفرز الغدة غير الطبيعية هرمون نمو أكثر من الطبيعي ، مما يتسبب في نمو سريع لدى الأفراد المصابين بـ X-LAG.

    تحدث الازدواجية ، التي يشار إليها غالبًا باسم Xq26.3 microduplication ، على الذراع الطويلة (q) للكروموسوم في موقع محدد q26.3. يمكن أن يشمل عدة جينات ، ولكن فقط ازدواجية GPR101 الجين ضروري لإحداث X-LAG. ال GPR101 يقدم الجين تعليمات لصنع بروتين غير معروف وظيفته ، على الرغم من أنه يعتقد أنه يشارك في نمو الخلايا في الغدة النخامية أو في إطلاق هرمون النمو من الغدة.

    ازدواجية GPR101 يؤدي الجين إلى زيادة بروتين GPR101. من غير الواضح كيف يؤدي بروتين GPR101 الإضافي إلى الإصابة بورم غدي نخامي أو تضخم أو في إفراز هرمون النمو الزائد.

    حالات صبغية أخرى

    غالبًا ما تؤثر حالات الكروموسومات التي تتضمن الكروموسومات الجنسية على تحديد الجنس (سواء كان لدى الشخص الخصائص الجنسية لذكر أو أنثى) ، والنمو الجنسي ، والقدرة على إنجاب أطفال بيولوجيين (الخصوبة). تختلف علامات وأعراض هذه الحالات بشكل كبير وتتراوح من خفيفة إلى شديدة. يمكن أن تكون ناجمة عن فقدان أو نسخ إضافية من الكروموسومات الجنسية أو عن طريق التغيرات الهيكلية في الكروموسومات.


    مجموعتان من الكروموسوم ومخرجات التسلسل - علم الأحياء

    يحتوي هذا المستودع على بعض البرامج التي أستخدمها لمعالجة بيانات التسلسل.

    التثبيت البسيط عبر المكدس والاختراق

    يقوم هذا التثبيت بتثبيت أحدث إصدار تم اختراقه:

    1. تنزيل المكدس (https://docs.haskellstack.org/en/stable/README/#how-to-install).
    2. قم بتشغيل تسلسل تثبيت المكدس - الأدوات - حل ليلا. يجب أن يكون لديك الآن الملفات التنفيذية من هذه الحزمة تحت

    /.local/bin إلى PATH ، على سبيل المثال عن طريق الإضافة إلى ملف

    /.bash_profile the line PATH = $ PATH: $ HOME / .local / bin. تشغيل المصدر

    التثبيت من المصدر عبر المكدس

    1. تنزيل المكدس (https://docs.haskellstack.org/en/stable/README/#how-to-install).
    2. استنساخ هذا المستودع عبر git clone https://github.com/stschiff/sequenceTools.git
    3. التثبيت عن طريق cd SequenceTools stack install

    الأداة الرئيسية في هذا المستودع هي برنامج pileupCaller لأخذ عينات من الأليلات من بيانات تسلسل منخفضة التغطية. تتمثل الخطوة الأولى في إنشاء ملف "pileup" في جميع المواضع التي ترغب في تكوينها وراثيًا. للقيام بذلك ، إليك سطر أوامر نموذجي ، والذي يقيد التعيين والجودة الأساسية لـ 30:

    ملاحظة مهمة: يجب عليك بالتأكيد استخدام العلامة -B ، التي تعطل إعادة معايرة جودة المحاذاة الأساسية. يتم تشغيل هذه الآلية افتراضيًا وتتسبب في تحيز مرجعي ضخم مع تغطية منخفضة لبيانات الحمض النووي القديمة. هذا العلم يعطل الآلية.

    في سطر الأوامر أعلاه ، يجب أن يحتوي الملف "list_of_positions.txt" إما على مواضع (على أساس 0) أو ملف سرير (انظر دليل samtools للحصول على التفاصيل). الإخراج عبارة عن ملف نصي بسيط مع جميع المواضع التي يمكن التنميط الجيني في العينات الثلاث.

    بعد ذلك ، تحتاج إلى تشغيل أداة pileupCaller ، والتي تقوم بتشغيلها على النحو التالي:

    هنا ، خيارات --sampleNames تعطي أسماء العينات التي تم إخراجها في ملف Eigenstrat * .ind ، و-samplePopName اختياري أيضًا لإعطاء أسماء السكان في هذا الملف (الإعدادات الافتراضية إلى Unknown ، يمكنك أيضًا تغييرها لاحقًا في الإخراج). ثم ، (مطلوب) الخيار -f يحتاج إلى ملف مواقف Eigenstrat. هذا مطلوب لـ pileupCaller لمعرفة ما هو المرجع وأي الأليل البديل في مجموعة البيانات المرجعية التي تريد الاتصال بها. ملف مواقف Eigenstrat هو تنسيق ملف قائم على سطر ، حيث يشير كل سطر إلى موضع SNP ، وهناك ستة أعمدة مطلوبة بالضبط ، تشير بالترتيب 1) معرف SNP ، 2) الكروموسوم ، 3) الموضع الجيني (يمكن ضبطه على الصفر ) ، 4) الوضع المادي ، 5) الأليل المرجعي ، 6) الأليل البديل. هنا مثال:

    أخيرًا ، يحدد الخيار -e Eigenstrat كتنسيق إخراج ويعطي بادئة للملفات * .ind و * .pos و * .geno. بدون الخيار -e ، سيخرج pileupCaller بتنسيق FreqSum ، الموصوف هنا ، وهو مفيد لتصحيح أخطاء خط الأنابيب الخاص بك ، لأنه مجرد ملف واحد يتم إخراجه في الجهاز وبالتالي يمكن فحصه بسهولة.

    يمكنك أيضًا الحصول على بعض المساعدة عن طريق كتابة pileupCaller -h ، والذي يُظهر الكثير من الخيارات ، على سبيل المثال طريقة أخذ العينات والحد الأدنى من التغطية وخيارات مهمة أخرى.

    لاحظ أنه يمكنك أيضًا دمج الخطوتين أعلاه في أنبوب واحد يونيكس:

    ومع ذلك ، توجد مشكلة هنا: إذا قمت بمحاذاة بيانات القراءة الخاصة بك إلى إصدار من الجينوم المرجعي يستخدم chr1 و chr2 وما إلى ذلك كأسماء كروموسوم ، فسيكون ملف Eigenstrat الناتج صالحًا ، ولكن لن يتم دمجه مع مجموعات بيانات Eigenstrat الأخرى التي تستخدم أسماء الكروموسومات 1 و 2 وما إلى ذلك. لذلك أوصي بنزع الكروموسومات من أسماء الكروموسومات الخاصة بك إذا لزم الأمر. يمكنك القيام بذلك بسهولة باستخدام فلتر UNIX صغير باستخدام أداة sed.في خط الأنابيب الكامل ، يبدو كما يلي:

    أداة بسيطة لتحويل ملف VCF إلى ملف Eigenstrat. جميلة لا تحتاج إلى شرح. الرجاء تشغيل vcf2eigenstrat - help لإخراج بعض الوثائق.

    أداة بسيطة للحصول على بعض الإحصائيات الفردية من ملف Eigenstrat أو Freqsum. قم بتشغيل genoStats - help للتوثيق.

    تحتوي هذه الحزمة أيضًا على العديد من البرامج النصية المجمعة haskell لأوامر ADMIXTOOLS و EIGENSOFT التالية: convertf و mergeit و qp3Pop و qpDstat و smartPCA. تتطلب الأدوات الأصلية ملفات معلمات كمدخلات ، والتي أجدها مملة لاستخدامها في خطوط أنابيب المعلوماتية الحيوية. لقد كتبت هذه البرامج النصية المجمعة لأتمكن من بدء تشغيل الأدوات بواجهة خيارات سطر أوامر بسيطة.

    إذا كنت قد قمت بتثبيت نظام مكدس (انظر أعلاه) ، فيجب أن تكون قادرًا على تشغيل هذه البرامج النصية على جهازك دون أي إعداد صعب. ما عليك سوى استنساخ هذا المستودع ، والانتقال إلى المجلد الفرعي للبرامج النصية واستدعاء أي برنامج نصي باستخدام تنفيذ bash القياسي ، على سبيل المثال

    إذا بدأت هذا في المرة الأولى ، فقد يستغرق الأمر بعض الوقت ، نظرًا لأن المكدس يقوم بتنزيل جميع التبعيات وحتى مترجم البرنامج النصي لك ، ولكن بعد ذلك يجب أن يبدأ بشكل فوري. إذا كنت تريد استخدام البرامج النصية من مسارك ، أقترح وضع روابط رمزية في أي مجلد موجود بالفعل على طريقك (على سبيل المثال


    التكهن

    يمكن أن تساعدك مجموعات الدعم والمناصرة على التواصل مع المرضى والأسر الأخرى ، ويمكنهم تقديم خدمات قيمة. يطور الكثيرون المعلومات التي تركز على المريض وهم القوة الدافعة وراء البحث للحصول على علاجات أفضل وعلاجات ممكنة. يمكنهم توجيهك إلى البحث والموارد والخدمات. لدى العديد من المنظمات أيضًا خبراء يعملون كمستشارين طبيين أو يقدمون قوائم بالأطباء / العيادات. قم بزيارة موقع المجموعة على الويب أو اتصل بهم للتعرف على الخدمات التي يقدمونها. التضمين في هذه القائمة ليس مصادقة من قبل GARD.

    المنظمات الداعمة لهذا المرض


    فارسكان

    يتم ترميز VarScan في Java ، ويجب تنفيذه من سطر الأوامر (Terminal ، في Linux / UNIX / OSX ، أو موجه الأوامر في MS Windows). للاتصال البديل ، ستحتاج إلى ملف pileup. راجع قسم كيفية إنشاء ملف Pileup للحصول على التفاصيل. يؤدي تشغيل VarScan بدون وسيطات إلى طباعة معلومات الاستخدام. نظرًا لتغيير بعض الحقول اعتبارًا من VarScan v2.2.3 ، فإننا نقدم وثائق محدثة للإصدار الحالي. لتوثيق الإصدار 2.2.2 وما قبله ، انظر أدناه.

    وثائق VarScan (الإصدار 2.2.3 والإصدارات الأحدث)

    يستدعي هذا الأمر المتغيرات ويحدد حالتها الجسدية (Germline / LOH / Somatic) باستخدام ملفات pileup من زوج متطابق من الورم العادي. يمكنك أيضًا إعطائه ملف mpileup واحد مع البيانات العادية والورم. يشترك كلا التنسيقين للأمر في هذه الخيارات الشائعة: لاحظ أن الخيارات الأكثر تحديدًا (على سبيل المثال min-cover-normal) ستتجاوز القيمة الافتراضية أو المحددة للخيارات الأقل تحديدًا (على سبيل المثال الحد الأدنى للتغطية).

    ال النقاء الطبيعي والورم يجب أن تكون القيم بين 0 و 1. تشير القيمة الافتراضية (1) إلى أن المعدل الطبيعي نقي بنسبة 100٪ مع عدم وجود خلايا ورمية ملوثة ، وأن الورم نقي بنسبة 100٪ ولا يحتوي على انسجة ملوثة أو خلايا غير خبيثة أخرى. يمكنك تغيير نقاء الورم إلى شيء أقل من 1 إذا كان لديك عينة ورم منخفض النقاء ، وبالتالي تتوقع ترددات أليل متغيرة أقل للطفرات. يمكنك تغيير النقاء الطبيعي إلى شيء أقل من 1 فقط إذا كان من الممكن أن يكون هناك بعض محتوى الورم في العينة "العادية" ، على سبيل المثال الأنسجة الطبيعية المجاورة للورم الصلب ، وخلايا الدم الخبيثة في الجلد لكمة طبيعية لبعض الأورام السائلة ، إلخ.

    يوجد خياران للقيمة p. واحد (قيمة p) هو عتبة الأهمية لخوارزمية المرور الأول التي تحدد ، لكل موضع ، ما إذا كان الورم طبيعيًا أو متغيرًا في هذا الموضع. الثانية (قيمة جسدية- p) أكثر أهمية ، هذه هي العتبة التي تحتها تُعتبر فروق قراءة القراءة بين الورم والطبيعي كبيرة بما يكفي لتصنيف العينة على أنها طفرة جسدية أو حدث LOH. في حالة المتغير المشترك (السلالة الجرثومية) ، يتم استخدام هذه القيمة لتحديد ما إذا كان الدليل المشترك للورم والورم يختلف بشكل كبير عن الفرضية الصفرية (لا يوجد متغير بنفس التغطية) للإبلاغ عن المتغير. انظر استدعاء طفرة جسدية قسم للحصول على التفاصيل.

    ينفذ هذا الأمر عمليات مقارنة المجموعة على ملفين من المتغيرات.

    للحصول على معلومات مفصلة عن الاستخدام ، راجع VarScan JavaDoc.

    وثائق VarScan (الإصدار 2.2.2 وما قبله)

    ينفذ هذا الأمر عمليات مقارنة المجموعة على ملفين من المتغيرات.


    التغيير الهيكلي في بنية الكروموسومات

    الكروموسومات هي وسيلة نقل المواد أو الجينات الوراثية. يؤدي أي تغيير أو إضافة أو حذف لجزء كروموسومي إلى تغيير عدد أو موضع أو تسلسل الجينات في الكروموسوم.

    يشار إلى هذا التغيير في البنية على أنه انحرافات صبغية أو طفرات صبغية.

    تتضمن الانحرافات الصبغية نوعين من التغييرات:

    (ط) التغييرات في عدد الجينات في الكروموسوم

    (2) التغييرات التي تنطوي على ترتيب الجينات.

    (أ) التغييرات في عدد الجينات في الكروموسوم:

    (أنا) الحذف أو النقص:

    إنه بسبب فقدان جزء من الكروموسوم. يصبح الكروموسوم أقصر بسبب فقدان واحد أو أكثر من الجينات (الشكل 5.21).

    قد يحدث ازدواجية في الكروموسوم بسبب ارتباط جزء محذوف من كروموسوم آخر به. هذا يجلب إضافة بعض الجينات الجديدة التي لا تنتمي إليها.

    (ب) التغييرات في ترتيب الجينات في الكروموسوم:

    ينتج الانعكاس عندما يكون هناك فاصلان في الكروموسوم ويتحد الجزء المقسم بترتيب عكسي ، أي أن المقطع يدور بمقدار 180 درجة. على سبيل المثال ، إذا كان تسلسل الجينات في الكروموسوم الأصلي هو ABCDEFGH ، فقد يتغير إلى ADCBEFGH (الشكل 5.21). إذا كان المقطع المقلوب يشتمل على centromere ، فإن الانعكاس يسمى الانعكاس المحيطي إذا لم يشمل centromere ، يُطلق على الانعكاس اسم انعكاس متاخم.

    يتضمن النقل نقل جزء من الكروموسوم إلى جزء مختلف من نفس الكروموسوم أو إلى كروموسوم مختلف. في الحالة اللاحقة ، قد يحدث النقل بين الكروموسومات غير المتجانسة (الشكل 5.21). الانحرافات الصبغية الموصوفة أعلاه هي نتيجة الانقسام الانتصافي المعيب وتؤدي إلى تغيير تسلسل الجينات. قد تؤدي الجينات الموجودة في الموقع الجديد أو المتغير إلى تغيير تعبير النمط الظاهري أو قد يتسبب في وفاة الفرد.

    الاختلافات في عدد الكروموسوم (التغييرات العددية):

    عادة ما تكون الكائنات الحية ثنائية الصبغيات (2n) ، أي أنها تمتلك مجموعتين من الكروموسومات. يُطلق على الاختلاف في عدد الكروموسوم ثنائي الصبغة العادي اسم ploidy. يمكن أن يكون التغيير العددي في الكروموسوم أو الاختلافات في عدد الكروموسوم (heteroploidy) بشكل أساسي من نوعين ، وهما (i) اختلال الصيغة الصبغية و (ii) euploidy.

    (أ) اختلال الصيغة الصبغية:
    يتضمن إضافة أو حذف واحد أو عدد قليل من الكروموسومات إلى مجموعة الكروموسومات ثنائية الصبغيات المعتادة. تنشأ حالات اختلال الصيغة الصبغية بسبب فشل فصل الكروموسومات المتجانسة لزوج معين أثناء الانقسام الاختزالي. يُعرف باسم عدم الانفصال. ونتيجة لذلك ، يتم إنتاج نوعين من الأمشاج يحتوي نوع واحد على كروموسومات أكثر من العدد الطبيعي والنوع الآخر من الأمشاج يحتوي على صبغيات أقل.

    Aneuploids هي من الأنواع التالية:

    تنشأ عن فقدان كروموسوم واحد من مجموعة ثنائية الصبغيات ، أي 2n-l. يمكن أن تشكل نوعين من الأمشاج ، (ن) و (ن -1).

    تنشأ هذه عن طريق فقدان زوج معين من الكروموسومات ، أي 2n-2. تنشأ عن طريق اندماج نوعين (n-1) من الأمشاج.

    تنشأ هذه عن طريق إضافة كروموسوم إضافي إلى مجموعة ثنائية الصبغة الطبيعية مع الصيغة الجينية ، 2n + 1. يتشكل هؤلاء الأفراد من اتحاد مشيج (n + 1) مع مشيج طبيعي (n).

    تنشأ هذه عن طريق إضافة زوج إضافي من الكروموسوم إلى مجموعة ثنائية الصبغيات مع صيغة كروموسومية 2n + 2. وبهذا يتم تمثيل كروموسوم معين في أربع جرعات بدلاً من جرعتين عاديتين.

    عادةً ما يمتلك الكائن الحي مجموعتين من الكروموسومات ، أي أنها ثنائية الصبغيات (2n). في بعض الأحيان يكون هناك إضافة أو فقدان لمجموعة واحدة كاملة (ن) أو يتم ملاحظة أكثر من مجموعة واحدة من الكروموسومات. يطلق عليه اسم euploidy.

    يتكون Euploidy من الأنواع التالية:

    (ط) Hapioidy أو Monoploidy:

    من مجموعتين من الكروموسومات لكائن حي طبيعي عند فقدان مجموعة واحدة ، فإن النسل الناتج & # 8217s لديه مجموعة واحدة فقط من الكروموسومات (ن).

    الكائنات التي تحتوي على أكثر من مجموعتين طبيعيتين من الكروموسومات (2n) تسمى polyploids. الكائنات التي تحتوي على ثلاث مجموعات من الكروموسومات (2n + n) = 3n هي تلك التي تحتوي على أربع مجموعات من الكروموسومات (2n + 2n) = 4n هي رباعي الصبغيات وتلك التي تحتوي على خمس مجموعات (2n + 3n) = 5n وست مجموعات (2n + 4n) = 6n تُعرف باسم pentaploids و hexapioids على التوالي.

    توجد تعدد الصبغيات عمومًا بين النباتات ولكن نادرًا ما توجد بين الحيوانات. حوالي ثلث جميع الأعشاب متعددة الصبغيات ، والقمح الشائع هو سداسي الصبغيات (6n) ، وبعض الفراولة قوس ثماني الصبغيات (8n). فواكه ونباتات الزينة التجارية Vlany هي polyploids. يُعزى السبب الرئيسي في انخفاض معدل تكرار تعدد الصبغيات بين الحيوانات إلى توازنها الجنسي ، وهو أكثر حساسية من ذلك في النباتات.

    ومع ذلك ، فإن عددًا قليلاً من الحيوانات مثل الجمبري المالح ، وبعض الطفيليات ، ويرقة إبسولوتل والهامستر الذهبي تظهر أدلة على تعدد الصبغيات. في بعض الأحيان ، قد تكون بعض الأنسجة المتخصصة (مثل الكبد) داخل كائن ثنائي الصبغيات متعددة الصبغيات. يمكن تحفيز تعدد الصبغيات عن طريق معالجة الأنسجة الحية بمادة كيميائية (قلويد) تسمى الكولشيسين. المعالجة الحرارية في الذرة وقطع الرأس في تعدد الصبغيات المحرض في الطماطم.

    تعدد الصبغيات ينشأ بعدة طرق. قد ينشأ بسبب الانقسام غير الطبيعي. في بعض الأحيان يتم إنتاج الأبواغ والأمشاج ثنائية الصبغيات بسبب الانقسام النسيجي المعيب الذي لا يوجد فيه انخفاض في عدد الكروموسوم. تندمج هذه الأمشاج ثنائية الصبغيات لتكوين أفراد رباعي الصبغيات. تؤدي مشاركة أكثر من نواتين في الإخصاب في نسيج السويداء لنبات البذور إلى تعدد الصبغيات.

    هناك نوعان رئيسيان من polyploids وفقا لأصل الكروموسومات autopolyploid و allopolyploid. الصبغيات الأوتوماتيكية هي تلك الصبغيات المتعددة ، التي لها نفس المجموعة الأساسية من الكروموسومات مضروبة. على سبيل المثال ، إذا كان النوع ثنائي الصيغة الصبغية يحتوي على مجموعتين متشابهتين من الكروموسومات (AA) ، فإن الصيغة الصبغية الذاتية لها ثلاث مجموعات متشابهة (AAA) وستحتوي الصيغة الصبغية الذاتية على أربع مجموعات من هذا القبيل (AAAA).

    قد ينتج تعدد الصبغيات أيضًا من مضاعفة عدد الكروموسوم في F1 هجين مشتق من نوعين مختلفين بوضوح (متعدد الصبغيات). الأمثلة الشائعة على الصبغ الذاتي هي العشب الشائع & # 8216doob & # 8217 (Cynodon dactylon) وتلك الخاصة بـ allopolyploidy هي Raphanobrassica والقمح الشائع.

    أهمية تعدد الصبغيات:

    1. تحتوي النباتات متعددة الصيغ الصبغية بشكل عام على أزهار كبيرة وبذور وفواكه.

    2. تعمل تعدد الصبغيات كعملية محافظة وتثبت الهجينة بين الأنواع.

    3. تعدد الصبغيات يسهل التبادل الجيني بين الأنواع ذات الصلة البعيدة.


    مركز تعليم علوم الوراثة KEY

    الهدف: سيتصفح الطلاب موقع مركز تعلم علوم الوراثة للتعرف على الجينات الأساسية ، بما في ذلك بنية الحمض النووي والنسخ والترجمة والعلاقة بين الجينات والبروتينات والسمات.

    ما هو الحمض النووي؟

    2. ما الذي يرمز إليه الحمض النووي؟ ______ حمض النووي الريبي منقوص الأكسجين ____
    3. لماذا يسمى الحمض النووي مخططًا؟ ___ يشفر مجموعة من الخطط _ __
    4. يُطلق على & quot شكل السلم & quot لجزيء الحمض النووي اسم اللولب المزدوج
    5. قم بتسمية القواعد الأربعة الموجودة في جزيء الحمض النووي: ____ A ، C ، T ، G ___
    6. سلسلة DNA مكونة من __ أحرف _____________ والتي تشكل _____ كلمات __________ والتي تشكل الجمل.
    7. هذه & quotentences & quot تسمى _____ جينات ____

    ما هو الجين؟

    8. ما هو الجين؟ ______ كتيبات التعليمات ______
    9. تستخدم خلايا الدم بروتينًا يسمى ______ الهيموجلوبين ___________________ لالتقاط وحمل الأكسجين.
    10. عندما يتم تغيير الجين ، يقال أنه ___ _ مطور ____
    11. حدوث طفرة في جين الهيموجلوبين تسبب الاضطراب: _ الهيموفيليا _

    ما هو الكروموسوم؟

    12. إذا قمت بمد كل الحمض النووي من خلية واحدة ، فكم من الوقت ستكون ؟؟ ______ 3 أمتار __________
    13. كم عدد الكروموسومات في الخلية البشرية؟ __ 46_ __ بعوضة؟ _ 6 __ سمكة شبوط؟ __ 104 __

    ما هو البروتين؟

    14. كيف يكون البروتين مثل محرك السيارة؟ ___________ كل جزء له وظيفة __________
    15. بروتينات المستقبلات هي المسؤولة عن التقاط ___________ الإشارات ___________
    16. كل جين في الحمض النووي يشفر المعلومات حول كيفية صنع ____ بروتين __________
    17. مرة واحدة في السيتوبلازم ، ____ الريبوسومات ____________ تقرأ الرسالة.

    ما هي الوراثة؟

    18. إن انتقال السمات من الآباء إلى الطفل هو أساس _____ الوراثة ___________________
    19. يتلقى كل طفل ____ نصف ____ من كروموسوماته من أمه ونصفه من ____ أبيه ____
    20. عندما ينضم الحيوان المنوي والبويضة ، فإنهما يخلقان خلية واحدة تسمى ______ اللاقحة _____________________
    21. يرث كل طفل __ مجموعة فريدة (أو كاملة) ______________ من الكروموسومات.

    & quot ما هي السمة؟ & quot

    22. أعط مثالاً عن سمة جسدية: ______ لون الشعر ، لون العين ، الطول ، إلخ .. ___
    23. الكلب الذي يجلب عظم هو مثال على أي نوع من السمات؟ _________ السلوكي ______
    24. يصف العلماء مجموعة المعلومات لكل شكل من أشكال السمات على أنها __ أليل __________________
    25. ما هي الكلمة المستخدمة لوصف وجود اثنين من نفس الأليلات؟ ____ متماثل الزيجوت _______ ما هي الأحرف التي يمكن استخدامها لوصف شخص لديه إبهام المسافر؟ __ ح ح ____
    26. ما هي الأحرف التي يمكن استخدامها لوصف تركيبة متغايرة الزيجوت؟ ____ ح ح ___
    27. ما هي مجموعة الأليلات الممكنة في الطفل إذا كان الأبوان Hh و Hh (هناك أربعة)؟ _ hh، HH، Hh، Hh ___
    28. أعط مثالا على الهيمنة غير الكاملة: _______ قرنفل _____________

    & quot؛ قم ببناء جزيء DNA & quot ارجع إلى الصفحة الرئيسية وابحث عن هذا النشاط

    29. بناء جزيء DNA. ما هي قاعدة زوج القاعدة؟ _________ أزواج مع أزواج T و G مع C _____

    ارجع إلى الصفحة الرئيسية ، وانقر على & quotDNA to Protein & quot & quot & gt & quot

    30. تعريف النسخ: __________________ يجعل mRNA _____________________
    31. تعريف الترجمة: ______________ يجعل البروتين ___________________________________
    32. اتبع التعليمات الخاصة بالنشاط. ضع قائمة بتسلسل الأحماض الأمينية التي قمت بإنشائها. ___ التقى ، ليو ، آسيا والمحيط الهادئ ، phe

    & quotWhat Makes a Firefly Glow & quot (ارجع إلى & quotDNA to Protein & quot)

    33. توهج اليراعات لجذب ___ رفيق ________ ولتجنب _____ الحيوانات المفترسة ___________
    34. يرتبط بوليميراز الحمض النووي الريبي بالجين ____ لوك ______________.
    35. عند اكتمال النسخ ، ينتقل LUC mRNA إلى _____ السيتوبلازم ____________
    36. يفسر الريبوسوم mRNA لإنتاج سلسلة من الأحماض الأمينية _______ ________
    37. من أجل أن يصبح إنزيم لوسيفيراز فعالاً ، يجب أن تنحني السلسلة وتنطوي ________________________
    38. ترتبط الإنزيمات بـ _______ لوسيفرون ______________ لتوليد الضوء.

    /> هذا العمل مرخص بموجب ترخيص Creative Commons Attribution-NonCommercial 3.0 Unported License.


    كيف أحدث التدفق المستمر للبيانات ثورة في علم الأحياء

    تقول آن كوركوران: "هذا هو الوقت الذي أبدأ فيه الشعور بعمري". هي عالمة في معهد بابراهام ، وهو مركز أبحاث الأحياء البشرية في كامبريدج. يقود كوركوران مجموعة تبحث في كيفية ارتباط جينوماتنا - الحمض النووي الملتف في كل خلية في أجسامنا تقريبًا - بأنظمتنا المناعية ، وعلى وجه التحديد بالأجسام المضادة التي نصنعها للدفاع ضد العدوى.

    إنها ، على حد تعبيرها ، "عالمة أحياء من المدرسة القديمة" ، نشأت على مهارات الماصات وأطباق بتري والنظارات الواقية ، وعلم التجارب مع الأواني الزجاجية على المقاعد - ما يُعرف باسم "المختبر الرطب". "كنت أعرف شكل الجين على مادة هلامية" ، كما تقول وهي تفكر في بداية حياتها المهنية.

    هذه الأيام مجموعة المهارات هذه ليست كافية. يقول كوركوران: "عندما بدأت في توظيف طلاب الدكتوراه قبل 15 عامًا ، كانوا معملًا مبتلًا بالكامل". "الآن عندما نقوم بتجنيدهم ، فإن أول شيء نبحث عنه هو ما إذا كان بإمكانهم التعامل مع تحليل المعلومات الحيوية المعقدة." لكي تكون عالم أحياء ، في الوقت الحاضر ، يجب أن تكون خبيرًا في الإحصاء ، أو حتى مبرمجًا. يجب أن تكون قادرًا على العمل مع الخوارزميات.

    موصى به

    الخوارزمية ، في الأساس ، هي مجموعة من التعليمات - سلسلة من الخطوات المحددة مسبقًا. يمكن النظر إلى الوصفة على أنها خوارزمية ، على الرغم من أن أحد الأمثلة الأكثر وضوحًا هو برنامج كمبيوتر. تأخذ مدخلاتك (مكونات ، أرقام ، أو أي شيء) ، وتديرها من خلال خطوات الخوارزمية - والتي يمكن أن تكون بسيطة مثل "إضافة واحد إلى كل رقم" ، أو معقدة مثل خوارزمية بحث Google - وتوفر مخرجات: كعكة أو نتائج البحث أو ربما جدول بيانات Excel.

    يحتاج الباحثون مثل كوركوران إلى استخدام الخوارزميات لأنه في 17 عامًا منذ أن أصبحت قائدة مجموعة ، تغير علم الأحياء. والشيء الذي غيره هو التدفق الواسع - الهائل بشكل مذهل - من البيانات الناتجة عن التقنيات الطبية الحيوية الجديدة ، وخاصة تسلسل الجيل التالي.

    منذ وقت ليس ببعيد ، كان ترتيب تسلسل الجينوم بأكمله - تحديد ترتيب كل 3 مليارات زوج من أحرف الحمض النووي في الحلزون - يستغرق سنوات. استغرق مشروع الجينوم البشري ، وهو أول تسلسل مكتمل لجينوم بشري كامل ، حوالي 13 عامًا من الحمل حتى اكتماله في عام 2003 ، وكلف أكثر من ملياري جنيه إسترليني. اليوم ، يمكن لتسلسل الجيل التالي أن يفعل الشيء نفسه في غضون 24 ساعة مقابل ما لا يزيد عن ألف رطل.

    لقد غير هذا تمامًا طريقة عمل العلماء. لا يقتصر الأمر على أنهم يتسخون أيديهم في كثير من الأحيان ، ولا ببساطة أن المهارات المطلوبة قد تغيرت. الأمر هو أن العملية العلمية برمتها - كيف تأتي بفكرة ما وتختبرها - قد انقلبت رأساً على عقب.

    وقد ترك هذا الكثير من كبار العلماء بحاجة إلى فهم التقنيات التي لم تكن موجودة عند التدريب والإشراف عليها. لقد تركت الجامعات تلعب دور اللحاق بالركب ، مع عدم تدريس العديد من الدرجات المهارات التي يحتاجها علماء الأحياء الحديثون. ولكن قبل كل شيء ، أدى ذلك إلى اكتشافات علمية رائدة - اختراقات لم تكن لتتحقق قبل 20 أو حتى 10 سنوات.

    على بعد 10 دقائق بالسيارة من بابراهام ، في قرية تسمى هينكستون ، يوجد مركز رئيسي آخر لعلوم الحياة ، وهو معهد ويلكوم سانجر. تأسست منذ 25 عامًا ، وتاريخ الجينوم سريع الحركة مكتوب في هندسته المعمارية ذاتها.

    يقول موريتز جيرستونج ، وهو الآن قائد مجموعة بحثية في المعهد الأوروبي للمعلوماتية الحيوية المجاور: "لقد أتممت بحثي لما بعد الدكتوراة في سانجر".يضحك في الذاكرة. "يمكنك أن تشعر تقريبًا عندما تم تصميم المبنى" ، كما يقول. "هناك مساحة كبيرة للعمل المخبري ، وليس هناك مساحة كبيرة يمكن للعلماء الجلوس فيها وتحليل البيانات على جهاز كمبيوتر."

    هذا صحيح في كل مكان ، كما يقول جيل ماكفين ، أستاذ علم الوراثة الإحصائي في معهد البيانات الضخمة بجامعة أكسفورد. أصبح البحث الجينومي شيئًا يتم إجراؤه بشكل أساسي على جهاز كمبيوتر محمول ، وليس على طاولة عمل. يقول: "إذا نظرت إلى أي مختبر أبحاث يبلغ من العمر 15 عامًا ، فستجد أنه مختبر مبلل بنسبة 90 في المائة". "وإذا ذهبت إلى واحدة ، فكل الناس تقريبًا يجلسون على أجهزة الكمبيوتر. إذا كنت ستبني مركزًا للأبحاث الطبية الحيوية اليوم ، فستبني مختبرًا رطبًا بنسبة 10 في المائة و 90 في المائة من الحوسبة ".

    لكن هذا ليس التغيير الوحيد. يقول ماكفين: "كان أحد التغييرات الكبيرة في العلوم هو الابتعاد عن نهج شديد التركيز ، ومستهدف ، وقائم على الفرضيات ، و" لقد حصلت على هذه الفكرة ، وصممت التجربة ، وأجريت التجربة ، وأقرر ما إذا كنت "نموذجًا" على صواب أم خطأ.

    كان من المعتاد أن يكون لديك فكرة معقولة عن سبب قيام الجين بشيء ما - يمكنك تخيل مسار كيميائي حيوي يبدو معقولًا والذي يمكن أن يربط الجين بمرض أو سمة. الوقت المستغرق لتسلسل الجينات وقوة الحوسبة المحدودة المتاحة يعني أنه يجب عليك التأكد تمامًا من أنك ستعثر على شيء ما قبل أن تخصص كل هذا الوقت الباهظ في المختبر والتحليل.

    الآن تقوم فقط بجمع الكثير من البيانات وترك البيانات تقرر ما يجب أن تكون عليه الفرضية ، كما يقول ماكفين. إذا نظرت إلى 10000 جينوم لأشخاص مصابين بمرض و 10000 جينوم بدونه ، يمكنك استخدام خوارزمية للمقارنة بينهم ، والعثور على الاختلافات ، ثم تحديد الجينات المرتبطة بالمرض ، دون الحاجة إلى التفكير مسبقًا في أي منها قد يكون لديهم. يكون.

    يُعرف هذا النهج بدراسة الارتباط على مستوى الجينوم ، وهو شكل شائع من التحليل في عصر البيانات المدفوعة. إنها فكرة بسيطة إلى حد ما. تأخذ الجينومات لعدد كبير من الناس ، وتسلسلها ، ثم تستخدم خوارزمية لمقارنة كل الحمض النووي - ليس فقط 24000 أو نحو ذلك من الجينات ، والتي تشكل 1-2 في المائة فقط من الجينوم ، ولكن أيضًا الكل من الحمض النووي غير المشفر الذي لا يزال غامضًا إلى حد ما أيضًا. يمكن أن تكون الخوارزمية بسيطة للغاية: على سبيل المثال ، مقارنة عدد المرات التي يظهر فيها متغير DNA معين في الأشخاص الذين لديهم سمة أو حالة معينة والأشخاص الذين لا يمتلكونها. إذا ظهر المتغير جنبًا إلى جنب مع سمة أو حالة أكثر بكثير مما كنت تتوقعه بالصدفة ، فإن الخوارزمية تضع علامة عليها كسبب محتمل.

    حيث يصبح الأمر صعبًا هو أن الأمراض كلها تقريبًا معقدة ، وتحتوي على عشرات أو أحيانًا مئات الجينات أو أقسام من الحمض النووي غير المشفر. يؤدي هذا سريعًا إلى الحاجة إلى تحليل متعدد الأبعاد معقد ، وعلى الرغم من أن الرياضيات المستخدمة ليست جديدة ، فإن الحجم الهائل للمهمة يعني أن الخوارزميات ضرورية. في كثير من الأحيان يمكنهم مقارنة عشرات أو مئات من المعلمات في وقت واحد.

    إنها تشبه إلى حد ما خوارزمية بحث Google. العملية التي تستخدمها لتصنيف كل صفحة ويب ليست بهذه التعقيد - على سبيل المثال ، قياس مدى تكرار ظهور مصطلحات البحث الخاصة بك على الصفحة ، ثم مكان ظهورها على الصفحة ، ثم عدد الروابط التي تؤدي إلى تلك الصفحة ، وما إلى ذلك. . لكنه يجمع بين المئات من هذه الإجراءات ويطبقها على بلايين من صفحات الويب في وقت واحد. سيكون من المستحيل على الإنسان أن يفعل.

    حقق النهج الحسابي مكاسب كبيرة. ربما كان مجال جيرستونج ، علم جينوم السرطان ، أكثر التطورات إثارة ، على سبيل المثال فيما يتعلق بسرطان الدم.

    يمكن علاج هذا المرض المدمر والقاتل في كثير من الأحيان - في بعض الحالات - بنجاح من خلال زرع نخاع العظم الكامل. لكن هذا إجراء كبير يمكن أن تكون مضاعفاته قاتلة في بعض الأحيان. أنت تريد فقط إعطائه للمرضى الذين يعانون من أكثر أشكال اللوكيميا فتكًا.

    ومع ذلك ، فإن التنبؤ بأمراض اللوكيميا التي ستكون الأكثر فتكًا هو أمر صعب للغاية. الأعراض معقدة ولا تخبرك دائمًا بشكل كافٍ عن التكهن.

    لذا فإن ما فعله فريق غيرستونغ هو تسلسل جينومات 1500 شخص من السرطان للعثور على طفرات الحمض النووي التي تقودهم ، ثم معرفة الطفرات المرتبطة بالنتائج. كان هناك 5000 طفرة مختلفة بين المرضى ، وحوالي 1000 مجموعة مختلفة ، والتي قسمها الفريق إلى 11 فئة ذات مخاطر أكبر أو أقل. يقول غيرستونج: "إنها تمكن الأطباء من اتخاذ قرارات أكثر تركيزًا".

    يمتد تأثير النهج المستند إلى البيانات إلى أبعد من ذلك بكثير. يقول إيد جيمس ، أستاذ علم المناعة السرطاني في جامعة ساوثهامبتون ، إن تحديد تسلسل جينومات الأورام قد تسبب في "تغيير العقل" في نهجنا تجاه السرطان بشكل عام. "نحن الآن نقدر كثيرًا أن السرطان ليس مجرد كتلة من الخلايا المنسوخة."

    1/20 أخبار العلم بالصور

    أخبار العلوم في صور

    بلوتو لديه & # x27 قلب ينبض & # x27 من النيتروجين المجمد

    أخبار العلوم في صور

    اكتشف أكثر من 400 نوع هذا العام من قبل متحف التاريخ الطبيعي

    أخبار العلوم في صور

    يمكن لـ Jackdaws تحديد & # x27dangerous & # x27 البشر

    أخبار العلوم في صور

    تؤثر أجنة السلحفاة على الجنس عن طريق الاهتزاز

    أخبار العلوم في صور

    تنخفض معدلات الصيد الجائر للأفيال في إفريقيا

    أخبار العلوم في صور

    اكتشاف حوت قديم رباعي الأرجل في بيرو

    أخبار العلوم في صور

    اكتشف حيوان ذو فتحة شرجية عابرة

    أخبار العلوم في صور

    رصدت نحلة عملاقة

    أخبار العلوم في صور

    تم العثور على أنواع جديدة من الثدييات داخل التمساح

    متحف نيو مكسيكو للتاريخ الطبيعي

    أخبار العلوم في صور

    نسيج يتغير حسب درجة الحرارة التي تم إنشاؤها

    فاي ليفين ، جامعة ماريلاند

    أخبار العلوم في صور

    يمكن استخدام دموع الفئران الصغيرة في مكافحة الآفات

    أخبار العلوم في صور

    تحذير نهائي للحد من كارثة المناخ & quot

    أخبار العلوم في صور

    جائزة نوبل للكيميائيين التطوريين

    أخبار العلوم في صور

    جائزة نوبل لعلماء فيزياء الليزر

    أخبار العلوم في صور

    اكتشاف نوع جديد من الديناصورات

    أخبار العلوم في صور

    ولادة كوكب

    أخبار العلوم في صور

    تم اكتشاف عضو بشري جديد كان قد فاته العلماء في السابق

    أخبار العلوم في صور

    يقول علماء الآثار إن مجتمعًا غير معروف سابقًا عاش في غابات الأمازون المطيرة قبل وصول الأوروبيين

    أخبار العلوم في صور

    وجدت الدراسة أن واحداً من كل 10 أشخاص لديه آثار من الكوكايين أو الهيروين على بصمات أصابعه

    أخبار العلوم في صور

    ناسا تنشر صورا مذهلة لكوكب المشتري و # x27s بقعة حمراء كبيرة

    قد يحتوي سرطان واحد على عشرات الأنواع المختلفة من الخلايا ، ولكل منها توليفات مختلفة من طفرات الحمض النووي وكل منها عرضة لأدوية مختلفة. لذا فإن التسلسل يسمح للأطباء بتوجيه الأدوية بشكل أفضل إلى المرضى - والأورام - التي سيعملون عليها. يقول جيمس: "في السابق ، كان الناس يُعاملون كأفراد من السكان:" X في المائة من الأشخاص الذين خضعوا لهذا العلاج سيكونون جيدًا ". "ولكن باستخدام هذه المعلومات ، يمكنك فهم ما إذا كانوا سيحصلون [بشكل فردي] على الفائدة."

    بالإضافة إلى اكتشاف الاختلافات ، كشف التسلسل الجيني عن أوجه تشابه غير متوقعة بين السرطانات أيضًا. تاريخيًا ، كما يقول جيمس ، حددنا السرطانات من خلال موقعها التشريحي: مثل سرطانات الرئة وسرطان الكبد وسرطان الرأس والرقبة وما إلى ذلك. "ولكن باستخدام تسلسل الجيل التالي ، يمكنك أن ترى أن هناك سرطانات في مواقع مختلفة تشترك مع بعضها البعض أكثر من السرطانات في نفس الموقع. لقد جعلنا ندرك أن بعض الأدوية التي تعمل من أجل سرطان الثدي ، على سبيل المثال ، قد تعمل على أدوية أخرى ، "كما يقول.

    يدعم Gerstung هذا الأمر: "من منظور وراثي ، هناك تداخل كبير بين السرطانات من مواقع تشريحية مختلفة. حتى أن المرء يجد BRCA1 [جين متورط بشدة في سرطان الثدي] في بعض سرطانات البروستاتا. "

    سيصبح هذا مهمًا بشكل متزايد. رخصت إدارة الغذاء والدواء الأمريكية مؤخرًا عقارًا للسرطان - بيمبروليزوماب - لاستخدامه في أي سرطان يظهر عليه علامات نقص إصلاح عدم التطابق ، وهو شكل من أشكال خطأ إصلاح الحمض النووي. هذه هي بداية ترخيص الأدوية على أساس جينات السرطان بدلاً من الموقع.

    وكل ذلك بسبب التدفق المستمر والمتدفق للبيانات.

    تقول نيكول ويلر ، عالمة البيانات في معهد سانجر والتي تنظر في جينومات البكتيريا المسببة للأمراض ، "لقد أصبحنا جيدًا في إنتاج البيانات ، لدرجة أننا انتهينا بالكثير منها". يوافق ماكفين. يقول: "في قانون مور ، قوة الحوسبة لديك تتضاعف كل 18 شهرًا". "إن نمو التقاط البيانات الطبية الحيوية - من خلال تسلسل الجينوم ، ولكن أيضًا من خلال التصوير الطبي أو علم الأمراض الرقمي - هو أسرع بكثير من ذلك. نحن قانون سوبر مور في البيانات الطبية الحيوية ".

    أصبح من المستحيل تمامًا ، في السنوات الأولى من هذا القرن ، على علماء الأحياء التحقق من بياناتهم بأنفسهم. وهذا يعني أنه كان على علماء الأحياء أن يجندوا ، أو يصبحوا علماء بيانات.

    تقول آن كوركوران: "لقد وصلنا إلى عنق الزجاجة قبل بضع سنوات". "كان لدينا الكثير من البيانات ، لكننا لم نعرف ماذا نفعل بها. لذلك كان لابد من اختراع الخوارزميات بسرعة ، للتعامل مع البيانات وتعظيمها ". "عندما تنظر إلى جينات مفردة ، أو قليلة ، يمكنك القيام بذلك يدويًا ، ولكن عندما تنظر إلى تعبير 20 ألف جين ، لا يمكنك حتى إجراء الإحصائيات بنفسك."

    كان على علماء الأحياء - الذين نشأ العديد منهم ، كما فعل كوركوران ، ويعملون على مقاعد بأواني زجاجية ، وليس مكاتب وأجهزة كمبيوتر محمولة - أن يتعلموا استخدام هذه الخوارزميات. وتقول: "أعتقد أن كبار العلماء غالبًا ما يخافون من ذلك ، ويعتمدون على زملائهم الصغار أكثر مما ينبغي ، أو يرغبون في الاعتراف بذلك."

    لقد طورت "معرفة عملية" لكيفية عمل هذه الخوارزميات ، لكنها تعترف بأنها "فترة ضعيفة إلى حد ما ، حيث لا يمتلك الأشخاص في القمة المهارات اللازمة للتحقق من عمل الأشخاص الموجودين تحتهم".

    يوافق وولف ريك ، أحد زملاء كوركوران في معهد بابراهام ، والذي يدير فريقًا بحثيًا يبحث في علم التخلق. يقول إن العلماء الأكبر سنًا لديهم عقلية مختلفة تمامًا. "إنه أمر مضحك للغاية - يفكر طاقم العمل في اجتماعات المعمل فيما يتعلق بما يفعله الجينوم ككل. لكني أفكر في الجينات المنفردة وأعمم منها - هكذا تعلمت أن أفكر ".

    يقول إنه من المهم للأشخاص في منصبه أن يفهموا عمل العلماء المبتدئين ، و "الأهم من ذلك أن يطوروا حدسًا حول كيفية استخدام الأدوات ، لأنني في النهاية أضع اسمي في العمل".

    من ناحية أخرى ، نشأ العلماء الأصغر سنًا مع البيانات. جاء بعضهم من تلك الخلفية - حصل غيرستونغ على درجة جامعية في الفيزياء - على الرغم من أن هذا ينطبق على بعض قادة المجموعات أيضًا ، مثل ماكفين. لكن الآخرين الذين جاءوا من خلال طريق أكثر بيولوجية انتهى بهم الأمر إلى التحدث من حيث الترميز. يقول نا كاي ، باحث ما بعد الدكتوراه في معهد سانجر الذي يدرس كيفية ارتباط الأنماط الجينية بسمات بشرية مختلفة: "لقد درست علم الأحياء بصفتي طالبًا جامعيًا ، وهذا هو نطاق معرفتي".

    "الآن أقوم بتحليل إحصائي كل يوم. كان الأمر أشبه بتعلم لغة أخرى أو عدة لغات ". "اضطررت إلى تحويل عقلي من التفكير فيما يتعلق بالمسارات الكيميائية الحيوية والمخططات الانسيابية إلى نوع أكثر تنظيماً من التفكير من حيث الكود."

    وتقول إن كبار العلماء الذين تعمل معهم "كانوا جيدين جدًا في مواكبة آخر التطورات". "قد لا يكونون قادرين على كتابة الكود ، لكنهم يفهمون ما يفعله التحليل."

    ويلر ، زميل كاي ، جاء أيضًا عبر مسار علم الأحياء وانتهى به الأمر في الترميز. تقول: "ليس لدي خلفية تقليدية في هندسة البرمجيات". "تعلمت البرمجة على الجانب أثناء الدكتوراه. [ترميزي] ليس هو الأكثر كفاءة أو بريقًا ، ولكنه يتعلق برؤية ما عليك القيام به من الناحية الحسابية وتحقيقه ".

    استجابة لهذه الاحتياجات ، تغيرت درجات البكالوريوس في السنوات القليلة الماضية. جامعة نيوكاسل ، على سبيل المثال ، لديها الآن وحدة معلوماتية حيوية في مقررها الجامعي في علم الأحياء ، ومشروعات ريدينج البحثية للسنة النهائية تتضمن علم الأحياء الحسابي ، على الرغم من أن وحدات الحوسبة الاختيارية السابقة لها إقبال منخفض ، لذا فإن الطلاب في سنتهم الأخيرة يتعلمون مهارات اللحظة الأخيرة. تخطط إمبريال كوليدج لندن ، التي لديها بالفعل دورات في المعلوماتية الحيوية ، لإضافة البرمجة للسنتين الأولى والثانية. يقول ويلر: "أعتقد أن هناك اعترافًا بأن علم الأحياء يتضمن بيانات أكثر مما اعتدنا عليه ، لذلك يحتاج الناس إلى امتلاك المهارات اللازمة لمعالجتها".

    لكن التغيير بطيء ، وأحيانًا يعارضه الطلاب ، ولم يدخل جميعهم في علم الأحياء للترميز. يقول كوركوران: "أود أن أقول إن بعض دورات الطلاب الجامعيين تلحق بالركب". "ولكن بشكل عام لم يفعلوا ذلك ، كما يتضح من انتشار دورات الماجستير بعد الدرجة التي تدرس هذه المهارات."

    التغيير ضروري ، رغم ذلك. حتى أكثر العلماء توجهاً نحو المختبر الرطب الذين تمت مقابلتهم قالوا إنهم يقضون أقل من 50 في المائة من وقتهم في إجراء التجارب ، قال البعض إنها كانت أقل من 10 في المائة أو حتى ، في حالة كاي ، لا شيء على الإطلاق منذ أن أصبحت كاملة- عالم المعلومات البيولوجية الوقت.

    يقول ويلر إن التحول نحو الاعتماد على البيانات يمكن أن يُنظر إليه على أنه انتقال من العلم الذي يقوم على اختبار الفرضيات إلى العلم الذي ينتج الفرضية. أحد العلماء ، الذي فضل عدم الإفصاح عن اسمه ، قلق من أن ذلك قد قلل من الإبداع في العلوم ، ولكن وفقًا لويلر ، فإن هذا ليس هو الحال. تقول: "لقد حركت الإبداع. "من بعض النواحي ، هناك مجال أكبر للإبداع. يمكنك حقًا تجربة بعض الأفكار المجنونة بتكلفة منخفضة نسبيًا ".

    هذا له مزايا أخرى. يقول مات باون ، عالم المعلوماتية الحيوية في معهد إيرلهام ، وهو مركز لأبحاث البيولوجيا الحاسوبية في نورفولك: "يمكنك أن تصبح مرتبطًا بالفرضيات". "من الأفضل أن تكون مراقبًا نزيهًا بدون أي أفكار مسبقة ، وأن تنظر إلى اللوحة الفارغة وتترك الصورة تظهر."

    لكن الفائدة الأكبر هي أن الدراسات التي تعتمد على البيانات تقدم نتائج جديدة رائعة طوال الوقت ، في مناطق معقدة كان من المستحيل دراستها سابقًا.

    يدرس ستيفان شونفيلدر ، وهو باحث آخر في معهد بابراهام ، الأشكال ثلاثية الأبعاد للكروموسومات وكيفية تأثيرها على التعبير الجيني. عندما تم الانتهاء من مشروع الجينوم البشري ، تم اكتشاف أن عدد الجينات أقل بكثير مما كان متوقعًا في السابق - حوالي 24000 ، أي ما يقرب من ربع ما اعتقد العلماء أنه الحد الأدنى. لم يقم باقي الحمض النووي بتشفير البروتينات على الإطلاق.

    ما تم إدراكه منذ ذلك الحين هو أن جزءًا مما تفعله تلك المناطق غير المشفرة هو تنظيم التعبير عن الجينات: تقوم بتشغيلها في بعض الخلايا ، وإيقافها في خلايا أخرى. وجزء من كيفية القيام بذلك هو عن طريق طي أنفسهم في أشكال مختلفة في خلايا مختلفة.

    عادة ما يتم تصوير الكروموسومات على شكل X. ولكن هذا يحدث فقط عندما تنقسم الخلية. في بقية الوقت ، يتم لف مترين من الحمض النووي داخل كل خلية تقريبًا في شكل متشابك معقد. لذا ، يمكن تحديد موقع طول الحمض النووي على مسافة شاسعة بعيدًا عن الجين الموجود على الكروموسوم ، ولكن لا يزال بإمكانه تنظيمه لأنه عمليًا ، لهما اتصال جسدي وثيق ، كما يقول شونفيلدر. "لهذا السبب من المهم دراسة هذا في سياق ثلاثي الأبعاد: إذا نظرت فقط إلى التسلسلات وافترضت أنها ستنظم الجين المجاور ، فهذا غالبًا غير صحيح.

    علاوة على ذلك ، فإن الجينومات تطوي بشكل مختلف تمامًا ، كما يقول شونفيلدر. "نفس الجينوم في الخلية التائية سيكون له شكل مختلف في خلية الكبد أو في خلية دماغية ، وهذا مرتبط بجينات مختلفة يتم التعبير عنها وتكتسب الخلايا وظائف مختلفة."

    يعد عمل الشكل ثلاثي الأبعاد في كل سياق أمرًا صعبًا للغاية. إنه ينطوي على تسلسل أنواع الخلايا ورؤية كيف تختلف عن أنواع الخلايا الأخرى ، وكذلك أي بتات من الحمض النووي تتفاعل في هذا السياق. لكن يجب معالجة الحمض النووي أولاً باستخدام تقنية معقدة تُعرف باسم الربط المتقاطع والربط للسماح للتسلسل برؤية البتات القريبة من بعضها البعض. إذا تم العثور على نقطتين بعيدتين معًا ، فربما تم طيهما بهذه الطريقة حتى تؤثر إحداهما على الأخرى. ولكن - في كثير من الأحيان - إنها مجرد نتاج اهتزاز عشوائي.

    يتطلب العثور على الارتباطات الحقيقية بين الضوضاء النظر إلى مليارات نقاط البيانات ومعرفة الروابط التي تستمر في الظهور أكثر قليلاً من غيرها. عندها تدخل الخوارزميات حيز التنفيذ حقًا. بمجرد معرفة أجزاء الكروموسوم التي تكون على اتصال منتظم مع البتات الأخرى ، يمكنك استخدام خوارزميات أخرى لإنشاء نماذج ثلاثية الأبعاد بناءً على نقاط الاتصال هذه.

    يقول شونفيلدر: "يبلغ عمر هذا الحقل بالكامل حوالي 15 عامًا فقط". قبل ذلك ، قال ، "لم أفكر في شكل الجينوم على الإطلاق ، لقد فكرت فيه فقط على أنه كرة من السباغيتي محطمة في النواة. اعتقدت أنها كانت مجرد مشكلة لوجستية ، حشوها في نواة ربما يبلغ عرضها 5 ميكرون.

    "ما أذهلني هو المستوى الجيد للتنظيم الموجود ، على الرغم من الضغط الشديد ، والذي لا يزال يسمح بهذا الضبط الدقيق." ستكون الأشكال ثلاثية الأبعاد للكروموسومات ، والعناصر التنظيمية التي تتفاعل مع الجينات الموجودة على هذا الشكل ، جزءًا كبيرًا من قصة كيفية ظهور 200 نوع من الخلايا في جسم الإنسان.

    وفي الوقت نفسه ، يقول ماكفين إن الأبحاث الجينومية أجبرت الأطباء على إعادة تصنيف مرض التصلب المتعدد تمامًا. يقول: "لقد وجدنا أكثر من 250 بتًا من الجينوم الذي يضيء من حيث خطر الإصابة بالمرض". "هذا دعونا نقدم تصريحات قوية للغاية حول المخاطر التي يتعرض لها الفرد. ولكنه سمح لنا أيضًا برؤية التداخل مع أمراض مثل التهاب المفاصل الروماتويدي: فبعض الجينات التي تزيد من خطر إصابتك بمرض التصلب العصبي المتعدد تقلل من خطر الإصابة بالتهاب المفاصل.

    يقول ماكفين: "لقد علمنا أنه أحد أمراض المناعة الذاتية ، على الرغم من أنه يمثل مرضًا تنكسيًا عصبيًا". "هناك أربع أو خمس شركات لديها برامج علاجية جديدة تخرج من هذا."

    وولف ريك من معهد بابراهام لديه قصة مثيرة تكاد تكون خيال علمي يرويها.يدور عمله في مجال علم التخلق ، حيث يبحث في كيفية تأثير البيئة الكيميائية للخلية على التعبير عن الجينات التي يقوم بتسلسل الحمض النووي الريبي (RNA) ، وهو جزيء الرسول الذي يسمح بقراءة الحمض النووي وتصنيع البروتينات ، لمعرفة كيف يختلف من خلية إلى أخرى. مجموعته مهتمة بشكل خاص بالشيخوخة.

    قبل خمس سنوات ، تم اكتشاف - وأكد عمل ريك منذ ذلك الحين - أن هناك ساعة شيخوخة في جميع خلايانا. إنها تسمى مثيلة الحمض النووي. هناك أربعة أحرف في أبجدية الحمض النووي: C (السيتوزين) ، A (الأدينين) ، G (الجوانين) و T (الثايمين). مع تقدمنا ​​في السن ، يكتسب المزيد والمزيد من Cs الموجودة على الحمض النووي لدينا علامة كيميائية صغيرة تسمى مجموعة الميثيل. لقراءة هذه الساعة ، فإن العمل بسيط - فقط عد مجموعات الميثيل لأعلى - ولكن ، مرة أخرى ، فإن العدد الهائل من نقاط البيانات التي تم إرجاعها ضخم جدًا لدرجة أنه يجب أن يتم احتسابها بواسطة الخوارزمية.

    يقول ريك: "بقراءة تلك الساعة ، يمكننا توقع عمرك وعمري في غضون ثلاث سنوات". "وهو دقيق بشكل مدهش: أكثر المؤشرات الحيوية دقة للشيخوخة التي لدينا."

    كل ذلك مثير جدًا للاهتمام بالطبع: إنه "إما قراءة لعملية الشيخوخة الأساسية ، أو متوسط ​​العمر المتوقع المبرمج لدينا". لكن ريك يقول إن المعنى الضمني هو أنه يمكننا مقاطعته: "أنا متأكد من أنه ستكون هناك أدوية وجزيئات صغيرة يمكنها إبطاء ساعة الشيخوخة هذه.

    قد يكون الأمل في أن البيانات الضخمة ستساعدنا جميعًا على العيش إلى الأبد. لكن كل عالم تحدثت إليه اتفق على أن ظهور الأبحاث الجينومية التي تعتمد على الخوارزميات والتي تعتمد على البيانات بشكل مكثف قد غيرت علوم الحياة. لقد ترك كبار العلماء في بعض الأحيان غير متأكدين مما يفعله زملائهم الصغار ، وترك مراكز الأبحاث الحديثة مع الكثير من المختبرات وعدم وجود مساحة كافية لجهاز كمبيوتر محمول. يقول شونفيلدر إن وتيرة التغيير يمكن أن تكون "مربكة".

    موصى به

    يقول: "الحياة أكثر تعقيدًا بكثير الآن". "مجموعة المهارات التي حصلت عليها عندما حصلت على الدكتوراه ، قبل 13 عامًا فقط ، ليست كافية على الإطلاق لمواكبة العلم اليوم." لكن هذا التغيير أعاد التفاؤل إلى الأبحاث الجينية. عندما أوشك مشروع الجينوم البشري على الانتهاء ، كان الناس متحمسين ، معتقدين أن العديد من الأمراض ستنخفض بسرعة عندما يتم الكشف عن مكوناتها الجينية. لكن تبين أن معظمها معقد ، ومتعدد الجينات ، ويستحيل فهمه من خلال النظر إلى جينات مفردة. الآن ، على الرغم من ذلك ، من الممكن النظر إلى تلك الأمراض من خلال قوة تسلسل الجيل التالي والأدوات التي يمكنها غربلة البيانات التي توفرها.

    يقول شونفيلدر: "الآن عندما أجري تجربة ، أحصل على 100 مليون و 200 مليون نقطة بيانات". "لم أكن أعتقد أن هذا كان ممكنًا في حياتي ، لكن هذا حدث على مدار بضع سنوات. يمكننا معالجة الأسئلة التي كانت محظورة تمامًا منذ 10 سنوات. لقد كانت ثورة غير عادية ".

    أسس Wellcome ، ناشر Mosaic ، معهد Wellcome Sanger في عام 1993 وقام بتمويله منذ ذلك الحين

    يتلقى Gil McVean حاليًا تمويلًا من Wellcome من خلال جائزة الباحث. يشارك Wolf Reik في تعاون موارد معهد Sanger الممول من Wellcome

    تم نشر هذه المقالة لأول مرة بواسطة Wellcome on Mosaic وتم إعادة نشرها هنا بموجب ترخيص Creative Commons. اشترك في النشرة الإخبارية على mosaicscience.com/#newsletter


    شاهد الفيديو: محاضرة أ1العناصر الأساسية فى الكروموسوم (كانون الثاني 2022).