معلومة

ما نوع القيمة التي سيكون موضع الكروموسوم في قاعدة بيانات أو شكل؟


كنت أرغب في إنشاء أداة لبعض الحقول مثل SIFT ، و Phenotype ، إلخ ... لذلك على سبيل المثال ، أعرف أن النمط الظاهري سيكون له قيم "نصية" أو أن SIFT سيكون له بعض القيم المحددة من القائمة المنسدلة ... ولكن ماذا عن مواقع Chrom؟ ما هي بعض قيم العينات الصالحة لذلك؟ حتى أتمكن من معرفة النوع الذي يمكنني استخدامه له.


نظرًا لأنه يبدو أنك الشخص الذي يصمم قاعدة البيانات ، يمكنك جعل ذلك بعدة طرق. أبسطها على الأرجح هو اختزالها إلى متغيرين ، من المحتمل أن تكون كسرتين عشريتين.

انظر إلى مثال الهيموجلوبين هذا للحصول على مثال على موضع الكروموسومات.

  • هناك كروموسومات N (23 للبشر ، إذا أردت ، يمكن التعامل مع الكروموسومات الجنسية كزوج).
  • يوجد 2 كروماتيدات لكل كروموسوم.
  • جزء الكروماتيد هو إما p أو q (ذراع قصير أو طويل).
  • ثم هناك الموقع على جزء الكروماتيد (على سبيل المثال ، 15.5).

يمكن تمثيل الكروماتيد بسهولة كرقم عشري ، حيث يكون الجزء الصحيح هو رقم الكروموسوم ، والجزء العشري يتوافق مع الكروماتيد والذراع.

يمكن أن يكون موضع الكروموسومات عددًا عشريًا آخر ، مثل 15.5 للمثال أعلاه.

هذه بالطبع طريقة واحدة ، وهناك العديد من الطرق الأخرى للقيام بذلك.


كيفية عبور الوالدين عند استخدام طريقة ترميز القيمة في الخوارزمية الجينية؟

هناك مرحلة في الخوارزمية الجينية حيث يجب أن نختار عبور الكروموسومات من الآباء إلى الأبناء.

من السهل القيام بذلك عن طريق النموذج الثنائي.

ولكن ماذا نفعل إذا قمنا بترميز الكروموسومات باستخدام ترميز القيمة؟

لنفترض أن البتة الواحدة في الكروموسومات الخاصة بي هي قيمة من النوع المزدوج ، دعنا نقول 0.99 ، مداها (0-1) لأنها ستمثل احتمالًا.

كيفية عبور هذا الرقم المزدوج؟

تحويل إلى ثنائي إلى تقاطع ثم تحويل مرة أخرى.


يستخدم هذا التنسيق لتوفير ما يسمى بقمم تخصيب الإشارة
بناء على بيانات مجمعة ومعايرة (مفسرة). إنه تنسيق BED6 + 3.

حقل نوع وصف
الكروم سلسلة اسم الكروموسوم
ابدأ int موضع البداية للميزة في الكروموسوم. تم ترقيم القاعدة الأولى في الكروموسوم 0.
نهاية الكروم int موقف النهاية
للميزة في الكروموسوم أو السقالة. قاعدة chromEnd ليست كذلك
المدرجة في عرض الميزة. على سبيل المثال ، أول 100 قاعدة
يتم تعريف الكروموسوم على أنه chromStart = 0 ، و chromEnd = 100 ، ويمتد إلى
قواعد مرقمة 0-99.
اسم سلسلة الاسم الذي يطلق على منطقة (يفضل أن يكون فريدًا). استخدم & # 8216. & # 8217 إذا لم يتم تعيين أي اسم.
نتيجة int يوضح كيف
الظلام سيتم عرض الذروة في المتصفح (1-1000). إذا & # 82160 & # 8217 ، فإن ملف
سيقوم DCC بتعيين هذا بناءً على قيمة الإشارة. من الناحية المثالية ، متوسط ​​قيمة الإشارة
لكل فارق أساس بين 100-1000.
ساحل شار +/- للإشارة إلى حبلا أو اتجاه (كلما أمكن ذلك). استخدم & # 8216. & # 8217 إذا لم يتم تعيين اتجاه.


هذا قد يساعدك. - من نارايانا فياس. يبحث في جميع أعمدة جميع الجداول في قاعدة بيانات معينة. لقد استخدمتها من قبل وهي تعمل.

هذا هو Stored Proc من الرابط أعلاه - التغيير الوحيد الذي أجريته كان استبدال الجدول المؤقت لمتغير الجدول حتى لا تضطر إلى تذكر إسقاطه في كل مرة.

لتنفيذ الإجراء المخزن:

إذا كنت بحاجة إلى إجراء مثل هذا البحث مرة واحدة فقط ، فمن المحتمل أن تتمكن من استخدام أي من البرامج النصية المعروضة بالفعل في الإجابات الأخرى. ولكن بخلاف ذلك ، أوصي باستخدام ApexSQL Search لهذا الغرض. إنها إضافة SSMS مجانية وقد وفرت لي الكثير من الوقت.

قبل تشغيل أي من البرامج النصية ، يجب تخصيصها بناءً على نوع البيانات التي تريد البحث عنها. إذا كنت تعلم أنك تبحث عن عمود التاريخ والوقت ، فلا داعي للبحث عبر أعمدة nvarchar. سيؤدي ذلك إلى تسريع جميع الاستفسارات أعلاه.

بناءً على إجابة bnkdev ، قمت بتعديل كود Narayana للبحث في جميع الأعمدة حتى الأعمدة الرقمية.

سيتم تشغيله بشكل أبطأ ، ولكن هذا الإصدار يعثر بالفعل على جميع التطابقات وليس فقط تلك الموجودة في أعمدة النص.


نتائج

تم تحليل نتائج 822 دورة PGT-A. يوضح الجدول 1 البيانات المتعلقة بعدد الحالات ، والمؤشرات الطبية لـ PGT-A وعمر المريض ، والتي تراوحت من 22 إلى 46 عامًا (المتوسط: 38.8 + 3.2 سنة 95CI: 38.6-39.0). يوضح الجدول 2 نتائج الاختبار الجيني لاختلال الصيغة الصبغية. كانت ستة وأربعون بالمائة من الأكياس الأريمية (1656 من 3565) ذات صبغة أحادية الصبغية ، مع حدوث تفاوت كبير وفقًا لمؤشر PGT-A (الجدول 2). تم تشخيص الكيسات الأريمية المتبقية على أنها اختلال الصيغة الصبغية (53.5٪ 1909 من 3565). في 45.2٪ (1610 من 3565) من الأكياس الأريمية المشخصة ، تورط واحد (29.2٪) أو أكثر (16.0٪) من الكروموسومات الكاملة في اختلال الصيغة الصبغية.

في حالة اختلال الصيغة الصبغية القطاعي (الجدول 2) ، أظهر 8.4٪ من الأكياس الأريمية المشخصة (299 من 3565) واحدًا أو أكثر من حالات اختلال الصيغة الصبغية القطاعية ، والتي ارتبط بعضها باختلال الصيغة الصبغية للكروموسوم بالكامل ، بينما لم يكن البعض الآخر كذلك. مائتان وأربعة وسبعون من 3565 الكيسة الأريمية (7.7٪) كان لها اختلال الصيغة الصبغية القطعي (SSA) ، المرتبط (ن = 115) أم لا (ن = 159) مع اختلال الصيغة الصبغية للكروموسوم بالكامل ، بينما أظهر 0.7٪ من الأكياس الأريمية المتبقية (25 من 3565) اختلال الصيغة الصبغية القطعي في كروموسومين مختلفين. تم تشخيص كيسة أريمية واحدة فقط على أنها تحمل ثلاثة اختلالات في الصيغة الصبغية القطعية الموجودة في ثلاثة كروموسومات مختلفة (اختلال الصبغيات القطاعي المتعدد). لم يلاحظ أكثر من ثلاثة اختلالات في الصبغيات القطعية لكل جنين ، أو جزء واحد لكل كروموسوم وجنين.

تم الكشف عن اختلال الصيغة الصبغية المقطعية المفردة في غياب اختلالات الصبغيات الكاملة (النقي- SSA) في 159 كيسًا أريميًا (4.5 ٪ من الأكياس الأريمية التي تم تحليلها) ، بصرف النظر عن الدلالة الطبية لدورة تقنية الإنجاب المساعدة (ART) (ص & GT 0.05 الجدول 2).

تردد نقي- SSA (ن = 159) ليس له علاقة بيوم خزعة الكيسة الأريمية (اليوم الخامس مقابل اليوم السادس ص = 0.70) أو مرحلة الكيسة الأريمية (ص = 0.58) ، بينما كان مرتبطًا بجودة ICM و TE (ص & لتر 0.01). وهكذا ، كما هو مبين في الجدول 3 ، لوحظت نسبة أعلى بكثير من SSA النقي بين الأكياس الأريمية المؤهلة بالدرجة "C" (بالإشارة إلى TE و ICM) من تلك التي تتمتع بجودة أفضل TE و ICM.

من وجهة نظر نوعية ، وصفنا سكان SSA وفقًا لموقع المكاسب أو الخسائر على أذرع الكروموسوم p أو q. بشكل عام ، تم تمثيل كل من المكاسب (44.0٪) والخسائر (56.0٪) بشكل متساوٍ في مجموعة SSA الخالصة ، ومع ذلك ، فقد كانت موجودة بشكل متكرر على q- من ذراع الكروموسوم p (67.3٪ مقابل 32.7٪ ، على التوالي). ). علاوة على ذلك ، تم توزيع نوع SSA ، المحدد من خلال الجمع بين كلا المتغيرين (المكاسب / الخسائر وموقع الذراع) ، بالتساوي في مجتمع الكيسة الأريمية (الجدول 4).

لم يتأثر نوع SSA إحصائيًا بالعمر (ص = 0.51) ، دلالة إكلينيكية (ص = 0.15) ، مرحلة الكيسة الأريمية (ص = 0.54) أو جودة ICM و TE (ص = 0.2 و ص = 0.28 ، على التوالي) ، لكنها تأثرت بشكل كبير بيوم الخزعة (ص = 0.007 جدول 4). وهكذا ، أظهرت الكيسات الكيسية الكيسية التي تم أخذها في اليوم الخامس نسبًا أعلى بكثير من المكاسب على أذرع الكروموسوم q (22.0٪) ، في حين أظهرت تلك الخزعة في اليوم السادس نسبًا أعلى بكثير من خسائر SSA على ذراع الكروموسوم q (22.0٪). تم توزيع SSA الذي يؤثر على أذرع الكروموسوم p بالتساوي بين الكيسات الكيسية التي تم أخذها في اليوم الخامس أو السادس من التطور (تتراوح من 5.0 إلى 11.3 ٪ الجدول 4).

تم تعريف الوصف النوعي لـ SSA أيضًا بواسطة الكروموسوم المعني. كشف اختبار Kolmogorov-Smirnov أن تواتر الكروموسومات مع SSA لا يتبع التوزيع الطبيعي (الشكل 2). ص & lt 0.001). في الواقع ، أظهر سكان SSA توزيعًا غير متماثل لتردد الكروموسوم: كانت SSA موجودة على الكروموسومات من 1 إلى 9 في ما يقرب من ثلثي الكيسات الكيسية ، في حين أن 29.6 ٪ من SSA كانت موجودة على الجسيمات الذاتية المتبقية والكروموسومات الجنسية. لم يلاحظ أي SSA على الكروموسوم Y أو على الصبغيات 19 أو 21 أو 22 (الشكل 2).

النسبة المئوية للكيسات الأريمية التي تم تشخيصها على أنها اختلال الصيغة الصبغية المفردة (SSA) وأنواعها (الخسائر على ذراع الكروموسوم الصغير أو الكبير: -p ، q ، على التوالي أو المكاسب على ذراع الكروموسوم الصغير أو الكبير: + p ، + q ، على التوالي) حسب حامل الكروموسوم

بالإضافة إلى ذلك ، تأثير SSA على كروموسوم معين لم يكن مرتبطًا إحصائيًا بالعمر (ص = 0.92) دلالة طبية (ص = 0.24) يوم الخزعة (ص = 0.25) ، مرحلة الكيسة الأريمية (ص = 0.96) أو جودة ICM (التي تم تصنيفها باستمرار "ب"). من ناحية أخرى ، لوحظ وجود علاقة معنوية بين جودة TE والكروموسوم المصاب (ص = 0.04). لم يتم إجراء أي تحليل إحصائي لاستكشاف علاقة حجم SSA بحامل الكروموسوم بسبب العدد المنخفض نسبيًا من الحالات التي تمت دراستها.

ومن المثير للاهتمام ، على الرغم من أن الأوصاف النوعية الحالية تشمل كلا من الموقع الطبوغرافي للمكاسب / الخسائر على ذراع الكروموسوم والكروموسوم المعني ، فقد أظهرت بياناتنا أن هذين المتغيرين النوعيين لا يرتبطان ببعضهما البعض (ص = 0.09 الشكل. 2 الجدول 5).

وصف SSA من وجهة نظر كمية يتطلب دراسة طول تسلسل الحمض النووي (ملف إضافي 1). كشف اختبار Kolmogorov-Smirnov أن حجم SSA لم يتبع توزيع تردد عادي (ص & lt 0.001). وهكذا ، تم تحويل هذا المتغير المستمر (حجم SSA) إلى متغير فئوي عن طريق إعادة تجميع الأحجام إلى أرباع من أجل إجراء مقارنات إحصائية مع المتغيرات المستمرة مثل عمر المريض.

لم يكن حجم SSA مرتبطًا إحصائيًا بالعمر (ص = 0.99) ، دلالة طبية (ص = 0.48) يوم الخزعة (ص = 0.18) ، مرحلة الكيسة الأريمية (ص = 0.40) أو TE (ص = 0.09) أو جودة ICM (تُصنف باستمرار "ب"). ومع ذلك ، لوحظت فروق ذات دلالة إحصائية وفقا لنوع SSA (ص = 0.003) والكروموسوم المعني (ص = 0.007). وبالتالي ، فإن المكاسب والخسائر الموجودة على p-arm لها متوسط ​​أحجام قابلة للمقارنة (45.4 ± 30.6 ميجا بايت 95CI: 36.9-53.9 ميجا بايت ص = 0.99) وكانت أقصر بكثير من المكاسب على الذراع q (المتوسط: 74.8 ± 33.2 ميجا بايت 95CI: 65.4-84.2 ميجا بايت ص & lt 0.03) ، في حين كانت الخسائر على q-arm متوسطة الحجم (المتوسط: 65.1 ± 36.9 ميجا بايت 95CI: 55.3–74.9 ميجا بايت الشكل 3 أ).

متوسط ​​حجم SSA (دائرة مفتوحة ميغابايت) وفقًا لنوع SSA (الشكل 3أ) وحامل الكروموسوم (الشكل 3ب). تمثل أشرطة الخطأ 95٪ فاصل ثقة بالميغا بايت. حاشية سفلية: تمثل الأحرف المرتفعة المختلفة فروق ذات دلالة إحصائية (ص & lt 0.05) بين أنواع SSA أو الكروموسومات المصابة

خلاف ذلك ، كان حجم SSA مرتبطًا بالكروموسوم المعني (ص = 0.003 الشكل 3 ب). ومع ذلك ، نظرًا لأن تحليل حجم SSA فيما يتعلق بالكروموسوم قدم عددًا منخفضًا نسبيًا من الحالات ، لم يتم إجراء مزيد من التحليل.

كما لوحظت العلاقة المذكورة أعلاه بين جودة TE والكروموسوم المصاب بعد تجميع الكروموسومات وفقًا لتصنيف دنفر. وهكذا ، في الكيسات الكيسية المتفجرة ذات الجودة العادلة (المصنفة "ج") ، لوحظت أكثر نقاوة من SSA على الكروموسومات acrocentric أو صغيرة الحجم (المجموعات DF) من الكيسات الأريمية ذات الجودة الممتازة أو الجيدة TE (المصنفة "أ" أو "ب" ) ، حيث نادرًا ما تتأثر هذه الكروموسومات (ص = 0.00006 الشكل 4). كانت SSA النقية موجودة في كثير من الأحيان على الكروموسومات الكبيرة أو المتوسطة الحجم شبه المترية (المجموعة A-C) ، بغض النظر عن جودة الأديم الظاهر (المتوسط: 88.0٪) ص = 0.25 شكل 4).

النسبة المئوية (متوسط ​​، أشرطة الخطأ: 95٪ فاصل الثقة) من SSA النقي الموجود في كل مجموعة تصنيف كروموسوم دنفر ، وفقًا لدرجات جودة الأديم الظاهر الممتازة أو الجيدة أو العادلة (أ ، ب ، ج ، على التوالي الشكل 4)أ). يوضح الشكل الأدنى النسبة المئوية (متوسط ​​أشرطة الخطأ: 95٪ فاصل الثقة) من SSA الموجود في الكروموسومات المتعلقة بالمجموعات A-C أو D-F ، وفقًا لدرجات جودة الأديم الظاهر (الشكل 4).ب)

ومع ذلك ، قمنا بإعادة تجميع سكان SSA وفقًا لنظام تصنيف كروموسوم دنفر القياسي [26]. كما هو مبين في الشكل 5 أ ، تم تمثيل SSA النقي بشكل متكرر في المجموعة C (43.4٪) ، تليها المجموعات A (25.8٪) و B (18.9٪). أظهرت الأكياس الأريمية المتبقية SSA في الكروموسومات في المجموعتين D (5.0٪) و E (6.3٪) ، وكيسة أريمية واحدة فقط بها SSA في الكروموسوم 20 (المجموعة F: 0.6٪). لم يتم الكشف عن SSA في الكروموسوم 19 صغير الحجم أو الكروموسومات acrocentric 21 و 22 و Y (الشكل 2 والشكل 5 أ). بعد نظام دنفر القياسي ، لوحظت أحجام مختلفة من SSA بين فئات الكروموسوم التي تم تحليلها (ص = 0.0001 الشكل 5 ب). وهكذا ، على الرغم من ملاحظة أحجام مماثلة بين المجموعتين D و E (31.9 ± 11.3 ميجا بايت 95CI: 26.3-37.5 ميجا بايت) ، كانت أقصر بكثير من تلك الموجودة في المجموعات AC وأكبر من SSA الفردي الذي لوحظ في الكروموسوم 20 (المجموعة F: 21.2 ميجا بايت) ). علاوة على ذلك ، كانت أحجام SSA في المجموعة A أكبر بكثير (المتوسط: 77.6 ± 38.1 ميجا بايت 95CI: 65.6-89.6 ميجا بايت) من تلك الموجودة في الكروموسومات متوسطة أو صغيرة الحجم ، بغض النظر عن تمركز centromere (المجموعات C-G). كانت SSA المحددة في autosomes كبيرة الحجم شبه المترية (المجموعة B: 69.0 ± 41.7 ميجا بايت 95CI: 53.4-84.6 ميجا بايت) ذات حجم متوسط ​​فيما يتعلق بالمجموعات A (كبيرة الحجم) و C (متوسطة الحجم شبه مترية متوسط ​​الكروموسومات: 57.5 ± 29.6 ميجا بايت 95CI: 50.4-64.6 ميجا بايت) ، لكنها كانت أكبر بكثير من تلك التي تم تحديدها كميًا في الكروموسومات صغيرة الحجم (المجموعات EF) والكروموسومات متوسطة الحجم acrocentric (المجموعة D).

تواتر الكيسات الأريمية القطعية أحادية الصيغة الصبغية (SSA) ، مع أنواع مفصلة من SSA (الشكل 5)أ) ومتوسط ​​أحجام SSA (دوائر مفتوحة ميغابايت ، الشكل 5ب) وفقًا لنظام تصنيف دنفر. متوسط ​​الحجم (الدوائر المفتوحة) لكل نوع من أنواع SSA المصنف بواسطة نظام دنفر القياسي (الشكل 5ج). تمثل أشرطة الخطأ 95٪ فاصل ثقة بالميغا بايت. حاشية سفلية: تمثل الأحرف المرتفعة المختلفة فروق ذات دلالة إحصائية (ص & lt 0.05) في حجم SSA بين فئات الكروموسوم أو أنواع SSA ضمن فئة الكروموسوم C

بالإضافة إلى ذلك ، قمنا بتقييم حجم جميع أنواع SSA الأربعة داخل كل مجموعة كروموسوم (الشكل 5 ج). أظهرت النتائج أحجام SSA قابلة للمقارنة بغض النظر عن نوع SSA في جميع المجموعات باستثناء المجموعة C. بهذه الطريقة ، كانت التسلسلات المقابلة للمكاسب أو الخسائر على q-arm أكبر بشكل ملحوظ (المتوسط: 68.6 ± 27.1 ميجا بايت 95CI: 60.4–76.8 ميجا بايت) من الخسائر على الذراع p (المتوسط: 39.2 ± 26.8 ميجا بايت 95CI: 26.2-52.3 ميجا بايت). كانت المكاسب على الذراع p ذات حجم متوسط ​​فيما يتعلق بخسائر SSA ، بغض النظر عن تأثر ذراع الكروموسوم (المتوسط: 34.4 ± 13.3 ميجا بايت 95CI: 22.1-46.7 ميجا بايت).

أخيرًا ، قمنا بحساب نسبة حجم SSA وفقًا لطول الكروموسوم بأكمله ، بما في ذلك السنترومير (نسبة SSA: الكروموسوم). أظهرت النتائج أن SSA: نسبة الكروموسوم كانت ثابتة إلى حد كبير لجميع مجموعات الكروموسومات المصنفة وفقًا لنظام دنفر القياسي (ص = 0.62) بمتوسط ​​يقدر بـ 0.37 ± 0.19 (95 درجة مئوية: 0.37 - 0.40 شكل 6 أ). ومع ذلك ، فإن SSA: نسبة الكروموسوم تأثرت بنوع SSA (ص & lt 0.001 الشكل 6 ب) كان للـ SSA على الذراعين p نسبة أقل بكثير (المتوسط: 0.27 ± 0.15 95CI: 0.23-0.31) من المكاسب على أذرع q (المتوسط: 0.46 ± 0.19 95CI: 0.40-0.51). تم حساب نسبة وسيطة (0.37 ± 0.18 95CI: 0.32-0.42) للخسائر على ذراع الكروموسوم q.

متوسط ​​SSA: نسبة الكروموسوم (تراوحت الدوائر المفتوحة 0-1) وفقًا لنظام تصنيف دنفر (الشكل 6)أ) ونوع SSA (الشكل 6ب). متوسط ​​SSA: نسبة الذراع (تراوحت الدوائر المفتوحة من 0 إلى 1) وفقًا لنظام تصنيف دنفر (الشكل 6ج ونوع SSA (الشكل 6د). تمثل أشرطة الخطأ 95٪ فاصل ثقة بالميغا بايت. حاشية سفلية: تمثل الأحرف المرتفعة المختلفة فروق ذات دلالة إحصائية (ص & lt 0.05) في SSA: كروموسوم أو SSA: نسبة الذراع بين فئات الكروموسوم أو نوع SSA

كانت نسبة حجم SSA إلى طول الذراع (SSA: نسبة الذراع) قابلة للمقارنة في جميع مجموعات الكروموسوم تقريبًا عندما تم استخدام تصنيف دنفر القياسي ، حيث تم الحصول على متوسط ​​نسبة 0.72 ± 0.37 (95CI: 0.66-0.78 ص = 0.71 الشكل 6 ج) ، باستثناء المجموعة D ، حيث كان أقل بكثير (المتوسط: 0.37 ± 0.11 95CI: 0.27-0.46). SSA: تأثرت نسب الذراع أيضًا بنوع SSA (ص = 0.005 الشكل 6 د). وهكذا ، أظهرت الخسائر على الذراع q-arm انخفاضًا ملحوظًا في نسب SSA: arm (المتوسط: 0.27 ± 0.15 95CI: 0.22–0.33) من تلك الموجودة على الذراع p (المتوسط: 0.37 ± 0.18 95CI: 0.32–0.42) ، بينما المكاسب عرض متوسط ​​SSA: نسب الذراع ، بغض النظر عن تأثر ذراع الكروموسوم (المتوسط: 0.74 ± 0.32 95 درجة مئوية: 0.66-0.82).


3 نتائج

3.1 تجميع الجينوم

ال ك- تحليل مرتبط بتسلسل جينوم الأنثى Salix dunnii أشار النبات إلى أن تواتر المواقع غير المتجانسة في هذا الفرد ثنائي الصيغة الصبغية منخفض (0.79٪) (الشكلان S2 و S3 ، الجدول S1). أنشأنا 72 جيجا بايت (

180 ×) من قراءات ONT الطويلة ، 60 جيجابايت (

150 ×) يقرأ Illumina و 55 جيجا بايت (

140 ×) من قراءات Hi-C (الجدولان S5 و S6). بعد تطبيق العديد من استراتيجيات التجميع المختلفة ، اخترنا تلك التي تحتوي على "أفضل" مقاييس الاتصال (smartdenovo مع تصحيح canu ، الجدول S2). أسفر التلميع / التصحيح باستخدام قراءات Illumina القصيرة لنفس الفرد عن تجميع جينوم سعة 333 ميجا بايت في 100 contigs (contig N50 = 10.1 ميجا بايت) (الجدول S2).

بمساعدة السقالات Hi-C ، حققنا تجميعًا نهائيًا لمقياس الكروموسوم يبلغ 328 ميجا بايت من 29 سقالة (سقالة N50 = 17.28 ميجا بايت) ، حوالي 325.35 ميجا بايت (99.17 ٪) مثبتة على 19 كروموسوم زائف (الشكل 1 أ ، الجدول 2 الشكل S4 ، الجدول S4) ، المقابل لعدد الكروموسوم أحادي الصيغة الصبغية للأنواع. تم تجميع جينومات الميتوكوندريا والبلاستيدات الخضراء في جزيئات DNA دائرية من 711422 و 155620 زوجًا أساسيًا على التوالي (الشكلان S5 و S6). تم تعيين حوالي 98.4٪ من قراءات Illumina القصيرة بنجاح إلى مجموعة الجينوم ، وتمت تغطية حوالي 99.5٪ من التجميع بـ 20 × قراءة على الأقل. وبالمثل ، تم تعيين 98.9٪ من قراءات ONT إلى مجموعة الجينوم و 99.9٪ تمت تغطيتها بـ 20 × قراءة على الأقل. كانت درجة مؤشر تجميع LTR (LAI) للجمعية 12.7 ، مما يشير إلى أن مجموعتنا وصلت إلى جودة عالية بما يكفي لتحقيق مرتبة "المرجع" (Ou et al. ، 2018). حدد تحليل busco (Simão et al. ، 2015) 1392 (96.6٪) من 1440 بروتينًا أساسيًا محفوظًا بدرجة عالية في قاعدة بيانات Embryophyta ، منها 1239 (86.0٪) جينات نسخة واحدة و 153 (10.6٪) جينات مكررة. كان لدى 33 (2.3 ٪) تطابقًا مجزأ مع الجينات المحفوظة الأخرى ، و 37 (2.6 ٪) في عداد المفقودين.

إجمالي حجم التجميع (ميغا بايت) 328
إجمالي عدد contigs 31
الحجم الإجمالي الثابت (ميغا بايت) 325.352
أقصى طول contig (ميغابايت) 35.892
الحد الأدنى لطول contig (kb) 68.49
طول Contig N50 (ميغابايت) 16.657
كونتيج L50 count 8
طول Contig N90 (ميغابايت) 12.795
كونتيج L90 count 17
إجمالي عدد السقالات 29
أقصى طول للسقالة (ميغا بايت) 35.892
الحد الأدنى لطول السقالة (kb) 68.49
طول سقالة N50 (ميغابايت) 17.281
عدد سقالة L50 8
طول سقالة N90 (ميغابايت) 13.179
عدد سقالة L90 17
رقم الفجوة 2
محتوى GC (٪) 33.09
رقم الجينات 31,501
كرر المحتوى (٪) 41.05

3.2 شرح الجينات وتكرارها

في المجموع ، يتكون 134.68 ميجا بايت (41.0 ٪) من الجينوم المجمع من مناطق متكررة (الجدول 2) ، بالقرب من 41.4 ٪ التي تنبأ بها Findgse (Sun et al. ، 2018). كانت LTR-RTs هي التعليقات التوضيحية الأكثر وفرة ، حيث شكلت ما يصل إلى 19.1٪ من الجينوم ، مع الغجر و كوبيا العناصر القابلة للنقل من الفئة الأولى (RT) القابلة للنقل (TEs) تمثل 13 ٪ و 5.85 ٪ من الجينوم ، على التوالي (الجدول S7). تمت دراسة جميع الجينومات حتى الآن في ساليكس الأنواع لها نسب كبيرة من متواليات TE ، ولكن النسب الأعلى من الغجر العناصر في S. dunnii (الجدول S7) (Chen et al. ، 2019) اقترح توسعًا كبيرًا في هذا النوع. استنادًا إلى الاختلاف المقدر لكل موقع (انظر الطرق) ، يبدو أن معظم LTR-RTs كاملة الطول قد تم إدخالها في أوقات مختلفة خلال آخر 30 مليون سنة بدلاً من الاندفاع الأخير (الأشكال S7-S9 ، الجدول S8). قيم الاختلاف لجميع الكروموسومات هي 0 إلى 0.2 ، يعني 0.041 ومتوسط ​​0.027. تتشابه قيم الكروموسوم 7 فقط ، وتتراوح من 0 إلى 0.18 ، ولكن المتوسط ​​0.0461 والمتوسط ​​0.035 أعلى قليلاً من الكروموسومات بخلاف 7 ، وهذا يرجع أساسًا إلى قيمة أعلى / عمر أكبر في المنطقة المرتبطة بـ X .

استخدام استراتيجية شاملة تجمع بين المستندة إلى الأدلة و البداية التنبؤ الجيني (انظر الطرق) ، ثم قمنا بتعليق الجينوم المقنع المتكرر. حددنا ما مجموعه 31501 نموذجًا جينيًا ، بما في ذلك 30200 جينة ترميز بروتين و 650 نقل RNAs (tRNAs) و 156 RNAs ريبوزومي (rRNA) و 495 RNAs غير مشفر غير قابل للتصنيف (ncRNAs) (الجدول 2 الجدول S9). المتوسط S. dunnii يبلغ طول الجين 4095.84 نقطة أساس ويحتوي على 6.07 إكسونات (الجدول S10). تطابق معظم جينات ترميز البروتين المتوقعة (94.68٪) بروتينًا متوقعًا في قاعدة بيانات عامة (الجدول S11). من بين جينات ترميز البروتين ، تم التنبؤ بجينات عامل النسخ 2053 (TF) وتصنيفها إلى 58 عائلة جينية (الجدولان S12 و S13).

3.3 علم الجينوم المقارن وأحداث تكرار الجينوم الكامل

قارنا S. dunnii تسلسل الجينوم لأربعة جينومات صفصاف منشورة و Populus trichocarpa، كمجموعة خارجية ، باستخدام 5950 جينًا من نسخة واحدة لبناء شجرة تطور لعلاقات الأنواع (الشكل 1 ب). بما يتوافق مع الطبولوجيا المنشورة (Wu et al. ، 2015) ، S. dunnii يظهر في دراستنا كصنف متباين مبكر في موقع الشقيقة للأربعة ساليكس أنواع شاميتية-فيتريكس كليد.

لاختبار أحداث تكرار الجينوم الكامل (WGD) ، قمنا بفحص توزيع كs بين نظائرها داخل S. dunnii الجينوم ، جنبًا إلى جنب مع مخطط نقطي لاكتشاف المناطق المخلوية المحتملة. هذا كشف أ كذروة مماثلة لتلك التي لوحظت في حور، مما يؤكد الاستنتاج السابق بأن WGD قد حدث قبل تباعد الجنسين (كحوالي 0.3 في الشكل S10) (توسكان وآخرون ، 2006). يتم دعم WGD أيضًا من خلال تحليلنا التركيبي داخل S. dunnii (الشكل 1 أ الشكل S11). كان التركيب والعلاقة الخطية المتداخلة مرتفعين مع ذلك S. dunnii و S. بوربوريا على جميع الكروموسومات التسعة عشر ، وبين نوعي الصفصاف و P. trichocarpa بالنسبة لـ 17 كروموسومًا (الشكل 1 ج) ، مع إعادة ترتيب كبيرة بين الكروموسومات معروفة سابقًا بين الكروموسوم 1 والكروموسوم 16 من ساليكس و حور (الشكل 1 ج).

3.4 تحديد نظام تحديد الجنس

لاستنتاج نظام تحديد الجنس في S. dunnii، قمنا بتسلسل 20 أنثى و 18 ذكرًا من مجموعتين بريتين بواسطة تسلسل قراءة قصيرة من Illumina (الجدول S1). بعد التصفية ، حصلنا على أكثر من 10 جيجا بايت من القراءات النظيفة لكل عينة (الجدول S14) بمتوسط ​​أعماق من 30 × إلى 40 × (الجدول S15) ، مما أسفر عن 4،370،362 تعدد الأشكال عالي الجودة.

كشفت GWAS عن نسبة صغيرة (1،067،232 نقطة أساس) S. dunnii منطقة الكروموسوم 7 ، بين 6،686،577 و 7،753،809 نقطة أساس ، حيث ارتبط 101 SNPs بشكل كبير بالجنس (الشكل 2 أ ، ب الجدول S16 ، الشكل S12). أكثر من 99 ٪ من تعدد الأشكال المرتبط بالجنس المرشح متماثل الزيجوت في جميع الإناث ، و 63.74 ٪ متغاير الزيجوت في جميع الذكور في عينتنا (الجدول S17).

تمشيا مع GWAS الخاص بنا ، اكتشفت طريقة CQ ، مع 18 فردًا من كل جنس ، نفس المنطقة ، وقدرت منطقة أكبر إلى حد ما ، بين 6.2 و 8.75 ميجا بايت ، مع CQ & gt 1.6 (والتي تشمل جميع SNPs المرشحة المرتبطة بالجنس) ، في حين أن المناطق الأخرى من الكروموسوم 7 والكروموسومات والـ contigs الـ 18 الأخرى لها قيم CQ قريبة من 1 (الشكل 2 ج الشكل S13). هذه النتائج تشير إلى ذلك S. dunnii لديه نظام ذكري غير متجانس ، مع منطقة صغيرة مرتبطة بالجنس تمامًا على الكروموسوم 7. نظرًا لأن هذه المواقف تعتمد على تسلسل أنثى ، ولأن النوع لديه تغاير ذكر ، فإننا نشير إلى هذا على أنه المنطقة المرتبطة بـ X (X-LR) . توقعنا (انظر الطرق) أن مركز الكروموسوم 7 يقع بين 5.2 و 7.9 ميجا بايت تقريبًا ، مما يعني أن المنطقة المرتبطة بالجنس قد تكون في منطقة إعادة تركيب منخفضة بالقرب من هذا المركز (الشكل S1). علاوة على ذلك ، يوضح تحليل LD باستخدام 20 أنثى أن X-LR يقع داخل منطقة من الكروموسوم X مع إعادة تركيب أقل من بقية الكروموسوم 7 ، بما يتوافق مع موقع مركزي أو محيط مركزي (الشكل S14). بدون الخرائط الجينية ، ليس من الواضح بعد ما إذا كان هذا النوع لديه تأشيب منخفض بالقرب من المراكز المركزية لجميع كروموسوماته.

التمايز الجيني (يقدر بـ Fشارع) بين عيناتنا من الأفراد من الذكور والإناث ، أكد أيضًا وجود منطقة 3.205-Mb X-LR في المنطقة التي اكتشفها GWAS. بين 5.675 و 8.88 ميغا بايت (21 ٪ من الكروموسوم 7) ، تم اكتشاف تحليل نقطة التغيير (انظر الطرق) Fشارع قيم أعلى بكثير من تلك الموجودة في المناطق المحيطة ، كما هو متوقع لمنطقة مرتبطة تمامًا بـ X (الشكل 2 الشكل S15). تشكل نسبة 79٪ الأخرى من الكروموسوم اثنين من PARs (انظر الشكل 2). كان LD أكبر بشكل كبير في المنطقة المرتبطة بالجنس المفترض بشكل كامل عنها في الجينوم بأكمله (الشكل S16).

3.5 المحتوى الجيني للمنطقة المرتبطة بالجنس بالكامل

وجدنا 124 جينًا وظيفيًا ظاهريًا في X-LR (استنادًا إلى تسلسل الترميز السليم) مقابل 516 في PAR1 (تُعرَّف على أنها منطقة الكروموسوم 7 من الموضع 0 إلى 5674999 نقطة أساس) ، و 562 في PAR2 في الكروموسوم 7 (من 8880001 إلى 15272.728 نقطة أساس). bp) (الشكل 2e الجدولين S9 و S18). تمثل أرقام جينات X-LR 10.3٪ فقط من الجينات الوظيفية على الكروموسوم 7 ، مقابل 21٪ من حجمه المادي ، مما يشير إما إلى انخفاض كثافة الجينات أو فقدان وظيفة الجينات ، وكلاهما يمكن أن يحدث في منطقة الجينوم المحيط بالتروم. . حددنا أيضًا 183 جينًا خادعًا مرتبطًا بـ X. بما في ذلك الجينات الخادعة ، تشكل جينات X-LR 17٪ من المحتوى الجيني لهذا الكروموسوم ، وبالتالي فإن كثافة الجينات الإجمالية ليست أقل بكثير مما كانت عليه في PARs. وبدلاً من ذلك ، تشكل الجينات الكاذبة نسبة أعلى بكثير (59٪) من تلك الموجودة في الجسيمات الذاتية (31٪) ، أو PARs (148 و 269 في PAR1 و PAR2 ، على التوالي ، أو 28٪ بشكل عام ، انظر الجدولين S19 و S20). في المجموع ، لم يكن لـ 41 جينًا داخل المنطقة المرتبطة بـ X ضربات انفجار على الكروموسوم 7 لأي منهما P. trichocarpa أو S. بوربوريا (الجدول S18).

عمليات البحث التي نجريها في S. dunnii الجينوم للنسخ الكاملة أو الجزئية لتسلسل Potri.019G133600 ( ARR17-مثل الجين الموصوف أعلاه ، والذي تمت مناقشته بمزيد من التفصيل أدناه ، والذي يشارك في تحديد الجنس في العديد من الساليسيا الأخرى) تم العثور على نسخ على الكروموسومات 1 و 3 و 8 و 13 و 19 (الجدول S21). الأهم من ذلك ، أننا لم نعثر على أي شيء في الكروموسوم 7 ، وبالتحديد لم نعثر على نسخة أو نسخة من الجينات الزائفة في X-LR.

3.6 التطور الجزيئي لـ S. dunnii الجينات المرتبطة بـ X

كثافة الجينات أقل في X-LR من PARs ، ربما لأن كثافة عنصر LTR-Gypsy أعلى (الشكل 3 أ). تشكل العناصر المتكررة 70.58٪ من X-LR ، مقابل 40.36٪ لـ PARs و 40.78٪ لـ 18 جسمًا جسميًا (الجدول 3). كان أكثر من نصف (53.31٪) عنصر LTR-Gypsy المحدد في الكروموسوم 7 من X-LR (الشكل 3 ب ، الجدول S8).

قدرنا كأ، كرمل كأ/كنسب s لجينات الكروموسوم 7 الموجودة في كليهما S. dunnii و S. بوربوريا (992 زوجًا لتقويم العظام) أو S. dunnii و P. trichocarpa (1017 زوجًا لتقويم العظام). على حد سواء كأ و كتتشابه قيم s تقريبًا عبر الكروموسوم بأكمله (الشكلان S17 و S18) ، و كأ/كلم تختلف قيم s بشكل كبير بين المنطقة المرتبطة بالجنس والجسيمات الذاتية أو PARs (الشكل 3 ج ، د الشكل S19). ومع ذلك ، فإن كأ و كتعد تقديرات s لجينات PAR أعلى بكثير من تلك الخاصة بالجينات الصبغية ، مما يشير إلى معدل طفرة أعلى (يوضح الشكل S17 نتائج الاختلاف من P. trichocarpa، والشكل S18 لـ S. بوربوريا).

فئة X-LR PARs جسدية
الجينات 0.537 (16.77%) 4.679 (38.78%) 122.740 (39.58%)
الغجر- LTR 1.429 (44.60%) 1.370 (11.36%) 39.321 (12.68%)
كوبيا- LTR 0.190 (5.94%) 0.844 (6.99%) 17.986 (5.80%)
إجمالي التكرارات 2.262 (70.58%) 4.870 (40.36%) 126.465 (40.78%)

3.7 التعبير الجيني المتحيز للجنس في الأنسجة التناسلية والنباتية

بعد مراقبة الجودة والتشذيب ، تم تعيين أكثر من 80 ٪ من قراءات RNAseq الخاصة بنا بشكل فريد لتجميع الجينوم عبر جميع العينات (الجدول S22). في كل من مجموعات بيانات catkin والأوراق ، يوجد عدد أكبر بكثير من الجينات المتحيزة للذكور أكثر من الجينات المتحيزة للإناث. في Catkins ، هناك اختلافات بين الجنسين في التعبير عن 3734 جينًا (2503 جينة متحيزة للذكور و 1231 جينة متحيزة للإناث). تم اكتشاف 43 جينًا معبرًا تفاضليًا فقط في مادة الأوراق (31 جينًا متحيزًا للذكور مقابل 12 جينًا متحيزًا للإناث ، يتم التعبير عنها أيضًا بشكل تفاضلي في الشكل S20 ، الجدول S23). أظهر الكروموسوم 7 ، ككل ، إثراءًا مشابهًا للجينات ذات التعبير المتحيز للذكور (117 جينًا متحيزًا للذكور ، من أصل 1112 التي أسفرت عن تقديرات التعبير ، أو 10.52٪) ، لكن الجينات المتحيزة للذكور تشكل نسبًا أعلى بشكل ملحوظ فقط في PARs ، وليس في المنطقة المرتبطة بـ X (الشكل 4) ، والتي تضمنت ستة جينات متحيزة للذكور وخمسة جينات فقط ، في حين أن 94 جينة X-LR الأخرى التي أسفرت عن تقديرات التعبير (90 ٪) كانت غير متحيزة.

قمنا بتقسيم الجينات إلى ثلاث مجموعات وفقًا لاختلافاتهم الجنسية في التعبير ، بناءً على السجل2قيم FoldChange. جميع جينات X-LR المتحيزة للذكور موجودة في فئة التعبير الأعلى ، لكن الجينات المنحازة للإناث ذات التعبير العالي كلها من PARs (الشكل 4).


النتائج

تطوير المسبار:

تشير التقارير السابقة لاكتشاف FISH أحادي الموضع إلى أن الحد الأدنى من الهدف الجيني الذي يمكن اكتشافه باستخدام FISH في الذرة هو ∼3000 نقطة أساس (K ato وآخرون. 2006 دبليو انج وآخرون. 2006 واي ش وآخرون. 2007). لتطوير مجسات يمكن استخدامها بشكل روتيني ، حددت عدة طرق أهدافًا جينومية و gt6000 bp التي ستكون خالية من العناصر المتكررة والتي من المتوقع أن تكون قابلة للاكتشاف بسهولة. تضمنت هذه الأهداف جينات منظمة في مجموعات ، و cDNAs كبيرة ، وجينات بدون عناصر متكررة في الإنترونات الخاصة بها ، وتسلسلات فريدة مجمعة من BACs.

عناقيد الجينات:

تميل أنواع معينة من جينات النبات إلى التنظيم على شكل مجموعات جينية كبيرة. نظرًا لأن مسبارًا واحدًا سوف يتهجين للمجموعة بأكملها ، فإن مثل هذه المجموعات تجعل أهداف FISH ممتازة. الأمثلة الكلاسيكية لاكتشاف الجينات الترادفية هي الجينات الريبوزومية التي تم استخدامها في التنميط النووي للعديد من الأنواع المختلفة ، بما في ذلك الذرة (L i and A rumuganathan 2001 K ato وآخرون. 2004). بالإضافة إلى ذلك ، فإن الجينات التي تتوسط في مقاومة أمراض الذرة (W ebb وآخرون. 2002 ميث وآخرون. 2004) أو ذلك التخزين المشفر (W oo وآخرون. 2001) وبروتينات جدار الخلية (W u وآخرون. 2001) في مجموعات كبيرة واستخدمت في مجسات FISH في الذرة (B auer and B irchler 2006 K ato وآخرون. 2006 L amp و B irchler 2006 V aldivia وآخرون. 2007). 19 كيلو دالتون زين توجد الجينات في مجموعات في عدة مواقع ، بما في ذلك الكروموسومات 4S و 7S (S ong و M essing 2002). لأن 19 كيلو دالتون زين الفصيلة الفرعية يمكن اكتشاف مجموعة الجينات الموجودة على الكروموسوم 4 بسهولة باستخدام FISH (K ato وآخرون. 2006) ، كانت المجموعة الجينية للفصيلة B مرشحًا واعدًا لعلامة كروموسوم 7. أ 19 كيلو دالتون زين تم تضخيم تسلسل الفصيلة الفرعية B واستنساخه باستخدام بادئات خاصة بالعائلة الفرعية تم وصفها مسبقًا (S ong و M essing 2002). تم استخدام هذا الاستنساخ في تفاعلات PCR اللاحقة لإنتاج قالب لتفاعل وسم FISH. كان يسمى المسبار α-زينB وأنتجت إشارة حصرية على 7S (الشكل 1).

FISH صغير الهدف على الكروموسومات الجسدية من سلالة الذرة الفطرية B73. تم تهجين الكروموسومات الجسدية من السلالة الفطرية B73 مع مجسات صغيرة الهدف (حمراء) ومع تحقيقات العناصر المتكررة (الساتل الصغير CentC ، TAG ، وتكرار المقبض 180 نقطة أساس) ، والتي بالاقتران مع نسب الحجم وطول الذراع ، تسمح لكل كروموسوم ليتم تحديدها. إشارات الأقمار الصناعية الصغيرة CentC و TAG باللون الأخضر وإشارات تكرار المقبض 180 نقطة أساس زرقاء. تم قطع الكروموسومات من المستحضرات الفردية إلكترونيًا وترتيبها في صفوف. في كل صف ، يتم تقديم الصورة المدمجة لإظهار موضع الكروموسومات لكل مسبار صغير الهدف. أسفل الصورة المدمجة ، يتم عرض القيم الرمادية لإشارات الهدف الصغير على النحو التالي: (أ) dek1، (ب) serk2+rf2e1، (ج) 19-كيلو دالتون α-زينعائلة الجينات B ، (D) BAC8L ، (E) BAC9S ، (F) acc1/acc2و (ز) ميو 1. تشير الأسهم الحمراء إلى مواقع الإشارات.

جينات واحدة:

معظم جينات الذرة هي & gt3 kb (H aberer وآخرون. 2005) ، الحد الأدنى للحجم الذي يمكن اكتشافه بشكل روتيني بواسطة FISH. لذلك ، فإن الجينات الفردية مرشحة لتحقيقات FISH أحادية الموقع على الرغم من أن بعضها سيحتوي على عناصر متكررة في الإنترونات الخاصة بهم ويكون غير مناسب. لتطوير مجسات للكروموسوم 5 ، تم تصميم أزواج PCR التمهيدي لتضخيم جينين موجودين على 5L: rf2e1 الجين (4739 نقطة أساس) و serk2 الجين (5484 نقطة أساس) (الجدول 1). ال rf2e1 تم تضخيم الجين في جزأين. أنتجت منتجات PCR الناتجة إشارات FISH على 5L وأظهرت عدم وجود خلفية أو انخفاضها. منتجات PCR من serk2 و rf2e1 تم دمج الجينات لإنتاج مسبار سعة 5 لتر ، يشار إليه باسم serk2+rf2e1 (شكل 1). On some chromosomes, two signals were produced, probably corresponding to the two genes (Figure 1 and supplemental Figure 1, A and B, at http://www.genetics.org/supplemental/). ال serk2 gene is placed on the GRAMENE Z. mays finger printed contig map (http://www.gramene.org/Zea_mays/) on chromosome 5L, contig 234, position 133.32 Mb. أ rf2e1 homolog, found by BLASTn analysis (Z. mays PCO083188_ov mRNA, accession AY107915), is mapped on chromosome 5L, contig 240, position 145.42 Mb. The distance between the serk2 و ال rf2e1 sequences is 12 Mb.

PCR probe production

Large cDNAs:

Approximately 11% of maize genes contain repetitive sequences in their introns (H aberer وآخرون. 2005) and will not be suitable as FISH probes without removal of the repeats. Because fully processed mRNAs do not contain introns and are therefore likely to contain less repetitive DNA, a database search was conducted for large maize cDNA sequences to use as FISH probes. Thirty-six candidate mRNA sequences >4000 bp were identified, including both mapped and unmapped genes. Of these, several with cDNA sequences >6000 bp were selected for further analysis, including Z. mays B73 calpain-like protein (dek1) (7110 bp), the unconventional myosin heavy chain (myo1) (5375 bp), and the acetyl-coenzyme A carboxylase (acc1) (7324 bp) genes. ال myo1 gene had not previously been localized and the maize genome contains two highly similar acc genes (A shton وآخرون. 1994) present on chromosome arms 2L (acc2) and 10L (acc1) (http://www.maizegdb.org). The resulting PCR products were used as FISH probes (Figure 1). Probe dek1 labeled the expected interstitial position on chromosome 1S and additional signal was seen at the NOR due to contaminating cDNA from the rDNA genes (supplemental Figure 2 at http://www.genetics.org/supplemental/). By using RNA that is enriched for poly(A)-containing mRNA as the RT–PCR template, the NOR hybridization signal was eliminated (Figure 1, supplemental Figure 1, E and F, at http://www.genetics.org/supplemental/), and purified mRNA was used as the template for subsequent RT–PCR reactions. ال myo1 probe produced a signal on the distal end of chromosome 3L. ال acc1/acc2 probe hybridized near the centromere on chromosome 2L and at an interstitial position on chromosome 10L (Figure 1). Thus, the position of the myo1 gene has been determined and the positions of dek1, acc1، و acc2 genes have been detected using FISH.

Pooled PCR products from BACs:

Although extensive BAC libraries exist for maize, the abundance of dispersed repetitive elements prevents the direct use of maize BACs as FISH probes. Many BAC clones have been sequenced as part of the ongoing maize genome sequencing effort, allowing the identification of unique or genic regions using sequence analysis software. Pooling multiple low-copy sequences from a BAC sequence would allow FISH to a genomic target of sufficient size to be readily detectable and free of background signal.

To develop a FISH marker for chromosome 8, the 136.9-kb BAC clone sequence AC157487 was selected. Four unique regions with sizes of 7.5, 13.4, 7.0, and 8.4 kb were identified after RepeatMasker analysis (Figure 2A). Each region was analyzed using the BLASTn program and sequences with homology to plant cDNAs or mRNAs were selected for primer design. These regions were expected to be conserved among maize varieties. Seven PCR products were labeled as FISH probes and individually tested on chromosome spreads. Three PCR products showing no background were combined to produce a probe totaling 8.7 kb in length that readily detected a specific region on chromosome 8L (Figure 1, Figure 2B, Table 1). Four PCR products showed nonspecific hybridization due to elements being present, which can be missed during RepeatMasker analysis. As additional repetitive elements are added to the Repeat Masker library, selection of maize unique sequences for FISH probe development will be more effective. We anticipate that many additional probes will be produced in this fashion and propose the following naming system. Probes will be designated by the chromosome arm and the GenBank accession number used in their design. Thus, a probe produced by pooling the PCR products is named BAC8L–AC157487. Because only one probe on 8L is used in this study, an abbreviated form of the name, BAC8L, will be used.

Development of unique probes from BAC sequences. (A) Chromosome 8L anchored BAC AC157487 (136.9 kb) after RepeatMasker analysis: four long unique BAC regions were selected for primer design. (B) Seven PCR products were amplified and used as FISH probes separately. Three PCR products that showed low or no background were selected and combined as one probe.

A similar approach was applied to develop a probe for chromosome 9S using sequence AF448416 from a BAC clone containing the bz1 regions (106.2 kb). RepeatMasker and BLASTn analysis was performed in the same manner as noted above. بسبب ال bz1 region has been well characterized (F u and D ooner 2002 B runner وآخرون. 2005), it was possible to select sequences shared among three different inbreds—B73, Mo17, and McC—for FISH probe development. Seven PCR primer pairs were designed. Five PCR products corresponding to regions of genes stk1, stc1, znf, tac7077، و uce2 showed low background as FISH probes and were pooled to produce a readily detectable 12.3-kb probe for the chromosome 9 bz region (Table 2, Figure 1). The other two PCR products were not used because they produced high background. This probe, BAC9S–AF448416, will be referred to as BAC9S in this report.

Karyotyping cocktail components

Karyotyping:

By combining the new probes produced for chromosomes 1S, 5L, 7S, 8L, and 9S with others described previously, including the p1 gene on 1S (Y u وآخرون. 2007), the 5S ribosomal gene cluster on 2L (K ato وآخرون. 2004), the rp3 disease resistance gene cluster on 3L (K ato وآخرون. 2006), the Cent4 repeat cluster near the centromere of chromosome 4 (K ato وآخرون. 2004), the expansin B11 gene cluster expB11 on 5L (V aldivia وآخرون. 2007), the 45S (NOR) ribosomal gene cluster on 6S (K ato وآخرون. 2004), the expansin B9 gene cluster expB9 on 9L (V aldivia وآخرون. 2007), and the rp1 disease resistance gene cluster on 10S (K ato وآخرون. 2006), a collection of single-locus FISH probes that includes at least one on each chromosome has been assembled (Table 2). By combining selected members of this collection, labeled in different colors, it is possible to identify each chromosome in the maize karyotype. The probe cocktail was successfully applied to chromosomes of inbred lines B73, Oh43, and KYS (KYS is shown in Figure 3). The position of each probe on the respective chromosome of inbred B73 was measured and an idiogram was constructed (Figure 4 ).

Inbred KYS chromosomes identified using small-target probes. FISH with small-target probes including dek1 (1S, red), p1-wr (1S, white), rp3 (3L, red), serk2+rf2e1 (5L, green), expB11 (5L, green), α-zeinB (7S, red), BAC8L (8L, green), BAC9S (9S, green), expB9 (9L, green), and rp1 (10S, red) and with probes to the repetitive elements 5S rDNA (2L, green), 45S rDNA (NOR, 6S, green), and Cent4 (green). See Table 1 for details on each probe. شريط ، 10 ميكرومتر.

Idiogram of Z. mays B73 chromosomes showing average relative chromosome lengths (as percentages) and positions of small-target probes on somatic chromosomes from inbred line B73. The asterisk by chromosome 4 indicates the position of a second site of hybridization to a 19-kDa zein gene probe and the asterisk by chromosome 9 indicates a minor site of hybridization to expB10. The colors used to indicate the probe positions correspond to the colors in Figure 3 except probes not used for karyotyping, which are shown in black.

Probe extension to other maize lines and relatives:

Because single-locus FISH probes detected B73 genes or gene clusters whose function is likely conserved, it was expected that they would hybridize in other maize lines and related species. To confirm this supposition, the probes dek1, serk2+rf2e1, BAC8L, and BAC9S were applied to the inbreds KYS and Oh43 and produced signals in the expected locations (supplemental Figure 1 at http://www.genetics.org/supplemental/). Several of the probes in the single-locus collection, including α-zeinأ، rp1، و rp3, were previously shown to hybridize to unique locations in Tripsacum and Z. diploperennis (L amb and B irchler 2006). The remaining probes from the single-locus collection—dek1, serk2+rf2e1, BAC8L, BAC9S, expB11, α-zeinب، acc1/acc2، و myo1—were applied to chromosome spreads from F1 hybrids between maize and wild relatives, including Z. luxurians, Z. diploperennis، و T. dactyloides, and to a “tri-species hybrid” containing chromosomes from Z. mays, Z. diploperennis، و T. dactyloides. The presence of the maize chromosomes in these hybrids provides a positive control for ensuring that the conditions were optimal for signal detection. For all the probes, signal could be detected on the chromosomes from the wild relatives. Several examples are included in Figure 5 and supplemental Figure 2 at http://www.genetics.org/supplemental/. The number of signals in the wild Zea species was the same as that in maize for each probe. In Tripsacum, rp1, rp3, α-zeinA (L amb and B irchler 2006), α-zeinب، myo1، و acc1/acc2 probes all produced the same number of signals per haploid genome as in maize (Figure 5, supplemental Figure 2 at http://www.genetics.org/supplemental/). The other probes produced more signals per haploid genome than Zea did: BAC8L (three signals), dek1 (two signals), and serk2+rf2e1 (three signals). Because BAC8L is a mixture of three detectable PCR products (3125, 2179, and 3353 bp long), the three sites could indicate three homologous regions or result from separation of the genomic locations relative to their positions in maize.

Extension of small-target FISH probes to wild relatives of Z. mays. Small-target probes are indicated by arrowheads. The gray-value images depict the small-target labeling alone. Bars, 10 μm. (A) Maize × Z. diploperennis F1 hybrid chromosomes labeled with BAC8L (red) and (B) ExpB11 (red). The Grande retrotransposon probe (green) hybridizes strongly to maize chromosomes and with intermediate intensity to Z. diploperennis الكروموسومات. (C) “Tri-species” hybrid containing a haploid set of chromosomes from maize (ن = 9, as chromosome 2 is missing), Z. diploperennis (ن = 10), and T. dactyloides (ن = 18), labeled with myo1 (red) and a Tripsacum-specific retroelement probe, TC#25 (green). Three myo1 signals are observed, two on Zea chromosomes and one on a Tripsacum chromosome. (D) Maize × Z. luxurians F1 hybrid labeled with the serk2+rf2e1 probe (red) and the 180-bp knob probe (green). Knob signals in Z. luxurians are located at the ends of chromosomes whereas maize knob signals are interstitial.


General usage¶

As described on the UCSC Genome Browser website (see link below), the browser extensible data (BED) format is a concise and flexible way to represent genomic features and annotations. The BED format description supports up to 12 columns, but only the first 3 are required for the UCSC browser, the Galaxy browser and for bedtools. bedtools allows one to use the “BED12” format (that is, all 12 fields listed below). However, only intersectBed, coverageBed, genomeCoverageBed, and bamToBed will obey the BED12 “blocks” when computing overlaps, etc., via the “-split” option. For all other tools, the last six columns are not used for any comparisons by the bedtools. Instead, they will use the entire span (start to end) of the BED12 entry to perform any relevant feature comparisons. The last six columns will be reported in the output of all comparisons.

  • Any string can be used. For example, “chr1”, “III”, “myChrom”, “contig1112.23”.
  • This column is required.
  • The first base in a chromosome is numbered 0.
  • The start position in each BED feature is therefore interpreted to be 1 greater than the start position listed in the feature. For example, start=9, end=20 is interpreted to span bases 10 through 20,inclusive.
  • This column is required.
  • The end position in each BED feature is one-based. See example above.
  • This column is required.
  • Any string can be used. For example, “LINE”, “Exon3”, “HWIEAS_0001:3:1:0:266#0/1”, or “my_Feature”.
  • This column is optional.
  1. score - The UCSC definition requires that a BED score range from 0 to 1000, inclusive. However, bedtools allows any string to be stored in this field in order to allow greater flexibility in annotation features. For example, strings allow scientific notation for p-values, mean enrichment values, etc. It should be noted that this flexibility could prevent such annotations from being correctly displayed on the UCSC browser.
  • Any string can be used. For example, 7.31E-05 (p-value), 0.33456 (mean enrichment value), “up”, “down”, etc.
  • This column is optional.
  1. blockSizes - A comma-separated list of the block sizes.
  2. blockStarts - A comma-separated list of block starts.

bedtools requires that all BED input files (and input received from stdin) are tab-delimited. The following types of BED files are supported by bedtools:

  1. BED3: A BED file where each feature is described by chrom, بداية، و نهاية.
  1. BED4: A BED file where each feature is described by chrom, بداية, نهاية، و اسم.
  1. BED5: A BED file where each feature is described by chrom, بداية, نهاية, اسم، و score.
  1. BED6: A BED file where each feature is described by chrom, بداية, نهاية, اسم, score، و strand.

BED12: A BED file where each feature is described by all twelve columns listed above.

For example: chr1 11873 14409 uc001aaa.3 0 + 11873 11873 0 3 354,109,1189, 0,739,1347,

BEDPE format¶

We have defined a new file format, the browser extensible data paired-end (BEDPE) format, in order to concisely describe disjoint genome features, such as structural variations or paired-end sequence alignments. We chose to define a new format because the existing “blocked” BED format (a.k.a. BED12) does not allow inter-chromosomal feature definitions. In addition, BED12 only has one strand field, which is insufficient for paired-end sequence alignments, especially when studying structural variation.

The BEDPE format is described below. The description is modified from: http://genome.ucsc.edu/FAQ/FAQformat#format1.

  1. chrom1 - The name of the chromosome on which the أول end of the feature exists.
  • Any string can be used. For example, “chr1”, “III”, “myChrom”, “contig1112.23”.
  • This column is required.
  • Use “.” for unknown.
  1. start1 - The zero-based starting position of the أول end of the feature on chrom1.
  • The first base in a chromosome is numbered 0.
  • As with BED format, the start position in each BEDPE feature is therefore interpreted to be 1 greater than the start position listed in the feature. This column is required.
  • Use -1 for unknown.
  1. end1 - The one-based ending position of the first end of the feature on chrom1.
  • The end position in each BEDPE feature is one-based.
  • This column is required.
  • Use -1 for unknown.
  1. chrom2 - The name of the chromosome on which the ثانيا end of the feature exists.
  • Any string can be used. For example, “chr1”, “III”, “myChrom”, “contig1112.23”.
  • This column is required.
  • Use “.” for unknown.
  1. start2 - The zero-based starting position of the ثانيا end of the feature on chrom2.
  • The first base in a chromosome is numbered 0.
  • As with BED format, the start position in each BEDPE feature is therefore interpreted to be 1 greater than the start position listed in the feature. This column is required.
  • Use -1 for unknown.
  1. end2 - The one-based ending position of the ثانيا end of the feature on chrom2.
  • The end position in each BEDPE feature is one-based.
  • This column is required.
  • Use -1 for unknown.
  • Any string can be used. For example, “LINE”, “Exon3”, “HWIEAS_0001:3:1:0:266#0/1”, or “my_Feature”.
  • This column is optional.
  1. score - The UCSC definition requires that a BED score range from 0 to 1000, inclusive. However, bedtools allows any string to be stored in this field in order to allow greater flexibility in annotation features. For example, strings allow scientific notation for p-values, mean enrichment values, etc. It should be noted that this flexibility could prevent such annotations from being correctly displayed on the UCSC browser.
  • Any string can be used. For example, 7.31E-05 (p-value), 0.33456 (mean enrichment value), “up”, “down”, etc.
  • This column is optional.
  1. Any number of additional, user-defined fields - bedtools allows one to add as many additional fields to the normal, 10-column BEDPE format as necessary. These columns are merely “passed through” pairToBed و pairToPair and are not part of any analysis. One would use these additional columns to add extra information (e.g., edit distance for each end of an alignment, or “deletion”, “inversion”, etc.) to each BEDPE feature.

Entries from an typical BEDPE file:

Entries from a BEDPE file with two custom fields added to each record:

GFF format¶

The GFF format is described on the Sanger Institute’s website (http://www.sanger.ac.uk/resources/software/gff/spec.html). The GFF description below is modified from the definition at this URL. All nine columns in the GFF format description are required by bedtools.

  • Any string can be used. For example, “chr1”, “III”, “myChrom”, “contig1112.23”.
  • This column is required.
  1. مصدر - The source of this feature. This field will normally be used to indicate the program making the prediction, or if it comes from public database annotation, or is experimentally verified, etc.
  • This column is required.
  • bedtools accounts for the fact the GFF uses a one-based position and BED uses a zero-based start position.
  1. score - A score assigned to the GFF feature. Like BED format, bedtools allows any string to be stored in this field in order to allow greater flexibility in annotation features. We note that this differs from the GFF definition in the interest of flexibility.
  1. attribute - Taken from http://www.sanger.ac.uk/resources/software/gff/spec.html: From version 2 onwards, the attribute field must have an tag value structure following the syntax used within objects in a .ace file, flattened onto one line by semicolon separators. Free text values must be quoted with double quotes. Note: all non-printing characters in such free text value strings (e.g. newlines, tabs, control characters, etc) must be explicitly represented by their C (UNIX) style backslash-escaped representation (e.g. newlines as ‘n’, tabs as ‘t’). As in ACEDB, multiple values can follow a specific tag. The aim is to establish consistent use of particular tags, corresponding to an underlying implied ACEDB model if you want to think that way (but acedb is not required).

An entry from an example GFF file :

الجينوم file format¶

Some of the bedtools (e.g., genomeCoverageBed, complementBed, slopBed) need to know the size of the chromosomes for the organism for which your BED files are based. When using the UCSC Genome Browser, Ensemble, or Galaxy, you typically indicate which which species/genome build you are working. The way you do this for bedtools is to create a “genome” file, which simply lists the names of the chromosomes (or scaffolds, etc.) and their size (in basepairs).

Genome files must be tab-delimited and are structured as follows (this is an example for C. ايليجانس):

bedtools includes pre-defined genome files for human and mouse in the /genomes directory included in the bedtools distribution.


نتائج

Upregulated DEGs were significantly enriched in cell cycle-related pathways

Many pipelines and strategies exist to aid in the interpretation of omics data. Firstly, we selected suitable datasets and performed canonical DEG screening to characterize ATC. Detailed sample information was listed in Table S1.

The data retrieval process for DEG screening was recorded in Fig. 1A. Using combined effect size method, we filtered out 661 DEGs, including 318 upregulated and 343 downregulated genes. Detailed information on DEGs was provided in Table S2.

After DEG filtering, we performed gene enrichment analysis to characterize the relevant KEGG pathways of these DEGs. As illustrated in Figs. 1B & 1C, upregulated DEGs were significantly enriched in cell cycle-related pathways. Meanwhile, downregulated DEGs were primarily enriched in thyroid hormone synthesis pathway.

The above results indicated that thyroid hormone synthesis pathway was significantly enriched in downregulated DEGs. We were not surprise to see that, as degenerative phenotypes are classic manifestations of ATC (Molinaro et al., 2017).

As indicated by previous literature (Evans et al., 2012 Pita et al., 2014), dyregulation of cell cycle-related pathways are important feature and potential driver of ATC. Hence, in the present work, we primarily focused on cell cycle-related key genes. We further validated the enrichment of KEGG pathway ‘دورة الخلية’ using flexible GSVA method. As illustrated in Fig. 1D, pathway ‘دورة الخلية’ was differentially enriched between ATC and normal thyroid tissue, with adjusted ص value < 0.0001.

Detecting gene modules using WGCNA

Next, we decided to apply an unsupervised clustering algorithm WGCNA to explore the co-expression network and find if there was any gene cluster highly related to ATC. Using WGCNA (Langfelder & Horvath, 2008), we can identify the correlations among genes and cluster genes into ‘gene modules’. By quantifying the associations between these gene modules and ATC, we can filter out potential key gene modules for further analysis.

As an advanced data mining algorithm, WGCNA has high demands on sample size. To make the full use of data and produce more robust results, we re-screened and re-selected the data (Fig. 2A). Detailed sample information was listed in Table S1.

The top 5,000 genes with the highest variance were loaded for module detection. As shown in Fig. 2B, several gene modules were identified by WGCNA. Then, we calculated out the correlations between these modules and ATC using each module’s eigengene. A total of five gene modules were identified as positively correlated with ATC (ص & lt 0.05). Among them, module turquoise had the highest correlation coefficient.

Identifying module turquoise as a potential key cycle-related module

After module detection, we can further uncover key gene modules by gene enrichment analysis focused on genes’ involvement in pathways. As the above analysis revealed that upregulated genes were enriched in cell cycle-related pathways, next we want to explore if any cell cycle-enriched gene module can be detected.

As illustrated in Fig. 3A, KEGG enrichment analysis revealed that cell cycle-related pathways were significantly enriched in genes of module turquoise. GSVA method confirmed the enrichment (Fig. 3B) with adjusted ص value < 0.0001. No other gene module with relevant to ATC (ص < 0.05, both positively and negatively correlated) showed the enrichment of cell cycle-related pathways (Table S3). Next, we will choose module turquoise as a cell cycle-related key gene module and perform further exploration.

Figure 3: Module turquoise was significantly enriched in cell cycle-related pathways.

Combining two pipelines to filter out potential cell cycle-related key genes

Genes interact with each other, forming a comprehensive network. For key genes occupying central positions in the regulatory network, even small changes may bring great impact. Hence, we tended to explore gene-gene interaction between these DEGs and tried to uncover key DEGs with potential key function. Based on protein-protein interaction (PPI) network, we identified the top 50 hub DEGs with the highest prediction scores. Interestingly, all the top 50 hub genes were clustered in module turquoise (Fig. 4).

Figure 4: Centrality of the top 50 PPI network-predicted hub DEGs in module turquoise.

The WGCNA algorithm can calculate the eigengene to feature each module. Module membership (MM) was defined as the absolute correlation coefficient between each gene’s expression and the corresponding module eigengene. Genes with high MM value indicate high centrality in the subnetwork. We defined that genes with MM > 0.85 shall be regarded as module’s hub genes. According to the above cut-off criteria, we identified 31 genes predicted as key genes by both PPI network-guided and WGCNA-guided prediction pipelines (Fig. 4). As both the upregulated DEGs and genes of module turquoise were significantly enriched in cell cycle-related pathways, these key genes can be regarded as potential cell cycle-related key genes.

Further filtering of cell cycle-related key genes with cancer/testis expression pattern

Expression of some genes are restricted to germ cells under normal conditions, but may be reactivated and upregulated in tumor. These ‘cancer/testis’ genes harbor potential of being therapeutic targets as they are both immunogenic and critical in tumorigenesis. وانغ وآخرون. recently systematically identified several testis-specific genes (Wang et al., 2016). Based on their publication, we filtered out 10 genes out of 31 predicted key genes as having cancer/testis expression pattern (Fig. 5A). Their expression levels across major organs under physiological conditions were illustrated in Fig. 5B. These genes were further regarded as putative key genes of ATC harboring therapeutic potential.

Figure 5: Identification of 10 genes with cancer/testis expression pattern as putative key genes of ATC harboring therapeutic potential.

We further validate their gene ontology (GO) ‘biological processes (BP)’ classification using ARCHS 4 database. Top 10 GO terms of each putative key gene with highest ض scores were recorded in the Table S4. These annotated GO terms again demonstrated that these putative key genes play key roles in cell cycle-related pathways. Notably, GO annotation revealed that these putative key genes were primarily associated with chromosome segregation, which will be discussed later.

Key genes’ impact on disease-free survival among patients with differentiated thyroid cancer

Next, we decided to further investigate the association between those key genes’ expression and clinical outcomes of thyroid cancer patients. Data from the THCA cohort, TCGA project was utilized. THCA cohort mainly includes differentiated thyroid cancers. Nevertheless, the tumorigenesis and progression of ATC have been widely acknowledged to be a multistep deterioration process that evolved from that of differentiated thyroid cancers (Molinaro et al., 2017). Hence, THCA cohort can still provide valuable information on the functional characterization of key genes in ATC from a pan-thyroid cancer perspective.

As illustrated in Figs. 6A–6E, expression levels of TRIP13, TPX2, DLGAP5, KIF2C و TTK were associated with shorter disease free survival (DFS) among differentiated thyroid cancer. As illustrated in Fig. 6F, patients with more key genes upregulated tended to have shorter DFS (logrank ص = 0.0128) than patients with less key genes upregulated.

Figure 6: Putative key genes’ impact on disease free survival (DFS) among differentiated thyroid cancer patients.


What value type would a chromosome position be in a database or form? - مادة الاحياء

In mammalian cells, the p-arm of many acrocentric chromosomes carry nucleolar organising regions (NORs) which contain genes coding for ribosomal RNA. This is true for all five pairs of acrocentrics in human cells.

CHROMOSOME ANOMALIES: CONSTITUTIONAL versus ACQUIRED, HOMOGENEOUS versus MOSAIC, NUMERICAL versus STRUCTURAL

A chromosome anomaly can be:

    على سبيل المثال 1: a constitutional anomaly having occurred in a parental gamete (e.g. + 21) will be found in each of the cells of the resulting child (homogeneous trisomy 21).

ملحوظة: In practice, when an acquired anomaly is said homogeneous, it only means that no normal cell was karyotyped within the scored sample.

MOSAIC

    على سبيل المثال 1: A non-disjunction (e.g. + 21) having occurred in the zygote after a few cell divisions: Only some of the embryo cells (and later, of the child’s cells) will carry the anomaly (46, XY/47, XY, +21).

* A chromosome anomaly can be:

CHROMOSOME ANOMALIES - MECHANISMS AND NOMENCLATURE

1 - Homogeneous due to meiotic non-disjunction (Figure)

    non disjunction in first meiotic division produces 4 unbalanced gametes.

طاولة: Zygotes produced for each type gamete: Empty boxes indicate a non-viable conceptus. Boxes XX and XY with ° are normal zygotes from normal gametes. Boxes with * are normal zygotes from unbalanced gametes.

الأمشاجا ص XXYYY XXXYYXXYXXYY
ا XXY* XX*XYYXXYXXYY
XXXY-XX-XXY XYYXXXXXYYXXXY
XXXX*XXYXXXXXXYXXYYXXXXXXXXY
XXXXXXXXXYXXXXXXXXY XXXXX
XXXXXXXXXXXXYXXXXX

2 - Homogenous due to a fertilisation anomaly

    digyny: non-expulsion of the 2nd polar body.

Note: Viability of the two daughter cells may differ. In the above-mentioned trisomy 21 example, the clone monosomic for 21 is non-viable and has disappeared.

ملحوظة: Mosaicism is frequent in malignancies, either because normal cells can still be karyotyped, or because the malignant clone produces sub-clones with additional anomalies (clonal evolution).

Visually, chromosomes can appear to break, and broken ends can rejoin in various ways:

retinoblastoma . Normal individuals carry 2 functional copies, but one of these can be inactivated by mutation or removal (loss of heterozygosity) and the cell continues normal function through the normal allele (which is now acting as a tumour suppressor gene). Loss of the second allele by removal (or mutation) leads to the formation of the tumour."

ملحوظة: Many of the structural aberrations formed are cell lethal, and are soon eliminated from the cell population. Of those that survive and are transmitted, the most frequent are translocations, small inversions and deletions.

ملحوظة: Rearranged chromosomes that are transmitted are called derivative chromosomes (der) and they are numbered according to the centromere they carry. Thus a reciprocal translocation between chromosome 7 and chromosome 14 will result in a der(7) and a der(14).

B - Main structural anomalies (Figure)

1 - Reciprocal translocation

Transmission to descendants (constitutional anomalies)

At meiosis, where there is pairing of homologous chromosome segments (normal chromosomes form a bivalent), followed by crossing-over, translocations may form a quadrivalent (tetravalent, in Greek) and this leads to segregation problems. At meiosis anaphase I, chromosomes separate without centromere separation this separation occurs at anaphase 2. Segregation of chromatids in the case of a quadrivalent (Figure) can be according the following:

ملحوظة There will be no mechanical transmission problems at mitosis.

ملحوظة: Reciprocal and Complex translocations can also occur in somatic cells at any time after birth they are particularly frequent in cancer processes.


شاهد الفيديو: شيء اغلب النساء تفلعة برغم ان الرسول ﷺ حرم فعلة حتي لو كان امام الزوج (كانون الثاني 2022).