معلومة

كيف يسبب NHEJ indels؟


كنت أقرأ على CRISPR-cas9 وكيف يعمل وأواجه مشكلة في التفاف رأسي حول كيفية إصلاح NHEJ لـ DSB يمكن أن يتسبب في حدوث indels. ألا يجب على NHEJ فقط لصق خيطي الحمض النووي معًا مرة أخرى؟

أعتقد أنني قرأت في مكان ما أنه إذا تسببت عوامل أخرى في DSB ، مثل مواد كيميائية معينة ، فيمكنها أيضًا إتلاف / تشقق النيوكليوتيدات ؛ يجب إزالة النيوكليوتيدات التالفة وملء الأجزاء المتراكمة بالبوليميراز قبل الربط ، مما قد يؤدي إلى الأخطاء التي تشتهر بها NHEJ.

بما أن cas9 لا يسبب مثل هذا الضرر ، كيف يمكن أن يؤدي إلى indel؟

شكرا.


هذا سؤال ممتع للغاية ولم أفكر فيه من قبل. أكرر خلفية سؤالك.

خلفية

يقوم Cas9 بقطع كل من خيوط الحمض النووي المستهدف في نفس الموقع مما يؤدي إلى قطع نهاية حادة. عادةً ما تؤدي النهايات اللاصقة والنهايات الدقيقة إلى indels بسبب القطع الخارج للنووية وإضافة قواعد إضافية بواسطة pol-µ. السؤال هو كيف تنشأ indels خلال إعادة ربط NHEJ بوساطة من نهايات حادة.


قد لا يؤدي NHEJ دائمًا إلى indels. يمكن إصلاح معظم التخفيضات غير الحادة بدون أخطاء. يتم أيضًا إعادة ربط بعض التخفيضات غير الحادة ؛ أفضل مثال على ذلك هو إعادة تركيب VDJ. يعد ارتباط بروتينات Ku ضروريًا لإعادة الربط بشكل مثالي (NHEJ / C-NHEJ الأساسي).

ومع ذلك ، هناك بعض المسارات غير المتعارف عليها والتي تشمل بدائل NHEJ و NHEJ و NHEJ وعلم التشريح الميكروي (MMEJ) (Bétermier et al. 2014). تشير بعض الدراسات أيضًا إلى كل هذه المسارات كبديل NHEJ أو altNHEJ. تتضمن هذه المسارات البديلة استئصال النيوكليوتيدات بواسطة نوكليازات خارجية مثل Mre11 لإنتاج بروزات. المحاذاة غير الكاملة لهذه الأجزاء المتدلية قبل الربط تؤدي إلى indels. تحدث إضافة النوكليوتيدات في بعض الأحيان من خلال عمل ترانسفيراز ديوكسي ريبونوكليوتيد الطرفي (TdT). يمكن أن يضيف Pol-أيضًا نيوكليوتيدات عشوائية في نهاية 3 (ليبر 2010).

بشكل عام ، سيكون ميل DSBR عبر مسارات NHEJ البديلة أعلى عندما يكون نشاط Ku أقل. حتى مع وجود نشاط Ku معتدل ، هناك دائمًا احتمال وجود مسارات بديلة في العمل. علاوة على ذلك ، تجدر الإشارة إلى أن الأربطة الطرفية اللاصقة أكثر كفاءة من الأربطة الطرفية غير الحادة.


مستنسخة من Bétermier et al. 2014


الفصل الثالث - ديناميكيات ملفات تعريف Indel الناتجة عن طرق توصيل CRISPR / Cas9 المختلفة

يعد إدخال تحرير الجينات CRISPR / Cas9 في خلايا الثدييات طفرة علمية ، والتي أثرت بشكل كبير على الأبحاث الأساسية والعلاج الجيني. تتميز البساطة والوصول العام إلى كواشف CRISPR / Cas9 بطريقة غير مسبوقة "دمقرطة" استهداف الجينات في البحوث الطبية الحيوية ، مما يتيح الهندسة الوراثية لأي جين في أي خلية أو نسيج أو عضو أو كائن حي. تعد القدرة على تحديد ملامح سريعة ودقيقة وفعالة لعمليات الإدخال والحذف (indels) التي يسببها الكسر المزدوج ، بوساطة أي من النيوكليازات المتاحة القابلة للبرمجة ، أمرًا بالغ الأهمية لأي نهج محدد لاستهداف الجينات. في هذه الدراسة ، نراجع طرق الكشف عن indel الأكثر شيوعًا وباستخدام طريقة كشف Indel قوية وحساسة وفعالة من حيث التكلفة بواسطة طريقة تحليل Amplicon ، قمنا بالتحقيق في تأثير تنسيقات توصيل CRISPR / Cas9 الأكثر شيوعًا ، بما في ذلك نقل الفيروس البطيء ، والبلازميد lipofection ، و electroporation البروتين النووي الريبي ، على ديناميات تشكيل ملف التعريف indel. نلاحظ تشكيل indel السريع باستخدام Electroporation للـ RNP ، خاصة مع gRNA التركيبي المستقر ، بالإضافة إلى الانخفاض طويل الأجل في تردد indel الكلي باستخدام طرق تعداء البلازميد القائمة على الدهون. تصل معظم الطرق إلى ذروة التحرير في اليوم 2-3 بعد التسليم. علاوة على ذلك ، نجد زيادة نسبية في تواتر حجم indels الأكبر حجمًا (& gt6 bp) بشرط التحرير المستمر باستخدام متجهات gRNA و Cas9 المدمجة بشكل ثابت.


إنديل

إنديل هو مصطلح البيولوجيا الجزيئية ل فيسيرتيون أو ديلetion من القواعد في جينوم الكائن الحي. يتم تصنيفها بين الاختلافات الجينية الصغيرة ، والتي تقيس من 1 إلى 10000 زوج أساسي في الطول ، [1] [2] [3] [4] [5] [6] [7] بما في ذلك أحداث الإدراج والحذف التي يمكن فصلها عن طريق سنوات عديدة ، وقد لا تكون مرتبطة ببعضها البعض بأي شكل من الأشكال. [8] أ ميكروينديل يُعرَّف بأنه indel الذي ينتج عنه صافي تغيير من 1 إلى 50 نيوكليوتيد. [9]

في مناطق الترميز في الجينوم ، ما لم يكن طول indel مضاعفًا لـ 3 ، فسوف ينتج عنه طفرة في الإطارات. على سبيل المثال ، ميكروينديل شائع ينتج عنه تغيير في الإطار يسبب متلازمة بلوم في السكان اليهود أو اليابانيين. [10] يمكن مقارنة Indels بـ a طفرة نقطة. يُدرج indel ويحذف النيوكليوتيدات من تسلسل ، بينما الطفرة النقطية هي شكل من أشكال الاستبدال يستبدل أحد النيوكليوتيدات دون تغيير الرقم الإجمالي في الحمض النووي. يمكن أيضًا مقارنة Indels مع الطفرات الأساسية الترادفية (TBM) ، والتي قد تنتج عن آليات مختلفة تمامًا. [11] يتم تعريف TBM على أنه استبدال في النيوكليوتيدات المجاورة (في المقام الأول بدائل في اثنين من النيوكليوتيدات المجاورة ، ولكن لوحظت البدائل في ثلاثة نيوكليوتيدات متجاورة). [12]

يمكن استخدام Indels ، إما عمليات الإدراج أو الحذف ، كعلامات وراثية في المجموعات الطبيعية ، خاصة في دراسات علم الوراثة. [13] [14] لقد ثبت أن المناطق الجينومية ذات الإنديلات المتعددة يمكن استخدامها أيضًا في إجراءات تحديد الأنواع. [15] [16] [17]

ينتج عن تغيير indel لزوج أساسي واحد في جزء الترميز من mRNA تغيير إطار أثناء ترجمة mRNA مما قد يؤدي إلى كودون إيقاف غير مناسب (سابق لأوانه) في إطار مختلف. تعد Indels التي ليست مضاعفات 3 غير شائعة بشكل خاص في مناطق التشفير ولكنها شائعة نسبيًا في المناطق غير المشفرة. [18] [19] هناك ما يقرب من 192-280 إندل لتغيير الإطارات في كل شخص. [20] من المرجح أن يمثل Indels ما بين 16٪ و 25٪ من جميع تعدد الأشكال المتسلسلة في البشر. [1] في الواقع ، في معظم الجينومات المعروفة ، بما في ذلك البشر ، يميل تواتر indel إلى أن يكون أقل بشكل ملحوظ من تعدد أشكال النوكليوتيدات المفردة (SNP) ، باستثناء المناطق القريبة من التكرار للغاية ، بما في ذلك البوليمرات المتجانسة والسواتل الصغيرة. [ بحاجة لمصدر ]

تم اختيار مصطلح "indel" في السنوات الأخيرة من قبل علماء الجينوم لاستخدامه بالمعنى الموصوف أعلاه. هذا تغيير عن استخدامه الأصلي ومعناه ، والذي نشأ من علم اللاهوت النظامي. في علم اللاهوت النظامي ، يمكن للباحثين العثور على اختلافات بين التسلسلات ، مثل من نوعين مختلفين. لكن كان من المستحيل استنتاج ما إذا كان أحد الأنواع قد فقد التسلسل أو اكتسبته الأنواع الأخرى. على سبيل المثال ، الأنواع أ لديه سلسلة من 4 جي نيوكليوتيدات في مكان معين وأنواع ب لديه 5 جي في نفس المكان. إذا كان وضع الاختيار غير معروف ، فلا يمكن للمرء أن يعرف ما إذا كانت الأنواع A قد فقدت واحدًا G (حدث "حذف") أو الأنواع B قد اكتسبت واحدًا G (حدث "إدراج"). عندما لا يمكن للمرء أن يستنتج اتجاه النشوء والتطور للتسلسل التغيير ، يشار إلى حدث تغيير التسلسل باسم "indel". [ بحاجة لمصدر ]


الاختلاف المستقل على الكروموزوم البشري 22

ركزت الجهود الأولى واسعة النطاق لتحديد INDELs في الجينوم البشري على الكروموسوم البشري 22 (23 ، 24). موليكين وآخرون. (23) قام بتحليل بيانات إعادة تسلسل ABI من 31 شخصًا لتحديد الاختلاف الجيني على الكروموسوم 22 وحدد أن 13 ٪ من المتغيرات على هذا الكروموسوم كانت عبارة عن تعدد أشكال INDEL. داوسون وآخرون. (24) حددت لاحقًا مجموعات كثيفة من كل من SNPs و INDELs على الكروموسوم 22 من خلال مقارنة التسلسلات المتداخلة للكروموسوم الاصطناعي الجرثومي المجاور (BAC) والكروموسوم الاصطناعي المشتق من P1 (P1) المستنسخات. تم إنشاء مكتبات BAC و P1 التي تم إنشاؤها لتسلسل الكروموسوم 22 من تسعة أفراد ثنائي الصيغة الصبغية متنوعين وتضم 18 نمطًا فرديًا مختلفًا. لذلك ، يمكن اكتشاف التباين الجيني الجديد بسهولة من خلال مقارنة التسلسلات المتداخلة للنسخ المجاورة. تم تحديد إجمالي 10 051 SNPs و 2180 INDELs صغيرًا من 358 منطقة متداخلة تمت مقارنتها [13.2 ميجا بايت من الحمض النووي المتداخل (24)]. اقترحت هذه الدراسات أن INDELs الصغيرة من المحتمل أن تكون وفيرة في الجينوم البشري (82٪ من المتغيرات التي تم اكتشافها كانت SNPs و 18٪ كانت INDELs). تم تأكيد اثنين وتسعين بالمائة من هذه المتغيرات في دراسات التحقق من المتابعة (الجدول & # x000a0 1).

جدول & # x000a01.

اكتشاف INDEL في المجموعات البشرية والجينومات الشخصية

يذاكرعامعدد INDELsفرادى)طريقةنطاق حجم INDEL (بي بي)دراسة التحقق أ معدل (٪)
السكان البشريون
& # x02003Mullikin وآخرون. (23)2000NR ب 31رسم خرائط تتبع ABINRاختصار الثانيغير متاح
& # x02003Dawson وآخرون. (24)200121809 ج تداخل BACNRPCR / RFLP / الغازي92
& # x02003Weber وآخرون. (13)20022000NRمتنوع2 & # x0201355PCR58
& # x02003Bhangale وآخرون. (14)20052393137PCR / التسلسل1 & # x02013543اختصار الثانيغير متاح
& # x02003Bhangale وآخرون. (25)20061126تشفيرPCR / التسلسلمن 1 إلى 30التفتيش اليدوي100
& # x02003 ميلز وآخرون. (15)2006415 43636رسم خرائط تتبع ABI1 & # x020139989PCR97
& # x02003Kidd وآخرون. (22)2008796 2738رسم خرائط تتبع ABI1 & # x02013100ND د 96
& # x02003R.E. المطاحن وآخرون. (مقدم للنشر)20101.96 مليون79 هـ رسم خرائط تتبع ABI1 & # x0201310 000PCR و 97
الجينوم البشري الشخصي
& # x02003Levy وآخرون. (1)2007823 396فينترABI1 & # x0201382 711PCR84 & # x02013100 ز
& # x02003 ويلر وآخرون. (2)2008222 718واتسون4542 & # x0201338896PCR70 ساعة
& # x02003Wang وآخرون. (3)2008135 262هان الصينيةIllumina / صابون1 & # x020133PCR90 & # x02013100
& # x02003 بنتلي وآخرون. (4)2008400000 ط يوروبانIllumina / ELAND / MAQ1 & # x0201316اختصار الثانيغير متاح
& # x02003Ley وآخرون. (5)2008726 ساعة AMLIllumina / مخصص1 & # x0201330PCR93 ج
& # x02003Ahn وآخرون. (7)2009342 965الكورية (SJK)Illumina / MAQ1 & # x0201326PCR100 ح ، ك
& # x02003Kim وآخرون. (6)2009170 202كوري (AK1)إلومينا / ألفيوس1 & # x0201329إعادة التسلسل100
& # x02003Schuster وآخرون. (8)2010NRالأفريقيغير متاحغير متاحغير متاحغير متاح

NR ، لم يتم الإبلاغ عنه ND ، لم يتم N / A ، لا ينطبق.

تم تعريفها على أنها دراسة تفحص مجموعة مختارة عشوائيًا من متغيرات INDEL المتوقعة في البشر الحقيقيين ثم قياس معدل تأكيد المتغيرات المتوقعة باستخدام اختبار مثل PCR-RFLP أو تسلسل PCR أو التنميط الجيني للمصفوفة الدقيقة أو اختبار مماثل.

ب 13٪ من المتغيرات كانت INDELs.

ج مكتبات BAC / PAC (تمثل كل منها إنسانًا).

d SSAHA-DIP ، الذي تم استخدامه للكشف عن INDELs ، لديه معدل تحقق من 96 ٪ (46).

هـ - عدد البشر أو المكتبات (كل مكتبة تمثل إنسانًا).

و تم استخدام خط الأنابيب الذي تم تطويره واختباره أعلاه (15) في هذه الدراسة.

تم تأكيد g 36/43 (84٪) من 100 & # x020131000 bp إدخالات متماثلة اللواقح و 15/15 (100٪) من 1 & # x020138 bp INDELs التي تم فحصها.

ي 24/26 (93٪) من المرشحين الذين تم فحصهم بنجاح تم التحقق من صحتها.

تم التحقق من صحة ك 9/9 (100 ٪) من INDELs التي تم فحصها.


الملخص

تعد فواصل الحمض النووي المزدوجة (DSBs) أخطر أنواع تلف الحمض النووي لأنها يمكن أن تؤدي إلى فقدان مناطق صبغية كبيرة. في جميع خلايا الثدييات ، يتم إصلاح DSBs التي تحدث في جميع أنحاء دورة الخلية في الغالب عن طريق مسار الانضمام إلى نهاية الحمض النووي غير المتماثل (NHEJ). تؤدي العيوب في NHEJ إلى الحساسية للإشعاع المؤين واستئصال الخلايا الليمفاوية. يستخدم مسار NHEJ البروتينات التي تتعرف على نهايات الحمض النووي وتقطعها وتبلمرها وتربطها بطريقة مرنة. تسمح هذه المرونة لـ NHEJ بالعمل على مجموعة واسعة من تكوينات نهاية الحمض النووي ، مع وجود تقاطعات DNA التي تم إصلاحها غالبًا تحتوي على طفرات. في هذه المراجعة ، نناقش أحدث النتائج المتعلقة بالمشاركة النسبية لبروتينات NHEJ المختلفة في إصلاح تكوينات نهاية الحمض النووي المختلفة. نناقش أيضًا تحويل إصلاح نهاية الحمض النووي إلى المسارات المساعدة لربط الطرف البديل (a-EJ) أو التلدين أحادي الخيط (SSA) وأهمية هذه المسارات المختلفة للأمراض البشرية.


باينز ، جي ، فريد ، إي إف ، وينكلر ، جي دي وأمبير جيل ، آر تي إعادة التركيب البكتيري: هندسة الجينوم عبر إعادة التركيب المتماثل القائم على الملتهمة. Acs Synth Biol 4 ، 1176-1185 ، دوى: 10.1021 / acssynbio.5b00009 (2015).

جو ، ب.ف وآخرون. استراتيجية سريعة وموثوقة للتكامل الكروموسومي للجين (الجينات) مع نسخ متعددة. Sci Rep-Uk 5 ، دوى: ARTN968410.1038 / srep09684 (2015).

Smanski ، M. J. et al. البيولوجيا التركيبية للوصول إلى التنوع الكيميائي للطبيعة وتوسيعه. Nat Rev Microbiol 14، 135–149، doi: 10.1038 / nrmicro.2015.24 (2016).

Esvelt، K. M. & amp Wang، H.H. هندسة مقياس الجينوم للأنظمة والبيولوجيا التركيبية. مول سيست بيول 9 ، 641 ، دوى: 10.1038 / msb.2012.66 (2013).

Thomason، L.C، Sawitzke، J.A، Li، X.، Costantino، N. & amp Court، D.L Recombineering: الهندسة الوراثية في البكتيريا باستخدام إعادة التركيب المتماثل. Curr Protoc Mol Biol 106، 1 1611–1116 39، doi: 10.1002 / 0471142727.mb0116s106 (2014).

مورفي ، ك.ج.استخدام وظائف إعادة تركيب البكتيريا لامدا لتعزيز استبدال الجينات في الإشريكية القولونية. J Bacteriol 180 ، 2063-2071 (1998).

Zhang، Y.، Buchholz، F.، Muyrers، J.P & amp Stewart، A.F. منطق جديد لهندسة الحمض النووي باستخدام إعادة التركيب في الإشريكية القولونية. نات جينيه 20 ، 123-128 ، دوى: 10.1038 / 2417 (1998).

Datsenko، K.A & amp Wanner، B. L. خطوة واحدة لإبطال نشاط الجينات الصبغية في الإشريكية القولونية K-12 باستخدام منتجات PCR. P Natl Acad Sci USA 97، 6640–6645، doi: DOI 10.1073 / pnas.120163297 (2000).

زيتون ، ر. إ. وآخرون. التتبع المضاعف للطفرات الجينية التوافقية في مجموعات الخلايا المهندسة. Nat Biotechnol 33 ، 631-637 ، دوى: 10.1038 / nbt.3177 (2015).

Jiang، W. Y.، Bikard، D.، Cox، D.، Zhang، F. & amp Marraffini، L. Nat Biotechnol 31 ، 233-239 ، دوى: 10.1038 / nbt.2508 (2013).

ران ، إف إيه وآخرون. شق مزدوج بواسطة CRISPR Cas9 الموجه من RNA لتحسين خصوصية تحرير الجينوم. الخلية 155 ، 479-480 ، دوى: 10.1016 / j.cell.2013.09.040 (2013).

Luo، M. L.، Leenay، R. T. & amp Beisel، C.L. الآفاق الحالية والمستقبلية للأدوات القائمة على كريسبر في البكتيريا. Biotechnol Bioeng 113 ، 930-943 ، دوى: 10.1002 / بت 25851 (2016).

كونغ ، ل. وآخرون. هندسة الجينوم المتعدد باستخدام أنظمة CRISPR / Cas. Science 339 ، 819-823 ، دوى: 10.1126 / العلوم .1231143 (2013).

مالي ، P. وآخرون. هندسة الجينوم البشري الموجهة RNA عبر Cas9. Science 339 ، 823-826 ، دوى: 10.1126 / العلوم .1232033 (2013).

Mao ، Z. ، Bozzella ، M. ، Seluanov ، A. & amp Gorbunova ، V. إصلاح الحمض النووي عن طريق الانضمام غير المتماثل وإعادة التركيب المتماثل أثناء دورة الخلية في الخلايا البشرية. دورة الخلية 7 ، 2902 - 2906 (2008).

Bowater، R. & amp Doherty، A.J. تلبية الاحتياجات: إصلاح التشققات في الحمض النووي البكتيري عن طريق الالتحام غير المتماثل. بلوس جينيت 2 ، إي 8 ، دوى: 10.1371 / journal.pgen.0020008 (2006).

Bassing، C.H & amp Alt، F. W. الاستجابة الخلوية للكسر المزدوج للحمض النووي العام والمبرمج. إصلاح الحمض النووي 3 ، 781-796 ، دوى: 10.1016 / j.dnarep.2004.06.001 (2004).

جمعة ، أ. إيه وآخرون. إزالة قابلة للبرمجة للسلالات البكتيرية باستخدام أنظمة CRISPR-Cas التي تستهدف الجينوم. MBio 5 ، e00928–00913 ، دوى: 10.1128 / mBio.00928-13 (2014).

Citorik ، R. J. ، Mimee ، M. & amp Lu ، T. K. مضادات الميكروبات الخاصة بالتسلسل باستخدام نوكليازات موجهة بكفاءة RNA. Nat Biotechnol 32 ، 1141-1145 ، دوى: 10.1038 / nbt.3011 (2014).

Aravind، L. & amp Koonin، E. V. متماثلات بدائية النواة لبروتين رابط الحمض النووي حقيقي النواة Ku ، مجالات جديدة في بروتين Ku والتنبؤ بنظام إصلاح كسر الخيط المزدوج بدائية النواة. Genome Res 11، 1365–1374، doi: DOI 10.1101 / gr.181001 (2001).

ديلا ، م وآخرون. تشكل بروتينات Mycobacterial Ku و ligase آلة إصلاح NHEJ المكونة من عنصرين. Science 306، 683–685، doi: 10.1126 / science.1099824 (2004).

Brissett، N.C & amp Doherty، A.J. ج. إصلاح الفواصل المزدوجة للحمض النووي عن طريق مسار الانضمام النهائي غير المتماثل بدائية النواة. Biochem Soc T 37 ، 539-545 ، دوى: 10.1042 / Bst0370539 (2009).

تونج ، واي. ، تشاروسانتي ، ب ، زانج ، إل ، ويبر ، ت. & أمبير لي ، إس واي. كريسبر-كاس 9 الهندسة القائمة على جينومات الفطر الشعاعي. Acs Synth Biol 4 ، 1020-1029 ، دوى: 10.1021 / acssynbio.5b00038 (2015).

Caliando ، B. J. & amp Voigt ، C. A. التدهور المستهدف للحمض النووي باستخدام جهاز CRISPR يحمل بثبات في جينوم المضيف. نات كومون 6 ، 6989 ، دوى: 10.1038 / ncomms7989 (2015).

Malyarchuk، S. et al. التعبير عن السل الفطري Ku و Ligase D في الإشريكية القولونية ينتج عنه انضمام نهاية الحمض النووي المستقل لـ RecA و RecB في مناطق علم الميكروهومولوجيا. إصلاح الحمض النووي (أمست) 6 ، 1413-1424 ، دوى: 10.1016 / j.dnarep.2007.04.004 (2007).

جينك ، م وآخرون. نوكلياز DNA داخلي قابل للبرمجة مزدوج RNA موجه في المناعة البكتيرية التكيفية. Science 337 ، 816-821 ، دوى: 10.1126 / العلوم .1225829 (2012).

باجانو ، إيه وآخرون. وحدات نسخ صغيرة جديدة تشبه جينات الحمض النووي الريبي النووي كمصادر للنصوص التنظيمية. بلوس جينيت 3 ، 174–184 ، دوى: ARTN e110.1371 / journal.pgen.0030001 (2007).

Wang ، T. ، Wei ، J. J. ، Sabatini ، D. M. & amp Lander ، E. S. شاشات وراثية في الخلايا البشرية باستخدام نظام CRISPR-Cas9. Science 343، 80–84، دوى: 10.1126 / العلوم .1246981 (2014).

لي ، واي إف وآخرون. هندسة التمثيل الغذائي الإشريكية القولونية باستخدام تحرير الجينوم المتأمل CRISPR-Cas9. متعب إنج 31 ، 13-21 ، دوى: 10.1016 / j.ymben.2015.06.006 (2015).

Santos، C.N، Regitsky، D. & amp Yoshikuni، Y. تنفيذ أنظمة بيولوجية مستقرة ومعقدة من خلال هندسة الجينوم بمساعدة إعادة التركيب. نات كومون 4 ، 2503 ، دوى: 10.1038 / ncomms3503 (2013).

وانج هـ وآخرون. تحسين الطفرات السلس عن طريق إعادة الجمع باستخدام ccdB للانتخاب المضاد. الأحماض النووية Res 42، e37، doi: 10.1093 / nar / gkt1339 (2014).

Ellis ، H. M. ، Yu ، D.G ، DiTizio ، T. & amp Court ، D. P Natl Acad Sci USA 98، 6742–6746، doi: 10.1073 / pnas.121164898 (2001).

وانج هـ. وآخرون. برمجة الخلايا عن طريق هندسة الجينوم المتعدد وتسريع التطور. Nature 460، 894–898، doi: 10.1038 / nature08187 (2009).

Ronda، C.، Pedersen، L. E.، Sommer، M. O. & amp Nielsen، A. T. CRMAGE: CRISPR الأمثل لإعادة تجميع MAGE. Sci Rep 6 ، 19452 ، دوى: 10.1038 / srep19452 (2016).

Kolisnychenko، V. et al. هندسة مخفضة الإشريكية القولونية الجينوم. Genome Res 12، 640–647، doi: 10.1101 / gr.217202 (2002).

Tuntufye، H. N. & amp Goddeeris، B. M. الإشريكية القولونية. FEMS Microbiol Lett 325 ، 140–147 ، دوى: 10.1111 / j.1574-6968.2011.02421.x (2011).

جيانغ ، واي وآخرون. تحرير متعدد الجينات في الإشريكية القولونية الجينوم عبر نظام CRISPR-Cas9. أبيل إنفيرون ميكروبيول 81 ، 2506-2514 ، دوى: 10.1128 / AEM.04023-14 (2015).

Pyne، M. E.، Moo-Young، M.، Chung، D. E.A & amp Chou، C.P. يتيح اقتران نظام CRISPR / Cas9 بإعادة تركيب لامدا الأحمر استبدال الجينات الصبغية المبسطة في الإشريكية القولونية. أبل إنفيرون ميكروب 81 ، 5103-5114 ، دوى: 10.1128 / Aem.01248-15 (2015).

Reisch، C.R & amp Prather، K.L J. نظام no-SCAR (إعادة التركيب بمساعدة Cas9 بدون ندبات) لتحرير الجينوم في الإشريكية القولونية. Sci Rep-Uk 5 ، دوى: ARTN 1509610.1038 / srep15096 (2015).

Lv ، L. ، Ren ، Y.L ، Chen ، J.C ، Wu ، Q. & amp Chen ، G.Q. تطبيق CRISPRi لهندسة التمثيل الغذائي بدائية النواة التي تنطوي على جينات متعددة ، دراسة حالة: التخليق الحيوي P (3HB-co-4HB) القابل للتحكم. متعب إنج 29 ، 160–168 ، دوى: 10.1016 / j.ymben.2015.03.013 (2015).

بيكارد ، د. وآخرون. قمع قابل للبرمجة وتنشيط التعبير الجيني البكتيري باستخدام نظام CRISPR-Cas المصمم هندسيًا. الأحماض النووية Res 41، 7429–7437، doi: 10.1093 / nar / gkt520 (2013).

Altenbuchner، J. تحرير العصوية الرقيقة الجينوم بواسطة نظام CRISPR-Cas9. أبل إنفيرون ميكروبيول ، دوى: 10.1128 / AEM.01453-16 (2016).

Standage-Beier، K.، Zhang، Q. & amp Wang، X. استهدفت الحذف واسع النطاق للجينومات البكتيرية باستخدام كريسبر نيكازات. Acs Synth Biol 4 ، 1217-1225 ، دوى: 10.1021 / acssynbio.5b00132 (2015).

عواقب انقسام Cas9 في كروموسوم الإشريكية القولونية. الأحماض النووية Res ، دوى: 10.1093 / nar / gkw223 (2016).

بيترز ، جي إم وآخرون. كريسبر البكتيرية: الإنجازات والتوقعات. Curr Opin Microbiol 27 ، 121-126 ، دوى: 10.1016 / j.mib.2015.08.007 (2015).

شو ، ت. وآخرون. تحرير الجينوم الفعال بتنسيق المطثية السليلولية عبر نيكا كريسبر- Cas9. أبيل إنفيرون ميكروبيول 81 ، 4423-4431 ، دوى: 10.1128 / AEM.00873-15 (2015).

Shee، C.، Ponder، R.، Gibson، J.L & amp Rosenberg، S.M. ما الذي يحد من كفاءة الطفرة التي يسببها الإجهاد المزدوج الخيط المعتمد على الكسر في الإشريكية القولونية؟ J Mol Microb Biotech 21، 8–19، doi: 10.1159 / 000335354 (2011).

Shee، C.، Gibson، J.L، Darrow، M.C، Gonzalez، C. & amp Rosenberg، S. M. الإشريكية القولونية. Proc Natl Acad Sci USA 108 ، 13659-13664 ، دوى: 10.1073 / pnas.1104681108 (2011).

Zhu، L.J، Li، Y. & amp Cai، Z. الإشريكية القولونية لتحسين تحمل الإجهاد. Biotechnol Biofuels 8 ، دوى: ARTN 9310.1186 / s13068-015-0276-1 (2015).

جيبسون ، دي جي وآخرون. تجميع إنزيمي لجزيئات الحمض النووي يصل إلى عدة مئات من الكيلوبات. طرق نات 6 ، 343-345 ، دوى: 10.1038 / نميث 1318 (2009).


محتويات

إصلاح MMEJ منخفض في طور G0 / G1 ولكنه يزداد خلال طور S و G2 من دورة الخلية. [3] في المقابل ، يعمل NHEJ في جميع أنحاء دورة الخلية ، ولا يعمل إعادة التركيب المتماثل (HR) إلا في أواخر S و G2.

يعد اختيار المسار المستخدم لإصلاح كسر حبال مزدوج أمرًا معقدًا. في معظم الحالات ، تمثل MMEJ نسبة طفيفة (10٪) من إصلاح كسر الخصلة المزدوجة ، على الأرجح في الحالات التي يتم فيها استئصال كسر الخيط المزدوج ولكن لا يتوفر الكروماتيد الشقيق لإعادة التركيب المتماثل. [3] الخلايا التي تكون ناقصة في NHEJ الكلاسيكي أو HR عادةً تعرض زيادة MMEJ. تقوم عوامل إعادة التركيب المتجانسة البشرية بقمع MMEJ المطفر بعد استئصال كسر الشريطة المزدوجة. [8]

يُظهر نظام الفحص الكيميائي الحيوي أن 6 جينات على الأقل مطلوبة للانضمام إلى النهاية بوساطة علم الأحياء الدقيقة: FEN1 و Ligase III و MRE11 و NBS1 و PARP1 و XRCC1. [9] كل هذه الجينات الستة منظمة في واحد أو أكثر من أنواع السرطان. في البشر ، يلعب DNA polymerase theta ، المشفر بواسطة جين POLQ ، دورًا رئيسيًا في ربط النهاية بوساطة علم الأحياء الدقيقة. [7] يستخدم Polymerase theta مجال الهلياز الخاص به لتحل محل بروتين النسخ A (RPA) من نهايات الحمض النووي وتعزيز التلدين الميكروبيولوجي. [6] يستخدم Polymerase thta أيضًا نشاط البوليميراز الخاص به لإجراء تخليق ملء ، مما يساعد على استقرار الأطراف المزدوجة.

ما يقرب من نصف جميع سرطانات المبيض تعاني من نقص في إعادة التركيب المتماثل (HR). تعمل هذه الأورام التي تعاني من نقص الموارد البشرية على تنظيم بوليميراز ثيتا (POLQ) ، مما يؤدي إلى زيادة في MMEJ. [10] تعتمد هذه الأورام بشكل مفرط على MMEJ ، لذلك تؤدي ضربة قاضية لـ polymerase theta إلى نسبة فتك كبيرة. في معظم أنواع الخلايا ، تقدم MMEJ مساهمة طفيفة في إصلاح كسر السلاسل المزدوجة. قد يمثل الاعتماد المفرط للأورام التي تعاني من نقص الموارد البشرية على MMEJ هدفًا دوائيًا محتملاً لعلاج السرطان.

يتضمن MMEJ دائمًا عمليات الإدراج أو الحذف ، بحيث يكون مسارًا مسببًا للطفرات. [11] قد يكون للخلايا ذات زيادة MMEJ عدم استقرار جيني أعلى وميل نحو تطور السرطان ، على الرغم من أن هذا لم يتم إثباته بشكل مباشر.

Penaeus monodon هي قشريات بحرية تستهلك على نطاق واسع لقيمتها الغذائية. يمكن أن يحدث إصلاح الكسور المزدوجة في هذا الكائن الحي بواسطة HRR ، لكن NHEJ غير قابل للكشف. [12] بينما يبدو أن معدل ضربات القلب HRR هو المسار الرئيسي لإصلاح الانكسار المزدوج ، وجد أيضًا أن MMEJ تلعب دورًا مهمًا في إصلاح فواصل الحمض النووي المزدوجة. [12]


نتائج

حاولنا استبدال HPRT1 جزيرة CpG مع الحمض النووي الميثلي في المختبر باستخدام NHEJ بوساطة كريسبر (الشكل 1 أ). تحقيقا لهذه الغاية ، فإن HPRT1 جزيرة CpG ، والتي تتداخل مع أول exon لـ HPRT1 بما في ذلك جزء من ORF ، تم استنساخه من الحمض النووي الجيني البشري (الشكل 1 ب). تم إدخال اثنين من SNVs المترادفتين في تسلسل الترميز لأول إكسون في بنية البلازميد المستنسخة لتوليد أليل أول يمكن تمييزه عن تسلسل جزيرة CpG من النوع البري. من بناء البداية ، تم إنشاء أليل ثان أيضًا عن طريق إدخال SNVs مترادفين في مواقع مختلفة عن تلك المستخدمة في الأليل الأول. نظرًا لأن المواضع المستخدمة لـ SNVs المترادفة في الأليلين كانت مختلفة ، كانت الأليلات يمكن تمييزها عن بعضها البعض وكذلك عن التسلسل من النوع البري. تم تضخيم أليلات جزيرة CpG لتضخيم تفاعل البوليميراز المتسلسل (PCR) لجعلها خطية ثم ميثيلها في المختبر باستخدام إنزيم M.SssI. من خلال البادئات المستخدمة لهذا PCR ، تم إدخال الطفرات في المواقع المقابلة لموقع PAM لأهداف الدليل المقصود من RNA ، من أجل تقليل احتمالية إعادة القطع بواسطة Cas9 بعد أي أحداث إدخال ناجحة (الشكل 1 ب ، ملف إضافي 1 : الشكل S1).

أليل ميثيل 1 وأليل 2 غير ميثيل ، جنبًا إلى جنب مع البلازميدات التي توجه تعبير Cas9-2A-GFP وتوجيه الحمض النووي الريبي الذي يستهدف نهايات 1120-bp HPRT1 جزيرة CpG ، تم نقلها بشكل مشترك إلى لوحة واحدة من خلايا Hap1. تم إجراء التجربة المتبادلة ، أي باستخدام نسخة ميثيلية من الأليل 2 ونسخة غير ميثلة من الأليل 1 ، بشكل متوازٍ ، كشكل من أشكال النسخ المتماثل وكذلك للتحكم في أي تأثيرات للطفرات المترادفة (الشكل 1 ج). تم إجراء كل من التجارب الأولية والمتبادلة في ثلاث نسخ. النقطة الأساسية هي أنه مع هذا التصميم التجريبي ، تسمح الأليلات للفرد باستنتاج ما إذا كان تم إدخال الأمبليكون الميثيل أو غير الميثيل ، دون الحاجة إلى تحويل ثنائي سلفيت قبل التسلسل.

في 48 ساعة بعد تعداء العدوى ، تم فرز 100000 خلية إيجابية GFP بواسطة FACS وإعادتها إلى الثقافة لمدة 7 أيام. تشير إيجابية GFP إلى أن هذه الخلايا تم نقلها بنجاح. في هذه المرحلة ، تم حصاد نصف الخلايا من كل طبق ("الاختيار المسبق" في الشكل 1 ج) وتم تقسيم النصف المتبقي من الخلايا إلى طبقين. إلى طبق واحد ، تمت إضافة 6-TG كعامل اختيار ("تم اختيار 6-TG" في الشكل 1 ج) ، وإلى الطبق الآخر ، تمت إضافة DMSO كعنصر تحكم في السيارة ("تم اختيار المحاكاة" في الشكل 1 ج). بعد 11 يومًا ، تم حصاد الخلايا واستخلاص الحمض النووي الجيني و HPRT1 تم تضخيم جزيرة CpG وتسلسلها.

استنادًا إلى التسلسل ، تم حساب الترددات النسبية للأليلات الميثيلية وغير الميثيلية ومقارنتها بين عينات الاختيار المسبق والاختيار الوهمي والعينات المختارة بـ 6 تيراغرام. تعتمد هذه الترددات على نتائج تحرير الجينوم ، مما يؤدي إلى البقاء أو الموت تحت اختيار 6-TG (الشكل 1 د). تشمل نتائج التحرير المحتملة حذف المقطع المتداخل ، أو إعادة إدخال جزيرة CpG الأصلية من النوع البري ، أو إدخال الأليل الميثيلي المنقول أو غير الميثيلي. بالإضافة إلى ذلك ، يمكن إدراج جزيرة CpG من النوع البري أو الأليلات الميثيلية أو غير الميثيلية في الاتجاه الأمامي الأصلي أو المقلوب. نظرًا لأن خلايا Hap1 أحادية العدد ، فمن المتوقع حدوث واحدة فقط من نتائج التحرير هذه لكل خلية. قد يُتوقع أن يؤدي إدخال الأليل الميثيلي في الاتجاه الأمامي إلى إسكات ناتج عن المثيلة HPRT1، في حين أن الحذف أو أي انعكاس سيؤدي إلى فقدان التعبير. الخلايا مع إسكات أو فقدان التعبير HPRT1 من المتوقع أن ينجو من اختيار 6-TG ، بينما من المتوقع أن يتم اختيار الأشخاص الذين لديهم تعبير قوي ضدهم.

قمنا أولاً بتسلسل SNV الذي يحدد الأليل والجزء المحيط من exon 1 باستخدام تسلسل Illumina قصير القراءة. لهذا الغرض ، تم استخدام نهج PCR المتداخلة مع عش خارجي واحد تمهيدي PCR في اتجاه المنبع من موقع القطع 5 وواحد بين مواقع القطع (ملف إضافي 2: الشكل S2). قام العش الداخلي بتضخيم منطقة 44 نقطة أساس بما في ذلك SNVs التي تحدد الأليل في exon 1 CDS وجزء صغير من المروج. تتمثل ميزة هذا النهج المتداخل في أنه يمنع تضخيم وتسلسل أي تكامل عشوائي في مواضع أخرى في الجينوم ، وكذلك عمليات الانقلاب أو الحذف المستهدفة للجزء المتداخل. نظرًا لاستبعاد هذه النتائج الأخرى ، كانت توقعاتنا لهذه التجربة على النحو التالي: إذا تم إدخال الأليل الميثلي ، فيجب أن يؤدي اختيار 6-TG إلى زيادة تواتر الأليل الميثيلي مقارنة بالأليل غير الميثيل (قابل للقياس الكمي عن طريق تسلسل SNV التي تحدد الأليل). في المقابل ، في عينات الاختيار المسبق والاختيار الوهمي ، لم يتم توقع أي اختلاف في تواتر الأليلات الميثيلية وغير الميثيلية. من ناحية أخرى ، يتمثل أحد القيود في النهج المتداخل في أننا عمياء عن أي indels بوساطة NHEJ في الموقعين المقطوعين بأنفسهم. ومع ذلك ، في أي حال مع تسلسل Illumina ، لم نتمكن من تسلسل كل من SNVs التي تحدد الأليل ومواقع القطع في نفس القراءة ، وذلك ببساطة لأن القراءات قصيرة جدًا (من حيث المبدأ ، يمكن القيام بذلك باستخدام القراءات المزدوجة ، ولكن الأمبليكون سيكون كبيرًا جدًا للتوافق مع تسلسل Illumina). نعود إلى هذه المشكلة ومسألة ما إذا كان هناك تداعيات بوساطة NHEJ في مواقع القطع الفردية أدناه.

قمنا بتحديد كمية ترددات الأليلات الميثيلية وغير الميثيلية المُدخلة ، سواء الاختيار المسبق أو بعد 6-TG والاختيار الوهمي (الشكل 2 أ). تم حساب هذه الترددات باستخدام أعداد فقط من الأليلات الميثيلية الموجهة للأمام ، وغير الميثيلية ، والبرية ، وكما هو مذكور أعلاه ، نحن متعمدون عن أي طفرات في مواقع القطع لجميع هذه الفئات ، بما في ذلك أليل النوع البري. الملاحظة الأولى هي أنه حتى الاختيار المسبق ، فإن نسبة الأليلات الميثيلية التي يتم إدخالها منخفضة للغاية (متوسط ​​0.24٪). في المقابل ، فإن نسبة الأليلات غير الميثيلية التي يتم إدخالها متواضعة ولكنها متسقة (يعني 5.1٪). يشير هذا إلى أن إدخال الأليلات الميثيلية بوساطة NHEJ أقل كفاءة بشكل ملحوظ من تلك الموجودة في الأليلات غير الميثيلية. لكل من الأليلات الميثيلية وغير الميثيلية ، كانت النسب بعد الانتقاء الوهمي دون تغيير إلى حد كبير. والمثير للدهشة أن تأثير اختيار 6-TG هو زيادة النسبة المئوية لـ على حد سواء الأليلات المدرجة وغير الميثلة ، نسبة إلى الأليل من النوع البري. ومع ذلك ، فإن تغيير الطية لاختيار 6-TG على الاختيار الوهمي للأليل الميثيلي كان أكبر بكثير من الأليل غير الميثيلي ، مما يشير إلى إثراء الأليل الميثيلي ، والذي يتوافق مع إسكات الميثيل الناجم عن الميثيل. HPRT1 (متوسط ​​التغير في الطي للميثيل مقابل غير الميثيل ، 41.0 مقابل 3.0 اللوغاريتم المحول ، المقترن ر-اختبار ص ≈ 0.002).

مثيلة من HPRT1 جزيرة CpG عن طريق استبدال التسلسل بوساطة CRISPR ينتج عنه HPRT1 إسكات. أ النسب المئوية لقراءات تسلسل Illumina المخصصة للأليلات المدرجة الميثيلية وغير الميثيلية بواسطة SNVs ، مجمعة حسب حالة التحديد (Mock ، التحديد المسبق ، التحديد الوهمي 6-TG ، 6-TG). على الرغم من أن كلاهما مُخصب ، إلا أن الأليلات المُدخلة الميثيلية تكون أكثر إثراءً من الأليلات المُدخلة غير الميثيلية بعد اختيار 6-TG. لا يتم عرض متواليات من النوع البري ، ولكن يتم تضمينها في النسب المئوية. تُظهر اللوحة الأولى التجربة حيث تم ميثلة الأليل 1 وأليل 2 غير ميثيل ، تُظهر اللوحة الثانية التجربة المتبادلة. تظهر أشرطة الخطأ نطاق من ثلاث نسخ. ب النسب المئوية لقراءات تسلسل PacBio المعينة "مطابقة تامة" للأليلات المدرجة الميثيلية وغير الميثيلة بواسطة SNVs ، مجمعة حسب حالة التحديد (Mock ، التحديد المسبق ، التحديد الوهمي 6-TG ، 6-TG). يتم إثراء الأليلات المتضمنة الميثيلية ، ولكن ليس الأليلات المدرجة غير الميثيلية ، بقوة عن طريق الانتقاء. تم حساب التسلسلات فقط إذا كانت في الاتجاه الأمامي ومطابقة تمامًا للمروج ، و exon 1 ، ومتبرع لصق ، وطفرة PAM ، وواحدة من ثلاث مجموعات من SNVs التي تحدد الأليل (النوع البري ، أو الأليل 1 ، أو الأليل 2). لا يتم عرض متواليات من النوع البري ، ولكن يتم تضمينها في النسب المئوية. تظهر أشرطة الخطأ نطاق من ثلاث نسخ. نلاحظ أن ذ-المحور مفصول ويحتوي على مقياسين لزيادة الدقة في نطاق 0-10٪. ج النسب المئوية لقراءات تسلسل PacBio المعينة للاتجاه العكسي / المعكوس ، مجمعة حسب حالة التحديد. أحداث الحذف ، وكذلك التسلسلات التي لا تستوفي معايير "المطابقة الدقيقة" المحددة أعلاه ، لم يتم احتسابها. لا يتم عرض التسلسلات الموجهة للأمام ، ولكن يتم تضمينها في النسب المئوية. النمط الواضح هو أن التسلسلات المقلوبة تسود بعد اختيار 6-TG. د تمت ملاحظة عدد المواقع الميثيلية عند تسلسل ثنائي سلفيت للأليلات الميثيلية أو غير الميثيلية أو من النوع البري لجزيرة CpG ، والتي تم جمعها عبر شروط الاختيار. تحتوي المنطقة على 35 CpG ثنائي النوكليوتيدات. Reads are assigned to in vitro methylated or unmethylated alleles, or to unedited wild-type sequence based on synonymous SNVs. In vitro methylated alleles remain heavily methylated, while unmethylated alleles and unedited sequences remain predominantly unmethylated

Given that the above experiments were blind to the cut sites, we speculated that the unexpected increase in inserted, unmethylated alleles upon selection (Fig. 2a) might have resulted from loss of expression due to repair-induced indels at the end(s) of the of the CpG island insert (in the first intron or 5′ UTR as noted above, we were not able to observe these junctions in the experiment represented in Fig. 2a), or alternatively from mutations in the promoter, exon 1 coding sequence, or splice donor in the CpG island insert introduced by PCR. To test this, we amplified a

2-kb region including the entire CpG island, with primers positioned

700 bp upstream of one cut site and

165 bp downstream of the other cut site (Additional file 3: Figure S3). We sequenced these amplicons using Pacific Biosciences (PacBio) instruments (the “Materials and methods” section).

Circular consensus sequence (CCS) calling was performed to a mean CCS accuracy of 99.4%. In contrast with our Illumina-based sequencing, this approach is expected to recover not only forward-oriented alleles, but also inversions, deletions, and multiple insertions of the intervening sequence. However, we did not attempt to quantify wholesale deletions or multiple insertions of the CpG island for the following reasons. First, we performed a gel extraction step after PCR that removed most deletion events. Second, although the PCR cycling conditions were designed to be able to amplify multiple insertion events, bands representing such longer sequences were not visible on agarose or polyacrylamide gels. Third, even to the extent that either wholesale deletions or multiple insertions are recovered, due to biases in PCR amplification and sequencing towards shorter sequences, it would be very difficult to interpret the counts of sequences of different sizes.

For our first analysis of these PacBio data, sequences were only counted if they were in the forward orientation and moreover exactly matched the promoter, exon 1, splice donor, expected PAM site for a given allele, and one of three sets of allele-defining SNVs (wild-type, allele 1, or allele 2), i.e., excluding inversions as well as sequences containing PCR errors or repair-induced indels. Because we required observation of the expected PAM sites for a given allele, indels at either cut site that extend more than 5 bp into the CpG island were excluded from this analysis. In contrast with the Illumina-based results presented in Fig. 2a, after 6-TG selection, we observed markedly higher proportions of methylated inserted alleles than unmethylated inserted alleles (mean 82.8% vs. 8.1% arcsine square root transformed, paired ر-اختبار ص ≈ 0.005) (Fig. 2b Additional file 4: Table S1). However, as illustrated by the pre-selection and mock selection experiments, the proportion of inserted methylated and unmethylated alleles remained very low in the absence of 6-TG.

We also examined other sequences in the PacBio data, i.e., sequences other than those exactly aligning to forward-oriented wild-type or forward-oriented inserted alleles. For example, one prediction is that 6-TG should also select for alleles inserted in the inverted orientation, regardless of whether it is the wild-type sequence or one of the exogenous inserts. To investigate this, we tabulated sequences that exactly matched the promoter, exon 1, splice donor, PAM mutation, and any of the three sets of allele-defining SNVs (wild-type, allele, 1 or allele 2), in إما orientation. Events involving wholesale deletion of the CpG island were again excluded. Collapsing all alleles in each orientation, we observe that the proportion of forward-oriented alleles was modestly higher in both the pre-selection and mock selection samples (mean 63.4% and 71.1% forward oriented, respectively). Although, percentages closer to 50/50 might have been expected, the deviation towards forward-oriented alleles is likely because the calculation includes wild-type alleles that were not fully cut out (e.g., either because of incomplete editing or NHEJ-mediated indels at one of the cut sites). However, after 6-TG selection, the overwhelming majority of sequences were in the reverse/inverted orientation (mean 98.6% reverse oriented) (Fig. 2c Additional file 4: Table S1). This confirms that 6-TG selection was nearly complete, particularly as the forward-oriented sequences observed after 6-TG selection were dominated by the methylated, inserted alleles (Fig. 2b).

Although we observe that the forward-oriented, methylated allele is strongly selected for by 6-TG, we sought to confirm that its in vitro methylation is maintained after transfection and insertion, and thus might plausibly cause silencing of HPRT1 and the consequent strong selection. We therefore performed bisulfite sequencing on a region of the CpG island including the allele-defining SNVs and 35 surrounding CpGs (Additional file 5: Figure S4). We observe that the in vitro methylated allele remained heavily methylated in the pre-selection, mock selection, and 6-TG selection samples, whereas the unmethylated allele and the wild-type sequence remained predominantly unmethylated in all samples (Fig. 2d). Of note, bisulfite sequencing of this same region in untransfected Hap1 cells harvested after mock selection exhibited a lack of methylation similar to the wild-type sequences of the transfected cells (data not shown). Consistent with this, 6-TG selection of untransfected Hap1 cells killed all cells, confirming that the HPRT1 gene was not silenced by methylation without our intervention.

Estimates of the rate of insertion of the methylated allele based on data in Fig. 2b are not based on all sequences and are therefore not exact. In our view, it is not possible to obtain a precise insertion rate from these data because of size biases in PCR amplification and sequencing, which vastly overestimate the number of the shorter deletion sequences. However, in an attempt to get a better estimate, we recalculated insertion rates, but this time including all sequences, except wholesale deletions of the intervening sequence, that could be aligned to the CpG island in either the forward or the inverted orientation in the total count, i.e., the denominator. Sequences were included in this total count regardless of whether or not they could be assigned to either the allele or the wild-type sequence, and indels larger than 5 bases were also included (in the previous calculations, sequences with indels larger than 5 bases were effectively filtered out because of the requirement that the PAM sites, which are 6 bases from the cut sites, match). Using only sequences that could be assigned to the methylated allele with a perfect match in the promoter, exon 1, splice donor, and PAM mutations and allowing up to 5 bp indels on either side, the methylated allele represented 0.72% of reads. If no indels were allowed, 0.12% of reads were the methylated allele. When the pre-selection and mock selection samples were combined and averaged for an estimate of the insertion rate without selection and up to 5 bp indels were allowed, the methylated allele represented 0.16% of reads. If no indels were allowed, the methylated allele represented 0.03% of reads.

Although our strategy remains challenged by the much higher rates of deletion or inversion over insertion of the methylated inserts, our observations nonetheless support the conclusions that (a) we successfully used CRISPR/NHEJ to replace the HPRT1 CpG island with an in vitro methylated allele (b) this methylation was maintained after insertion to the genome, at least over the course of our 11-day experiment and (c) this methylation was sufficient to functionally silence the HPRT1 الجين.

Why are unmethylated alleles frequent upon 6-TG selection in the Illumina-based results but not the PacBio-based results, given that this is the same experiment? As the main difference between these analyses involves the former analysis being blind to the larger region vs. the latter including but only allowing small indels at the repair junctions, we speculated that large repair-induced indels (included in the Illumina-based analysis of Fig. 2a, but analytically excluded from the PacBio-based analysis of Fig. 2b) may result in a subset of forward-oriented, unmethylated inserts being positively selected.

To assess this and related questions, we further analyzed the PacBio sequencing data to explore the indel patterns at the cut sites. First, we asked why, in the Illumina short-read sequencing, 6-TG selection resulted in enrichment of both methylated and unmethylated alleles rather than just methylated alleles (Fig. 2a, b). As discussed above, comparison of the Illumina short-read sequencing and PacBio sequencing data suggested that larger indels impacting functional regions of the CpG island insert, i.e., the 5′ UTR, promoter, exon 1, or splice donor sequences, might cause loss of expression of HPRT1, resulting in selection of these indel-bearing, unmethylated sequences by 6-TG. We formally addressed the question by analyzing the distribution of indels across the region subjected to PacBio sequencing (Fig. 3a). To facilitate comparison, inclusion criteria were identical to those used for analysis of Illumina reads (both methylated and unmethylated allele sequences selected by 6-TG, with a perfect match of the allele-defining SNVs and the surrounding region of exon 1). As expected, the distribution of indel sites had peaks at both CRISPR/Cas9 cut sites (Fig. 3a). Notably, many indels extended from the flanking CRISPR/Cas9 cut sites into the interior of the CpG island encompassing functional regions involved in HPRT1 التعبير. Such indels are predicted to result in loss of expression of HPRT1. Since these regions were not visible to Illumina short-read sequencing, indel-containing alleles were included in the results shown in Fig. 2a, but were excluded by our sequencing matching requirements with PacBio for the results shown in Fig. 2b. Overall, we conclude that any modest enrichment of unmethylated alleles after 6-TG selection was likely due to these alleles containing indels extending into functional regions of the CpG island (Additional file 6: Figure S5).

The positional and size distribution of indels, in relation to methylation status, insertion type, and orientation. أ Percentage of reads with an indel at positions along the PacBio sequenced region. The same subset of reads used in Fig. 2a is included here (6-TG selected, both methylated and unmethylated, perfect match on the allele-defining SNVs and the surrounding portion of exon 1). Red arrowheads indicate the CRISPR/Cas9 cut sites. The purple bar marks the region of exon 1 surrounding the allele-defining SNVs. The distribution of indels is highest at the CRISPR/Cas9 cut sites, but many reads have indels within the CpG island as well. ب Indel distributions at repair junctions of methylated (blue) or unmethylated (purple) alleles. ج Indel distributions at repair junctions from events involving exogenous inserts (gray) or endogenous inserts (forward-oriented and inverted wild-type sequences black). د Indel distributions at repair junctions from forward-oriented wild-type sequences (gray) or inverted wild-type sequences (black). The numbers of indels (ذ-axis) were scaled so that the maximum number for any indel size (x-axis) for a given distribution was one to allow easier comparison between distributions. Negative numbers for indel size represent deletions, positive numbers represent insertions, and sequences without any repair junction indels have an indel size of zero

Next, we examined the potential effects of methylation on indel patterns in CRISPR/NHEJ-mediated sequence replacement. We started by asking whether there are differences in the rates of insertion of methylated vs. unmethylated alleles. A caveat of this analysis is that it is unclear if the 100,000 cells transfected are sufficient to accurately quantify the frequency of insertion events, which were rare (Additional file 4: Table S1). Nonetheless, combining alleles and observations in both orientations, we found that the unmethylated allele was consistently inserted more frequently than the methylated allele (0.65% methylated vs. 2.37% unmethylated in pre-selection 0.60% methylated vs. 2.06% unmethylated in mock selection). These differences were consistent between the forward and reverse orientations. There are reports that some double-strand breaks are repaired differently in methylated than unmethylated DNA it is possible that such differences may also affect the relative rates of insertion of methylated vs. unmethylated fragments [20, 21].

If these methylated vs. unmethylated inserts are handled differently, it might, but not necessarily, be reflected in a difference in the rates of repair-associated indels. We therefore examined the rates of indels at the flanking CRISPR/Cas9 cut sites, excluding sequences from 6-TG-selected samples. We did not find a rate difference between the methylated and unmethylated alleles (48.9% vs. 50.9%, Fisher’s exact test ص ≈ 0.3) and furthermore observed similar distributions of indel sizes for methylated vs. unmethylated sequences (Fig. 3b).

However, we did observe a higher rate of indels for exogenous inserts (i.e., either methylated or unmethylated alleles in either orientation) as compared with endogenous inserts (50.4% vs. 40.6%, Fisher’s exact test ص < 2.2 × 10 − 16 size distribution of events in Fig. 3c counts for endogenous inserts include both forward-oriented and inverted wild-type sequences of note, whereas all inverted alleles were obviously cut out then reinserted, we cannot distinguish whether forward-oriented sequences were cut out and then re-inserted vs. not). These data suggest that exogenous DNA might be more likely to be inserted if there is exonuclease chew-back during the repair. This result is further supported by the indel distribution of 6-TG-selected methylated and unmethylated alleles, which showed many indels extending from the CRISPR/Cas9 cut sites into the interior of the CpG island (Fig. 3a). We note that three phosphorothioate linkages were incorporated during PCR at both ends of the insert amplicons, because these linkages are supposed to prevent exonuclease chew-back [3]. It is unclear how effective these linkages were, and it is possible that the association between insertion and exonuclease chew-back is simply an artifact of these linkages.

Again excluding 6-TG-selected sequences, we also observed higher rates of indels for forward-oriented wild-type alleles as compared to inverted wild-type alleles (46.8% vs. 27.5%, Fisher’s exact test ص < 2.2 × 10 − 16 size distribution of events in Fig. 3d). However, this could simply be due to an increased propensity for indels when the break-repair recreates the wild-type sequence without mutation, because this site becomes a substrate for CRISPR/Cas9 cleavage again. This break-repair cycle can repeat until Cas9 is no longer active or a mutation occurs, explaining the higher rate of observed indels with forward-oriented wild-type alleles.


CK designed the research, performed the experiments, analyzed the results, and wrote the manuscript NU contributed to the design of the study and scientific discussion of the results, and wrote the manuscript JFT contributed to the design of the study and scientific discussion of the results and wrote the manuscript and GPR designed the research, evaluated the results, wrote the manuscript, and gave final approval of the manuscript.

The authors have no competing interests.

الملحق S1. Supplemental Methods.

Table SI. List of on- and off-target loci for amplicon deep sequencing of polymerase chain reaction (PCR) amplicons.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


شاهد الفيديو: Double stranded break repair - Non homologous end joining explained. (كانون الثاني 2022).