429 0

Impact of sgRNA sequence and secondary structure on CRISPR-Cas activity

Title
Impact of sgRNA sequence and secondary structure on CRISPR-Cas activity
Other Titles
CRISPR-Cas 활성에서 sgRNA 서열과 2차 구조의 효과
Author
비핀 메논
Alternative Author(s)
비핀 메논
Advisor(s)
Professor Jin Wu Nam
Issue Date
2022. 8
Publisher
한양대학교
Degree
Doctor
Abstract
Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)-Cas 시스템은 포유류 체세포 유전학에서 게놈 공학에 혁명을 일으켰습니다. 상당한 연구들이 Spacer를 개선하거나 SpCas9 및 scaffold 서열(소위 tracrRNAs)을 조작함으로써 single guide RNA (sgRNA)-매개 편집의 효율을 향상시키는 것이 집중되었습니다. 초기 조사는 CRISPR-Cas 시스템의 표적 부위를 평가하기 위해 sgRNA의 spacer 서열을 사용하는 computational model의 개발로 이어졌고, 이로써 효율적인 guide RNA의 일반적인 설계 원리를 제시했습니다. 효율적인 sgRNA 설계를 위한 computational tool들은 일반화 문제를 나타내며 최적의 결과를 종합적으로 제공하지 않습니다. 또한, 이전 연구에서는 sgRNA 편집 효율 측면에서 2차 구조 및 scaffold 서열의 역할을 이해하기에는 한계가 있었습니다. 효율적인 sgRNA를 식별하는 설계 원리를 개선하기 위해서 4가지 다른 CRISPR 시스템에서 이를 확인하는 machine learning algorithm인 Elastic Net Logistic Regression (ENLOR)을 활용하는 Comprehensive Guide Designer (CGD)를 개발했습니다. CGD에는 편파적이지 않은 방식의 CRISPRi, CRISPRa, CRISPR-SpCas9 및 CRISPR-Cas12a (각각 CGDi, CGDa, CGD9 및 CGD12a)에서 생성한 공개 dataset로 훈련된 특정 model들이 포함되어 있습니다. 독립적인 test dataset로 평가했을 때 훈련된 CGD model 은 gRNA의 효능을 예측하는데 기존 방법을 능가했습니다. sgRNA spacer 서열의 Minimum Free Energy(MFE)를 보여주는 CGD model은 다양한 CRISPR-Cas 시스템에서 유전자 편집에 중요한 역할을 합니다. 연구 결과를 바탕으로 high throughput dataset에서 spacer와 scaffold 사이의 상호 작용을 분석하여 sgRNA 2차 구조의 역할을 평가했습니다. 이러한 분석을 통해서 대부분의 spacer-scaffold 상호작용은 편집 효율을 상당히 감소시키지만 소수의 상호작용은 고도로 활성화한 sgRNA의 효율을 향상시켰습니다. SpCas9 변이체와 base editor에 대한 추가 분석은 다양한 SpCas9 활성에 대한 sgRNA의 중요한 2차 구조를 기계적인 유사성과 차이점을 드러냈습니다. 연구 결과는 SpCas9, SpCas9 변이체 및 base editor 시스템에서 구조적 특징을 이용하여, 고도로 활성화한 sgRNA를 예측할 수 있는 CNN 기반 deep learning model을 통해 spacer-scaffold 상호작용을 정리합니다. 따라서 이 연구는 sgRNA 서열의 구조적 메커니즘에 대한 더 발달된 이해를 제공할 뿐만 아니라 CRISPR 시스템의 현재 치료 가치를 향상시킬 수 있는 고효율 sgRNA 설계하는 데 도움이 될 것입니다. |The Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)-Cas systems revolutionized genome engineering in mammalian somatic cells genetics. Significant research has focused on increasing the effectiveness of single guide RNA (sgRNA)-mediated editing by either refining the spacer or engineering SpCas9 and scaffold sequences (so-called tracrRNAs). Initial investigations led to the development of computational models using a spacer sequence of sgRNA to assess the target site of the CRISPR-Cas system, thereby laying out general design principles of efficient guide RNAs. The computational tools developed for designing efficient sgRNA exhibit generalization issues and do not comprehensively provide optimal results. Moreover, previous studies were limited in understanding the role of secondary structure and scaffold sequence in the sgRNA editing efficiency. To improve the design principle of identifying efficient sgRNAs, I developed Comprehensive Guide Designer (CGD), which utilizes the machine learning algorithm, Elastic Net Logistic Regression (ENLOR), that identifies efficient sgRNA across four different CRISPR systems. CGD contains specific models trained with public datasets generated by CRISPRi, CRISPRa, CRISPR-SpCas9, and CRISPR-Cas12a (designated as CGDi, CGDa, CGD9, and CGD12a, respectively) in an unbiased manner. When evaluated with independent test datasets, the trained CGD models outperformed the pre-existing methods in predicting the efficacy of gRNAs. The CGD model showcased MFE (Minimum Free Energy) of sgRNA spacer sequence, which plays a significant role in gene editing across different CRISPR-Cas systems. Based on the findings, I assessed the role of sgRNA secondary structure by analyzing the interactions between spacer and scaffold across high throughput datasets. My investigation showed that most spacer-to-scaffold interactions considerably reduce editing efficacies, but a handful of interactions enhanced the efficacies in highly active sgRNAs. Further analysis of SpCas9 variants and base editors revealed mechanistic similarity and dissimilarity of the significant secondary structures of sgRNAs over different SpCas9 activities. The findings incorporate spacer-scaffold interaction as structural features into a CNN-based deep learning model that could predict highly active sgRNAs in SpCas9, SpCas9 variants, and base editing system. My study thus will provide a better understanding of the structural mechanism of sgRNA sequences but also helps to design highly efficient sgRNAs which could enhance the present therapeutic value of the CRISPR system.
URI
http://hanyang.dcollection.net/common/orgView/200000626703https://repository.hanyang.ac.kr/handle/20.500.11754/174492
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > LIFE SCIENCE(생명과학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE