196 0

AI-guided Design of Artificial Short-Hairpin RNAs and Messenger RNAs: Lessons from Nature

Title
AI-guided Design of Artificial Short-Hairpin RNAs and Messenger RNAs: Lessons from Nature
Author
박석주
Alternative Author(s)
Seokju Park
Advisor(s)
남진우
Issue Date
2023. 8
Publisher
한양대학교
Degree
Doctor
Abstract
The field of RNA biology has seen significant advancements in recent years, leading to the development of various RNA-based therapeutic agents. To date, several types of RNA therapeutics have received FDA approval, such as antisense oligonucleotides, aptamers, messenger RNAs (mRNAs), and small interfering RNA (siRNA). This study presents novel approaches to the generation of synthetic RNAs that have the potential to overcome the limitations of the current methods. The proposed methods combine the fields of biology and artificial intelligence (AI), and specifically, the methods utilize recently discovered knowledge in the areas of mRNA and RNA interference to optimize the synthetic RNA production process. MicroRNAs (miRNAs) are found in a wide range of species, from viruses to humans. They play a key role in regulating target gene expression. By mimicking miRNA biology, diverse technological approaches such as siRNA, short hairpin RNA (shRNA), and second-generation shRNA (shRNAmir) have been devised, and are also used in drug development for various diseases. Among them, shRNAmir mimics the entire biogenesis and function of endogenous miRNA. Despite many efforts to predict the potency of guide RNAs used for shRNAmir, unsatisfactory performance has been achieved. This is due to the limited understanding of miRNA biology. In this study, I propose a new model called shRNAI, a convolutional neural network-based model, that enables accurate prediction of the guide RNA potency. shRNAI was developed by incorporating existing knowledge about the mechanism of miRNA biogenesis and targeting. The function of miRNA is largely dependent on two key features: the level of productivity and accuracy in the processing of miRNA and the efficiency with which miRNAs recognize their targets. Dysregulation of the miRNA processing pathway can lead to changes in the expression of miRNAs themselves or miRNA isoforms with heterogenous 5-ends (isomiRs), which can recognize different targets due to their shifted seed sequences. The efficiency with which miRNA recognizes its target is influenced by factors such as the affinity between the guide RNA and the target site, as well as the structural accessibility of the target site. The characteristics identified in miRNAs were utilized in the development of shRNAI, resulting in superior performance compared to existing algorithms. This was demonstrated through both in silico and in vitro experiments. The mRNA plays a crucial role in the central dogma of molecular biology by carrying the genetic information encoded in DNA and serving as a template for protein synthesis. The recent development of mRNA vaccines for COVID-19 has highlighted the need for optimizing mRNA for efficient and stable protein production in human cells. The mRNA molecule can be divided into three regions: the 5’ untranslated region (5’UTR), the coding region (codon), and the 3’ untranslated region (3’UTR). Each of these regions plays a unique role in regulating mRNA stability, translation initiation, and translation kinetics, and RNA structure. In this study, I propose novel methods for optimizing each region of the mRNA molecule by taking into account factors beyond the primary sequence, such as RNA secondary structure, protein tertiary structure, and the interdependence between the regions. Through this approach, our proposed models for each region achieved state-of-the-art performance, outperforming existing algorithms. Additionally, I propose the need for a comprehensive approach to optimizing the entire mRNA molecule, rather than optimizing individual regions. I have proposed a novel approach to synthetic RNA generation that combines the fields of biology and artificial intelligence (AI) to overcome the limitations of current methods. My research focuses on two key areas: the development of a new model called shRNAI for accurately predicting the efficacy of guide RNAs and the optimization of mRNA for efficient and stable protein production in human cells. My approach to optimizing each region of the mRNA molecule and guide RNAs by taking into account factors beyond the primary sequence is particularly interesting. Overall, I suggest that my study has the potential to make significant contributions to the field of RNA biology and therapeutics. |최근 RNA 분야는 눈부신 발전을 이룩하여 다양한 RNA 기반 치료제의 발전을 이끌었다. 현재 antisense oligonucleotide, aptamer, messenger RNA (mRNA), 그리고 small-interfering RNA (siRNA)와 같은 RNA 치료제들이 FDA 승인을 받은 상태이다. 본 연구에선 RNA 치료제 개발에 적용 가능한 합성 RNA를 생성하는 새로운 접근을 제시한다. 제안된 방법들은 생물학과 AI의 융합이며, 특히 mRNA와 RNAi 분야에서 현재까지 밝혀진 이론들을 이용하여 합성 RNA 생산 과정을 최적화하는데 집중하였다. MicroRNA (miRNA)는 바이러스부터 인간까지 다양한 종에서 발견이 되며, 타겟 유전자의 발현을 조절하는 데 중요한 역할을 한다. siRNA, short hairpin RNA (shRNA), 그리고 second-generation shRNA (shRNAmir) 같은 다양한 기술들이 개발되었고 이들은 질병 치료를 위해 약물로써 사용되고 있다. 이 중, shRNAmir는 내생의 miRNA의 전체 생발생과 기능을 모사한 기술이다. shRNAmir에 사용되는 guide RNA의 기능성을 예측하기 위한 많은 노력들이 있었음에도 불구하고, miRNA에 대한 이해 부족으로 인해 아직 만족할 수준을 달성하진 못했다. 본 연구에선 convolutional neural network (CNN) 기반으로 miRNA의 생합성 및 타겟팅 메커니즘에 대한 기존 지식들을 융합시킨 높은 정확도의 shRNAI 모델을 제안한다. miRNA의 기능성은 두 가지 중요한 특징에 의존한다. 첫 번째는 miRNA 생발생에서의 효율과 정확성인데, 이는 잘 못 될 경우 miRNA 자체의 양뿐만 아니라 다른 유전자들을 타겟할 수 있는 이소체들을 생산할 수 있어 매우 중요하다. 두 번째는 miRNA가 타겟을 인식하는 효율이다. 여기엔 guide RNA와 타겟의 친밀도와 타겟 부위의 구조적 접근성에 의해 크게 영향받는다. 이러한 miRNA의 특성들이 shRNAI의 개발에 이용되었고, 결과적으로 현존하는 알고리즘들과 비교해 높은 성능을 보이는 것이 in silico 및 in vitro 실험에서 증명되었다. mRNA는 DNA에 존재하는 유전정보를 옮기고 단백질 합성의 주형이 되는 central dogma에서 중요한 역할을 수행하는 분자이다. 최근 COVID-19 mRNA 백신 개발로 인해, 인간세포에서 단백질 발현 및 안정성을 최적화시키는 mRNA 최적화 분야는 중대한 분야로 떠오르고 있다. 이를 위해, 5’ untranslated region (5’UTR) 부위, coding 부위, 그리고 3’UTR 부위로 mRNA를 나누어 최적화를 진행한다. 각각의 부위들이 mRNA의 안정성, 번역 개시 효율, 번역 속도, 그리고 RNA 구조를 조절하는데 중요한 역할을 한다. 본 연구에선, 일차원적인 서열 외에 RNA 2차 구조, 단백질 3차 구조, 각 부위간의 상호 의존성과 같은 특징들을 고려하여 각 부위들을 최적화하는 새로운 접근을 제안한다. 해당 방식을 통해 우리가 만든 각 부위 별 모델들은 현존하는 알고리즘들에 비해 최첨단의 성능을 성취하였다. 또한, 각 개별의 지역을 최적화하는데 그치지 않고 총제적 접근을 통해 전체 mRNA 분자를 최적화가 필요하다는 것을 제시한다. 본 연구는 현재 방법의 한계를 극복하기 위해 생물학과 인공지능(AI) 분야를 결합한 합성 RNA 생성에 대한 새로운 접근법을 제안한다. 본 연구는 Guide RNA의 효율을 정확하게 예측하는 새로운 모델인 shRNAI의 개발과 인간 세포에서 효율적이고 안정적인 단백질 생산은 위한 mRNA 최적화에 초점을 맞추고 있다. 특히 기본 서열 이외의 요소를 고려하여 mRNA 분자의 각 영역 및 guide RNA를 최적화하는 접근 방식에 집중하고 있다. 전반적으로 본 연구는 RNA 생물학 및 신약개발 분야에 중요한 기여를 할 수 있는 잠재력을 가지고 있다고 여겨진다.
URI
http://hanyang.dcollection.net/common/orgView/200000684048https://repository.hanyang.ac.kr/handle/20.500.11754/186778
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > LIFE SCIENCE(생명과학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE