311 0

유전자 가위를 이용하여 유전체 전장 long intergenic non-coding RNA 녹아웃 라이브러리의 전산 설계

Title
유전자 가위를 이용하여 유전체 전장 long intergenic non-coding RNA 녹아웃 라이브러리의 전산 설계
Other Titles
Computational design of Genome-wide sgRNAs for long intergenic non-coding RNA knockout using Cas9
Author
이현주
Alternative Author(s)
Lee, Hyeon Joo
Advisor(s)
남진우
Issue Date
2015-08
Publisher
한양대학교
Degree
Master
Abstract
Genomic engineering with clustered, regularly interspaced, short palindromic repeats (CRISPR) system modifies predetermined genomic loci of target genes. Although the programmable nuclease, which is derived from prokaryotic cells, is widely being used to knockout genes of interest by making frame-shift mutations, yet only applicable to protein-coding genes. For functional studies of long intergenic non-coding RNAs (lincRNAs), multiple features need to be integrated for determining of target loci and to design a pair of single guide RNAs (sgRNAs) of CRISPR system to delete a target locus. Here, we computationally designed the genome-wide sgRNAs for knocking out lincRNAs using CRISPR system. The set of lincRNAs is based on the gold-standard set filtered from the GENCODE annotations, 5,882 transcripts in human and 822 transcripts in mouse. To make an archive of functional lincRNAs, ones that are expressed in at least one of cell-types examined in the ENCODE project were selected, annotating with tissue or stage specific expression pattern. The regions with RNA family motifs and embedding conserved elements are defined as candidate loci to be deleted. The same approach is applied to annotate functional signatures of lincRNAs in other species, fly, worm and zebrafish. We also computationally designed sgRNAs with the high efficiency that can provide any pair of sgRNAs for the deletion of the candidate loci or whole lincRNA locus. To select sgRNAs with the high efficiency, we assessed them with sequence and structural features, and off-targets. We, thus, provide an online tool to guide the selection of target sites and sgRNAs for knockout any lincRNAs of interest.|최근에 개발된 크리스퍼 유전자 가위는 특정 유전자가 위치한 염기서열을 절단시키므로 유전자의 기능을 없앤다. 유전자의 기능 연구를 위해 원액세포에서 유래된 크리스퍼 유전자 가위 기술이 도입되고 있다. 돌연변이에 의해 격자이동이 유발이 되면서 유전자 발현을 저해시켜 특정 유전자의 기능을 없어지게 하는데 이러한 방법은 단백질 코딩 유전자들 대상으로만 적용되어 왔다. Long intergenic non-coding RNAs (lincRNAs)의 기능 연구에 크리스퍼 유전자 가위 기술을 적용하기 위해서는 여러 다양한 특징들을 통합시켜야 한다. 본 논문에서는 크리스퍼 유전자 가위를 이용하여 lincRNA 녹아웃 라이브러리를 전산 설계하였다. 공개된 데이터베이스인 GENCODE에서 동정한 lincRNAs을 CAGE-seq과 polyA-seq 데이터를 이용하여 보다 정확하게 유전자 구조를 동정하였다. 그 다음 여러 조건을 적용한 후, 인간 lincRNAs는 총 5,882개 그리고 마우스에서는 822개의 lincRNAs를 얻었다. 동정된 lincRNAs의 기능 주석을 위해 ENCODE project 에서 얻은 실험 데이터를 이용하여 조직 또는 세포 특이적으로 발현되는 lincRNAs를 조사하였다. 또한, 기능적으로 주요할 것이라고 예측되는 conserved elements를 포함하고 있는 부분을 동정하고 알려진 RNA family motifs 존재여부는 확인하였다. 동일한 접근법을 사용하여 인간과 마우스뿐만 아니라, 예쁜 꼬마선충, 초파리, 그리고 제프라 피쉬를 대상으로도 lincRNAs 기능 주석을 하였다. 또한, 기능 주석된 부분이나 전체 유전자를 절단하기 위한 효율성 높은 single guide RNAs (sgRNAs)를 설계하였다. 전체 유전체에서 존재하는 sgRNAs 중 효율성 높은 sgRNAs만을 선정하기 위해서는 sequence 그리고 구조적 특징들을 고려해야한다. 최종적으로 특정 lincRNA을 절단하기 위해 필요한 모든 정보를 얻을 수 있는 녹아웃 라이브러리를 구축하였다.; Genomic engineering with clustered, regularly interspaced, short palindromic repeats (CRISPR) system modifies predetermined genomic loci of target genes. Although the programmable nuclease, which is derived from prokaryotic cells, is widely being used to knockout genes of interest by making frame-shift mutations, yet only applicable to protein-coding genes. For functional studies of long intergenic non-coding RNAs (lincRNAs), multiple features need to be integrated for determining of target loci and to design a pair of single guide RNAs (sgRNAs) of CRISPR system to delete a target locus. Here, we computationally designed the genome-wide sgRNAs for knocking out lincRNAs using CRISPR system. The set of lincRNAs is based on the gold-standard set filtered from the GENCODE annotations, 5,882 transcripts in human and 822 transcripts in mouse. To make an archive of functional lincRNAs, ones that are expressed in at least one of cell-types examined in the ENCODE project were selected, annotating with tissue or stage specific expression pattern. The regions with RNA family motifs and embedding conserved elements are defined as candidate loci to be deleted. The same approach is applied to annotate functional signatures of lincRNAs in other species, fly, worm and zebrafish. We also computationally designed sgRNAs with the high efficiency that can provide any pair of sgRNAs for the deletion of the candidate loci or whole lincRNA locus. To select sgRNAs with the high efficiency, we assessed them with sequence and structural features, and off-targets. We, thus, provide an online tool to guide the selection of target sites and sgRNAs for knockout any lincRNAs of interest.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/128021http://hanyang.dcollection.net/common/orgView/200000427479
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > LIFE SCIENCE(생명과학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE