339 0

돌연변이 탐지를 위한 트랜스포머 모델과 RNN 모델의 성능 비교

Title
돌연변이 탐지를 위한 트랜스포머 모델과 RNN 모델의 성능 비교
Other Titles
Comparison of Transformer Model and RNN Model Performance for Variant Detection
Author
이재경
Alternative Author(s)
Jae Kyung Lee
Advisor(s)
박희진
Issue Date
2022. 2
Publisher
한양대학교
Degree
Master
Abstract
NGS(Next-generation sequencing) 기술로 인해서 염기서열(Nucleotide) 분석은 전통적인 방법보다 낮은 비용으로 쉽게 이루어지게 되었다. 염기서열 분석은 생물의 현상을 이해하고 질병에 대한 정보를 알 수 있어서 생물정보학(Bioinformatics)에서 중요하다. 특히 염기서열 분석에서 염기서열 내의 돌연변이(Variation)를 찾는 것은 질병에 대한 정보를 얻는 것에서 중요한 역할을 하고 있다. NGS 기술로 시퀀싱한 염기서열에서 돌연변이를 찾는 일은 기존에는 통계적 방식을 응용하는 Samtools나 GATK와 같은 툴을 이용해서 이루어졌으며, 최근에는 딥러닝(Deep learning) 방식을 이용해서 돌연변이를 찾는 방법이 개발되었다. 이러한 툴에는 DeepVariant 가 있다. 본 연구에서는 DeepVariant 와 같이 딥러닝을 이용해서 염기서열 내의 돌연변이를 찾되, CNN을 사용하는 DeepVariant 와는 다른 딥러닝 모델인 RNN과 트랜스포머(Transformer) 모델을 이용해서 돌연변이 발생 위치를 탐지하고 비교해본다. | Due to NGS (Next-generation sequencing) technology, nucleotide sequence analysis has become easier at a lower cost than traditional methods. Sequencing analysis is important in bioinformatics because it can understand biological phenomena and helps people to know information about diseases. In particular, finding variants within the sequence plays an important role in obtaining information about diseases. Finding variants in sequences in NGS technology has previously been done using tools such as Samtools and GATK, which apply statistical methods, and recently, methods for finding variants have been developed using deep learning methods. One of these tools is DeepVariant.n this paper, we use deep learning to find mutations in the sequence, such as DeepVariant, but use RNN and Transformer models, which are different from deepVariant using CNN, to detect mutations and compare them between the two models.
URI
http://hanyang.dcollection.net/common/orgView/200000590410https://repository.hanyang.ac.kr/handle/20.500.11754/167513
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE