돌연변이 탐지를 위한 트랜스포머 모델과 RNN 모델의 성능 비교
- Title
- 돌연변이 탐지를 위한 트랜스포머 모델과 RNN 모델의 성능 비교
- Other Titles
- Comparison of Transformer Model and RNN Model Performance for Variant Detection
- Author
- 이재경
- Alternative Author(s)
- Jae Kyung Lee
- Advisor(s)
- 박희진
- Issue Date
- 2022. 2
- Publisher
- 한양대학교
- Degree
- Master
- Abstract
- NGS(Next-generation sequencing) 기술로 인해서 염기서열(Nucleotide) 분석은 전통적인 방법보다 낮은 비용으로 쉽게 이루어지게 되었다. 염기서열 분석은 생물의 현상을 이해하고 질병에 대한 정보를 알 수 있어서 생물정보학(Bioinformatics)에서 중요하다. 특히 염기서열 분석에서 염기서열 내의 돌연변이(Variation)를 찾는 것은 질병에 대한 정보를 얻는 것에서 중요한 역할을 하고 있다. NGS 기술로 시퀀싱한 염기서열에서 돌연변이를 찾는 일은 기존에는 통계적 방식을 응용하는 Samtools나 GATK와 같은 툴을 이용해서 이루어졌으며, 최근에는 딥러닝(Deep learning) 방식을 이용해서 돌연변이를 찾는 방법이 개발되었다. 이러한 툴에는 DeepVariant 가 있다. 본 연구에서는 DeepVariant 와 같이 딥러닝을 이용해서 염기서열 내의 돌연변이를 찾되, CNN을 사용하는 DeepVariant 와는 다른 딥러닝 모델인 RNN과 트랜스포머(Transformer) 모델을 이용해서 돌연변이 발생 위치를 탐지하고 비교해본다.
|
Due to NGS (Next-generation sequencing) technology, nucleotide sequence analysis has become easier at a lower cost than traditional methods. Sequencing analysis is important in bioinformatics because it can understand biological phenomena and helps people to know information about diseases. In particular, finding variants within the sequence plays an important role in obtaining information about diseases. Finding variants in sequences in NGS technology has previously been done using tools such as Samtools and GATK, which apply statistical methods, and recently, methods for finding variants have been developed using deep learning methods. One of these tools is DeepVariant.n this paper, we use deep learning to find mutations in the sequence, such as DeepVariant, but use RNN and Transformer models, which are different from deepVariant using CNN, to detect mutations and compare them between the two models.
- URI
- http://hanyang.dcollection.net/common/orgView/200000590410https://repository.hanyang.ac.kr/handle/20.500.11754/167513
- Appears in Collections:
- GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML