275 0

Next Generation Sequencing 데이터의 quality control을 위한 딥러닝 모델 개발

Title
Next Generation Sequencing 데이터의 quality control을 위한 딥러닝 모델 개발
Other Titles
Development of a deep learning model for quality control of Next Generation Sequencing data
Author
정경건
Alternative Author(s)
Kyungkeon Chung
Advisor(s)
박희진
Issue Date
2022. 2
Publisher
한양대학교
Degree
Master
Abstract
NGS 분석에서 결과에 부정적인 영향을 끼칠 수 있는 낮은 quality의 데이터를 처리하는 것은 중요하다. 일반적인 quality control 툴은 사용자가 직접 검토 할 수 있는 다양한 features를 도출한다. 하지만, 다양한 features에 따라 직접 NGS 시퀀싱 데이터의 quality를 분류하는 것은 확신할 수 없다. 이 논문에서는 NGS quality features 데이터를 스케일링한 후 CNN 딥러닝 모델을 적용하여 새로운 quality control procedure를 개발하였다. 그 결과, 여러 데이터 셋의 조합인 generic data와 ChIP-seq human과 mouse, DNase-seq human 데이터에서 CNN 모델이 기존 seqQscorer 툴의 딥러닝 모델인 MLP 모델보다 뛰어난 결과를 보였다. 또한 RNA-seq와 DNase-seq mouse 데이터에서는 CNN 모델이 seqQscorer의 MLP뿐만 아니라 RFC 모델까지 뛰어넘는 결과를 보였다.|In the NGS analysis, it is important to classify low quality data that may negatively affect the results. A general quality control tool derives various features that the user can manually review. However, it is unreliable to directly classify the quality of NGS sequencing data according to various features. In this paper, we developed a new quality control procedure using the CNN deep learning model after scaling NGS quality features data. As a result, in all datasets, the CNN model showed better results than the MLP model, a deep learning model of the seqQscorer tool. In particular, in RNA-seq data and DNase-seq mouse data, CNN model outperformed not only the MLP model but also the RFC model of seqQscorer.
URI
http://hanyang.dcollection.net/common/orgView/200000590792https://repository.hanyang.ac.kr/handle/20.500.11754/167502
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE