580 0

펩타이드 서열 결정에 있어서 분할 검증 방법

Title
펩타이드 서열 결정에 있어서 분할 검증 방법
Author
나지훈
Advisor(s)
백은옥
Issue Date
2019-02
Publisher
한양대학교
Degree
Master
Abstract
펩타이드 동정에 있어 가장 널리 사용되는 방법 중 하나는 데이터베이스 기반 동정이다. 이는 이미 알려져 있는 단백질 서열을 가지고 이론적인 스펙트럼을 생성하여 실험을 통해 나온 스펙트럼과의 유사도를 계산함으로써 펩타이드를 동정하는 방법이다. 동정 프로그램은 후보 펩타이드 중 가장 점수가 높은 펩타이드들의 목록을 결과로 주는데, 이렇게 매치된 모든 결과들을 그대로 신뢰할 수 없으므로 신뢰할 수 있는 점수 구간을 결정하는 기준을 정해야 한다. 이를 위해 가장 많이 사용되는 방법은 Target-Decoy 방법[1]이다. 이 방법은 의도적으로 존재하지 않는 서열에 해당하는 decoy서열을 만들어 데이터베이스에 넣고 동정을 진행한다. 그 후 일정 점수 이상에 포함된 decoy의 양을 통해 신뢰할 수 있는 정도를 설정한다. 이미 실험으로 통해 target과 decoy 사이의 잘못 동정 된 펩타이드의 수가 유사하다는 것이 알려져 있기 때문에, target내에 있는 false positive를 일정 점수 이상의 decoy의 수를 통해 추정할 수 있다. 질량 스펙트럼의 실험 과정은 크게 MS와 MS/MS로 구성되는데, MS는 펩타이드의 질량을 측정하고 시퀀싱할 펩타이드를 선택하기 위해, MS/MS는 MS에서 선택한 특정 펩타이드의 구체적인 서열을 알기 위해 진행한다. 앞서 선택된 펩타이드의 서열을 무작위로 분열시켜 시퀀싱을 위한 정보를 얻게 되는데, 이 과정에서 isolation window를 통해 분열시키고자 하는 펩타이드를 선택한다. 기존의 연구에서는 이렇게 isolation window안에 선택되어 얻어지는 MS/MS 스펙트럼의 약 50% 정도는 2개 이상의 펩타이드가 선택된다고 보고된 바 있다[2]. 현재의 질량 스펙트럼을 통한 펩타이드 동정 방법은 일반적으로 1개의 스펙트럼 당 1개의 펩타이드를 매칭하는 것을 가정하고 있기에 여러 개의 펩타이드가 한번에 분열되는 경우를 적절히 처리하기에 어려움이 있다. 위의 가정으로 인해 펩타이드 매치 과정의 점수 계산에 있어 오히려 페널티를 주기 때문인데, 이는 펩타이드가 공동 분열된 정도에 따라, 즉 질량 스펙트럼의 순도에 따라 매칭의 점수 분포가 다르다는 것을 의미한다. 위에서 언급한 것과 같이 동정 결과를 검증함에 있어 target과 decoy의 점수 분포를 통해 그 신뢰 정도를 산출하게 되므로 펩타이드 동정 점수 분포를 정확히 아는 것이 중요하다. 기존의 “1 스펙트럼 - 1 펩타이드” 매치를 가정하는 패러다임을 따르는 상황에서 낮은 순도의 스펙트럼은 무작위 매치의 위험과 실제 존재하는 펩타이드를 잘 검출하지 못하는 문제를 가지고 있다. 즉, 순도에 따라 그 점수 분포가 매우 상이하다는 것을 예상할 수 있다. 따라서 본 연구는 이러한 차이를 고려하여 스펙트럼을 순도별로 나누어 Target-Decoy 전략을 적용하고자 한다. 또한 공공 데이터를 통해 이러한 접근법이 실제 동정 결과의 신뢰도를 높일 수 있는지를 보이고자 한다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/99803http://hanyang.dcollection.net/common/orgView/200000435415
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE