229 0

Full metadata record

DC FieldValueLanguage
dc.contributor.advisor백은옥-
dc.contributor.author강성곤-
dc.date.accessioned2022-02-22T01:35:45Z-
dc.date.available2022-02-22T01:35:45Z-
dc.date.issued2022. 2-
dc.identifier.urihttp://hanyang.dcollection.net/common/orgView/200000590880en_US
dc.identifier.urihttps://repository.hanyang.ac.kr/handle/20.500.11754/167479-
dc.description.abstractRecent studies show that alternative splice events such as exon extension, retained intron, and exon skipping contribute to functional changes in biological pathways. Identification of novel peptides from those events in mass spectrometry-based proteomics is challenging in that the peptides cannot be found in a reference protein database such as UniProt. Here we propose a pipeline called PGpep (ProteoGenomics peptide validation), that can automatically interpret and validate novel peptides from de novo peptide sequencing coupled with RNA-seq data. PGpep works with de novo peptide sequencing results and RNA-seq data as input. PGpep returns validated novel peptide candidates and evidences of putative novel events (number of supporting RNA read, putative novel splice site, putative novel transcript model, p-value) as output. PGpep consists of three main processes. First, known peptide sequences (e.g., those in UniProt database) are removed from the list of candidate peptides obtained by de novo peptide sequencing of mass spectrometry-based proteomics. Second, the peptide sequences are mapped to genes using ACTG, a peptide mapping tool allowing novel events based on genome fasta and transcriptome model in gene transfer format (GTF). Finally, we integrate the peptides mapped to genes with RNA-seq data using SAMtools and validate whether these novel peptide candidates can reliably be interpreted as one of three novel events - exon extension, retained intron, and exon skipping. We tested the pipeline with 50 glioblastoma (GBM) patients’ proteogenomics dataset and were able to find putative novel events - two exon extensions, twenty-two retained introns, and ten exon skippings. Among them, single exon skipping in PSMB2 and exon extension in NCOA5 were recurrently observed in over 26% of patients and had been previously reported. Novel alternative splice forms found by PGpep can be considered reliable because there is evidence in both proteomics and transcriptomics. |최근 연구에서는 엑손 확장, 인트론 유지, 엑손 건너뛰기와 같은 선택적 스플라이싱 이벤트를 통한 유전자 변형이 암과 같은 질병의 발생, 진행 또는 항암제 내성과 관련된다는 보고가 있다. 질량 분석 기반 단백체학에서 선택적 스플라이싱 이벤트로부터 새로운 펩타이드를 식별하는 것은 펩타이드를 UniProt 와 같은 기준 단백질 데이터베이스에서 찾을 수 없다는 점에서 어렵다. 이 연구에서 우리는 de novo 펩타이드 시퀀싱 결과를 이용해 새로운 펩타이드 후보를 선정하고, 이를 RNA-seq 데이터와 결합하여 자동으로 해석하고 검증할 수 있는 PGpep (ProteoGenomics peptide validation) 파이프라인을 제안한다. PGpep 은 de novo 펩타이드 시퀀싱 결과와 RNA-seq 데이터를 입력값으로 사용한다. PGpep 은 검증된 새로운 펩타이드 서열 후보들과 잠정적인 새로운 이벤트들의 증거들을 (새로운 이벤트를 지지하는 RNA 가닥의 수, 추정 새로운 스플라이싱 부위, 추정 새로운 전사 모델, p-값) 결과값으로서 반환한다. PGpep 은 세 가지 주요 과정으로 구성된다. 첫째, de novo 펩타이드 시퀀싱에 의해 얻은 펩타이드 중 알려져 있는 펩타이드 서열을 (예: UniProt 데이터베이스) 목록에서 제거한다. 둘째, 펩타이드 서열은 게놈 fasta 와 gene transfer format (GTF)의 전사체 모델에 기반하여 새로운 이벤트를 허용하는 펩타이드 매핑 도구인 ACTG 를 사용하여 유전자에 매핑된다. 최종적으로, SAMtools 를 사용하여 유전자에 매핑된 펩타이드를 RNA-seq 데이터와 통합하고 새로운 펩타이드 후보가 세 가지 새로운 이벤트 (엑손 확장, 인트론 유지, 엑손 건너뛰기) 중 하나로 해석될 수 있는지 검증한다. 50 명의 교모세포종 (GBM) 환자의 단백유전체 데이터 세트로 파이프라인을 테스트했고 2 개의 엑손 확장, 22 개의 인트론 유지, 10 개의 엑손 건너뛰기로 추정되는 새로운 이벤트들을 찾을 수 있었다. 이중에서, PSMB2 유전자에서 관찰된 엑손 건너뛰기와 NCOA5 유전자에서 관찰된 엑손 확장은 이전 연구에서도 보고된 바 있으며, 본 연구에서 사용한 교모세포종 데이터에서도 26% 환자에서 발현됨을 확인할 수 있었다. PGpep 에 의해 발견된 선택적 스플라이싱 모델은 단백체학 및 전사체학 모두에 증거가 있기 때문에 신뢰 될 수 있다.-
dc.publisher한양대학교-
dc.titleAutomated validation of novel peptides from proteogenomics data-
dc.title.alternative단백유전체 데이터를 사용한 신규 펩타이드의 자동 검증-
dc.typeTheses-
dc.contributor.googleauthorSunggon Kang-
dc.contributor.alternativeauthor강성곤-
dc.sector.campusS-
dc.sector.daehak대학원-
dc.sector.department컴퓨터·소프트웨어학과-
dc.description.degreeMaster-
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE