192 0

Computational analysis of heterotypic cell-cell interactions from single-cell RNA-seq data

Title
Computational analysis of heterotypic cell-cell interactions from single-cell RNA-seq data
Other Titles
단일 세포 RNA 시퀀싱 데이터의 전산학적 분석을 통한 이형세포간 상호작용의 추론
Author
김한지
Alternative Author(s)
Hanji Kim
Advisor(s)
남진우
Issue Date
2022. 8
Publisher
한양대학교
Degree
Master
Abstract
Single-cell RNA sequencing (scRNA-seq) has become a critical technology for exploring cellular heterogeneity within a tissue. In droplet-based microfluidic systems, which is now the most widely used protocol of scRNA-seq, there exists a typical artifact named ‘doublet (multiplet)’, where two (or more) cells are mistakenly captured in the same droplet and together exhibit a spurious cell type. While its influences on analysis can be reduced via both experimental and computational detection, recent efforts have been made to exploit multiplets to obtain spatial information of cells within a tissue, postulating that physically contacting cells will more often be captured together inside the same droplet than they would by chance. Here I introduce a computational analysis pipeline termed CINCIA (Computational Inference of Cell-Cell Interactions from scRNA-seq Data), which infers putative interactions between different cell types from doublets. In this workflow, an input gene expression matrix is first analyzed through computational analysis steps of scRNA-seq data, putative doublets are next collected by a new simple Gaussian Naïve Bayes based doublet meta-caller which utilizes three existing doublet detection algorithms. Those doublets found are then deconvoluted into two contributing cell types for each, and finally, statistically significant combinations of cell types observed in doublets come out as potential heterotypic interactions. To validate the workflow, CINCIA was applied first to several scRNA-seq data simulated from two public datasets of which target tissues were mildly dissociated to obtain more multiplets. In addition, the pipeline is also validated on a public scRNA-seq data and its matched spatial transcriptomics data in which normal dissociation is conducted. Taken together, as a straightforward method solely based on computational approaches, I believe this work could help identify potential interactions between different types of cells in a complex tissue using scRNA-seq data. |단일 세포 RNA 시퀀싱은 조직 내 세포의 이질성을 분석하는 데 있어 중요한 기술이 되었다. 액적 기반의 미세유체 (droplet-based microfluidics) 시스템은 단일 세포 RNA 시퀀싱 기술 중 가장 널리 사용되고 있는 기술이고, ‘doublet’ 이라는 전형적 산물(arfifact)이 존재하는데 이는 2개의 (multiplet의 경우 2개 이상) 세포가 동일한 액적에 함께 들어가 그럴싸한 세포 타입의 특징을 나타내는 것을 의미한다. Doublet이 분석에 미치는 영향은 실험적, 전산적 탐지 방법을 통해 완화시킬 수 있는데, 최근에는 doublet (multiplet) 을 활용해 조직 내 세포들의 위치 정보를 얻는 연구들이 진행되었다. 이는 조직 내 물리적으로 접촉하고 있는 세포들은 우연보다 더 빈번히 doublet으로 발견될 것이라는 전제를 바탕으로 한다. 본 연구에서는 단일 세포 RNA 시퀀싱 데이터를 활용해 세포 간 상호작용을 전산적 방법으로 추론하는 분석 파이프라인을 개발하였고 이를 ‘CINCIA’ 라 명명하였다. 해당 파이프라인에서는 가장 먼저 단일세포 RNA 시퀀싱 데이터의 기본적인 전산적 분석 방법을 통해, 입력 데이터인 행렬 형태의 유전자 발현 데이터를 분석하고, 세 개의 기존 doublet 감지 알고리즘들을 활용해 새롭게 개발한 Gaussian Naïve Bayes 기반의 간단한 doublet meta-caller를 이용하여 doublet들을 추정한다. 그 다음, 예측된 각 doublet을 이들을 구성하고 있는 두 개의 세포 유형 (cell-type) 으로 분해하고, 마지막으로 doublet으로 발견된 세포 유형 조합들 중 통계적 유의성을 보이는 것들을 이형 세포 타입간 상호작용으로 추정한다. 본 파이프라인의 검증을 위해, 약한 조직 해리를 수행해 평소보다 더 많은 multiplet을 얻은 두 개의 공용 데이터로부터 시뮬레이션을 통해 가상의 단일 세포 RNA 시퀀싱 데이터들을 생성하였고, 이들에 CINCIA를 적용해보았다. 또한, 보통의 효과적인 조직 해리를 거친 하나의 샘플에서 얻은 단일 세포 RNA 시퀀싱 데이터와 공간 전사체 데이터에도 적용해 검증하고자 하였다. 이를 종합하면, 본 파이프라인은 전산적 접근방식만을 기반으로 한 간단한 방법으로서, 단일세포 RNA 시퀀싱 데이터를 활용해 복잡한 조직 내 이형 세포 타입간의 잠재적 상호작용을 식별하는 데에 도움을 줄 것이라 생각된다.
URI
http://hanyang.dcollection.net/common/orgView/200000626437https://repository.hanyang.ac.kr/handle/20.500.11754/186795
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > LIFE SCIENCE(생명과학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE