1121 0

유전자 발현 프로파일의 행렬 분해를 이용한 유전자 발현 조절 망 추정

Title
유전자 발현 프로파일의 행렬 분해를 이용한 유전자 발현 조절 망 추정
Other Titles
Inference of Gene Regulatory Network using Factorization of Gene Expression Profile Matrix
Author
김혜영
Alternative Author(s)
Kim, Hye-Young
Advisor(s)
김진혁
Issue Date
2007-08
Publisher
한양대학교
Degree
Doctor
Abstract
유전자 발현 조절 망(gene regulatory network)은 유전자의 발현을 조절하여 생명현상을 관장하는 정보의 흐름을 매개하는 휘발성 구조를 의미한다. 유전자의 발현은 유전자 또는 유전자 모듈 사이의 논리와 연결 강도에 의해 적절한 시점에 적절한 수준으로 조절되어야 한다. 유전자 발현 조절 망은 생명현상의 핵심적 역할을 수행하며 생명체의 진화를 비롯하여 종 간 혹은 개체 간 차이를 발현시킬 뿐만 아니라 각종 질환의 병태생리를 설명할 수 있을 것으로 기대된다. 그러나 최근 개발된 high-throughput 실험으로부터 얻은 다량의 유전자 발현 데이터를 사용하더라도 유전자 발현 조절 망을 파악하기에는 여전히 양적 · 질적으로 정보가 부족하다. 따라서 실제 유전자 발현 조절 망에 가장 근접한 모델을 개발하고, 이러한 모델에 준하여 유전자 발현 조절 망의 각 부분에 접근하는 방식이 필요하다. 본 연구에서는 분화하는 마우스 배아줄기세포의 유전자 발현 조절 망을 추정하고자 유전자 군집 및 유전자 군집 간 조절 정보의 전달 통로를 추적하였다. 총 8,947 유전자의 시간 별 발현 데이터가 사용되었으며, 이는 마우스 배아줄기세포의 분화 유도 후 6 시점에서 수집하였다. 유전자의 군집은 RnE (refinement and enrichment) 군집화 방법을 이용하여 유전자 발현의 진동 위상 (oscillatory phase) 별로 잘 분류된 171개의 유전자 군집을 확보하였다. RnE 군집화 방법은 k-means 군집화 방법 및 특이값 분해(SVD, sigular value decomposition)의 장점을 계승한 것으로, 특정 환경에서 일시적으로 발현되는 기능적 단위체로서 작동하는 유전자의 모듈(module)을 획득하기 위해 고안되었다. 또한 각 유전자 군집의 발현을 주도하는 eigengene 행렬을 추출하여 이를 두 개의 행렬, 즉 유전자 발현 행렬 및 가중 계수 (weight coefficient) 행렬로 분해하였다. 가중 계수의 유의성 검증을 통해 171개 유전자 군집의 제 일 eigengene을 주로 구성하는 34개 유전자, 즉 유전자 군집을 조절하는 데 주도적인 역할을 하는 유전자(principal gene)를 발견하였다( < 1.0E-9). 이러한 결과를 종합하여 34개의 principal gene을 거쳐 전달되는 유전자 발현 조절 망을 추정하였다. 또한 유전자 발현 조절 망에 깊이 우선 탐색(DFS, depth first search)을 적용하여 유전자 발현 조절의 계층적 구조를 발견하였다. 본 연구의 결과로 도출된 principal gene 및 유전자 발현 조절 망의 생물학적 의미를 분석한 결과, 실제 생물학적 현상과 근접함을 보여주었다. Principal gene을 포함하고 있는 유전자 군집은 마우스 배아줄기세포의 특성의 발현을 주도하는 것으로 밝혀졌으며, 이는 지금까지 알려진 줄기세포의 특성 발현에 대한 연구와 상당히 일치한다. 따라서 본 논문에서 제시한 방법은 포유동물의 세포에서 유전자 발현의 조절 관계를 이해하는 데 기여할 것이다.; The gene regulatory network represents a volatile structure that mediates the flow of information controlling and regulating life. This network is believed to play a key role in life, to lead the evolution of life and the difference between individuals or species, and to explain the pathophysiology of diseases. It is assumed that the expression of genes can be controlled and regulated at the proper time by some logic and connection strength between genes or modules of genes. Because high-throughput data is still insufficient to understand the gene regulatory network, it is necessary to develop a model reflecting the real gene regulatory network and to approach each part of the gene regulatory network based on the model. In this study, a gene regulatory network of differentiating mouse embryonic stem (ES) cells was inferred by obtaining both clusters of genes and channels transmitting regulatory information between the clusters as nodes and edges of the network, respectively. A time-series gene expression dataset of 8,947 genes of mouse ES cells were obtained from cDNA microarray experiments at six points of time after induction of neuronal differentiation. Clusters of genes were obtained by using the refinement and enrichment (RnE) algorithm that adopts the advantages of both k-means and Singular Value Decomposition (SVD). The RnE algorithm was devised for obtaining modules of genes, which operate as functional units temporarily appearing under a certain momentary condition of the biological system. It clustered genes into 171 clusters having strong concentratedness in their expression patterns and a distinct range of oscillatory phases. The eigengenes of each cluster were factorized into two matrices, the gene expression profile matrix and the weight coefficient matrix. By using the significance testing of the weight coefficients, 34 genes that mainly comprise the first eigengenes of the 171 clusters were identified ( < 1.0E-9). Such genes, defined as the principal genes, were considered to be crucial in regulating the clusters. By putting the results together, a gene regulatory network was inferred, which transmits regulatory information between clusters mediated by the 34 principal genes. In addition, hierarchical structures of cluster regulation were discovered by applying Depth First Search (DFS) to the network. The analysis of biological significance of the principal genes and the cluster network supports the feasibility of the algorithms. The clusters that include the principal genes are understood to drive the manifestation of the phenotypes, e.g., the neuronal differentiation of mouse ES cells. This is in concord with our knowledge of the phenotypes of stem cells. The proposed methods will contribute to our understanding of gene regulatory relationships in mammalian cells.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/149035http://hanyang.dcollection.net/common/orgView/200000407459
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > DEPARTMENT OF BIOMEDICAL SCIENCES(의생명공학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE