301 0

유전자 프로그래밍에 의한 유전자 조절 네트워크의 선형 모델의 추론

Title
유전자 프로그래밍에 의한 유전자 조절 네트워크의 선형 모델의 추론
Other Titles
Combining Genetic Programming with Linear Model for Gene Regulatory Network Inference
Author
김보경
Advisor(s)
김진혁
Issue Date
2007-02
Publisher
한양대학교
Degree
Master
Abstract
생명체는 세포 내·외부의 환경적 혹은 생리적 자극에 대한 정보를 처리하여 적응적으로 반응한다. 이와 같은 정보의 처리와 반응은 유전체 수준에서도 일어나는데, 이는 외부의 자극을 반영하는 다수의 조절인자가 유전자의 발현을 변화시키고, 변화된 유전자의 발현 정도는 전사인자의 형태로 전환되어 다수의 다른 유전자에 조절적 기능을 수행함으로써 진행된다. 따라서, 유전자 발현의 변화는 세포내의 정보전달 기능의 세포내의 정보전달 기능의 수행과 밀접하게 관련된다고 할 수 있다. 최근, 마이크로 어레이 기술이 개발됨에 따라, 유전자의 발현을 대단위로 동시에 측정할 수 있게 되었고, 이를 통해 집적된 대단위 데이터로부터 생물학적 정보를 추출하기 위한 다양한 컴퓨터 계산 기술이 발달하였다. 특히 유전자 조절 네트워크의 규명이 생명 현상의 근본적인 이해를 위한 핵심적 문제로 조명됨에 따라, 유전자 발현 데이터를 이용한 유전자 조절 네트워크의 추론은 중요하게 되었다. 본 연구에서는 선형 모델과 유전자 프로그래밍을 이용하여 cDNA 마이크로 어레이 데이터로부터 유전자 조절 네트워크를 추정하고자 하였다. 유전자 프로그래밍은 다수의 개체로 구성된 개체군을 생성하고, 적합도가 높은 개체를 진화시킴으로써 최적화된 개체를 구하는 알고리즘이다. 유전자 조절 네트워크를 개체로 표현하고, 개체로 표현된 유전자 조절 네트워크에서 예측된 유전자 발현 데이터와 실제 특정된 마이크로 어레이 발현 데이터 간의 오차 값을 적합도로 평가하였다. 적합도가 높게 나타난 개체는 유전연산자에 의해 돌연변이, 유전교차 혹은 복제되어 세대를 반복하며 진화되었다. 유전자 조절 네트워크를 추정하는 과정은 다음과 같이 진행 되었다. 1. 생쥐의 ESell을 뉴런으로 분화시킴에 따라 cDNA 마이크로 어레이 실험을 실시하였고, 이를 통해 획득된 10368개의 유전자 발현데이터는 K-mean clustering 기법을 이용하여 200개의 집단으로 군집화되었다. 분화단계에 따라 발현 양상이 급격히 변화하는 유전자 군집에 속하는 유전자 39개와 전사 인자에 해당하는 444개의 유전자를 대상으로 유전자 조절 네트워크를 구축하였다. 2. 유전자 프로그래밍에서 유전자 네트워크는 네트워크 모티프 구조와 유전자간 조합에 의한 나무 구조로 표현되었다. 선형 모델을 기반으로 한 적합도 평가에 따라 유전 연산자를 적용함으로써 유전자 네트워크는 세대를 따라 진화되었다. 3. 선형모델을 기반으로 한 유전자 프로그래밍 기법을 이용해 최종적으로 추정된 유전자 네트워크는 다수의 유전자와, 방향성과 크기 정보가 포함된 유전자간 조절 관계로 표현되었다. 결과로 최고의 적합도를 가진 유전자 조절 네트워크에서 평가된 유전자 발현 프로파일은 실제 마이크로 어레이 데이터와 매우 유사한 양상으로 나타났다. 그러므로, 본 연구에서 제안한 선형 모델 기반의 유전자 프로그래밍 알고리즘은 대단위 유전자 발현 데이터로부터 정량적인 유전자 조절 네트워크를 추정에 효과적으로 적용될 수 있다. 또한 본 연구에서 추정된 유전자 조절 네트워크를 기반으로 생물학적인 검증 실험과 이를 통한 네트워크 모델의 수정을 반복함으로써, 생명 현상을 예측할 수 있는 'in silico' 모델 구현 연구를 진행할 수 있을 것이다.
Living cells regulate gene expression in response to environmental and physiological changes through a diversity of transcription factors. The gene expression has evolved to perform information processing functions. In recent years, the developed micro-array technology allows gene expression levels to be measured for the whole genome at simultaneously. While the amount of gene expression data has been increasing rapidly, the required computational techniques to analyze such data is still in development. Particularly, estimating the regulatory relationships between the transcription factors and genes from gene expression data is becoming a difficult task. Here, we describe a method to infer gene regulatory network, including the regulatory relationship, from the high-throughput gene expression data. In order to reconstruct the gene regulatory network, we use the network motifs as the blocks of it. It is a pattern or small graph that occurs more often at some statistically significant level in the true network as gene regulatory network module by syntax-tree based genetic programming. The estimated network motifs mean a direct relationship between mRNA levels of transcription factors (TFs) genes and their target genes. The fitness function of each syntax-tree uses the linear model. As genetic programming infers the best syntax-tree with fitness score, syntax-tree is direct mapping onto a network structure. This method was applied to cDNA microarray gene expression data, which were obtained from the differentiating mouse embryonic stem cells to neurons. In this study, we can reconstruct the subnetwork related neuronal cell differentiation and stem cell proliferation.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/150328http://hanyang.dcollection.net/common/orgView/200000406299
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > DEPARTMENT OF BIOMEDICAL SCIENCES(의생명공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE