246 0

Beta-shape의 다양체화 및 단백질의 포켓 계산

Beta-shape의 다양체화 및 단백질의 포켓 계산
Other Titles
Manifoldization of Beta-shapes and Extraction of Pockets on Proteins
Alternative Author(s)
Lee, Changhee
Issue Date
포켓은 단백질 표면의 움푹 파인 영역이며 단백질의 기능을 결정하는 데 중요한 역할을 한다. 단백질과 약물은 대개 포켓 주변에서 결합하여 상호작용을 한다고 알려져 있다. 따라서 포켓을 찾는 것은 신약을 개발하고 단백질의 기능을 예측하는데 매우 중요하다. 이 논문에서는 단백질의 포켓을 찾기 위한 알고리즘을 제안한다. 제안된 알고리즘은 베타-쉐입(beta-shape)을 이용하여 단백질 표면의 기하 구조를 분석하여 포켓을 찾아낸다. 베타-쉐입은 단백질 표면의 원자들 간의 인접정보에 의해 정의된 기하구조를 분석하기 위한 도구이다. 베타-쉐입은 단백질을 이루는 원자들의 반지름이 서로 다른 것을 고려하고, 유클리디안-거리척도(Euclidean-distance)를 이용하기 때문에, 단백질의 기하구조 분석에 매우 효율적인 도구이다. 그러나 이러한 베타-쉐입은 비다양체(non-manifold) 모델이다. 비다양체 모델을 활용하기 위해서는 보다 복잡한 형태의 알고리즘이 필요하다. 또한, 모델을 표현하기 위해서는 보다 복잡한 자료구조가 필요하다. 본 논문에서는, 먼저 비다양체 모델인 베타-쉐입을 다양체로 바꾸는 다양체화(manifoldization) 알고리즘을 제안하였다. 다양체화 과정에서 주어진 모델의 기하적인 정보는 전혀 바꾸지 않고, 위상 정보만을 정제하여 모델을 다양체로 바꾼다. 다양체화 알고리즘은 크게 2가지 단계로 이루어져 있는데, 첫 번째는 주어진 모델의 표면에 가상의 심플렉스(simplex)들을 추가하는 것이다. 두 번째는 추가된 모델의 표면을 다양체(manifold) 모델을 담을 수 있는 자료구조에 담는 것이다. 제안된 알고리즘은 단백을 이루는 원자의 개수에 선형적인 시간 안에 모델을 다양체로 바꾼다. 이렇게 다양체화된 베타-쉐입을 이용하면, 포켓을 찾는 문제는 2차원 그물망(mesh)의 영역을 나누는 문제로 바꿀 수 있다. 베타-쉐입의 위상적 성질을 이용하면, 물체 표면에 움푹 파인 영역에 있는 원자들을 쉽게 밝혀낼 수 있다. 본 논문의 알고리즘은 움푹 파인 영역에 있는 원자들을 인접한 것들끼리 군집화하여 포켓을 정의한다. 이렇게 정의된 포켓은 정제과정이 필요한데 이 과정은 2개의 프로세스로 이루어져 있다. 첫 번째는 포켓의 경계 부분을 한 층 깎아내는 것이고, 두 번째는 깎인 포켓을 다시 한 층 추가하는 것이다. 이 알고리즘은 단백질 표면의 움푹 파인 영역과 터널, 내부 공간에 있는 약물과 결합하는 영역을 효율적으로 계산한다. 본 논문은 단백질 데이터베이스 Protein Data Bank의 실제 단백질에 대하여 제안된 알고리즘들을 적용시켜 얻은 실험 결과들을 보인다.
Depressed regions on the boundary of proteins are called pockets and considered important for determining molecular functions. In particular, the interaction between a protein and a compound is frequently found to occur around pockets of the protein. Therefore, the recognition of pockets on a protein is important for understanding the functional characteristics of proteins in the structural molecular biology. In this thesis, we propose a new algorithm for extracting pockets by prioritizing the shape characteristics of protein boundary using beta-shapes. A beta-shape is a recently introduced geometric construct which facilitates efficient computations about the proximity among spherical particles in three-dimensional space. They have proven to be very useful for the structural analysis of bio-molecules. However, it has been known that the beta-shape is non-manifold. Hence, the topology traversal on the boundary of the beta-shape is inconvenient with ordinary algorithms to handle the surface structure of a sphere set. In this regard, we have first developed a topological scheme to convert the non-manifoldness of the beta-shape into manifold so that the topological traversal can be rather easier. Our algorithm, called manifoldization, is for transforming a beta-shape from non-manifold to manifold without altering any geometric characteristics of the model. After locating the simplexes where the non-manifoldness is caused on the boundary of the beta-shape, the algorithm augments the boundary of the beta-complex which corresponds to the beta-shape so that all the non-manifoldness is resolved on such simplexes. Then, we take off the boundary of the manifoldized beta-shape and stores it in a data structure such as a winged-edge data structure. The algorithm runs in O(n) time, without any float-point operation, in the worst case for protein models, where n is the number of spherical atoms. With the manifoldized beta-shape, we formulate the pocket extraction problem as the segmentation problem f two-dimensional meshes. Using topological properties of the simplexes on the boundary of the beta-shape, we identify the candidate atoms which are placed on depressed region of proteins by looking at the exposure intervals of each atom with respect to the given threshold value. Given the marked atoms on the molecular boundary determined as the potential elements constituting pockets, we segment the molecular boundary by clustering the marked atoms which form a connected subset of the boundary mesh. Given the connected subsets of mesh, called the raw pockets, we refine the raw pockets through the shaving process which consists of two consecutive processes called the shrinking and the enlargement process. It turns out that the shaving process produces a fairly well-structured pocket boundary which is appropriate for the following process of docking between proteins and ligands. We provide some experimental results obtained from real protein models available from the Protein Data Bank.
Appears in Collections:
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.