텍스트에서 박테리아와 질병의 다양한 관계 추출 프로그램

Title
텍스트에서 박테리아와 질병의 다양한 관계 추출 프로그램
Other Titles
BDRextractor: extracting diverse relations between bacteria and disease from the text
Authors
고대진
Advisor(s)
노미나
Issue Date
2018-02
Publisher
한양대학교
Degree
Master
Abstract
박테리아는 질병과 밀접한 관계를 갖는다. 주변 환경은 물론 인체 내까지 존재한다. 박테리아는 어떤 기능을 가지고 있는지에 따라 우리 몸에 이로운 또는 해로운 결과를 낳기도 한다. 지금까지 박테리아에 대한 수많은 연구들이 진행되어 왔고 수천만 편의 논문에 해당된다. 박테리아가 어떤 역할을 하고 어떤 환경에서 어떻게 변화해야하는지 파악하기 위해 그 수많은 논문을 봐야한다. 하지만 이는 인간에게 불가능에 가까운 일이며, 막대한 시간과 비용을 초래한다. 그리고 논문을 보는 인간의 지능에 따라서 얻는 지식 또한 다양하게 이해된다. 본 연구에서는 인간이 진행하기 힘든 수많은 박테리아와 질병에 관한 논문 중에서 상호간 관계를 추출할 수 있는 프로그램 개발을 진행했다. Pubtator에서 박테리아에 관련된 초록 40만 건을 수집하고 수많은 초록에서 질병과 박테리아가 같이 언급된 문장을 뽑아 추출 규칙을 정의했다. 추출 규칙은 총 4가지로 정의하였으며 정규식, Lowest Common Ancestor(LCA), Dependency 관계 태그 등으로 필터규칙을 세웠다. 동시 언급된 문장을 dependency grammar를 이용하여 트리를 빌드하였고 해당 트리를 추출 규칙에 대입하고 필터규칙으로 관계가 설명되었는지 거르는 역할을 수행했다.
URI
http://www.dcollection.net/handler/hanyang/000000106245http://repository.hanyang.ac.kr/handle/20.500.11754/68652
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE