253 0

생물의학 문헌에서의 개체명 인식 방법에 관한 연구

Title
생물의학 문헌에서의 개체명 인식 방법에 관한 연구
Author
이순호
Alternative Author(s)
LEE, SOON HO
Advisor(s)
노미나
Issue Date
2022. 2
Publisher
한양대학교
Degree
Master
Abstract
문헌에서 명명된 개체명들은 대개 중요한 정보를 나타내기 때문에 이를 정확하게 찾아내고 분류하는 개체명 인식(Named entity recognition)은 자연어 처리(Natural language processing) 분야에서 근본적이면서도 중요한 과제이다. 특히나 일반적인 단어들이 아닌 생소하고 어려운 단어들이 많이 등장하는 생물의학(Biomedical) 문헌을 이해하는 데에는 더욱 중요하다고 할 수 있다. 개체명 인식은 크게 단일 개체명 인식(Flat named entity recognition)과 중첩된 개체명 인식(Nested named entity recognition)으로 나눌 수 있는데, 본 연구에서는 생물의학 문헌에서의 단일 개체명 인식, 중첩된 개체명 인식 태스크를 각각 나누어, 단일 개체명 인식에서는 language model 기반 contextual embedding에 여러 임베딩 방식을 결합한 모델을 통해 성능 개선을 시도하였고, 중첩된 개체명 인식에서는 attention network와 recurrent neural network (RNN)를 이용한 모델을 통해 성능 개선을 시도하였다. 더해서 마지막 부분에서는 중첩된 개체명 인식을 위해 제안된 모델로 단일 개체명 인식 태스크 성능을 평가해 보았다.|Since named entities in the literature usually contain important information, Named entity recognition is a fundamental task in natural language processing. It is more important to understand the biomedical literature, where more scientific words appear than the general literature. Named entity recognition can be divided into flat named entity recognition and nested named entity recognition. In this study, we divided the named entity recognition tasks in the biomedical literature into flat named entity recognition and nested named entity recognition and try to improve entity recognition performance. In flat named entity recognition part, we LEE, SOON HO Dept. of Computer Science Graduate School of Hanyang University tried combining various embedding methods with language model-based contextual embedding, and in the nested named entity recognition part, we proposed a model using attention and recurrent neural networks. In the last part, we evaluated the performance of flat named entity recognition with the proposed model for nested entity name recognition.
URI
http://hanyang.dcollection.net/common/orgView/200000591709https://repository.hanyang.ac.kr/handle/20.500.11754/167515
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE