68 0

태그 정보를 활용한 PG-Net 모델 기반 한국어 문서 생성 요약

Title
태그 정보를 활용한 PG-Net 모델 기반 한국어 문서 생성 요약
Other Titles
Abstractive Document Summarization based on PG-Net using Tag Information
Author
이동호
Issue Date
2019-12
Publisher
한국정보과학회
Citation
2019년 한국소프트웨어종합학술대회 논문집, Page. 482-484
Abstract
기존 문서 요약 기법 중 생성 요약 방식에서는 사전에 없는 단어를 요약에 반영하지 못하는 OOV(Out-of-Vocabulary) 문제와 반복적인 단어와 어구들로 구성된 문장을 생성하는 문제가 존재한다. 이러한 문제들을 해결하기 위해 PG-Net(Pointer Generator Network) 모델이 제안되었지만 생성할 단어들을 문맥적으로 고려하지 않고 단어 별로 다음에 올 단어를 예측하여 문장을 구성하기 때문에 생성된 요약이 원문의 의미와 달라지는 문제점이 발생하였다. 본 논문에서는 형태소 분석과 개체명 인식 과정을 통해 단어의 품사 정보와 개체의 의미 정보를 동시에 학습함으로써 문서의 핵심 내용을 보다 잘 요약할 수 있는 태그 정보 기반의 PG-Net 모델을 제안한다. 또한 한 어절이 어근 및 접사로 구성되는 한국어의 특징을 반영하기 위해 형태소 및 개체명 단위의 임베딩 학습 방법론을 제시한다. 마지막으로 비교 실험을 통해 본 논문에서 제안하는 방법이 기존 방법들보다 우수함을 보인다.
URI
https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE09301628https://repository.hanyang.ac.kr/handle/20.500.11754/186021
Appears in Collections:
ETC[S] > ETC
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE