태그 정보를 활용한 PG-Net 모델 기반 한국어 문서 생성 요약
- Title
- 태그 정보를 활용한 PG-Net 모델 기반 한국어 문서 생성 요약
- Other Titles
- Abstractive Document Summarization based on PG-Net using Tag Information
- Author
- 이동호
- Issue Date
- 2019-12
- Publisher
- 한국정보과학회
- Citation
- 2019년 한국소프트웨어종합학술대회 논문집, Page. 482-484
- Abstract
- 기존 문서 요약 기법 중 생성 요약 방식에서는 사전에 없는 단어를 요약에 반영하지 못하는 OOV(Out-of-Vocabulary) 문제와 반복적인 단어와 어구들로 구성된 문장을 생성하는 문제가 존재한다. 이러한 문제들을 해결하기 위해 PG-Net(Pointer Generator Network) 모델이 제안되었지만 생성할 단어들을 문맥적으로 고려하지 않고 단어 별로 다음에 올 단어를 예측하여 문장을 구성하기 때문에 생성된 요약이 원문의 의미와 달라지는 문제점이 발생하였다. 본 논문에서는 형태소 분석과 개체명 인식 과정을 통해 단어의 품사 정보와 개체의 의미 정보를 동시에 학습함으로써 문서의 핵심 내용을 보다 잘 요약할 수 있는 태그 정보 기반의 PG-Net 모델을 제안한다. 또한 한 어절이 어근 및 접사로 구성되는 한국어의 특징을 반영하기 위해 형태소 및 개체명 단위의 임베딩 학습 방법론을 제시한다. 마지막으로 비교 실험을 통해 본 논문에서 제안하는 방법이 기존 방법들보다 우수함을 보인다.
- URI
- https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE09301628https://repository.hanyang.ac.kr/handle/20.500.11754/186021
- Appears in Collections:
- ETC[S] > ETC
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML