1997 0

워드임베딩 기반 TextRank 알고리즘을 활용한 추출 문서 요약 기법 성능 평가

Title
워드임베딩 기반 TextRank 알고리즘을 활용한 추출 문서 요약 기법 성능 평가
Other Titles
Performance Evaluation of Extracted Document Summary Using TextRank Algorithm Based on Word Embedding
Author
지영민
Alternative Author(s)
ZHI, YOUNG MIN
Advisor(s)
이동호
Issue Date
2021. 2
Publisher
한양대학교
Degree
Master
Abstract
워드 임베딩을 활용하여 여러 가지 주제의 문서에서 주제가 되는 문장을 추출하여 문서를 요약하는 연구가 활발하게 진행되고 있으며 실용적인 연구가 많이 존재한다. 하지만 기존 문서 추출 요약 기법들은 단어의 빈도 또는 한 문장내에서 동시에 발생하는 빈도인 Co-occurence로 단어의 중요도와 연관성을 계산하여 중심 문장을 추출한다. 이로 인해 학습에 이용된 데이터와 다른 주제의 입력 데이터가 들어오면 연관이 없는 문장을 단어의 빈도 또는 Co-occurence로 계산하여 추출해오는 단점이 있다. 본 논문에서는 기존 연구의 단점을 극복하기 위해 동적 및 정적 워드임베딩들을 TextRank 알고리즘과 결합하여 더욱 정확한 문서 추출 요약 기법을 제안한다. 본 논문에서 제안한 기법은 문서 추출 요약에 많이 활용되는 스포츠 기사와 제목을 사용하여 제안한 기법의 우수성을 보인다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/158953http://hanyang.dcollection.net/common/orgView/200000486184
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE & ENGINEERING(컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE