638 0

Efficient Multi-turn Conversation Summarization System Using KoBART and TextRank

Title
Efficient Multi-turn Conversation Summarization System Using KoBART and TextRank
Author
박승진
Alternative Author(s)
박승진
Advisor(s)
이동호
Issue Date
2022. 2
Publisher
한양대학교
Degree
Master
Abstract
최근 많은 회사나 대학에서 화상 회의나 강의 등 비대면 의사소통이 증가함에 따라 대화 데이터의 규모가 엄청난 속도로 축적되고 있다. 동시에 최신 인공지능 연구들은 대화 데이터에 중요한 정보가 포함되어 있는 문장과 그렇지 않은 문장을 구별하거나 재확인 등과 같은 요약 기능을 저하시킬 수 있는 문장을 효과적으로 제거함으로써 대화 요약의 성능을 향상시키는 연구를 진행하고 있다. 본 연구에서는 한국어 화행 및 중복 발화 감지를 통하여 요약 기능의 성능을 저하시키는 요소들을 효과적으로 제거하는 방법을 제안한다. 또한, 단어의 문맥적 의미를 고려하는 BART 알고리즘과 일반 문서 요약에 자주 활용되는 TextRank 알고지름을 사용하여 대화 데이터를 효과적으로 요약하는 방법을 제안한다. 마지막으로 AI HUB에서 제공하는 한국어 대화 요약 데이터 세트를 활용한 다양한 비교 실험을 통하여 논문에서 제안하는 방법의 우수성을 보인다.|Recently, conversation data have been accumulated with tremendous speed, as contact-free communications such as video-conferencing or video-lecturing are increasing in many companies and schools. At the same time, current studies about artificial intelligence (AI) have been focused on improving the function of conversation summarization, by distinguishing the sentences containing important informations from the ones containing unimportant informations and by removing efficiently the sentences that deteriorate summarization function such as reconfirmation in conversation data. In this study, we propose the methods for removing effectively the elements that decrease the efficacy of summarization function, through utilizing Korean dialogue acts and duplicate utterance detection module. In addition, we suggest the methods for summarizing effectively the conversation data by using BART algorithm that consider contextual meaning of words and TextRank algorithm that is frequently used in summarization of general documents. Finally, we show the superiority of the methods proposed in this study through various comparison experiments utilizing Korean conversation summary data sets which are provided by AI HUB.
URI
http://hanyang.dcollection.net/common/orgView/200000577696https://repository.hanyang.ac.kr/handle/20.500.11754/167527
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE & ENGINEERING(컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE