264 0

TPE 기반 텍스트코퍼스 검색 및 문장/문단 가독성 평가

Title
TPE 기반 텍스트코퍼스 검색 및 문장/문단 가독성 평가
Other Titles
TPE Based Text Corpus Search and Sentence/Paragraph Readability Assessment
Author
김준혁
Alternative Author(s)
Kim, Jun Hyuk
Advisor(s)
최용석
Issue Date
2017-02
Publisher
한양대학교
Degree
Master
Abstract
각종 소셜미디어와 매체가 성장함에 따라 비약적으로 늘어난 비정형 데이터 속에서 원하는 정보를 찾는 시간과 노력은 늘어나고 있다. 이를 효율적으로 해결하기 위한 방안으로 문법 주석 코퍼스를 활용하는 연구가 활발히 진행되어왔다. 본 논문에서는 문법 주석 코퍼스를 활용하는 도구인 트리 TPE(Tree Pattern Expression)을 활용하여 TPE 기반 텍스트코퍼스 검색 및 문장/문단 가독성 평가에 대한 내용을 제안한다. 본 논문에서 제안하는 TPE 기반 텍스트코퍼스 검색은 기존 TPE 검색을 사용하기 위해서 TPE 문법을 익혀야하는 불편함을 해결하기 위한 방안으로 키워드 기반 검색과 Triple 구조 술어 기반 검색이다. 키워드 기반 검색이란 사용자가 키워드를 입력하면 해당 키워드를 리프노드로 가지는 TPE 패턴 질의를 생성하여 검색을 수행하는 기법이다. Triple 구조 술어 기반 검색은 술어, 주어, 목적어를 가지는 문장을 검색할 때 복잡한 형태의 질의를 입력하는 것이 아니라 [술어 주어 목적어] 형태의 질의만 입력하면 자동으로 해당 술어, 주어, 목적어를 가지는 문장을 검색하고 매치를 수행하는 기법이다. 또한, TPE 기반 문장/문단 가독성 평가란 기존 가독성 평가 특징과 더불어 TPE를 활용한 문법 구조 점수를 가독성 평가 특징으로 추가하여 문장/문단 가독성 평가의 성능을 향상시키는 것을 목적으로 한다. 추출한 기존 가독성 평가 특징과 TPE를 활용한 문법 구조 점수 특징은 SVM기반 가독성 평가기를 이용하여 가독성 평가를 진행하였다. 본 논문에서는 Weebit 데이터를 활용하여 TPE 기반 문장/문단 가독성 평가에 대한 성능평가를 진행하였다. 실험을 통해 TPE를 활용하여 추출한 문법 구조 점수가 적합함을 확인하였고, 문단 가독성 평가의 정확도는 최대 95%보다 높게 측정되어 기존 기법에 비해 우수한 성능을 보이는 것을 확인하였다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/124215http://hanyang.dcollection.net/common/orgView/200000429815
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE