TPE 기반 텍스트코퍼스 검색 및 문장/문단 가독성 평가
- Title
- TPE 기반 텍스트코퍼스 검색 및 문장/문단 가독성 평가
- Other Titles
- TPE Based Text Corpus Search and Sentence/Paragraph Readability Assessment
- Author
- 김준혁
- Alternative Author(s)
- Kim, Jun Hyuk
- Advisor(s)
- 최용석
- Issue Date
- 2017-02
- Publisher
- 한양대학교
- Degree
- Master
- Abstract
- 각종 소셜미디어와 매체가 성장함에 따라 비약적으로 늘어난 비정형 데이터 속에서 원하는 정보를 찾는 시간과 노력은 늘어나고 있다. 이를 효율적으로 해결하기 위한 방안으로 문법 주석 코퍼스를 활용하는 연구가 활발히 진행되어왔다.
본 논문에서는 문법 주석 코퍼스를 활용하는 도구인 트리 TPE(Tree Pattern Expression)을 활용하여 TPE 기반 텍스트코퍼스 검색 및 문장/문단 가독성 평가에 대한 내용을 제안한다. 본 논문에서 제안하는 TPE 기반 텍스트코퍼스 검색은 기존 TPE 검색을 사용하기 위해서 TPE 문법을 익혀야하는 불편함을 해결하기 위한 방안으로 키워드 기반 검색과 Triple 구조 술어 기반 검색이다. 키워드 기반 검색이란 사용자가 키워드를 입력하면 해당 키워드를 리프노드로 가지는 TPE 패턴 질의를 생성하여 검색을 수행하는 기법이다. Triple 구조 술어 기반 검색은 술어, 주어, 목적어를 가지는 문장을 검색할 때 복잡한 형태의 질의를 입력하는 것이 아니라 [술어 주어 목적어] 형태의 질의만 입력하면 자동으로 해당 술어, 주어, 목적어를 가지는 문장을 검색하고 매치를 수행하는 기법이다.
또한, TPE 기반 문장/문단 가독성 평가란 기존 가독성 평가 특징과 더불어 TPE를 활용한 문법 구조 점수를 가독성 평가 특징으로 추가하여 문장/문단 가독성 평가의 성능을 향상시키는 것을 목적으로 한다. 추출한 기존 가독성 평가 특징과 TPE를 활용한 문법 구조 점수 특징은 SVM기반 가독성 평가기를 이용하여 가독성 평가를 진행하였다.
본 논문에서는 Weebit 데이터를 활용하여 TPE 기반 문장/문단 가독성 평가에 대한 성능평가를 진행하였다. 실험을 통해 TPE를 활용하여 추출한 문법 구조 점수가 적합함을 확인하였고, 문단 가독성 평가의 정확도는 최대 95%보다 높게 측정되어 기존 기법에 비해 우수한 성능을 보이는 것을 확인하였다.
- URI
- https://repository.hanyang.ac.kr/handle/20.500.11754/124215http://hanyang.dcollection.net/common/orgView/200000429815
- Appears in Collections:
- GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML