386 0

텍스트마이닝을 통한 학습자 상태 분류 및 활동 모니터링 시스템

Title
텍스트마이닝을 통한 학습자 상태 분류 및 활동 모니터링 시스템
Other Titles
Classifying Learner's state and Monitoring his activity Using Text mining
Author
김동현
Alternative Author(s)
Kim,Dong Hyun
Advisor(s)
최용석
Issue Date
2017-02
Publisher
한양대학교
Degree
Master
Abstract
텍스트 마이닝은 객관적인 정보를 필요로 하는 많은 분야에서 쓰이는 기술이다. 특히 자연어 처리 기반 텍스트 마이닝은 반정형 또는 비정형 텍스트 데이터를 정형화하고, 그 특징을 추출하기 위한 기술이 핵심이다. 이 기술을 통해서 추출해낸 특징으로부터 사용자가 원하는 정보를 얻어낼 수 있도록 하는 것이 주된 목적이라고 할 수 있다. 다만 어떤 언어로 텍스트가 구성되었는지에 따라 특징을 추출하는 기술은 어느 정도 다를 수 있다. 특히 한글은 표현의 자유도가 높기 때문에 표준어가 정해져 있는 단어라도 조금씩 형태가 바뀌어서 사용되기도 한다. 또한 인터넷 상에서는 상대방에게 자신이 말하고자 하는 의미를 더 편하게 전달하는 데에 초점이 맞춰졌기 때문에 굳이 맞춤법을 완벽하게 맞출 필요가 없어졌고 이로 인해 발생하는 한글 파괴 현상이 한글 텍스트를 분석하는데 문제가 되기도 한다. 본 논문에서는 한글 텍스트를 음소단위로 분할하여 시그니처 비트를 생성하는 트라이그램 시그니처(Trigram-Signature) 기법과 구문 패턴을 분석하여 사용하는 구문 태그 패턴 기법을 통합한 새로운 상태 분류 기법을 제안했다. 그리고 기존 연구에서 분류 했던 만족, 불만, 의문, 흥분 4가지 상태에 추가적으로 낙담 상태를 추가하여 분류를 시도했다. 또한 기존 연구에서 만족/불만 분류에만 적용했던 극성 사전 기반의 기법을 나머지 상태 분류에도 동일하게 적용할 수 있도록 수정했다. 이에 추가적으로 제안한 시각화 시스템에서는 사용자의 ID와 글의 내용 및 게시날짜 데이터를 분석하여 사용자의 현재 상태 및 상태 변화와 활동 변화를 초기 화면에서 보여준다. 그리고 ID를 클릭하면 앞서 제공한 정보 외에도 사용자가 몇 주차에 어떤 상태의 글을 몇 건 게시하였는지를 원형 그래프 및 방사형 그래프로 나타내주며, 각각의 상태 글의 빈도와 극성 값을 확인할 수 있도록 꺾은선 그래프와 막대 그래프로 나타낸다. 이에 추가적으로 해당 ID의 사용자가 작성한 글도 취합하여 상태 별로 확인할 수 있도록 해준다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/124234http://hanyang.dcollection.net/common/orgView/200000430588
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE