316 0

개선된 밀도기반 알고리즘을 이용한 활성데이터 검출 구현 및 시각화

Title
개선된 밀도기반 알고리즘을 이용한 활성데이터 검출 구현 및 시각화
Other Titles
Implementation and Visualization of Active Data Detection Using Improved Density-Based Algorithm
Author
서보현
Alternative Author(s)
Suh, Bo Heon
Advisor(s)
조인휘
Issue Date
2020-02
Publisher
한양대학교
Degree
Master
Abstract
정보화 사회가 가속화 됨에 처리해야 하는 데이터량은 증가하고 있다, 이에 따라 분류되지 않은 자료 들을 특정한 속성을 기준으로 군집 분류하는 기술 또한 많은 관심을 받고 있다 활성 데이터 그룹은 빈번하게 호출되고 있으며 가까운 미래에도 계속 사용될 가능성이 높은 데이터들의 그룹이라고 할 수 있다. 서비스 운용에 있어서 이러한 활성 데이터의 추출은 자원 활용의 효용성, 유지 비용 감소 등에 대한 이점을 가져다준다. 하지만 어떠한 데이터를 활성 문서(Active Documents)라고 바라볼 것인가에 대한 논의는 다양하다. 본 연구에서는 DBSCAN과 K-Means Clustering 등 기존에 알려진 알고리즘에 대해서 조사하고 그중 밀도 기반 군집화 알고리즘이 가지고 있는 장단점을 분석하여 목적 적합한 활성 데이터 추출의 보완 방법을 제안하였다. 데이터 호출 수와 최근 접근시간이라는 두 가지 속성을 기준으로 데이터의 차원을 축소하고 가공된 가공된 파라미터를 반경이 되는 Epsilon으로서 사용함으로써 파라미터를 입력하고 시간에 대한 가중 범위에 우선순위를 두어 범위 조정을 하도록 하였다. 개선된 알고리즘은 기존 원형 기준의 이웃 거리 판정에서 더 유연한 판정 기준을 적용할 수 있으며 시간에 대한 추가 가치가 고려되기 때문에 활성 데이터 검출에 개선된 결과를 낼 수 있었다. 새로운 알고리즘의 효용성에 대한 가설을 기준으로 검증한 실험에서 테스트 데이터 기준 약 12%의 성능 증가를 보였다. 가공된 데이터를 OLAP, 데이터웨어하우스에 응용 적용한다면 이는 정보 이용자에게 올바른 선택을 할 수 있게 도움을 주고, 관리 비용의 감소와, 활성 데이터를 기반으로 한 의사결정에 긍정적인 효과를 가져올 수 있다고 기대한다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/122951http://hanyang.dcollection.net/common/orgView/200000437163
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE