352 0

실시간 서버장애탐지를 위한 직교다항계수변환 일반화 ESD 모형

Title
실시간 서버장애탐지를 위한 직교다항계수변환 일반화 ESD 모형
Other Titles
Orthogonal Polynomial Coefficients Transformation Generalized ESD based Online Anomaly Detection
Author
이운섭
Alternative Author(s)
Lee, Woon Sub
Advisor(s)
이기천
Issue Date
2017-02
Publisher
한양대학교 일반대학원
Degree
Master
Abstract
In the new era of big data, numerous information and technology systems are able to collect huge log data in real time. In addition, the importance of anomaly detection using big log data in application management systems is rapidly increasing. One of the biggest challenges in anomaly detection is to carry out real-time anomaly detection. In this paper, we focus on online anomaly detection in measurements collected by application performance management systems and time series log data with seasonality and trend. Most anomaly detection algorithms have several weaknesses in that they have difficulty in dealing with input log data that trends and seasonality. They are also suitably implemented for offline anomaly detection and hardly provide a systemic way to include supervised and unsupervised settings. To address these issues, we propose a new algorithm of online anomaly detection based on Grubbs’ outlier test which is a relatively accurate and efficient method by performing statistical hypothesis testing. We transform input log data using orthogonal polynomial coefficients, and then apply Grubbs’ test to the transformed data. We also use sliding windows to detect anomalies for streaming input data. Experiments with synthetic data, real-traffic data from Yahoo Webscope, and real-life response-time data from application management systems show that our method performs better than several existing methods for online anomaly detection in recall and false positive ratios.|빅데이터 시대를 맞아 많은 산업분야에서 실시간으로 방대한 양의 데이터를 수집하고 있다. 게다가 성능관리시스템 분야에서 대량의 로그데이터를 사용한 이상치 탐지의 중요성은 빠르게 증가하고 있다. 이상치 탐지의 가장 큰 도전 중 한 가지는 실시간으로 입력되는 데이터에 대해 탐지하고 모니터링 하는 것이다. 본 논문에서는 애플리케이션 성능관리(APM) 서비스에서 수집되는 서버 데이터 그리고 계절성과 추세 등이 있는 다양한 시계열 데이터에서 실시간 이상치 탐지에 대한 새로운 접근법을 제안한다. 본 연구의 방법은 통계적 가설 검정기반인 Grubbs’ 이상치 탐지법을 이용하였다. 기존의 Grubbs’ 방법은 몇 가지 약점을 가지고 있다. 첫 번째, 계절성과 추세를 가지는 시계열 데이터에서 이상치 탐지가 어렵다. 둘째, 실시간 탐지에 구현되어진 방법이 아닌 단순 배치 이상치 탐지법이다. 마지막으로 데이터에서 이상치 값에 대한 라벨정보에 따른 지도 학습법 또는 비지도학습법으로 구별되어지지 않다. 그러므로 본 연구에서는 직교다항계수를 사용한 데이터 변환을 통해 Grubbs’ 이상치 탐지에 적용하였고, 또한 실시간 입력 데이터에 대한 이상치 탐지를 위해 Sliding window 방법을 활용하였다. 실험을 위해 Yahoo Webscope에서 시계열 이상치 탐지를 위한 synthetic 데이터와 real-traffic 데이터를 사용하였고 APM 서비스로부터 얻은 서버반응시간 데이터를 이용하였다. 수집된 데이터를 바탕으로 이상치 탐지 실험을 진행한 결과, 다른 몇 개의 기존 이상치 탐지법들 보다 더욱 높은 Recall 값과 더 낮은 False positives 값들을 확인하였다.; In the new era of big data, numerous information and technology systems are able to collect huge log data in real time. In addition, the importance of anomaly detection using big log data in application management systems is rapidly increasing. One of the biggest challenges in anomaly detection is to carry out real-time anomaly detection. In this paper, we focus on online anomaly detection in measurements collected by application performance management systems and time series log data with seasonality and trend. Most anomaly detection algorithms have several weaknesses in that they have difficulty in dealing with input log data that trends and seasonality. They are also suitably implemented for offline anomaly detection and hardly provide a systemic way to include supervised and unsupervised settings. To address these issues, we propose a new algorithm of online anomaly detection based on Grubbs’ outlier test which is a relatively accurate and efficient method by performing statistical hypothesis testing. We transform input log data using orthogonal polynomial coefficients, and then apply Grubbs’ test to the transformed data. We also use sliding windows to detect anomalies for streaming input data. Experiments with synthetic data, real-traffic data from Yahoo Webscope, and real-life response-time data from application management systems show that our method performs better than several existing methods for online anomaly detection in recall and false positive ratios.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/124932http://hanyang.dcollection.net/common/orgView/200000430251
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > INDUSTRIAL ENGINEERING(산업공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE