885 0

시계열 예측 모델을 이용한 네트워크 트래픽 발생량 예측

Title
시계열 예측 모델을 이용한 네트워크 트래픽 발생량 예측
Other Titles
Network Prediction of Traffic Generation Amount using Time Series Prediction Model
Author
장용준
Alternative Author(s)
Jang, YongJun
Advisor(s)
조 인 휘
Issue Date
2022. 2
Publisher
한양대학교
Degree
Master
Abstract
4차산업혁명으로 인한 초연결사회를 지향하면서 네트워크 인프라에 대한 의존도가 높아지고 과거보다 더 많은 네트워크 트래픽이 생산되고 앞으로 이와 같은 네트워크 인프라의 의존과 트래픽의 증가는 지속적으로 증가할 것이다. 이와 같은 현실 가운데 네트워크 인프라를 효율적으로 사용하기 위해 증가하는 네트워크 트래픽에 대한 보다 세분화된 네트워크 서비스별 트래픽에 대한 사용량의 예측은 네트워크를 관리하는 작업요소에서 필수적인 작업이 될 것으로 예상된다 본 논문은 대학기관의 방화벽을 통해 수집된 로그정보를 이용해 네트워크 트래픽을 Web(Http, Https), Dns, P2P 등과 같은 보편적으로 알려진 인터넷 서비스를 중심으로, 시계열 기반의 네트워크 트래픽 예측 모델인 SARIMA와 순환신경망인 LSTM, 합성곱 신경망인 CNN모델과 같은 예측 모델을 연구 모델로 하여 각각의 모델들을 이용한 주요 서비스의 네트워크 트래픽을 예측하는 방안을 제시하였다. 머신러닝, 딥러닝 프레임워크와 라이브러리를 제공하는 Python 기반 Anaconda를 이용하여 구현 하였고 데이터는 총 2400개의 데이터를 8:2 비율로 훈련과 테스트로 나누어 각 모델에 적용시켰다. 트래픽 발생량 예측에 있어 시계열 예측 모델과 딥러닝의 순환신경망, 합성곱 신경망을 통해 오차율을 비교하는 평균제곱근오차 RMSE 값으로 성능비교평가 하였다. 성능을 측정한 결과 평균적으로 LSTM과 CNN-LSTM 모델이 SARIMA 보다 11% 수준으로 감소하는 예측 결과를 제공하였다. 향후 연구 결과로 제시하는 시계열 예측모델을 응용하여 L7 헤더를 분석한 좀 더 세분화된 서비스 데이터를 적용할 경우 보다 향상된 네트워크 트래픽을 예측할 수 있고 효율적인 네트워크 트래픽 관리를 할 수 있을 것으로 예상된다. |Aiming for a hyper-connected society due to the 4th industrial revolution, the dependence on network infrastructure increases, generating more network traffic than in the past. In this reality, it is expected that the prediction of traffic for each service that will increase in order to efficiently use the network infrastructure will become an essential task in the work element of managing the network. This paper classifies five service traffics based on network traffic information and presents a CNN model that combines a convolutional neural network with seasonal ARIMA, a time series-based network traffic prediction model, and LSTM and LSTM, which are recurrent neural networks. The prediction accuracy was compared. As a result of measuring the performance, the LSTM model and the CNN-LSTM model had a difference of 10% on average, so the LSTM model showed high precision, and the SARIAMA model provided a prediction result that decreased to an average of 25%. Using the time-series prediction model presented in the future paper, it is possible to manage massive network traffic through various services, and furthermore, if the network anomaly detection function is implemented using the predicted value, it will be a stable network service.
URI
http://hanyang.dcollection.net/common/orgView/200000595710https://repository.hanyang.ac.kr/handle/20.500.11754/168385
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE