445 0

촛대 차트의 극좌표 위치 인코딩 이미지에 대한 변이형 오토 인코더를 이용한 주가 예측

Title
촛대 차트의 극좌표 위치 인코딩 이미지에 대한 변이형 오토 인코더를 이용한 주가 예측
Other Titles
Prediction of stock prices using variational auto-encoder for Gramian angular field encoded image of candle stick chart
Author
조예서
Alternative Author(s)
Yeseo Joh
Advisor(s)
정재홍
Issue Date
2022. 8
Publisher
한양대학교
Degree
Master
Abstract
과거에는 재무재표 등을 이용한 기본적 분석과 차트 분석과 같은 기술적 분석을 통해 주식 시장을 예측하였지만, 최근에는 컴퓨팅 능력이 발전함에 따라 딥러닝과 접목한 연구들이 증가하는 추세이다. 대표적인 기술적 분석인 촛대 차트(Candle Stick Chart) 이미지 분석은 반복되는 추세를 학습하여 미래의 주가를 예측하는 분석 방법이다. 하지만 주가 데이터는 시간의 흐름을 가지는 시계열 데이터로 기존의 촛대 차트 이미지 분석은 시간적 특성을 반영하지 못한 한계점이 있다. 본 논문에서는 이를 해결하기 위해 1차원의 원본 시계열 데이터를 2차원의 행렬로 변환하여 시간의 상관성을 가지는 이미지로 인코딩 시키는 Gramian Angular Field (GAF) 변환 방식을 제안한다. GAF 변환 방식은 시계열 데이터를 데카르트 좌표계(Cartesian coordinates system) 대신 극좌표계(Polar coordinates system)의 방식으로 계산하여 시간의 상관관계를 보존한다. 주식의 시가, 고가, 저가, 종가 데이터를 기반으로 생성한 기존의 촛대 차트 이미지와 GAF 변환 이미지를 입력 데이터로 익일 종가의 상승과 하락에 대한 이진 예측의 성능을 비교하였다. 또한 두 가지 방식으로 변환된 이미지 입력 데이터를 대표적인 생성 모델(Generative Model)인 변이형 오토 인코더(Variational AutoEncoder, VAE)를 학습시켜 로지스틱 회귀모형, Support Vector Machine (SVM), 랜덤포레스트와 접목하여 분석하였다. 이를 대표적인 이미지 분석 모델인 합성곱 신경망(Convolutional Neural Network, CNN)을 통한 예측과 성능을 비교하였다. 기존의 촛대 차트 이미지보다 GAF 변환 이미지를 이용한 분석이 정확도, F1-Score, AUC 측면에서 전반적으로 높은 성능을 보여주었고, CNN을 통한 분석보다 VAE 접목 로지스틱 회귀모형, SVM, 랜덤포레스 분석이 정확도, F1-Score, AUC 측면에서 모두 높은 성능을 보여주었다. |In the past, the stock market was predicted through basic analysis using financial statements and technical analysis such as chart analysis, but recently, as computing power develops, studies combined with deep learning are increasing. Candle Stick Chart image analysis, a representative technical analysis, is an analysis method that predicts future stock prices by learning repeated trends. However, stock price data is time series data with time flow, and the analysis of the existing candlestick chart image has a limitation in that it does not reflect the temporal characteristics. To address this, this paper proposes a Gramian Angular Field (GAF) transformation scheme that converts one-dimensional original time series data into two-dimensional matrices and encodes them into images with time correlation. The GAF conversion method preserves the correlation of time by calculating time series data in a polar coordinates system instead of a Cartesian coordinates system. We compared the performance of binary predictions for rising and falling closing prices of closing prices, with existing candlestick chart images generated based on market price, high price, low price, and closing price data of stocks and GAF conversion images as input data. In addition, the image input data converted in two ways were analyzed by training a representative generative model (VAE), a variant autoencoder (VAE), combined with a logistic regression model, a Support Vector Machine (SVM), and a random forest. This was compared with the prediction and performance through convolutional neural network (CNN), a representative image analysis model. Analysis using GAF transform images showed higher overall performance in terms of accuracy, F1-Score, and AUC than conventional candlestick chart images, and VAE grafted logistic regression model, SVM, and random forest analysis showed higher performance in terms of accuracy, F1-Score, and AUC.
URI
http://hanyang.dcollection.net/common/orgView/200000627615https://repository.hanyang.ac.kr/handle/20.500.11754/174650
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED STATISTICS(응용통계학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE