과표본추출 방법 기반의 블록체인 이상 탐지 방법에 관한 연구
- Title
- 과표본추출 방법 기반의 블록체인 이상 탐지 방법에 관한 연구
- Other Titles
- Oversampling Method-based anomaly detection for blockchain network
- Author
- 고자영
- Alternative Author(s)
- Go. Ja Young
- Advisor(s)
- 배석주
- Issue Date
- 2019. 8
- Publisher
- 한양대학교
- Degree
- Master
- Abstract
- 블록체인은 분산 원장 기술로서 거래 데이터를 공개적으로 여러 곳에 분산시켜 저장하는 개념이다. 최근 블록체인 기술 기반의 비트코인에 대한 관심이 대두됨에 따라 이를 악용하는 사례들에 대한 탐지가 중요해지고 있다. 익명성을 갖는 블록체인 구조를 악용한 사기들이 급증하고 있으며, 이를 검출하기 위한 관심 또한 증가하고 있다. 현재까지의 연구들은 K-means 등의 클러스터링 기법을 통해 이상 탐지를 시도하였지만, 비지도 학습 방법은 매우 낮은 정확도를 보인다. 이러한 이유로, 비트코인 사기에 관한 실제 데이터를 추가로 확보하여 분류 문제로 전환하여 분석을 진행하면 보다 더 높은 검출이 가능하다.
본 연구에서는 비트코인 이상탐지를 위한 절차를 제안하였다. 그 과정에서 데이터를 새롭게 정제하고 유의미한 변수를 추출 하였다. 또한, 네트워크 지표를 추출하여 관계형 데이터를 좀 더 용이하게 분석할 수 있게 시도하였다. 분석 시 불균형 데이터 처리를 위해 과표본추출을 이용해 소수 데이터에 대한 샘플링을 진행하였으며 데이터에 적합한 Borderline Clustering SMOTE라는 기법을 새롭게 제안하였다. 이 방법으로서 노이즈가 과표본추출 되는 것을 방지하고 분류 정확도를 향상시켰다.
이후 시각화를 통해 과대 표본추출의 당위성을 육안으로 확인하였으며, 지도학습 방법으로서 4가지 분석 기법을 선택하여 분석을 진행했다. 즉, 본 논문에서는 제안한 과표본추출 기법을 이용하여 이상 검출 분석 절차를 새롭게 구성하였으며 이를 적용하여 블록체인 데이터의 이상 탐지 문제를 해결하고자 한다.; Blockchain is a distributed ledger technology, which is a concept of publicly distributing and storing transaction data in multiple locations. The recent growing interest in blockchain-based bitcoin has made it important to detect cases of anomaly behavior such as fraud, illegal arms, drug etc. Fraud using anonymous blockchain structures is rapidly increasing, and interest in detecting them is also growing. While current studies have attempted to detect anomalies through clustering techniques such as K-means, the method of unsupervised learning has extremely low accuracy. For this reason, higher detection is possible when actual data on bitcoin fraud is obtained, converted to classification problems, and analyzed.
In this study, we proposed a procedure for detecting bitcoin anomalies. In the process, the data were newly refined and significant variables were extracted. As feature we also attempted to make it easier to analyze
relational data using network metrics. In order to process unbalanced data in the analysis, we sampled minority data using oversampling and proposed a new technique called Borderline Clustering SMOTE that is suitable for the data. This method prevents noise from being over-sampled and improves classification accuracy.
After sampling by suggested method, we visualized the equivalence of oversampling and analyzed four analytical techniques as a method of supervised learning. In other words, using the over-sampling technique
proposed in this paper, the abnormal detection analysis procedure has been newly constructed to solve the problem of detection of blockchain data.
- URI
- https://repository.hanyang.ac.kr/handle/20.500.11754/109863http://hanyang.dcollection.net/common/orgView/200000435988
- Appears in Collections:
- GRADUATE SCHOOL[S](대학원) > INDUSTRIAL ENGINEERING(산업공학과) > Theses (Master)
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML