338 0

한국프로야구 투수 연봉 평가 척도에 영향을 미치는 경기력 변수 분석

Title
한국프로야구 투수 연봉 평가 척도에 영향을 미치는 경기력 변수 분석
Other Titles
Analysis of Critical Factors affecting Market Value of Baseball Players (Pitchers) in Korea
Author
전홍권
Alternative Author(s)
JEON, Hongkweon
Advisor(s)
박성배
Issue Date
2017-02
Publisher
한양대학교
Degree
Master
Abstract
본 연구는 프로야구의 핵심 상품인 선수의 경기력을 입증하는 척도 중 하나인 연봉 산정에 관련하여, 선수의 인구통계학적 지표, 입단 및 이적 정보, 그리고 전통적인 성적 지표 및 세이버메트릭스 지표 중 연봉인상여부와 유의미한 연관성을 지닌 변수를 각종 분석기법을 통해 분석했다. 1997~2015년에 1군 기록이 있는 투수 중 차기년도, 군입대자의 경우 군제대 후 시즌에 재계약한 2,792개의 데이터를 대상으로 삼았다. 일차적으로, 선형회귀분석을 통해 예측자 중요도가 0.05이상이고 유의확률이 .05이하인 FIP, 삼진, 연령, 선발 변수를 유의한 예측자로 분석하였다. 다음으로 C5.0, CART, CHAID 등 의사결정나무 기법, 다층 퍼셉트론(MLP)와 방사형 기본함수(RBF)를 각각의 모델로 한 인공신경망 기법, 로지스틱 회귀 분석 기법, TAN, Markov Blanket을 각각의 구조 유형으로 채택한 베이지안 네트워크 기법 등 각 분류기법을 실행하여 AUC Value와 Gini 계수를 비교 분석했다. 그 결과, 다층 퍼셉트론을 모델로 한 인공신경망의 AUC Value 및 Gini 계수가 가장 높아 해당 모델이 예측자로 분석한 FIP, 삼진, 연령, 선발 변수를 다음 단계인 K-평균 군집분석(K-means clustering)의 입력변수로 채택했다. K-평균 군집분석을 통해 총 7개의 군집을 형성할 수 있었으며, 그 중 평균 26.4회의 선발 등판, 평균 121.17개의 탈삼진, 평균 4.08의 FIP(수비 무관 추정 평균자책점)를 기록하며 각 지표에서 모두 평균 이상, 즉, 에이스급 선발투수의 특성을 지니고 있는 군집-2(전체의 8.2%, 228개)의 연봉인상비율이 84.649%, 평균 3.78의 FIP, 68.46개의 탈삼진을 기록했으나, 평균 1.69개의 선발 등판을 기록하며 핵심 불펜투수의 특성을 지니고 있는 군집-7의 연봉인상비율이 81.646%를 기록하며 연봉인상이 가능한 성적에 대한 기준을 제시하는 역할을 했다. 본 연구를 진행한 결과, 선발투수 및 불펜투수는 평균 이상의 탈삼진과 FIP를 기록할 경우 연봉이 인상된다는 사실을 입증할 수 있었다. 특히 전통적인 지표였던 평균 자책점(ERA)보다 FIP가 연봉인상에 유의미하게 적용된다는 점으로 보았을 때, 향후 세이버메트릭스 관련 척도가 국내 프로야구 실정에 맞게 기존 지표가 조정되거나, 새로운 지표가 도출될 경우 연봉인상과 관련되어 더욱 유의미한 결과를 도출할 것으로 전망된다.|Since the concept of Sabermetrics was introduced into the business of baseball industries, several outcomes (i.e., win/loss prediction model and prediction of going playoff) were developed and utilized in the past decade or nowadays. From twenty years, the role of pitcher has been divided by starting pitchers, relievers. Therefore, the main purposes of this study were (1) to segregate starting pitchers and relievers into some groups abided by K-means clustering and (2) extract the meaningful factors which would eventually contribute to valuation of their market value, respectively. The performance records and salary information of a total of 2,792 former and current professional baseball players from 1997 to 2015 were obtained and met the minimum conditions to be included in this study. The results included that strikeouts(predictive importance = 0.41), age(predictive importance = 0.27), the number of taking the mound by starting pitcher(predictive importance = 0.26), and FIP(Fielding Independent Pitching, predictive importance = 0.05) are important factors turned by simple regression analysis artificial neural network of multi-layer perception. Besides, the results by K-means clustering included that can be divided seven groups and can especially be found two groups:Cluster 2(top-tier starting pitchers), Cluster 7(good relievers).; Since the concept of Sabermetrics was introduced into the business of baseball industries, several outcomes (i.e., win/loss prediction model and prediction of going playoff) were developed and utilized in the past decade or nowadays. From twenty years, the role of pitcher has been divided by starting pitchers, relievers. Therefore, the main purposes of this study were (1) to segregate starting pitchers and relievers into some groups abided by K-means clustering and (2) extract the meaningful factors which would eventually contribute to valuation of their market value, respectively. The performance records and salary information of a total of 2,792 former and current professional baseball players from 1997 to 2015 were obtained and met the minimum conditions to be included in this study. The results included that strikeouts(predictive importance = 0.41), age(predictive importance = 0.27), the number of taking the mound by starting pitcher(predictive importance = 0.26), and FIP(Fielding Independent Pitching, predictive importance = 0.05) are important factors turned by simple regression analysis artificial neural network of multi-layer perception. Besides, the results by K-means clustering included that can be divided seven groups and can especially be found two groups:Cluster 2(top-tier starting pitchers), Cluster 7(good relievers).
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/124799http://hanyang.dcollection.net/common/orgView/200000430655
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > GLOBAL SPORT INDUSTRY(글로벌스포츠산업학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE