MLB타자들의 기록과 연봉 - 회귀분석자료
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

본문내용

X1(홈런)과 X5(단타율)로 나타났다.
다음은 X1(홈런)과 X5(단타율)로 휘귀 적합한 결과이다.
<표 6> 최종 회귀적합 결과
위와 같이 최종적으로 두 개 변수로 모형 적합한 결과, F-VALUE값이 유의하고 Adj R-Sq값이 61.45%로 나타났다. 즉, 이모형 적합결과, 두 가지 변수(홈런과 단타율)로써 연봉을 61.45% 적합하게 예측시킬 수 있음을 뜻한다.
또한, 각 변수간 t-value를 보았을 때 모두 유의한 결과가 나타났다. 즉, 홈런을 한 개 더 칠 때마다 로그 변환된 연봉값이 8.224만큼 늘어난다는 것이다. 또한 단타율이 한 단위 증가할 때마다 연봉이 1.949만큼 증가함을 알 수 있다.
3.7 특이치
<그림 4> 잔차 plot
잔차 plot을 살펴보면 -2와 2사이에 랜덤하게 분포하고 있음을 알 수 있다. 이를 통해 우리는 적합 된 회귀모형이 적절하다는 것을 알 수 있다.
<그림 5> 영향력 분석(Leverage Effect) 과 지렛대 plot (Cooke's distance)
영향력 분석 결과를 살펴보면 지렛대 값과 쿡의 거리에 있어 특이치 값들이 존재한다. 지렛대의 경우에는 97번째 값이 큰 지렛대 값을 갖고 있고, 15, 57, 93번째 값들은 쿡의 거리가 매우 커 영향력이 크다고 할 수 있다. 하지만 지렛대 값과 영향력이 동시에 커서 회귀모형에 큰 영향을 미쳐 특이치로 판단할 수 있는 개체는 없다고 볼 수 있다.
4. 결 론
최종 적합모형은 다음과 같다.
LOG ( Y FITTED ) = 5.32 + 8.22*X1 + 1.95*X5 (Adj R-Sq 0.6145) (2)
연봉은 홈런과 단타율에 의해 61%의 설명력을 갖고 설명된다. 즉 MLB선수들의 연봉에 홈런과 단타율이 가장 많은 영향을 미치고 기타 다른 변수들은 홈런과 단타율에 큰 상관관계를 가지고 있으므로 홈런과 단타율에 의해 설명되어질 수 있다는 것이다. 최종 적합식의 타당성 검토를 위해 실제 선수의 연봉과 우리가 추정한 적합식을 통한 예측치를 비교해보면 다음과 같다.
<표 7> 적합된 모형에 대한 실제 적용
선 수
실제값
적합값
마이크 피아자
9.686
9.517
알렉스 로드게스
9.998
9.837
실제 예측을 통해 관찰해 본 결과, 비슷한 결과를 보여 우리가 추정한 적합식이 잘 예측되었다고 판단된다. 이와 같은 분석을 통해 MLB선수들 뿐 아니라 나아가 우리나라 프로야구 선수들의 적정 연봉 또한 예측될 수 있을 것이다. 이번 분석에 있어 많은 변수를 고려했지만 서로 상관관계가 큰 변수들이었고, 연봉에 큰 영향을 미칠 것이라 예상되는 인기도를 고려하지 못했다는 것이 아쉽다. 이는 인기도에 대해 적절히 수치화된 자료가 없었고 우리가 수치화시키기에도 한계가 있었기 때문이다. 결과적으로 연봉을 결정하는데 있어 단순히 두 변수만을 고려하게 되어 조금 단순한 회귀모형이 되었다. 하지만, 최종모형을 이용한 예측값이 실제값과 유사한 값을 가져 우리가 적합한 회귀모형이 크게 잘못된 결과는 아니란 것을 알 수 있었다.
이미 스포츠계에 통계분야가 많이 사용되고 있다. 각종 data들이 존재하는 스포츠에 있어 통계학이야말로 가장 필요로 하는 학문분야일 것이다. 우리가 기존에 생각하고 있던 금융 분야나 보험 분야 등의 경영경제 분야 이외에도 우리가 미처 생각하지 못한 분야에서 통계학이 실제로 쓰이고 있고 분석된 자료들 또한 많이 있다는 것을 알게 되었다. 다시 한 번 기회가 주어진다면 더 나은 분석을 할 수 있을 것 같다는 아쉬움이 남는다.
끝으로 한 학기동안 학생들을 위해 열정적으로 강의를 해 주시고 조원들과 실제로 우리가 배운 학문을 이용해 함께 토론하고 고민해 볼 기회를 주신 김기영 교수님께 감사를 드린다.
<참 고 문 헌>
[1] 김기영, 전명식 (1998). 「예제를 통한 회귀분석」 , 서울, 자유아카데미.
[2] John Thorn and Pete Palmer (1985). 「The Hidden Game of Baseball」,
New York: Doubleday.
[3] Albright, S.C. (1993). 「A Statistical Analysis of Hitting Streaks in Baseball」,
Journal of the American Statistical Association.
[4] MLB 공식 홈페이지 (http://mlb.mlb.com)
[5] 세이버메트릭스 공식 사이트 (http://www.baseballthinkfactory.org/)

키워드

  • 가격1,000
  • 페이지수9페이지
  • 등록일2007.07.16
  • 저작시기2007.4
  • 파일형식한글(hwp)
  • 자료번호#420982
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니