WAR 지표의 착각: 팬들이 놓치는 계산의 함정
야구 통계의 성배라 불리는 WAR(Wins Above Replacement)을 둘러싼 논쟁이 끊이지 않는 이유가 있습니다. 대부분의 팬들은 WAR를 단순히 “좋은 선수를 가려내는 만능 지표”로 여기지만, 실제로는 **복잡한 가정과 추정치들의 산물**입니다. 오타니 쇼헤이가 MVP를 수상할 때마다 WAR 논쟁이 재점화되는 것도 바로 이 계산 방식의 복잡성 때문입니다. 진정한 야구 분석가라면 WAR의 내부 메커니즘을 정확히 이해해야 합니다.
WAR 계산식의 핵심 구성 요소
WAR는 타격, 주루, 수비, 포지션 조정값을 모두 Run 단위로 환산한 뒤 승리로 변환하는 복합 지표입니다. 하지만 각 요소별 가중치 설정에서 이미 주관적 판단이 개입됩니다.
| 구성 요소 | 계산 방식 | 변수의 복잡성 | 오차 발생 지점 |
| 타격 기여도 | wRC+ 기반 Run 환산 | 파크팩터, 리그 조정 | 볼파크별 편차 |
| 수비 기여도 | UZR, DRS 등 종합 | 포지션별 난이도 | 주관적 채점 개입 |
| 주루 기여도 | 도루, 진루 상황별 점수 | 상황별 Run Value | 표본 크기 한계 |
| 포지션 조정값 | 역사적 데이터 기반 | 시대별 변화 반영 | 고정값의 한계 |
타격 지표의 파크팩터 보정 문제
가장 큰 함정은 파크팩터 적용입니다. 쿠어스 필드에서 뛰는 타자와 마린스 파크에서 뛰는 타자를 동일 선상에서 비교하려면 구장 효과를 제거해야 하는데, 이 과정에서 실제 능력과 구장 빨을 완벽히 분리하는 것은 불가능합니다. 특히 좌타자와 우타자의 구장별 유불리가 다르게 작용하는 점까지 고려하면 보정의 정확성은 더욱 떨어집니다.
수비 지표의 측정 한계와 편향성
WAR 계산에서 가장 논란이 되는 부분이 바로 수비 평가입니다. UZR(Ultimate Zone Rating)과 DRS(Defensive Runs Saved) 같은 수비 지표들은 구장별 특성과 투수 성향을 완전히 배제하지 못합니다.
스테이트캐스트 이전 시대의 추정치 의존
2015년 이전 데이터는 실제 타구 속도와 각도가 아닌 추정치에 의존했습니다. 이는 과거 선수들의 WAR 계산에 상당한 오차를 만들어냅니다. 현재의 오즈 알비스와 과거의 오마르 비즈켈을 직접 비교하는 것이 부정확한 이유입니다.
| 측정 방식 | 정확도 | 적용 시기 | 주요 한계점 |
| 비디오 분석 | 70% | 2007-2014 | 주관적 판단 개입 |
| 스테이트캐스트 | 95% | 2015-현재 | 초기 캘리브레이션 문제 |
| 레트로시트 | 60% | 1988-2006 | 표본 부족, 추정 의존 |
포지션별 가중치의 고정성 문제
1루수는 연간 -12.5 Run, 유격수는 +7.5 Run의 포지션 조정값을 받습니다. 하지만 이는 20년 전 데이터를 기반으로 한 고정값입니다. 현대 야구에서 1루수들의 수비 범위가 확장되고, 유격수들의 역할이 변화했음에도 불구하고 여전히 옛날 기준을 적용하고 있습니다.
리플레이스먼트 레벨의 주관적 설정
WAR에서 ‘R’에 해당하는 Replacement Level은 AAA 선수 중 상위 83% 수준으로 설정되어 있습니다. 하지만 이 기준선 자체가 자의적입니다. 왜 80%도 85%도 아닌 83%일까요?
리그별 리플레이스먼트 레벨 차이
아메리칸리그와 내셔널리그의 지명타자 제도 차이, 각 팀의 마이너리그 시스템 수준 격차 등이 리플레이스먼트 레벨에 영향을 미치지만 WAR 계산에서는 이를 완전히 반영하지 못합니다. 양키스의 AAA 선수와 말린스의 AAA 선수가 같은 리플레이스먼트 레벨일 리 없습니다.
- 팀별 마이너리그 투자 규모 차이 (연간 1000만 달러 vs 3000만 달러)
- 국제 선수 영입 시스템의 편차
- 코칭 스태프 수준의 격차
- 트레이닝 시설과 데이터 분석 인프라 차이
WAR 제공 사이트별 계산 방식 차이
fWAR(FanGraphs)와 bWAR(Baseball-Reference)의 계산 결과가 종종 크게 다른 이유는 핵심 지표 선택의 차이 때문입니다. 같은 선수를 평가하는데 1.5 WAR vs 3.2 WAR 같은 극단적 차이가 나타나는 것은 결코 우연이 아닙니다.
| 구분 | fWAR | bWAR | 차이점 |
| 투수 평가 | FIP 기반 | RA9 기반 | 운의 개입 vs 결과 중심 |
| 수비 지표 | UZR | DRS + 기타 | 계산 알고리즘 상이 |
| 리플레이스먼트 | 고정값 | 동적 조정 | 시즌별 변동성 |
| Run-Win 환산 | 고정 10 | 리그별 조정 | 득점 환경 반영도 |
투수 WAR의 더 큰 복잡성
타자 WAR도 복잡하지만 투수 WAR은 또 다른 차원의 변수들이 개입합니다. FIP(Fielding Independent Pitching)를 쓸지, 실제 실점을 기준으로 할지에 따라 사이 영의 2021시즌 WAR은 완전히 달라집니다. 수비가 좋은 팀의 투수와 수비가 나쁜 팀의 투수를 어떻게 공정하게 비교할 것인가의 문제입니다.
실전 활용에서의 WAR 한계점과 대안
WAR의 복잡성을 이해했다면 이제 실제 선수 평가와 트레이드 분석에서 어떻게 활용해야 할지 알아야 합니다. WAR를 맹신하는 것도, 완전히 무시하는 것도 잘못된 접근법입니다.
상황별 가중치 조정의 필요성
플레이오프에서는 정규시즌과 다른 가중치를 적용해야 합니다. 클러치 상황에서의 성과, 압박감 하에서의 퍼포먼스, 짧은 시리즈에서의 변동성 등은 WAR가 포착하지 못하는 영역입니다. 코리 시거의 2020 플레이오프 활약을 WAR로만 평가한다면 그의 진정한 가치를 놓치게 됩니다.
- 레버리지 인덱스(LI) 가중 조정
- 포스트시즌 경험치 반영
- 부상 히스토리와 내구성 고려
- 팀 케미스트리와 리더십 요소
WAR 기반 계약 협상의 함정
최근 들어 구단들이 WAR를 계약 협상 근거로 활용하는 사례가 늘고 있지만, WAR의 불완전성을 악용하는 경우도 빈번합니다. 특히 수비 지표의 변동성을 이용해 선수의 가치를 의도적으로 낮게 평가하는 구단들이 있습니다.
결국 WAR는 완벽한 지표가 아닌 하나의 참고 도구입니다. 복잡한 계산 과정에 숨어있는 가정들과 한계점을 이해하고, 다른 지표들과 종합적으로 판단해야 합니다. 데이터는 거짓말을 하지 않지만, 데이터를 해석하는 방식에 따라 완전히 다른 결론에 도달할 수 있습니다. 진정한 야구 분석가는 숫자 뒤에 숨겨진 맥락을 읽어내는 능력을 갖춰야 합니다.