Sabermetrics 칼럼
어제 EqA 때문에 고생 좀 했습니다. 영어번역을 잘 못해서 어려움을 겪었네요. 또한 우리나라 기록정리를 해놓은 www.statiz.co.kr이 EqA의 기준점을 .260이 아닌 .255~.256로 삼고 있어서 검증해보는데도 시간이 걸렸습니다.
무엇보다 고안과정을 정확히 이해하는게 쉽지는 않았습니다.
EqA의 착안은 무엇일까요?
그것은 투수진이 리그평균일 때 "어느 정도의 팀타자를 가져야 5할승부를 할 수 있는가?" 일 것입니다. 그리고 그 타자를 타율로 보았을 때 .260을 가져야만 된다고 여겼지요. 대략 타율 .260, 출루율 .340 장타율 .420 수준의 타자로 팀평균을 유지한다면 팀은 타력으로 5할승부를 할 수 있다고 생각하고 있습니다. 이보다 더 좋은 타자가 있다면 당연히 승률은 5할보다 높게 가져가겠지요.
먼저 선수의 RawEqA를 구하는데 이것은 주루능력을 반영한 OPS라고 생각해도 좋습니다.
1단계 RawEqA (수정OPS)
RawEqA =(H+TB+1.5*(BB+HBP+SB)+SH+SF-IBB/2)/(AB+BB+HBP+SH+SF+CS+SB)
이것은 주루를 반영한 수정OPS입니다
출루요소=(H+BB+HBP)/(AB+BB+HBP+SH+SF)
진루요소=(TB+0.5*(BB+HBP)+SH+SF-IBB/2)/(AB+BB+HBP+SH+SF)
주루요소=(1.5*SB)/(CS+SB)
이 3가지를 조합한 게 RawEqA입니다.
2단계 UEQR (수정RC)
xmul=2*(.125/PF/Lg(R/PA))
EQAADJ=xmul*(RawEqA/LgEawEqA)* ((1+1/diffic)/2) + (1-xmul)
UEQR=EQAADJ*PA*Lg(R/PA)
xmul이라는 것은 일단 구장효과와 함께 1경기-27아웃-5점-40타석과 비교하여 현재 리그가 어떤 성향을 보이고 있는가를 표현하는 조정계수입니다. 기준은 2이고 만약 리그가 타석당 0.125점 이상의 득점력을 보인다면 xmul은 2보다는 작겠지요. 타고투저일 때는 2보다 더 작고 투고타저일 때는 2보다 다소 크게 됩니다. 2로 고정시켜도 되는데 정밀하게 파악해보는 것도 나쁘진 않을 겁니다.
EQAADJ는 특정타자의 타석당 득점력을 의미합니다. diffic은 1로 고정시키시길 바랍니다. diffic은 리그별 수준을 고려한 조정계수인데 이는 예로 들면 마이너리거가 메이저로 승격될 때 고려해주는 것이라고 할 수 있겠습니다. 메이저리그의 diffic를 1로 볼 때 마이너리그나 KBO는 1보다 더 작겠지요. 왜냐면 마이너리그와 KBO의 수준이 더 떨어지니까요. 다만 이렇게 특정선수의 승격과 강등을 고려하지 않을 때는 1로 생각하시면 됩니다.
이렇게 EQAADJ를 구하면 우리는 특정타자의 득점력을 RC보다 정확히 알 수 있습니다. 여기서 부터는 예제를 이용해보지요. 김현수의 EQAADJ는 1.494로 리그 타석당 득점력 0.131보다 1.494배 더 레버레지가 있습니다. 이를 김현수의 타석수로 곱해주면 김현수의 득점력 111.9점이 나옵니다. (=1.494*572*0.131) 즉, 김현수의 UEQR은 111.9점이란 거겠지요
UEQR은 정밀한 RC입니다. RC보다 설명력이 높은 득점생산성지표인 셈이죠
3단계 기대승률구하기
AVGTM=Lg(R/PA)*Lg(PAs/9inning)*PF*P_Games
TMPLUS=AVGTM+UEQR- Lg(R/PA)*P_PAs*PF
AVGTM은 9명의 리그평균수준의 타자들이 타선을 이룰 때 득점력입니다. "Lg(R/PA)*Lg(PAs/9inning)"은 9이닝까지 득점입니다. 2009시즌에 9이닝당 득점은 5.27이었습니다. P-Games는 선수의 경기출장수입니다. 김현수는 133경기 전경기 출장을 하였군요. 김현수를 기준으로 한 AVGTM은 5.27*0.922*133으로 695.9입니다. 예제 보고 계시지요? ^^
TMPLUS는 8명의 리그평균수준의 타자들과 특정타자로 타선을 이룰 때 득점력입니다. 여기서는 Lg(R/PA)*P_PAs*PF 이게 중요한데 이것은 김현수의 타석에 리그평균의 타자로 대체시키는 것입니다. 자 보세요. 9명의 팀득점인 AVGTM과 김현수의 득점인 UEQR을 더해놓으면 10명이 포함되어 있는 모양입니다. 따라서 1명을 빼줘야 하는데 그 1명은 리그평균의 타자여야 겠지요. 리그평균의 타자는 타석당 0.131점 득점생산성을 가지고 김현수의 타석수는 572이므로 TMPLUS는 695.9+111.9-0.131*572*0.992이렇게 하여 733.57이 구해지는 군요.
다시 말해 김현수가 포함되어 리그평균보다 38점 더 득점을 했군요. (=733.57-695.9)
Get pythagorean exponent
pyexp=((TMPLUS+AVGTM)/P_Games)**.285
pyexp는 2라고 생각하시면 좋겠습니다만 보다 정밀한 기대승률을 구하고 싶다면 이런 식으로 계산해주어야 합니다. 예제에서는 1.95~1.97 정도로 형성하고 있지요. 구해놓은 TMPLUS, AVGTM를 그대로 사용하고 김현수의 경기출장수인 133경기를 P_Games로 하여 계산하면 pyexp는 1.968이 나옵니다.
WINPCT=((TMPLUS/AVGTM)**pyexp)/(1+(TMPLUS/AVGTM)**pyexp)
팀실점을 리그평균득점으로 하기에 이렇게 사용할 수 있는 것입니다. 원래 피타고리안승률공식은
"(팀득점^pyexp)/(팀득점^pyexp+팀실점^pyexp)"인데 우리 팀 투수력이 리그평균이라고 가정함으로 우리팀의 팀실점은 리그평균득점과 같아집니다. 분모와 분자를 리그평균득점으로 나누어주면 위와 같은 피타고리안승률공식이 나오게 되겠지요.
김현수의 팀은 김현수가 들어감으로써 .526의 승률을 얻게 되었네요. 다시 말해 5할 승률팀이 리그평균수준의 선수 한 명을 빼고 김현수선수를 썼더니 승률이 .026더 증가하였습니다. "(733.57/695.9)^1.968 / (1+(733.57/695.9)^1.968)"은 .526입니다.
4단계 EqR, EqA구하기
NEWTM=(WINPCT/(1-WINPCT))**(1/2)
EQR=.17235*((NEWTM-1)*27.*Games + Outs)
EQA= (EQR/5/Outs)** 0.4
피타고리안기대승률작업이 이미 끝났는데 왜 또 WINPCT가 나오는지 궁금하시겠지만 이는 김현수의 득점효율을 알기 위해서입니다. 즉 5할팀에 비해 김현수가 포함된 팀은 1.053배 득점효율이 있음을 표현합니다. 이는 0.526/0.5로도 표현가능하지만 (0.526/(1-0.526))^0.5로도 표현됩니다. 이렇게 하면 김현수가 포함된 팀은 1아웃카운트당 0.17235점을 득점하는 것이 아닌 0.181점 득점하는 것이 되겠지요. (=0.17235*1.053) 또한, 김현수 단독의 1아웃카운트당 득점은 0.278점으로 리그평균선수들보다 1.65배나 높습니다. 이는 일곱줄 뒤에 설명하겠습니다.
EQR을 잠시 보지요. 만약 5할승률팀이라고 가정한다면 WINPCT는 0.5일 것이며 NEWTM은 1일 것입니다. 이럴 때 1경기-27아웃카운트의 EQR은 4.65가 나옵니다. [0.17235*((1-1)*27*1+27)=0.17235*27] 이는 2009년 시즌 1경기-5.27점을 뽑아내었다고 하더라도 타고투저시즌이 아닌 투타 밸런스가 맞은 시즌에서는 4.65점과 다를 바 없다는 뜻입니다. EQR은 Equivalent Runs로 등가화한 득점이라고 하는데 이는 타고투저의 득점이나 투고타저의 득점을 투타균형을 이룬 시즌의 득점으로 등가화시킨다는 의미입니다.
자 김현수로도 살펴보면 김현수의 2009시즌 UEQR은 119점이지만 만약 타고투저의 시즌이 아니었다면 119점은 86.49점과 같다 할 것입니다. 2009시즌 김현수의 UEQR 119점은 EQR 86.5점과 같습니다. [=.0.17235*((1.053-1)*27*133+311)] 여기서 일곱줄 위의 김현수의 아웃카운트당 득점 0.278이 설명됩니다. 86.5점을 311아웃 동안 뽑았으니 0.278(=86.5/311) 이겠지요.
EQR은 EQA와 "EQA= (EQR/5/Outs)^0.4 "의 관계가 있습니다. 이는 득점과 타율의 일반적인 관계입니다. 즉 득점=(타율/5/아웃수)^0.4의 관계가 있는 것이지요. 이렇게 표현도 가능합니다. EQR=5*OUTS*EQA^2.5라고 말이지요.
이런 식으로 하면 김현수는 EQA가 0.315가 되어야 311아웃카운트 동안 86.5점을 뽑을 수 있습니다. [=86.5=5*311*(.315)^2.5]
김현수가 아닌 리그 평균의 타자를 생각해보지요. 리그평균의 타자의 EQA는 .260이라고 하였습니다. 이를 적용하면 27아웃카운트당 몇 점을 뽑을까요? 당연히 4.65점일 것입니다. 검증을 해보면 4.65(=5*27*(.26)^2.5)로 설명됩니다.
이로써 우리는 김현수의 2009시즌 득점생산성 119점이 EqR-86.5점과 같고, 김현수의 올시즌 타율 .357는 EqA-.315와 같음을 알 수 있었습니다. 2009시즌 리그 1경기 득점력 5.27을 4.65점으로, 시즌타율 .275를 .260으로 변환해보는 작업도 동시에 하였습니다.
EqA 이것은 계량적인 등가타율로서 출루율과 장타율과 비례관계도 있습니다. 실제 타율은 출루율 및 장타율과 높은 상관관계가 있다고는 할 수 있으나 비례관계에 있다고 할 수 없지만 이론적인 타율인 EqA는 출루율과 장타율과 100%-상관관계 즉 비례관계가 있습니다.
다시 한번 예제를 제시합니다. 이해하기 어렵다면 클릭하셔서 공부하세요. 세이버관련글은 공부를 해야한다는게 골치가 아프지만 말입니다.
<<주의: WWW.STATIZ.CO.KR의 리그EqA는 .254~.256이 기준입니다. 한국형스탯이려나요? 국내야구의 중립기준은 .255인가 봅니다. 하긴 우리나라는 한 동안 4점도 못 뽑는 야구를 82년부터 92년까지 하였으니까요. 물론 참고한 예제는 리그EqA를 .260로 하였습니다.>>
대단하십니다. nineguys 님
저는 두산쪽 타자 스탯을 정확히 모르나 정말 잘 하셨네요.
nineguys님 덕뿐에 저도 힘이 나네요.
좋은 자료 올려 주셔서 감사합니다.

아, 스탯티즈 EqA가 .255를 기준으로 작성이 된건가요? 저도 .260으로 잡고 몇번 계산해보았었는데 값이 약간 다르게 나오더라구요. 어쩐지;;
그런데 .255와 .260 중에 어떤 수치가 더 현실을 잘 반영하는 수치일까요?
저는 요즘 한국야구 타자진의 상향평준화 현상을 감안할때, .260이 좀 더 맞지않나란 생각을 하는데... 장기적인 리그평균값을 생각하면 더 낮아져야 하려나요
승짱님//상관없지 않을까요? 기준이 어떻든지요. 그러나 제 생각엔 .255여야 할 것 같습니다. 야구역사 28년동안 4.65점 밑으로 17년 그 위로 11년 해왔으니까요. 어처구니 없게도 리그평균득점이 3.7~4.0점인 해도 3번 정도 있었구요.
그러나 00년대를 생각하면 딱 4.65점 .260이 적용됩니다. 어떤 기준을 사용해도 좋겠지만, 저는 .260을 사용하는 게 좋을 것 같습니다. 이미 우리나라타자들이 4.5점대 야구를 완전히 벗어난지 15년이 지났는데 기준을 .255로 삼는 것은 그닥 좋은 선택은 아니겠지요.
아 그리고 승짱님 첨부파일 보이십니까? 저는 왜 자꾸 엑셀파일이 안뜨는지......... 글 읽는 분들은 엑셀파일을 참조하는 게 중요한데요. 제가 다시 한 번 파일 첨부할테니 관리자님이 처리해주세요 ^^
저도 .260이 낫다고 봅니다. 일단은 원저자(Clay Davenport)의 기준을 그대로 살려 주는 것이 좋을 듯 하네요. 어차피 기준이 무엇이냐는 큰 상관은 없습니다만... 애초에 EqA의 문제 중 하나가 타율과 유사한 스케일로 만들기 위해 불필요한 노가다 계산이 추가되는 것이지요.
EqA는 주루를 포함한다는 면에서 진보한 측면이 있습니다만, wOBA에 비해 계산이 지나치게 복잡하면서도 정확도는 그다지 향상되지 않습니다. 전형적인 Baseball Prospectus 스타일의 스탯이라고 생각합니다.
그나저나 저는 국내야구를 가지고 이렇게 분석해 본 적이 없는데... 정말 대단하십니다. ^^ 이거 이 게시판이 어쩌면 한국판 The Hardball Times가 될 수도 있겠네요...
| 번호 | 제목 | 닉네임 | 조회 | 별점 | 등록일 | |
|---|---|---|---|---|---|---|
| 47 |
|
안타방지능력은 있는가? 있다!!!
|
||||
| 973 |
5.0/1
|
2010-02-23 | ||||
|
FIP, DIPS 등은 페어지역내에 떨어지는 타구는 투수들이 관리할 수 없다. 따라서 볼넷허용회피능력, 홈런허용회피능력, 삼진능력 이 세가지 요인으로 투수의 능력을 측정해야 한다고 주장하고 있습니다. 또한 Freeredbird님이 새...
|
||||||
![]() |
|
두산베어스와 2009시즌과 함께하는 EqA
|
||||
| 930 |
5.0/1
|
2010-02-22 | ||||
|
어제 EqA 때문에 고생 좀 했습니다. 영어번역을 잘 못해서 어려움을 겪었네요. 또한 우리나라 기록정리를 해놓은 www.statiz.co.kr이 EqA의 기준점을 .260이 아닌 .255~.256로 삼고 있어서 검증해보는데도 시간이 걸렸습니다.
...
|
||||||
| 45 |
|
한국야구 파워랭킹 -EqA와 VORP 적용- [1] | ||||
| 659 |
0.0/0
|
2010-02-21 | ||||
|
FREEREDBIRD님 EqA와 VORP를 동시에 적용해 보았습니다. 논리에 오류가 없는지 확인 좀 부탁드립니다.
어제 EqA에 대해 완전히 이해를 했습니다. BP 칼럼 2개를 조합하니 고안과정을 이해하겠더군요.
아무튼 EqA와 VO...
|
||||||
| 44 |
|
DIPS [1] | ||||
| 621 |
0.0/0
|
2010-02-19 | ||||
|
1. 탄생배경
1-1. 투수가 관리할 수 있는 항목
BB% = BB/((IP*3)+H+BB) : 이 스탯은 투수가 한 시즌동안 자신이 상대한 타자 몇 명당 하나의 볼넷을 기록했는 가를 가늠하는 수치이다. 분명히 후반기 실제 BFP는 이 ...
|
||||||
| 43 |
|
SIERA(Skill-Interactive ERA) : 새로운 투수 스탯의 ...
|
||||
| 1061 |
0.0/0
|
2010-02-19 | ||||
|
(주의: 이 글은 그동안 적어온 세이버메트릭스 글 중에서도 매우 매니악한 분위기의 글이다. 마음의 준비를 하고 읽으시기를...) Baseball
Prospectus가 세이버메트릭스의 중심지이던 시절이 있었다. Voros McCracken이 DIPS
이론을...
|
||||||
| 42 |
|
MLV에서 VORP까지 알아보기 [2] | ||||
| 568 |
0.0/0
|
2010-02-16 | ||||
|
한국야구사이트 세이버매트릭션에 freeredbird님이 포스팅한 글에 보충적인 내용이 될 것입니다. 저는 타자의 VORP의 고안과정에 대한 원문내용을 전부 살펴보았습니다. 먼저 VORP에 관심을 갖게 해준 freeredbird님께 고맙다는...
|
||||||
| 41 |
|
THE BOOK -RUNNING WILD- 중 도루 [4] | ||||
| 818 |
5.0/1
|
2010-02-16 | ||||
|
freeredbird님의 블로그에서 좋은 정보를 많이 얻어가기만 하였는데 우연히 이곳에서 뵙네요. 조금이나마 수고를 덜어드리는 싶은 입장에서 글 몇 편 올립니다. freeredbird님께서도 THE BOOK-PLAYING THE PERCENTAGE I...
|
||||||
| 40 |
|
wRC+ : 타자에 대한 상대 평가
|
||||
| 1530 |
5.0/1
|
2010-02-04 | ||||
|
우리는 그 동안 타자의 생산성을 평가하기 위한 보다 발전된 스탯으로 wOBA, wRAA 등을 살펴보았고, 타자를 종합적으로 평가하기 위한 WAR의 계산 방법도 살펴본 바 있다. 그런데, OPS 대신 wOBA나 wRAA를 사용할 수 ...
|
||||||



승짱
