Defendiendo el WAR

El pasado 2 de mayo el columnista de ESPN, Jorge Morejón escribió para su portal web un artículo titulado “mi guerra personal contra la estadística WAR”. Donde expone varios argumentos que desafían la lógica bajo la que está hecha las famosas Victorias sobre Remplazo, la cual viene siendo la punta de lanza del análisis Sabermetrico. Si bien no es la única estadística propuesta por la Sabermetrica, si es la que mas recibido atención y cierto grado de aceptación por los seguidores de la pelota, no solo por su complejidad sino además por la pregunta tan importante que ella intenta responder.

Aquí en Sabermetrico, no podíamos perder la oportunidad para analizar los argumentos ofrecidos  por el Sr. Morejón y defender, donde se deba, a la estadística WAR.

El primer argumento esgrimido es la existencia de dos WAR diferentes, el de Fangraphs (fWAR) y el de Baseball Reference (rWAR). Para un mismo jugador la mayoría de las veces los números discrepan dependiendo de qué pagina se revise. Pero ¿Por qué existen dos WAR distintos? ¿Por qué no simplemente se ponen de acuerdo y consiguen un mismo valor? La respuesta es sencilla, aunque siguen la misma lógica detrás de su cálculo, el procedimiento lleva tal grado de complejidad que permite discernir en múltiples detalles, dependiendo de la opinión de quien esté desarrollando la estadística.

Por ejemplo, el fWAR ajusta los valores en función de las diferencias de los parques, con datos de las últimas 5 temporadas, el rWAR solo utiliza datos de las últimas 3 temporadas. El fWAR incorpora el UZR para medir la defensa, el cual es un sistema totalmente automatizado, el rWAR utiliza el DRS, que tiene un componente automatizado, pero también registra ciertas jugadas “buenas o mal hechas” a juicio de un anotador, por lo que también incorpora el factor humano, tal como lo explica The Fielding Bible. El fWAR utiliza como media ofensiva, los promedios de todo MLB, el rWAR utiliza como media ofensiva, los promedios de cada liga (Americana y Nacional). ¿Cuál de los dos es mejor? Responder esa pregunta ya seria caer en la subjetividad.

El segundo argumento utilizado se refiere al wOBA y a la obtención de sus coeficientes. En realidad, de todos los componentes del WAR del que más se está seguro de su veracidad es precisamente del wOBA. Los coeficientes no son cifras arbitrarias como infiere el artículo. Sino que en realidad surgen de un procedimiento estadístico llamado “Cadenas de Markov” en donde se calculo el promedio de carreras anotadas hasta el final del inning, en donde se registran cada uno de los eventos ofensivos (hit, BB, 2B, 3B, HR, HBP, etc) de tal forma que se calcula un valor promedio y se puede decir con bases que un HR vale en promedio x número de carreras, tal como lo explica The Book.

Dentro del wOBA también se critica que lo coeficientes varían entre ligas y divisiones. En realidad lo coeficientes varían levemente entre ligas cada año. Pero ¿Por qué? ¿Acaso un HR puede tener un peso diferente a hace 15 años? De hecho, si. La explicación es que en ligas donde el pitcheo es muy dominante, cuando se conecta un cuadrangular se conseguirán en promedio menos hombres en base, por lo que su peso relativo o aporte de carreras será menor al de una liga donde domine la ofensiva. Siguiendo esa lógica, entre mayor sea la ofensiva de una liga menos valiosos, en promedio, serán los toques de sacrificios y bases robadas. O por el contrario, entre mayor sea la carencia de ofensiva, los boletos y hits se revalúan. No es tan difícil de entender.

El tercer argumento con el que se ataca al WAR es su falta de contexto. Este argumento es verídico, el WAR es una estadística contextualmente neutra y de hecho siempre se ha buscado que sea así, por la lógica de que el jugador no posee control sobre su contexto de juego. El bateador no puede controlar si viene a batear con las bases llenas o con las almohadillas vacías. No puede controlar si el juego se le escapara de las manos al pitcheo de su equipo o si estará cerrado hasta el final. El promedio de bateo, Hrs, Ponches y ERA también son estadísticas contextualmente neutras, la mayoría de las estadísticas del beisbol lo son.

Si el Sr. Morejón o cualquier otra persona lo que desea es fijarse del contexto, la Sabermétrica también ha desarrollado un grupo de estadísticas que miden el aporte del jugador dada la situación del juego como el Clutch o el WPA, que mide la probabilidad de victoria agregada en cada turno del Bateador/lanzador en base a estadísticas Play-by-play. Se podría profundizar mucho en este tema, pero lo dejaremos para otra ocasión.

El hecho de que se tome el valor de una victoria como aproximadamente 10 carreras tampoco es una arbitrariedad, sino que se debe al promedio de carreras anotadas por juego. Obviamente es más valioso irse de 1-5, 2B, RBI en un juego que termina 1-0, que batear 4-4 con escalera en un juego que tu equipo pierde. Pero nuevamente afirmamos que la situación de juego no la controla el jugador, agregar eso a la estadística sería injusto.

El último argumento manejado por el autor es que el WAR no puede medir el aporte del liderazgo. Esto también es verdad, en realidad ninguna estadística puede. Ya que ninguna estadística es perfecta, todas tienen vacios. Solo que las estadísticas Sabermetricas están diseñadas para tener estructuralmente menos vacios. El WAR está lejos de estar terminado, pero definitivamente se está en el camino correcto, la mejor prueba es el nivel de correlación del WAR con las victorias reales del equipo. En el artículo “WAR: Imperfect but Useful Even in Small Samplesde Dave Cameron, publicado recientemente en Fangraphs, afirman que en lo que va de temporada la correlación es de 88%, el porcentaje restante son precisamente los aporten intangibles o que todavía no se miden correctamente.

La correlación nunca será perfecta, nunca se llegara al 100%, pero ciertamente el WAR (y la Sabermetrica en general) nos ayuda a comprender un poco mejor que contribuye en mayor o menor medida a las victorias. No todo lo puede decir los números, pero tampoco la observación directa tiene todas las respuestas.

Billy Beane, Gerente General de los Atléticos de Oakland

Billy Beane, Gerente General de los Atléticos de Oakland

Hace 20 años si se afirmaba que una alineación terminaría penúltimo en promedio de bateo y antepenúltimo en errores, todos los analistas hubieran afirmado que eran unos de los peores line ups. Pero como ya los explicamos en un articulo anterior, ese equipo resulto anotar tantas carreras como el promedio de la liga y tener una defensiva (según el UZR) mejor que el promedio. Estamos hablando de los Atléticos de Oakland de la temporada pasada.

La Sabermetrica ha avanzado bastante desde sus inicios en el entendimiento del juego del beisbol. Más que rechazar sus estadísticas se debe buscar es un mayor entendimiento, ya que no son números al azar, sino que son buscados con argumentos y lógica.

Sr Morejón, usted afirma que el beisbol para su persona es una religión. Pues para muchos de los que leemos, estudiamos y escribimos de Sabermetrica, también lo es.

Todos los datos fueron tomados de baseball-reference.com y Fangraphs.com

Tadeo Varela es colaborador de Sabermétrico.com. Lo puedes contactar vía twitter a través de @TadeoVarela

Comments

comments

Powered by Facebook Comments

Esta entrada fue publicada en Grandes Ligas, Sabermetría, Tutorial y etiquetada , . Guarda el enlace permanente.

Los comentarios están cerrados.