Traducido por Pepe Latorre
Las peticiones para que se instaure el umpire robot se han intensificado en los últimos años, sobretodo a medida que la tecnología de monitorización ha mejorado y se ha vuelto omnipresente en el juego. Y cuando se cree que la alternativa a lo que tenemos ahora es un sistema imaginario que siempre acierta, es más fácil enojarse con los seres humanos, propensos a cometer errores, que actualmente hacen las llamadas.
Hay todo tipo de razones para dudar de la auténtica precisión de los robots. Así como de su capacidad para adaptarse al ritmo de la MLB. Pero eso no ha impedido a los aficionados abuchear a los árbitros con más alegría que en años anteriores. En general, las decisiones están siendo igual de precisas que en temporadas anteriores. El problema es que las malas decisiones están siendo un poco más frecuentes, creándose el escenario necesario para que las críticas afloren.
Aunque en los últimos años no ha habido cambios significativos en la forma de delimitar la zona, tiende a haber fluctuaciones menores en lo que se considera strike de una temporada a otra, además de altibajos en la precisión. Desde la introducción de la tecnología que evalúa la precisión de los árbitros de un juego a otro, su desempeño ha tendido a mejorar, pero eso no significa que estemos en una tendencia larga e ininterrumpida hacia la precisión perfecta. Para estudiar cómo lo han hecho he utilizado datos de Statcast de 2019 a 2021 para predecir si cada llamada sería una bola o un strike, basándose únicamente en su ubicación (usando un modelo de Random Forest). Son muchos (¡pero muchos!) los factores que afectan al tamaño real de la zona, desde el recuento hasta la situación del juego, pero estos tienden a ser efectos marginales y las cadenas de televisión no ajustan el tamaño del cuadro de la zona si hay tres bolas o no. Y esto suele ser precisamente lo que más irrita a los fanáticos.
En general, la zona de strike tiene la misma forma, tamaño y nivel de precisión. Se podría discutir sobre los bordes, pero los árbitros están haciendo su trabajo con aproximadamente el mismo nivel de precisión que antes. Aproximadamente el 92% de los lanzamientos se cantaron correctamente (según las coordenadas y cómo se delimita realmente la zona en el reglamento) en 2019. Igualmente, en 2021 un 92% de los strikes han sido cantados correctamente. Los primeros análisis de la zona produjeron hallazgos similares, como nos decía Ben Clemens en este artículo en FanGraphs.
Pero la precisión general no es la única manera de medir el rendimiento de los umpires. La gran mayoría de los lanzamientos son strikes claros o bolas obvias, e incluso en el peor de los casos, tienden a llamarse correctamente. Los errores, cuando suceden, tienden a limitarse a ubicaciones bastante marginales: un lanzamiento que se canta como strike el 51% de las veces y que en un momento concreto se da incorrectamente como bola no es un error mayor.
Sin embargo, rara vez se da un strike a un lanzamiento que no está cerca de la zona de strike (y viceversa). Si bien, estos lanzamientos tienden a no producirse a menudo, cuando lo hacen, enfada de una manera desproporcionada a los fanáticos. Pueden ser el resultado de que el árbitro falle por completo o se deje engañar por la reacción de un jugador. O simplemente podrían ser errores.
Sin importar el motivo, podemos aislar este tipo de errores enfocándonos en lanzamientos que tienen un 99% o más de probabilidad de ser una bola o un strike, según el modelo, pero que acaban siendo cantados como lo opuesto a lo que la tecnología nos dice. Estos son probablemente los tipos de errores más graves que puede cometer un árbitro y resulta que esta temporada se han vuelto un poco más frecuentes. En lo que va de año ha habido alrededor de 500. En 2019, a estas alturas del calendario, solo había habido 330.
Solo ha subido el número de malos strikes. Las bolas malas, aquellas con una probabilidad de strike cantado superior a 0,99 pero que el árbitro acaba dando como lanzamientos fuera de la zona, están aproximadamente al mismo ritmo que solían estar. No está claro por qué los dos tipos de errores serían diferentes, pero los estudios sí que coinciden con la percepción popular al considerar a los árbitros como culpables de cantar demasiados strikes fuera de la zona en lugar de errores al dar bolas.
Aún así estamos hablando de un número reducidísimo de casos. Ha habido, de momento, unos 500 en una muestra total de casi 200.000 lanzamientos. Es decir, una mala decisión cada cuatro partidos. Es un aumento con respecto al 2019, cuando se produjo un error cada cinco partidos. Sin embargo es difícil que esta variación sea apreciable para los aficionados.
Salvo por el pequeño detalle de que un número significativo de errores se han dado en situaciones muy apretadas (high-leverage moment en inglés). Aproximadamente la mitad de los fallos se han producido en partidos que estaban empatados o con una sola carrera de diferencia. Las malas llamadas en partidos ajustados han aumentado en un 50% con respecto al 2019. Lo mismo sucede si además de partidos ajustados buscamos que estos estén en los instantes finales (de la sexta entrada en adelante).
Las malas decisiones no ocurren todo el tiempo, pero como son un poco más frecuentes y mucho más frecuentes en partidos ajustados donde pueden afectar al resultado, los fanáticos han criticado duramente a los umpires. Tomemos este juego que iba 2-3 en la parte superior de la novena como ejemplo. Mark Melancon, cerrador a los Padres, termina el partido ante los Giants después de una serie de decisiones bastante cuestionables. Los lanzadores, gracias a su velocidad, efecto y movimiento, están siendo muy dominantes esta temporada. Tener ayuda extra los hace prácticamente invencibles.
No hay patrones sólidos en términos de quiénes son los beneficiarios de estas llamadas, los árbitros que las hacen o incluso las localizaciones donde tienden a ocurrir. Debido a que estos errores son muy raros, es casi imposible saber qué los motiva. El mascoteo por parte de los receptores ha sido durante mucho tiempo uno de los caballos de batalla de los críticos de los árbitros, pero los receptores rara vez pueden robar strikes en lanzamientos fuera de la zona, su logro más común es evitar bolas erróneas en lanzamientos que están los bordes. Ni siquiera está del todo claro que esta tendencia sea algo más que un error de muestreo. Es posible que las llamadas raras se hayan agrupado en estas importantes situaciones de juego a principios de año, lo que explica el aumento de las quejas de los árbitros en abril, que parece haber disminuido un poco desde entonces.
Dado que los árbitros robots van a acabar siendo una realidad, este tipo de errores no seguirán sucediendo (es probable que tengamos errores diferentes, y potencialmente peores en su lugar). Pero una de las fortalezas de los robo-árbitros es que no sucumbirán a la presión del momento ni serán persuadidos por jugadores vehementes que buscan beneficiarse en instantes cruciales. Por eso será difícil para los fanáticos culparlos o molestarse más en la novena entrada de un juego empatado que en un ponche en la segunda entrada. Las frías máquinas de calcular no sabrán ni les importará cuál es el índice de apalancamiento y tampoco se les podrá acusar de mostrar favoritismos.
¿Hará esto que los aficionados dejen de quejarse? Seguramente no. Pero será refrescante discutir sobre cómo las máquinas establecen la altura límite de la zona de un jugador en lugar de si Ángel Hernández es ciego.
Thank you for reading
This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.
Subscribe now