keyboard_arrow_uptop
Image credit: David Kohl-USA TODAY Sports

Traducido por Marco Gámez

Cuando MLB empezó a usar PITCHf/x durante la postemporada de 2006, probablemente pareció un tema de curiosidades para la mayoría del público que seguía el béisbol. Catorce años después, los datos de los sistemas de seguimiento han cambiado el juego de innumerables formas, desde cuantificar el arsenal de un lanzador hasta contar la historia de la pelota de béisbol adulterada y su rol en el desarrollo de la tasa de jonrones más alta de la historia. Un sistema que comenzó con el objetivo de medir principalmente a los lanzadores se ha transformado en un panóptico en el campo de béisbol, monitoreando cada movimiento de los jugadores y cada segundo de la trayectoria de la pelota.

Esta temporada, estamos en presencia del nuevo paso en la evolución de la tecnología de seguimiento, el Hawkeye, un sistema basado en cámaras y que prometió un rendimiento mejorado y nuevos datos en relación con la versión anterior de Statcast. Con todas las complejidades de una temporada retrasada por COVID-19, un período relativamente corto para probar la nueva tecnología y una cantidad enorme de otras dificultades, muchos esperaban que el lanzamiento de Hawkeye fuera un desastre. Pero los datos que provienen de las cámaras parecen ser casi tan precisos o mejores que los que estamos acostumbrados a tener.

La principal herramienta para evaluar la precisión de Hawkeye es el concepto de ajuste del estadio. De manera similar a cómo se deben ajustar las estadísticas de un bateador o lanzador si juegan en Coors o San Diego, las lecturas en bruto de los sistemas de seguimiento deben calibrarse. Cuando son inexactos o están mal calibrados, un lanzamiento de 100 mph (161 kph) en un estadio podría estar realmente a 98 mph (158 kph), o un slider que parece que rompió a siete pulgadas (18 cm) realmente solo rompió a cinco (13 cm). En la medida en que se requieran más ajustes, peores serán los datos sin procesar y más necesario será limpiarlos antes de realizar cualquier análisis.

Para calcular los ajustes del estadio, obtuve los datos de Hawkeye para los primeros juegos de la temporada y construí modelos lineales generalizados en cada estadística de interés: velocidad de la bola rápida, ubicación del plato, punto de rotura del lanzamiento, velocidad de salida y ángulo de despegue. Usé un efecto aleatorio para el estadio y comparé el tamaño del ajuste del estadio este año con los primeros 20,000 lanzamientos de cada temporada de 2016-2019.

Podría decirse que la medida más importante es la velocidad de lanzamiento, ya que les dice mucho a las oficinas centrales sobre un jugador: su habilidad, salud, niveles de fatiga, etc. La precisión de Hawkeye en la velocidad de los envíos parece ser aproximadamente igual a la de Trackman…con algunas excepciones. La mayoría de los estadios están en funcionamiento, lo que requiere ajustes de no más de una o dos décimas de milla por hora agregadas o perdidas. Algunos, sin embargo, tienen pistolas de registro que añaden o restan más velocidad. Las mediciones de velocidad de Milwaukee señalan alrededor de 0.7 mph (1.12 kph) más, un margen lo suficientemente grande como para ver a algunos lanzadores lanzar más rápido de lo que acostumbran cuando visitan ese estadio. De manera similar, el estadio de los Diamondbacks presenta registros 0.5 mph (0.80 kph) por debajo.

Por lo tanto, la velocidad es un poco problemática, pero no lo suficiente como para que las mediciones de Hawkeye pierdan credibilidad. Algunos lanzadores individuales, Jacob deGrom, se destacan por tener rectas excepcionalmente rápidas este año (ha lanzado varias a más de 100 mph (161 kph)). Su caso merece una atención especial, pero las lecturas de velocidad general de Hawkeye parecen ser confiables.

En términos de ubicación del plato (horizontal y vertical), Hawkeye es igual o supera a los sistemas de seguimiento anteriores. La ubicación horizontal es un área de especial fortaleza. Esta evaluación se ajusta a la información proporcionada al personal de la oficina principal y a la prensa que sugirió que Hawkeye era notablemente experto en medir la ubicación de los lanzamientos.

El movimiento del pitcheo o la rotura es otra de las estadísticas más importantes que puede medir Statcast. Trackman inicialmente tuvo problemas con la rotura, a veces lo informó erróneamente en los primeros años y mostró grandes diferencias entre los estadios. Un avance tecnológico más adelante mejoró las habilidades de Statcast, pero llevó a la aparición incorrecta de cambios en el movimiento de los lanzamientos de toda la liga.

Hawkeye parece capaz de medir bien el movimiento de lanzamiento, pero el giro de la pelota que genera ese movimiento es otro tema. La medición del quiebre de los lanzamientos parece confiable y constante de estadio en estadio. MLBAM sugirió que Hawkeye podría usar sus cámaras para rastrear la velocidad de giro y la dirección en la que gira la pelota (su eje) directamente, una mejora con respecto al aporte de Trackman. Pero, Eno Sarris informa que las velocidades de giro y los ejes de Hawkeye pueden no ser confiables; quizás como resultado, MLBAM no está proporcionando los ejes medidos por Hawkeye, sino extrapolando el movimiento observado del lanzamiento.

Un gran problema con el advenimiento de la primera versión de Statcast fue la perdida de datos. El sistema basado en radar de Trackman cubría la mayoría de las trayectorias de bolas bateadas razonablemente bien, pero entre el 10 y el 15 % de los batazos evadieron el rayo registrador, lo que provocó la pérdida de datos. Peor aún, los datos perdidos por el radar tendían a ser muy específicos en lugar de una muestra aleatoria: batazos elevados, pero no largos y roletazos, literalmente, arrastrados. MLBAM trató de manejar este problema infiriendo (es decir, adivinando estadísticamente) cuáles eran las velocidades de salida y los ángulos de despegue de las bolas bateadas perdidas, pero aún así era un obstáculo que los sabermétricos debían superar al hacer análisis con estos datos.

Curiosamente, Hawkeye parece no tener ninguno de esos problemas de datos perdidos. Hasta ahora, las cámaras solo pierden alrededor del 1% de las bolas bateadas, una mejora de diez veces con respecto a Trackman. Y según el arquitecto de datos sénior de MLBAM, Tom Tango, los batazos de los que pierde el rastro se distribuyen de forma más aleatoria que la alergia de Trackman a los mansos batazos elevados y a los roletazos. La perdida de datos siempre es un problema, pero reducir la magnitud de ese problema en un múltiplo de 10 hará que las inferencias sobre las velocidades de salida no ajustadas y los ángulos de despegue sean mucho más seguras.

Al mismo tiempo, la falta de datos perdidos crea un problema al comparar estadísticas como la velocidad de salida y el ángulo de despegue de un año a otro. Debido a que Hawkeye rastrea tantos batazos que Trackman no pudo (ahora incluye hasta los batazos en territorio foul), parece que la velocidad de salida ha disminuido enormemente de 2019 a 2020 (de manera similar, el ángulo de despegue promedio sin procesar parece que se ha disparado). Pero los cambios desde el año pasado hasta este año son principalmente el resultado del cambio del sistema de seguimiento. (También parece haber un aumento real en el ángulo de despegue, pero es necesario un análisis más cuidadoso para aislar cuán grande es el aumento). Ten cuidado con los analistas que sugieren que los bateadores no están haciendo un contacto tan sólido este año en función de los números de velocidad de salida sin procesar: el cambio del sistema de seguimiento complica esa premisa simple.

A Major League Baseball se le culpa (y con razón) de las decisiones tomadas durante la pandemia, desde la falta de un plan para controlar los brotes hasta un enfoque ad hoc para las pruebas y el rastreo. Incluso antes de la pandemia, el lanzamiento de Hawkeye parecía destinado al fracaso: se ensambló apresuradamente después de que fracasara un acuerdo con Trackman y no parecía que hubiera tiempo suficiente para depurar problemas que tienden a surgir al instalar nuevos sistemas de seguimiento. Pero, hay que reconocer a favor de la liga (y de la compañía), que Hawkeye parece haber encajado sin problemas en el flujo de datos existente, produciendo números tan precisos como el sistema anterior y minimizando los datos perdidos.

Thank you for reading

This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.

Subscribe now
You need to be logged in to comment. Login or Subscribe