Traducido por Marco Gámez
Estamos en medio de lo que será por lo menos el período más largo sin béisbol desde la huelga de 1994. (Y tampoco tenemos conflictos laborales sobre los cuales escribir). No hay juegos, ni prácticas, ni siquiera los pequeños destellos de esperanza que son los informes de velocidad de lanzamientos durante el Entrenamiento de Primavera o las historias de estar en “La mejor condición física de su vida”.
Entonces, ¿qué debe hacer un fanático del béisbol o, en este caso, un escritor con inclinación hacia la Sabermetría? Si no tenemos ningún evento nuevo de beisbol sobre el que escribir, tratemos de crear algunos datos nuevos del béisbol que ya se ha jugado. Obtener una nueva fuente de datos resulta tan simple como usar un paquete de software en los videos de la MLB, pero hay un largo camino por recorrer antes de que sea completamente utilizable.
A estas avanzadas alturas en la historia del béisbol, las posibilidades de selección son escasas. Tenemos velocidad de salida y ángulo de lanzamiento, Carreras Merecidas Creadas (DRC, por sus siglas en inglés) y Porcentaje de Alcanzar una Base (OBP, por sus siglas en inglés) y velocidad de lanzamiento y tasa de giro y todo un glosario de siglas y métricas disponibles para cuantificar cada faceta del béisbol. Pero un aspecto que sigue siendo un territorio inexplorado es la biomecánica. Con esto, me refiero a la posición tridimensional de las extremidades de un jugador, ya que realizan todo tipo de tareas de béisbol: correr, batear, lanzar desde el montículo, lanzar a las bases, etc.
Este tipo de datos ya está disponible para los equipos, ya sea que han sido generados en instalaciones privadas de investigación o recolectados por tecnologías avanzadas como las cámaras Kinatrax que muchos equipos han comprado. De hecho, el nuevo sistema de seguimiento de MLB, HawkEye (Ojo de Halcón), promete suministrar información sobre la posición de la extremidad de cada jugador en tiempo real. Pero es muy poco probable que las fuentes de Kinatrax o HawkEye lleguen al público en corto plazo, lo que nos deja sin una fuente importante de datos que los equipos sí pueden usar para analizar a sus propios jugadores.
Si lo tuviéramos, la información biomecánica podría abrir una perspectiva completamente nueva al béisbol. ¿Alguna vez te has preguntado qué hace que el manejo del bate de Mike Trout sea tan rápido y poderoso? ¿O cómo el movimiento que luce doloroso de Chris Sale logra generar tanta velocidad? (¿Y cómo se las arregló para usarlo durante 1600 entradas de Grandes Ligas antes de que finalmente necesitara la cirugía Tommy John?) El análisis de biomecánica podría responder a estas preguntas traduciendo las observaciones anecdóticas de los busca talentos de los equipos (“movimiento suave”) en datos tangibles y cuantificados.
Gran parte de la tecnología para convertir imágenes de video en datos biomecánicos es de propiedad exclusiva. Pero en los últimos años, ha habido también un progreso increíble en el dominio público. Un avance reciente fue el lanzamiento de un paquete de software llamado OpenPose, que fue desarrollado por investigadores de la Universidad Carnegie Mellon. Afortunadamente para nuestros propósitos, OpenPose es gratuito y fácil de usar.
Una descripción técnica de cómo funciona OpenPose sería larga, no digerible y probablemente aburrida para el lector promedio. En cambio, aquí hay una versión breve y simplificada:
- Primero, la computadora extrae partes de cada imagen que parecen cuerpos humanos.
- Segundo, busca segmentos dentro de esos cuerpos que se asemejan a extremidades, así como ojos, oídos, pies, etc.
- Luego utiliza un modelo entrenado en la identificación de la posición de las extremidades en datos anteriores para trazar dónde la computadora cree que las extremidades están en esta imagen en particular.
(Esta, por necesidad, es una descripción muy simplificada de lo que sucede debajo del capó).
El resultado final de la ingesta de OpenPose y el análisis de algunos videos es algo similar a esto. (Por supuesto, tuve que comenzar con la biomecánica de Mike Trout).
(Sí, es un swing de golf. El recorte de video original está aquí).
Los segmentos de línea de color representan la mejor suposición de la computadora sobre dónde se encuentran las extremidades de Mike Trout dentro de la imagen. Los humanos, con nuestros sistemas de procesamiento visual mucho más potentes, podemos ver que la computadora hace un buen trabajo en general. El seguimiento es delicado, siguiendo sus extremidades a través de un movimiento que es muy similar a un swing de béisbol. Los datos son claros y te permiten calcular características de cosas como el ángulo de swing de Trout en relación con su cuerpo y qué tan rápido se mueven sus brazos. Y procesar estos datos, y las coordenadas que proporciona, fue tan simple como descargar el paquete OpenPose y aplicarlo a una versión descargada del recorte de video.
Pero eso es golf y estamos interesados en el béisbol. Y resulta que el béisbol es un poco más complicado.
Por un momento, la computadora identifica con precisión a Trout. Pero se complica y pierde la pista poco después. Hay mucha más interferencia en este video corto: un fondo lleno de humanos que la computadora también quiere rastrear. Un receptor y un árbitro que a veces la computadora tiene problemas para separar de Trout. Sin embargo, hay suficiente material para sugerir que con un recorte cuidadoso, podríamos echar un vistazo a los datos detrás del swing de Trout.
Los datos que provienen de OpenPose están contaminados. A veces pierden el rastro del bateador y el lanzador. A veces nunca los recoge en absoluto. Otras veces, no puede segmentar la imagen correctamente, produciendo resultados francamente extraños. Aquí, por ejemplo, está la cadera de Mike Trout… unida a la pierna del árbitro. Eso no está bien (y quizás es un poco inquietante también).
Obviamente, si intentara utilizar los datos procedentes de OpenPose de inmediato, sin intentar ajustar las anomalías visuales como ésta, obtendría malos resultados. Si entra basura, sale basura.
Sin embargo, hay una esperanza clara. Porque OpenPose funciona sorprendentemente bien desde el primer momento, sin recorte, personalización o ajuste a un entorno específico de béisbol. Con un poco de ajuste, podríamos obtener información biomecánica utilizable. Y si un fondo visualmente turbio dificulta las labores, hay muchos videos antiguos que son mucho más susceptibles a las habilidades de OpenPose, como esta imagen congelada de Barry Bonds al bate.
Nunca obtendremos la calidad de los datos que una cámara múltiple o una configuración de alta resolución o infrarroja podrían proporcionar. Las transmisiones de TV son limitadas, los fondos son feos y están llenos de fanáticos, y la resolución palidece en comparación con lo que una cámara elegante y costosa podría proporcionar. Pero hay potencial aquí. Con más procesamiento y tiempo para trabajar, sí podríamos obtener un nuevo tipo de datos de esto, tal vez no esté cerca de las imágenes con la que los equipos se deleitan, pero son lo suficientemente buenas como para mantenernos ocupados durante la primera primavera sin béisbol en 25 años.
Thank you for reading
This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.
Subscribe now