Traducido por José M. Hernández Lagunes
Es época de contrataciones en la MLB. Si tu sueño es trabajar en una oficina de la MLB, ¿puedo sugerirte que actualices tu currículum esta tarde? En octubre es cuando salen todos los anuncios de “se busca ayuda” en el departamento donde ocurre la diversión. Los equipos de la MLB son organizaciones que emplean a contadores, guardias de seguridad, profesionales de recursos humanos, fontaneros y… odio romper tu ilusión, pero hay una persona real en esa botarga. Pero mi suposición es que tú, lector de Baseball Prospectus, quieres trabajar en Operaciones de Béisbol. Y como estás leyendo al fulano que escribe sobre #GoryMath, probablemente quieras trabajar en la Caverna de Estadísticas.
Incluso si no estás buscando trabajo, vale la pena leer algunos de esos anuncios, porque nos dicen cosas acerca de lo que se ha convertido de la analítica en la MLB y las gerencias en general. Por un lado, al leer esos anuncios para preparar este artículo, encontré que más de 20 equipos anunciaban una vacante para algo que podría considerarse un puesto “analítico”. Esta es la primera pista de cómo se ha desarrollado la analítica en los despachos en la última década.
No todos los puestos de trabajo que se van a ocupar en la temporada invernal se van a anunciar ampliamente. En los próximos meses se contratarán algunos nuevos gerentes generales, y esos trabajos no van a aparecer en la página de TeamWork. El puesto de mayor rango que vi fue que los Tigers esperan contratar a un Director de Infraestructura de Datos de Béisbol. (En algo que nunca he visto antes, los Reds publicaron que están buscando un Director de Desarrollo de Jugadores, así que si siempre has querido probarte en ese rubro, éntrale). Pero sí tenemos algunos anuncios disponibles públicamente para puestos de trabajo de nivel inferior, y si los leemos con atención, podemos aprender algunas cosas interesantes sobre el juego, las gerencias y el movimiento Sabermétrico.
Se puede aprender mucho con sólo leer los clasificados.
***
La “analítica” es, en gran parte, manejo de datos
Muchos de ustedes, lectores, estarán familiarizados con la Ley de Moore, la idea de que el número de transistores que pueden colocarse en un chip semiconductor se duplica cada dos años. La ley lleva el nombre de Gordon Moore, cofundador de Intel, y en realidad describe bastante bien la evolución de los microchips en las últimas décadas. Se debate si esta “ley” puede mantenerse o no, si hay un límite físico a la cantidad de transistores que realmente pueden bailar en la cabeza de un alfiler o, lo que es más importante, si el modelo puede sostenerse económicamente. Para los que disfrutamos de los frutos de esa ley, con chips cada vez más rápidos y potentes para alimentar nuestros aparatos, puede parecer que este crecimiento exponencial se produce por sí solo, pero es un resultado de… ya sabes, científicos inteligentes con batas de laboratorio y microscopios o cualquier material visual de archivo que hayan obtenido. La realidad es que el costo de esa duplicación aumenta cada vez, tanto en los costes de I+D para encontrar nuevas formas de hacer transistores más pequeños como en las técnicas necesarias para fabricarlos.
Si hay algo que salta a la vista al leer los anuncios, es que muchos de los puestos son para ingenieros de datos, cuyas descripciones de trabajo se centran en la adquisición y el almacenamiento de datos. Es lógico. La MLB ha invertido mucho en infraestructura de datos, empezando por StatCast y ahora entrando en la nueva era de FieldVision. Hay un montón de 1’s y 0’s que hay que analizar.
Creo que todavía queda la idea romántica de los viejos tiempos de la analítica del béisbol como un esfuerzo creativo—que la mayoría son personas quienes se sientan a intercambiar ideas y luego hacen algunas regresiones para ver si funcionan. Que el esfuerzo para probar o refutar una hipótesis es mínimo. Y en su día, puede que lo fuera. Pensar en algunos de los primeros avances de la Sabermetría, cosas como el documento original de DIPS o apreciar la importancia del OBP en lugar del promedio de bateo, requería poco más que el acceso a las estadísticas de nivel estacional que estaban ampliamente disponibles y algunas habilidades rudimentarias en Excel. El asunto del OBP consistía sobre todo en preguntarse “¿por qué pretendemos que las bases por bolas nunca ocurrieron?”.
Luego vinieron otras fuentes de datos que estaban disponibles públicamente, incluyendo los archivos de cada juego de Retrosheet o los archivos PitchF/X que se publicaron erróneamente. Requerían mucho espacio en el disco duro y un poco más de experiencia técnica para trabajar con ellos, pero tenían sus secretos, y había mucha gente que tenía el conocimiento para encontrarlos. La MLB publica algunos datos (pero no todos) del sistema StatCast, pero la información completa de StatCast de un solo partido abrumaría a la mayoría de los analistas ocasionales. Sólo Dios sabe cómo son los conjuntos de datos de FieldVision.
De vez en cuando, alguien escribe el artículo siempre divertido de leer en retrospectiva “ya no hay nada más que descubrir sobre el béisbol”. Hay mucho más por descubrir sobre el béisbol. Puede que no haya mucho más por descubrir que pueda ser descubierto con el mismo nivel de esfuerzo que hace 15 años. Puede que hayamos aprendido la mayor parte de lo que podemos aprender de los archivos de Retrosheet (aunque haré todo lo posible para demostrar que eso es falso…) pero pensar que se tiene el béisbol todo resuelto es el error fundamental del juego.
Creo que hemos estado operando en la Sabermetría con la misma suposición que la Ley de Moore, que de alguna manera, el conocimiento Sabermétrico se expandiría mágicamente de manera exponencial. No dudo que podría, pero los costes de I+D de todo ello son mucho más altos ahora, hasta el punto de que sólo los equipos pueden realmente justificarlos. Y necesitan un pequeño equipo de personas sólo para gestionar la alimentación de datos. Hay un cambio cultural que va unido a esto, y a algunos de ustedes que han estado leyendo esta publicación durante una década o más puede que no les guste. La analítica del béisbol solía—y quizás aún lo hace—enorgullecerse de ser un campo abierto lleno de “forasteros”. Cuando todo esto empezó, había personas sin experiencia formal en el béisbol que proporcionaban a los equipos de la MLB conocimientos que antes no tenían. Ahora vivimos en un ecosistema en el que los datos que podrían impulsar los próximos descubrimientos no son públicos, ni tampoco muchas de las personas que podrían hacerlos. Hemos sido testigos de la lenta erosión de la democratización en la investigación sobre béisbol.
Hace más o menos una década, los escritores de Sabermetría se jactaban cada vez que la analítica llegaba “adentro de la bestia” y anhelaban que llegara el día en que fuéramos totalmente bienvenidos en su interior. Pues bien, lo conseguimos. Ahora, me pregunto cuánto volverá a salir.
***
La difusión y el monitoreo son tan importantes como el descubrimiento
Incluso entre los puestos de trabajo que están señalados como de “Analista” y que no son obviamente trabajos de gestión de datos, te darás cuenta de que muchos equipos están buscando candidatos que tengan experiencia en desarrollo web. Por supuesto, los equipos esperan que sus candidatos tengan algunas habilidades en el análisis de datos, pero el análisis de datos sólo te llevará hasta cierto punto.
Te invito a que consideres el encuadre de lanzamientos. Sí, es importante, pero el discurso público sobre el encuadre no siempre refleja la forma en que los equipos ven el asunto. Una vez que el genio del encuadre de los lanzamientos salió de la botella, los equipos reaccionaron con bastante rapidez y empezaron a incorporar esa habilidad en la forma de calificar a los receptores, hasta el punto de que la mayor parte del jugo se ha exprimido de esa naranja. Públicamente, el encuadre se convirtió en parte del WARP, y tenemos tablas de clasificación de encuadre para decirnos quién es un buen y un mal receptor en este rubro. Eso es lo más lejos que la mayoría de los aficionados llegan con esos datos. “¡Pedrito es un horrible encuadrador! Deberíamos conseguir a alguien mejor”.
Tu equipo favorito sabe que Pedrito es un mal encuadrador. Pueden leer una tabla de clasificación, pero también los otros 29 equipos. No hay que empeñar a Pedrito con algún tonto desprevenido que no está con los tiempos. E incluso si un equipo quisiera hacer un cambio en la receptoría, no es frecuente tener la oportunidad de hacer ese tipo de intercambio. Un equipo hará ese intercambio si está disponible, pero te quedas quieto si sólo esperas a que ese intercambio se materialice.
Tu equipo favorito sabe que Smith es un mal encuadrador. Pueden leer una tabla de clasificación, pero también los otros 29 equipos. No hay que empeñar a Smith en algún tonto desprevenido que no está con los tiempos. E incluso si un equipo quisiera hacer un cambio en el puesto de receptor, no es frecuente tener la oportunidad de hacer ese tipo de intercambio. Un equipo hará ese trato si está ahí, pero te quedas quieto si sólo esperas a que ese trato se materialice.
El mejor uso de esos datos de encuadre y del tiempo de un analista, el que proporcionará más valor al equipo, podría ser ayudar a Pedrito en qué trabajar para mejorar el encuadre. Arreglar los jugadores que tienes es una mejor estrategia que buscar nuevos jugadores. A veces no tienes otras opciones. Eso requiere que vayamos más allá de “el encuadre es importante” y “Pedrito es malo en el encuadre” y lleguemos a “Pedrito necesita ayuda con el encuadre de los lanzamientos en el borde exterior contra bateadores diestros”. Pero para llegar a ese punto, hay que ser capaz de averiguar dónde están los problemas de Pedrito, y ser capaz de mostrárselo a Pedrito y al instructor de receptores de una manera que tenga sentido para ellos. También hay que idear una forma de controlar el progreso de Pedrito. Para ello, hay que tomar los datos y crear algo que sea fácil de digerir y luego hacer que los datos se comuniquen con esa aplicación.
El mejor departamento de análisis puede no ser el que descubra la próxima gran ineficiencia. Es el que puede comunicar cien pequeñas ineficiencias a las personas que necesitan verlas.
***
Concluyo el martes en la segunda entrega.
Thank you for reading
This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.
Subscribe now