Traducido por Carlos Pérez
Revisemos uno de los experimentos teóricos más famosos: el escarabajo en la caja de Wittegnstein. El experimento dice: suponga que todo el mundo tiene una caja, y dentro de ella, hay un escarabajo. Aquí está el asunto, usted puede mirar dentro de su propia caja, pero no puede mirar lo que hay en la caja de los demás. Así que, ¿cómo sabe si cuando una persona dice “escarabajo” están refiriéndose al mismo objeto que hay en su caja?
Al fin y al cabo, podrían hablar sobre el insecto, o el villano de Spider-Man, o el grupo británico de pop. Pero usted no sabe eso. Usted sólo (puede) saber a lo que usted llama escarabajo. Esto es lo que Wittgenstein llamó lenguaje privado, y terminó formulando que lo que es importante no es el contenido de la caja sino cómo las personas usan los contenidos para comunicarse con otros. El contexto está basado en el entendimiento de uno propio. Por eso los grados de dolor, emoción, o la percepción de los colores son experiencias únicas.
Cuando se trata de descifrar un idioma, el entendimiento se convierte en un juego complicado. Es crucial que seamos capaces de descifrar ciertos elementos, como señales de tráfico o señas en béisbol, o poner nuestras ideas en orden para generar más información. Las definiciones, en este aspecto, son muy importantes, ya que contienen información relevante sobre cómo deberíamos interpretar palabras.
Ok, pero ¿qué tiene que ver esto con el béisbol? Bueno, tiene que ver con el lenguaje y el entendimiento.
Recientemente, Jonathan Judge publicó un artículo sobre “estadísticas esperadas” o xStats. No repetiré los detalles, pero me quiero enfocar en una cosa que fue mencionada pero que se perdió en el debate siguiente. La clave para entender ambas partes del debate de xStats reside en cómo MLB Advanced Media y la comunidad de analítica de béisbol interpretan la palabra esperado.
Del artículo de Judge:
Estos extractos asumen que nuevas métricas como “Promedio de Bateo esperado” (xBA) y “Promedio de Embasado ponderado esperado” (xwOBA) ofrecen nuevas y únicas conclusiones sobre el verdadero rendimiento del jugador.
Para MLBAM, de acuerdo con las definiciones de xBA y xwOBA, esperado deber ser interpretado como lo que un jugador debería hacer dadas circunstancias neutrales. Sin embargo, muchos han escogido interpretarlo como lo que un jugador debería hacer el resto de la temporada.
Ambas son formas válidas de interpretar la palabra, pero ha habido una malinterpretación sobre la intención inicial de lo que las xStats están tratando de hacer. Nadie tiene la culpa de cómo entendemos la palabra esperado – ambas interpretaciones son válidas bajo esta definición. Pero hay una diferencia sutil y darse cuenta de esto nos puede llevar a mejores definiciones de lo que cualquier (nueva) estadística debería medir.
Si la x en xStats estuviera definida con más acierto, quizás nunca habríamos recibido la crítica de Judge (aunque seríamos afortunados de tenerla). El problema no es la definición. Si MLBAM pusiera más atención en las muchas interpretaciones de esperado, proporcionando una definición más apropiada y menos ambigua, no habría ninguna confusión entre los usuarios de xStats. Además, habría eliminado probablemente cualquier intento de gimnasia mental que trata de circunvalar el significado real que MLBAM estaba tratando de dar.
De nuevo, tratar de tener en cuenta cómo usa todo el mundo la palabra esperado es una tarea imposible. Volviendo al argumento del Lenguaje Privado, podemos asignar significados, ideas, o conceptos a las palabras que usamos, pero solo nosotros conocemos nuestros conceptos, cualquier otra persona tendrá sus propios conceptos unidos a las mismas palabras, (probablemente) ignorando aquellas que usted ha unido. En otras palabras, nadie sabe realmente lo que la otra persona quiere decir salvo que lo escriba explícitamente – e incluso eso está sujeto a la interpretación.
Quizá el concepto colectivo de esperado sí incluye la definición usada por MLBAM. Quizá la definición ofrecida por MLBAM no trataba de incluir el significado de predictivo, y aun así escogemos ignorarlo ya que falla a la hora de igualar la narrativa que tratamos de generar. El lenguaje privado de MLBAM no estaba sincronizado con el lenguaje común de la comunidad de analíticas.
En otras palabras, la interpretación de esperado como lo que debería haber ocurrido no estaba incluida en el lenguaje común usado por la comunidad de analíticas. En lugar de eso, el uso común de esperado está más asociado con estadísticas predictivas. Esto, de hecho, lleva a otra clave y a una pregunta muy importante: ¿qué queremos decir con predictivo?
Cada año, antes de que la temporada comience, escuchamos que PECOTA proyecta que los Rays serán buenos. Steamer predice que Mike Trout tendrá otra temporada increíble. Las apuestas de Las Vegas estiman que los Dodgers estarán por encima o por debajo de las 95.5 victorias. En estos casos, hemos usado proyectar, predecir, y estimar, de manera intercambiable. ¿Pero son intercambiables en realidad?
Le daré dos definiciones: primero, de acuerdo a Harry Pavlidis, una predicción sería algo cercano a lo que usted cree que pasará aquí -el resultado esperado– y una proyección es más una estimación probabilística alcanzada sistemáticamente que es explícitamente eso – o la probabilidad de que el suceso esperado suceda.
Hasta ahí, bien. Pero no ofrece claridad sobre si esperada es la palabra adecuada para usar en el contexto de las xStats.
La segunda de las definiciones, de acuerdo al diccionario Oxford, dice que el verbo predecir significa decir o estimar que (algo específico) sucederá en el futuro o que será una consecuencia de algo -ergo esperado. Una proyección, sin embargo, es una estimación o previsión de una situación futura basada en un estudio de las tendencias actuales – en otras palabras, un análisis que nos da confianza sobre cuál es el resultado más probable.
Esto es lo más cercano a lo que estamos buscando. Usando la palabra esperado, estamos prediciendo que un resultado sucederá-de acuerdo con la pregunta inicial de Judge. Parecería que usando esperado, salvo que estemos deliberadamente tratando de predecir un resultado futuro, es la palabra incorrecta para usar en xStats ya que, por definición, MLBAM xStats mira qué resultados deberían ser y no lo que serán de aquí en adelante. No tratan de predecir.
Así que Pavlidis no estaba tan alejado en sus definiciones. Pero intercambiar predecir y proyectar está mal. Parecen ser lo mismo -ciertamente los usamos así- pero no lo son. Esto quizás se debe a que usamos predecir cuando hablamos sobre estadísticas predictivas. Quizá deberíamos hablar más de estadísticas proyectivas -pero dejaré ese debate a la Asociación Estadística Americana y otras sociedades.
***
El lenguaje es una cosa complicada. Puede llevar a un debate creciente causado por malinterpretar o puede llevar a varios grados de comedia. Pero siempre es importante entender cómo se usa – su propósito. Si vamos a profundizar en de béisbol, debemos llegar a un consenso de lo que significan palabras simples como esperar, proyectar y predecir, y quedarnos con esas definiciones, para evitar así cualquier confusión sobre lo que estamos tratando de lograr.
Citando a Heidegger: “Lo que queda sin ser dicho es más importante que lo que se dice”. Discrepo respetuosamente, en este caso, con el Doktor Heidegger, ya que decir explícitamente lo que queremos decir y lo que deberíamos querer decir es más importante para evitar futuras confusiones.
Thank you for reading
This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.
Subscribe now