
Traducido por Fernando Battaglini
Incluso si usted no ha tomado un curso de estadística, probablemente aprendió estadísticas básicas en la escuela secundaria. Como, por ejemplo: calcular el promedio de un conjunto de números. Si tienes cinco números, los sumas y los divides por cinco.
Esa es la media. El problema es que la media no siempre es útil. Digamos que, por ejemplo; usted vive en un pueblo donde hay cinco personas y cada una gana $50.000 al año. La media en ese pueblo es $50.000. En mi pueblo, también hay cinco personas. Uno gana $100, uno gana $200, uno gana $300, uno gana $400 y uno gana $499.000. La media es $100.000, el doble que en tu ciudad. ¿Significa eso que los residentes de mi ciudad son más ricos? Por supuesto que no.
Ahí es donde la mediana es útil. Ese es el valor medio. Su ciudad tiene un ingreso medio de $50,000. En el mío, son $300. Eso es más descriptivo.
El tercer tipo de promedio, del que todo el mundo se olvida, es la moda. Es el número que ocurre con mayor frecuencia. Digamos que una tienda de vinos tiene 30 clientes en una hora. Siete pasan por los pasillos y se van con las manos vacías. Nueve compran una botella. Siete compran dos, cuatro obtienen tres y uno obtiene cuatro. Un cliente compra una caja y otro cliente compra dos cajas. La media es de 2,5 botellas por cliente. La mediana es uno. La moda es uno. Eso tiene más sentido, ¿verdad? Si le pregunta al propietario cuántas botellas compran sus clientes, el diría: “La mayoría de ellos compró una botella.”
OK, he terminado con las cosas básicas que ya sabías. El punto es: si bien la media y la mediana suelen ser las medidas estadísticas más útiles del promedio, hay momentos en que la moda funciona mejor.
***
Retrosheet es una herramienta absolutamente invaluable. Empodera muchos de los sitios de datos de béisbol disponibles públicamente, es mantenida al 100% por voluntarios y toda la información disponible es gratuita. Es asombroso, Retrosheet ha catalogado datos de juegos que se remontan a 1871 y play-by-plays que se remontan a 1918. No está completo en todos los casos, pero es lo mejor que tenemos y es de dominio público. Una herramienta maravillosa, maravillosa.
Para cualquier temporada, usted puede descargar registros de cada juego. Esto es lo que obtuve de 161 columnas de datos de Retrosheet de la temporada 2021.
***
El punto de ese preámbulo es que este es un buen ejemplo de cuándo la moda es útil. Hubo 4,53 carreras por equipo por juego en 2021. Pero como todos los promedios, eso se debe a valores atípicos en el lado alto. Hay juegos en los que los equipos anotaron 10 carreras más que el promedio y no hay juegos en los que los equipos anotaron 10 carreras menos que el promedio. ¿Qué sucedió con más frecuencia?
Anotaciones: Hubo 4,53 carreras por equipo por juego. La puntuación media de los visitantes fue de 4,46 carreras. La puntuación media de los locales fue de 4,61 carreras. Las puntuaciones medias fueron cuatro carreras para cada uno. ¿Pero sabes qué puntaje ocurrió más?
Fue Local 4, Visitantes 3. Hubo 78 juegos con esa combinación exacta, superando por poco 76 ocurrencias de Local 3, Visitantes 2. Local 5 y Visitantes 4, estuvo bastante por detrás, con 60. El puntaje modal para cada equipo fue de cuatro carreras, lo que ocurrió 355 veces para los visitantes y 332 veces para los locales, pero un final de 4-3 a favor de los locales fue lo más común. Completando el top 10 estaban:
- Locales 6, Visitantes 5: 59 veces
- Visitantes 3, Locales 2: 54 veces
- Locales 5, Visitantes 3: 53 veces
- Locales 2, Visitantes 1: 52 veces
- Visitantes 4, Locales 3: 47 veces
- Locales 3, Visitantes 1: 46 veces
- Locales 4, Visitantes 2: 42 veces
Si está buscando el puntaje final más común, independientemente de qué lado ganó, fue 3-2, que ocurrió 130 veces. Hubo 125 juegos de 4-3 y 98 juegos de 5-4.
Box score. Estos son los valores medios de los partidos de la última temporada.
Bateadores | Visitante | Local |
AB | 34,1 | 32,4 |
C | 4,5 | 4,6 |
H | 8,2 | 8,1 |
2B | 1,6 | 1,6 |
HR | 1,2 | 1,2 |
RBI | 4,2 | 4,4 |
BB | 3,2 | 3,3 |
K | 9,0 | 8,4 |
Dejados en base | 6,7 | 6,7 |
Lanzadores usados | 4,3 | 4,5 |
Carreras permitidas | 4,2 | 4,1 |
PO | 25,6 | 27,1 |
A | 8,4 | 9,0 |
E | 0,5 | 0,5 |
DP | 0,8 | 0,8 |
Recuerde que el equipo local no siempre batea en el noveno (o, en las dobles carteleras de 2021, en el séptimo) y es posible que no obtenga los tres outs en entradas adicionales. Por eso los visitantes tienen más turnos al bate y el equipo local tiene más outs.
Aquí están los valores modales, los resultados más comunes.
Bateadores | Visitante | Local |
AB | 34 | 33 |
C | 3 | 3 |
H | 7 | 8 |
2B | 1 | 1 |
HR | 1 | 1 |
RBI | 2 | 3 |
BB | 3 | 3 |
K | 8 | 7 |
Dejados en base | 6 | 7 |
Lanzadores usados | 4 | 4 |
Carreras permitidas | 3 | 3 |
PO | 24 | 27 |
A | 8 | 8 |
E | 0 | 0 |
DP | 0 | 0 |
Creo que la diferencia más interesante aquí son los ponches. Los equipos locales suelen hacerlo con menos frecuencia que los equipos visitantes. Eso simplemente no es un artefacto de que los visitantes tengan más outs; los equipos locales se poncharon en el 22,8 por ciento de las apariciones en el plato en comparación con el 23,5 por ciento de los equipos visitantes. Apuesto a que la familiaridad con el estadio de béisbol en lo que respecta a la visibilidad juega un papel allí.
Tiempo de Juego. La media fue de tres horas, once minutos. El juego más largo del año fue Dodgers contra Padres, 25 de agosto: Los Ángeles 5, San Diego 3, 17 entradas, 5:49. El más corto fue el primer juego de la doble cartelera Rangers-Blue Jays el 18 de julio en Buffalo: Toronto 5, Texas 0, 1:48. La mediana elimina los valores atípicos: 3:09. La duración más común del juego, que ocurrió 54 veces, fue de 3:02, nueve minutos menos que la media.
Alineaciones. Retrosheet incluye alineaciones iniciales para cada equipo, enumerando tanto el nombre del jugador como su posición. Dado que las posiciones son numéricas, podemos usar el modo para averiguar qué posición batea con mayor frecuencia en cada lugar de la alineación. Debido al DH, tenemos que dividir las alineaciones modales entre los juegos que se juegan en los parques de la Liga Nacional y los que se juegan en los parques de la Liga Americana. Aquí las dos posiciones que aparecen con más frecuencia en cada posición de la alineación.
Estadios LN | Visitante | Local |
1 | 2B, CF | 2B, CF |
2 | 1B, SS | 1B, SS |
3 | RF, 1B | RF, 1B |
4 | 1B, 3B | 1B, 3B |
5 | 3B, LF | 3B, C |
6 | 3B, LF | 3B, LF |
7 | C, CF | C, CF |
8 | C, CF | C, CF |
9 | P, CF | P, CF |
Estadios LA | Visitante | Local |
1 | 2B, CF | 2B, CF |
2 | SS, DH | 1B, SS |
3 | 1B, DH | 1B, 3B |
4 | DH, 1B | DH, 1B |
5 | 1B, 3B | 1B, DH |
6 | RF, LF | RF, C |
7 | LF, CF | C, RF |
8 | C, CF | C, CF |
9 | C, SS | C, SS |
Casi no hubo diferencia entre las alineaciones locales y visitantes más comunes en los estadios de la Liga Nacional. La única variación leve fue que los equipos visitantes colocaron al tercera base quinto 221 veces, al jardinero izquierdo 200, al primera base 166, al receptor 165. En casa, el desglose fue 3B 233, C 202, 2B 178, LF 161. Eso no es mucha variación.
Hubo algunas diferencias en los parques de la Liga Americana, y no puedo explicarlas. Los visitantes batieron a su campo corto segundo 192 veces y su bateador designado 179. Los equipos locales colocaron al primera base en el segundo lugar de la alineación 195 veces y al campo corto 182 veces. A los managers les gustaba que sus primera base batearan en tercera o quinta, pero su segunda opción en el tercer lugar era su tercera base en casa y su designado en la carretera. Su segunda opción se invirtió en el quinto lugar. Los bateadores número 7 solían ser jardineros izquierdos, jardineros centrales y receptores, jardineros derechos y tercera base, en ese orden, en la carretera. En casa, fueron con mayor frecuencia los receptores, los jardineros derechos, los jardineros centrales y los jardineros izquierdos, en ese orden. Como dije, no sé por qué.
La alineación de equipo visitante más frecuente en la Liga Nacional fue CF, SS, RF, 1B, LF, 3B, 2B, C, P. Eso ocurrió once veces, nueve por los Nacionales y dos por los Mets. La alineación más frecuente del equipo local de la Liga Nacional fue RF, 1B, LF, 2B, 3B, SS, C, CF, P, ocurriendo en 10 juegos de Atlanta cuando el club tenía activos a Marcell Ozuna y Ronald Acuña Jr. En la Liga Americana, las alineaciones locales y visitantes más frecuentes fueron idénticas: 2B, LF, 3B, DH, 1B, SS, RF, CF, C. Las tarjetas de alineación de Houston de Dusty Baker enumeraron ese orden 10 veces en casa y siete veces en la carretera en parques de la Liga Americana.
Anotación por Inning. A veces, la moda nos da información interesante. A veces no.
Visitante | Local | |||
Inning | Media de carreras | Moda de carreras | Media de carreras | Moda de carreras |
1 | 0,46 | 0 | 0,57 | 0 |
2 | 0,45 | 0 | 0,48 | 0 |
3 | 0,52 | 0 | 0,65 | 0 |
4 | 0,53 | 0 | 0,62 | 0 |
5 | 0,57 | 0 | 0,57 | 0 |
6 | 0,55 | 0 | 0,61 | 0 |
7 | 0,52 | 0 | 0,54 | 0 |
8 | 0,46 | 0 | 0,53 | 0 |
9 | 0,48 | 0 | 0,41 | 0 |
1-3 | 1,44 | 0 | 1,69 | 0 |
4-6 | 1,65 | 0 | 1,80 | 0 |
7-9 | 1,39 | 0 | 1,23 | 0 |
La diferencia entre la distribución entrada por entrada de carreras medias para los equipos locales y visitantes es interesante. El hecho de que la puntuación más común en una entrada sea cero no lo es.
Thank you for reading
This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.
Subscribe now