keyboard_arrow_uptop
Image credit: Erik Williams-USA TODAY Sports

Traducido por Pepe Latorre

Aunque no estudies estadística, algo te enseñan en el colegio. O quizás en la universidad. Calcular la media y cosas por el estilo. Si tienes cinco números, te dicen, los sumas y luego lo divides entre cinco.

A eso lo llaman promedio. El problema es que el promedio no siempre es útil. Imagina que vives en una ciudad habitada por cinco personas. Imagina que cada una de ellas gana 50.000 dólares. El sueldo medio sería de 50.000 dólares. En mi ciudad viven también cinco personas. Una gana 100 dólares, otra 200, otra 300, otra 400 y la última 499.000. La media es 100.000, el doble de lo que se gana en tu ciudad. ¿Significa eso que somos más ricos en mi ciudad? Por supuesto que no.

Es entonces cuando la mediana toma importancia. Es el valor de en medio. En tu ciudad la mediana es 50.000. En la mía es 300. Eso es bastante más descriptivo.

La tercera estadística de la media, esa de la que nadie se preocupa, es la moda. Es la magnitud que más se repite. Imaginemos una clase con 30 alumnos. Hay siete que pasan el invierno sin resfriarse. Nueve se resfrían una vez. Hay once que tienen un resfriado dos veces. Hay uno que se refría tres veces y dos que lo hacen hasta en cuatro ocasiones. La media es 1.4. La mediana es 1 y la moda 2. ¿Se entiende? Esto quiere decir que si le preguntas al profesor cuántas veces se han puesto malos los chavales de su clase te dirá que la mayoría lo ha hecho dos veces.

Ya hemos repasado lo básico. Lo que ya sabías. Lo que quiero hacer ver es que, aunque en ocasiones la media y la mediana sean las estadísticas más utilizadas, la moda es mucho más útil.

***

Retrosheet es una herramienta de valor incalculable. Nutre a muchas webs de béisbol Está hecha por voluntarios y es gratis. Es asombrosa. Te da información sobre partidos que se jugaron en 1871 y sobre jugadas que acontecieron en 1918. No se puede decir que sea perfecta, pero es lo mejor que tenemos y es de dominio público. ¡Una herramienta maravillosa!

Puedes descargar todas las estadísticas de cada uno de los partidos disputados en una temporada. Hace poco se han publicado los de 2019. 161 columnas para cada uno de los 2.429 partidos. Y yo he profundizado en el asunto.

***

Llevó más de 400 palabras de introducción para lo que viene a continuación. La media de carreras anotadas por juego fue de 4.83. Pero como sucede en todos los promedios esto se debe a valores registrados en el lado alto.  Hubo juegos en los que un equipo anotó hasta 10 carreras por encima de la media. Nunca se produjo que un equipo anotara 10 carreras menos que la media. ¿Qué sucedió con más frecuencia?

Anotación: Hubo 4.83 carreras por juego, ¿pero adivina cuál fue la anotación más común?

La media de los visitantes fue de 4.84. La de los locales de 4.82. Seguramente adivinar que la mediana fue de 4 carreras para cada equipo. ¿Pero sabes qué resultado se dio más?

El 4-3 a favor del equipo local. Hubo 347 ocasiones en las que el equipo de casa anotó cuatro carreras. Y 73 en las que el resultado final fue 4-3. Lo segundo más habitual fue el 3-2, en 65 ocasiones. El 5-4 aconteció 64 veces.

Box score. Estadísticas promedio para los partidos disputados la temporada pasada.

Batter             Visitor             Home

AB       R         H         3B       HR       RBI      BB       K         LOB    Lanzadores utilizados          Carreras permitidas      PO       A         E          DP

Bateador Visita Local
AB 35.1 33.5
C 4.8 4.8
H 8.8 8.5
2B 1.8 1.7
HR 1.4 1.4
CI 4.6 4.6
BB 3.2 3.3
K 9.2 8.5
LOB 6.8 6.7
Lanzadores utilizados 4.3 4.5
Carreras permitidas 4.5 4.5
PO 26.1 27.6
A 8.8 9.3
E 0.6 0.6
DP 0.8 0.9

Nota: Recuerda que el equipo local no siempre batea en la novena entrada. Por eso los visitantes tienen más AB y los de casa más eliminados.

Aquí la moda de los valores, los resultados más comunes.

Bateador Visita Local
AB 34 33
C 3 4
H 7 8
2B 1 1
HR 1 1
CI 3 4
BB 2 2
K 10 7
LOB 6 6
Lanzadores utilizados 4 4
Carreras permitidas 4 3
PO 24 27
A 9 8
E 0 0
DP 0 0

El lunes 6 de mayo los Orioles recibieron a los Red Sox. Baltimore anotó cuatro carreras con ocho hits (cuadrangular y doble incluidos). Consiguieron dos boletos y se poncharon en siete ocasiones. Fue la producción más modal de toda la temporada (y aunque esperes que diga que perdieron 4-1 ganaron 11-4).

Duración de los juegos. La media fue de 3:10 horas. Eso incluye juegos anormalmente cortos (el Blue Jays-White Sox del 18 de mayo terminó 4-1 después de cuatro entradas y medias) y otros muy largos (el St. Louis vs Arizona del 24 de septiembre terminó 3-2 después de 19 innings y 6:53 horas). La moda ignora los valores atípicos. Lo que más se repitió en 2019 fueron los juegos cuya duración fue de 3:07, es decir, 179 segundos menos que la media (modo sarcasmo encendido).

Alineaciones. Esto es divertido. Retrosheet incluye alineaciones para cada equipo, enumerando tanto el nombre del jugador como su posición. Desde que las posiciones son numéricas podemos usar esto para averiguar qué posición batea con más frecuencia en cada lugar de la alineación. Lo separaré por estadios de la Liga Americana (regla DH en vigor) y de la Nacional. Y enumeraré las dos posiciones que aparecen con más frecuencia en cada posición de la alineación.

Estadios NL Visitante Local
1 JC, CC JC, CC
2 JD, 1B JD, 1B
3 3B, 1B 3B, 1B
4 1B, JI 1B, JI
5 R, 1B JD, R
6 2B, JC 2B, JI
7 CC, 2B CC, 2B
8 R, JC R, JC
9 L, JC L, JC
Estadios AL Visitante Local
1 CC, JC CC, JC
2 CC, JD CC, JI
3 BD, 1B BD, 1B
4 BD, 1B BD, 1B
5 1B, DH 3B, 1B
6 1B, 2B 3B, 1B
7 2B, C 2B, 1B
8 R, 2B R, 2B
9 R, JC R, JC

Por supuesto que es fácil extender las variaciones entre ligas. Los campocortos de la Liga Americana lideran bastante las alineaciones gracias a Marcus Semien y Francisco Lindor, entre otros. Los jardineros centrales lideran en la Liga Nacional gracias a Ronald Acuña Jr. y Lorenzo Cain. Pero, por qué el orden de bateo cambia entre los equipos locales y los equipos visitantes. La suposición (ciertamente vaga) es que es por los juegos de interliga.

Anotación por entrada. A veces la moda nos da datos interesantes, otras no.

Visitante Local
Entrada  Carreras promedio Carreras según la moda Carreras promedios Carreras según la moda
1 0.55 0 0.61 0
2 0.47 0 0.51 0
3 0.56 0 0.57 0
4 0.51 0 0.56 0
5 0.52 0 0.59 0
6 0.55 0 0.58 0
7 0.52 0 0.57 0
8 0.55 0 0.51 0
9 0.51 0 0.44 0
1-3 1.58 0 1.69 0
4-6 1.57 0 1.73 0
7-9 1.58 0 1.33 0

La diferencia de carreras anotadas por entrada entre locales y visitantes es interesante. Sin embargo, no lo es el hecho de que la anotación más común sea cero.

Thank you for reading

This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.

Subscribe now
You need to be logged in to comment. Login or Subscribe