La predicción de resultados en el fútbol, y en el deporte en general, es una industria multimillonaria. Algunos estimados ponderan que alcanzará $125 mil millones de USD en el año 2022. Pero aún en la oficina, con los amigos o la familia, las copas del mundo se viven con adicional emoción por ver quien acierta los resultados de cada partido. Para armar la secuencia de predicciones, cada uno toma la que sabe de cada equipo, lo que recuerda de su desempeño, quienes son sus jugadores, y cuales son sus fortalezas y debilidades. Al final, el resultado es un ensamble de los criterios subjetivos de quien hace la predicción, casi equivalente a tirar una moneda al aire.
Todo esto puede mejorarse notablemente si sabe utilizar las matemáticas y los datos. Una de las técnicas más adecuadas para esto tiene a su base una brillante fórmula de casi tres siglos de antigüedad:
P(H|E) = P(E|H) P(H) / P(E)
Esta trascendental ecuación es el fruto de las ideas de un presbítero llamado Thomas Bayes, nacido a principios del siglo XVIII en el Reino Unido. Escribió sobre teología y matemáticas, y al final de su vida tomó especial interés en la probabilidad condicional; el estudio riguroso para descifrar cómo las causas influyen en la probabilidad de observar sus efectos y viceversa. El teorema puede resumirse así: es el grado de confianza (P) en una hipótesis (H) a medida que se acumula evidencia (E). Si la evidencia es consistente con la hipótesis, mi confianza debe aumentar. Si no, debe bajar.
Lo primero que debe hacer es decidir cuales son los factores que determinan el desempeño de un equipo y cuantificarlos. Por ejemplo, el ranking del equipo según la FIFA, el número juegos ganados, perdidos o empatados en las últimos años, su ranking en los juegos clasificatorios o incluso datos como la edad, estatura, o peso de sus jugadores. Adicionalmente características del movimiento de cada jugador pueden cuantificarse, por ejemplo la cantidad de asistencias, la cantidad de goles o tarjetas obtenidas en los últimos juegos. Una vez se han decidido todas las características, se echa un vistazo a las estadísticas para determinar las probabilidades que se han de utilizar con la ecuación de Bayes.
Como ejemplo, si uno de los factores que usted ha escogido como medida de desempeño es la distancia promedio de sus tiros que terminan en gol, examinar la estadística histórica le revelará que la probabilidad de que un tiro fuera del área chica termine en el fondo de la red, es solo de 3 %.
Sacadas todas las probabilidades, puede entonces construir una red de dependencias. Hay factores que están intrínsecamente relacionados, como la probabilidad de asistencias con la probabilidad de un tiro, y a su vez las probabilidades de un tiro con la probabilidad de un gol. Otra interdependencia puede ser el peso de sus jugadores laterales con las probabilidades de un centro. Las estaturas de delanteros y defensores contrarios ejercen influencia sobre la probabilidad de cabeceos y a su vez influyen la probabilidad de las anotaciones con la cabeza. En esa red de interdependencias, cada nodo es un cálculo, y ese cálculo es la ecuación de Bayes, que toma probabilidades y produce otras probabilidades. A su vez, esas nuevas probabilidades son las entradas para los siguientes nodos de la red. De ahí su nombre: redes bayesianas.
Aunque la teoría sobre redes bayesianas tiene décadas, no había sido práctico implementarlas sino hasta principios de los años 90, cuando las computadoras fueron lo suficientemente poderosas para procesar grandes cantidades de datos. Las primeras aplicaciones fueron científicas, luego para industrias comerciales como las finanzas, marketing, transporte o logística. Desde la última década, con las redes sociales, se usa en la predicción de decisiones humanas. Solo en los últimos años se comenzó a utilizar en el deporte.
El Dr Martin Neil, profesor de ciencias computacionales y estadística en la Universidad de Londres, ha construido modelos para la predicción de resultados deportivos utilizando complejas redes bayesianas como parte de sus investigaciones. Con ello, ha sobrepasado notablemente el desempeño de los corredores de apuestas, llegando a eficiencias de hasta el 80 % en sus predicciones. Su trabajo es ahora utilizado por empresas, equipos y analistas en todos los ámbitos deportivos.
Si su quiniela en la oficina está sufriendo por los inesperados resultados de este mundial, recuerde que la suerte siempre mete la mano. Pero si quiere mejorarla para Qatar 2022, desde ya mejor ir leyendo un poco sobre Bayes.
(Si desea hacer sus propios experimentos sobre predicción de resultados, podrá encontrar estadísticas históricas de hasta 25 temporadas en http://www.football-data.co.uk).
Ingeniero Aeroespacial
salvadoreño, radicado en Holanda.
cornejo@52ecuaciones.xyz