Ejemplos de uso de datos en fútbol y hockey sobre hielo

Meetup Usuarios de R en Chile - Sept. 2020

Ismael Gómez Schmidt
Data Scientist 49ing / Co-Founder Futbolytics / Frontman datofutbol.cl

Agenda



  • Analítica deportiva

  • Datos y herramientas

  • Ejemplos de uso de datos en fútbol y hockey sobre hielo

Analítica deportiva





Datos y herramientas

Datos de eventos

  • Registro de distintos eventos relevantes con sus detalles respectivos

Proveedores








Herramientas

Ejemplos en fútbol y hockey sobre hielo

1) Modelos xG


  • xG: eXpected Goals (Goles esperados)

  • Se busca estimar la probabilidad de gol que tienen los tiros antes de ejecutarse

  • Es un problema de clasificación con dos salidas: "GOL" y "NO GOL"

  • Clases muy desbalanceadas: En fútbol aprox. el 11% de los tiros son goles (y en hockey el 6%)

Características modelos xG

Características modelos xG

Influencia de la cantidad de oponentes en la trayectoria del tiro:

Características modelos xG

Aplicaciones modelos xG: Contexto + Scouting

Aplicaciones xG: Optimización de line-up

  • Pregunta: ¿Qué tipo de jugadores maximimizan la producción ofensiva?

  • Enfoque: Usar el xGF% (proporción de xG a favor respecto al xG total) como predictor de la prob. de ganar -> con xGF 55% tienes 60% prob. de ganar

Aplicaciones modelos xG: Optimización de line-up

  • Método:
    - Clustering de jugadores según estilo de juego y performance ofensiva
    -Calcular xGF% para todos los tiros en Estados 5-5 de una temporada asociados a cada combinación de 3 delanteros (Forwards)
  • Ranking de combinaciones de 3 delanteros según XGF%: mejores line-ups!

  • Conformación de plantel

Aplicaciones modelos xG

El xG es el proxy de generar/conceder peligro de gol. Es la base para otras métricas que buscan valorar pases y posesión: xA, xGchain, xGBuild, xT, VAEP, g+, etc.

2) Clustering de pases

  • Idea: observar patrones de ubicación, longitud, y dirección de pases, en específico asistencias en la zona ofensiva, tanto a nivel de jugadores como de equipo en situaciones particulares de un partido.

  • Problema: son muchos pases!

  • Enfoque: aplicar clustering para facilitar la visualización

Resultados del clustering

Luego de algunas iteraciones optamos por 39 clusters, aceptando errores en favor de mantener la simetría y la ubicación de tiros


Aplicación del clustering: nivel equipo

Aplicación del clustering: nivel jugador

3) Similitud de jugadores


  • Idea: Un caso recurrente en scouting es buscar un reemplazo a un jugador que se va/fue o bien querer a alguien que tenga un perfil similar a un jugador específico.

  • Problema: Pueden ser decenas o cientos de candidatos + puede haber buenos candidatos que no están en mi radar + se requieren muchos recursos para analisar y evaluar a cada uno.

  • Enfoque: Crear un perfil cuantitativo del jugador de referencia en cuanto a performance (percentiles en atributos relevantes dentro de un universo objetivo) + aplicar un algoritmo/función de similitud + aplicar filtros según condiciones de borde para acotar la cantidad de candidatos

4) Análisis espacio-temporal con tracking data

Otras aplicaciones

Gracias!

https://futbolytics.cl
Twitterhttps://twitter.com/DatoFutbol_cl
Bloghttps://datofutbol.cl