28 Tweets 2 reads Jun 04, 2022
📊 Thread : Bilan de saison de LaLiga 🇪🇸 par la Data
Aujourd'hui, quelques visualisations pour voir quels équipes et joueurs ressortent statistiquement et ce qu'on peut confirmer de l'œil par les stats.
On va aussi voir comment Madrid s'est imposé avec ses fortes individualités.
Avant de commencer, j'ai quelques précisions à introduire. Pour toutes les statistiques présentées, j'ai répété une manipulation basique mais importante : tout ramener à 90 minutes. Ça permet de mettre sur un pied d'égalité des joueurs n'ayant pas eu le même temps de jeu.
À propos du temps de jeu, j'ai limité les joueurs sélectionnés à un échantillon jugé "acceptable" pour la saison, c'est-à-dire les ceux ayant disputé au minimum ⅓ des minutes (soit 12.6 x 90').
Un total de 304 joueurs dans la base de données.
Sur chaque graphique, la taille du point représentant un joueur dépendra de son tdj.
Enfin, j'avais réalisé un thread semblable en oct. dernier. Par soucis de clarté pour ceux ne l'ayant pas lu, je vais tout réexpliquer, mais les autres, vous pouvez sauter les tweets sans image.
🤺 Efficacité & dangerosité offensives
• LaLiga a présenté les pires statistiques du Top 5 européen en terme de création d'occasions.
• L'efficacité dans les deux surfaces a été un argument important à la compétitivité du Real Madrid et de Sevilla.
🏹 Comportement à la relance
• L'Atléti a répondu aux difficultés rencontrées en pratiquant un jeu moins protagoniste.
• Alessio Lisci a honoré l'héritage des relances courtes de Paco López à Levante.
👕 Au niveau individuel maintenant, jetons un œil aux statistiques avec ballon.
• Benzema 🇫🇷 et Juanmi 🇪🇸 ont maintenu un niveau d'efficacité impressionnant.
• Danjuma 🇳🇱, Ferran 🇪🇸, Iñaki 🇪🇸 et Isak 🇸🇪 sont les mauvais élèves de la saison devant le but.
🎯 Une passe clé est une dernière passe avant un tir. Les xA (passes décisives attendues) sont calculées avec une méthode proche des xG. Elle prend en compte plusieurs facteurs, comme le type de passe, le point d'arrivée de la passe et la longueur de la passe.
• Les statistiques avancées confirment l'excellente année 2022 de Dembélé 🇫🇷 dans le secteur.
• Benzema 🇫🇷 confirme sa suprématie dans le dernier tiers en se distinguant parmi d'autres figures fortes du championnat (Gerard Moreno 🇪🇸, Muniain 🇪🇸, Chukwueze 🇳🇬, Vinícius 🇧🇷).
🛠️ Compter le nombre d'actions amenant à un tir/but dans lesquelles un joueur est investi permet de prendre chaque action dans leur totalité et pas seulement le dernier passeur et le tireur.
🏃‍♂️ Progression par la course
• Les meilleurs joueurs de percussion du championnat se disputent le haut du panier.
• Avec respectivement 3.63 et 3.38 dribbles réussis par match, 🥈 Dembélé et 🥉 Viní sont sur le podium des meilleurs dribbleurs, derrière 🥇 Chukwueze (3.92).
🪃 Progression par la passe
• Kroos 🇩🇪 et Modrić 🇭🇷 pour représenter le Real dans ce secteur et confirmer sa domination individuelle.
• La présence des défenseurs de Sevilla illustrent bien une des meilleurs relances d'Europe.
⛔️ Passons aux stats défensives. Ici on observe à quel point les équipes subissent et comment elles empêchent leur adversaire d'obtenir des occasions.
Naturellement, plus l'équipe subit, plus elle va subir d'occasions.
C'est un problème qui se répète dans les stats défensives. On essaie donc généralement de le contourner. On va voir cela avec la partie sur le pressing.
Le pressing est un aspect du jeu difficile à retranscrire. C'est un principe qui peut se répéter dans le temps mais de manière plus ou moins intense, comme séquentielle.
On prend donc un max. d'indicateurs pour se donner une idée la plus précise possible, et qu'ils se complètent
D'abord, intéressons nous aux PPDA (Passes allowed Per Defensive Action) qui détermine le nombre de passes "autorisées" par action défensive. Ainsi, plus la valeur sera basse, plus l'équipe sera active sans ballon.
Faute de mieux, c'est la seule statistique que j'ai pris d'understat.com (d'expérience, le PPDA n'est pas parfait mais correct). Tout le reste est de StatsBomb (depuis fbref.com), bien plus qualitatif et précis.
L'inconvénient du PPDA est qu'il peut être bas même si l'équipe ne presse pas particulièrement. Un exemple frappant et connu est celui du PSG qui, en L1, affronte des adversaires pratiquant un jeu direct (moins de passes) : faible PPDA, pourtant Paris ne presse pas forcément.
On va donc compléter dans un premier temps avec le pourcentage de passes réussies de l'équipe adverse, qui peut donner une indication sur la capacité de l'équipe à forcer des prises de passes difficiles et/ou à jouer long.
L'indicateur est déjà différent pour certaines équipes.
Par exemple, Sevilla se rapproche du Barça.
Valencia justifie l'intérêt d'une troisième statistique, car tirer la conclusion que c'est une équipe qui presse est tentant mais...
Plutôt que de contourner le problème de la possession du ballon, on peut le régler. Pour ce faire, on utilise des formules élaborées par des Data Scientist/Data Analyst, qui permettent de ramener les données à une situation fictive où toutes les équipes ont 50% de possession.
Cela nous permet d'ajouter une troisième statistique à l'évaluation du pressing, le nombre de pressions. Et de passer d'une réalité où Cádiz, équipe la plus défensive de Liga avec 40.9% de possession, occupe le podium, à quelque chose d'exploitable.
On va donc obtenir une valeur qu'on appelle Nombre de pressions PAdj (Possession-Adjusted).
On y observe que Valencia presse peu, moins que ce que nous disait le PPDA pour une dizaine d'équipes.
En reliant ceci à ce que l'on a vu à l'œil tout au long de la saison, on peut tirer la conclusion d'une équipe agressive haut sur le terrain, pour court-circuiter les actions adverses, mais moins dans son camp.
Le cas du RMA est aussi intéressant : presse quand il peut mais mal.
Je vous invite à lire la partie pressing du thread d'octobre 2021, qui propose une situation différente, justifiant d'autant plus l'utilisation coordonnée des trois graphiques ⬇️⬇️⬇️
🚌 Performance défensive
J'ai également ajusté à la possession (PAdj) les statistiques de tacles et interceptions des joueurs, pour les mettre sur un pied d'égalité, et obtenir un graphique comparatif plus significatif.
• Les garants de la défense merengue bien présents.
🧤 Pour conclure, une évaluation de la performance des gardiens sur leur ligne, avec la pression subie et le nombre de buts sauvés.
• Maximiano impérial mais n'a pas pu sauvé Granada de la relégation. Oblak, meilleur gardien des dernières années dans le secteur, ombre de lui-m̂
Voilà pour ce bilan de la saison de Liga par la data. Merci d'avoir lu 🙏
Si vous souhaitez voir où se situe quel joueur sur quel tableau, vous pouvez me demander je vous l'indiquerai avec plaisir, pareil si vous voulez savoir à quel joueur correspond quel point.

Loading suggestions...