Contenuti
Negli ultimi anni l’utilizzo delle statistiche avanzate nel calcio è cresciuto a dismisura. Nonostante un certo conservatorismo e reazionarismo presente soprattutto in Italia, concetti come gli xG (Expected Goals) sono ormai noti alla maggior parte degli appassionati. Ma al di là dei famigerati xG, esistono tante altre statistiche che vengono comunemente usate per analizzare nel dettaglio giocatori, squadre e partite. Questo articolo (che prende ispirazione da questo pubblicato da The Athletic) nasce con l’obiettivo di introdurre questi concetti ai meno avvezzi e a chi è interessato all’argomento.
1. Expected Goals (xG)
Definizione: Come già scritto nell’introduzione, gli xG sono senza dubbio il dato statistico più conosciuto dagli appassionati. Si tratta di un dato che misura la probabilità che un tiro diventi un gol. Per farlo, è necessario stabilire la qualità del tiro prendendo in considerazione diversi fattori quali:
- L’angolo di tiro
- La distanza del tiro
- Se si tratta di un colpo di testa o di un tiro di piede
- Se il passaggio precedente è stato un cross, un passaggio corto o un passaggio lungo
- Se ci sono dei difensori tra il pallone e la porta
Il valore degli xG viene presentato come un valore che va dallo 0 (teoricamente impossibile segnare) a 1 (gol certo). Per stabilire il valore in questione ogni tiro viene messo a paragone con centinaia di migliaia di tiri che presentano caratteristiche simili, per poi calcolarne la percentuale di realizzazione. Di conseguenza, gli xG non considerano la qualità del giocatore che effettua il tiro, bensì fornisce un valore basato sulle capacità del giocare medio in quella determinata situazione. Va da sé che la percentuale di realizzazione di un tiro in una determinata situazione di gioco sia estremamente fluttuante. Ci sono tanti modelli di xG, di conseguenza a seconda del modello utilizzato i dati possono variare.
Utilizzo: Sommare gli xG prodotti da un giocatore o una squadra durante una partita possono darci un’idea della pericolosità offensiva creata, seppur non sia corretto da un punto di vista matematico sommare probabilità di eventi indipendenti. Nonostante ciò vedrete diversi analisti parlare di overperformance se un giocatore (o una squadra) segna un numero di gol superiore a quelli attesi e viceversa parlare di underperformance.
Per ottenere dei dati più affidabili è meglio utilizzare i NPxG (Non-penalty expected goals) in relazione ai NPG (Non-penalty goals), così da evitare dati inflazionati dai rigori, il cui valore è all’incirca 0.76 xG.
In modo di fatto identico ma focalizzandosi sui passaggi e sugli assist si può parlare di Expected Goals Assisted (xA), che ci permette di attribuire un valore a un assist a seconda di quanto questo abbia prodotto un tiro ad alto valore di xG. EDIT 05/10/2022: Quando si parla di Expected Assist (xA), è opportuno fare una distinzione fra modelli di Expected Goal Assisted (Statsbomb) e modelli di Expected Assist (Soccerment, Opta). Infatti il modello degli Expected Assist è focalizzato su tutti i passaggi, non solo quelli che danno luogo a un tiro. In questo modo si elimina quello che può essere considerato un limite di indici come assist, chances created ma anche xG assisted, separando la qualità in rifinitura di chi fa il passaggio dall’abilità e il decision-making del compagno che riceve.
2. Expected Goals on Target (xGOT)
Definizione: Se gli xG danno un valore al tiro prima che il calciatore calci, gli Expected Goals on Target (xGOT) danno un valore al tiro dopo che il pallone è stato calciato. Il valore, esattamente come gli xG, varia tra 0 e 1. Come dice già il nome, questo dato misura soltanto i tiri in porta, e ci permette di capire la percentuale di realizzazione (sempre paragonandolo a centinaia di migliaia di tiri simili) di un tiro a seconda di dove arriva il pallone.
Per esempio, il gol di Candreva qua sotto ha un valore xG di soli 0.02 considerando la distanza dalla porta, il posizionamento del portiere e la presenza di un difensore davanti al tiratore.
Il tiro di Candreva però è favoloso e finisce proprio sotto l’incrocio dei pali dove Silvestri non può arrivare. Il valore xGOT di questo tiro è infatti di 0.60.
Utilizzo: Gli xGOT sono un dato utilissimo per capire le capacità realizzative di un giocatore: se gli xGOT sono costantemente superiori agli xG, il giocatore in questione è stato in grado di effettuare degli ottimi tiri da occasioni di qualità inferiore rispetto alle attese. La differenza tra xG e xGOT si chiama Shooting goals added (dati Soccerment) e ci dice quanti gol “aggiunge” un giocatore per ogni tiro che prende.
Utilizzando gli xGOT (o PSxG secondo la nomenclatura di Statsbomb) siamo anche in grado di capire quali portieri si stanno comportando meglio tra i pali, analizzando la differenza tra gli xGOT subiti (e quindi la difficoltà dei tiri affrontati) e i gol concessi.
Una pecca importante del modello consisteva nella mancanza di informazioni in merito alla velocità del tiro, ma il nuovo aggiornamento di Statsbomb pubblicato a maggio 2022 ha risolto questo problema.
3. Passes per defensive action (PPDA)
Definizione: Il PPDA è un indicatore dell’intensità del pressing a livello di squadra, utilizzato per cercare di misurare il grado di pressione esercitata da una squadra quando questa non è in possesso del pallone.
In parole povere, questa metrica tiene conto del numero di passaggi che una squadra consente all’avversario prima di effettuare un’azione difensiva. Il dato si calcola a seconda del fornitore statistico entro una certa zona del campo, che può essere l’intera metà campo difensiva, i primi 30 metri o i primi 50.
Utilizzo: Un valore basso di PPDA indica maggiore intensità nel tentativo di riconquistare il pallone, mentre un valore più alto indica una squadra meno intensa nel tentativo di riconquistare palla. Per esempio, secondo Understat, il valore PPDA nella scorsa stagione del Torino di Juric – allenatore noto per l’intensità e il pressing ultraoffensivo che contraddistingue le sue squadre – è stato di 7.68. Quello della Salernitana invece, che specialmente nella prima parte di campionato tendeva a stare più basso e compatto in fase di non possesso, è stato di 14.57.
4. Buildup Disruption Percentage (BDP)
Definizione: Sempre nell’ambito dei dati relativi al pressing, Soccerment ha recentemente introdotto una nuova statistica denominata Buildup Disruption Percentage (BDP). Questa metrica ci permette di valutare l’efficacia del pressing delle squadre.
L’idea di base è che una squadra il cui pressing è efficace abbassa la precisione nei passaggi della squadra avversaria; di conseguenza, le squadre che mediamente abbassano la percentuale di complemento dei passaggi dei propri avversari sono quelle che pressano meglio. Nella scorsa stagione di Serie A la squadra con il pressing più efficace è stato ancora una volta il Torino di Juric, che mediamente abbassava la percentuale di passaggi degli avversari del 9%.
Il grafico seguente combina i dati di PPDA e BDP (dati Soccerment) delle squadre di Serie A nella scorsa stagione.
5. Field Tilt
Definizione: Il Field Tilt è una statistica importante perché dandoci un’indicazione sul dominio territoriale ci permette di andare oltre il ben poco utile dato sul possesso palla. La critica che viene mossa più spesso al dato sul possesso palla è che non ci dà informazioni sulla zona di campo in cui avviene. Una squadra che ha avuto l’80% di possesso palla in una partita in linea teorica può anche non aver mai superato la metà campo, effettuando quindi un possesso palla sterile.
Il Field Tilt ci viene in aiuto da questo punto di vista perché calcola la percentuale di possesso palla considerando soltanto l’ultimo terzo di campo. Se la Squadra A effettua 80 passaggi nell’ultimo terzo di campo e la Squadra B ne completa 20, la Squadra A avrà un Field Tilt dell’80%.
Utilizzo: Ovviamente il Field Tilt va preso come un dato quantitativo (o descrittivo) e non qualitativo: non è detto che avere maggiore dominio territoriale porti necessariamente a più occasioni pericolose. Inoltre, una squadra può deliberatamente scegliere di lasciare il dominio territoriale all’avversario, per esempio se è in possesso di giocatori capaci nell’attaccare in transizione o se gli avversari fanno fatica a difendere a campo lungo.
6. Expected Threat (xT)
Definizione: Per Expected Threat (xT) si intende un modello statistico che attribuisce a ogni azione effettuata in campo un valore di pericolosità. Più l’azione avvicina la squadra alla porta avversaria, maggiore sarà l’xT. I valori negativi indicano azioni che allontanano la squadra dalla porta avversaria.
Utilizzo: Un dato di questo tipo ci permette di dare il giusto peso anche a quelle giocate che non avvengono solo nell’ultimo terzo di campo e a quei giocatori che stazionando in posizioni più arretrate sono chiaramente svantaggiati per fare gol o assist. Con gli xT siamo in grado di dare un peso a tutte quelle piccole azioni (passaggi, conduzioni, dribbling) che hanno poi prodotto un’azione pericolosa. Sommando ognuna di queste azioni siamo quindi in grado di stabilire quali sono stati i giocatori più pericolosi (ossia quelli che hanno aumentato le possibilità della propria squadra di costruire un’azione pericolosa).
Il grafico seguente (datato 21/04/2022) mostra quali sono stati i giocatori di Serie A che hanno alzato il livello di pericolosità tra passaggi e conduzioni palla al piede.
È importante sottolineare che dal momento che gli xT attribuiscono un valore negativo ai passaggi all’indietro (perché allontanano la squadra dalla porta avversaria), le punte centrali sono particolarmente svantaggiate, perché giocando tanto spalle alla porta e lavorando di sponda sono costrette a giocare tanti palloni all’indietro. Passare il pallone all’indietro però non li rende effettivamente meno pericolosi nell’economia generale della partita, perché il passaggio all’indietro può anche servire come “esca” per attirare la pressione avversaria (per esempio nel caso dei passaggi indietro al portiere), oppure può essere utile per trovare il 3° uomo.
Dove trovare questi dati?
Alcuni tra i fornitori statistici più noti, nonché quelli da cui sono solito raccogliere io i dati, sono FBref (che attinge dai dati di Statsbomb); Understat, Soccerment e Wyscout. FBref e Understat sono completamente gratuiti, mentre Soccerment e Wyscout necessitano di un abbonamento.
EDIT (05/10/2022): Con un aggiornamento effettuato in data 30/09/2022, Soccerment ha ampliato la copertura da 5 a 17 leghe per quanto riguarda le metriche avanzate. I dati relativi ai primi 5 campionati sono gratuiti se si crea un account.
FBref è probabilmente il fornitore statistico più completo, specialmente per quanto riguarda l’analisi statistica dei singoli giocatori. I pregi di Understat sono l’immediatezza e la possibilità di fare rapidi paragoni tra due giocatori attraverso dei radar charts (così come è possibile fare anche su Soccerment), nonché le interessantissime shot zones dei giocatori.
Soccerment (che per altro è un’azienda italiana) ha il grande vantaggio di essere l’unico fornitore statistico consultabile online che presenta i dati sugli Expected Threat e sul Buildup Disruption, nonché i dati sul PPDA e sul Field Tilt (presenti anche su FBref ma soltanto indirettamente). Wyscout ha invece dalla sua un enorme database di partite e di clip, comodissimo se si vuole analizzare rapidamente un calciatore.
Conclusione
Il mondo delle statistiche nel calcio è molto più variegato di quanto presentato in questo articolo, che va preso più come un rapido glossario da sfogliare per avere un’indicazione chiara di che cosa siano alcune delle statistiche più utilizzate oggi. La data analysis nel calcio è solo agli albori, e nonostante le tante critiche, il conservatorismo e il reazionarismo che ha incontrato e ancora incontrerà (atteggiamenti che non vanno assimilati a quelli di coloro che invece muovono critiche puntuali al movimento permettendogli di crescere), è ormai indubbio che giorno dopo giorno continuerà a svilupparsi e ad acquisire importanza. Per questo motivo, diventa sempre più necessario conoscere e saper utilizzare questo genere di dati.