Hack a Stat – La costanza aiuta a vincere?

Bentornati su Hack a Stat! Ultimo appuntamento con la rubrica per gli amanti delle statistiche prima della pausa estiva, nel quale andiamo ad esplorare quanto la costanza incida sui risultati. Partiamo!

Avete mai pensato a cosa ci sia dietro una media statistica? Ovvero, avete mai pensato da dove nasce quel singolo valore che ci fornisce determinate informazioni? Beh, è abbastanza facile, nasce dalle singole prestazioni nelle varie partite giocate.
Quando osserviamo una media statistica infatti viene automatico controllare su quale campione essa si basi: media di due partite? Sarà probabilmente un dato poco attendibile, perché prende in considerazione un campione ristrettissimo che comporta di conseguenza grande aleatorietà. Media su una intera stagione? Quasi sicuramente ci mostra una tendenza vera, proprio perché ha dietro una grande quantità di dati.

È anche vero però che osservare solo la media alle volte non sia sufficiente per capire come una squadra o un giocatore giochi, dato che quel singolo valore non ci mostra tutto. Un rapido esempio con l’Offensive Rating: due squadre hanno mediato un Off Rtg di 100 durante il campionato. Il primo pensiero che ci sovviene è che entrambe le squadre abbiamo avuto un rendimento offensivo molto simile. In realtà però la prima squadra nel corso della stagione ha sempre ottenuto un Offensive Rating di 100 alla sirena finale, mentre la seconda ha ottenuto un valore di 120 per la prima metà del campionato e di 80 per la seconda metà. Entrambe a fine stagione avranno il già citato 100 in Offensive Rating, ma i due percorsi con cui sono giunti a quel valore sono nettamente differenti. Conoscendo anche questa situazione il conseguente pensiero è selezionare come squadra migliore quella più costante, dato che nel corso della stagione non ha subito un calo nel rendimento.

Questo è un banale esempio per spiegare il concetto dietro alla mia analisi di oggi: esiste una statistica che permetta di considerare anche la “storia” della stagione di ogni squadra, per capire quale sia stata la più costante? Ed esiste un modo per mostrare numericamente che la costanza influenzi i risultati? Per la prima domanda posso rispondere subito: sì, è la deviazione standard. Grazie ad essa arriveremo anche a conoscere la seconda risposta.

La deviazione standard è un calcolo statistico che fornisce la variabilità di un campione di numeri: maggiore sarà la deviazione, maggiore sarà la differenza tra i valori rispetto alla loro media. Per capire quindi quali sono state le squadre più o meno costanti ho calcolato le deviazioni standard di Offensive e Defensive Rating, così da ottenere un primo riscontro numerico. Per facilità di lettura riporto i risultati in un grafico a dispersione che mostra il tutto:

Come vedete non è una disposizione totalmente casuale. Non ci sono squadre che nel corso della stagione abbiamo variato poco entrambi i rating: comunque una delle due statistiche ha una deviazione standard vicino alla media di Lega; per esempio il Fenerbahce nel corso della stagione ha avuto un rendimento offensivo abbastanza costante, mentre a livello difensivo ha avuto qualche sbalzo in più. Al contrario il CSKA ha avuto un Defensive Rating più costante e un Offensive Rating con più variazioni.
Ovviamente nessuna squadra ha deviazioni standard pari a 0, sarebbe assolutamente impossibile: la costanza di rendimento è influenzata sia da fattori controllabili (come gli schemi e le tattiche offensive e difensive), sia da altri incrollabili (ad esempio infortuni e condizione fisica dei giocatori). Detto ciò, osservando il grafico si nota che le squadre più forti hanno almeno una deviazione standard bassa e le ritroviamo infatti in prossimità del riquadro in basso a sinistra. Più ci si spinge verso l’alto o verso la destra del grafico, più si incontrano squadre che hanno faticato nel corso della stagione.

Alla luce di queste considerazioni sembrerebbe che tramite la deviazione standard sia possibile constatare numericamente la correlazione che stiamo cercando. Per avere però un unico valore ho calcolato il Constancy Factor e l’ho intersecato con la Winning Percentage:

 

Il Constancy Factor è una statistica creata per questa analisi che prende in considerazione entrambe le deviazioni standard di attacco e difesa: per trovarlo è necessario calcolare il percentile di ogni valore per i due gruppi di deviazioni, sommare a 1 ogni risultato e infine sommare assieme il percentile offensivo e difensivo di ogni squadra. Si ottiene così un valore che tiene conto della costanza in fasi di attacco e di difesa di ogni squadra: maggiore sarà il risultato, maggiore sarà la variazione dei Rating nel corso della stagione (e quindi una minore costanza di rendimento).
Incrociando il Constancy Factor con la percentuale di vittoria si nota come in effetti una correlazione tra costanza e vittoria esista: le squadre con fattore minore hanno le migliori percentuali di vittoria. Ritroviamo infatti sette delle prime otto squadre in classifica nel riquadro in alto a destra. L’unica eccezione (come anche nello scorso articolo dedicato alla selezione di tiro) è l’Olympiacos.

La squadra greca ha il secondo valore più alto di deviazione standard dell’Offensive Rating (dietro solo alla Stella Rossa), mentre per quanto riguarda quella della fase difensiva si piazza ottava. Tutti sappiamo che l’arma principale della squadra di Spanoulis nel corso della stagione è stata la difesa (miglior Defensive Rating di Eurolega, 109,4): Oly però quando giocava in trasferta non sempre riusciva a replicare la stessa difesa casalinga. I numeri ci dicono infatti che tra le mure amiche il Defensive Rating medio è pari a 105,7, mentre in trasferta sale a 113,2. Questa differenza comporta ovviamente una deviazione standard più alta rispetto a quanto ci si potesse aspettare per la squadra greca. In attacco questa differenza tra casa e trasferta è ancora più netta e porta ad una delle deviazioni standard più alte: si passa da un Offensive Rating di 116,8 tra le mure amiche a un 104,7 lontano da Atene. Tutto questo spiega il posizionamento distaccato dell’Olympiacos dal gruppo del quadrate in alto a destra nonostante un ottimo terzo posto in classifica: si può affermare che i bianco rossi siano l’eccezione che confermano la regola, proprio perché a dispetto di un rendimento poco costante tra casa e trasferta, siano comunque riusciti a prevalere sulla maggior parte delle squadre.

Ora però sorge spontanea una domanda: la costanza è da considerarsi sempre e comunque come una qualità positiva? Beh, no. Con il grafico precedente abbiamo evidenziato che le squadre migliori abbiano mantenuto un rendimento abbastanza costante durante la stagione, ma Bamberg, Stella Rossa o Milano hanno valori di Constancy Factor simili alle già citate prime sette, eppure si sono piazzate tra gli ultimi posti in classifica, faticando per tutta la competizione.

Il Constancy Factor in effetti pecca di un difetto: non tiene conto del valore medio attorno al quale il rendimento è variato. Banalmente due squadre possono avere una deviazione standard bassa, ma se la prima ha il miglior Offensive Rating e la seconda il peggiore, capite bene che per quest’ultima il citato fattore assumerà un aspetto negativo, dato che certifica un non miglioramento nel corso della stagione.

Per esempio la Stella Rossa è stata la terza peggior difesa di Eurolega con un Defensive Rating di 121,2, ma la relativa deviazione standard è tra le più basse: in altre parole la difesa della squadra di Belgrado non ha elevato il proprio livello nel corso della stagione, rimanendo sempre tra le più battute.
Discorso simile per i tedeschi di Bamberg: terzo peggior attacco, ma deviazione standard bassa, a significare che la fase offensiva di Hackett e compagni ha quasi sempre avuto difficoltà a produrre punti.

Per ovviare a questo difetto del Constancy Factor ho provveduto a considerare anche il livello delle due statistiche prese in considerazione. Per fare ciò ho semplicemente calcolato un fattore legato alla bontà dei due rating: maggiore il fattore associato, peggiore sarà la statistica. Moltiplicando per tale fattore il relativo addendo del Constancy Factor ho ottenuto un Adjusted Constancy Factor che prende anche in considerazione la qualità di gioco offensivo e difensivo. Ecco il risultato:

L’Olympiacos rimane una mosca bianca, ma per il resto la tendenza del grafico e la disposizione delle squadre ci mostrano che attraverso l’Adjusted Constancy Factor possiamo constatare numericamente quali siano state le squadre migliori.
Per avere un ulteriore riscontro ho effettuato gli stessi calcoli anche per la Serie A. Ecco i risultati:

Anche in questo caso il trend del grafico ci mostra le prime otto in classifica in alto a destra, mentre quelle rimaste fuori dai play-off nel quadrante in basso a sinistra.

In conclusione possiamo affermare che la deviazione standard sia un utile strumento per analizzare il rendimento nel corso della stagione di una squadra. Tramite essa è stato possibile confermare numericamente che la costanza di rendimento, unica ovviamente a un’efficienza positiva, aiuti a ottenere risultati soddisfacenti.

Baskettaro a tempo perso, nerd a tempo pieno. Così malato di numeri che se non trovo la statistica che mi aggrada, me la creo da solo [cit.].