Insights / Blog

Box Plots in Tableau: Teoria e Pratica

Training_TIL

Box Plots o Whisker Plots sono dei tipi di diagrammi molto utilizzati e soprattutto utili che potrete sfruttare per i vostri progetti con Tableau. Oggi vedremo bene di cosa si tratta, con un po’ di teoria e poi ne creeremo uno insieme.

Un Box Plots o se vogliamo in italiano una Diagramma a scatola è una rappresentazione grafica utilizzata per descrivere la distribuzione di un campione attraverso alcuni semplici indici di dispersione e di posizione.

Ecco come è rappresentato orizzontalmente, ma può essere visto anche verticalmente:
box plots in tableau

Il rettangolo o scatola è delimitato da due quartili, il primo e il terzo mentre la linea al centro è la mediana.  I segmenti esterni, comunemente detti baffi invece segnano il massimo e il minimo.
Questi quattro intervalli delimitati dai quartili suddividono in parti uguali la popolazione campione.

Con un box plot possiamo vedere la forma della distribuzione, il suo valore centrale e la sua variabilità.

tableau e i box plots

Qui vediamo come nel tooltip siano visibili tutte le informazioni necessarie. Il valore mediano, il quartile minore (o primo quartile) e quello superiore (o terzo) e i Whisker, baffi. Questa è statistica descrittiva, in quanto abbiamo la descrizione di quello che abbiamo calcolato.

La mediana suddivide l’intero campione in due parti ugualmente popolate, dove il primo e terzo quartile saranno le rispettive mediane.
C’è differenza con i quantili? Minima. I quartili equivalgono ai quantili q0 (quartile zero), q1/4 (primo quartile), q2/4=q1/2 (secondo quartile), q3/4 (terzo quartile) e q1 (quarto quartile).

Quello che ci interessa maggiormente è la Standard Deviation, o lo Scarto quadratico medio. Che cos’è? E’ un indice di dispersione statistico, ovvero una stima della variabilità della popolazione campione di dati o di una variabile casuale. In altre parole la dispersione dei dati rispetto a una posizione, come ad esempio la mediana, il centro medio dei nostri valori statistici. Quanto distanti possono essere i valori dalla mediana? Quali valori sono estremi, ovvero escono da un range accettabile?

Più la Standard Deviation è vicina a 0, più i valori saranno raggruppati, più è alta e più saranno dispersi.

Ora creiamone uno in Tableau.

Come creare un box plots in Tableau

Utilizzeremo il classico file sample Superstore per questo esercizio. Lo troverete nella cartella Sample di sistema. Una volta connesso con Tableau e scelto il foglio Orders, apriamo un foglio.

Vogliamo creare un box plot che rappresenti le vendite per categorie nei diversi stati americani. Per creare un box plot ci serve una dimensione continua, questo ricordatevelo sempre.

Il modo più rapido per crearne uno è quello di selezionare una dimensione e cliccare su Show Me, e in seguito il diagramma Box Plot, ma ovviamente noi non lo faremo. Invece prendiamo la misura Sales e la posizioniamo in righe, la dimensione Category in colonne ed infine State lo mettiamo in detail.
A questo punto scegliamo Circle nel menu a tendina di Marks. Il risultato finale che viene fuori è questo.

sample box plots

Ora andiamo sulla scheda Analytics e scegliamo Box Plots. Lo trasciniamo sulla view e otterremo i nostri box plots con i whiskers. Nel tooltip saranno già comprese tutte le informazioni che ci cervono

box plots tableau

Possiamo modificare come meglio preferiamo ora, cliccando con il tasto destro su uno dei box plots e scegliendo Edit.

box plots

Possiamo modificare l’estensione dei baffi, lo stile e i colori della scatola, così come le linee e i segmenti. Se ci spostiamo sulle altre schede, Distribution, Band, possiamo inserire delle bande colorate o modificare i fattori della Standard Deviation.

Blog
data driven business

Data-driven business: perché il dato è cruciale per l’azienda?

Il data-driven business è un percorso a cui ormai nessuna impresa può sottrarsi. Contare su...

Blog
creare grafici interattivi

Creare grafici interattivi: Come si fa e principali vantaggi

Nel mondo digitale odierno, la visualizzazione dei dati è fondamentale per comunicare informazioni complesse in...