Insights / Blog

Tableau Prep & Alteryx: Step Aggregate vs Summarize Tool

Quando si approccia un’analisi statistica, la preparazione dei dati è fondamentale. Software come Tableau Prep ed Alteryx ci vengono in soccorso proprio durante questa delicata fase di organizzazione del dataset, offrendoci una serie di funzionalità mirate ad armonizzare le informazioni oggetto della nostra analisi in una struttura logica facilmente legibile da Tableau Desktop.

Nello specifico, oggi ci concentreremo sugli strumenti dedicati all’aggregazione di dati in colonna appartenenti ad una stessa dimensione, con l’obiettivo finale di comprimere il nostro dataset originale in una tabella più concisa.

Esempio: Due amici (Gervaso ed Alberico), tengono conto dei caffè bevuti ogni mese. Ai fini della nostra analisi statistica, potremmo essere interessati a creare una viz che rappresenti solamente i caffè bevuti nel 2019, piuttosto che quelli bevuti ogni mese indipendentemente dalla persona, od ancora il totale specifico per Gervaso ed Alberico. Il dataset iniziale è il seguente:

Database Iniziale

Gli strumenti di data preparation messi a disposizione da Tableau Prep ed Alteryx per semplificare la nostra tabella secondo i criteri esposti nell’esempio sono, rispettivamente, lo Step Aggregate ed il Summarize Tool.

Tableau Prep: Step Aggregate

Una volta aperto Tableau Prep e caricato il database, clicca sull’icona “+” a destra dell’input e seleziona lo step denominato “Aggregate“:

Seleziona lo step "Aggregate" dall'icona "+" a destra del file di input

Una volta aggiungo l’ Aggregate Step, verrai reindirizzato in una schermata dedicata, dove, nel menu di sinistra vedrai elencate le quattro colonne del tuo database (Anno, Mese, Nome e Caffè Bevuti). Nella parte destra dello schermo invece, vedrai comparire due finestre: “Grouped Fields” ed “Aggregate Fields“.

Tableau Prep dedica due finestre distinte per separare i fields raggruppati da quelli aggregati.

Supponiamo di voler conoscere quanti caffè in totale hanno bevuto Gervaso ed Alberico singolarmente indipendentemente dall’anno e dal mese. La nostra colonna da raggruppare sarà “Nome”, mentre i valori da aggregare saranno quelli di “Caffè Bevuti”. Per ottenere il risultato desiderato, basterà trascinare “Nome” dal menu di sinistra nella finestra “Grouped Fields” mentre “Caffè Bevuti” nella finestra “Aggregate Fields”:

 

Trascina le colonne in "Grouped Fields" ed "Aggreate Fields" secondo il tipo di raggruppamento che vuoi ottenere.

Qualora fossi interessato a visualizzare il numero medio dei caffè bevuti dai due amici, piuttosto che il valore massimo o minimo nella serie, sarà sufficiente cliccare su “SUM” nella finestra degli “Aggregate Fields” e cambiare il tipo di operazione matematica tra le molteplici proposte:

Cambia il tipo di operazioe matematica dal meu "Aggregate Fields"

Tableau Prep ti permette anche di aggiungere livelli di raggruppamento multiplo per colonna. Se volessimo infatti ottenere il numero di caffè bevuti per anno e per mese indipendentemente dal singolo individuo, basterebbe semplicemente trascinare “Anno” e “Mese” nella finestra “Grouped Fields” e lasciare “Caffè Bevuti” nella finestra “Aggregate Fields”.

Tableau Prep permette raggruppamenti multipli di colonne nello Step Aggregate

Per visualizzare l’output finale della tabella dopo le modifiche ottenute grazie allo Step Aggregate, aggiungi uno “Step Output” dal pulsante “+” a destra dell’Aggregate.

Aggiungi un Output Step per visualizzare la tua tabella semplificata

Fatto! Puoi ora salvare la tua tabella semplificata è caricarla su Tableau Desktop per creare una Viz.

Alteryx: Summarize Tool

Approcciando la stessa situazione in Alteryx, il primo step da fare dopo aver caricato il database attraverso l’input tool, è quello di andare a cercare il Summarize Tool nella sezione “Transform” e creare una connessione.

Cliccando sul Summarize Tool, nel menu delle impostazioni sulla sinistra apparirà una finestra che ti permetterà di impostare il tipo di aggregazione desiderata. Nello specifico, nella parte superiore troverai la lista delle “colonne” provenienti dal tuo database; mentre, nella parte inferiore, una lista di azioni che ti permetteranno di creare delle regole di raggruppamento e calcolo.

Imposta il Summarize Tool

Ipotizziamo di voler sintetizzare la tabella iniziale per capire quanti caffè sono stati bevuti dai due amici ogni mese, indipendentemente dall’anno o dal singolo individuo.

In questo caso dovremo:

A) Selezionare la colonna “Mese”

B) Cliccare sul bottone “Add” nel menu inferiore

C) Scegliere l’opzione “Group By”

D) Selezionare la colonna “Caffè Bevuti”

E) Cliccare sul bottone “Add” nel menu inferiore

F) Scegliere l’opzione “Sum” affinchè i valori appartenenti allo stesso mese vengano sommati

Una volta “settate” le impostazioni, aggiungi un “Browse Tool” alla fine del tuo flow e clicca su “Run”. Il risultato sarà esattamente quello desiderato:

Risultato Finale

Oltre alla somma, il Summarize Tool di Alteryx ti permette anche di applicare svariate operazioni matematiche ai tuoi valori, come ad esempio la media, il conteggio, la deviazione standard etc. Potrai selezionare l’operazione desiderata direttamente dal menu inferiore dopo aver cliccato il bottone “Add”.

Il Summarize Tool di Alteryx offre diverse operazioni matematiche per manipolare i tuoi valor

In maniera analoga a Tableau Prep, il Summarize Tool di Alteryx ti permette anche di aggregare il tuo database per più di una colonna di interesse, andando dunque a moltiplicare esponenzialmente le possibilità di raggruppamento dei tuoi dati. Ad esempio, se fossimo interessati a sapere quanti caffè hanno bevuto singolarmente Gervaso ed Alberico in ogni specifico anno, potremmo utilizzare l’opzione “Group by” due volte: una per la colonna “Anno” ed una per la colonna “Nome”.

Il Summarize Tool di Alteryx permette di raggruppare anche più di una colonna alla volta

Conclusioni:

Sia Tableau Prep che Alteryx forniscono un ottimo tool per il raggruppamento e l’aggregazione di colonne in base a specifici parametri. In Tableau Prep la gestione del Tool avviene in maniera più intuitiva grazie all’utilizzo del “drag & drop”, mentre il punto di forza del Summarize di Alteryx è sicuramente la grande quantità di operazioni matematiche applicabili per l’aggregazione dei valori e la possibilità di “settare” tutte le impostazioni direttamente dal menu laterale sinistro.

Spero di esservi stato di aiuto, continuate a leggere i nostri blog!

Potete inoltre seguirmi su Twitter, Linkedin e Tableau Public.

[button URL=”http://www.tableau.com/partner-trial?id=45890″]Download Tableau[/button]     [button URL=”https://www.theinformationlab.it/newsletter-2/”]Iscriviti alla newsletter[/button]

 

Blog
cultura dei dati

Cultura dei dati: perché è così importante?

Innestare una cultura dei dati evoluta e permeata in tutto il tessuto aziendale accelera l’innovazione...

Blog
Manufacturing Analytics: cos’è e come impatta l’ottimizzazione dei costi

Manufacturing Analytics: cos’è e come impatta l’ottimizzazione dei costi

Il Manufacturing Analytics è l’ultima frontiera dell’evoluzione dell’industria manifatturiera, sempre spinta dalla necessità di rimanere...