Raggruppare i dati in base ad alcuni parametri ed effettuare operazioni come la somma e il conteggio della frequenza.
Con Excel possiamo usare le formule CONTA.PIÙ.SE, SOMMA.PIÙ.SE e anche MEDIA.PIÙ.SE se vogliamo calcolare la media.
Abbiamo, ad esempio, un elenco di transazioni che appartengono a diverse categorie e sottocategorie di prodotto. Vogliamo calcolare la somma delle quantità vendute per ogni categoria e sottocategoria.
Dobbiamo prima di tutto estrapolare dal nostro elenco ogni combinazione categoria/sottocategoria unica, unvoca. Possiamo selezionare le due colonne relative a categoria e sottocategoria ed eliminare i duplicati. Ovviamente copiando prima altrove tutta la tabella iniziale, altrimenti perderemmo i dati originali:
Adesso possiamo cancellare la colonna Order ID duplicata (che non ci serve più) e possiamo cancellare anche i valori della colonna Quantity (che saranno rimpiazzati con le somme aggregate) e avremo il nostro elenco di categorie/sottocategorie univoche.
Vediamo come funziona la funzione SOMMA.PIÙ.SE:
Nella cella I2 Somma le quantità della colonna D di tutti gli ordini che hanno una categoria nella colonna B uguale alla categoria in G2 e di tutti gli ordini che hanno una sottocategoria nella colonna C uguale alla sottocategoria in H2. Simbolo del dollaro per le due colonne B e C che devono rimanere fisse e possiamo trascinare la formula verso il basso.
Stessa cosa con la formula =CONTA.PIÙ.SE($B:$B;G2;$C:$C;H2) con l’unica differenza che la funzione conta non ci farà scegliere una colonna di valori su cui eseguire il calcolo, perché deve solo contare il numero di voci.
Vediamo ora come ottenere lo stesso risultato su Alteryx:
Un solo tool, il Summarize Tool, nel quale possiamo decidere come raggruppare i dati (i SE delle funzioni ____.PIÙ.SE) e quale operazione effettuare (il SOMMA/CONTA/MEDIA delle funzioni di Excel. E in più la possibilità di effettuare una varietà di operazioni, e non solo prettamente matematiche: