Insights / Blog

Che cos’è Aggregate data for visible dimensions?

Da dove partire?

L’aggregate data for visible dimensions è un opzione del menù Extract di Tableau che ci permette di creare degli estratti più performanti.

Come spesso accade, ci connettiamo a basi di dati che hanno molte più righe e colonne del necessario, magari perché anziché creare delle tabelle o delle viste ad-hoc per le analisi in Tableau, tendiamo ad avere un unico database che serve più dipartimenti aziendali, col risultato che alcune colonne potrebbero essere inutili per noi, ma utili per altri.

Sappiamo già che, le colonne che non ci servono, posso essere nascoste, andando a creare degli extract più piccoli in termini di colonne contenute.

L’aggregate for visible dimension ci permette di fare la stessa cosa, ma in senso verticale. Ci permette di andare a “risparmiare” righe di dato.

 

Facciamo un piccolo esempio: nel database ho come livello di dettaglio il singolo ordine di vendita di ogni negozio. La mia analisi però si spinge al massimo al livello del negozio.

Se un negozio ha fatto fatto 10 ordini di vendita, avrò 10 righe di dato. Ma se la mia analisi è a livello del negozio, quelle 10 righe sono totalmente inutili, sarebbe molto più comodo avere un’unica riga che somma già tutti gli ordini dei negozi.

Questa opzione ci permette in pratica di inserire – nell’extract – una clausola di “GROUP BY” le dimensioni visbili, le dimensioni che sto utilizzando. Andando quindi in certi casi a creare degli estratti con molte meno righe rispetto al database originale e quindi più performante.

Per stabilire quale aggregazione debba essere utilizzata per le metriche, possiamo andare nelle Default Properties delle metriche visibili e scegliere la default aggrgation.

Se imposto la default aggregation delle vendite su SUM, l’extract andrà a raggruppare le 10 righe di ordine sommando le vendite. Se impostiamo la default aggregation come AVG, le 10 righe verranno raggruppate calcolando la media delle vendite.

Problemi

Creando un’aggregazione c’è il rischio, come riportato nell’immagine sottostante, di incappare in un problema legato al tipo di calcolo che si effettua su un determinato campo.

Nel caso in cui volessimo applicare questa tipologia d’estratto su un campo che ha come calcolo applicato una media, dobbiamo ricordarci che l’opzione in questione si salverà in memoria solamente il campo visibile, e quindi non tutti i valori che compongono quel campo.

 

Nell’esempio possiamo vedere come Tableau ci avvisi di questo problema. In questo caso specifico, il campo AVG(Discount), dopo aver fatto “aggregate data for visible dimensions” sarà composto solamente da un valore che rappresenta la media e non da tutti i valori che vengono usati per calcolarla. Questo problema di presenta con tutte le aggregazioni diverse da MIN, MAX o SUM.

Pensiamo ad esempio all’aggregazione COUNT, che conta un determinato valore. Contare un valore equivale a contare quante volte una riga che contiene quel valore si ripete. Se il COUNT del negozio valeva 10 perché avevo 10 ordini, dopo l’aggregate for visible dimensions il conteggio varrà 1, perché mi è rimasta una singola riga per ogni negozio.

Questa funzionalità degli extract di Tableau ci permette quindi di creare degli estratti ridotti e che performano meglio, ma dobbiamo stare attenti ad autilizzarli in modo corretto, capendo tutte le ripercussioni sui calcoli che questa opzione potrebbe causare.

Pharma
Predictive analytics healthcare

Predictive analytics healthcare: come l’AI rivoluziona la medicina

Il mondo dell’healthcare è storicamente legato ai dati. Gli esami, le diagnosi, i successi degli...

Blog
tableau pulse

Tableau Pulse: La GeneAI sbarca su Tableau

Tableau Pulse, introdotto da Salesforce come parte della suite Tableau AI, sfrutta l’intelligenza artificiale generativa...