Insights / Blog

Calcoli LOD – {EXCLUDE}

Continuiamo il nostro viaggio nelle LOD – Level of Detail calculations – con i calcoli EXCLUDE.

Come dice il nome stesso, “EXCLUDE” serve per escludere.

Facciamo subito un esempio. File Sample Superstore, questa volta la versione USA, non quella europea.

Cattura

Con questa tabella sto vedendo che Aaron Bergman si ripete 6 volte nel mio DB. Questo perché ha acquistato 6 oggetti (Product Name), come possiamo vedere dai dati sottostanti:

Cattura

Se aggiungiamo nella tabella anche l’Order ID, quel numero 6 ci verrà splittato, partizionato, in tutti gli acquisti differenti fatti da Aaron:

Cattura

Che cosa mi stanno dicendo questi dati? Che Aaron Bergman ha comprato in tutto 6 oggetti. 1 durante un primo acquisto. 3 in un secondo acquisto e 2 nell’ultimo acquisto che ha fatto.

E se io volessi creare una colonna lì accanto al count del Customer Name che riporti il totale di 6 per Bergman? Come faccio? Sono obbligata a togliere Order ID dalle righe. Ma io l’Order ID voglio tenerlo lì, perché voglio comparare il singolo ordine con il totale degli ordini.

Devo escludere dal calcolo l’Order ID anche se tecnicamente è lì presente. Ecco a cosa serve il calcolo EXCLUDE!

Cattura

Nella prima colonna abbiamo il conteggio del Customer Name che ci dice quanti oggetti ha comprato in ogni ordine. Nella seconda colonna abbiamo il totale degli oggetti acquistati senza considerare i singoli ordini.

Possiamo calcolare la % sul totale senza usare table calculations, che hanno i loro pro ma anche i loro contro.

Cattura

Oppure possiamo usare questi calcoli al posto delle constant line:

Cattura

Le barre grigie sono il nostro calcolo che esclude l’Order ID. Ho messo nel grafico anche una costant line rossa tratteggiata per pane, che riporta la somma del count del customer name, e vedete che arrivano allo stesso valore, si sovrappongono. Potremmo usare il calcolo LOD al posto della linea.

Blog
Databricks vs Snowflake

Databricks vs Snowflake: pro e contro delle piattaforme

Snowflake e Databricks sono leader tra le piattaforme cloud. Si tratta di servizi di Data...

Blog
big data healthcare

Big data healthcare: i numeri al servizio della sanità

Da sempre il mondo dell’healthcare ha basato le sue le evoluzioni e il suo progresso...