Distinguere tra questi diversi oggetti mi ha confuso all’inizio.
Penso che la confusione sia iniziata quando mi sono immerso nella piattaforma Tableau Next (e più in generale in Salesforce) e ho iniziato a costruire cose per capire come funzionavano. Durante la creazione di un modello semantico, ho notato che c’erano tre categorie di oggetti dati che si potevano aggiungere, ma io ne avevo solo una:
- Data Lake Objects (DLO)
- Data Model Objects (DMO)
- Calculated Insights (CIO)
Avevo solo DLO perché avevo caricato i dati personalmente nella piattaforma, senza ancora costruire nulla sopra. Questo però mi ha lasciato il dubbio su cosa fossero gli altri…
Ma prima, cos’è un DLO?
Se vuoi acquisire (ingest) dati, devi caricarli nella piattaforma, e l’oggetto che crei è un DLO. Si tratta semplicemente di dati archiviati da qualche parte, come in un bucket S3. Se vai a vedere i dettagli del “data stream” (che crea il DLO), vedrai infatti un indirizzo S3.
Usa i DLO per acquisire o memorizzare dati grezzi nel Data Cloud, senza trasformazioni.
Cos’è un Data Model Object (DMO)?
Un DMO si posiziona sopra uno o più DLO, collegandoli tra loro e aggiungendo un po’ di metadati aggiuntivi. Il risultato è un oggetto dati riutilizzabile e governato che rappresenta un concetto di business.
I DMO sono le “tabelle” di dati con cui gli utenti business interagiranno.
Cos’è un Calculated Insight Object (CIO)?
Pensa ai CIO come a risultati calcolati riutilizzabili derivati dai DMO. In altre parole, i CIO sono calcoli materializzati. Ti aiutano a ottimizzare i tempi di elaborazione, permettendoti di fare riferimento a questi risultati da dashboard, concierge o agent, senza dover ricalcolare ogni volta.
I CIO sono calcoli materializzati basati sui DMO.
Riepilogo
- DLO – Archiviazione grezza dei dati acquisiti (tabelle).
- DMO – Oggetto dati “business-ready”, creato a partire dai DLO.
- CIO – Risultati o insight calcolati e riutilizzabili, costruiti sui DMO.