Immaginiamo di esserci connessi per la prima volta a una fonte di dati e di aver impiegato molto tempo per settare al meglio i metadati. Vogliamo ora riproporre in futuro o condividere con altri la stessa formattazione dei metadati: possiamo fare ciò attraverso un Saved Data Source.
Per Saved Data Source si intende un file creato da Tableau e che possiede estensione .tds (Tableau Data Source).
Il file .tds non è altro che una sorta di short cut che permette di collegarsi ad una fonte di dati già formattata correttamente. Il file .tds quindi contiene solo le informazioni riguardanti i settaggi della fonte di dati, come ad esempio:
- campi rinominati (header, titoli colonne)
- filtri sul datasource
- formattazioni di numeri, date, ecc, ecc…
- colori e tutte le default proprieties
- parametri, campi calcolati o ancora gruppi o gerarchie.
È facile intuire perché creare dei Saved Data Source può rendere l’analisi dei dati più semplice e veloce.
Facciamo un esempio pratico. Mi connetto al Sample Superstore EU, il file d’esempio già presente in Tableau.
C’è una colonna che si chiama Order Date e abbiamo deciso a livello aziendale che debba chiamarsi “Date”. Vale per me e vale per tutti gli analisti.
Avrebbe senso se tutti gli analisti tutte le volte che si connettono al Sample Superstore EU, la prima cosa che devono fare sia rinominare la colonna Order Date in Date? Ovviamente no.
La modifica può essere fatta una volta sola, la prima volta, salvando un tds che altro non è che un file xml in cui è indicato che la colonna Order Date della connessione “C:/Emanuele/Documents/My Tableau Repository/Sample Superstore EU.xlsx” in Tableau debba essere rinominata in Date.
Se apro in Tableau il file excel originale, la colonna si chiamerà Order Date.
Se apro in Tableau il tds, la colonna si chiamerà Date.
Immaginate il file tds come una sorta di mantello che si appoggia alla fonte dei dati originale e sovrascrive tutte le modifiche di default che abbiamo deciso (filtri, formattazioni, colori, campi calcolati, colonne nascoste….)
Ora che il Saved Data Source è stato creato, non ci resta che condividerlo con tutti gli analisti che lo devono utilizzare, di modo che possano sfruttare anche loro le modifiche fatte. A seconda della disponibilità in azienda di Tableau Server, avremo 2 differenti opzioni.
Condividere il Saved Data Source in locale
Se non abbiamo Tableau Server in azienda, un metodo per condividere i Saved Data Source è quella di salvare in locale il file .tds e condividerlo con gli altri analisti, sfruttando ad esempio una cartella di rete condivisa.
Per farlo basterà cliccare col tasto destro sul nome del datasource in Tableau e scegliere “Add to Saved Data Sources“. Ci verrà chiesto dove salvare il file .tds.
Ora capite bene che se salvo un file .tds in cui c’è scritto che la colonna Order Date del file Sample Superstore EU.xlsx deve essere rinominata in Data e salvo il .tds in una cartella di rete a cui abbiano accesso anche gli altri analisti, la prima cosa che farà Tableau, quando facciamo doppio clic sul .tds, sarà andare a cercare il file Sample Superstore EU.xlsx che si trova in C:/Emanuele/Documenti.
Cosa succede se gli altri analisti non accesso alla mia cartella documenti? Tableau avviserà che la base di dati non è accessibile, non trova il file excel.
Quindi data source originale e Saved Data Source (xlsx e tds) devono sempre stare entrambi in un posto, che dovrà essere accessibile a chiunque necessiti di connettersi al datasource.
Condividere il Saved Data Source su Tableau Server
Se invece in azienda abbiamo Tableau Server, potremo sfruttarlo non solo per pubblicare workbook e dashboard, ma anche i datasource.
In questo specifico caso, gli analisti non si connetteranno più al file excel in locale, ma si connetteranno a un tdsx (Packaged Tableau Data Source) che risiede sul server e che, essendo pacchettizzato, contiene il file excel (opportunamente criptato) più il tds.
Per pubblicare su server possiamo andare al menù “”:
Ci verrà mostrata una finestra che ci permetterà di impostare le varie opzioni:
- Project: scegliere il project in cui vogliamo pubblicare il data source
- Name: scegliere il nome in cui vogliamo pubblicare il data source
- Description: scrivere una descrizione
- Tags: aggiungere dei tag
- Refresh: schedulare dei refresh nel caso in cui stiamo pubblicando un extract di Tableau che necessita di essere aggiornato ogni X tempo
- Permission: settare i permessi, per decidere quali utenti Tableau Server possano interagire con il datasource e come
- Update workbook to use the published datasource: fare un replace del datasource subito dopo la pubblicazione. In questo momento il workbook è connesso al file excel che si trova in My Tableau Repository. Dopo la pubblicazione è possibile dire a Tableau di fare un replace del file locale con quello appena pubblicato.
Rientrano tra le best practice per la pubblicazione di data source su server:
- salvare i file con nomi appropriati, nomi parlanti, che facciamo capire immediatamente cosa contiene il data source
- inserire delle descrizioni in modo che i vari utilizzatori capiscano esattamente cosa contiene il data source
- inserire dei tag per semplificare eventuali ricerche di contenuti in Tableau Server e Online.