Insights / Blog

Ottenere output e risultati in Trifacta

output-e-risultati-in-trifacta

Ciao e bentornato nel nostro periodico appuntamento con la rubrica dedicata a Trifacta! Questo fa parte di una serie di articoli che ci impegniamo a pubblicare settimanalmente, per accompagnarti passo dopo passo alla scoperta della piattaforma Trifacta.

Se non hai ancora letto il precedente capitolo lo trovi qui: Importare i dati in Trifacta.

Se invece lo hai già letto, ti sarai appena loggato in cloud su Trifacta. E adesso?
Andiamo a scoprire come ottenere un Output e come gestire i risultati in Trifacta.


Ottenere output in Trifacta



Un output è definito come un insieme di file o tabelle, formati e posizioni in cui i risultati vengono scritti al termine di un lavoro eseguito sulla Recipe. Per eseguire un lavoro da un flusso, è necessario creare un oggetto di output che definisca la destinazione dei risultati dopo che un flusso è stato eseguito correttamente.
Ogni flusso richiede un output per pubblicare i risultati in Trifacta. Un oggetto di output è composto da una o più azioni di pubblicazione. Un’azione di pubblicazione definisce il tipo di output, il formato, la posizione e altre impostazioni in cui vengono prodotti i risultati di una Recipe.
È possibile creare azioni di pubblicazione in più formati e pubblicarle in database e formati di archiviazione file diversi.

Di seguito sono riportati i tipi di output:
– Output basati su file come CSV o JSON.
– Output basati su tabelle come Oracle o PostgreSQL.

È possibile utilizzare uno dei metodi seguenti per creare un oggetto di output e la relativa azione di pubblicazione.


Dalla Flow View


Nella Flow View, un oggetto di output si estende da una Recipe, indicando che i risultati della ricetta vengono consegnati all’oggetto di output.
1. Apri il flusso in Flow View.
2. Nella Flow View, puoi: fare clic con il pulsante destro del mouse su una Recipe. Selezionare Aggiungi output per l’esecuzione oppure se esiste già un output, selezionarlo.
3. L’output viene visualizzato nel pannello Dettagli sul lato destro.
4. Nella colonna Dettagli in Impostazioni manuali, fare clic su Modifica.
5. Nella pagina Impostazioni di pubblicazione, fare clic su Aggiungi azione di pubblicazione.

Suggerimento: per le esecuzioni pianificate del flusso, è necessario specificare Impostazioni pianificate per generare automaticamente l’output quando il flusso viene eseguito da una pianificazione. Per ulteriori informazioni sulla pianificazione, vedere Panoramica della pianificazione.*


Dalla pagina dei Job



Per un output esistente, puoi creare nuove destinazioni dalla pagina Esegui Job.
1. In Visualizzazione flusso, fare clic su Esegui processo.
2. Nella pagina Esegui lavoro, fare clic su Aggiungi azione per aggiungere una nuova destinazione.

Una volta impostato l’output e scelto il tipo di formato (CSV o JSON) avrai a disposizione le seguenti opzioni:

risultati-in-trifacta

Compressione: i file di output non vengono compressi.
Numero di file: gli output sono contenuti in un unico file.
Intestazioni: il formato file CSV supporta l’inserimento di intestazioni come prima riga nell’output.
Con virgolette: i valori dei campi nel file sono contrassegnati da virgolette (“).
Delimitatore: i campi (colonne) sono separati nel file da virgole (,).

Nel prossimo articolo andremo a vedere insieme come gestire i propri output dalla pagina dei job details.

Per ulteriori domande su Trifacta ti invitiamo a contattarci all’indirizzo: info@theinformationlab.it

Speriamo che questo articolo ti abbia incuriosito e che continui a seguire il nostro blog. Alla prossima!

Blog
Manufacturing Analytics: cos’è e come impatta l’ottimizzazione dei costi

Manufacturing Analytics: cos’è e come impatta l’ottimizzazione dei costi

Il Manufacturing Analytics è l’ultima frontiera dell’evoluzione dell’industria manifatturiera, sempre spinta dalla necessità di rimanere...

Blog
Data analytics tool: i 4 fattori da considerare per sceglierlo

Data analytics tool: i 4 fattori da considerare per sceglierlo

I data analytics tool svolgono un ruolo fondamentale nel processo di analisi dei dati, ormai...