Insights / Blog

Guida completa alla Data Visualization: Definizione, Strumenti e Vantaggi

finance data visualization

Cos’è la Data Visualization

La data visualization è imperativa per qualsiasi impresa che voglia sposare l’approccio data driven, cioè basare la propria strategia sui dati e su ciò che essi raccontano. La data visualization è la tecnologia che permette di dare forma ai dati, trasformandoli in grafici, tabelle e istogrammi per far sì che le informazioni siano più facili da interpretare e condividere.  

I dati derivano da molte fonti come ad esempio persone, macchine e dispositivi connessi a Internet. Ogni tipologia di dato deve essere raccolta, organizzata e, soprattutto, resa interpretabile. È qui che entra in gioco l’utilità della data visualization. 

La data visualization interpreta un ruolo chiave perché rende il dato fruibile anche a chi non ha esperienza di business intelligence e di data management. Tutti i reparti dell’azienda, soprattutto i decisori aziendali, possono leggere i dati perché essi sono stati semplificati. I grafici fanno emergere le correlazioni tra i dati, un aspetto ancora più importante dei dati stessi: le vendite sono aumentate o diminuite? Quale percentuale dei clienti ha risposto positivamente a una strategia di marketing? Per quanto tempo uno specifico prodotto è rimasto in magazzino prima di essere spedito? Il compito della data visualization è fornire riscontri facili e immediati a questi quesiti. 

Come funziona la data visualization

Alla base della data visualization c’è questa idea: è più efficace comunicare un messaggio attraverso una rappresentazione grafica.  

Trasformare grandi quantità di dati in grafici è importante: i decisori aziendali possono avere il quadro della situazione, delle tendenze e delle previsioni più facilmente e velocemente. Gli stessi dati sarebbero praticamente inaccessibili se restassero sotto forma di informazioni testuali e numeriche. 

La data visualization fa uso di metafore legate al mondo fisico. Sarebbe come far vedere a una persona due tubi di lunghezze diverse: capirebbe subito qual è il più lungo. Lo stesso vale per il taglio di una torta: è facile capire qual è la fetta per l’adulto (più grande) e quella per un bambino (più piccola). Lo stesso discorso vale per le rappresentazione grafiche legate al business, di cui la data visualization è la massima espressione tecnologica. 

La data visualization, in sostanza, fornisce a chi osserva i dati un nuovo contesto per comprendere un fenomeno ed evidenziare correlazioni che altrimenti resterebbero nascoste o molto difficilmente comprensibili.

Correlazioni, quote e comparazioni: i grafici più usati

La scelta della rappresentazione visiva è fondamentale perché ciascun tipo di grafico fornisce un’analisi differente. Un grafico a torta, per esempio, dà un’indicazione della quota di un fenomeno (in percentuale) rispetto a un totale. Una comparazione nominale (un grafico a barre) è da preferire, invece, se si vogliono confrontare determinate categorie di prodotti o servizi. 

Le tipologie di analisi più diffuse sono:

 – Serie storiche (grafico a linee)

Le rappresentazioni a linee sono molto diffuse perché facili da interpretare. Sono utili, per esempio, per tracciare l’andamento di un fenomeno nel tempo e per valutare le tendenze mentre aumentano o diminuiscono. Inoltre, le serie storiche permettono di inserire più linee e quindi di valutare contemporaneamente diversi fenomeni all’interno del medesimo riferimento temporale. 

Ranking (grafico a barre)

I grafici ranking sono ottimi per confronti semplici. Uno degli esempi tipici è la piramide demografica, che viene utilizzata quando bisogna discutere di tendenze sociali su larga scala. I grafici a barre vengono invece preferiti quando ci sono molteplici variabili in gioco e ognuno degli elementi viene valutato in un dato periodo di tempo. Un caso pratico è la necessità di confrontare l’attuale stato di un fenomeno rispetto alle previsioni nel prossimo futuro. 

Quote (grafico a torta)

Per comparare la quota di un fenomeno rispetto al totale viene tipicamente usato un grafico a torta. Il caso d’uso tipico è la suddivisione del budget aziendale. 

Correlazione (grafico a dispersione)

Mostrare come un elemento si inserisca in un contesto ampio è uno dei compiti più importanti della data visualization: non è il singolo elemento a essere importante, bensì come rappresenta una tendenza. Per le correlazioni tra due elementi, il più usato è il grafico a dispersione, dove è facile determinare se le due variabili si muovono nella stessa direzione o, al contrario, in senso opposto. 

Distribuzione di frequenza (grafico a barre e scatole con baffi)

Per questa categoria vengono preferiti gli istogrammi e il diagramma a scatola con baffi. Viene usata per mostrare il numero delle osservazioni durante un certo periodo di tempo. Per esempio, i ricavi durante un trimestre suddivisi per ogni reparto dell’impresa.

Comparazione nominale (grafico a barre)

È il metodo più popolare per i confronti diretti tra due elementi. Due barre che vanno in direzioni opposte mostrano istantaneamente la differenza tra uno stesso elemento condiviso fra due categorie. Un esempio potrebbe essere il confronto della quantità di prodotti appartenenti alle stesse categorie merceologiche venduti da due filiali dello stesso gruppo.

Rappresentazione geografica (mappa geografica)

Con questo grafico, invece, viene usata una rappresentazione termica su una mappa geografica. È molto utile, per esempio, per capire quali siano i mercati più profittevoli e quali, invece, quelli con il ritorno dell’investimento più basso: le prime saranno più scure, mentre le seconde più chiare.

Quali benefici apporta all’impresa la data visualization

La data visualization è propedeutica al processo di decision making, in quanto agevola i decisori aziendali fornendo loro insights di valore.  

La data visualization permette di:

 – Riconoscere rapidamente nuove tendenze

La semplicità e la chiarezza delle dashboard e dei grafici realizzati per mezzo della data visualization agevolano le decisioni anche in chiave futura. Sfruttando varie tipologie di grafici è facile intercettare una nuova tendenza quando è agli albori. 

Condividere insights con i decisori aziendali

L’intero assetto decisionale di un’impresa ha molteplici competenze, che spesso non riguardano il data management. La data visualization, quindi, rende fruibili i dati e, in particolare, ciò che queste informazioni raccontano (quote di mercato, correlazioni, tendenze, etc) a tutti i livelli. 

Dare un senso ai dati

Ogni impresa poggia su una base molto consistente di Big Data, molti dei quali sono disordinati e difficili da decifrare. Il compito del data visualization expert è quello di prendere questo caos informatico e dargli un ordine, rendendolo fruibile all’interno di un grafico o di una tabella. I dati possono comunicare velocemente, anche live, il proprio significato, segnalando, per esempio, un problema di produttività oppure una situazione (positiva o negativa) che non era ancora evidente. 

– Interagire direttamente con i dati

Oltre a permettere di leggerli facilmente, la data visualization agevola la gestione stessa di questi dati garantendo un’interazione diretta. Mentre le tabelle monodimensionali permettono soltanto di vedere i dati, gli strumenti di data visualization permettono di interagisce con tali informazioni e avere una visione più ampia, filtrando i dati di maggiore interesse o approfondendo aspetti ritenuti più interessanti, rende quindi la visualizzazione dei dati anche interattiva. 

Analizzare il customer sentiment in modo preciso

La data visualization è importante per valutare con maggiore precisione la risposta dei clienti. Avere insights più precise riguardo al customer sentiment permette, per esempio, di decidere con maggiore cognizione di causa il lancio di un prodotto. 

Meno tempo nella preparazione dei dati

Molte imprese hanno un rapporto di 80:20 tra il tempo che viene speso per la preparazione dei dati e quello che viene dedicato all’analisi e all’interpretazione. Poco tempo viene dedicato all’effettiva analisi del dato e del rapporto. Gli strumenti avanzati di data visualization permettono di risparmiare tempo durante la prima fase e di ottenere risultati migliori nella seconda. 

Personalizzare i grafici

Uno dei benefici della data visualization è la possibilità di modificare a uso e consumo la rappresentazione, per esempio cambiando la forma del grafico per mettere in evidenza una correlazione differente oppure omettendo alcuni dati. Un vantaggio importante rispetto ai metodi tradizionali di rappresentazione dei dati.

Quali strumenti si possono usare per la data visualization

La data visualization ha bisogno di un supporto software. Molti di questi sono specificamente pensati alla data visualization, ma alcune funzioni sono integrate all’interno di soluzioni pensate, più in generale, per la Business Intelligence e l’analisi dei dati.  

Le soluzioni dedicate possono offrire caratteristiche specifiche ed esaudire esigenze settoriali. Per esempio, i software dedicati alla data visualization possono gestire set di dati molto ampi e dinamici, che vengono usati nelle operazioni che ruotano attorno ai Big Data (applicazioni di Machine Learning e Intelligenza Artificiale, per esempio), e supportano database esterni.  

In generale, i migliori strumenti per la data visualization integrano un ricco database di account (nell’ordine delle decine di migliaia) distribuiti per dozzine di Paesi, sono altamente personalizzabili e offrono funzioni trasversali. Una piattaforma di data visualization include svariati tipi di grafici e tabelle tra cui scegliere, supporta soluzioni software e framework di terze parti, al fine di garantire all’impresa un’integrazione fluida, oltre all’integrazione con linguaggi di programmazione, come Python, R e Matlab. 

Gli strumenti espressamente dedicati alla data visualization, per esempio, permettono di avere delle anteprime in tempo reale del risultato finale, importando rapidamente set di dati, e vedere la loro “forma” prima di esportare definitivamente il rapporto in forma visiva. La mole di dati spesso è sterminata: ecco perché i migliori strumenti di data visualization suggeriscono automaticamente il migliore grafico da usare dopo aver “letto” i dati che sono stati inseriti. 

Un ulteriore elemento che contraddistingue gli strumenti migliori per la data visualization è la possibilità di fruire della dashboard in modalità self-service, ossia senza la collaborazione di un esperto della materia. Si tratta di una tendenza sempre più ricercata perché l’intera impresa ha bisogno di conoscere i dati e non unicamente i decisori aziendali apicali o i tecnici IT. 

Ogni soluzione per la data visualization, infine, punta su un aspetto differente: chi sulla semplicità dell’interfaccia e chi, per esempio, sul supporto alle piattaforme di terze parti. Tutte permettono, in ogni caso, di importare i dati da fonti eterogenee, un aspetto critico della data visualization. 

Come gestire i Big Data: grafici e filtri

Nella data visualization il fiume di dati può causare alcuni grattacapi perché in molti casi le informazioni sono misurate in milioni di unità. In questi casi, vengono in soccorso una serie di consigli utili e pratici che permettono di gestire agilmente grossi volumi di dati. Molti di questi, inoltre, sono dati non strutturati, quindi difficili da interpretare. Soprattutto in questi scenari, scegliere il grafico ideale è essenziale per lavorare con i Big Data e fornire la miglior rappresentazione visiva possibile

Le nuvole di parole

Le nuvole di parole (word clouds) sono una rappresentazione visiva molto chiara: più grande è la parola e maggiore è il numero di volte che è stata registrata, per esempio, nei commenti sulla pagina Facebook dell’azienda. Il riscontro è immediato nonostante la base di dati sia immensa. Queste informazioni possono essere racchiuse automaticamente in alcune macrocategorie. Gli utenti possono cliccare su queste categorie per approfondire le parole che sono state incluse al suo interno. 

Il diagramma a scatola e baffi

Il diagramma a scatola e baffi (noti anche con l’espressione inglese “box plots”) è un altro metodo molto usato per gestire grandi quantità di dati non strutturati. In questo grafico, ogni rettangolo è diviso in due parti, da cui escono due segmenti. Il rettangolo (cioè la scatola) identifica il primo e il terzo quartile ed è diviso da una linea che segna la mediana. Le due linee (i “baffi”, che possono essere orizzontali o verticali) mostrano il dato minimo e quello massimo. 

Diagramma a rete

I diagrammi di rete (o network diagrams) possono essere usati in applicazioni e discipline eterogenee: un’impresa può analizzare il sentiment degli suoi utenti sui social network, mentre le forze dell’ordine possono avere un riscontro visivo sul traffico di un’organizzazione criminale. Come funzionano? Specialmente se il diagramma a rete viene posto sopra una mappa geografica, le varie linee uniscono città e regioni: più è spessa una linea e più dati ci saranno. Questo grafico, per esempio, può indicare le zone verso cui le spedizioni di un prodotto sono più frequenti. 

Filtrare i Big Data

Un aspetto importante da considerare quando un’impresa deve gestire grandi quantità di dati, è sapere filtrare velocemente quali informazioni siano realmente importanti per l’azienda. Per esempio, potrebbe essere necessario filtrare i dati secondo parametri geografici o per linee di prodotto. Gli strumenti di data visualization offrono filtri facili da usare, o impostando parametri. Così facendo è possibile adottare un approccio meno invasivo e meno prono a errori di selezione dei dati.  

I vantaggi della data visualization rispetto a Excel

Il mondo digitale è immerso nei dati, che devono essere raccolti e trasformati in insights per i decisori aziendali. La risposta di molte imprese è usare i grafici di Excel o di un altro software di fogli di calcolo. Il risultato finale, però, non è quello auspicato: produrre un rapporto è un’operazione lenta, senza scordare che l’errore umano nella trascrizione dei dati e nella realizzazione dei grafici è molto frequente. 

La data visualization offre una serie di benefici evidenti rispetto a Excel. Per esempio: 

Molti più grafici fra cui scegliere

Avere un riferimento visivo è più semplice e comodo per tutti. Rispetto a Excel, i software di data visualization integrano una più ampia opzione di grafici, come le mappe termiche. Queste rappresentazioni visive offrono un immediato riscontro e i decisori aziendali hanno immediatamente la risposta che stavano cercando. 

I dati sono interattivi

I grafici e le tabelle di Excel sono statici e vengono usati prevalentemente per evidenziare se un andamento è positivo o negativo. La data visualization permette invece di interagire con i dati filtrando oppure ordinando in modo diverso i dati affinché possano offrire ulteriori risposte su vari aspetti del business. 

Decisioni migliori

Se il messaggio comunicato dai dati viene recepito immediatamente e chiaramente, la decisione finale sarà più accurata. Gli strumenti di data visualization permettono di avere un riscontro chiaro delle correlazioni tra le condizioni operative e le prestazioni commerciali. Ciò permette, per esempio, di identificare la causa principale di un problema e di simulare le azioni che potrebbero essere usate per porre rimedio. 

Le linee di business sono interconnesse

Un’impresa che funziona bene è una realtà dove tutti i reparti sono sincronizzati. La data visualization abilita una nuova prospettiva sull’intero business e sulle sue modalità operative. Ogni figura (dall’amministratore delegato fino al responsabile IT) possono usare gli analytics per avere il polso delle prestazioni, dei margini disponibili per migliorare la produttività e ottimizzare il ritorno dell’investimento. 

I dati sono affidabili

Lavorare sui fogli Excel è un’attività facilmente soggetta a errori umani. La condivisione di informazioni attendibili e credibili non può prescindere dall’attendibilità e dalla purezza del dato. Gli strumenti di data visualization connessi con i gestionali aziendali offrono insights di valore attraverso un’integrazione fluida ed evoluta. 

Previsioni in tempo reale

La tempestività è importante. Un rapporto vecchio di due settimane fornisce una prospettiva datata e che rischia di mettere l’impresa in una posizione di svantaggio rispetto alla concorrenza. Uno dei principali benefici della data visualization è nei modelli predittivi che aiutano i decisori aziendali a prendere decisioni in tempo reale e, anzi, anche in anticipo. 

La self-service data analytics è sempre più una necessità

Le migliori imprese data-driven lo hanno capito da tempo: gli insights non sono soltanto merce per i decisori aziendali. Tutti i reparti devono essere sincronizzati e, cosa ancora più importante, tutti gli utenti business devono poterne usufruire autonomamente, senza doversi appoggiare all’esperto. È qui che entra in giro la self-service data analysis. 

Ciò garantisce un ambiente di lavoro migliore, dove tutte le persone si sentono utili e possono produrre a un ritmo regolare. Inoltre, la self-service data analysis dà un vantaggio competitivo importante all’impresa e agevola il flusso del lavoro perché la comunicazione ne esce agevolata e semplificata. 

In questo contesto, assume un’importanza centrale la figura del data visualization expert, il cui compito è quello di configurare dashboard e visualizzazioni interattive che siano accessibili a un ampio ventaglio di utenti, anche poco competenti nella materia. Ciò permette di abbattere le barriere nell’utilizzo dei sistemi di data visualization, rendendo gli insights generati accessibili a più persone. Nei sistemi più avanzati, i dati possono essere fruiti anche tramite soluzioni di realtà virtuale e altre tecniche innovative

L’evoluzione degli strumenti di data visualization e, più in generale, di data analysis ha permesso di fornire a un numero maggiore di utenti aziendali le capacità necessarie per modificare i dati e per preparare presentazioni migliori. 

La self-service data analysis pone l’accento, però, su un’ulteriore questione: la data governance aziendale. Nel momento in cui più persone, spesso non adeguatamente formate sulla materia, interagiscono con i dati e, anzi, adattano il proprio lavoro di conseguenza, è fondamentale che l’impresa segua le best practice e, soprattutto, assuma un responsabile della data governance per potersi attivare in ottica data-driven

L’importanza della qualità del dato nella data visualization

Un ulteriore aspetto della data visualization e della Business Intelligence più in generale è la data quality, ossia la qualità del dato. Non si tratta unicamente di valutare la veridicità di tale informazione, bensì prendersi cura del suo aggiornamento e di un’adeguata rappresentazione. La data quality è una caratteristica essenziale che determina l’affidabilità del processo di decision-making. 

La qualità del dato è sempre più critica poiché i Big Data sono un asset rilevante per le imprese e viaggiano sempre più frequentemente e più velocemente in ogni reparto dell’azienda. In tale contesto, vanno inseriti la compliance, l’integrazione, l’accesso e il riutilizzo delle informazioni da numerose fonti. 

La data quality non beneficia soltanto il decision-making: l’intera impresa ne trae vantaggio. Un dato di buona qualità permette ai dipendenti di essere più produttivi. Anziché perdere tempo nel validare e correggere gli errori nei dati, essi possono focalizzare la loro attività per far crescere l’impresa. Viceversa, una cattiva data quality può avere effetti negativi pervasivi in tutte le aree aziendali.  

Un esempio concreto dell’importanza del dato è il marketing: senza dati affidabili e aggiornati, la comunicazione sarà imprecisa e non adeguata a gestire correttamente i segmenti di mercato predisposti. La comunicazione, in sostanza, perderà di efficacia e non svolgerà il suo compito. 

Data quality: come ottenerla

Come assicurare la qualità del dato? Ci sono diverse linee guida di cui tener conto: 

Usare strumenti di data profiling

Esistono software specifici per la data quality. Bisogna considerare, innanzitutto, che tanti dati usati dalle imprese provengono dall’esterno: aggregatori di terze parti o un’altra azienda, per esempio. Per questo, il primo passaggio verso un dato di qualità è quello di applicare un filtro all’ingresso. Gli strumenti di data profiling analizzano aspetti come il formato del dato, la sua consistenza, la sua storia e la completezza. È possibile anche automatizzare questo processo introducendo, inoltre, avvisi regolari riguardanti la qualità dei dati. 

Evitare dati doppi

È forse l’aspetto più delicato perché coinvolge la data governance dell’azienda e richiede una comunicazione efficiente in tutta l’impresa. Poiché i dati vengono usati da più reparti, è possibile che, pur provenendo da una singola fonte, possano crearsi dati o pezzi di dati duplicati. Quando questi entrano nel sistema, possono creare grattacapi difficili da sradicare. Come risolvere? Stabilendo un programma di data governance che definisca chiaramente la proprietà del set di dati e promuova la condivisione in modo da evitare i “silo”. Inoltre, è importante centralizzare il data asset management e il data modeling, che devono essere rivisti periodicamente. 

Integrare la data lineage traceability nella pipeline

Le data pipeline devono essere organizzate in modo preciso, così che all’aumentare del volume dei dati non crescano proporzionalmente i problemi collegati. Quando quest’ultimi avvengono, inoltre, l’impresa deve aver predisposto sistemi di data lineage traceability in modo da poter ripercorre a ritroso la strada e capire quale sia il problema alla base. Alcuni metodi sono il tracciamento di chiavi univoche per ciascun dataset oppure aggiungere un timestamp a ogni data record, così che rimanga un riferimento di quando un dato è stato modificato o cambiato l’ultima volta. 

Organizzare un team di controllo competente

Infine, è importante che un gruppo di Quality Assurance e di Production Quality Control supervisioni l’elevata data quality nell’impresa. Il primo si occupa di verificare la qualità del software e dei programmi ogni qualvolta avvengono delle modifiche. Il secondo, che spesso è parte integrante del team di Quality Assurance o di quello di Business Analysis, identifica eventuali errori nella qualità dei dati e altri scenari anomali nella produzione e li corregge prima che causino problemi agli utenti e ai clienti.

Dati in streaming e aspettative più alte: le nuove frontiere della data visualization

La data visualization (e più in generale la data analysis) è strettamente legata ai Big Data. Il modo in cui essi muteranno nel prossimo futuro – tantissimi dispositivi saranno connessi a Internet – influenzerà sia l’ingresso delle informazioni per la data visualization sia le stesse aspettative delle persone, che sono destinate ad aumentare. 

Sempre più dati in streaming

Nel prossimo futuro, la quantità di dati che sarà possibile usare aumenterà esponenzialmente: auto, dispositivi per la casa e smart city saranno lo standard, incrementando fortemente la quantità di dati che sarà possibile usare per fornire indicazioni grafica.  

Per tale ragione, i dati saranno sempre di più usati in streaming, esattamente come oggi guardiamo video e ascoltiamo musica senza salvarla in locale. Allo stesso modo, lo streaming dei dati permetterà di usarli più rapidamente e in maggiore quantità, ma senza gravare sul database. Soltanto una piccola porzione verrà effettivamente archiviata. Per di più, il flusso in streaming dei dati necessari per la data visualization impatterà anche il modo in cui “leggeremo” il mondo: ogni nuovo dato in ingresso avrà un impatto immediato, garantendo un aggiornamento ancora più rapido. 

Gli utenti aumenteranno le proprie aspettative

Le auto useranno cruscotti digitali. Le smart city sfrutteranno l’IoT e la realtà aumentata per fornire indicazioni e previsioni aggiornate in tempo reale. Nel prossimo futuro, le persone si aspettano che tali informazioni viaggino attraverso una rappresentazione grafica immediatamente riconoscibile. Le aspettative sulla data visualization e sulla sua efficacia sono quindi destinate ad aumentare. 

L’evoluzione della data visualization dovrà, insomma, assecondare l’evoluzione del digitale. Esattamente come oggi ci si aspetta che un’email arrivi in pochi secondi, allo stesso modo tra qualche anno i cittadini daranno per assodato che le mappe del trasporto pubblico siano interattive e aggiornate in tempo reale anziché pezzi di carta appesi al muro. Più le città diventeranno intelligenti e digitali e più i dati dovranno essere analizzati e, interpretati per diventare insights utili. 

Il percorso sarà anche inverso: dai grafici ai dati

Stanno iniziando a nascere strumenti, inoltre, che anziché convertire i dati in rappresentazioni grafiche permettono di effettuare il percorso inverso: dare un grafico in pasto a un algoritmo e far sì che quest’ultimo ne ricavi i dati inclusi. Si tratta di un approccio che cambia radicalmente la prospettiva e può fornire insights di valore in tempi rapidi anche tramite asset (grafici e tabelle) che oggigiorno rappresentano, invece, l’output del processo di data visualization. Questi sistemi sfruttano il riconoscimento ottico dei caratteri (OCR, Optical Character Recognition) e il deep learning per interpretare un’immagine ed estrarre una tabella di dati. 

Tags
Blog
product data management

Product data management: perché è cruciale nel 2024

Il Product Data Management sta consolidando il suo ruolo all’interno di tutte le attività e...

Snowflake
Snowflake Cloud Services

Snowflake Cloud Services: Quali sono e a cosa servono

Quando parliamo di Snowflake Cloud Services ci riferiamo a tutta una serie di servizi e...