Quando si parla di data mining e analisi di dati, non si può non pensare anche all’analisi automatica del testo, la cosiddetta text analysis, da cui poter estrapolare parole chiavi presenti nelle frasi o, addirittura, capire il “sentiment” di un brano o di una frase.
Tutto ciò sembra quasi fantascientifico e sicuramente fuori dalla nostra portata, ma la verità è che anche con Alteryx si possono fare delle analisi di questo tipo, e in questo blog scopriremo come.
In questo momento, ciò che viene utilizzato è una API di Microsoft, Azure, a cui Alteryx si collega tramite il tool “Cognitive Service Text Analytics”. La configurazione del tool è molto semplice:
Nel campo “Field for Analysis” inseriamo il nome della colonna che contiene il testo da analizzare, mentre nel campo “Analysis Type” selezioniamo il tipo di informazione che vogliamo estrapolare dal testo. Si può scegliere fra la scoperta della lingua in cui è scritto il testo, l’estrazione delle frasi chiave oppure l’analisi del sentimento della frase. In particolare, questa terza opzione restituisce, per ogni frase analizzata, un valore compreso tra 0 e 1, dove 0 indica un sentimento completamente negativo e 1 un sentimento del tutto positivo.
I primi due campi, invece, richiedono le credenziali del servizio Azure. Il servizio è gratuito, dietro registrazione, fino a un massimo di 5000 richieste al mese, cioè 5000 frasi analizzate in uno dei tre modi (attenzione: per la stessa frase, se seleziono prima un tipo di analisi e poi un altro, mi conterà due richieste separate). I dettagli della registrazione e dei prezzi dell’API si trovano a questo link: https://azure.microsoft.com/en-gb/pricing/details/cognitive-services/text-analytics/ . In “Account Key”, quindi, va inserita la chiave fornita in sede di registrazione, mentre in “Endpoint” si seleziona l’endpoint associato alla chiave di account inserita.
Una volta configurato il tool e lanciato il workflow, il risultato ha questa struttura:
Poiché abbiamo utilizzato due volte il tool, una volta con Sentiment Analysis e una con Key Phrase Extraction, per ogni riga avremo una colonna con un numero fra 0 e 1 (l’analisi del sentimento, come detto prima) e un’altra con le frasi chiave estratte dal messaggio.
A questo punto, non abbiamo più bisogno di nessuna API, nessuna connessione a Internet e nessuna chiave, abbiamo già quello che ci serve e si tratta solo di fare un po’ di post-processing sul testo. Per esempio, nel nostro flow abbiamo diviso le varie parole chiave in modo da creare una riga per ognuna di esse, e poter poi creare una dashboard riepilogativa in Tableau.
Aggiungendo le informazioni anagrafiche degli utenti che hanno lasciato il messaggio, ad esempio, è stata creata la seguente dashboard:
Ma lì, poi, ogni utilizzatore si può sbizzarrire come preferisce per far sì che i dati in suo possesso siano il più “parlanti” possibile all’audience a cui si riferisce.
Spero che questo blog sul text analysis in Alteryx vi sia stato utile, alla prossima!