Siete interessati ad Alteryx, allo JATD o alla Text Analytics?!?
Allora siete nel posto giusto! In questo breve articolo, vi racconterò la mia esperienza allo JATD e come Alteryx, può essere utile nella Text Analytics.
Cos’è lo JATD
Innanzitutto, che cos’è lo JATD? Lo JATD è un evento internazionale legato all’analisi statistica dei testi e quindi appunto alla Text Analytics. Quest’anno lo JATD, si è tenuto al CNR (Centro Nazionale delle Ricerche) a Roma dal 12 al 15 giugno , l’evento si tiene con cadenza biennale ed è aperto a tutte le persone che, per questioni accademiche, lavorative o di ricerca, hanno a che fare con la Text Analytics, di seguito il link alla pagina web dell’evento.
Perchè The Information Lab e Alteryx
Vi starete ancora chiedendo cosa c’entra The Information Lab ed Alteryx con lo JATD?
Oltre ad essere Sponsor dell’evento, ci stiamo sempre più specializzando sul tema della Text Analytics; ho tenuto personalmente uno speech di mezz’ora su come Alteryx può essere utilizzato per la Text Analytics.
(Ovviamente non vi voglio annoiare per mezz’ora, quindi riporto di seguito un breve Abstract che spero vi faccia incuriosire e nel caso venir voglia di approfondire la discussione).
Entrando nel vivo della discussione, perchè usare Alteryx?
Alteryx è una Analytics Platform che attraverso un ambiente più che user-friendly, ci permette di costruire workflows complessi e quindi permetterci di connettersi, unire, trasformare ed analizzare tutti i nostri dati, tutto senza fare scripting e con due semplici drag and drop.
Il software ci permette inoltre di:
- Compiere operazioni di Web Scraping direttamente da Internet e quindi di scaricare intere pagine html, di fare il parse della pagina attraverso le regular expressions (Regex);
- Big Data Management;
- Connetterci ad altri servizi esterni di Advanced Analytics, come ad esempio l’utilizzo delle chiavi API come ad esempio quelle di Azure Cognitive Services, attraverso Alteryx e l’utilizzo di questa possono essere fatte operazioni di Key Phrases Extraction, Sentiment Analysis e Language Dectection (come descritto nel dettaglio nell’articolo di Chiara);
- Connessioni ad altri Servizi Web, attraverso connettori custom a Twitter e altri Social Media;
L’immagine qui sopra, ad esempio un lavoro fatto per Gazzetta dello Sport da noi di The Information Lab; in questa abbiamo scaricato tutti i tweet del Giro d’Italia, riuscendo ad individuare da quello che postava la gente, qual è la nazione o location da cui viene seguito di più l’evento, chi ha vinto la tappa o l’orario al minuto degli eventi salienti!
Un esempio abbastanza curioso di Text Analytics e di utilizzo dell’Advance Analytics in Alteryx.
Risultato, è che osservando la dashboard e non avendo seguito l’evento su un normale mezzo di comunicazione si riesce comunque a capire tutto ciò!
(vi consiglio di andare a visitare la pagina di Tableau Public di The Information Lab Italia)
- Integrazione con R e Python e librerie già esistenti o create al momento, di questo c’è un blog secondo me esaustivo e che riporta ad un tool di Alteryx che potete anche scaricare;
Tutto questo è possibile farlo creando delle Macro, che possono essere più o meno complicate e che possono usare o meno tutti i servizi cui sopra.
Vi consiglio di andare a leggere anche il blog di Chiara (mi ripeto lo so) e di contattarmi nel caso siate interessati a fare analisi di questo genere!
Come sempre concludo il mio articolo ringraziandovi per avermi letto; e vi invito a leggere altri miei articoli da qui.
Potete inoltre seguirmi su Twitter, Linkedin e Tableau Public.
[button URL=”http://www.tableau.com/partner-trial?id=45890″]Download Tableau[/button] [button URL=”https://www.theinformationlab.it/newsletter-2/”]Iscriviti alla newsletter[/button]