Si è da poco concluso l’evento Snowday 2021 di Snowflake, durante il quale è stato annunciato il rilascio di nuove funzionalità di prodotto che vanno ad ampliare l’attuale offerta del Data Cloud.
Vediamole assieme.
Supporto Python in Snowflake
Tra le novità più importanti comunicate durante il Snowday 2021 di Snowflake troviamo il supporto Python in Snowpark (attualmente solo in anteprima privata).
Snowpark consiste in una libreria DataFrame API utile per l’AI, grandi volumi ETL e altre streaming solutions, che è automaticamente deployata in un sandbox.
Snowpark permette agli sviluppatori di collaborare sui dati in diversi linguaggi e costrutti a loro familiari, e allo stesso tempo approfittando dei vantaggi di Snowflake in termini di sicurezza, governance e prestazioni.
Nei giorni scorsi quindi Snowflake ha annunciato che Python è supportato e integrato nativamente nell’engine di Snowpark. Il grande vantaggio di Python risiede nel suo ricco ecosistema di pacchetti open source. Negli ultimi anni infatti i pacchetti open source hanno fortemente contribuito allo sviluppo del mondo data science.
Integrando quindi Python in Snowpark, Snowflake ha voluto portare l’innovazione open source a livello di enterprise all’interno del Data Cloud di Snowflake, al fine di assicurare un’esperienza senza soluzione di continuità a data scientists e developers.
In particolare, attraverso la recente partnership con Anaconda e le integrazioni di prodotto, gli utenti di Snowflake che già beneficiano di un accesso quasi instantaneao e governato ai dati, ora saranno in grado di accelerare i loro flussi di lavoro basati su Python, sfruttando l’integrazione seamless con i pacchetti integrati di Anaconda.
Ciò permette inoltre ai data teams di operare con maggiore fiducia e sicurezza. Gli utenti possono collaborare utilizzando gli stessi dati ma con i loro linguaggi di programmazione preferiti, senza la necessità di copiare o spostare i dati. In questo modo si evitano copie non governate di dati, e tutto il codice viene eseguito in una sandbox altamente sicura all’interno di Snowflake, consentendo un ulteriore livello di protezione.
Altre innovazioni
In aggiunta al supporto Python, durante l’evento Snowday 2021 di Snowflake è stata confermata l’intenzione di continuare ad espandere la portata e le possibilità del Data Cloud, fornendo innovazioni uniche che consentono ai clienti di:
- Operare a livello globale
- Eliminare i silos
- Costruire più velocemente
- Creare nuovi business
Operare a livello globale
Sappiamo già che Snowflake offre già un’esperienza che va oltre il livello territoriale essendo appunto basata su un’architettura cloud.
In merito a questo tema, Snowflake ha annunciato miglioramenti significativi nell’efficienza della replica dei dati, con un miglioramento delle prestazioni fino al 55%, che a sua volta si traduce una riduzione del 55% dei costi di replica dei clienti, dal momento che i clienti pagano solo per ciò che utilizzano.
Inoltre, Snowflake ha ulteriormente semplificato le operazioni globali con l’annuncio della replica dell’account cross-cloud e cross-region in anteprima privata. Con questa nuova capacità, i metadati dell’account (dai controlli di accesso basati su identità e ruoli alle politiche di governance, ai monitor delle risorse ) possono essere ora sincronizzati automaticamente attraverso il cloud e le regioni. Questa funzionalità, assieme alla capacità di reindirizzamento del cliente recentemente annunciata, rende ancora più facile per le organizzazioni fornire dati – a quasi zero interruzioni – ai loro clienti e consumatori, anche in caso di interruzione del data center o di disastro naturale.
Snowflake ha anche ampliato le sue capacità native di governance, in modo che i clienti possano operare a livello globale garantendo la protezione e la sicurezza dei dati, attraverso due funzionalità:
- Visibilità del lignaggio in Access History (anteprima privata) – attraverso la quale i clienti possono approfondire il data lineage dei dati sia in arrivo da fonti esterne, sia nel flusso all’interno di Snowflake
- Object Dependencies (in arrivo in anteprima privata) – ha lo scopo di aiutare i team ad identificare quali oggetti dipendono da altri oggetti, in modo da porter valutare potenziali impatti “a valle”
- Il nuovo Governance Accelerated Program – ovvero un intero ecosistema di soluzioni e integrazioni fornite dai partner per aiutare i clienti a scoprire e proteggere i dati
Eliminare i silos
Snowflake continua la sua missione verso l’eliminazione dei silos, perseguendo un’esperienza unificata e coerente nella gestione e analisi di diversi tipi di dati (strutturati, semi-strutturati e non strutturati).
Ciò è possibile attraverso il supporto dei dati non strutturati (in anteprima pubblica), che include la possibilità di sfruttare la condivisione dei dati con viste sicure che fanno riferimento a dati non strutturati o arricchire quei dati attraverso lo Snowflake Data Marketplace.
Tutto ciò ha permesso ai clienti di costruire data lakes performanti e governati su Snowflake, aiutandoli anche a raggiungere maggiori performance in termini di agilità per implementare nuovi modelli architetturali emergenti.
Costruire più velocemente
Al fine di rendere la piattaforma uno strumento sempre più adatto alle esigenze dell’analytics, data processing e dello sviluppo di applicazioni, Snowflake continua a migliorare lo sviluppo della pipeline end-to-end.
Iniziando dall’ingestione dei dati, Snowflake ha apportato miglioramenti in Snowpipe. Una maggioranza di clienti ha sperimentato riduzioni di latenza media tra il 50-68% attraverso tutti i clouds. E con le attività serverless (ora in anteprima pubblica), si riducono drasticamente l’overhead operativo necessario per sviluppare, distribuire e mantenere le pipeline.
Anche l’introduzione di Snowpark – il framework Snowflake per i developer come menzionato sopra – contribuisce anch’essa alla costruizione di un’infrastruttura moderna, che delinea il futuro del data engineering e del data science.
Creare nuovi business
Il Data Cloud permette ai clienti di scoprire, condividere e collaborare su dati di first e third parties. Attraverso il suo Data Marketplace, Snowflake ha infatti semplificato notevolmente il processo di commercializzazione dei dati, consentendo agli utenti di scoprire e negoziare con i fornitori di dati direttamente nel Marketplace e consentendo un’opzione “prova prima di comprare”. Gli utenti possono anche approfittare di modelli di prezzi flessibili basati sull’uso nel Marketplace dei dati. Tutte queste capacità sono attualmente in anteprima privata.
Il numero di annunci disponibili nel Marketplace dei dati di Snowflake è cresciuto del 34% da giugno a ottobre, ed è fornito da oltre 200 partner. Anche il numero di connessioni edge stabili ha continuato a crescere, evidenziando relazioni sempre più continue tra fornitori e consumatori. I fornitori di dati stanno anche vedendo una crescita significativa in termini di nuovi clienti e nuovi business.
Speriamo che questo articolo vi abbia incuriosito e che continuiate a seguire il nostro blog.
Vi diamo appuntamento alla settimana prossima in cui andreamo ad approfondire ulteriormente le differenze tra Time Travel e Fail Safe!
Alla prossima! ❄️