Home » Blog
Blog

ELK Stack: cos’è e a cosa serve
ELK Stack, acronimo di Elasticsearch – LogStash – Kibana, è un valido strumento per l’ingest e l’analisi dei dati in diversi contesti applicativi. Nato inizialmente per supportare la ricerca testuale, ad oggi le sue funzionalità sono aumentate considerevolmente. E’ possibile, infatti, fare l’ingest dei dati mediante Beats e LogStash e/o creare dashboard interattive di analisi mediante Kibana. Scopriamo le sue caratteristiche principali.

Google Cloud Storage: soluzione per i data lakes
Google offre diverse soluzioni per implementare un data lake. Tra queste, la più popolare è il Cloud Storage a causa della sua versatilità nella gestione dei dati e dei costi bassi. La configurazione del servizio richiede però alcune considerazioni a seconda del suo impiego. Scopriamo le sue caratteristiche e come ottimizzare le performance e i costi.

Data lakes: soluzioni in GCP
Nel mondo dei Big Data, la gestione dei dati grezzi ricopre un ruolo fondamentale. Nella maggioranza dei casi non è possibile caricare i dati forniti da diverse applicazioni in data warehouses al fine di creare modelli di Machine Learning o dashboards. I data lakes, ossia delle aree di sosta dei dati grezzi, ricoprono un ruolo fondamentale per effettuare le pipeline di trasformazione necessarie. Scopriamo quali soluzioni sono offerte da Google Cloud per implementare un data lake.

BigQuery: ottimizzazione delle performance
Nonostante BigQuery sia uno strumento molto valido per interrogare terabyte, è opportuno adottare delle best practices per migliorare le performance. Scopriamo i trucchi per scrivere query che vengano eseguite velocemente e che facciano risparmiare sui costi di esecuzione. Inoltre, analizziamo come è possibile ottimizzare la memorizzazione delle tabelle mediante il partizionamento e il clustering.

BigQuery: WINDOWS analitiche
In molti scenari applicativi, le statistiche che bisogna estrarre si riferiscono a raggruppamenti differenti sui dati di partenza. Mediante la definizione di finestre di aggregazione è possibile calcolare delle statistiche all’interno della stessa query. Inoltre, se necessario, è possibile anche fornire livelli differenti di granularità dei dati mediante la tipologia di dati degli ARRAY. Scopriamo queste funzionalità avanzate mediante due alcuni esempi reali.

BigQuery: funzioni GIS e Geo Vis
I dati geografici ricoprono un ruolo molto importante in diverse analisi. BigQuery include le funzioni GIS oltre allo standard SQL per interrogare, manipolare e analizzare questa tipologia di informazione. Scopriamo come usarle e visualizzarle mediante Geo Vis.