Blog

Elasticsearch
Alessandro Fiori

ELK Stack: cos’è e a cosa serve

ELK Stack, acronimo di Elasticsearch – LogStash – Kibana, è un valido strumento per l’ingest e l’analisi dei dati in diversi contesti applicativi. Nato inizialmente per supportare la ricerca testuale, ad oggi le sue funzionalità sono aumentate considerevolmente. E’ possibile, infatti, fare l’ingest dei dati mediante Beats e LogStash e/o creare dashboard interattive di analisi mediante Kibana. Scopriamo le sue caratteristiche principali.

Leggi Tutto »
Google Cloud
Alessandro Fiori

Google Cloud Storage: soluzione per i data lakes

Google offre diverse soluzioni per implementare un data lake. Tra queste, la più popolare è il Cloud Storage a causa della sua versatilità nella gestione dei dati e dei costi bassi. La configurazione del servizio richiede però alcune considerazioni a seconda del suo impiego. Scopriamo le sue caratteristiche e come ottimizzare le performance e i costi.

Leggi Tutto »
Google Cloud
Alessandro Fiori

Data lakes: soluzioni in GCP

Nel mondo dei Big Data, la gestione dei dati grezzi ricopre un ruolo fondamentale. Nella maggioranza dei casi non è possibile caricare i dati forniti da diverse applicazioni in data warehouses al fine di creare modelli di Machine Learning o dashboards. I data lakes, ossia delle aree di sosta dei dati grezzi, ricoprono un ruolo fondamentale per effettuare le pipeline di trasformazione necessarie. Scopriamo quali soluzioni sono offerte da Google Cloud per implementare un data lake.

Leggi Tutto »
Google Cloud
Alessandro Fiori

BigQuery: ottimizzazione delle performance

Nonostante BigQuery sia uno strumento molto valido per interrogare terabyte, è opportuno adottare delle best practices per migliorare le performance. Scopriamo i trucchi per scrivere query che vengano eseguite velocemente e che facciano risparmiare sui costi di esecuzione. Inoltre, analizziamo come è possibile ottimizzare la memorizzazione delle tabelle mediante il partizionamento e il clustering.

Leggi Tutto »
Google Cloud
Alessandro Fiori

BigQuery: WINDOWS analitiche

In molti scenari applicativi, le statistiche che bisogna estrarre si riferiscono a raggruppamenti differenti sui dati di partenza. Mediante la definizione di finestre di aggregazione è possibile calcolare delle statistiche all’interno della stessa query. Inoltre, se necessario, è possibile anche fornire livelli differenti di granularità dei dati mediante la tipologia di dati degli ARRAY. Scopriamo queste funzionalità avanzate mediante due alcuni esempi reali.

Leggi Tutto »
Google Cloud
Alessandro Fiori

BigQuery: funzioni GIS e Geo Vis

I dati geografici ricoprono un ruolo molto importante in diverse analisi. BigQuery include le funzioni GIS oltre allo standard SQL per interrogare, manipolare e analizzare questa tipologia di informazione. Scopriamo come usarle e visualizzarle mediante Geo Vis.

Leggi Tutto »