Google Cloud Storage: soluzione per i data lakes

Google offre diverse soluzioni per implementare un data lake. Tra queste, la più popolare è il Cloud Storage a causa della sua versatilità nella gestione dei dati e dei costi bassi. La configurazione del servizio richiede però alcune considerazioni a seconda del suo impiego. Scopriamo le sue caratteristiche e come ottimizzare le performance e i costi.

Data lakes: soluzioni in GCP

Nel mondo dei Big Data, la gestione dei dati grezzi ricopre un ruolo fondamentale. Nella maggioranza dei casi non è possibile caricare i dati forniti da diverse applicazioni in data warehouses al fine di creare modelli di Machine Learning o dashboards. I data lakes, ossia delle aree di sosta dei dati grezzi, ricoprono un ruolo fondamentale per effettuare le pipeline di trasformazione necessarie. Scopriamo quali soluzioni sono offerte da Google Cloud per implementare un data lake.

BigQuery: ottimizzazione delle performance

Nonostante BigQuery sia uno strumento molto valido per interrogare terabyte, è opportuno adottare delle best practices per migliorare le performance. Scopriamo i trucchi per scrivere query che vengano eseguite velocemente e che facciano risparmiare sui costi di esecuzione. Inoltre, analizziamo come è possibile ottimizzare la memorizzazione delle tabelle mediante il partizionamento e il clustering.

BigQuery: WINDOWS analitiche

In molti scenari applicativi, le statistiche che bisogna estrarre si riferiscono a raggruppamenti differenti sui dati di partenza. Mediante la definizione di finestre di aggregazione è possibile calcolare delle statistiche all’interno della stessa query. Inoltre, se necessario, è possibile anche fornire livelli differenti di granularità dei dati mediante la tipologia di dati degli ARRAY. Scopriamo queste funzionalità avanzate mediante due alcuni esempi reali.

BigQuery: funzioni GIS e Geo Vis

I dati geografici ricoprono un ruolo molto importante in diverse analisi. BigQuery include le funzioni GIS oltre allo standard SQL per interrogare, manipolare e analizzare questa tipologia di informazione. Scopriamo come usarle e visualizzarle mediante Geo Vis.

BigQuery: clausola WITH

L’estrazione dei dati e la loro analisi è un processo che richiede conoscenza delle sorgenti dati e capacità di scrittura di interrogazioni complesse. BigQuery, il database di Google, permette in modo semplice di accedere a terabyte di dati. La scrittura delle query però richiede metodo. Scopriamo la clausola WITH per aumentare la leggibilità delle nostre query.

AutoML Vision: classificazione di immagini

Lo sviluppo di modelli di classificazioni di dati non strutturati, quali immagini o testi, non è un task semplice. In molti casi sono richieste competenze di sviluppo molto specifiche. Scopriamo come è possibile, mediante AutoML Vision di Google Cloud, creare un modello di classificazione di immagini senza scrivere una linea di codice ma solo selezionando le immagini per il nostro modello.

Google Cloud: introduzione alla piattaforma

I Big Data sono una delle evoluzioni più profonde e pervasive del mondo digitale. Un trend destinato a rimanere e a incidere profondamente sulla nostra vita e sul nostro modo di fare business. La loro gestione richiede infrastrutture di calcolo molto potenti. I grandi colossi del Web, tra cui Google, Amazon e Microsoft, forniscono i loro data center e le loro piattaforme per affrontare le sfide offerte dai Big Data. Scopriamo la potenza di calcolo fornita da Google Cloud mediante alcuni casi di studio.