Clustering: un vero progetto per esplorare i dati

Il clustering è uno strumento molto potente per raggruppare i dati. Esistono molti algoritmi che possono essere applicati e pertanto la scelta risulta sempre difficile. Inoltre, tutti gli algoritmi di clustering richiedono dei parametri per funzionare. Mediante un caso di studio reale, applicato ai dati immobiliari, combineremo PCA, clustering gerarchico e K-means per fornire soluzioni di clustering ottimali.

Clustering gerarchico: come funziona

Gli algoritmi di clustering permettono di raggruppare i dati in base alle loro caratteristiche intrinseche. Esistono molti algoritmi che sono stati sviluppati negli anni. Il clustering gerarchico, grazie ad una rappresentazione grafica chiamata dendrogramma permette di visualizzare in modo immediato la composizione dei clusters e interpretare le loro caratteristiche. Scopriamo, passo passo, il suo funzionamento e come interpretare i risultati ottenuti.

K-Means: come funziona

Gli algoritmi di clustering permettono di raggruppare i dati in base alle loro caratteristiche intrinseche. Esistono molti algoritmi che sono stati sviluppati negli anni. Il K-Means è quello sicuramente più popolare e semplice. Scopriamo, passo passo, come questo metodo riesce ad individuare cluster di dati usando solo il numero di gruppi che devono essere estratti.

DBSCAN: come funziona

Gli algoritmi di clustering permettono di raggruppare i dati in base alle loro caratteristiche intrinseche. Esistono molti algoritmi che sono stati sviluppati negli anni. Tra quelli più famosi non possiamo dimenticare il DBSCAN. Scopriamo, passo passo, come questo metodo riesce ad individuare cluster di dati di qualsiasi forma e dimensione grazie a soli due parametri.

Design with MongoDB

Design with MongoDB!!!

Buy the new book that will help you to use MongoDB correctly for your applications. Available now on Amazon!