Hai 200 recensioni, 500 ticket di supporto, 1.000 commenti sui social. Leggerli tutti richiederebbe giorni — e alla fine non saresti neanche sicuro di aver colto i pattern più importanti. Sentiment Analysis e Topic Modeling risolvono esattamente questo: in dieci minuti ottieni il tono emotivo di ogni testo, i temi ricorrenti raggruppati automaticamente e una sintesi strategica pronta per le decisioni. Ottava puntata del percorso Stack Digitale 2026.
C’è un problema che scala malissimo: la lettura manuale di testo. Con dieci recensioni funziona. Con cinquanta inizia a stancare. Con cinquecento diventa impossibile — e quando finisci, le prime letture sono già svanite dalla memoria. Il risultato sono decisioni basate sulle impressioni delle ultime dieci recensioni lette, non sull’intero corpus.
Diciamolo francamente: il problema non è la mancanza di dati. È l’incapacità umana di processare grandi volumi di testo in modo sistematico e oggettivo. Il cervello non è progettato per questo — si stanca, si distrae, porta bias delle letture precedenti. L’AI, invece, analizza il testo 500 con la stessa attenzione del testo 1. Ed è esattamente questo il vantaggio operativo di Sentiment Analysis e Topic Modeling.
Sentiment Analysis: assegnare un voto emotivo a ogni testo
La Sentiment Analysis assegna a ogni testo uno score che rappresenta il tono emotivo. Il range standard va da -1 (estremamente negativo) a +1 (molto positivo), con 0 come neutro. Non è una classificazione binaria positivo/negativo — la granularità dello score è informativa quanto l’etichetta: un testo a -0.30 è molto diverso da uno a -0.85, anche se entrambi vengono classificati come “negativi”.
Il valore pratico emerge quando si analizzano set di dati, non singoli testi. Vedere che il 30% delle tue recensioni ha score sotto -0.50 è un segnale di allerta concreto. Vedere che i testi con score più negativo citano tutti la stessa parola chiave — “rimborso”, “attesa”, “corriere” — trasforma un problema percepito in un problema identificato e localizzato.
La demo: 10 recensioni e-commerce analizzate da Claude
Per rendere la guida completamente replicabile, ecco esattamente i testi usati nella demo:
- Testo 1: “Prodotto arrivato in anticipo rispetto alla data prevista, imballaggio curato e articolo esattamente come descritto. Acquisterò di nuovo senza dubbi.”
- Testo 2: “Ho aspettato tre settimane per una risposta all’email di assistenza. Alla fine il problema non è stato risolto e ho dovuto aprire una disputa con PayPal.”
- Testo 3: “Nella norma. Consegna nei tempi indicati, prodotto corrispondente alle foto. Niente di eccezionale ma nemmeno motivi di lamentela.”
- Testo 4: “Qualità del materiale deludente rispetto al prezzo. Me lo aspettavo più resistente. Non lo consiglierei.”
- Testo 5: “Ottimo rapporto qualità-prezzo. L’assistenza clienti ha risposto in meno di due ore e ha risolto subito il mio problema di taglia. Esperienza molto positiva.”
- Testo 6: “Il pacco è arrivato danneggiato. L’articolo per fortuna era integro, ma l’imballaggio era completamente aperto. Situazione un po’ spiacevole.”
- Testo 7: “Servizio professionale, comunicazione chiara in ogni fase dell’ordine. Il prodotto supera le aspettative per la fascia di prezzo. Consigliato.”
- Testo 8: “Niente di particolare da segnalare. Ho ricevuto quello che ho ordinato nei tempi previsti. Non ho avuto bisogno dell’assistenza.”
- Testo 9: “Esperienza terribile. Ordine sbagliato, reso impossibile da gestire e rimborso ancora non ricevuto dopo un mese. Evitate questo venditore.”
- Testo 10: “Prodotto bellissimo, spedizione rapidissima. Unico neo: il manuale solo in inglese. Per il resto tutto perfetto.”
Il prompt usato: “Analizza il sentiment di questi 10 testi. Per ogni testo: score da -1 (molto negativo) a +1 (molto positivo), breve spiegazione dello score (max 10 parole). Output: tabella markdown con colonne ID | Score | Sentiment | Motivo.”

Il risultato in tabella mostra immediatamente i pattern. Il testo 9 (-1.00, Estremamente negativo) e il testo 2 (-0.85, Molto negativo) sono i casi critici. I testi 1 e 5 (+0.90, Molto positivo) mostrano cosa funziona bene — consegna puntuale e assistenza reattiva. Il testo 6 (-0.30, Lievemente negativo) segnala un problema di imballaggio che non avrebbe mai emergere tra le recensioni a stelle, perché l’articolo era integro e il cliente ha lasciato 3 stelle su 5. Quel tipo di insight — il problema che si nasconde nel testo libero ma non nello score aggregato — è esattamente dove la Sentiment Analysis aggiunge valore rispetto alle sole stelle.
L’approccio visivo: livechatai per chi non vuole scrivere prompt
Scrivere un prompt e interpretare una tabella markdown richiede qualche minuto di pratica. Se il tuo team non lavora abitualmente con tool AI, esiste un’alternativa più immediata: tool con interfaccia grafica che visualizzano il sentiment senza richiedere nessuna configurazione.

Lo screenshot mostra livechatai.com con gli stessi testi in inglese. Il grafico a torta in alto a sinistra mostra la distribuzione percentuale del sentiment attraverso più dimensioni emotive — non solo positivo/negativo/neutro, ma Happy, Angry, Content, Frustrated, Joyful, Disappointed, Satisfied, Furious, Neutral, Excited. In basso, ogni frase è colorata: verde per le positive (“This Product Exceeded My Expectations In Every Way”), rosso per le negative (“Terrible Experience, I Will Never Order From Here Again”), giallo/arancio per le neutre (“Nothing Special But No Complaints Either”). La navigazione 1/9 permette di scorrere i risultati frase per frase.
Questo approccio è ideale per team che devono condividere i risultati con stakeholder non tecnici — un grafico a torta colorato è più leggibile in una presentazione di una tabella con score decimali. Claude e livechatai non si escludono: Claude per l’analisi approfondita e lo score granulare, livechatai per la comunicazione dei risultati verso l’esterno.
La word cloud: la prima fotografia del corpus
Prima ancora di chiedere a Claude di fare topic modeling strutturato, c’è uno strumento visivo immediato che permette di orientarsi in un corpus di testi senza leggere una sola riga: la word cloud. Le parole più grandi sono quelle che compaiono più frequentemente — in pochi secondi cattura l’occhio sulle priorità tematiche del dataset.

La word cloud qui sopra è stata generata dai 30 testi dei Set 2 e Set 4 usati per la demo. Le parole più grandi — prezzo e prodotto — confermano immediatamente i due temi centrali del corpus. Seguono per dimensione assistenza, spedizione, concorrenza, internazionale, imballaggio — esattamente i cluster che il topic modeling strutturato ha poi identificato in modo sistematico. La word cloud non è un sostituto del topic modeling: è il punto di partenza visivo che aiuta a formarsi un’ipotesi prima di chiedere all’AI la conferma quantitativa. Generarla richiede meno di un minuto su wordclouds.com — basta incollare i testi e clicca genera.
Topic Modeling: trovare i temi nascosti in centinaia di testi
La Sentiment Analysis risponde a “come si sente il cliente?”. Il Topic Modeling risponde a “di cosa parla?”. La differenza è cruciale: puoi avere un punteggio medio di sentiment neutro (+0.05) su 200 recensioni, ma se il Topic Modeling rivela che il 40% dei testi parla di ritardi nella spedizione e il 30% di problemi di rimborso, hai due priorità strategiche precise — non una media che non dice nulla.
Il Topic Modeling analizza tutti i testi contemporaneamente e identifica automaticamente i cluster tematici naturali: le parole che co-occorrono frequentemente, i concetti che appaiono in blocchi di testi simili, la percentuale di presenza di ogni tema sull’intero corpus. Non devi definire i temi in anticipo — emergono dai dati.
La demo: 20 testi, 5 temi emergenti
I 20 testi usati per il topic modeling coprivano quattro aree tematiche volutamente non dichiarate: spedizione e logistica, qualità del prodotto, rapporto qualità-prezzo, assistenza clienti. Il prompt: “Identifica i 4-5 temi principali in questi 20 testi. Per ogni tema: nome, parole chiave principali (5-7 parole), percentuale di presenza stimata, descrizione breve (1 frase), esempi dal testo (numeri delle frasi). Output: lista strutturata con intestazioni in grassetto.”

L’output dettagliato per tema è la parte più ricca: ogni tema viene presentato con le parole chiave identificate automaticamente, la percentuale di presenza stimata sul corpus, una descrizione di una frase e — dettaglio molto utile — gli esempi numerati con il simbolo ✅ o ❌ per indicare se l’esperienza nel testo era positiva o negativa. Tema 1 (Spedizione e Logistica, 25%) mostra testi 1 ✅ (consegna il giorno dopo), 5 ✅ (tracking in tempo reale), 9 ❌ (ritardo 4 giorni senza comunicazione) e 13 ❌ (pacco lasciato sotto la pioggia). In una sola riga si vede che la spedizione divide — non è uniformemente buona o cattiva, ma polarizzata.
La sintesi tematica: la tabella che guida le decisioni

La tabella di sintesi è il documento operativo del processo: cinque temi con la percentuale di presenza e il tono prevalente per ciascuno. Il dato più interessante è il Rapporto Qualità-Prezzo al 25% con tono “Negativo (2 pos / 2 neg / 1 neutro)”: è il tema con il tono più critico in proporzione. Non significa necessariamente che il prodotto costi troppo — significa che quando i clienti parlano di prezzo, la percezione è prevalentemente negativa, e questo è un segnale su cui lavorare nel positioning o nella comunicazione del valore. Spedizione, Assistenza e Qualità del Prodotto hanno invece tono misto — ci sono sia esperienze positive che negative, e il task successivo è capire cosa le differenzia.
Combinare Sentiment e Topic: il quadro completo
Il valore reale emerge quando si incrociano i due output. Dalla Sentiment Analysis sai che il 20% dei testi ha score sotto -0.50. Dal Topic Modeling sai che i temi prevalenti sono Spedizione e Assistenza Clienti con tono misto. Incrociando: quali testi negativi parlano di spedizione? Quali di assistenza? La risposta — ottenibile con un terzo prompt: “Quali testi negativi (score < -0.50) appartengono al tema Assistenza Clienti?” — localizza esattamente dove concentrare gli interventi.
Questo è il passaggio che il Modulo 9 chiama “da sensazioni a decisioni data-driven”: non più “ho l’impressione che i clienti si lamentino della spedizione” ma “il 25% dei feedback riguarda la spedizione, il 40% di questi ha tono negativo, i tre problemi ricorrenti sono: ritardi senza comunicazione, pacco danneggiato, corriere non affidabile”.
Tre limiti da non ignorare
La Sentiment Analysis fatica con l’ironia e il sarcasmo. “Fantastico, il terzo pacco danneggiato in un mese” ha parole positive ma sentiment chiaramente negativo — i modelli generici lo classificano spesso male. La soluzione pratica: aggiungi al prompt “Attenzione a ironia e sarcasmo: interpreta il significato contestuale, non le parole letterali”.
Il Topic Modeling su testi in italiano è meno preciso dei modelli addestrati principalmente su corpus in inglese. Claude e GPT-4 gestiscono bene l’italiano, ma le percentuali di presenza dei temi vanno considerate indicative, non esatte — soprattutto su corpus piccoli (sotto i 50 testi). Verifica manualmente un campione del 15-20% dei risultati prima di usarli per decisioni importanti.
Infine: non caricare mai testi con dati personali identificabili su servizi cloud senza anonimizzazione preventiva. Sostituisci nomi, email e riferimenti specifici con codici prima dell’upload — è un requisito GDPR, non un’opzione.
Prossima puntata: Supabase e il backend per le app vibe-coded
Con Sentiment Analysis e Topic Modeling chiudiamo il blocco sull’analisi testuale avanzata. La settimana prossima cambiamo registro: dall’analisi dei dati alla loro archiviazione in applicazioni reali. Supabase è il backend open source che completa le app costruite con Lovable e Bolt — PostgreSQL managed, autenticazione e storage gratuiti, Row Level Security spiegata semplicemente. Tutto quello che serve per portare un’app vibe-coded dalla demo alla produzione. Sentiment analysis e topic modeling ti dicono cosa pensano i tuoi clienti. Il passo successivo è costruire i sistemi che raccolgono quei dati in modo strutturato.