Come le imprese
possono usare i discorsi
Perché distinguere dati fattuali e
opinioni
Fabrizio Sebastiani Gruppo Human Language Technologies – NeMIS Lab Istituto di Scienza e Tecnologie dell’Informazione Consiglio Nazionale delle
Ricerche 56124 Pisa
Cos’è la Corporate Reputation?
“Corporate reputation affects the way in which various stakeholders behave towards an organization, influencing, for example, employee retention, customer satisfaction and customer loyalty.”
Corporate reputation: Meaning and measurement, Volume: 7, Issue: 2, Pages: 91-109, First published: 25 November 2005, DOI: (10.1111/j.1468-
2370.2005.00109.x)
Cos’è la Corporate Reputation?
• Post and Griffin 1997 “reputation is a synthesis of the opinions, perception and
attitudes of an organization's stakeholders including employees, customers, suppliers and investors and community”
• Fombrun 1996 “a perceptual representation of a company's past actions
and future prospects that describe the firm's appeal to all of its key constituents”
• Fombrun et al. 2000 “corporate reputation represents a collective and
multidimensional construct which is an aggregated perception of many individuals”
Corporate reputation: Meaning and measurement, Volume: 7, Issue: 2, Pages: 91-109, First published: 25 November 2005, DOI: (10.1111/j.1468-
2370.2005.00109.x)
Cos’è la Corporate Reputation?
Cos’è la Corporate Reputation?
User Generated Content
Net-consumatori
Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.
Anche se il negozio fisico resta ancora un luogo importante, • il 62% degli utenti su scala mondiale commenta un prodotto o servizio
online dopo l’acquisto.
• se si aggiungono post e tweet il dato arriva al 69%
• il 55% degli utenti ibridi (coloro che si informano in rete ma poi effettuano l’acquisto in un punto vendita) postano commenti.
www.globalwebindex.com
Net-consumatori
Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.
Anche se il negozio fisico resta ancora un luogo importante,
dobbiamo prendere seriamente in considerazione il modello di impresa che emerge dall’adozione strategica
dei social media.
www.globalwebindex.com
Filtrare l’informazione automaticamente
Fatti Opinioni
Gli spinaci sono ricchi di ferro
Gli spinaci hanno un brutto sapore
Filtrare l’informazione automaticamente
Fatti Opinioni
Gli spinaci sono ricchi di ferro
• Oggettivi
• Ritraggono la realtà
• Possono essere verificati
• Presentati con obiettività
Gli spinaci hanno un brutto sapore
• Soggettive
• Interpretano la realtà
• NON possono essere verificate
• Presentate attraverso una valutazione
Filtrare l’informazione automaticamente
Fatti Opinioni
• Data Mining
• Information Retrieval
• Information Extraction
• Opinion Mining
• Sentiment Classification
• Feature-based Sentiment Analysis
Filtrare l’informazione automaticamente
Metodi Rule-Based
cercano di imitare il modo in cui l’uomo utilizza e
comprende il linguaggio, riproducendo le strutture sintattiche che sono alla
base di questo processo di comprensione, costruendo
risorse lessicali come i dizionari elettronici, le
tassonomie, le ontologie
Metodi Stocastici
trattano la lingua come un insieme di parole,
quantificando queste in modo matematico e cercando di estrarre
informazioni senza la necessità di individuare le
strutture sintattiche o, addirittura, cercando di
rendere capace la macchina stessa di
imparare la sintassi.
Filtrare l’informazione automaticamente
Quali Vantaggi?
• Ads placement
• Text summarization
• Recommendation systems
• Flame and cyberbullying detection
• Literary reputation tracking
• Political texts analysis
Cos’è l’Analisi dei Sentimenti
La Sentiment Analysis (SA) consiste nel trattamento automatico di opinioni e sentimenti espressi all’interno di testi non strutturati.
Sono sinonimi della SA opinion mining, subjectivity analysis, or appraisal extraction.
Alcune sfide nella ricerca sulla SA:
• Sentiment and Subjectivity Classification,
• Feature-based Sentiment Analysis,
• Sentiment Analysis of comparative sentences,
• Opinion search and retrieval,
• Opinion holders, Opinion features and opinion targets extraction.
15
Cos’è un’opinione?
oj, fjk, ooijkl, hi, tl
dove
oj è l’oggetto sul quale viene espressa l’opinione
fjk rappresenta le caratteristiche (features) dell’oggetto
ooijkl è l’orientamento (positivo o negativo) dell’opinione
hi è opinion holder, colui che esprime l’opinione
tl rappresenta il tempo in cui l’opinione viene espressa
16
Liu, B. (2010). Sentiment analysis and subjectivity. Handbook of natural language processing, 2, 568.
Cos’è un’opinione?
Cos’è un’opinione?
Cos’è un’opinione?
Cos’è un’opinione? oj
Cos’è un’opinione? oj, fjk
Cos’è un’opinione? oj, fjk, ooijkl
Cos’è un’opinione? oj, fjk, ooijkl, hi
Cos’è un’opinione? oj, fjk, ooijkl, hi, tl
Cos’è un’opinione? I dati non strutturati
Cos’è un’opinione? I dati non strutturati
Cos’è un’opinione? I dati non strutturati
Indicatori di Sentimento
• Parole dotate di
Orientamento Semantico
1. gentile +2 2. pulito +2 3. abbondante + 4. buono +2 5. esagerato + 6. spettacolare +3 7. lussuoso +2 8. bene +2
Cos’è un’opinione? Strutturare i dati
Indicatori di Sentimento
• Espressioni dotate
di Orientamento Semantico
Contextual Valence Shifters: 1. molto gentile 2. non spettacolare 3. non lussuoso 4. avere da ridire sul prezzo
Dipendenza dal dominio: 1. hotel molto caratteristico 2. Colazione abbondante 3. arredo con tutto
l’occorrente 4. prezzo esagerato
Cos’è un’opinione? Strutturare i dati
Sentiment Polarity Classification
Correzione. Polarity Switching: 4 stars → 2 stars
Ridimensionamento. Polarity Shifting : 4 stars → 3 stars
Sentiment Polarity Classification
Correzione. Polarity Switching: 4 stars → 2 stars
Ridimensionamento. Polarity Shifting : 4 stars → 3 stars
Alcuni task della Sentiment Analysis
Sentiment Polarity Classification
Sentiment Polarity Classification
Classificare interi documenti in base alle seguenti macro-classi • Positivo • Negativo • Neurale
Ciò che differenzia questo task dal comune Topic Detection and Classification è il fatto che le categorie in gioco non sono semanticamente slegate l’una rispetto all’altra. Tali categorie possono essere rappresentate come:
• Un’ opposizione binaria • Una rating scale • Un continuum
Feature-based Sentiment Analysis
Feature-based Sentiment Analysis
T=O(f)
F = {f1, f2, . . . , fn}
Wi = {wi1, wi2, . . . , wim} Ii = {ii1, ii2, . . . , iiq}
Sintetizzare il contenuto delle opinioni espresse nei testi individuando le singole caratteristiche che rappresentano i punti di forza e/o le debolezze discusse nell’opinione. La relazione intercorrente tra features e opinione viene perfettamente espressa grazie al concetto di Target (T) dell’opinione, descritto dalla seguente funzione:
Ogni feature può essere descritta da sottoinsiemi di altre features:
Il Target può essere descritto nei testi da indicatori diretti (W) o indiretti (I)
Feature-based Sentiment Analysis
Un esempio di testo annotato
Sentiment Role Labeling
Sentiment Role Labeling
Il task del Semantic Role Labeling (SRL) ha come finalità il mapping degli elementi sintattici localizzati nei testi liberi e le loro rappresentazioni semantiche. Esse verranno poi etichettate in base ad appropriati ruoli tematici o semantici. Il Sentiment Role Labeling focalizza l’analisi sui frame semantici relativi alla sfera della soggettività.
Frame Semantics Sentiment (SENT)
experiencer (e)
causer (c)
Opinion (OP)
opinion holder (h)
opinion target (t)
Physical Act (PHY)
patient (z)
agent (a)
Sentiment Role Labeling
“ ” Fillmore, C. J. (2006). Frame semantics. Cognitive linguistics: Basic readings,34, 373-400.
Sentiment Role Labeling
Frame Semantics Sentiment (SENT)
experiencer (e)
causer (c)
Opinion (OP)
opinion holder (h)
opinion target (t)
Physical Act (PHY)
patient (z)
agent (a)
Sentiment Role Labeling
Valutazione dell’analisi
Fare sentiment analysis è difficile perché, per esprimere le nostre opinioni ed emozioni, facciamo ricorso a una estrema varietà di sofisticati mezzi espressivi, tra cui la metafora, l’ironia, il sarcasmo, l’allusione, etc.
• Nell’analisi di significato dei testi tutto si può fare, ma solo con un
certo grado di accuratezza.
• Un software di sentiment analysis potrebbe I ▫ riconoscere la presenza di un’opinione inesistente (“falso positivo”); ▫ non riconoscere la presenza di un’opinione esistente (“falso negativo”); ▫ assegnare a un’opinione una polarità erronea; ▫ non riconoscere correttamente il soggetto e/o l’oggetto dell’opinione; I ...
Fabrizio Sebastiani Gruppo Human Language Technologies – NeMIS Lab Istituto di Scienza e Tecnologie dell’Informazione Consiglio Nazionale delle
Ricerche 56124 Pisa