• Associate Professor in the Department of Computer
Science, Sapienza University of Rome
• Principal investigator of several projects, including:
– ERC Starting Grant (MultiJEDI, 2011-2016, 1.3M €)
– ERC Consolidator Grant (MOUSSE, 2017-2022, 1.5M €)
– Google Focused Research Award (co-PI, 300k €)
Roberto Navigli
14/03/2017 2Il punto su due progetti ERC in informatica
Roberto Navigli
Giro di boa o no
14/03/2017Recent achievements in multilingual NLP
Roberto Navigli
3
MultiJEDI: ERC Starting Grant (2011-2016)
MOUSSE: ERC Consolidator Grant (2017-2022)
Giro di boa o no
Giro di boa
• La reputazione è in ascesa
• Velocità: carriera, inviti, coinvolgimento
• Vitalità: possibilità di creare e mantenere un gruppo
• Visibilità: hai gli occhi puntati addosso
No
• Non hai vinto alla lotteria: se sei lì, c'è una ragione
• Continui a scontrarti con i problemi quotidiani (leggi:
burocrazia, lungaggini, ecc.)
• Non puoi "concentrarti" sul progetto: hai comunque
sempre gli altri impegni come tutti i tuoi colleghi
14/03/2017 4Il punto su due progetti ERC in informatica
Roberto Navigli
A Key Goal of AI – Multilingual Machine Reading
• Why? Machines could potentially "read" the entire Web
• Answer all kinds of questions, summarize, translate, etc.
Key question: deriving meaning from natural language by
overcoming its inherent complexities
5Il punto su due progetti ERC in informatica
Roberto Navigli
• We collect lexicalizations, definitions, translations,
images, etc. from each of the merged resources
BabelNet: Unifying Lexical Knowledge Resources into
a Single Semantic Network
7
WordNet
Il punto su due progetti ERC in informatica
Roberto Navigli
14/03/2017 8
Why do we need BabelNet?
• Multilinguality: the same concept is expressed in tens of
languages
Il punto su due progetti ERC in informatica
Roberto Navigli
14/03/2017 9
Why do we need BabelNet?
• Multilinguality: the same concept is expressed in tens of
languages
• Coverage: 271 languages and 14 million entries!
– 6M concepts and 7.7M named entities
– 119M word senses
– 378M semantic relations (27 relations per concept on avg.)
– 11M images associated with concepts
– 41M textual definitions
– 2M concepts with domains associated
Il punto su due progetti ERC in informatica
Roberto Navigli
14/03/2017 10
Why do we need BabelNet?
• Multilinguality: the same concept is expressed in tens of
languages
• Coverage: 271 languages and 14 million entries!
• Concepts and named entities together: dictionary and
encyclopedic knowledge is semantically interconnected
14/03/2017 10
14/03/2017 11
Why do we need BabelNet?
• Multilinguality: the same concept is expressed in tens of
languages
• Coverage: 271 languages and 14 million entries!
• Concepts and named entities together: dictionary and
encyclopedic knowledge is semantically interconnected
• "Dictionary of the future": semantic network structure
with labeled relations, pictures, multilingual entries
14/03/2017 11Il punto su due progetti ERC in informatica
Roberto Navigli
BabelNet is our biggest success
• Well-known worldwide
• Continuously updated
• Most cited 2012 paper in Artificial Intelligence!
• Attracted the attention of the EU:
14/03/2017NLP: Work at the Sapienza University of Rome Pagina 12
BabelNet is our biggest success
• Well-known worldwide
• Continuously updated
• Most cited 2012 paper in Artificial Intelligence!
• Attracted the attention of the EU
– Workshop organized by EU Parliament, Commission &
Publications Office
– An article appeared in TIME magazine!
14/03/2017 Pagina 13Il punto su due progetti ERC in informatica
Roberto Navigli
Abbiamo creato Babelscape
• Una startup Sapienza ipertecnologica
• Un ambiente ideale per sviluppare idee innovative
• Dare spazio a studenti di ogni livello
14/03/2017Metodologie di Programmazione
Roberto Navigli
14
Rifare o non rifare domanda? Questo è il problema
• E' un po' come pensare di avere in mano un secondo
best seller dopo averne sfornato uno
– Non può essere il seguito naturale dell'idea precedente
• Devi crederci davvero
• Provarci non serve
• Dopo alcuni mesi l'idea è arrivata
• Perché no: andare contro corrente
14/03/2017 16Il punto su due progetti ERC in informatica
Roberto Navigli
“Stay hungry, stay foolish” – Think different
14/03/2017Metodologie di Programmazione
Roberto Navigli
17
From MultiJEDI to MOUSSE: a Quantum Leap!
MultiJEDI (2011-16)
Large multilingual repository of
concepts: BabelNet
Disambiguation outputs a bag
of concepts
MOUSSE: Multilingual Open-text Unified Syntax-independent SEmantics
Roberto Navigli
19
MOUSSE (2017-22)
Huge repository of novel structured
universal semantic representations
We will construct a language-
independent structured semantic
representation of the sentence
1
2
1
2
CONCEPTS SENTENCE REPRESENTATIONS
DISAMBIGUATION SEMANTIC PARSING
• N2 Machine Translation– Universal semantics as the long-sought-for interlingua
• Way beyond current machine translation
20
text in source
languagetext in target
language
The holy grail of AI: long-sought-for interlingua!
Il punto su due progetti ERC in informatica
Roberto Navigli