1
Semantic Web и семантические викиИнтересная наука, полезные
бизнес-приложения
02.02.2013
Катков Юрий, WikiVote
2
ВВЕДЕНИЕ
02.02.2013
3
Что веб-разработчики думают о Semantic Web?
• Когда-то кто-то пытался сделать веб машиночитаемым
• Проект провалился, очень уж сложная оказалась задача
• Все про это потихоньку забылиПочему это неправильная история: • Semantic web уже здесь!
02.02.2013
402.02.2013
502.02.2013
602.02.2013
702.02.2013
802.02.2013
902.02.2013
1002.02.2013
1102.02.2013
1202.02.2013
13
Что такое Semantic Web сегодня• Данные
– Data.gov, Data.gov.uk и терабайты гос. данных в Европе, Азии и Америке
• Коммерческие продукты– Oracle Spatial and Graph (Oracle 11g)– IBM DB2 10– IBM Watson– Apple Siri
• Важные элементы back-end’а:– Google Freebase (подмножество Google Knowledge Graph)– Facebook Open Graph– Wikidata (википедия как база данных)– Schema.org – схема описания ресурсов от W3C, Yahoo, Google, Bing,
Yandex• Научные исследования и стандартизация02.02.2013
14
Стандарты
• Ядром Semantic Web являются стандарты• Объект стандартизации – способ
представления и обмена данными• Linked Data использует только часть
стандартов Semantic Web
02.02.2013
15
Слое
ный
пиро
г SW
02.02.2013
16
Слое
ный
пиро
г SW
02.02.2013
17
URIUniform Resource Identifier
служит для однозначного именования
сущностей
основное правило: не существует двух объектов с одинаковыми URI
URL – частный случай URI
02.02.2013
18
Слое
ный
пиро
г SW
02.02.2013
19
позволяет представлять данные в виде троек, формируя граф данных
( subject , predicate , object )
RDF
02.02.2013
20
позволяет представлять данные в виде троек, формируя граф данных
( subject , predicate , object )
RDF
URI URI URI или литерал02.02.2013
21
Леонардо место_рождения ВинчиЛеонардо дата_рождения 15.04.1452
Леонардо да Винчи родился в городе Винчи 15 апреля 1452 года
<http://ex.org/Leo> <http://ex.org/birthDate>
<http://ex.org/Vinci>
"1452-04-15"^^xsd:date
<http://ex.org/Leo> <http://ex.org/birthPlace>
02.02.2013
22
позволяет представлять данные
в виде троек, формируя граф данных ( subject , predicate , object )
RDF
вершина ребро вершина02.02.2013
2302.02.2013
2402.02.2013
25
Графовая модель удобна и гибка
02.02.2013
26
Графовая модель удобна и гибка
02.02.2013
27
Графовая модель удобна и гибка
02.02.2013
28
Графовая модель удобна и гибка
02.02.2013
29
RDF имеет несколько способов записи
02.02.2013
30
RDF имеет несколько способов записи
Turtle
N-triplesN3
02.02.2013
3102.02.2013
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix ex: <http://ex.org/> .
ex:Leo ex:birthDate "1452-04-15"^^xsd:date . ex:Leo ex:birthPlace ex:Vinci .
32
RDF имеет несколько способов записи
Turtle
N-triplesN3
XMLJSON
02.02.2013
3302.02.2013
<?xml version="1.0"?> <rdf:RDF
xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xmlns:ex="http://ex.org/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<rdf:Description rdf:about="http://ex.org/Leo"> <ex:birthDate rdf:datatype = "http://www.w3.org/2001/XMLSchema#date">1452-04-15 </ex:birthDate>
<ex:birthPlace rdf:resource="http://ex.org/Vinci" /> </rdf:Description>
</rdf:RDF>
34
Слое
ный
пиро
г SW
02.02.2013
35
RDFS и OWLСтандарты для создания структурированных словарей
02.02.2013
36
RDFS и OWLСтандарты для создания структурированных словарей
КРАТКО02.02.2013
37
RDFS и OWLСтандарты для создания структурированных словарей
02.02.2013
38
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
39
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
классификаций
40
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
глоссариев
классификаций
41
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
глоссариев
классификацийтезаурусов
42
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
глоссариев
классификаций
тематических карт
тезаурусов
43
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
глоссариев
таксономий
классификаций
тематических карт
тезаурусов
44
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
глоссариев
таксономий
классификаций
тематических карт
тезаурусов
семантических сетей
45
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
глоссариев
таксономий
классификаций
тематических карт
тезаурусов
семантических сетей
схем данных
46
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
глоссариев
таксономий
классификаций
тематических карт
тезаурусов
семантических сетей
схем данных
TBox
47
RDFS и OWLСтандарты для создания
02.02.2013
структурированных словарей
онтологий
таксономий
классификаций
тематических карт
схем данных
глоссариевсемантических сетей
тезаурусов
TBox
48
ЗАЧЕМ НУЖНЫ
02.02.2013
Структурированные словари
онтологии
схемы данных
глоссариисемантические сети
таксономии
классификации
тематические карты
тезаурусы
TBox
4902.02.2013
Онтологии нужны для
5002.02.2013
стандартизациитерминологии
Онтологии нужны для
Предложение: связь национальностьБудем всегда называть терминомhttp://dbpedia.org/property/nationality« »
5102.02.2013
стандартизациитерминологии
автоматического обогащения данных
Онтологии нужны для
Предложение: связь национальностьБудем всегда называть терминомhttp://dbpedia.org/property/nationality« »
Любой, кто имеет свойствонациональность, является
человеком, а его национальностьявляется страной. А страна – это
частный случай населенного места« »
Давайте, если говорим о Леонардо даВинчи, будем всегда пользоваться его идентификатором в Dbpedia« »
5202.02.2013
Автоматическое обогащение данных
53
Автоматическое обогащение данных
02.02.2013
54
Автоматическое обогащение данных
02.02.2013
55
Автоматическое обогащение данных
02.02.2013
5602.02.2013
Автоматическое обогащение данных
5702.02.2013
Автоматическое обогащение данных
58
Слое
ный
пиро
г SW
02.02.2013
59
SPARQLЗапросы к RDF-данным
02.02.2013
60
SPARQLSPARQL Protocol and RDF Query Language
02.02.2013
6102.02.2013
6202.02.2013
6302.02.2013
6402.02.2013
6502.02.2013
http://dbpedia.neofonie.de
http://dbpedia.org/sparql
66
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>
SELECT * WHERE { ?a rdf:type dbpedia-owl:Company . } LIMIT 100OFFSET 300
Выполняем на dbpedia.org/sparql
02.02.2013
6702.02.2013
68
?a rdf:type dbpedia-owl:Company
Запрос:
02.02.2013
69
?a rdf:type dbpedia-owl:Company
Запрос:
02.02.2013
70
НАУКА И СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ
Чем заняться учёному
02.02.2013
71
Как найти свою семантическую научную тему
• Изучите основы: – Semantic University– очные школы в России и за рубежом– Вебинары и видеолекции
• Живите жизнью сообщества: – списки рассылки: Semantic Web mailing list, LOD mailing list– новости на semanticweb.com, в блогах
• Читайте программы мероприятий: – WWW Conference– ISWC, ESWC, WIMS, LDOW, SEMTECH,
02.02.2013
72
Актуальные темы (на 2013 г)• Дескрипционная логика и алгоритмы логического вывода:
– ускорение алгоритмов– более выразительные логики– унификация логики
• Хранение графовых данных, преобразование SQL-SPARQL• Оптимизация SPARQL-запросов, федерация запросов,
распределенное выполнение• Доверие в SW, проверка и выдача обоснований
логических выводов• Семантические веб-сервисы• Смежные темы: Name Entity Recogninition, Data Mining,
управление знаниями, визуализация, мультиагентные системы, формальный анализ понятий
02.02.2013
73
Слое
ный
пиро
г SW
02.02.2013
74
Слое
ный
пиро
г SW
02.02.2013
75
СЕМАНТИЧЕСКИЕ ТЕХНОЛОГИИ И ПРОМЫШЛЕННОСТЬ. LINKED DATA
Чем заняться инженеру
02.02.2013
76
Слое
ный
пиро
г SW
02.02.2013
77
Слое
ный
пиро
г SW
02.02.2013
Здесь практические приложения
78
Семантические технологии в бизнесе. Семантические вики
• Семантическая вики – это Semantic Web в миниатюре
02.02.2013
Вики• Простое
редактирование• Хранение истории
изменений• Простота
исправления ошибок
Структурированные вики• Структура
данных• Запросы к
данным• Гибкое
представление данных
Семантические вики• Логический вывод• Поддержка
стандартов SW
79
Семантические технологии в бизнесе. Семантические вики
02.02.2013
• Традиционные вики:+ очень динамичны и просты+ поддерживают обновление
структуры данных+ легко исправлять ошибки
НО– быстро засоряются– быстро рассогласовываются– тяжело находить данные– нет общей картины
• Базы данных+ имеют четкую структуру
НО– структура не динамична– стоимость расширения
на новые области высока
– механизмы обновления и отката данных программируются отдельно
80
Простейшая вики
02.02.2013
Страницы и ссылки
81
Традиционная вики
02.02.2013
Категории
82
Традиционная вики
02.02.2013
Категории
83
Традиционная вики
02.02.2013
Категории
84
Структурированная вики
02.02.2013
Именованные ссылки
85
Структурированная вики
02.02.2013
Связь с типизированными данными
86
Структурированная вики
02.02.2013
Запросы к данным
{{#ask: [[ :Категория Город]] [[ ::Население >10 000 000]]|?Население}}
87
Структурированная вики
02.02.2013
Представление данных
88
Структурированная вики
02.02.2013
Представление данных
89
Структурированная вики
02.02.2013
Представление данных
90
Структурированная вики
02.02.2013
Представление данных
91
Структурированная вики
02.02.2013
Представление данных
9202.02.2013
Семантическая викиАвтоматический вывод знаний
9302.02.2013
Семантическая викиАвтоматический вывод знаний
94
Семантическая вики
02.02.2013
Автоматический вывод знаний
95
Семантическая вики
02.02.2013
Другие часто встречающиеся функции
• Экспорт и импорт RDF и OWL-онтологий• Использование RDF-хранилищ• Поддержка SPARQL• Контроллируемый естественный язык• Фасетный, уточняющий поиск• Конвертация единиц измерения• Генерация документов
96
Движки семантических вики
02.02.2013
• OntoWiki• The Information Workbench• Semantic MediaWiki• TWiki• TikiWiki• AceWiki
97
Слое
ный
пиро
г SW
02.02.2013
9802.02.2013
9902.02.2013