Date post: | 01-Nov-2014 |
Category: |
Technology |
Upload: | danusa-ribeiro |
View: | 1,472 times |
Download: | 4 times |
LINKED DATA: da Web de Documentos para
a Web de Dados Danusa Ribeiro Bernadette Lóscio Damires Souza
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
como tudo Começou?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 2
Os dados viviam isolados em ilhas de informação
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 3
Os dados eram guardados em arquivos e tinham
muitos problemas de redundância entre si.
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 4
Para solucionar esses problemas, os dados começaram
a se organizar em banco de dados.
livro editora
autor
prod venda
item
projeto eng.
dept
Com o passar do tempo, os bancos de dados foram se
organizando em grupos e daí surgiram os sistemas de bancos de dados distribuídos e as federações de bancos de dados.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 5
... com o passar dos anos, eis que surgiu:
a World Wide Web
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 6
Criada por Tim Berners Lee.
“A ideia é que a máquina consiga entender e interpretar os dados da Web de forma a raciocinar sobre eles, inferindo
novos conhecimento e provendo informações e serviços relevantes aos
usuários”
The World Wide Web: Past, Present and Future
Tim Berners-Lee
Agosto, 1996
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 7
A Web organiza as informações disponíveis na
Internet por meio de hipertexto e torna a
interação do usuário com a rede mundial
mais amigável.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 8
a Web atual
Páginas direcionadas para pessoas e não para o processamento
O principal foco é apresentação de informações
O processo de interpretação é feito pelos usuários
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 9
... Daí, volume de dados digitais cresceu
imensamente e a Web tornou-se um espaço global de informações.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 10
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
Páginas HTML
a Web atual
Porque os computadores não conseguem
interpretar as informações?
...faltam informações sobre as Páginas =(
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 11
a Web atual...
é apenas Sintática.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 12
web Sintática
mecanismos de busca baseados em
palavras-chave
Grande número de páginas com pouca precisão
Informações distribuídas em várias páginas e
integração manual
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 13
14
... mas
nem todos os dados podem ser encontrados por meio dos mecanismos de busca
não é possível especificar consultas complexas sobre os dados
assim como no tempo dos arquivos, os dados na Web ainda vivem isolados uns dos outros
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 15
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 16
O que fazer para transformar a Web em um verdadeiro espaço global de dados?
aumentar a estrutura do conteúdo da Web ?
prover significado para os dados ?
estabelecer padrões para a publicação de dados e criação de links entre eles ?
Então, Tim Berners Lee teve mais uma brilhante ideia...
“The Semantic Web is the extension of the World Wide Web that enables people to share
content beyond the boundaries of applications and websites. It has been described in rather
different ways: as a utopic vision, as a web of data, or merely as a natural paradigm shift in
our daily use of the Web.”
semanticweb.org
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 17
Web Semântica
Representar o conteúdo da Web para facilitar o seu processamento
Categorizar as informações para facilitar o acesso
os dados estão mais ricos, são associados a vocabulários e possuem um significado
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 18
Aaaaaagora sim...
os dados não precisam mais viver isolados e
podem ser compartilhados por diversas
aplicações
os dados, agora chamados de recursos, são
únicos e possuem a sua própria identificação na Web!
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 19
Tááá legal, mas onde entra Linked Data nessa história?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 20
Conjunto de melhores práticas para a publicação de dados estruturados na Web.
“Linked Data is about using the Web to connect related data that wasn't previously linked, or using
the Web to lower the barriers to linking data currently linked using other methods.”
linkeddata.org
"a term used to describe a recommended best practice for exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic Web
using URIs and RDF.”
wikipedia
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 21
Arquitetura da Web Clássica
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 22
A B C
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
Navegadores Máquinas de Busca
Hiperlinks
Web APIs e Mashups
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 23
A B C
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
<....>
Mashups
Web APIs Web APIs
APIs tem interface proprietárias
Mashups são baseados em um conjunto fixo de fontes de dados
Não se pode „linkar‟ item de dados de APIs
diferentes
1 2
3
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 24
Reproduzido de www.economist.com (illustration by David Simonds)
Linked Data
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 25
RDF
RDF
RDF
RDF
RDF
RDF RDF
RDF
RDF
Link RDF
Link RDF
Link RDF
Link RDF
Contextualizando....
Web de Documentos
Navegadores HTML (HyperText Markup
Language)
hiperlinks
URIs, HTTP, HTML
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 26
Web de Dados
Navegadores RDF (Resource Description
Framework)
links RDF
URIs, HTTP, RDF, SPARQL
Padrões Linked Data
• URIs – Uniform Resource Identifiers
URI é uma cadeia de caracteres compacta usada para identificar ou denominar um recurso na Internet, onde um recurso pode ser um documento html, uma
figura ou uma pessoa.
O principal propósito desta identificação é permitir a interação com representações do recurso através de uma rede, tipicamente a Web, usando protocolos
específicos.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 27
Padrões Linked Data
• URIs – Uniform Resource Identifiers
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 28
URL URN
Livro Romeu e Julieta
Identifica o Item Localiza o item
ISBN: 0-486-27557-4 file://home/Desktop/RomeoAndJuliet.pdf
Padrões Linked Data
• URIs – Uniform Resource Identifiers
identificar objetos e conceitos
Por exemplo, a URI http://www.w3.org/People/Berners-Lee/card#i
identifia o pesquisador Tim Bernes-Lee.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 29
Padrões Linked Data
• HTTP – HyperText Transfer Protocol
responsável pelo tratamento de pedidos e respostas entre cliente e servidor na Web
utilizado para a comunicação entre computadores
na Internet e a especificar como seriam realizadas as transações entre clientes e servidores, através do uso de
regras básicas
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 30
Padrões Linked Data
• HTTP – HyperText Transfer Protocol
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 31
Servidor
PC rodando Mozila
PC rodando Chrome
Padrões Linked Data
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 32
[Redes de Computadores e a Internet - James F. Kurose, Keith W. Ross]
HTTP – HyperText Transfer Protocol
Padrões Linked Data
• RDF – Resource Description Framework
“RDF is a standard model for data interchange on the Web. RDF has features that facilitate data merging
even if the underlying schemas differ, and it specifically supports the evolution of schemas over
time without requiring all the data consumers to be changed.”
http://www.w3.org/RDF/
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 33
Padrões Linked Data
• RDF – Resource Description Framework
Como representar os dados dos bds ou das páginas html para que os eles possam ser
compartilhados na Web?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 34
id title professor
FUP 01 Berna Farias
year
02
03
04
05
Programação
2007 algoritmos
genre
Berna Farias 2009 algoritmos
BD I Berna Farias BD 2009
Damires Souza 2010 BD
BDNC Berna Farias 2011 BD
SGBD
Disciplinas computação
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 35
Os dados podem ser distribuídos em:
Linhas Colunas Células
36 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
1
2
3
Distribuição por linha
37 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
03 BD I Berna Farias BD 2009
02 Programação Berna Farias 2009 algoritmos
FUP 01 Berna Farias
04
2007 algoritmos
Damires Souza 2010 BD SGBD
05 BDNC Berna Farias 2011 BD
eita... Cadê o esquema? Quem é o quê?
38 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
Padrões Linked Data
1
2
3
03 BD I Berna Farias BD 2009
02 Programação Berna Farias 2009 algoritmos
FUP 01 Berna Farias
04
2007 algoritmos
Damires Souza 2010 BD SGBD
05 BDNC Berna Farias 2011 BD
Title
year genre
professor title
1 2
3
Distribuição por coluna
39 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
FUP
Programação
BD I
BDNC
SGBD
2007 algoritmos
2009 algoritmos
BD 2009
2010 BD
2011 BD
Berna Farias
Berna Farias
Berna Farias
Damires Souza
Berna Farias
... e agora??? Quem é quem?
Id
40 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
year genre
professor title
1 2
3
FUP
Programação
BD I
BDNC
SGBD
2007 algoritmos
2009 algoritmos
BD 2009
2010 BD
2011 BD
Berna Farias
Berna Farias
Berna Farias
Damires Souza
Berna Farias
BD I
title
row 3 Berna Farias
professor
row 1
2011
year
row 5
genre
algoritmo row 1
genre
algoritmos row 2 1
2
3
Distribuição por célula
41 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
Iiiihhhhhhh... Agora complicou =(
Como eu vou saber “quem é o quê” e “quem é quem” ?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 42
Quer dizer então que eu preciso ter uma maneira global para referenciar?
As linhas
As colunas
E os valores
sujeito
predicado
objeto
43 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
subject predicate
Row 5
object
Row 2
BDNC
title Programação
Row 2 year 2009
professor Damires Souza
Row 3 genre BD
Row 4
BD
Nós precisamos de triplas!
44 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
subject predicate
Berna Farias
object
Claudia
BDNC
é_irmã Berna Farias
Berna Farias mora_em Recife
Is in Pernambuco
Pernambuco parte_de Brasil Recife
leciona
Ceará Parte_de Brasil
Berna Farias Programação leciona
Várias triplas podem fazer referência a uma mesma entidade!
45 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
Triplas de diferentes fontes podem ser facilmente combinadas para formar um único grafo
Além disso, é possível usar termos de diferentes vocabulários para representar os dados.
O modelo RDF ainda permite a representação de dados em diferentes níveis de estruturação, sendo possível representar desde dados semiestruturados
a dados altamente estruturados.
46 V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí.
Padrões Linked Data
• SPARQL
é a linguagem de consulta padrão recomendada pelo W3C para recuperação de informações contidas em grafos RDF
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 47
Padrões Linked Data
• SPARQL
• Select: Especifica uma projeção sobre os dados como a ordem e a quantidade de atributos e/ou instâncias que serão retornados.
• From: Declara as fontes que serão consultadas. Esta cláusula é opcional. Quando não especificada, assumimos que a busca será feita em um documento RDF/RDFS particular.
• Where: Impões restrições na consulta. Os registros retornados pela consulta deverão satisfazer as restrições impostas por esta cláusula.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 48
uma consulta que retorna o escritor que
escreveu o livro King Lear e é casado com
AnneHathaway
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 49
Usar URIs como nomes para recursos
Usar URIs HTTP para que as pessoas possam encontrar esses nomes
Quando alguém procurar por uma URI, através dessa, providenciar informações úteis, por meio de RDFs
Incluir sentenças RDF que ligam para outras URIs de forma que eles possam descobrir mais recursos.
50
1
2
3
4
Princípios Linked Data
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 50
pd:cygr foaf:Person
Richard Cyganiak
dbpedia:Berlin
rdf: type
foaf: name
foaf: based_near
dbpedia:Berlin = http://dbpedia.org/resource/Berlin
dados linkados
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 51
pd:cygr foaf:Person
Richard Cyganiak
3.405.259
dbpedia:Berlin
dp:Cities_in_Germany
rdf: type
foaf: name
foaf: based_near dp:population
skos:subject
dados linkados
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 52
pd:cygr foaf:Person
Richard Cyganiak
3.405.259
dbpedia:Berlin
dp:Cities_in_Germany
rdf: type
foaf: name
foaf: based_near dp:population
skos:subject dbpedia:Hamburg
dbpedia:Muenchen
skos:subject
skos:subject
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 53
dados linkados
poxa.... E isso já é realidade? Já existem dados na Web de Dados?
54
Sim! Projeto Linking Open data
linkeddata.org
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 54
Fundado em janeiro de 2007 e apoiado pelo W3C
“identificar conjuntos de dados disponíveis sob licenças abertas e convertê-los para RDF
de acordo com os princípios Linked Data”
55
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 55
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 56
... e como eu posso publicar dados na Web de Dados seguindo os princípios Linked Data?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 57
Como publicar...Passo 1
Criação de URIs adequadas
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 58
Como publicar...Passo 1
• Usar URIs HTTP para tudo, tornando-as passíveis de serem
dereferenciadas.
• Evitar URIs com detalhes de implementação ou do
ambiente em que estão publicadas.
http://www.lia.ufc.br:8080/~danusarbc /index.php
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 59
X X
Como publicar...Passo 1
• Manter as URIs estáveis e persistentes
• usar algum tipo de chave primária dentro das URIs, para se certificar de que cada uma delas é única.
Livros ISBN
Cool URIs for the Semantic Web
http://www.w3.org/TR/cooluris/
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 60
Como publicar...Passo 2
Usar URIs dereferenciáveis
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 61
Como publicar...Passo 2
É o processo de recuperar uma representação de um recurso
identificado por uma URI, onde um recurso pode ter várias representações como documentos HTML, RDF, XML
entre outros.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 62
Como publicar...Passo 2
A recuperação da representação mais adequada para o usuário é feita por meio da
negociação de conteúdo.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 63
Servidor
Cliente
Get, Head, Post, Put, Delete, Trace, Options, Connection
Como publicar...Passo 2
Duas estratégias
303 URI e Hash URI
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 64
Como publicar...Passo 2
303 é um código de status de redirecionamento no qual o servidor
pode dar a localização de um documento que contém informações
sobre um recurso.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 65
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 66
GET /resource/Berlin HTTP/1.1
Host: dbpedia.org
Accept: text/html;q=0.5, application/rdf+xml
HTTP/1.1 303 See Other
Location: http://dbpedia.org/data/Berlin
Vary: Accept
GET /data/Berlin HTTP/1.1
Host: dbpedia.org
Accept: text/html;q=0.5, application/rdf+xml
HTTP/1.1 200 OK
Content-Type: application/rdf+xml;charset=utf-8
<?xml version="1.0"?>
<rdf:RDF
xmlns:units="http://dbpedia.org/units/"
xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:geonames="http://www.geonames.org/ontology#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
...
1
2
3
4
Como obter informações sobre a cidade de
Berlin
fonte Dbpedia: http://dbpedia.org/
Como publicar...Passo 2
Hash URI
a URI contém um fragmento, uma parte especial que é separada do resto da URI
pelo símbolo #. Quando um cliente deseja recuperar uma hash URI, ele remove tudo
que vem após o símbolo # e envia o restante da URI para o servidor. Como
resposta, o cliente recebe um documento completo com o conteúdo solicitado.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 67
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 68
GET /vocab/sme HTTP/1.1
Host: bidlynx.co.uk
Accept: application/rdf+xml
HTTP/1.1 200 OK
Content−Type: application/ rdf+xml ; charset=utf −8
<? xml version ="1.0"?>
<rdf:RDF
xmlns:rdf=" http: //www.w3.org /1999/02/22 − rdf−syntax−ns#"
xmlns:rdfs=" http: //www.w3.org /2000/01/ rdf−schema#">
<rdf:Description
rdf:about="http: // biglynx .co .uk/ vocab /sme#SmallMediumEnterprise ">
<rdf:type rdf:resource=" http: //www.w3.org /2000/01/ rdf−schema#Class " />
</ rdf:Description>
...
Vocabulário http://biglynx.co.uk/vocab/sme http://biglynx.co.uk/vocab/sme#SmallMediumEnterprise http://biglynx.co.uk/vocab/sme#Team
1
2
Como publicar...Passo 3
Criação de links RDF
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 69
Como publicar...Passo 3
devem ser criados links para outras fontes, seja de forma manual ou
automatizada.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 70
Como publicar...Passo 3
devem ser criados links para outras fontes, seja de forma manual ou
automatizada
links RDF internos e externos
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 71
Como publicar...Passo 3
links RDF internos
conecta recursos dentro de uma única fonte de dados Linked Data
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 72
Como publicar...Passo 3
links RDF externos
conectam recursos os quais são provenientes de diferentes fontes de dados
Linked Data
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 73
Como publicar...Passo 3
Sujeito: http://www.w3.org/People/Berners-Lee/card#i
Predicado: http://www.w3.org/2002/07/owl\#sameAs
Objeto: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007
Sujeito: http://dbpedia.org/resource/Tim\_Berners-Lee
Predicado: http://www.w3.org/2002/07/owl\#sameAs
Objeto: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 74
Como publicar...Passo 3
Ao se criar links RDF é preciso estabelecer relações entre os termos dos vocabulários
entre as fontes que estão sendo interligadas
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 75
Como publicar...Passo 3
•Friend-of-a-Friend (FOAF)
•Semantically-Interlinked Online Communities (SIOC)
•Simple Knowledge Organization System (SKOS)
•Description of a Project (DOAP)
•Creative Commons (CC)
•Dublin Core (DC).
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 76
Como publicar...Passo 4
Explicitar formas de acesso adicional aos dados
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 77
Como publicar...Passo 4
Para acessar os dados das fontes Linked Data é preciso realizar
consultas SPARQL sobre as fontes.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 78
Como publicar...Passo 4
SPARQL endpoint é um serviço Web com suporte ao protocolo SPARQL.
possui uma URI especifica para receber requisições HTTP com consultas SPARQL e retornar os resultados dessas consultas em
diferentes formatos como XML, JSON, texto, RDF/XML, NTriples, Turtle ou N3 e HTML
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 79
É preciso seguir algum padrão para publicar dados Linked Data?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 80
Sim!!! Publicando os dados em RDF...
Converter planilhas, arquivos CSV, arquivos XML, dados
relacionais e outros documentos para o formato RDF
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 81
Publicando os dados em RDF.... Conversão!!!
Após a geração do arquivo em formato RDF, os dados podem ser carregados em um banco de
dados que armazena as triplas RDF, chamado de RDF Store.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 82
Publicando os dados em RDF.... Conversão!!!
Vantagem?
melhoria de desempenho que pode ser obtida ao
usar formas de armazenamento especificamente
otimizadas para realizar a persistência de triplas
RDF
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 83
Desvantagem?
o armazenamento das triplas requer espaço extra em relação aos
dados originais. Além disso, a conversão demanda um certo
tempo para ser realizada e os dados em RDF
podem ficar desatualizados em relação aos dados
originais.
Publicando os dados em RDF.... Visão!!!
fornecer uma visão RDF
através de um RDF Wrapper
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 84
Publicando os dados em RDF.... Visão!!!
Vantagem?
a visão RDF não requer espaço de armazenamento extra e não corre o risco de apresentar
dados desatualizados
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 85
Desvantagem?
um desempenho inferior à conversão de dados para RDF devido às traduções dinâmicas entre os
modelos que deve ser realizada a cada uso
da visão RDF
Publicando os dados em RDF.... Visão!!!
• O RDB-to-RDF Wrappers é uma solução que cria visões RDF a partir de mapeamentos entre as estruturas relacionais e os grafos RDF http://www.w3.org/TR/r2rml/
• A plataforma D2RQ é um exemplo de RDB-to-RDF Wrappers, que fornece toda a infraestrutura necessária para acessar bancos de dados relacionais como grafos RDF virtuais
• http://www4.wiwiss.fu-berlin.de/bizer/d2rq/spec/
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 86
E como fazemos isso?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 87
Vamos ver?
Publicando os dados em RDF.... Validação!!!
Após gerar os dados no modelo RDF, é necessário verificar se o resultado está de acordo com os princípios Linked Data. Essa verificação pode ser feita através de ferramentas de validação como, por exemplo, Sindice
Web Data Inspector, Eyeball e W3C Validation Service.
http://inspector.sindice.com/
http://jena.sourceforge.net/Eyeball/
http://www.w3.org/RDF/Validator/
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 88
Após os dados serem publicados seguindo os princípios RDF como eles são consumidos?
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 89
Consumo de dados ligados
Browsers
Motores de buscas
Aplicações para domínios específicos
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 90
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 91
Tabulator
Piggy Bank
URI Burner LinkSailor
Dipper
Graphite RDF Browser
Browsers
Marbles
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 92
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 93
Swoogle
Falcons
Sig.ma
Sindice
Watson
Motores de
Buscas
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 94
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 95
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 96
BBC Programmes
Revyu
Talis Aspire
DBpedia Mobile
LinkedDataBr
Aplicações para
domínios específicos
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 97
BBC Programmes
DBpedia Mobile
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 98
Tarefa para casa...
• http://www.foaf-project.org/
• Criar seu arquivo RDF
• Colocar em sua página pessoal
• Inserir no Sindice, Sig.ma
• E ver o que acontece =)
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 99
Conclusões ...
árdua a tarefa de prover meios eficientes que permitam aproveitar todo conteúdo na Web, que pode ser composto tanto por dados estruturados, como os dados provenientes de bancos de dados relacionais, quanto por dados não estruturados, como textos e
dados multimídia
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 100
Conclusões ...
espera-se que o uso dos princípios do Linked Data possibilite a transformação de uma Web na qual os recursos são documentos HTML para uma Web de
Dados, onde os dados estarão interligados através de metadados
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 101
Grande Desafio ...
Adoção dos Princípios Linked Data e dos padrões para publicações de dados RDF
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 102
Obrigada!!! Danusa Ribeiro
Bernadette Lóscio [email protected]
Damires Souza [email protected]
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 103
Referências
• [Allemang & Hendler 2008] Allemang, D., Hendler, D. (2008) Semantic Web for the Working Ontologist, 1st edition. Morgan Kaufmann publ., Amsterdam, Netherlands.
• [Auer et al. 2009] Auer, S., Dietzold, S., Lehmann, J., Hellmann, S., and Aumueller, D. (2009) Triplify: Light-weight linked data publication from relational databases. In Quemada, J., León, G., Maarek, Y. S., and Nejdl, W., editors, Proceedings of the 18th International Conference on World Wide Web, WWW 2009, Madrid, Spain, April 20-24, 2009, pages 621–630. ACM.
• [Becker & Bizer 2008] Becker, C., Bizer, C. (2008) DBpedia Mobile: A Location-Enabled Linked Data Browser. In Linked Data on the Web (LDOW2008).
• [Bizer & Cyganiak 2006] Bizer, C., Cyganiak, R. (2006) D2R Server – Publishing Relational Databases on the Semantic Web. In 5th International Semantic Web Conference.
• [Bizer et al 2009] Bizer C., Heath T., Berners-Lee T. (2009) Linked data - the story so far. Int. J. Semantic Web Inf. Syst., 5(3):1–22, 2009.
• [Campos 2010] Campos M. L. (2010) GT-LinkedDataBR – Exposição, compartilhamento e conexão de recursos de dados abertos na Web (Linked Open Data). Disponível em http://www.rnp.br/pd/gts2010-2011/gt_linkeddatabr.html
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 104
Referências
• [Cheg & Qu 2011] Cheng, G., Qu, Y. (2011) Searching Linked Objects with Falcons: Approach, Implementation and Evaluation. International Journal on Semantic Web and Information Systems, Special Issue on Linked Data.
• [Costa & Yamate 2009] Costa A., Yamate F. (2009) Semantic Lattes: uma ferramenta de consulta baseada em ontologias. Trabalho de Grduação em Engenharia de Computação - Escola Politécnica. IME/USP.
• [Erling & Mikhailov 2006] Erling, O., Mikhailov, I. (2006) Mapping Relational Data to RDF in Virtuoso. http://virtuoso.openlinksw.com/dataspace/dav/wiki/ Main/VOSSQLRDF.
• [Filho & Lóscio 2009] Filho, F. W. B. H , Lóscio B. F. (2009) Web Semântica: Conceitos e Tecnologias. In Anais do ERCEMAPI (Escola Regional de Computação Ceará – Maranhão – Piauí).
• [Freitas 2003] Freitas, F. L. G. (2003) Ontologias e a Web Semântica. XXIII Congresso da Sociedade Brasileira de Computação. JAI. Campinas, São Paulo, Junho de 2003.
• [Gruber 1995] Gruber T. (1995) Toward principles for the design of ontologies used for knowledge sharing. 1995. International Journal Human-Computer Studies Vol. 43, Issues 5-6, November 1995, p.907-928.
• [Heath & Bizer 2011] Heath, T., Bizer, C. (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool, 2011.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 105
Referências
• [Klyne et al 2004] Klyne, G., Carroll, JJ., McBride., B. (2004) Resource description framework (RDF): Concepts and abstract syntax. Disponível em: http://www.w3.org/TR/rdf-concepts/
• [Lee et al 2006] Lee, B. T., Chen, Y., Chilton, L., Connolly, D., Dhanaraj, R., Hol-lenbach, J., Lerer, A., and Sheets, D. (2006) Tabulator: Exploring and Analyzing Linked Data on the Semantic Web. In In Procedings of the 3rd International Semantic Web User Interaction Workshop (SWUI06, page 06.
• [Lee et al 2001] Lee, B. T., Hendler J., Lassilia O. (2001) The semantic web. Scientific American, 284(5):34–44, Mai 2001. http://dx.doi.org/10.1038/scientificamerican0501-34DOI: 10.1038/scientificamerican0501-34
• [Magalhães et al 2011] Magalhães, R. P., Macedo, J. A. F., Vidal, V. M. P. (2011) Linked Data: Construindo um Espaço de Dados Global na Web. In Anais do XXIV Simpósio Brasileiro de Banco de Dados. Outubro de 2011.
• [Oren et al 2008] Oren, E., Delbru, R., Catasta, M., Cyganiak, R., Stenzhorn, H., and Tumma-rello, G. (2008) Sindice.com: a document-oriented lookup index for open linked data. Int. J.Metadata Semant. Ontologies, 3:37–52.
• [Souza 2009] Souza D. (2009) Using Semantics to Enhance Query Reformulation in Dynamic Distributed Environments. PhD Thesis, Federal University of Pernambuco (UFPE), Recife, PE, Brazil.
V ERCEMAPI - Escola Regional de Computação Ceará, Maranhão e Piauí. 106