Date post: | 05-Dec-2014 |
Category: |
Technology |
Upload: | junior-grossi |
View: | 59 times |
Download: | 0 times |
Junior Grossi && Paloma DieselDezembro/2013 | PPGCI UFMG
Semantic Web Technology for the Extraction and Analysis of Social Networks
Peter Mika, 2005
Flink
Peter Mika?
● Yahoo! Research (Barcelona, Espanha)
● Semantic Web, Search, Web Mining
● Flink (2005) - Web - Java● Livro "Social Networks and the
Semantic Web" (2007)
Flink (Origem)
● Sucesso da Web○ Divulgação de informações pessoais○ Redes Sociais (Friendster - 5M users [2005])
● Redes Sociais○ Informações comuns
entre os sites○ Os mesmos dados
mantidos em sites diferentes
Flink (Origem)
● FOAF Project (www.foaf-project.org)○ Iniciativa parte do usuário○ Semântica dos dados pessoais
■ Links nas páginas (meta tag)■ rdfs:seeAlso
Pessoa
Pessoa
Pessoa
Flink (Origem)
● Utilizar FOAF○ Formar "Social Intellingence"○ Coletar informações pessoais de pesquisadores
■ Web pages, e-mails, publicações○ "FOAF ontology"
● 608 pesquisadores de Web Semântica○ Links de um pesquisador
■ Informações pessoais■ "Rede Social de Pesquisador"
Flink
● Dados Coletados (cada pesquisador)○ Informações pessoais○ Localização geográfica○ Interesses○ Participação em eventos de Web Semântica○ Publicações escritas sobre Web Semântica
● Resultados○ 5147 publicações○ 8185 mensagens para grupos de discussão
Ontologia (Tópicos de Pesquisa)
Fontes de Dados
Recursos
● Web mining (Google)○ Conferir área de atuação de pesquisador
■ Crawler■ Google Mindshare (#)
● NP Interesses / NP Pesquisador (>=0)
● FOAF○ Crawler RDF para coletar perfis (scutter)○ Análise das triplas com predicados RDF, RDFs
Recursos
● E-mails○ Download POP3 ou IMAP○ Header capturado em RDF
● Publicação○ Google Scholar
● Sesame Server (http://openrdf.org)○ Deploy de RDF
■ SQL DB, filesystem, in-memory, etc○ Suporta SPARQL○ Suporta milhões de triplas
Armazenamento
Análises
● Interpretação das Redes● Erros / Ambiguidade● Ruídos (pequenas falhas)
Trabalhos Relacionados
● Ontology-based knowledge management○ On-To-Knowledge && SEKT Project○ Coleta de dados manualmente
■ Entrevistas e questionários● Emails como foco principal● FOAF
○ Paolillo && Wright
Conclusão e Trabalho Futuro
● Desafios1. Extração, representação e agregação de
informações sociais2. Ontologia Social
■ Classificar relacionamentos3. Criação de padrões sociais
■ Identificar relacionamentos■ Utilizando dados eletrônicos
● + Performance● + Escalabilidade Horizontal
Obrigado!Perguntas?