Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk...

Post on 04-Jun-2020

1 views 0 download

transcript

Prototype SOLAP appliqué sur des champs continus en mode raster

Analyse de hot spots de criminalité

Jean-Paul Kasprzyk, doctorant

Session démos 24 novembre 2014

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Introduction

2

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

L’informatique décisionnelle (BI)

• Collecte, consolidation et analyse de données afin d’aider les entreprises dans le processus de prise de décision

• Approche décisionnelle (OLAP) ≠ approche transactionnelle (OLTP) • Le cœur d’une architecture BI est l’entrepôt de données

– Entrepôt présente une structure multidimensionnelle

• Le serveur OLAP (« On Line Analytical Processing ») permet à un utilisateur d’extraire simplement et rapidement de l’information synthétisée hors de l’entrepôt (agrégations des données)

3

Données externes

Entrepôt de données

ETL

Serveur OLAP

Interfaces OLAP

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Exemple de structure multidimensionnelle en étoile

4

Fait: délit

Niveau: mois

Niveau: année

Niveau: type de délit

Niveau: province

Niveau: pays

Dimension temporelle

Dimension thématique

Dimension spatiale

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

5

OLAP

ROLAP MOLAP

HOLAP

SIG

Vecteur Raster

SOLAP

Information spatiale

Continue Discrète

OLAP dominant SIG dominant

OLAP-SIG intégré

OLAP spatial et question de recherche

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Modélisation SOLAP raster

6

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

7

Modèle logique: Raster MOLAP

• Raster = tableau multidimensionnel • Fait = pixel indexé (rangée, colonne, bande) • « Rangée » et « colonne » sont les membres des dimensions spatiales X et Y • « Bande » est une dimension sémantique (ou éventuellement Z)

– Toutes les bandes doivent partager les même propriétés géométriques (même domaine spatial) – Bande optimisée pour l’OLAP quand la dimension est ordonnée

Exemple de cube raster

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

4

Rast 30

Rast 100

Rast 300

Mois

8

Modèle logique: Raster HOLAP

• 3 dimensions dans le MOLAP (X, Y et bande) – Agrégations très rapide en ligne et en colonne (idem

MOLAP) – Structure optimisée pour le filtrage spatial à la volée car

la proximité géographique des pixels est conservée dans la structure du raster

• Autres dimensions rejetées dans l’architecture ROLAP – Une mesure ROLAP = un raster

– Agrégation par opérations raster (Map algebra) = opérations de « drill across » entre cubes MOLAP

– Optimisé quand mesures raster partagent le même domaine spatial: • Dimensions raster

– Nombre de rangées – Nombre de colonnes – Nombre de bandes

• Géoréférencement – Résolution X, Y – Rotation – Translation

Type de crime

1

2

3

Attributs ou FK des dimensions ROLAP

Mesures raster = cubes MOLAP raster

Exemple de table des faits raster

A

B

C

D

… … … … …

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Application: analyse de hot spots de criminalité

9

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Cartes de hot spots

• Technique très populaire en cartographie criminelle au niveau stratégique – Offre une bonne visualisation de la distribution spatiale de la criminalité – Egalement utilisée pour de la prédiction

• Ces cartes sont générées par transformations de nuages de points (délits) en surface continue (raster) – « Kernel Density Estimation » (KDE) – Chaque pixel a une valeur dépendant du nombre de délits et de leur proximité

10

KDE Classification

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Prototype SOLAP raster

11

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Architecture open source

12

Input data

ETL

Geokettle

Entrepôt de

données

PostGIS raster

Serveur

SOLAP

Php

Serveur de

données spatiales

Mapserver

Serveur web

Apache

Interface

Html

Javascript

Carte

OpenLayers Arbre à dimensions et

graphiques

DHTMLX

COTE

SERVEUR

COTE

CLIENT

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Démonstration

13

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Conclusions

• Présentation d’un outil SOLAP exploitant le format raster à travers une architecture hybride (multidimensionnelle et relationnelle)

• Avantages: – Agrégations spatiales bénéficient des performances du MOLAP – Stockage bénéficie des performances du ROLAP – Filtres spatiaux intégrés à la volée – Nombreux traitements d’analyse spatiale propres au format raster – Outil adapté à l’analyse de champs continus

• Un outil OLAP-SIG intégré devrait pouvoir combiner les deux approches: vecteur et raster – Vecteur permet l’accès aux données individuelles – Vecteur plus approprié pour les données discrètes et les champs

continus incomplets

14