Objetos Simbólicos:
• Real-life objects are too complex to be represented by points in a vectorial space. [Bock&Diday, 2000]
• Symbolic objects overcome this limitation by representing concepts rather than individuals. [Bock&Diday, 2000]
• Knowledge extraction from large data bases is our main aim as in "Data Mining". [Diday, 1998]
• En análisis simbólico de datos transforma el Análisis de Datos en Minería de Datos.
Un poco de historia del ADS:
• L'ADS ou encore l'analyse des données appliquée
à des concepts, a été introduite par E.Diday [Diday
(1987a)], [Diday (1987b)], [Diday (1989)] pour
combler les insuffisances des méthodes de
l'analyse de données classique
• En analyse factorielle, l'analyse en composantes
principales (ACP) a été adaptée aux individus
décrits par un vecteur d'intervalles numériques
[Cazes et al. (1997)], [Verde et al. (1998)], [Lauro et
al. (1998)], [Chouakria (1998)], [Rodríguez 2000].
Un poco de historia del ADS: • Dans le domaine de la segmentation, [Ciampi et al.
(1995)] et [Perinel (1996)] ont développé une
extension des arbres standard de décision que
[Bravo et al. (1998)] a adaptée dans le cas de
données stratifiées.
• Les méthodes de classification ascendante telles
que les hiérarchies ou les pyramides [Diday
(1984)], [Bertrand (1986)], [Brito (1991)],
[Rodríguez (2000)] ont été récemment modifiées
dans le but d'accélérer les algorithmes et
d'améliorer l'interprétation des résultats
[Mfoumoune (1998)] et [Pak et al. (2005)].
Livraison Fournisseur Compagnie Ville
Liv1 F1 CNET Paris
Liv2 F2 MATRA Toulouse
Liv3 F3 EDF Clamart
Liv4 F1 CNET Lannion
Liv5 F3 EDF Clamart
Nous définissons: C1={Liv1,Liv2}, C2={Liv3, Liv5}, C3={Liv1, Liv3, Liv4, Liv5}.
Classe Fournisseur Compagnie Ville
C1 F1, F2 CNET,MATR
A
Paris, Toulouse
C2 F3 EDF Clamart
C3 F1,F3 CNET, EDF
Lannion,Clamart
Creando tablas simbólicas:
Creando tablas simbólicas:
Classical description of Schools
Town Nb of pupils Kind Level
Paris [320, 450] (100%)Public {1, 3}
Lyon [200, 380] (50%)Public , (50%)Private {2, 3}
Toulouse [210, 290] (50%)Public , (50%)Private {1, 2}
Symbolic description of the towns by the schools variables
Schools Town Nb of pupils Kind Level
Jaurès Paris 320 Public 1
Condorcet Paris 450 Public 3
Chevreul Lyon 200 Public 2
St Hélène Lyon 380 Private 3
St Sernin Toulouse 290 Public 1
St Hilaire Toulouse 210 Private 2
¿Cómo se construyen las tablas simbólicas?
Análisis
Multivariado
Numérico
Análisis
Clásico
1002 1,600.00 Heredia 34 6486
1002 1,900.00 Alajuela 27 5367
1001 1,850.00 Alajuela 35 3245
1001 1,900.00 San Pedro 35 7635
1000 2,400.00 Grecia 39 3245
1001 1,750.00 San Pedro 28 1251
1000 2,500.00 Curridabat 36 3457
# Tarjeta Monto Sucursal Causal Id-trx
Millones…
Datos
[1.6,1.9] {Al-50%,Her-50%} 27(1/2),34(1/2) 1002
[1.75,1.9] {SP-66%,Al-33%} 28(1/3),35(2/3) 1001
[2.4,2.5] {Curr-50%,Gre-50%} 36(1/2),39(1/2) 1000
Monto Sucursal Causal # Tarjeta Análisis
Multivariado
Simbólico
Cientos…
Conceptos 534,5
122,2
255.4
Salario
Relational Data Base Symbolic Data Base
100% knowledge
15 Gigabyte
90 % knowledge
10.3 Megabyte
Symbolic Data Base: