Date post: | 03-Jan-2016 |
Category: |
Documents |
Upload: | stephanie-carpenter |
View: | 34 times |
Download: | 0 times |
Aq (Algorithme de l’étoile)
Jérôme AZÉLRI – équipe IA
DEA I3 - Module Génomique 2
Plan
Présentation de Aq
Algorithme Un exemple Défauts de la méthode Solution apportée Application à la génomique
DEA I3 - Module Génomique 3
Aq (Algorithme de l’étoile)
Proposé par R. Michalski (1969) Problème :
un ensemble d’attributs 2 classes (POS, NEG)
Objectif : Apprendre une description correcte et complète de
la classe POS
DEA I3 - Module Génomique 4
Ensemble d’apprentissage
Exemples Att1 Att2 Att3 Classe
E1 Y N R +E2 X M R +E3 Y N S +PO
S
E4 X N R +F1 X M S -F2 Y M T -F3 Y N T -F4 Z N T -F5 Z N R -
NEG
F6 X N S -
DEA I3 - Module Génomique 5
Algorithme
Diviser les exemples en deux sous ensembles (POS, NEG)
Choisir un exemple dans POS (le noyau) Trouver un ensemble de règles générales
caractérisant le noyau (l’étoile) Choisir la meilleure règle dans l’étoile Itérer s’il reste des exemples non couverts
dans POS
DEA I3 - Module Génomique 6
Changement de représentation (1/4)
Exemples Att1 Att2 Att3 Classe
E1 Y N R + E2 X M R + E3 Y N S + PO
S
E4 X N R +
F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -
NEG
F6 X N S -
NM
X Y
R
S
T
Z
F3
E3
E1E4
F4
F5
F6
DEA I3 - Module Génomique 7
Changement de représentation (2/4)
Exemples Att1 Att2 Att3 Classe
E1 Y N R + E2 X M R + E3 Y N S + PO
S
E4 X N R +
F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -
NEG
F6 X N S -
MN
X Y
R
ST
ZE2
F2F1
NM
X Y
R
S
T
Z
F3
E3
E1E4
F4
F5
F6
DEA I3 - Module Génomique 8
Changement de représentation (3/4)
Att1
E2 E4 F1 F6 X
E1 E3 F2 F3 Y
F5 F4 Z
M N M N M N Att2 R S T Att3
Exemples Att1 Att2 Att3 Classe
E1 Y N R + E2 X M R + E3 Y N S + PO
S
E4 X N R +
F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -
NEG
F6 X N S -
DEA I3 - Module Génomique 9
Changement de représentation (4/4)
Att1
E2 E4 F1 F6 X
E1 E3 F2 F3 Y
F5 F4 Z
M N M N M N Att2 R S T Att3
Exemples Att1 Att2 Att3 Classe
E1 Y N R + E2 X M R + E3 Y N S + PO
S
E4 X N R +
F1 X M S - F2 Y M T - F3 Y N T - F4 Z N T - F5 Z N R -
NEG
F6 X N S -
Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2 R S T Att3
DEA I3 - Module Génomique 10
Apprentissage (1/4)
Choix du noyau : E1
Génération de l ’étoile de E1 tel que F1 ne soit pas couvert
Exemples Att1 Att2 Att3 Classe
E1 Y N R +E2 X M R +E3 Y N S +PO
SE4 X N R +F1 X M S -F2 Y M T -F3 Y N T -F4 Z N T -F5 Z N R -
NEG
F6 X N S -
DEA I3 - Module Génomique 11
Apprentissage (2/4)
E1 :• (Att1 = Y)• (Att2 = N)• (Att3 = R)
Négation de F1 :• (Att1 = Y v Z)• (Att2 = N)• (Att3 = R v T)
Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2R S T Att3
F1E1
DEA I3 - Module Génomique 12
Apprentissage (3/4)
Prise en considération de F2• Att3 = R• (Att3 = (R v S)) & (Att1 = (Y v Z))• Att2 = N
Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2R S T Att3
F2
DEA I3 - Module Génomique 13
Apprentissage (4/4)
Prise en considération de F3 (ou F4)• (Att3 = R) & (Att1 = X v Y)• (Att3 = (R v S)) & (Att1 = (Y v Z))
Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2R S T Att3
F3
F4
DEA I3 - Module Génomique 14
Étoile de E1
La spécialisation des règles conduit à : R1’ : (att1 = X v Y) & (att3 = R)
R2’ : (att1 = Y) & (att3 = R v S)Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2R S T Att3
DEA I3 - Module Génomique 15
Critères de sélection des règles dans l’étoile
Maximiser le nombre d ’éléments couverts par la règle retenue
Minimiser le nombre d ’attributs de la règle retenue
Maximiser la capacité à généraliser de la règle retenue
...
DEA I3 - Module Génomique 16
Critère et règle retenus
Maximiser le nombre d’exemples couverts
Règle retenue :• R1’ : (att1 = X v Y) & (att3 = R)Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2R S T Att3
E3
DEA I3 - Module Génomique 17
Itération de l’algorithme
Exemple non couvert par R1’ : E3 Étoile de E3 :
• R : (att1 = Y) & (att3 = R v S)Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2R S T Att3
DEA I3 - Module Génomique 18
Résultat final
Deux règles permettent de caractériser POS par rapport à NEG• R1 : (att1 = X v Y) & (att3 = R)
• R2 : (att1 = Y) & (att3 = R v S)Att1
+ + - - X
+ + - - Y
- - Z
M N M N M N Att2R S T Att3
DEA I3 - Module Génomique 19
Défauts de Aq
Sensibilité au bruit dans les classes Sensibilité liée à l’imprécision du
contexte
Solution proposée par R. Michalski (1990)• approche à deux niveaux (two-tiered
approach )
DEA I3 - Module Génomique 20
Approche à deux niveaux(1/3)
Idée :• découper la description de la classe POS
en deux parties :Représentation de Base du Concept (RBC)Interprétation Inférentielle du Concept (IIC)
Possibilité d’apprendre des concepts flexibles
DEA I3 - Module Génomique 21
Approche à deux niveaux(2/3)
Algorithme• Utiliser Aq pour obtenir l’ensemble initial
de règles• Retenir la règle la plus importante
(nombre maximal d’éléments de POS couverts) : RBC
• Définir la procédure IIC pour reconnaître les éléments de POS non couverts par RBC
DEA I3 - Module Génomique 22
Approche à deux niveaux(3/3)
Exemple• BCR : si A1 & A2 & … & An alors POS
• IIC : au moins 3 conditions parmi A1, …, An doivent être vérifiées
BCR
IIC
DEA I3 - Module Génomique 23
Application à la génomique
Caractériser des gènes (ou des protéines) par classes de fonctions
Caractériser des séquences d’ADN (ou d’ARN) selon certaines propriétés