+ All Categories
Home > Documents > Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I...

Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I...

Date post: 19-Oct-2020
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
31
Outline Motivation Optimierung des Algorithmus Benchmarks Efficient Learning of Label Ranking by Soft Projections onto Polyhedra Thomas Achenbach Technische Universit¨ at Darmstadt 18. Januar 2008 Thomas Achenbach Label Ranking by Projections onto Polyhedra
Transcript
Page 1: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

Efficient Learning of Label Ranking by SoftProjections onto Polyhedra

Thomas Achenbach

Technische Universitat Darmstadt

18. Januar 2008

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 2: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

MotivationSzenarioNotation

Optimierung des Algorithmusduales ProblemWeitere Schritte

BenchmarksVoraussetzungenTests

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 3: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

Gegeben:

I Menge von Instanzen (z.B. Newsfeeds) aus instance space χ

I Endliche Menge von Labeln: γ mit γ = {1, 2, . . . , k} = [k]

I Feeds konnen ein oder mehrere Label zugeordnet werden:Mapping von Feed auf Label

I Jedes Label hat fur jeden Feed bestimmte Relevanz:Preference (Feed handelt z.B. hauptsachlich von Politik, einwenig von Wirtschaft usw.)

Problem:Wie moglichst schnell automatisch den Feeds die richtigen Labelsmit den richtigen Praferenzen zuordnen???

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 4: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

Also Ziel:

I Exaktes Mapping von instance space (Newsfeeds) zum targetspace (labels).

I dabei richtige Voraussage der label preferences

I moglichst schnell

Hier: Lernen aus Trainingsbeispielen (batch learning)

Betonung auf moglichst schnellGeht hier nur um Performance - Optimierung; dass Ziel erreichbarschon bekannt.Also zuerst: ansehen, was genau optimiert werden sollDazu: Vorarbeiten mit Notation... :

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 5: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

Ausgangspunkt:

I Instanz aus instance space: x ∈ χ, χ ⊆ Rn

I Vordefinierte endliche Menge von Labeln γ mitγ = {1, 2, . . . , k} = [k]

Lernziel: Label Ranking Function:I f : χ→ Rk mit Ruckgabewert:

I ~γ ∈ Rk target vector / label rankingI ~γi ∈ RI fr (x) rtes Element von ~γI ~γy > ~γy ′ ⇒ γ relevanter fur x als γ′

I ~γy = ~γy ′ moglichI Darstellung von ~γ als gerichteter gewichteter Graph moglich

z.B. Edge (3,1): ~γ3 − ~γ1 = 3 bei ~γ = (−1, 0, 2, 0,−1)

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 6: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

I fγ(x) > fγ′(x)⇒ γ relevanter fur x als γ′

I fr (x) = wr · x; wr ∈ Rn, χ ⊆ Rn ⇒ lineare Funktion (Das aberkeine echte Einschrankung (SVM Kernel trick...)

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 7: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

I Trainingsbeispiel: S = {(xi , ~γi )}mi=1; x ∈ χ,~γi ∈ Rk

Performance via Loss Function evaluiert(Notation: (a)+ = max{0, a}):

I ` : Rk × Rk → RI `r ,s(f(x), ~γ) = (((~γr − ~γs)− (fr (x)− fs(x)))+

I `r ,s zeigt wieweit constraint fr (x)− fs(x) ≥ ~γr − ~γs nichtberucksichtigt wird

Bis hierher nur paarweiser Vergleich der Label (r , s)Jetzt: Alle paarbasierten losses in einen loss zusammenfassen!

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 8: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

Paare von Labeln in d unabhangige Mengen aufteilen. Jede Mengeisomorph zu vollst. biparititem Graphen

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 9: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

I loss eines Subgraphen (Vj ,Ej): maximum uber den losses derPaare im Subgraphen

I zusatzl. Gewichtung der einzelnen Subgraphen mit(nichtnegativem) σj

=⇒ Loss:

`(f(x), ~γ) =d∑

j=1

σjmax(r ,s)∈Ej`r ,s(f(x), ~γ)

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 10: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

Mit loss-function jetzt label-ranking-function bilden:

I constrained optimization problem definieren (mit SVMParadigma)

I optimale Losung davon: label-ranking-function mit 2 Termen:

1. empirischer loss der label-ranking-function bezgl. Trainingsset2. penalty fur Komplexitat der Funktion (Regularisierungsterm),

i.e. Summe der Quadrate der Normen von {w1, . . . ,wk}3. Tradeoff zwischen beiden Termen durch Parameter C

kontrolliert

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 11: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

minw1,...,wk

1

2

k∑j=1

‖wj‖2 + Cm∑

i=1

`(f(xi ), ~γi ) mit : fγ(xi ) = wγ · xi

Und andere Notation der loss-function:

`(f(x), ~γ) = minξ∈Rd+

d∑j=1

σjξj

mit: ∀j ∈ [d ],∀(r , s) ∈ Ej , fr (x)− fs(x) ≥ ~γr − ~γs − ξj

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 12: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

SzenarioNotation

Ergibt das quadratische Optimierungsproblem:

minw1,...,wk ,ξ1

2

k∑j=1

‖wj‖2 + Cm∑

i=1

|E(~γ i )|∑j=1

σjξij

mit: ∀i ∈ [m],∀Ej ∈ E(~γ i ),∀(r , s) ∈ Ej ,wr · xi −ws · xi ≥~γ i

r − ~γ is − ξij ∀i , j , ξij ≥ 0

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 13: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Ziele Optimierung:

I schnell

I soll mit allen Dekompositionen in Subgraphenzurechtkommen.

Herleitung des Algorithmus komplex!

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 14: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Grober Ablauf:

1. Iteration uber die Trainingsbeispiele

2. Iteration uber die Subgraphen

3. dort die ranking-function fur neues Beispiel verbessern

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 15: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Kern des Algorithmus:3. Punkt: ranking-function fur neues Beispiel verbessern:Dabei Ausgangsposition:

I schon label-ranking-function vorhanden ( {u1, . . . ,uk})I E(~γ) besteht aus nur einem vollstandigen bipartiten Graphen

I Ziel: Funktion verbessern wenn neues Beispiel verarbeitet wird

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 16: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Ergibt constrained optimization problem:

minw1,...,wk ,ξ1

2

k∑y=1

‖wy − uy‖2 + Cξ

mit: ∀(r , s) ∈ E ,wr · x−ws · x ≥ ~γr − ~γs − ξ, ξ ≥ 0

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 17: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

I label-ranking function schon vorhanden, reprasentiert durch{u1, . . . ,uk}

I Erinnerung: label-ranking-function fr (x) = ur · x;ur ∈ Rn, χ ⊆ Rn

Problemlosung kann aufgefasst werden als: Projektion von{u1, . . . ,uk} auf das Polyeder, dass mit den BeschrankungenDefiniert wird.Daher Name des Algorithmus: SOft-Projection Onto POlyhedraSOPOPO

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 18: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Erlauterung zur Projektion (aus Wikipedia):

turkis, schwarz, violett sind die Beschrankungen; erlaubte punkte im blauen Polyeder; gestrichelte Rote sollen

optimiert werden (soweit wie moglich nach rechts schieben)

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 19: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Losung des Problems in mehreren Schritten:

I Duales Problem finden

I Anzahl m der Variablen im dualen Problem von k2/4 ≥ m aufk reduzieren

I Aufteilung des Problems in zwei einfachere

Ergebnis: Komplexitat von O(k log(k))

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 20: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Duales Problem:

I primare Zielfunktion ist konvex

I primare constraints sind linear

I Es gibt Losung fur primares Problem (setze wy = 0 undξ = max(r ,s)∈E (~γr − ~γs)

=⇒ strong duality

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 21: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Finden des Problems:Lagrange des Primarproblems bilden:

mit: ∀(r , s) ∈ E : τr ,s ≥ 0, ζ ≥ 0

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 22: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

I teilterme fallen weg

I Primaervariablen konnen beseitigt werden

I Umformung fuhrt zu Ergebnis

I Dann Anzahl der Variablen im dualen Problem auf kreduzieren.

I Problem in zwei einfache Teilprobleme aufteilen

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 23: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Zur Ansicht:

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 24: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Weiter im Algorithmus:

I Jetzt nur eine Projektion fur einen einzigen vollstandigenbipartiten Graphen

I Algorithmus soll aber auf jeder beliebigen Aufteilungfunktionieren

I Gesucht also Algorithmus der Urspruengliche Aufgabe lost,indem er immer wieder SOPOPO verwendet

I ursprungliches Problem vereinfachen (syntax) ⇒

minw’,ξ1

2‖w’‖2 +

m∑i=1

Ciξi

Mit Beschrankungen

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 25: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Fur die Vereinfachung:

I Duales Problem suchen (Lagrange...)I Dann Algorithmus der in Runden arbeitet:

I In jeder Runde wird eine Menge von dualen Variablenupgedatet

I alle anderen variablen sind fix

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 26: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

duales ProblemWeitere Schritte

Ansicht des Algorithmus in Pseudocode:

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 27: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

VoraussetzungenTests

LOQO: Kommerzielles Paket zur linearen Optimierung, basiertauf interior point MethodeAngesteuert mit Matlab-Interface, Implementierung selbst: C++SOPOPO: Implementiert in MatlabTestdaten immer zufallig gewahlt (Normalverteilt)

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 28: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

VoraussetzungenTests

Erster Test: Performance Soft-projection auf ein Polyeder /originares Problem

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 29: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

VoraussetzungenTests

Aber: Test ’unfair’, da:

I LOQO ist general purpose, nimmt daher immer interial pointAlgorithmus

I SOPOPO optimiert immer auf:

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 30: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

VoraussetzungenTests

Daher LOQO direkt auch auf das optimierte Problem angesetzt:

Thomas Achenbach Label Ranking by Projections onto Polyhedra

Page 31: Efficient Learning of Label Ranking by Soft Projections ... · Lernziel: Label Ranking Function: I f : ˜!Rk mit R uckgabewert: I ~ 2Rk target vector / label ranking I ~ i 2R I f

OutlineMotivation

Optimierung des AlgorithmusBenchmarks

VoraussetzungenTests

Gesamttest batchlearning:Jeweils 10x mehr Beispiele als Labels (k) generiert

Thomas Achenbach Label Ranking by Projections onto Polyhedra


Recommended