Machine Learning - Ein Überblick - W3L...Ein Programm lernt, wenn seine Leistung in Bezug auf eine...

Post on 25-Sep-2020

0 views 0 download

transcript

Machine Learning

Ein Überblick

2

Inhalt

Anwendungsbeispiele

Begriffe

Arten des Machine Learnings

3

Anwendungsbeispiele

4

Anwendungsbeispiele

Automatische Zusammenfassung

Buch wurde herausgegeben von

Springer Nature

Autor: Beta Writer

Fasst Forschungsstand im Bereich

Lithium-Ionen-Akkus zusammen

Input: Große Anzahl aktueller

Forschungsartikel aus dem

Forschungsbereich (von SpringerLink)

https://link.springer.com/book/10.1007

/978-3-030-16800-1

5

Anwendungsbeispiele

Textgenerierung

OpenAI GPT-2

Berücksichtigt Sprachstil der Eingabe

Modell wurde bisher nicht vollständig veröffentlicht

https://openai.com/blog/better-language-models/#sample1

6

Anwendungsbeispiele

Deep Fakes

Bildgenerierung

Fake-Porträts

https://thispersondoesnotexist.com/

Videogenerierung

Austausch von Gesichtern in Videos

FakeApp

Obama-Video

7

Anwendungsbeispiele

AlphaGo Zero

Brettspiel Go

Training nur auf Basis der Go-Spielregeln

Lernen durch Spiel gegen sich selbst

AlphaStar

Starcraft II

Zusammenarbeit mit Blizzard für direkten Zugriff

auf Spielinformationen (Feature-Karten)

Gewann 10 von 10 Spiele gegen 2 Top-Profis unter

Wettbewerbsbedingungen

Herausforderungen

Unzureichende Informationen („Fog of War“)

Echtzeitspiel

Viele mögliche Aktionen

Langzeitplanung / Strategie

Quelle:

https://de.wikipedia.org/wiki/Go_(Spiel)#/me

dia/Datei:Go_game_Kobayashi-Kato.png

Quelle: https://starcraft2.com/de-de/media#screenshots-13

8

Anwendungsbeispiele

Weitere Beispiele

Erkennung von Kreditkartenbetrug, Versicherungsbetrug

Produktempfehlungen auf Basis des bisherigen Kaufverhaltens

Diagnostik in der Medizin

Selbstfahrende Autos

Voraussage von Aktienkursen

Automatische Übersetzung

Voraussage des Stromverbrauchs

9

Begriffe

10

Begriffe

Künstliche Intelligenz (KI)

Nachahmung menschlichen Verhalten und Denkens

Automatische und autonome Aufgabenerledigung

Quelle: http://www.datenbanken-verstehen.de/lexikon/kuenstliche-intelligenz/

11

Begriffe

Machine Learning

Ein Programm lernt, wenn seine Leistung in Bezug auf eine Aufgabe mit zunehmender Erfahrung

anwächst (Tom Mitchell, 1997)

Keine explizite Programmierung (Arthur Samuel, 1959)

12

Explizite Programmierung vs ML

Manuell Autom.

Regeln

Explizite Programmierung Machine Learning

Programmieren

ProgrammEingabe Ausgabe

Ände

rung Daten

Training

ProgrammEingabe Ausgabe

Ände

rung

13

Begriffe

Deep Learning

Machine Learning mit mehrschichtigen neuronalen Netzen

Dem menschlichen Gehirn nachempfunden

14

Begriffe

Datensatz

Besteht aus mehreren

Datenpunkten

Ein Datenpunkt besteht i. d. R.

aus mehreren Merkmalen

(Features)

Zu einem Datenpunkt können

ein oder mehrere zugehörige

Ausgaben vorhanden sein

(Targets, Labels)

Features Targets

Zimmer Größe(m²)

Preis (Euro)

3 80 150.000

1 23 60.000

4 100 155.000

… … …

15

Arten des Machine Learnings

16

Arten des Machine Learnings

Klassifikation nach menschlicher Überwachung

Überwachtes Lernen (Supervised Learning)

Unüberwachtes Lernen (Unsupervised Learning)

Halb-/Teilüberwachtes Lernen (Semi-Supervised Learning)

Bestärkendes Lernen (Reinforcement Learning)

Aktives Lernen (Active Learning)

17

Überwachtes Lernen

Datensatz enthält

Features

Targets

Features Targets

Zimmer Größe(m²)

Preis (Euro)

3 80 150.000

1 23 60.000

4 100 155.000

… … …

18

Überwachtes Lernen

Regression

Vorhersage numerischer Werte

Ausgabe kontinuierlicher

Werte

Kontinuierliche Werte sind

geordnet

Beispiele:

Ausgabe von

Immobilienpreisen

Prognose von Aktienkursen

Prognose von Temperaturen

Features Targets

Zimmer Größe(m²)

Preis (Euro)

3 80 150.000

1 23 60.000

4 100 155.000

… … …

19

Überwachtes Lernen

Klassifikation

Ausgabe von diskreten Werten

Jeder dieser Werte steht für eine Klasse

Die Werte sind nicht geordnet

Beispiele:

Spamfilter

– Spam

– Ham

Klassifikation von Kunden

– Wird nochmal kaufen

– Wird nicht mehr kaufen

Klassifikation von Fotos

– Hund

– Katze

– Maus

Features Targets

Zimmer Größe(m²)

Preis (Euro)

Ausstattung

3 80 150.000 Gehoben

1 23 600.000 Luxus

4 90 155.000 Standard

… … … …

20

Überwachtes Lernen

Viele Algorithmen zur Regression können auch zur Klassifikation eingesetzt werden (und

umgekehrt)

Beispiel

Logistische Regression wird zur Klassifikation eingesetzt

Sie gibt kontinuierliche Werte aus, die für Wahrscheinlichkeiten stehen

Features Targets Vorhersage

Zimmer Größe(m²)

Preis (Euro)

Ausstattung Standard Gehoben Luxus

3 80 150.000 Gehoben 0.3 0.6 0.1

1 23 600.000 Luxus 0.0 0.1 0.9

4 90 155.000 Standard 0.5 0.4 0.1

… … … … … … …

21

Unüberwachtes Lernen

Datensatz enthält

nur Features

Datensatz enthält

keine Targets!

Features Targets

Zimmer Größe(m²)

Preis (Euro)

Ausstattung

3 80 150.000 Gehoben

1 23 600.000 Luxus

4 85 155.000 Standard

… … … …

22

Unüberwachtes Lernen

Clustering

Visualisierung

Dimensionsreduktion

Anomalieerkennung

Lernen von

Assoziationsregeln

Feature 1

Feature 2

23

Unüberwachtes Lernen

Clustering

Visualisierung

Dimensionsreduktion

Anomalieerkennung

Lernen von

Assoziationsregeln

Quelle: https://cdn-images-1.medium.com/max/1600/1*Wcn_sTqL05a7vHpmxf24Dw.png

24

Unüberwachtes Lernen

Clustering

Visualisierung

Dimensionsreduktion

Anomalieerkennung

Lernen von

Assoziationsregeln

Manifold Learning

Quelle: https://csdl-images.computer.org/trans/tp/2008/09/figures/ttp20080915471.gif

25

Unüberwachtes Lernen

Clustering

Visualisierung

Dimensionsreduktion

Anomalieerkennung

Lernen von

Assoziationsregeln

Features

Lauf-leistung(km)

Alter(Jahre)

Preis (Euro) …

10.000 1 13.000 …

35.000 4 27.000 …

90.000 10 15.000 …

… … … …

Features

Abnutzung Preis (Euro)

0.1 13.000

Merkmalsextraktion

26

Unüberwachtes Lernen

Clustering

Visualisierung

Dimensionsreduktion

Anomalieerkennung

Lernen von

Assoziationsregeln

Target 1

Feature 1

Unauffälliger Datenpunkt

Anomalie

27

Unüberwachtes Lernen

Clustering

Visualisierung

Dimensionsreduktion

Anomalieerkennung

Lernen von

Assoziationsregeln

Quelle: https://www.amazon.de/dp/B07339ND52

28

Halb-/Teilüberwachtes Lernen

Datensatz enthält

mehrheitlich

Datenpunkte ohne

Targets

Meist Kombination aus

unüberwachtem und

überwachtem Lernen

A

B

Feature 1

Feature 2

29

Bestärkendes Lernen

Agent interagiert mit

Umgebung

Agent lernt Strategie (Policy),

um Belohnung (Reward) zu

maximieren

Betrachtet Zustand und

Aktionen und deren Wert

Beispiele

Roboter lernen laufen

AlphaGo, AlphaStar

Agent

Beobachtet

Zustand

Umgebung

Policy

AktionBelohnung1

23

30

Aktives Lernen

Keine / wenige gelabelte Datenpunkte vorhanden

Labeln von Datenpunkten ist aufwändig

Supervisor vorhanden (Orakel)

Algorithmus wählt zu lernende Datenpunkte aus

Fragt Supervisor interaktiv bzgl. korrektem Label

Benötigt weniger Datenpunkte zum Lernen

Verschiedene Befragungsstrategien

31

Arten des Machine Learnings

Klassifikation nach der Fähigkeit, inkrementell aus einem kontinuierlichen

Datenstrom dazuzulernen

Batch-Lernen (Batch-Learning)

Online-Lernen (Online-Learning)

32

Batch-Lernen

Kein inkrementelles Lernen möglich

System wird immer mit dem vollständigen Trainingsdatensatz trainiert

Hoher Verbrauch an Ressourcen

Rechenkapazitäten für das Training

Speicherplatz für den gesamten Datensatz

Keine schnelle Anpassung an neue Daten möglich

Offline-Learning

Training erfolgt immer außerhalb des Produktivsystems

Im Produktivsystem nur Anwendung des Erlernten

33

Online-Learning

Inkrementelles Lernen möglich

Einzelne Datenpunkte

Pakete aus wenigen Datenpunkten (Mini-Batches)

Schnelle Anpassung an neue Daten möglich

Insgesamt geringerer Verbrauch an Ressourcen

Geringere Rechenkapazitäten benötigt

Einmal gelernte Datenpunkte können nach dem Training verworfen

werden

Problem

Beobachtung nötig, um Lernen auf Basis minderwertiger Datenpunkte

zu verhindern

Eingabedatenpunkte automatisiert tracken, z. B. mittels eines

Anomalieerkennung

34

Arten des Machine Learnings

Klassifikation nach Art der Verallgemeinerung

Instanzbasiertes Lernen

Modellbasiertes Lernen

35

Instanzbasiertes Lernen

Auswendiglernen der

Datenpunkte

Verallgemeinerung durch

Anwendung eines

Ähnlichkeitsmaßes

Feature 1

Feature 2

Neuer Datenpunkt

36

Modellbasiertes Lernen

Auf Basis der

Datenpunkte wird ein

konkretes Modell erstellt

(Lernphase)

Modellierung z. B. mittels

Gerade

Polynom

Neuronales Netz

Schnelle Abfrage des

Modells möglich

(Inferenz)

Feature 1

Feature 2

Neuer Datenpunkt

37

Fazit

Extrem umfangreich

Viele Anwendungsgebiete

Viele unterschiedliche Verfahren

38

Vielen Dank!

W3L AG

info@w3l.de

2019