+ All Categories
Home > Documents > Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU...

Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU...

Date post: 26-Oct-2019
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
14
1 Programm 10. Oktober 2017 Uhrzeit Referent Vortragstitel Firma 13:00 - 14:00 - Registrierung Organisationsteam 14:00 - 14:05 Marcus Hudec Begrüßung Organisationsteam 14:05 - 14:50 Matt Harris & Alex McMullan Using data to make the world’s fastest cars faster: the inside track with Mercedes- AMG Petronas Motorsport Mercedes-AMG Petronas Formula One™ Team & Pure Storage 14:50 - 15:25 Ingo Nader Identifizierung von Shop- Besuchen mit Hilfe von Mobilfunkdaten oder "Fügen Sie diesem Ort ein Foto hinzu" The unbelievable Machine Company GmbH (*um) 15:25 - 16:00 Oliver Linder Data Strategy: Wie unterstützen Analysen Ihre Entscheidungsfindung? Tableau Software 16:00 - 16:30 - Kaffeepause 16:30 - 17:10 Tamas Madl Preventing heart attacks with smartphones: biological neuron- based deep learning for cardiovascular disease screening HeartShield 17:10 - 17:45 Sebastian Dennerlein & Florian Geigl The Role of Recommendations in Predictive Analytics Know-Center GmbH & Detego GmbH 17:45 - 18:20 Hermann Madlberger & Mihai Paunescu Predictive Analytics – "Die Spreu vom Weizen trennen", Anwendungsfälle in der Steuerprüfung Bundesministerium für Finanzen 18:30 - open end Abend- veranstaltung Cocktailempfang, Grußworte des Veranstalters, Konferenzdinner (Sky Stage im Tech Gate Vienna)
Transcript
Page 1: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

1

Programm

10. Oktober 2017

Uhrzeit Referent Vortragstitel Firma

13:00 - 14:00 - Registrierung Organisationsteam

14:00 - 14:05 Marcus Hudec Begrüßung Organisationsteam

14:05 - 14:50 Matt Harris &

Alex McMullan

Using data to make the world’s fastest cars faster: the inside track with Mercedes-AMG Petronas Motorsport

Mercedes-AMG Petronas Formula One™ Team & Pure Storage

14:50 - 15:25 Ingo Nader

Identifizierung von Shop-Besuchen mit Hilfe von Mobilfunkdaten oder "Fügen Sie diesem Ort ein Foto hinzu"

The unbelievable Machine Company GmbH (*um)

15:25 - 16:00 Oliver Linder Data Strategy: Wie unterstützen Analysen Ihre Entscheidungsfindung?

Tableau Software

16:00 - 16:30 - Kaffeepause

16:30 - 17:10 Tamas Madl

Preventing heart attacks with smartphones: biological neuron-based deep learning for cardiovascular disease screening

HeartShield

17:10 - 17:45 Sebastian Dennerlein & Florian Geigl

The Role of Recommendations in Predictive Analytics

Know-Center GmbH & Detego GmbH

17:45 - 18:20 Hermann Madlberger & Mihai Paunescu

Predictive Analytics – "Die Spreu vom Weizen trennen", Anwendungsfälle in der Steuerprüfung

Bundesministerium für Finanzen

18:30 - open end Abend- veranstaltung

Cocktailempfang, Grußworte des Veranstalters, Konferenzdinner (Sky Stage im Tech Gate Vienna)

Page 2: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

2

11. Oktober 2017

Uhrzeit Referent Vortragstitel Firma

09:00 - 09:45 Bertram Barth

Der User und der Mensch. Der Mehrwert der (Digitalen) Sinus-Milieus gegenüber reinen Beobachtungsdaten.

INTEGRAL Markt- und Meinungs-forschungsges.m.b.H.

09:45 - 10:20 Marco Schneider Mit Datenanalyse zu mehr Effektivität und Effizienz in der Entwicklung

BMW Group

10:20 - 10:45 - Kaffeepause

10:45 - 11:20 Marcus Kottinger

Watson und Predictive Analytics – wie Operating Technology ein Partner von Information Technology im Rahmen der Industrie 4.0 wird

IBM

11:20 - 11:55 Walter Müllner Analysis and Prediction of Product Quality in a Production Process Based on Sensor Data

SAP Österreich

11:55 - 12:30 Lisa Neuhofer & Barbara Hachmöller

Data Science – Neues aus dem Labor / Erfahrungsberichte eines Advanced Analytics Teams

Bundesrechenzentrum & BMF

12:30 - 13:50 - Mittagsbuffet

13:50 - 14:25 Anton Jenzer

Wie kompatibel ist PREDICTIVE ANALYTICS mit der neuen Datenschutz-Grundverordnung (DSGVO)?

VSG Direktwerbung GmbH

14:25 - 15:00 Elmar Kiesling Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten Daten

TU Wien

15:00 - 15:30 - Kaffeepause

15:30 - 16:05 Gerhard Svolba

Data Science in Action – 10 Dinge, die Advanced Analytics und Data Science für Ihr Unternehmen tun kann

SAS

16:05 - 16:45 Marcus Hudec & Clemens Sauerzopf

Revolutioniert Artificial Intelligence die Welt der Analytik?

Data Technology

16:45 - 17:00 Marcus Hudec Summary und Verabschiedung Data Technology

Page 3: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

3

11. Oktober 2017 – Breakout Sessions

Breakout-Session

Parallel im Saal Multimedia Stage City

10:45 - 11:20

Peter Scholze „Industrial Scale Text Mining“ mit eventgetriebenen Microservices

scholze IT

11:20 - 11:55

Andreas Hackl Aufschwung oder Rezession? Methoden zur Identifikation und Analyse von Trends und Zyklen bei Zeitreihen im finanzwirtschaftlichen Umfeld.

Erste Asset Management GmbH

11:55 - 12:30

Christian Pfeiffer & Gernot Steindl

Modellvergleich zur Prognose synthetischer Fernwärmenetzprofile

Forschung Burgenland GmbH

13:50 - 15:00

Walter Müllner Workshop: Analyse der Einflussfaktoren und Vorhersage von Qualitätsproblemen in einem industriellen Produktionsprozess

SAP Österreich

Page 4: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

4

Die Referentinnen und Referenten und deren Abstracts zu den Vorträgen

Bertram Barth (INTEGRAL Markt- und Meinungsforschungsges.m.b.H.)

Der User und der Mensch. Der Mehrwert der (Digitalen) Sinus-Milieus gegenüber reinen Beobachtungsdaten

Die Datenfülle im Internet eröffnet neue Möglichkeiten der Analyse des Konsumentenverhaltens. In diesem Vortrag soll gezeigt werden, dass eine ausschließlich verhaltensorientierte Erfassung des Menschen aber zu kurz greift. Die Sinus-Milieus basieren auf grundlegenden Wertorientierungen und lebensweltlichen Perspektiven der Menschen und erlauben dadurch auch situationsübergreifende Verhaltensprognosen. Seit über dreißig Jahren weltweit angewandt, gibt es seit vier Jahren auch die Digitalen Sinus-Milieus, welche eine Schätzung der Milieuzugehörigkeit von Internetverwendern aufgrund ihres Surf-Verhaltens darstellen. Dadurch lassen sich ansonsten isolierte Verhaltensbeobachtungen in einen ganzheitlichen Kontext einordnen und verstehen.

Sebastian Dennerlein (Know-Center GmbH) & Florian Geigl (Detego GmbH)

The Role of Recommendations in Predictive Analytics

Clustering or finding a natural grouping in data has many applications in biomedicine, ranging from image segmentation to patient stratification. Despite the maturity of clustering research, existing methods tend to be difficult to parameterize and often lack in interpretability. To overcome these problems, we develop information-theoretic clustering methods. Considering clustering as a data compression problem, we can e.g. automatically discover the number of clusters in data or jointly cluster data represented by numerical and categorical attributes.

Page 5: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

5

Andreas Hackl (Erste Asset Management GmbH)

Aufschwung oder Rezession? Methoden zur Identifikation und Analyse von Trends und Zyklen bei Zeitreihen im finanzwirtschaftlichen Umfeld

Die Analyse von Zeitreihen diverser volks- und finanzwirtschaftlicher Indikatoren zählt zu den maßgeblichen Aufgaben von Analysten und Managern im Investment-Umfeld. Bedeutend ist hierbei die Identifikation von Trends und Zyklen, um aktuelle Entwicklungen im Marktumfeld passend deuten zu können. Sogenannte Filter-Methoden bieten die Möglichkeit, Zeitreihen in ihre Komponenten zu zergliedern, wodurch auch die zyklische Komponente zu jedem Zeitpunkt identifiziert werden kann.

Basierend auf einer Projektarbeit werden in diesem Vortrag einige häufig eingesetzte Methoden zusammen mit neueren Ansätzen vorgestellt und deren Anwendung auf eine Reihe von Indikatoren, die für Fondsmanager eine tägliche Relevanz besitzen, illustriert.

Matt Harris (Mercedes-AMG Petronas Formula One™ Team) & Alex McMullen (Pure Storage)

A look at how the Mercedes-AMG Petronas F1 team stores and uses data to compete effectively in the hi-tech world of F1 racing, not just data gathered from the car during races, but also a range of computer simulation methods. Back at the factory in England a team of data scientists and engineers use HPC methods to make the cars not just faster but also safer for the drivers. The combination of live car telemetry data to the drivers, race engineers and strategists alongside the evolving design of the car at the factory helps the team to remain competitive in a sport where speed, efficiency and quality are the key design aims.

Page 6: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

6

Marcus Hudec & Clemens Sauerzopf (Data Technology)

Ausgehend von aktuellen Beispielen aus den Medien werden Hintergründe rund um den aktuellen Hype zum Thema Künstliche Intelligenz beleuchtet und Entwicklungen im Technologiefeld der künstlichen Intelligenz (KI) dargestellt. Dabei versuchen wir ein realistisches Bild zu zeichnen, was heute unter KI verstanden wird, wie sie funktioniert und was diese Systeme heute wirklich leisten können.

Mächtige Werkzeuge bieten viele Möglichkeiten, aber auch viele Fallstricke, die sich in der praktischen Anwendung ergeben. Anhand der Frage: "Ist künstliche Intelligenz wirklich intelligent?", wird gezeigt, wo momentan die Grenzen der künstlichen Intelligenz liegen.

Abschließend diskutieren wir, wie sich KI auf die Arbeit in der analytischen Praxis auswirkt.

Anton Jenzer (VSG Direktwerbung GmbH)

Wie kompatibel ist PREDICTIVE ANALYTICS mit der neuen Datenschutz-Grundverordnung (DSGVO)?

Mit der ab Mai 2018 geltenden DSGVO wird der Datenschutz EU-weit harmonisiert. Sie stärkt das Recht von Bürgerinnen und Bürger auf ihre Privatsphäre und beim missbräuchlichen und unsachgemäßen Umgang mit personenbezogenen Daten drohen hohe Strafen. Sie schafft damit neue Rahmenbedingungen für alle Anwendungsfelder, in denen personenbezogene Daten erhoben, ausgewertet und angewendet werden, so auch für den Bereich PREDICTIVE ANALTICS.

Page 7: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

7

Elmar Kiesling (TU Wien)

Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten Daten

Im Rahmen einer breiten Open Data Bewegung publizieren mehr und mehr Institutionen umfangreiche Daten aus unterschiedlichen Themenbereichen zur freien öffentlichen Nutzung. Diese Daten sind allerdings in der Regel sehr inhomogen hinsichtlich Struktur, Syntax, und Semantik und werden über eine Vielzahl unterschiedlicher Mechanismen bereitgestellt. Dies erschwert es, relevante Daten aufzufinden, mit ihnen zu interagieren, und sie zu verschneiden und zu analysieren.

Linked Data Technologien ermöglichen es, weltweit dezentral gehaltene, heterogene Daten miteinander zu vernetzen, mit einer eindeutigen Bedeutung zu versehen, und damit maschinenlesbar zu machen. In der auf diesen Prinzipien beruhenden Linked Data Cloud stehen heute unter anderem eine Fülle von statistischen Daten zur Verfügung. Die Auffindung und Nutzung dieser Daten, sowie die Integration mit eigenen Daten, stellt Anwender allerdings immer noch vor große Herausforderungen.

Dieser Vortrag führt in die Grundlagen von Linked Data ein, illustriert die Vision und Kernkonzepte anhand von Beispielen, und stellt aktuelle Forschungsprojekte vor, die es zum Ziel haben, Endanwendern die einfache Interaktion mit Linked Data zu ermöglichen.

Marcus Kottinger (IBM)

Watson und Predictive Analytics – wie Operating Technology ein Partner von Information Technology im Rahmen der Industrie 4.0 wird

Die Digitalisierung der Gesellschaft zeichnet sich nicht nur durch den Einsatz des Smart Phones aus. Mit den unterschiedlichsten Industrie 4.0 Initiativen, vor allem in einigen Europäischen Ländern, kommt es auch zu ersten Änderungen bei den Abläufen und Prozessen in der Fertigungsindustrie. Wie weit wird uns Kollege Watson mit seinen analytischen und kognitiven Fähigkeiten hier den Alltag erleichtern? IBM und seine Partner arbeiten an einer digitalen Zukunft in der Industrie, um die sich rasch ändernden Kundenwünsche mit einer effizienten Fertigung zu vereinen.

Page 8: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

8

Oliver Linder (Tableau Software)

Data Strategy: Wie unterstützen Analysen Ihre Entscheidungsfindung?

Nicht nur die Fertigungskosten lassen sich mit Predictive Maintenance senken. Auch im Dienstleistungsbereich entsteht durch Vorhersagen enormes Optimierungspotential. Unternehmen transformieren die Art und Weise, wie sie ihre Analyse angehen in vielen verschiedenen Aspekten. Dieser Wandel ist jedoch weder branchenübergreifend, noch von Unternehmen zu Unternehmen innerhalb einer Branche konsistent. Ein Schlüssel zum Erfolg, bei dem die IT eine entscheidende Rolle spielen kann, ist es, den Faktor Kundenwissen möglichst gewinnbringend in die eigene Unternehmensstruktur zu integrieren.

Tamas Madl (HeartShield)

Preventing heart attacks with smartphones: biological neuron-based deep learning for cardiovascular disease screening

Every third person dies of heart disease, which would be preventable with timely risk reduction. Screening can literally save lives, and yet, most people dislike waiting rooms and syringes, leading to millions of people with untreated risk factors. But what if you had a heart health check-up in your pocket? We have developed a novel deep learning approach inspired by biological models of the cardiac pacemaker, combining spiking neuron layers with deep neural networks in an end-to-end trainable architecture, and show that it is applicable for heart disease risk recognition on any smartphone, outperforming state of the art screening scores.

Page 9: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

9

Hermann Madlberger & Mihai Paunescu (Bundesministerium für Finanzen)

Predictive Analytics – 'Die Spreu vom Weizen trennen' Anwendungsfälle in der Steuerprüfung

Seit drei Jahren setzt das BMF Predictive Analytics ein. Dieser Vortrag stellt die Entwicklung und zwei beispielhafte Anwendungsfälle zur Betrugserkennung vor.

Im ersten Anwendungsfall aus dem Bereich Umsatzsteuerbetrug werden verschiedene Datenquellen mit unterschiedlichen Perspektiven für den gleichen Sachverhalt (z.B. Betrag berichtet vom Käufer und berichtet vom Verkäufer) verwendet um inkonsistentes Verhalten aufzudecken. Die Herausforderung ist zwischen Inkonsistenzen aufgrund von Datenqualitätsproblemen und solchen durch Betrug zu unterscheiden.

Der zweite Anwendungsfall ist aus dem Bereich Lohnabgabenprüfung: Unter Berücksichtigung individueller Unternehmenskennzahlen können Inkonsistenzen in der Lohnsumme auf Basis einer Quantilsregression identifiziert werden.

Walter Müllner (SAP Österreich)

Analysis and Prediction of Product Quality in a Production Process Based on Sensor Data

An industry customer is facing a high percentage (above 20%) of defect parts on one of the production lines. By analyzing sensor data collected during the process he wants to find specific situations which lead to defect parts. The production line consists of several separated sections in each of which the material is machined. Sensors are measuring physical states like temperature, pressure, flows, voltages, etc. These sensor values are recorded and should be analyzed if they can be used as meaningful indicators of the final part quality. The quality of the parts is measured by two ‘quality detectors’ at the end of the process. They measure different aspects of the product quality. A part is considered ‘defect’ if at least one of the quality sensors signals a ‘defect’. The production line sensors data are collected on regular time intervals which may be different for some of the sensors. The manufactured parts move through the production line segments in a sequential manner at the end of which the quality inspection occurs together with a timestamp recording the time of inspection and the end time of the manufacturing process.

Page 10: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

10

Walter Müllner (SAP Österreich) - Workshop

Analyse der Einflussfaktoren und Vorhersage von Qualitätsproblemen in einem industriellen Produktionsprozess

Im Rahmen des Workshops wird der auf der Konferenz präsentierte Kunden-Case (Analysis and Prediction of Product Quality in a Production Process Based on Sensor Data) im Detail Schritt für Schritt durchgegangen. Dabei zeigen wir im Detail sowohl die Datenaufbereitung, die Modellbildung (Modelle für Klassifikation und Zeitreihen-Fragestellungen) mittels der Software „SAP Predictive Analytics“ als auch die Interpretation der Ergebnisse.

Die Teilnehmer benötigen keinerlei spezielle Vorkenntnisse.

Ingo Nader (The unbelievable Machine Company GmbH (*um))

Identifizierung von Shop-Besuchen mit Hilfe von Mobilfunkdaten oder "Fügen Sie diesem Ort ein Foto hinzu"

Verwendung von Bewegungsdaten um Shop-Besuche zu identifizieren sind für Google und Apple durch den Einsatz von GPS und WLAN-Ortung heute keine Herausforderung mehr. Telco-Provider haben hier weniger gute Voraussetzungen: Einerseits unterliegen sie deutlich strengeren Datenschutzbedingungen (besonders in Hinblick auf EU-Datenschutzverordnung), andererseits sind die zur Verfügung stehenden Daten deutlich weniger reliabel. Im Rahmen dieses Vortrages wird ein Use Case vorgestellt, der beide Aspekte näher beleuchten sollte.

Page 11: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

11

Lisa Neuhofer & Barbara Hachmöller (Bundesrechenzentrum & BMF)

Data Science– Neues aus dem Labor / Erfahrungsberichte eines Advanced Analytics Teams

Gibt es ein Rezept, dass sich die Mitglieder eines Advanced Analytics Teams gut ergänzen, kollaborieren, eine gemeinsame Sprache finden, effizient handeln und gemeinsam Ziele erreichen?

Idealerweise werden Thesen, Methodik, Analysewerkzeuge, Datenbanken, Kollaborationstools, Unternehmensrichtlinien, große Mengen an Daten, ein Organisationsmodell und eine Portion Struktur bereitgestellt. Gefordert werden Analysen, Qualität, Wissenssicherung, Dokumentation und eine agile Vorgehensweise in einem strukturierten Analyseprozess.

Dieser Vortag gibt einen Einblick wie sich der Arbeitsalltag eines Data Scientisten hinsichtlich dieser Aspekte gestaltet. Was passiert, wenn eine Zutat fehlt? Wie wirkt sich die Anzahl der Köche auf das Ergebnis aus und wie verarbeitet man ungeplante Richtungsänderungen. Am Ende des Tages stellt sich das Team die Frage, wohin führt die kulinarische Reise? Ein Erfahrungsbericht eines Advanced Analytics Team.

Christian Pfeiffer & Gernot Steindl (Forschung Burgenland GmbH)

Modellvergleich zur Prognose synthetischer Fernwärmenetzprofile

Um die Nutzung erneuerbarer Energieträger zu verbessern, könnten bestehende Wärmenetze als thermische Speicher dienen. Dahingehend werden für die Entwicklung intelligenter Regelstrategien Prognosen über die Wärmeabnahme im Wärmenetz benötigt. Vorgestellt wird die methodische Vorgehensweise beginnend mit der Sammlung und Aufbereitung von Wetterdaten über die Modellierung der statistischen Prognoseverfahren (Quadratische Regression, Support Vektor Maschinen, Random Forests, k-Nearest Neighbor Regression, Neuronale Netzwerke) samt vergleichender Darstellung der Ergebnisse.

Page 12: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

12

Marco Schneider (BMW Group)

Mit Datenanalyse zu mehr Effektivität und Effizienz in der Entwicklung

Der Bereich Forschung und Entwicklung ist wie kein anderer von einem professionellen Umgang mit Daten abhängig. Eigentlich besteht R&D Arbeit ausschließlich aus der Aufnahme und Weiterverarbeitung von Daten. Dabei wird das Ziel verfolgt, im Vergleich zum Wettbewerb, einen besseren und schnelleren Erkenntnisgewinn zu schaffen. Die Verarbeitung von Informationen ist heute, wenn auch vollständig digital, in den meisten Fällen eine manuelle Tätigkeit. Die Möglichkeiten diese Tätigkeit effizienter oder schneller zu machen sind weitestgehend erschöpft.

Was wäre also, wenn es uns gelänge in diesem Umfeld eine Technologie zu integrieren, mit der wir gigantische Geschwindigkeitssteigerungen erreichen und so Innovationen schneller in den Markt bringen können?

Der Vortrag von Marco Schneider (Betriebsleiter Akustik Prüfstände) gibt einen Einblick in die laufenden Aktivitäten zur Integration von Analytics in die Fahrzeugentwicklung am Beispiel Akustik-Gesamtfahrzeugprüfstände. die Frage, wohin führt die kulinarische Reise? Ein Erfahrungsbericht eines Advanced Analytics Team.

Page 13: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

13

Peter Scholze (scholze IT Gesellschaft für Informationstechnologie mbH)

„Industrial Scale Text Mining“ mit Event-getriebenen Microservices

Mehr als 80 Prozent aller Daten liegen in unstrukturierter Form, nämlich als Textdokumente vor. Für das menschliche Gehirn ist es recht einfach, Texte zu verstehen. Für deren automatische Analyse bedarf es hingegen des Einsatzes komplexer computerlinguistischer und statistischer Methoden. Dieser weitgehend automatisierte Prozess zur Informationsextraktion und Wissensgenerierung aus Textdokumenten ist unter dem Begriff des „Text Mining“ bekannt.

Einsatzpotenziale des Text Mining liegen z.B. in der Competitive Intelligence oder in der semantischen Suche.

Während das eigentliche Text Mining, nicht zuletzt unter Verwendung von Methoden des Maschinellen Lernens und der Künstlichen Intelligenz, qualitativ bereits einen hohen Stand erreicht hat, schickt es sich nunmehr an, das Labor zu verlassen und gewissermaßen in die „großtechnische“ Anwendung zu gehen: Hier kommen u.a. Prozessschritte wie Datenübernahme, -validierung und -aufbereitung ins Spiel, aber auch Fragen der Orchestrierung, Skalierbarkeit und Verfügbarkeit.

Weil für diese Problemstellungen bereits Lösungsansätze aus dem klassischen Big Data-Umfeld existieren, wird vielfach der Versuch unternommen, Tools wie Hadoop, Spark oder Storm „fit“ zu machen für den Umgang mit unstrukturierten Daten.

Würden Sie aber einen Hammer umbauen, um damit Schrauben eindrehen zu können?

Der Vortrag will anhand einer SaaS-Plattform für die Textanalyse einen Architekturansatz der eigenen Art aufzeigen, der auf Event-getriebenen Microservices basiert und mit Spring Cloud umgesetzt wurde. Dabei folgen die fachlichen Verarbeitungskomponenten dem OASIS-Standard „Unstructured Information Management Architecture“ (UIMA).

Page 14: Programm 10. Oktober 2017 - predictive-analytics.at6613A0FB-9C1B-4C57-82CF... · Elmar Kiesling (TU Wien) Linked Data Analytics: Vernetzung, Exploration und Integration von verteilten

14

Gerhard Svolba (SAS)

Data Science in Action – 10 Dinge, die Advanced Analytics und Data Science für Ihr Unternehmen tun kann

Wird der Vertriebsleiter seinen Job behalten, wenn wir einen Blick auf seine Projekt-Pipeline werfen? Können unsere Daten zu uns „sprechen“ auch wenn wir nicht alle Fragen explizit stellen? Können wir Ausreißer und Bruchpunkte in unseren Zeitreihendaten automatisch erkennen, um betrügerisches Verhalten aufzudecken? Können wir mit fehlenden Endpunkten von Zeitdauern umgehen und vorhersagen, welche Mitarbeiter noch wie lange bei uns im Unternehmen sein werden? Diese und anderen Fragen werden im Vortrag beantwortet. Dabei wird gezeigt, wie Data Science Methoden verwendet werden können, um die großen Datenmengen, die Organisationen über ihre Mitarbeiter und Prozesse sammeln, in Erkenntnisse umzuwandeln. Die Beispiele sind dem Buch „Applying Data Science: Business Case Studies Using SAS” entnommen. Im Vortrag werden analytische Verfahren wie die Kaplan-Meier Methode, Monte Carlo Simulationen, Unsupervised Machine Learning, multivariate Adaptive Regression Splines und ARMA Modelle angewandt und illustriert.


Recommended