© CGI Group Inc.
Big Data und Datenschutz?!
DOAG Big Data Days 2015 Michael Klose 18. September 2015
Referent: Michael Klose Manager BI Architektur & Strategie, CGI Deutschland Ltd. & Co. KG Vorstand DOAG BI Community
Schwerpunkte
Ø Konzeption, Implementierung von Prozessen, Datenschutz und komplexer BI & DWH Architekturen
Ø Oracle DB, OWB, ODI, OBI, Informatica Powercenter
Ø Certified Data Vault 2.0 Practitioner Ø Oracle DWH Certified Implementation Specialist
Ø Oracle Data Integrator 11g Certified Implementation Essentials
Ø Oracle Business Intelligence Foundation Suite 11g Essentials
2
Ihr Partner weltweit: Das Unternehmen CGI
größter unabhängiger Anbieter von IT- & Geschäftsprozess-
Dienstleistungen
Service für über
10.000 Kunden von weltweit über
400 Standorten
68.000 Mitarbeiter;
75% besitzen Firmenanteile
3
7 Mrd. Euro
Jahresumsatz
38 Jahre erfolgreiche
Partnerschaft mit unseren Kunden
Über 100 führende
IP-basierte Lösungen
Erstklassige Business- und IT-Beratung
Fokussiertes Branchen- und
Themen-
Know-how
Kundennähe in Kombination mit unserem globalen Delivery-Netzwerk
5. Weltweit
Alternative Unternehmensfolie: Eine davon löschen ebenso wie diesen Kasten!
Bestwerte für Erfolg: Unsere Qualität in Zahlen
95% der Projekte
in Zeit und Budget
Wir versprechen eine hohe Qualität
unserer Arbeit und ihrer Ergebnisse – und liefern sie.
9.1/10 gemessener
Kundenzufriedenheitswert
9.4/10 unserer Kunden
empfehlen uns gerne weiter
Unsere Account Executives sind direkt verantwortlich für die Zufriedenheit ihrer
Kunden.
Für unsere Mitarbeiter steht der Erfolg ihrer
Kunden an erster Stelle.
4
Überall und zu jeder Zeit: Unser globales Delivery-Modell
Philippines India
Malaysia
Estonia
Poland Hungary
Czech Republic Slovakia
Spain Portugal Morocco
Egypt
Canada
United States
Über 30 Global Delivery Center auf vier Kontinenten
Individuelle Liefermöglichkeit: onshore,
nearshore, offshore
Deutsches Global Delivery Center in Bremen und Erfurt
5
Bremen
Erfurt
Hamburg
Bremen
Düsseldorf
Leinfelden- Echterdingen
München
Karlsruhe
Darmstadt
Hennef
Frankfurt/ Sulzbach
Mannheim
Hannover Berlin
Erfurt
Ganz nah und weltweit geschätzt: Unsere Kompetenz vor Ort
6
Führend in Deutschland* § Business Innovation/Transformation Partner
(Lünendonk, 2013)
§ Anbieter für Application Management (PAC, 2013)
§ IT-Dienstleister im Telekommunkationssektor (PAC, 2013)
Global gelistet* § Magic Quadrant for Data Center Outsourcing
& Infrastructure Utility (Gartner, 2012)
§ Forrester Wave™: Enterprise Mobility Services (Forrester, 2013)
§ Führender Anbieter für Smart Grids (IDC, 2013)
Top Arbeitgeber Basel
Genf
2.300 Mitarbeiter
15 Standorte
* Auszug: CGI-Ranking 2013/2014
Public Services & Health
Outsourcing Services Business AM+ | Infrastructure OS | On Demand Services (Cloud) | Managed Test Services | Full ITO
IT Modernization Legacy Applications: Rehost | Convert | Integrate | Replace
Dynamic Workbench & Transformation
Change Management | Dynamic Workbench | Project Management as a Service
Customer Experience Collections | Customer Insight | eCommerce | User Experience | Web Experience
Financial Services
Transport, Post & Logistics
Communications Big Data Big Data Management | Data to Diamonds | Predictive Analytics
Digital Enterprise Collaboration | Customer360 for Media | Digital Transformation
Cyber Security DC Services | Governance, Risk Management & Compliance | Identity- & Access Management | Infrastructure & Technical Compliance
Ihre Themen im Blick: Unser Fokus in Deutschland
Utilities
Inhalte
8
Grundlagen und Begriffsdefinitionen 1
Löschen oder Sperren im Datawarehouse 3
Grundsätze ordnungsgemäßer Datenverarbeitung 2
Lösungsansätze 5
Auswirkungen auf das Reporting 4
Grundlagen und Begriffsdefinitionen Aufgaben und Ziele eines DWH Unter einem Datawarehouse ist die Gesamtheit von Prozessen, Anwendungen und Systemen zu verstehen, die durch verschiedene Technologien und Dienste unterstützt werden und dabei Ø Daten aus verschiedenen Anwendungssystemen übernehmen, Ø diese Daten in logischen Modellen integrieren, Ø so speichern, dass sie für den Endbenutzer zugänglich und
verständlich sind, und auf breiter Basis für Auswertungen zur Verfügung stellt.
Das DWH soll durch Informationsintegration analytische und planerische Managementaufgaben unterstützen und vor allem Entscheidungsgrundlagen liefern.
10
Grundlagen und Begriffsdefinitionen Auszug 59. Konferenz Datenschutzbeauftrage (2000) Nach dem grundrechtlichen Gebot der Zweckbindung dürfen personenbezogene Daten nur im Rahmen der gesetzlich zugelassenen Zwecke oder der gegenseitigen Vereinbarungen verwendet werden.
Eine personenbezogene Speicherung in einem allgemein verwendbaren DWH entfernt sich vom ursprünglichen Verwendungszweck und stellt eine Speicherung auf Vorrat ohne Zweckbindung dar. Eine Zweckänderung ist nur mit Einwilligung der Betroffenen zulässig, nachdem diese über die Tragweite der Einwilligung aufgeklärt worden ist. Eine Einwilligung in unbestimmte und zeitlich unbegrenzte Zweckänderungen ist deswegen unwirksam. Gestaltung und Auswahl von Datenverarbeitungssystemen haben sich an dem Ziel auszurichten, keine oder so wenig personenbezogene Daten wie möglich zu verarbeiten.
Anonyme und pseudonyme Verfahren sind datenschutzrechtlich unbedenklich. Verfahren sind so zu gestalten, dass die Betroffenen hinreichend unterrichtet werden, damit sie jederzeit die Risiken abschätzen und ihre Rechte wahrnehmen können. Sie haben insbesondere das Recht, eine erteilte Einwilligung jederzeit zurückzuziehen.
Die gesetzlichen Speicherfristen, nach deren Ablauf die Daten zwingend archiviert oder gelöscht werden müssen, sind strikt zu beachten. Deswegen ist die Einrichtung von permanenten „Daten-Lagerhäusern“ rechtswidrig.
11
Grundlagen und Begriffsdefinitionen
Anonymisierung Pseudonymisierung
Löschen Sperren
Personenbezogene Daten
12
Grundlagen und Begriffsdefinitionen Personenbezogene Daten BDSG: Einzelangaben über persönliche oder sachliche Verhältnisse einer bestimmten oder bestimmbaren natürlichen Person Das bedeutet: Ø Daten eindeutig einer bestimmten Person zuordenbar Ø Zuordnung kann zumindest mittelbar erfolgen
Besondere Arten sind Daten über: Ø Rassische und ethnische Herkunft Ø Politische Meinungen Ø Religiöse oder philosophische Überzeugungen Ø Gewerkschaftszugehörigkeit Ø Gesundheit Ø Sexualleben
Name, Familienstand, Alter, Geburtsdatum
Anschrift, Telefonnummer, E-Mail Adresse
Konto-, Kreditkartennummer Kraftfahrzeugnummer,
Kfz-Kennzeichen Personalausweisnummer,
Sozialversicherungsnummer Vorstrafen
genetische Daten und Krankendaten
Zeugnisse
Augenfarbe: Klaus Mustermann hat blaue Augen. PKW: Erika Mustermann besitzt einen VW Golf. Geburtsort: Der erste Kanzler der Bundesrepublik Deutschland war gebürtiger Kölner
Sperren
Löschen
Anonymisierung Veränderung der Daten Keine Zuordnung zu einer Person möglich Realisierung durch Hash (SHA2, MD5) Keine Rückschlüsselung möglich
Pseudonymisierung Veränderung der Daten Keine Zuordnung zu einer Person möglich Realisierung durch Verschlüsselung Rückschlüsselung möglich
13
Grundlagen und Begriffsdefinitionen
Unumkehrbare Unkenntlichmachung der personenbezogenen Daten auf ALLEN Medien (inkl. Backups) Nicht Wiederherstellbar
Kennzeichnung der Daten Verwendung zur Verarbeitung eingeschränkt Daten können entsperrt werden
14
Grundsätze ordnungsgemäßer Datenverarbeitung Wann dürfen personenbezogene Daten verarbeitet werden? Ø Freiwillige Einwilligung des Betroffenen liegt vor oder entsprechende
Rechtsvorschriften bestehen Ø Die erhobenen Daten unterliegen der Zweckbindung
ü Datenvermeidung und Datensparsamkeit ü Verhältnismäßigkeit und Erforderlichkeit
Ø Datensicherheit muss gewährleistet sein ü Zutrittskontrolle, Zugangskontrolle, Zugriffskontrolle, Weitergabekontrolle ü Eingabekontrolle, Auftragskontrolle, Verfügbarkeitskontrolle ü Trennungsprinzip
Ø Keine Vorratsdatenspeicherung
15
Löschen oder Sperren im Datawarehouse
Ø Löschen oder Sperren von Daten in bestandsführenden Systemen nach gesetzlichen oder unternehmerischen Fristen weitgehend implementiert
Wie bekommt das Datawarehouse die Löschung oder Sperrung mit? Ø Sperren bedeutet meist nur eine Attributänderung (Flag) Ø Löschen „fehlt“ der Datensatz
ü Delta Lieferungen nicht ausreichend ü Change Data Capture ü Kompletter Datenvergleich zur Erkennung gelöschter Datensätze
Ø Masterdata Management ü Zentrale Stelle für personenbezogene Daten ü Hält Lösch- und Sperrfristen vor ü Sendet Lösch- und Sperrinformationen an alle datenhaltenden Systeme
16
Auswirkungen auf das Reporting Löschen von Daten
KDNR Kunde 1000 Müller 2000 Meier 3000 Weber
Vertrag Typ 777 KFZ 888 Leben 999 Hausrat
KDNR Vertrag Abschluss Kündigung 1000 777 1.1.2002 - 1000 888 1.10.1988 - 1000 999 1.7.1995 31.12.2004
KPI: Verträge pro Kunde Reportdatum: 19.11.2014
Jahr KDNR Verträge 2003 1000 3 2004 1000 3 2005 1000 2
KPI: Verträge pro Kunde Reportdatum: 2.1.2015
Jahr KDNR Verträge 2003 1000 2 2004 1000 2 2005 1000 2
Löschung 1.1.2015
17
Lösungsansätze
Gruppierung Gruppierung von Werten, z.B. Altersbereich, PLZ, KFZ Kennzeichen
Pro ü Compliance gegeben ü Einfaches Security Konzept
bzgl. personenbezogener Daten
Kontra - Business Key/Surrogate muss
abgebildet werden - Löschen/Sperren evtl.
notwendig - Gruppierungen dürfen sich
nicht ändern - Quelldaten nicht aus DWH
wiederherstellbar
18
Lösungsansätze
Trennung Personenbezogene Daten aggregiert, nicht personenbezogene Daten detailliert gespeichert
Pro ü Kein Löschen oder Sperren
notwendig ü Einfaches Security Konzept
bzgl. personenbezogener Daten
Kontra - Aufwendige Ladeprozesse
wegen Trennung Attribute - Nachträgliche Data Marts
schwierig implementierbar - Keine Anreicherung möglich - Compliance nicht nachweisbar - Quelldaten nicht aus DWH
wiederherstellbar
19
Lösungsansätze
Reiner dispositiver Datenbestand
Keine personenbezogenen Daten Anonymisierung der Business Keys (Hash) Speicherung auf Detailebene
Pro ü Kein Löschen oder Sperren
notwendig ü Einfaches Security Konzept
bzgl. personenbezogener Daten
ü Personenbezogene Daten können Zweckgebunden z.B. aus MDM im Reporting angereichert werden
Kontra - Compliance aufwendiger
nachzuweisen - Quelldaten nicht aus DWH
wiederherstellbar - MDM o.Ä. notwendig falls
Anreicherung erwünscht - Schwieriger im Debugging
Ich freue mich auf Ihre Kommentare & Fragen!
20
Michael Klose
Manager BI Architektur & Strategie
Mobile: +49 171 977 90 99 E-Mail: [email protected]