Die Datenschutz-Grundverordnung (DSGVO) stellt hohe Anforderungen an den Umgang mit personenbezogenen Daten, und KI-Systeme verarbeiten davon oft große Mengen. Dieser Artikel erklärt, was Sie rechtlich beachten müssen, um KI DSGVO-konform einzusetzen.
Warum KI und Datenschutz eine besondere Herausforderung sind
Das Spannungsfeld
KI und Datenschutz stehen in einem natürlichen Spannungsverhältnis:
KI braucht Daten:
- Große Mengen für Training
- Oft personenbezogene Daten
- Historische Daten für Muster
- Kontinuierliche Daten für Verbesserung
DSGVO fordert Datenminimierung:
- Nur notwendige Daten
- Zweckbindung
- Speicherbegrenzung
- Betroffenenrechte
Typische KI-Datenschutz-Risiken
| Risiko | Beschreibung | Beispiel |
|---|---|---|
| Unerlaubte Verarbeitung | Verarbeitung ohne Rechtsgrundlage | Training mit Kundendaten ohne Einwilligung |
| Zweckentfremdung | Nutzung für anderen als ursprünglichen Zweck | Marketingdaten für HR-Scoring |
| Mangelnde Transparenz | Betroffene wissen nicht von KI-Einsatz | Automatisierte Entscheidungen ohne Information |
| Profilbildung | Umfassende Profile aus verschiedenen Quellen | Zusammenführung von Online-/Offline-Daten |
| Datenlecks | Personenbezogene Daten in Modellen | Model Inversion Attacks |
DSGVO-Grundlagen für KI
Relevante Artikel im Überblick
Artikel 5 - Grundsätze:
- Rechtmäßigkeit, Verarbeitung nach Treu und Glauben, Transparenz
- Zweckbindung
- Datenminimierung
- Richtigkeit
- Speicherbegrenzung
- Integrität und Vertraulichkeit
Artikel 6 - Rechtsgrundlagen:
- Einwilligung
- Vertragserfüllung
- Rechtliche Verpflichtung
- Lebenswichtige Interessen
- Öffentliches Interesse
- Berechtigte Interessen
Artikel 13/14 - Informationspflichten:
- Information über Verarbeitung
- Zweck und Rechtsgrundlage
- Empfänger der Daten
- Speicherdauer
- Betroffenenrechte
- Bei automatisierten Entscheidungen: aussagekräftige Informationen über Logik
Artikel 22 - Automatisierte Entscheidungsfindung:
- Recht, nicht einer ausschließlich automatisierten Entscheidung unterworfen zu werden
- Ausnahmen bei Vertrag, Rechtsvorschrift, ausdrücklicher Einwilligung
- Mindestens menschliche Überprüfung, Standpunkt darlegen, Anfechtung
Artikel 35 - Datenschutz-Folgenabschätzung:
- Erforderlich bei hohem Risiko für Rechte und Freiheiten
- Insbesondere bei Profiling mit rechtlicher Wirkung
- Systematische Bewertung und Überwachung
Besondere Kategorien personenbezogener Daten
Nach Artikel 9 DSGVO gelten verschärfte Anforderungen für:
- Rassische/ethnische Herkunft
- Politische Meinungen
- Religiöse Überzeugungen
- Gewerkschaftszugehörigkeit
- Genetische Daten
- Biometrische Daten
- Gesundheitsdaten
- Sexualleben/sexuelle Orientierung
Für KI bedeutet das:
- Besondere Vorsicht bei Modellen, die diese Daten nutzen
- Strenge Rechtsgrundlagen erforderlich
- Häufig zusätzliche Schutzmaßnahmen nötig
Datenschutz im KI-Lebenszyklus
Phase 1: Datensammlung und -aufbereitung
Rechtliche Anforderungen:
- Rechtsgrundlage für Datenerhebung prüfen
- Zweckkompatibilität mit ursprünglicher Erhebung
- Informationspflichten erfüllen
- Bei Bedarf Einwilligung einholen
Praktische Maßnahmen:
- Datenquellen dokumentieren
- Rechtsgrundlagen je Datenquelle erfassen
- Privacy Impact Assessment durchführen
- Anonymisierung/Pseudonymisierung prüfen
Checkliste Datensammlung:
- Rechtsgrundlage für alle Datenquellen identifiziert
- Zweckkompatibilität geprüft
- Betroffene informiert
- Sensible Datenkategorien identifiziert
- Anonymisierung/Pseudonymisierung wo möglich
Phase 2: Training
Rechtliche Anforderungen:
- Training ist Verarbeitung im Sinne der DSGVO
- Rechtsgrundlage erforderlich
- Auch Testdaten unterliegen DSGVO
Praktische Maßnahmen:
- Separate Rechtsgrundlage für Training dokumentieren
- Anonyme/synthetische Daten wo möglich nutzen
- Zugriffsbeschränkungen für Trainingsdaten
- Löschkonzept für Trainingsdaten
Optionen für datenschutzfreundliches Training:
- Anonymisierung: Personenbezug vollständig entfernen
- Pseudonymisierung: Identifikatoren ersetzen
- Synthetische Daten: Künstlich generierte Daten mit gleicher Verteilung
- Federated Learning: Training auf dezentralen Daten
- Differential Privacy: Mathematische Garantien für Anonymität
Phase 3: Deployment und Inferenz
Rechtliche Anforderungen:
- Transparenz über KI-Einsatz
- Bei automatisierten Entscheidungen: Art. 22 beachten
- Betroffenenrechte ermöglichen
- Dokumentation der Verarbeitung
Praktische Maßnahmen:
- Nutzer über KI-Einsatz informieren
- Human-in-the-Loop bei relevanten Entscheidungen
- Widerspruchs-/Anfechtungsmechanismen
- Logging für Nachvollziehbarkeit
Phase 4: Monitoring und Wartung
Rechtliche Anforderungen:
- Datenverarbeitung für Monitoring rechtfertigen
- Re-Training mit neuen Daten: neue Prüfung
- Speicherfristen beachten
- Regelmäßige Überprüfung
Praktische Maßnahmen:
- Logging-Konzept mit Speicherfristen
- Anonymisierung von Monitoring-Daten
- Regelmäßige Datenschutz-Reviews
- Dokumentation aller Änderungen
Datenschutz-Folgenabschätzung (DSFA)
Wann ist eine DSFA erforderlich?
Nach Art. 35 DSGVO und Leitlinien der Aufsichtsbehörden ist eine DSFA insbesondere erforderlich bei:
- Scoring/Profiling mit rechtlicher oder ähnlich erheblicher Wirkung
- Systematischer Überwachung
- Verarbeitung besonderer Datenkategorien in großem Umfang
- Automatisierten Entscheidungen mit rechtlicher Wirkung
- Einsatz neuer Technologien mit hohem Risiko
Für KI bedeutet das:
Die meisten KI-Systeme, die personenbezogene Daten verarbeiten und Entscheidungen beeinflussen, erfordern eine DSFA.
Ablauf einer DSFA für KI-Systeme
1. Beschreibung der Verarbeitung:
- Zweck des KI-Systems
- Art der verarbeiteten Daten
- Beteiligte Akteure
- Datenflüsse
2. Bewertung der Notwendigkeit und Verhältnismäßigkeit:
- Ist KI erforderlich für den Zweck?
- Gibt es weniger invasive Alternativen?
- Werden nur notwendige Daten verarbeitet?
3. Risikobewertung:
- Welche Risiken bestehen für Betroffene?
- Wie wahrscheinlich sind diese Risiken?
- Wie schwerwiegend wären die Folgen?
4. Maßnahmen zur Risikominimierung:
- Technische Maßnahmen (Anonymisierung, Verschlüsselung)
- Organisatorische Maßnahmen (Zugriffskontrollen, Schulungen)
- Rechtliche Maßnahmen (Verträge, Einwilligungen)
5. Dokumentation und Überprüfung:
- Vollständige Dokumentation
- Regelmäßige Überprüfung
- Bei Änderungen: Aktualisierung
DSFA-Template für KI-Projekte
| Aspekt | Beschreibung | Risikobewertung | Maßnahmen |
|---|---|---|---|
| Datenkategorien | Welche Daten werden verarbeitet? | Hoch/Mittel/Niedrig | Liste der Maßnahmen |
| Betroffenenkreis | Wer ist betroffen? | Hoch/Mittel/Niedrig | Liste der Maßnahmen |
| Automatisierte Entscheidungen | Welche Entscheidungen trifft das System? | Hoch/Mittel/Niedrig | Liste der Maßnahmen |
| Transparenz | Wie werden Betroffene informiert? | Hoch/Mittel/Niedrig | Liste der Maßnahmen |
| Betroffenenrechte | Wie werden Rechte gewährleistet? | Hoch/Mittel/Niedrig | Liste der Maßnahmen |
| Datensicherheit | Wie werden Daten geschützt? | Hoch/Mittel/Niedrig | Liste der Maßnahmen |
Automatisierte Entscheidungen (Art. 22 DSGVO)
Was ist eine automatisierte Entscheidung?
Eine Entscheidung gilt als automatisiert, wenn sie:
- Ausschließlich auf automatisierter Verarbeitung basiert
- Rechtliche Wirkung entfaltet ODER erheblich beeinträchtigt
Beispiele:
- Automatische Kreditablehnung
- KI-gestütztes Recruiting ohne menschliche Prüfung
- Automatische Versicherungsprämienberechnung
- Algorithmische Kündigungsentscheidungen
Wann ist Art. 22 anwendbar?
Anwendbar wenn:
- Entscheidung ausschließlich automatisiert
- UND rechtliche Wirkung (z.B. Vertragsabschluss/-ablehnung)
- ODER erhebliche Beeinträchtigung (z.B. Zugang zu Dienstleistungen)
Nicht anwendbar wenn:
- Mensch trifft finale Entscheidung (echter Human-in-the-Loop)
- Nur Empfehlung/Unterstützung
- Keine erhebliche Wirkung
Ausnahmen und Anforderungen
Zulässig bei:
- Erforderlichkeit für Vertrag
- Ausdrückliche Einwilligung
- Rechtsvorschrift
Bei Ausnahmen zusätzlich erforderlich:
- Angemessene Maßnahmen zum Schutz der Betroffenen
- Mindestens: Recht auf menschliches Eingreifen
- Recht, Standpunkt darzulegen
- Recht auf Anfechtung
Praktische Umsetzung
Option 1: Human-in-the-Loop
- Mensch prüft jede Entscheidung
- Echte Entscheidungskompetenz (nicht nur Bestätigung)
- Dokumentation der menschlichen Prüfung
Option 2: Einwilligung
- Ausdrückliche, informierte Einwilligung
- Hinweis auf Konsequenzen
- Jederzeit widerrufbar
- Alternative anbieten
Option 3: Schutzmaßnahmen
- Informationen über Logik des Systems
- Möglichkeit zur Anfechtung
- Schnelle menschliche Überprüfung auf Anfrage
- Regelmäßige Audits
Betroffenenrechte bei KI
Recht auf Information (Art. 13/14)
Bei KI-Systemen informieren über:
- Dass KI eingesetzt wird
- Zu welchem Zweck
- Welche Logik zugrunde liegt
- Welche Konsequenzen zu erwarten sind
- Wer verantwortlich ist
Beispiel Informationstext:
"Wir nutzen ein KI-gestütztes System zur Vorauswahl von Bewerbungen. Das System analysiert Ihren Lebenslauf auf Übereinstimmung mit den Stellenanforderungen. Faktoren wie Berufserfahrung, Qualifikationen und Fähigkeiten werden berücksichtigt. Alle vom System vorgeschlagenen Kandidaten werden zusätzlich von unseren HR-Mitarbeitern geprüft, bevor eine Entscheidung getroffen wird."
Recht auf Auskunft (Art. 15)
Bei KI-Systemen:
- Welche Daten verarbeitet werden
- Wie die Daten genutzt werden
- Welche Entscheidungen beeinflusst wurden
- Aussagekräftige Informationen über die Logik
Recht auf Berichtigung (Art. 16)
Bei KI-Systemen:
- Korrektur falscher Eingabedaten
- Auswirkungen auf bisherige Entscheidungen prüfen
- Bei Bedarf Neuberechnung
Recht auf Löschung (Art. 17)
Besondere Herausforderung bei KI:
- Daten in Trainingsdaten
- Einfluss auf Modell-Parameter
- Praktische Umsetzung oft schwierig
Lösungsansätze:
- Pseudonymisierung statt Klartext-Training
- Machine Unlearning-Techniken
- Neutraining ohne betroffene Daten
Recht auf Widerspruch (Art. 21)
Bei KI-Systemen:
- Widerspruch gegen Profiling
- Alternativen anbieten (manuelle Bearbeitung)
- Schnelle Umsetzung
Best Practices für datenschutzkonforme KI
Datenschutz by Design
Von Anfang an berücksichtigen:
- Minimale Datenerhebung planen
- Anonymisierung/Pseudonymisierung einbauen
- Zugriffsbeschränkungen umsetzen
- Löschkonzepte entwickeln
- Transparenz-Features einbauen
Datensparsamkeit bei KI
Maßnahmen:
- Nur notwendige Features nutzen
- Aggregierte statt Einzeldaten wo möglich
- Zeitliche Begrenzung der Datennutzung
- Regelmäßige Relevanzprüfung
Privacy-Preserving Machine Learning
Techniken:
- Differential Privacy: Rauschen hinzufügen, um Rückschlüsse zu verhindern
- Federated Learning: Training auf dezentralen Daten
- Homomorphe Verschlüsselung: Berechnungen auf verschlüsselten Daten
- Secure Multi-Party Computation: Verteilte Berechnungen
Dokumentation und Nachweisbarkeit
Dokumentieren:
- Rechtsgrundlagen für alle Datenverarbeitungen
- DSFAs für alle relevanten Systeme
- Technische und organisatorische Maßnahmen
- Entscheidungen und deren Begründungen
- Änderungen am System
Auf den Punkt gebracht
DSGVO-konforme KI ist machbar. Erfordert aber sorgfältige Planung und kontinuierliche Aufmerksamkeit:
Grundprinzipien:
- Rechtsgrundlage vor jeder Verarbeitung prüfen
- Datensparsamkeit bei Entwicklung und Betrieb
- Transparenz gegenüber Betroffenen
- Betroffenenrechte aktiv ermöglichen
- Dokumentation aller Maßnahmen
Kritische Punkte:
- Automatisierte Entscheidungen besonders sorgfältig prüfen
- DSFA für die meisten KI-Systeme erforderlich
- Besondere Kategorien personenbezogener Daten meiden oder besonders schützen
- Human-in-the-Loop bei kritischen Entscheidungen
Der Datenschutzbeauftragte sollte von Anfang an in KI-Projekte eingebunden werden. In Zusammenarbeit mit dem CAIO lassen sich datenschutzkonforme Lösungen finden, die sowohl rechtlichen Anforderungen als auch Geschäftszielen gerecht werden.
