Dieses Dokument befindet sich in aktiver Entwicklung und ist noch nicht finalisiert.
Skip to content

Daten & Data Governance – Art. 10

Anforderung

Trainings-, Validierungs- und Testdatensätze für Hochrisiko-KI-Systeme unterliegen spezifischen Anforderungen an Data Governance.

Datenanforderungen

Datensätze müssen:

  • Relevant sein für den bestimmungsgemäßen Zweck
  • Hinreichend repräsentativ sein, insbesondere für betroffene Personengruppen
  • Soweit möglich fehlerfrei und vollständig sein
  • Geeignete statistische Eigenschaften aufweisen (auch bezüglich geografischer, verhaltensbezogener und funktionaler Aspekte)

Data Governance Maßnahmen

Provider müssen dokumentieren:

  • Datenherkunft und Erhebungsmethoden
  • Datenaufbereitungsprozesse (Labeling, Bereinigung, Anreicherung)
  • Bias-Bewertung und ergriffene Gegenmaßnahmen
  • Maßnahmen zur Erkennung und Behebung von Datenlücken und -mängeln
  • Datenschutzrechtliche Grundlage (DSGVO-Konformität)

BAUER GROUP Umsetzung

SzenarioAnsatz
BAUER GROUP trainiert eigene ModelleVollständige Data-Governance-Dokumentation erforderlich
BAUER GROUP nutzt Dritt-Modelle (API)Dokumentation der Nutzungsbedingungen des Anbieters, Input/Output-Monitoring
BAUER GROUP finetuned Dritt-ModelleData Governance für Finetuning-Datensatz erforderlich

Unverhältnismäßiger Aufwand

Wenn die Data-Governance-Anforderungen (insb. für Trainingsdaten-Dokumentation, Bias-Analyse, Repräsentativitätsnachweis) den Produktwert übersteigen → No-Go EU, Vertrieb nur in Drittmärkten.

Dokumentation lizenziert unter CC BY-NC 4.0 · Code lizenziert unter MIT