Lizenzmodelle für die Nutzung von Lebensmitteldaten zum KI-Training
Die Frage der KI-Trainingsdaten ist tatsächlich rechtlich komplex und wirtschaftlich bedeutsam für Datenanbieter wie Sie. Ihre Bedenken sind berechtigt: Ohne entsprechende vertragliche Regelungen könnte ein Unternehmen Ihre wertvollen Daten zum Training einer KI nutzen und anschließend keine weiteren Lizenzzahlungen leisten, obwohl es wirtschaftlichen Nutzen aus dem mit Ihren Daten trainierten Modell zieht.
Rechtliche Ausgangslage
In Deutschland wurde kürzlich durch ein Urteil des Landgerichts Hamburg festgestellt, dass die Erstellung von KI-Trainingsdatensätzen grundsätzlich als Text- und Datamining zulässig sein kann, insbesondere für wissenschaftliche Zwecke
. Allerdings betrifft dies nicht automatisch kommerzielle Nutzungen. Zudem zeigen Entwicklungen wie OpenAIs Lizenzverträge mit Inhalteanbietern, dass eine Vergütung für Trainingsdaten zunehmend Standard wird.
Zehn Lizenz- und Vertragsmodelle zum Schutz Ihrer Datensammlung
1. Dauerhaftes Lizenzmodell mit KI-Aufschlag
Konzept: Statt einer zeitlich begrenzten Lizenz mit möglicher Kündigung bieten Sie eine dauerhafte Nutzungslizenz an, die das Recht zum KI-Training explizit einschließt, aber zu einem entsprechend höheren Preis.
Umsetzung:
Einmalzahlung, die deutlich höher ist als die üblichen Jahreslizenzen
Erlaubnis zur Nutzung der Daten für definierte KI-Trainingsszenarien
Klare Abgrenzung, welche KI-Anwendungen erlaubt sind
Vorteile: Sie werden für den potenziellen Wertverlust Ihrer Daten direkt entschädigt.
2. Umsatzbeteiligungsmodell
Konzept: Die Vergütung für die KI-Trainingslizenz wird an den Erfolg der daraus resultierenden KI-Anwendung gekoppelt.
Umsetzung:
Moderate Grundgebühr für das KI-Training
Prozentuale Beteiligung an den Umsätzen oder Gewinnen, die mit der trainierten KI erzielt werden
Verpflichtende Berichterstattung über Nutzung und Umsätze
Auditrechte zur Überprüfung der gemeldeten Zahlen
Vorteile: Sie partizipieren langfristig am Erfolg der Anwendung und erhalten eine faire Vergütung, falls die KI erfolgreich ist.
3. Stufenmodell mit Trainings- und Nutzungsphase
Konzept: Trennung der Lizenz in zwei Phasen mit unterschiedlichen Gebührenstrukturen.
Umsetzung:
Phase 1: Höhere Gebühr für die Trainingsphase (z.B. für 6-12 Monate)
Phase 2: Reduzierte "KI-Nutzungsgebühr" nach Abschluss des Trainings
Klare Definition, wann das Training als abgeschlossen gilt
Vorteile: Sie erhalten auch nach dem eigentlichen Training weiterhin Einnahmen, während das Startup nach dem Training weniger zahlen muss.
4. Lizenzerweiterung mit KI-Output-Beschränkungen
Konzept: Erlaubnis zum KI-Training, aber mit Beschränkungen bezüglich der Ausgabemöglichkeiten des trainierten Modells.
Umsetzung:
Festlegung von maximalen Output-Volumina (z.B. Anzahl der Anfragen)
Zusatzgebühren bei Überschreitung dieser Grenzen
Technische Implementierung zur Überwachung der Nutzung
Vorteile: Die KI kann nicht unbegrenzt Ihre Daten reproduzieren, was den Wert Ihrer Ursprungsdaten schützt.
5. White-Label-Partnerschaftsmodell
Konzept: Statt nur Daten zu lizenzieren, werden Sie Partner der KI-Anwendung.
Umsetzung:
Ko-Branding der resultierenden KI-Anwendung
Gemeinsame Vermarktung der Lösung
Geteilte Einnahmen aus der KI-Anwendung
Mitspracherecht bei Weiterentwicklungen
Vorteile: Sie sichern sich einen strategischen Platz im Geschäftsmodell des Startups und mehr Kontrolle.
6. Zeitlich gestaffeltes Abschmelzmodell
Konzept: Die Lizenzgebühren reduzieren sich schrittweise, verschwinden aber nie vollständig.
Umsetzung:
Höhere Anfangsgebühr für die intensive Trainingsphase
Schrittweise Reduktion der Gebühren über mehrere Jahre
Langfristige Mindestgebühr als "Restlizenz"
Vorteile: Realistische Anerkennung, dass der Wert der Originaldaten nach dem Training abnimmt, aber nie ganz verschwindet.
7. Exklusivitätsmodell mit Preisaufschlag
Konzept: Angebot von exklusiven Trainingsrechten gegen entsprechend höhere Vergütung.
Umsetzung:
Deutlich höherer Preis für das exklusive Recht, bestimmte Datenbereiche für KI-Training zu nutzen
Zusicherung, diese Daten nicht an Wettbewerber für ähnliche KI-Anwendungen zu lizenzieren
Begrenzte Dauer der Exklusivität (z.B. 2-3 Jahre)
Vorteile: Bietet dem Startup einen Wettbewerbsvorteil, für den es bereit sein könnte, mehr zu zahlen.
8. Daten-Update-Modell
Konzept: Kontinuierliche Aktualisierung der Daten als fortlaufender Wertbeitrag.
Umsetzung:
Grundlizenz für initiales Training
Fortlaufende Lizenzgebühr für regelmäßige Daten-Updates
Updates können für Nachtraining oder Validierung des Modells genutzt werden
Vorteile: Schafft einen kontinuierlichen Wert über das initiale Training hinaus, da KI-Modelle mit aktuellen Daten nachtrainiert werden müssen.
9. Nutzungsbeschränktes Lizenzmodell
Konzept: Detaillierte Einschränkungen, wie das trainierte Modell verwendet werden darf.
Umsetzung:
Genaue Definition der erlaubten Anwendungsfälle
Verbot bestimmter Nutzungsformen (z.B. keine eigenständige Weitervermarktung der Daten)
Technische und vertragliche Absicherungen gegen Missbrauch
Vorteile: Verhindert, dass aus Ihren Daten trainierte Modelle in unerwünschter Weise verwendet werden.
10. Kombiniertes Daten- und Support-Modell
Konzept: Die Daten werden mit Beratungs- und Support-Leistungen gekoppelt.
Umsetzung:
Datenlizenzen zu moderatem Preis
Zusätzliche Vergütung für Beratung bei der Datenaufbereitung und beim KI-Training
Fortlaufende Support-Komponente für die Datennutzung und -interpretation
Vorteile: Schafft einen Mehrwert über die reinen Daten hinaus und bindet den Kunden langfristig.
Empfehlungen für Ihre Vertragsinhalte
Unabhängig vom gewählten Modell sollten folgende Elemente in Ihrem Vertrag berücksichtigt werden:
- Klare Definition der Datennutzung: Spezifizieren Sie exakt, wie die Daten für das KI-Training verwendet werden dürfen
Qualitätsanforderungen: Verpflichten Sie den Lizenznehmer zur Einhaltung bestimmter Qualitätsstandards bei der Datenverarbeitung
Audit- und Überprüfungsrechte: Sichern Sie sich das Recht, die Einhaltung der Vertragsbedingungen zu überprüfen
Haftungsregelungen: Klare Regelungen zur Haftung bei Datenmissbrauch oder Vertragsverletzungen
Vertraulichkeitsklauseln: Schutz Ihrer Geschäftsgeheimnisse und Datenmethodik
Es gibt bereits Musterverträge für ähnliche Zwecke, die als Ausgangspunkt dienen können, jedoch sollten diese an Ihre spezifische Situation angepasst werden.
Fazit
Die Lizenzierung von Daten für KI-Training erfordert eine sorgfältige Vertragsgestaltung, die über traditionelle Datenlizenzen hinausgeht. Mit den vorgestellten Modellen haben Sie verschiedene Optionen, Ihre Investitionen zu schützen und gleichzeitig attraktive Angebote für innovative Startups zu schaffen. Eine rechtliche Beratung bei der endgültigen Vertragsgestaltung ist in jedem Fall empfehlenswert, da dieses Rechtsgebiet noch in der Entwicklung ist.
Kannst Du für alle Vorschläge konkrete Vertrags und Lizenzbedingungen für unseren aktuellen Fall ausarbeiten, in Kurzform, oder zu entsprechenden Musterverträgen mit Fundstellen verweisen?
Nachfolgend finden Sie für jedes der zehn vorgeschlagenen Lizenzmodelle konkrete, stichpunktartige Vertrags- und Lizenzbedingungen, zugeschnitten auf Ihren Fall. Die Formulierungen sind als Musterbausteine zu verstehen und sollten individuell juristisch geprüft und ergänzt werden. Hinweise zu Musterverträgen und Fundstellen sind jeweils beigefügt.
1. Dauerhaftes Lizenzmodell mit KI-Aufschlag
Lizenzumfang: Einfache, nicht-exklusive, dauerhafte Lizenz zur Nutzung der Daten für das Training und die Nutzung von KI-Modellen.
Vergütung: Einmalige, deutlich erhöhte Lizenzgebühr („KI-Aufschlag“).
Beschränkungen: Keine Weitergabe der Daten oder des trainierten Modells an Dritte ohne Zustimmung.
Dokumentationspflicht: Lizenznehmer muss Trainingsprozess und Datenherkunft dokumentieren (vgl. Art. 53 KI-VO).
Fundstelle: [Taylor Wessing, KI-Gesetz & Urheberrecht]
2. Umsatzbeteiligungsmodell
Lizenzumfang: Nutzung der Daten zum KI-Training; kommerzielle Nutzung des Modells erlaubt.
Vergütung: Niedrige Grundgebühr plus prozentuale Umsatzbeteiligung an Erlösen aus der KI-Anwendung.
Reporting: Lizenznehmer ist zu regelmäßigen Umsatzberichten verpflichtet; Anbieter erhält Audit-Recht.
Fundstelle: [IW Köln, Datenlizenzverträge]
3. Stufenmodell (Training/Nutzung)
Phase 1: Zeitlich begrenzte Lizenz zur Nutzung der Daten für das Training (z. B. 12 Monate, höhere Gebühr).
Phase 2: Nach Abschluss des Trainings reduzierte jährliche Gebühr für die weitere Nutzung des trainierten Modells.
Definition Trainingsende: Klarer Zeitpunkt, ab dem Phase 2 beginnt.
Fundstelle: [Haerting, Datenlizenzverträge]
4. KI-Output-Beschränkungen
Lizenzumfang: Nutzung der Daten zum Training, jedoch Beschränkung der Modell-Outputs (z. B. max. Anfragen/Monat).
Monitoring: Lizenznehmer verpflichtet sich zu technischen Maßnahmen zur Einhaltung der Output-Beschränkungen.
Konventionalstrafe: Bei Überschreitung Vertragsstrafe oder Nachlizenzierung.
Fundstelle: [Haerting, Datenlizenzverträge]
5. White-Label-Partnerschaft
Lizenzumfang: Gemeinsames Produkt, Co-Branding.
Vergütung: Einnahmenteilung nach vertraglich vereinbartem Schlüssel.
Mitspracherecht: Anbieter erhält Einfluss auf Weiterentwicklung und Vermarktung.
Fundstelle: [IW Köln, Datenlizenzverträge]
6. Zeitlich gestaffeltes Abschmelzmodell
Lizenzgebühr: Anfangs hohe Gebühr, die jährlich sinkt, aber nie auf null fällt.
Lizenzdauer: Mindestlaufzeit, danach jährliche Verlängerung möglich.
Restlizenz: Dauerhafte Mindestgebühr für Nutzung des trainierten Modells.
Fundstelle: [Haerting, Datenlizenzverträge]
7. Exklusivitätsmodell
Lizenzumfang: Exklusive Nutzung der Daten für bestimmte KI-Anwendungsfälle.
Vergütung: Deutlich erhöhter Preis für Exklusivität.
Exklusivitätsdauer: Zeitlich begrenzt (z. B. 2 Jahre).
Fundstelle: [IW Köln, Datenlizenzverträge]
8. Daten-Update-Modell
Lizenzumfang: Initiale Lizenz plus Pflicht zur Abnahme regelmäßiger Daten-Updates.
Vergütung: Laufende Gebühren für Updates, ggf. mit Nachtrainingsrecht.
Updatepflicht: Anbieter verpflichtet sich, Daten aktuell zu halten.
Fundstelle: [Haerting, Datenlizenzverträge]
9. Nutzungsbeschränktes Lizenzmodell
Lizenzumfang: Nutzung der Daten ausschließlich für klar definierte KI-Anwendungsfälle.
Verbot: Keine Weitergabe des trainierten Modells oder der Daten an Dritte.
Kontrolle: Anbieter erhält Kontroll- und Auditrechte.
Fundstelle: [Haerting, Datenlizenzverträge]
10. Kombiniertes Daten- und Support-Modell
Lizenzumfang: Datenlizenz plus Beratungs- und Supportleistungen für das KI-Training.
Vergütung: Kombination aus Lizenzgebühr und Dienstleistungspauschale.
Support: Anbieter unterstützt bei Datenintegration und Modelltraining.
Fundstelle: [IW Köln, Datenlizenzverträge]
Wichtige Vertragsbausteine für alle Modelle
Definition der Daten und Qualität: Klare Leistungsbeschreibung und Qualitätsstandards.
Nutzungsrechte: Genaue Regelung, welche Rechte am Datensatz und am trainierten Modell eingeräumt werden.
Datenschutz: Sicherstellung, dass keine personenbezogenen Daten verarbeitet werden, oder Einhaltung der DSGVO, falls doch.
Dokumentationspflichten: Lizenznehmer muss Datenherkunft und Trainingsprozess dokumentieren.
Haftung und Freistellung: Lizenznehmer stellt Anbieter von Ansprüchen Dritter frei.
Vertraulichkeit: Schutz der Daten und Geschäftsgeheimnisse.
Auditrechte: Anbieter kann Einhaltung der Vertragsbedingungen prüfen.
Beendigung/Kündigung: Klare Regelungen zur Beendigung und zum Umgang mit trainierten Modellen nach Vertragsende.
Musterverträge und Fundstellen
Haerting Rechtsanwälte: Übersicht und Musterklauseln zu Datenlizenzverträgen, speziell für KI und Data-Sharing.
https://www.vischer.com/know-how/blo...le%20%C3%BCber
IW Köln: Studie mit Vertragsbausteinen und Mustern für Datenlizenzverträge.
Taylor Wessing: Hinweise zu KI-Gesetz und Urheberrecht, Musterklauseln zu Dokumentations- und Urheberrechts-Policies.
Noerr: Präsentation mit Vertragsaspekten für KI-Sourcing und Datenlizenzierung.