Einzelnen Beitrag anzeigen

Rollo62

Registriert seit: 15. Mär 2007
4.185 Beiträge
 
Delphi 12 Athens
 
#6

AW: Abgeltung Trainingsdaten für KI-Modell

  Alt 9. Mai 2025, 14:56
Oh, das ist eine sehr schöne Frage.
Mittlerweile stelle ich solche Fragen immer an verschiedene KI, weil die sich damit in der Regel viel besser auskennen.
Hier mal 10 verschiedene Lizenz-Modelle und Gedankengänge, von denen aus man diese je nach Unternehmens-Philosophie weiter verfeinern könnte:

Zitat:
Lizenzmodelle für die Nutzung von Lebensmitteldaten zum KI-Training

Die Frage der KI-Trainingsdaten ist tatsächlich rechtlich komplex und wirtschaftlich bedeutsam für Datenanbieter wie Sie. Ihre Bedenken sind berechtigt: Ohne entsprechende vertragliche Regelungen könnte ein Unternehmen Ihre wertvollen Daten zum Training einer KI nutzen und anschließend keine weiteren Lizenzzahlungen leisten, obwohl es wirtschaftlichen Nutzen aus dem mit Ihren Daten trainierten Modell zieht.
Rechtliche Ausgangslage

In Deutschland wurde kürzlich durch ein Urteil des Landgerichts Hamburg festgestellt, dass die Erstellung von KI-Trainingsdatensätzen grundsätzlich als Text- und Datamining zulässig sein kann, insbesondere für wissenschaftliche Zwecke
. Allerdings betrifft dies nicht automatisch kommerzielle Nutzungen. Zudem zeigen Entwicklungen wie OpenAIs Lizenzverträge mit Inhalteanbietern, dass eine Vergütung für Trainingsdaten zunehmend Standard wird.

Zehn Lizenz- und Vertragsmodelle zum Schutz Ihrer Datensammlung
1. Dauerhaftes Lizenzmodell mit KI-Aufschlag

Konzept: Statt einer zeitlich begrenzten Lizenz mit möglicher Kündigung bieten Sie eine dauerhafte Nutzungslizenz an, die das Recht zum KI-Training explizit einschließt, aber zu einem entsprechend höheren Preis.

Umsetzung:
Einmalzahlung, die deutlich höher ist als die üblichen Jahreslizenzen
Erlaubnis zur Nutzung der Daten für definierte KI-Trainingsszenarien
Klare Abgrenzung, welche KI-Anwendungen erlaubt sind
Vorteile: Sie werden für den potenziellen Wertverlust Ihrer Daten direkt entschädigt.

2. Umsatzbeteiligungsmodell

Konzept: Die Vergütung für die KI-Trainingslizenz wird an den Erfolg der daraus resultierenden KI-Anwendung gekoppelt.

Umsetzung:
Moderate Grundgebühr für das KI-Training
Prozentuale Beteiligung an den Umsätzen oder Gewinnen, die mit der trainierten KI erzielt werden
Verpflichtende Berichterstattung über Nutzung und Umsätze
Auditrechte zur Überprüfung der gemeldeten Zahlen

Vorteile: Sie partizipieren langfristig am Erfolg der Anwendung und erhalten eine faire Vergütung, falls die KI erfolgreich ist.

3. Stufenmodell mit Trainings- und Nutzungsphase

Konzept: Trennung der Lizenz in zwei Phasen mit unterschiedlichen Gebührenstrukturen.

Umsetzung:
Phase 1: Höhere Gebühr für die Trainingsphase (z.B. für 6-12 Monate)
Phase 2: Reduzierte "KI-Nutzungsgebühr" nach Abschluss des Trainings
Klare Definition, wann das Training als abgeschlossen gilt

Vorteile: Sie erhalten auch nach dem eigentlichen Training weiterhin Einnahmen, während das Startup nach dem Training weniger zahlen muss.

4. Lizenzerweiterung mit KI-Output-Beschränkungen

Konzept: Erlaubnis zum KI-Training, aber mit Beschränkungen bezüglich der Ausgabemöglichkeiten des trainierten Modells.

Umsetzung:
Festlegung von maximalen Output-Volumina (z.B. Anzahl der Anfragen)
Zusatzgebühren bei Überschreitung dieser Grenzen
Technische Implementierung zur Überwachung der Nutzung

Vorteile: Die KI kann nicht unbegrenzt Ihre Daten reproduzieren, was den Wert Ihrer Ursprungsdaten schützt.

5. White-Label-Partnerschaftsmodell

Konzept: Statt nur Daten zu lizenzieren, werden Sie Partner der KI-Anwendung.

Umsetzung:
Ko-Branding der resultierenden KI-Anwendung
Gemeinsame Vermarktung der Lösung
Geteilte Einnahmen aus der KI-Anwendung
Mitspracherecht bei Weiterentwicklungen

Vorteile: Sie sichern sich einen strategischen Platz im Geschäftsmodell des Startups und mehr Kontrolle.

6. Zeitlich gestaffeltes Abschmelzmodell

Konzept: Die Lizenzgebühren reduzieren sich schrittweise, verschwinden aber nie vollständig.

Umsetzung:
Höhere Anfangsgebühr für die intensive Trainingsphase
Schrittweise Reduktion der Gebühren über mehrere Jahre
Langfristige Mindestgebühr als "Restlizenz"

Vorteile: Realistische Anerkennung, dass der Wert der Originaldaten nach dem Training abnimmt, aber nie ganz verschwindet.

7. Exklusivitätsmodell mit Preisaufschlag

Konzept: Angebot von exklusiven Trainingsrechten gegen entsprechend höhere Vergütung.

Umsetzung:
Deutlich höherer Preis für das exklusive Recht, bestimmte Datenbereiche für KI-Training zu nutzen
Zusicherung, diese Daten nicht an Wettbewerber für ähnliche KI-Anwendungen zu lizenzieren
Begrenzte Dauer der Exklusivität (z.B. 2-3 Jahre)

Vorteile: Bietet dem Startup einen Wettbewerbsvorteil, für den es bereit sein könnte, mehr zu zahlen.

8. Daten-Update-Modell

Konzept: Kontinuierliche Aktualisierung der Daten als fortlaufender Wertbeitrag.

Umsetzung:
Grundlizenz für initiales Training
Fortlaufende Lizenzgebühr für regelmäßige Daten-Updates
Updates können für Nachtraining oder Validierung des Modells genutzt werden

Vorteile: Schafft einen kontinuierlichen Wert über das initiale Training hinaus, da KI-Modelle mit aktuellen Daten nachtrainiert werden müssen.

9. Nutzungsbeschränktes Lizenzmodell

Konzept: Detaillierte Einschränkungen, wie das trainierte Modell verwendet werden darf.

Umsetzung:
Genaue Definition der erlaubten Anwendungsfälle
Verbot bestimmter Nutzungsformen (z.B. keine eigenständige Weitervermarktung der Daten)
Technische und vertragliche Absicherungen gegen Missbrauch

Vorteile: Verhindert, dass aus Ihren Daten trainierte Modelle in unerwünschter Weise verwendet werden.

10. Kombiniertes Daten- und Support-Modell

Konzept: Die Daten werden mit Beratungs- und Support-Leistungen gekoppelt.

Umsetzung:
Datenlizenzen zu moderatem Preis
Zusätzliche Vergütung für Beratung bei der Datenaufbereitung und beim KI-Training
Fortlaufende Support-Komponente für die Datennutzung und -interpretation

Vorteile: Schafft einen Mehrwert über die reinen Daten hinaus und bindet den Kunden langfristig.

Empfehlungen für Ihre Vertragsinhalte

Unabhängig vom gewählten Modell sollten folgende Elemente in Ihrem Vertrag berücksichtigt werden:
- Klare Definition der Datennutzung: Spezifizieren Sie exakt, wie die Daten für das KI-Training verwendet werden dürfen

Qualitätsanforderungen: Verpflichten Sie den Lizenznehmer zur Einhaltung bestimmter Qualitätsstandards bei der Datenverarbeitung

Audit- und Überprüfungsrechte: Sichern Sie sich das Recht, die Einhaltung der Vertragsbedingungen zu überprüfen

Haftungsregelungen: Klare Regelungen zur Haftung bei Datenmissbrauch oder Vertragsverletzungen

Vertraulichkeitsklauseln: Schutz Ihrer Geschäftsgeheimnisse und Datenmethodik

Es gibt bereits Musterverträge für ähnliche Zwecke, die als Ausgangspunkt dienen können, jedoch sollten diese an Ihre spezifische Situation angepasst werden.

Fazit
Die Lizenzierung von Daten für KI-Training erfordert eine sorgfältige Vertragsgestaltung, die über traditionelle Datenlizenzen hinausgeht. Mit den vorgestellten Modellen haben Sie verschiedene Optionen, Ihre Investitionen zu schützen und gleichzeitig attraktive Angebote für innovative Startups zu schaffen. Eine rechtliche Beratung bei der endgültigen Vertragsgestaltung ist in jedem Fall empfehlenswert, da dieses Rechtsgebiet noch in der Entwicklung ist.
Kannst Du für alle Vorschläge konkrete Vertrags und Lizenzbedingungen für unseren aktuellen Fall ausarbeiten, in Kurzform, oder zu entsprechenden Musterverträgen mit Fundstellen verweisen?

Nachfolgend finden Sie für jedes der zehn vorgeschlagenen Lizenzmodelle konkrete, stichpunktartige Vertrags- und Lizenzbedingungen, zugeschnitten auf Ihren Fall. Die Formulierungen sind als Musterbausteine zu verstehen und sollten individuell juristisch geprüft und ergänzt werden. Hinweise zu Musterverträgen und Fundstellen sind jeweils beigefügt.

1. Dauerhaftes Lizenzmodell mit KI-Aufschlag
Lizenzumfang: Einfache, nicht-exklusive, dauerhafte Lizenz zur Nutzung der Daten für das Training und die Nutzung von KI-Modellen.
Vergütung: Einmalige, deutlich erhöhte Lizenzgebühr („KI-Aufschlag“).
Beschränkungen: Keine Weitergabe der Daten oder des trainierten Modells an Dritte ohne Zustimmung.
Dokumentationspflicht: Lizenznehmer muss Trainingsprozess und Datenherkunft dokumentieren (vgl. Art. 53 KI-VO).

Fundstelle: [Taylor Wessing, KI-Gesetz & Urheberrecht]

2. Umsatzbeteiligungsmodell
Lizenzumfang: Nutzung der Daten zum KI-Training; kommerzielle Nutzung des Modells erlaubt.
Vergütung: Niedrige Grundgebühr plus prozentuale Umsatzbeteiligung an Erlösen aus der KI-Anwendung.
Reporting: Lizenznehmer ist zu regelmäßigen Umsatzberichten verpflichtet; Anbieter erhält Audit-Recht.
Fundstelle: [IW Köln, Datenlizenzverträge]

3. Stufenmodell (Training/Nutzung)
Phase 1: Zeitlich begrenzte Lizenz zur Nutzung der Daten für das Training (z. B. 12 Monate, höhere Gebühr).
Phase 2: Nach Abschluss des Trainings reduzierte jährliche Gebühr für die weitere Nutzung des trainierten Modells.
Definition Trainingsende: Klarer Zeitpunkt, ab dem Phase 2 beginnt.
Fundstelle: [Haerting, Datenlizenzverträge]

4. KI-Output-Beschränkungen
Lizenzumfang: Nutzung der Daten zum Training, jedoch Beschränkung der Modell-Outputs (z. B. max. Anfragen/Monat).
Monitoring: Lizenznehmer verpflichtet sich zu technischen Maßnahmen zur Einhaltung der Output-Beschränkungen.
Konventionalstrafe: Bei Überschreitung Vertragsstrafe oder Nachlizenzierung.
Fundstelle: [Haerting, Datenlizenzverträge]

5. White-Label-Partnerschaft
Lizenzumfang: Gemeinsames Produkt, Co-Branding.
Vergütung: Einnahmenteilung nach vertraglich vereinbartem Schlüssel.
Mitspracherecht: Anbieter erhält Einfluss auf Weiterentwicklung und Vermarktung.
Fundstelle: [IW Köln, Datenlizenzverträge]

6. Zeitlich gestaffeltes Abschmelzmodell
Lizenzgebühr: Anfangs hohe Gebühr, die jährlich sinkt, aber nie auf null fällt.
Lizenzdauer: Mindestlaufzeit, danach jährliche Verlängerung möglich.
Restlizenz: Dauerhafte Mindestgebühr für Nutzung des trainierten Modells.
Fundstelle: [Haerting, Datenlizenzverträge]

7. Exklusivitätsmodell
Lizenzumfang: Exklusive Nutzung der Daten für bestimmte KI-Anwendungsfälle.
Vergütung: Deutlich erhöhter Preis für Exklusivität.
Exklusivitätsdauer: Zeitlich begrenzt (z. B. 2 Jahre).
Fundstelle: [IW Köln, Datenlizenzverträge]

8. Daten-Update-Modell
Lizenzumfang: Initiale Lizenz plus Pflicht zur Abnahme regelmäßiger Daten-Updates.
Vergütung: Laufende Gebühren für Updates, ggf. mit Nachtrainingsrecht.
Updatepflicht: Anbieter verpflichtet sich, Daten aktuell zu halten.
Fundstelle: [Haerting, Datenlizenzverträge]

9. Nutzungsbeschränktes Lizenzmodell
Lizenzumfang: Nutzung der Daten ausschließlich für klar definierte KI-Anwendungsfälle.
Verbot: Keine Weitergabe des trainierten Modells oder der Daten an Dritte.
Kontrolle: Anbieter erhält Kontroll- und Auditrechte.
Fundstelle: [Haerting, Datenlizenzverträge]

10. Kombiniertes Daten- und Support-Modell
Lizenzumfang: Datenlizenz plus Beratungs- und Supportleistungen für das KI-Training.
Vergütung: Kombination aus Lizenzgebühr und Dienstleistungspauschale.
Support: Anbieter unterstützt bei Datenintegration und Modelltraining.
Fundstelle: [IW Köln, Datenlizenzverträge]

Wichtige Vertragsbausteine für alle Modelle
Definition der Daten und Qualität: Klare Leistungsbeschreibung und Qualitätsstandards.

Nutzungsrechte: Genaue Regelung, welche Rechte am Datensatz und am trainierten Modell eingeräumt werden.

Datenschutz: Sicherstellung, dass keine personenbezogenen Daten verarbeitet werden, oder Einhaltung der DSGVO, falls doch.

Dokumentationspflichten: Lizenznehmer muss Datenherkunft und Trainingsprozess dokumentieren.

Haftung und Freistellung: Lizenznehmer stellt Anbieter von Ansprüchen Dritter frei.

Vertraulichkeit: Schutz der Daten und Geschäftsgeheimnisse.

Auditrechte: Anbieter kann Einhaltung der Vertragsbedingungen prüfen.

Beendigung/Kündigung: Klare Regelungen zur Beendigung und zum Umgang mit trainierten Modellen nach Vertragsende.

Musterverträge und Fundstellen
Haerting Rechtsanwälte: Übersicht und Musterklauseln zu Datenlizenzverträgen, speziell für KI und Data-Sharing.
https://www.vischer.com/know-how/blo...le%20%C3%BCber

IW Köln: Studie mit Vertragsbausteinen und Mustern für Datenlizenzverträge.
Taylor Wessing: Hinweise zu KI-Gesetz und Urheberrecht, Musterklauseln zu Dokumentations- und Urheberrechts-Policies.
Noerr: Präsentation mit Vertragsaspekten für KI-Sourcing und Datenlizenzierung.

Zitat:

**Lizenz‑ und Vertragsoptionen für KI‑Training mit Euren Lebensmitteldaten
(Reinform für Copy‑&‑Paste in ein Vertrags‑ oder Konzeptdokument)**

---

### 1. Exklusive Einmallizenz

* **Beschreibung:** Ein einziger Lizenznehmer erhält sämtliche Nutzungs‑ und KI‑Trainingsrechte an den Daten für einen definierten Zeitraum oder unbegrenzt.
* **Vorteile:**

* Höhere Einmalvergütung möglich.
* Starke Kontrolle über Weiterverwertung (kein Mitbewerb mit demselben Datensatz).
* **Nachteile:**

* Nur ein Kunde → begrenztes Umsatzpotenzial.
* Abhängigkeit vom wirtschaftlichen Erfolg des Lizenznehmers.
* **Typische Fälle:** Strategische Partnerschaften mit Großkonzernen, die ein proprietäres Ernährungssystem entwickeln.
* **Wesentliche Klauseln:**

* Verbot der Unterlizenzierung und Weitergabe.
* Vertragsstrafe bei Datenweitergabe ohne Zustimmung. ([vischer.com][1])

---

### 2. Nicht‑exklusive Einmallizenz

* **Beschreibung:** Mehrere Kunden erwerben zeitlich unbegrenzte Trainings‑ und Nutzungsrechte gegen einmalige Zahlung.
* **Vorteile:**

* Schnelle Liquidität, kein aufwendiges Abrechnungsmodell.
* Beliebig viele Abnehmer möglich.
* **Nachteile:**

* Keine Folgerlöse; Investition amortisiert sich nur über neue Kunden.
* Nach dem Training entfällt Eure Verhandlungsmacht.
* **Klauseln:**

* Zweckbindung (z. B. nur für App XY, kein Re‑Selling).
* Audit‑Recht, um Zweckbindung zu kontrollieren. ([vischer.com][1])

---

### 3. Abonnement / wiederkehrende Lizenz

* **Beschreibung:** Zugriff oder Datendumps gegen monatliche/jährliche Gebühr inkl. Updates.
* **Vorteile:** Planbare, wiederkehrende Einnahmen; Datenpflege refinanzierbar.
* **Nachteile:** Verwaltungsaufwand (Kündigungen, Preisanpassungen).
* **Klauseln:**

* Automatische Verlängerung bei stillschweigender Fortsetzung.
* Pflicht zur Datenlöschung oder ‑rückgabe bei Vertragsende. ([rosenthal.ch][2])

---

### 4. Nutzungsbasierte Lizenz (Pay‑per‑Use)

* **Beschreibung:** Abrechnung pro API‑Call, heruntergeladenem Datensatz oder pro 1 000 Trainingsbeispiele.
* **Vorteile:** Faire Kostenverteilung nach tatsächlicher Nutzung; niedrige Einstiegshürde.
* **Nachteile:** Technische Zähler und Reporting nötig; Risiko von Unter‑/Fehlmessungen.
* **Klauseln:**

* Verbindliche Messmethode (Server‑Logs) und Prüfungsrecht. ([rosenthal.ch][2])

---

### 5. Data‑as‑a‑Service (reiner Online‑Zugriff)

* **Beschreibung:** Daten bleiben auf Euren Servern; Lizenznehmer ruft sie nur per gesicherter API ab.
* **Vorteile:**

* Volle Eigentumskontrolle; sofortige Sperre bei Missbrauch.
* Keine Kopien außerhalb Eurer Umgebung.
* **Nachteile:**

* Abhängigkeit von Service‑Verfügbarkeit.
* Ggf. höhere Latenzkosten für KI‑Batch‑Training.
* **Klauseln:**

* Technische Zugangsbeschränkungen + Pen‑Tests.
* Verbot lokaler Caches; automatische Token‑Ablaufzeiten. ([vischer.com][1])

---

### 6. Forschung / Non‑Commercial‑Lizenz (mit Namensnennung)

* **Beschreibung:** Kostenfrei oder stark rabattiert, aber nur für nicht‑kommerzielle Forschung & Lehre.
* **Vorteile:** Positive Publicity und Verbreitung; Datenqualität wird von Forschern validiert.
* **Nachteile:** Schwierige Abgrenzung von „nicht‑kommerziell“; mögliches Leakage in kommerzielle Modelle.
* **Klauseln:**

* CC‑ähnliche Bedingungen (BY, evtl. SA).
* Veröffentlichungs‑ und Zitationspflicht.

---

### 7. Lizenz mit Umsatz‑ oder Gewinnbeteiligung

* **Beschreibung:** Geringe Vorabgebühr, dafür prozentuale Beteiligung an Einnahmen aus dem trainierten Modell.
* **Vorteile:** Unbegrenztes Upside, Interessengleichheit zwischen Euch und Lizenznehmer.
* **Nachteile:** Komplexe Buchprüfung, Streitpotenzial über Berechnungsbasis.
* **Klauseln:**

* Periodisches Reporting, Wirtschaftsprüfer‑Zugriff.
* Mindestgebühr als Floor. ([rosenthal.ch][2])

---

### 8. Lizenz mit Offenlegungs‑/Reporting‑Pflichten

* **Beschreibung:** KI‑Projekte dürfen nur nach vorheriger schriftlicher Projektbeschreibung und Genehmigung trainiert werden.
* **Vorteile:** Transparenz, Früherkennung von unerwünschten Use‑Cases.
* **Nachteile:** Zusatzaufwand für beide Seiten, mögliche Geschäftsgeheimnis‑Bedenken.
* **Klauseln:**

* Detaillierte Trainings‑Reports (Datenmenge, Modellarchitektur, Zweck).
* Vertragsstrafe bei unterlassener Meldung. ([vischer.com][1])

---

### 9. Befristete / widerrufliche Testlizenz

* **Beschreibung:** Pilotzugang für 3–12 Monate; Verlängerung oder Rückgabe danach.
* **Vorteile:** Niedriges Einstiegsrisiko für Startup, Ihr behaltet Hebel für Follow‑Up‑Deal.
* **Nachteile:** Unsicherheit für Lizenznehmer; Exit‑Management muss klar geregelt sein.
* **Klauseln:**

* Pflicht zur Modellde‑letion oder Retraining ohne Eure Daten bei Nichtverlängerung.
* Rückrufrecht bei regulatorischen Änderungen (EU AI Act). ([rosenthal.ch][2])

---

### 10. „No‑AI‑Use“‑Lizenz

* **Beschreibung:** Daten dürfen ausschließlich in klassischen, nicht‑KI‑gestützten Anwendungen genutzt werden.
* **Vorteile:** Maximale Wahrung der Investition; verhindert unerwünschte Modell‑Ableitungen.
* **Nachteile:** Unattraktiv für KI‑Anbieter; begrenzt Vermarktungschancen.
* **Klauseln:**

* Explizites KI‑Trainingsverbot (§ 44b UrhG nicht anwendbar).
* Vertragsstrafe und Unterlassung bei Zuwiderhandlung.

---

## Muster‑ und Referenzquellen

* **VISCHER Blog „Feeding AI: How to commercialize data sets“** – zentrale Punkte zu Kontroll‑ und Verwertungsrechten. ([vischer.com][1])
* **VISCHER AI‑Provider‑Check (Checkliste, 17 Apr 2024)** – konkrete Klauseln zu Training, Löschung und Audit. ([rosenthal.ch][2])
* **VG WORT KI‑Lizenz FAQ (Okt 2024)** – Beispiel für interne Nutzungsbeschränkung und Vergütungssystem.

---

### 11. Vertragliche Pflichtmodule (für jedes Modell empfehlenswert)

* **Definition des Datensatzes** (Inhalt, Format, Cut‑off‑Datum).
* **Sicherheits‑ und Vertraulichkeitsklausel** (ISO 27001‑Level, Verschlüsselung, Zugriffskontrollen).
* **Audit‑ und Berichtspflichten** (Nutzungs‑Logs, externe Prüfer).
* **Haftung & Gewährleistung** (Richtigkeit, Rechtsmängel, IP‑Indemnities).
* **Exit‑Management** (Daten‑ und Modell‑Löschung, Rückgabe‑Formate).

---

## Klärungsfragen

1. **Datenbestand:** Enthalten Eure Lebensmitteldaten ausschließlich Fakten (Nährwerte) oder auch geschützte Texte/Bilder?
2. **Persönliche Daten:** Gibt es personenbezogene Anteile (z. B. Testergebnisse, Health‑Daten), die DSGVO‑relevant sind?
3. **Gewünschtes Erlösmodell:** Präferiert Ihr laufende Einnahmen (Abo/Beteiligung) oder schnelle Einmalerlöse?
4. **Technische Schutzmaßnahmen:** Stehen euch API‑Gateways zur Verfügung, um Data‑as‑a‑Service technisch umzusetzen?
5. **Regionale Vorgaben:** Sollen Verträge EU‑weit einheitlich sein oder unterschiedliche Jurisdiktionen (CH, US) abdecken?


Geändert von Rollo62 ( 9. Mai 2025 um 15:01 Uhr)
  Mit Zitat antworten Zitat