Meta-Mitarbeiter diskutieren über die Nutzung urheberrechtlich geschützter Inhalte für KI-Training
Laut am Donnerstag veröffentlichten Gerichtsunterlagen haben Mitarbeiter von Meta über Jahre hinweg intern diskutiert, urheberrechtlich geschützte Werke, die auf rechtlich fragwürdige Weise erlangt wurden, zum Training der KI-Modelle des Unternehmens zu verwenden.
Die Dokumente stammen von Klägern in dem Fall Kadrey gegen Meta, einem von vielen Rechtsstreitigkeiten im Bereich KI und Urheberrecht, die sich langsam durch das US-Gerichtssystem ziehen. Der Beklagte, Meta, argumentiert, dass das Training von Modellen mit urheberrechtlich geschützten Werken, insbesondere Büchern, als „fair use“ gilt. Die Kläger, darunter die Autoren Sarah Silverman und Ta-Nehisi Coates, sind anderer Meinung.
Frühere Materialien, die im Verfahren vorgelegt wurden, behaupteten, dass Meta-CEO Mark Zuckerberg dem KI-Team von Meta die Erlaubnis gegeben hat, mit urheberrechtlich geschütztem Inhalt zu trainieren, und dass Meta die Gespräche über die Lizenzierung von Trainingsdaten mit Buchverlagen abgebrochen hat. Doch die neuen Unterlagen zeigen, wie Meta möglicherweise urheberrechtlich geschützte Daten verwendet hat, um seine Modelle, einschließlich der Llama-Modellreihe, zu trainieren.
In einem Chat diskutierten Meta-Mitarbeiter, darunter Melanie Kambadur, eine leitende Managerin des Llama-Modell-Forschungsteams, über das Training von Modellen mit Werken, von denen sie wussten, dass sie rechtlich problematisch sein könnten.
Ein Mitarbeiter schlug vor, E-Books zum Einzelhandelspreis zu kaufen, um einen Trainingssatz zu erstellen, anstatt Lizenzverträge mit einzelnen Buchverlagen abzuschließen. Nach einer Warnung eines anderen Mitarbeiters, dass die Verwendung unautorisierter, urheberrechtlich geschützter Materialien rechtliche Probleme nach sich ziehen könnte, beharrte der Mitarbeiter darauf, dass viele Startups wahrscheinlich bereits gestohlene Bücher für ihr Training verwendeten.
Diskussion über Libgen
In einem weiteren Chat, der in den Unterlagen wiedergegeben wird, spricht Kambadur darüber, möglicherweise Libgen zu verwenden, einen „Links-Aggregator“, der Zugang zu urheberrechtlich geschützten Werken von Verlagen bietet, als Alternative zu Datenquellen, die Meta möglicherweise lizenzieren könnte.
Die Kläger in Kadrey gegen Meta haben ihre Klage seit der Einreichung im Jahr 2023 mehrmals geändert. Die neuesten Behauptungen deuten darauf hin, dass Meta möglicherweise urheberrechtlich geschützte Bücher mit lizenzierten Büchern abgeglichen hat, um festzustellen, ob es sinnvoll wäre, einen Lizenzvertrag mit einem Verlag zu verfolgen.
Meta hat auf eine Anfrage nach einem Kommentar nicht sofort geantwortet.