
Photo : Apple Intelligence
Une nouvelle action collective a été déposée aujourd’hui devant le tribunal fédéral du Nord de la Californie accusant Apple d’utiliser illégalement des livres pour entraîner ses modèles d’intelligence artificielle. Voyons de plus près cette affaire.
DES ACCUSATIONS BASÉES SUR LES PROPRE DOCUMENTS D’APPLE
Selon Reuters, les auteurs Grady Hendrix et Jennifer Robertson affirment que leurs œuvres ont été incluses dans un ensemble de données piratées utilisé par Apple. D’après le recours judiciaire :
« Apple construit une partie de sa nouvelle entreprise en utilisant Books3, un ensemble de livres piratés, incluant les œuvres publiées des plaignants et de la classe. Apple a utilisé Books3 pour entraîner ses modèles de langage OpenELM. Il est également probable qu’Apple ait utilisé ce même ensemble de données piratées pour entraîner ses modèles Foundation Language Models. »
L’accusation repose sur les détails fournis par Apple dans son document sur OpenELM, un modèle open-source que la société a rendu disponible sur Hugging Face l’an dernier. Ce document mentionne RedPajama comme l’un des ensembles de données utilisés pour le modèle. RedPajama utilise à son tour Books3, décrit dans la plainte comme « un ensemble connu de livres piratés ».
Les auteurs demandent à la cour de faire de cette procédure une action collective contre Apple et sollicitent les réparations suivantes après un procès devant jury :
- Autoriser cette action à avancer comme action collective, avec les plaignants en tant que représentants de la classe et leur conseil comme conseil de classe.
- Accorder aux plaignants et à la classe des dommages-intérêts légaux, compensatoires, la restitution, le dénigrement et toute autre réparation autorisée par la loi ou l’équité.
- Interdire définitivement au défendeur les comportements illégaux, injustes et contrefaits allégués.
- Ordonner, en vertu du 17 U.S.C. § 503(b), la destruction de tous les modèles d’intelligence d’Apple ou autres LLM et ensembles de formation incorporant les travaux des plaignants et membres de la classe.
- Octroyer les frais de justice, dépenses et honoraires d’avocats autorisés par la loi.
- Autres mesures ou réparations appropriées que la cour peut juger convenables.
UNE SAGA JURIDIQUE AU CŒUR DE DÉBATS PARTAGÉS
Cette procédure judiciaire survient dans le sillage d’un règlement record d’1,5 milliard de dollars par Anthropic dans une affaire très similaire Bloomberg. Fait intéressant, Meta a récemment été confrontée à une affaire similaire, mais le juge a tranché en sa faveur, considérant que l’utilisation de livres protégés par des droits d’auteur pour entraîner ses modèles d’IA relevait de l’usage équitable FT.
Les auteurs devraient-ils être rémunérés pour l’utilisation de leurs livres dans l’entraînement des modèles d’IA ?