
Une action collective proposée accuse Apple d’avoir utilisé un jeu de données référençant des millions de vidéos YouTube afin d’entraîner un modèle d’IA, à partir d’un corpus décrit dans une étude publiée fin 2024.
Des créateurs YouTube à l’origine de la plainte
Repérée par MacRumors, la plainte a été déposée par Ted Entertainment, Matt Fisher et Golfholics. Les plaignants affirment qu’Apple aurait contourné les protections anti-scraping de YouTube pour télécharger à grande échelle des vidéos.
Le document fait référence à une publication d’une équipe de chercheurs d’Apple, intitulée STIV: Scalable Text and Image Conditioned Video Generation, qui mentionne l’usage d’un jeu de données baptisé Panda-70M pour contribuer à l’entraînement d’un modèle de génération vidéo.
Panda-70M, un index de liens… et des téléchargements contestés
Selon la plainte, Panda-70M fonctionnerait comme un fichier d’index permettant d’identifier des vidéos et des extraits via URL, identifiant de vidéo et horodatage. Une même vidéo pourrait être découpée en de nombreux clips, chacun utilisé comme échantillon d’entraînement distinct.
Les plaignants soutiennent que l’extraction de ces clips implique d’accéder aux vidéos sources sur YouTube et d’isoler les segments concernés, ce qui constituerait, pour chaque clip récupéré, un contournement distinct des mécanismes de protection.
Ils affirment que leur contenu apparaîtrait plus de 500 fois dans le jeu de données et demandent à représenter « tous les autres placés dans une situation similaire » dans le cadre de cette action collective proposée.
Ce que demandent les plaignants
- La certification de l’affaire en action collective et la désignation des plaignants et de leurs conseils pour représenter le groupe.
- Une déclaration selon laquelle Apple aurait volontairement contourné les systèmes de protection mis en place par YouTube pour protéger les contenus audiovisuels.
- Des dommages et intérêts statutaires (jusqu’au maximum prévu par la loi par violation), des mesures d’injonction, ainsi que le remboursement des frais et honoraires, au titre de 17 U.S.C. §1203.
- Des mesures équitables visant à prévenir ou à restreindre toute atteinte aux droits d’auteur, incluant une injonction préliminaire et permanente imposant l’arrêt des actes d’atteinte allégués, y compris pour les contenus listés dans les annexes A, B et C.
- Des intérêts avant et après jugement, dans toute la mesure permise, sur toute condamnation pécuniaire.
- Toute autre mesure que le tribunal jugerait juste et appropriée.
Amazon et OpenAI également visés
En parallèle d’Apple, les mêmes plaignants ont aussi déposé des actions collectives proposées contre Amazon et OpenAI, en avançant que ces deux entreprises auraient également utilisé Panda-70M dans leurs processus d’entraînement de modèles d’IA, selon Law360.