
Concept : rangée de robots alimentés par l’IA
Il y a quelques mois, Apple a organisé un événement de deux jours mettant en avant les dernières évolutions en traitement du langage naturel (NLP). Aujourd’hui, la firme a publié un récapitulatif de cet événement, rassemblant discussions et études présentées lors de l’atelier Workshop on Natural Language and Interactive Systems 2025 qui s’est tenu les 15 et 16 mai.
Les présentations ont abordé trois axes principaux de recherche :
- Systèmes interactifs de langage parlé
- Entraînement et alignement des grands modèles de langage (LLM)
- Agents de langage
De nombreux chercheurs d’universités telles que l’institut Allen pour l’IA, l’Imperial College de Londres, le MIT, Harvard, Stanford et Princeton ont partagé leurs travaux les plus récents. Ils collaborent également avec des géants industriels comme Microsoft, Amazon, Sony, Google, Tencent, Cohere, et bien sûr, Apple.
Effondrement des modèles d’IA et détection des hallucinations des LLM
Le professeur Yarin Gal de l’Université d’Oxford a présenté deux études majeures. La première, « AI Model Collapse », explore les risques de l’entraînement des LLM sur des données synthétiques susceptibles de mener à un effondrement des capacités de raisonnement. Il souligne que le développement d’outils pour différencier les contenus générés par l’IA des contenus humains pourrait atténuer ce risque. Sa seconde étude propose une approche novatrice pour détecter le niveau de confiance des LLM, ce qui aiderait à garantir la précision des réponses.
Apprentissage par renforcement pour les agents interactifs sur le long terme
Kevin Chen, chercheur chez Apple, a mis en avant une méthode appelée optimisation de politique proximale à laisser-un-de-côté (LOOP) pour former des agents capables de réaliser des tâches complexes en plusieurs étapes. Avec cette technique, les erreurs diminuent, améliorant l’efficacité des agents, bien que certaines limitations persistent.
Streaming spéculatif et vitesse de déduction des LLM
La responsable technique Irina Belousova a exposé les avantages du décodage spéculatif, une méthode qui permet de générer des réponses de haute qualité avec des modèles plus petits, réduisant l’usage de la mémoire et simplifiant l’infrastructure nécessaire, tout en garantissant des performances exceptionnelles.
Découvrez tous les détails fascinants de ces travaux, et explorez la liste complète des vidéos et études présentées lors de cet événement phare.