
La plupart des propriétaires d’iPhone ne perçoivent pas encore la valeur d’Apple Intelligence, selon un récent rapport. En effet, après avoir retardé le déploiement de fonctionnalités Siri plus personnalisées, Apple met en place des changements pour optimiser ses mises à jour d’Apple Intelligence.
Un article de son site de recherche en apprentissage automatique explique comment l’entreprise a utilisé des données synthétiques pour entraîner ses modèles d’intelligence artificielle. Cependant, cette approche présente des limites, notamment sur la capacité des données synthétiques à comprendre des tendances, notamment dans des outils de résumé ou d’écriture de messages longs tels que des emails.
Pour pallier cette lacune, Apple souhaite introduire une nouvelle technologie qui comparera des données synthétiques à un petit échantillon d’emails récents d’utilisateurs, tout en préservant leur vie privée :
« Pour améliorer nos modèles, nous devons générer un ensemble d’emails couvrant les sujets les plus courants. Nous créons d’abord un large éventail de messages synthétiques sur divers sujets. Par exemple, nous pourrions générer un message synthétique tel que ‘Souhaites-tu jouer au tennis demain à 11h30 ?’. Cela se fait sans aucune connaissance des emails individuels des utilisateurs. Ensuite, nous extrayons une représentation, appelée embedding, de chaque message synthétique qui capture les dimensions clés comme la langue, le sujet et la longueur. Ces embeddings sont alors envoyés à un nombre restreint d’appareils utilisateurs ayant opté pour les analyses des appareils.
Les appareils participants sélectionnent alors un petit échantillon d’emails récents et calculent leurs embeddings. Chaque appareil détermine ensuite quel embedding synthétique est le plus proche de ces échantillons. Grâce à la méthode de protection de la vie privée différentielle, Apple peut alors apprendre quels embeddings synthétiques sont les plus fréquemment sélectionnés sur tous les appareils, sans savoir quel embedding a été choisi sur un appareil donné.
Les embeddings synthétiques les plus fréquemment sélectionnés pourront ensuite servir à générer des données d’entraînement ou de test, ou pour effectuer des étapes de curation supplémentaires. Par exemple, si le message sur le tennis est parmi les principaux embeddings, un message similaire remplaçant « tennis » par « football » ou un autre sport pourrait être créé et ajouté au prochain cycle de curation.
Ces techniques permettent à Apple de comprendre les tendances globales sans collecter d’informations sur des utilisateurs individuels. Selon Bloomberg, ce nouveau système sera déployé dans une future version bêta d’iOS 18.5 et de macOS 15.5.