
Selon The Information, une partie de l’infrastructure serveur d’Apple dédiée à l’IA tournerait largement en dessous de ses capacités. Certains serveurs déjà fabriqués resteraient même inactifs, stockés sur des étagères d’entrepôt.
Le média affirme par ailleurs que Google aurait été chargé d’opérer des serveurs Siri au sein de ses propres data centers, tout en respectant les standards de confidentialité imposés par Apple. Cette approche s’inscrit dans la continuité d’informations déjà rapportées plus tôt dans l’année par Bloomberg, autour d’un hébergement des nouveaux modèles Siri en dehors de Private Cloud Compute.
Private Cloud Compute : capacité disponible, usage faible
The Information indique qu’Apple n’utiliserait qu’environ 10% de la capacité moyenne de Private Cloud Compute à l’heure actuelle. Cette sous-utilisation expliquerait que des machines déjà produites ne soient pas déployées et restent dormantes.
Une infrastructure cloud jugée trop fragmentée
Le rapport décrit une organisation interne où plusieurs équipes exploitent leurs propres technologies et ressources de manière indépendante. Faute de « pool » centralisé dans lequel les différents services pourraient puiser, une partie de la capacité serveur resterait inutilisée, tandis que d’autres segments de la pile cloud pourraient en manquer.
Cette duplication d’infrastructures aurait alimenté des tensions côté finances, partagées entre la frustration liée aux coûts et la réticence à engager des investissements massifs pour une refonte complète. Toujours selon le média, plusieurs tentatives d’unification auraient été lancées au cours de la dernière décennie, sans aboutir.
Des limites techniques face aux modèles de nouvelle génération
Private Cloud Compute est aussi présenté comme insuffisant pour les besoins à venir. Les mises à jour logicielles seraient complexes et lentes à déployer. Plus fondamentalement, les puces actuellement utilisées — évoquées comme des M2 Ultra modifiées — ne seraient pas assez puissantes pour exécuter des modèles de pointe du niveau de Gemini, sur lesquels s’appuierait la nouvelle version de Siri.
- Sous-utilisation : environ 10% de capacité moyenne exploitée.
- Ressources immobilisées : des serveurs déjà produits resteraient en entrepôt.
- Architecture morcelée : des silos internes qui empêchent de mutualiser la capacité.
- Contraintes techniques : mises à jour difficiles et puissance insuffisante pour les modèles les plus avancés.
Google en soutien pour l’hébergement de Siri
Dans ce contexte, Apple serait en discussions avancées avec Google afin d’exécuter la nouvelle version de Siri dans les data centers de Google. L’argument principal tiendrait à l’expérience de Google sur les déploiements à grande échelle de serveurs pour modèles de langage, avec Gemini.
Le rapport rappelle également qu’Apple s’appuie déjà sur l’infrastructure cloud de Google pour certaines briques d’iCloud, notamment le stockage.