Close Menu
AppSystemAppSystem
  • Astuces
  • Tutoriels
  • Boutique
    • Coques
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Verres trempés
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Accessoires
  • iPhone 15
  • Jailbreak
  • Bons Plans
  • Fonds d’écran
  • Accessoires
  • À propos
  • Contact
  • Publicité
Facebook X (Twitter)
  • iPhone 15
  • Jailbreak
  • Bons Plans
  • Fonds d’écran
  • Accessoires
Facebook X (Twitter)
AppSystemAppSystem
  • Astuces
  • Tutoriels
  • Boutique
    • Coques
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Verres trempés
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Accessoires
AppSystemAppSystem
Actualité

Manzano : le modèle unifié d’Apple pour comprendre et générer des images

Léon GalarneauBy Léon Galarneau14 janvier 2026Aucun commentaire2 Mins Read
WhatsApp Email Facebook Twitter Pinterest Telegram

Des chercheurs d’Apple présentent Manzano, un modèle multimodal unifié capable à la fois de comprendre des images et de générer des visuels à partir de texte, en réduisant les compromis de performance traditionnellement observés entre ces deux tâches.

Le problème traité

Les approches unifiées actuelles peinent à exceller simultanément en compréhension et en génération, en raison de la tokenisation visuelle. La génération auto-régressive privilégie des jetons d’image discrets, tandis que la compréhension bénéficie d’embeddings continus. L’usage de deux tokeniseurs impose au modèle de langage de concilier des représentations hétérogènes (sémantique vs. spatiale), ce qui crée des conflits d’objectifs et des inefficacités paramétriques.

Architecture

  • Tokeniseur visuel hybride : produit des représentations continues et discrètes.
  • Décodeur LLM : accepte des jetons texte et/ou des embeddings d’image continus et prédit, de manière auto-régressive, les prochains jetons d’image ou de texte au sein d’un vocabulaire commun.
  • Décodeur d’image : rend les pixels à partir des jetons d’image prédits, via un processus de diffusion.

Performances et cas d’usage

Selon l’étude, Manzano traite correctement des invites contre-intuitives (« L’oiseau vole sous l’éléphant ») avec des résultats comparables à GPT-4o et Nano Banana (Google). Sur plusieurs benchmarks, les modèles Manzano 3B et 30B affichent des performances supérieures ou compétitives face aux meilleurs modèles multimodaux unifiés.

Échelle des modèles

Manzano a été évalué à différentes tailles, d’environ 300 millions à 30 milliards de paramètres, afin de mesurer les gains liés au changement d’échelle sur les tâches unifiées de compréhension et de génération.

Édition et transformation d’images

Le modèle montre également de bonnes capacités en édition guidée par instructions, transfert de style, inpainting/outpainting et estimation de profondeur.

L’étude complète et les détails techniques (formation du tokeniseur hybride, conception du décodeur de diffusion, expériences d’échelle et évaluations humaines) sont disponibles sur le site Apple Machine Learning Research : MANZANO.

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Previous ArticleiOS 26.4: Siri pourrait créer des notes dans Apple Notes
Next Article Pression accrue pour retirer X de l’App Store, xAI resserre les filtres de Grok
Léon Galarneau

Rédacteur occasionnel sur AppSystem, je cultive une réelle passion pour les mangas, le tennis et l'univers Apple.

Related Posts

iPhone 18 Pro : deux pistes sérieuses pour muscler la photo, selon les rumeurs

8 février 2026

Messages sur iOS 26 : chiffrement RCS et réponses en ligne au programme

7 février 2026

Apple News critiqué pour des publicités jugées douteuses

6 février 2026
Leave A Reply Cancel Reply

coque iphone la plus fine du monde

Top 3

Quatre nouveautés Apple attendues dès janvier 2026

5 décembre 2025

WhatsApp et WhatsApp Business sont à jour pour ajouter quelques nouveautés

31 juillet 2024

Astuce : comment vérifier si la batterie de votre iPhone mérite d’être remplacée

18 décembre 2017
Suivez-nous
  • Facebook 15K
  • Twitter
Facebook X (Twitter)
  • À propos
  • Contact
  • Publicité

Nos sites : ShopSystem • App4Phone

Copyright © 2026 AppSystem. Publié depuis 2008.

bannière app store

Apple, le logo Apple, iPod, iTunes et Mac sont des marques d’Apple Inc., déposées aux États-Unis et dans d’autres pays. iPhone et MacBook Air sont des marques déposées d’Apple Inc. MobileMe est une marque de service d’Apple Inc. AppSystem.fr et son App ne sont pas liés à Apple et les marques citées sont la propriété de leurs détenteurs respectifs.

Type above and press Enter to search. Press Esc to cancel.