Close Menu
AppSystemAppSystem
  • Astuces
  • Tutoriels
  • Boutique
    • Coques
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Verres trempés
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Accessoires
  • iPhone 15
  • Jailbreak
  • Bons Plans
  • Fonds d’écran
  • Accessoires
  • À propos
  • Contact
  • Publicité
Facebook X (Twitter)
  • iPhone 15
  • Jailbreak
  • Bons Plans
  • Fonds d’écran
  • Accessoires
Facebook X (Twitter)
AppSystemAppSystem
  • Astuces
  • Tutoriels
  • Boutique
    • Coques
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Verres trempés
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Accessoires
AppSystemAppSystem
Actualité

Apple unifie compréhension, génération et édition d’images dans un seul modèle d’IA

Léon GalarneauBy Léon Galarneau18 décembre 2025Aucun commentaire2 Mins Read
WhatsApp Email Facebook Twitter Pinterest Telegram

Apple présente UniGen‑1.5, un modèle multimodal capable de comprendre, générer et éditer des images au sein d’un seul système.

Le premier travail, UniGen, a été publié en mai 2025 dans l’étude « UniGen: Enhanced Training & Test-Time Strategies for Unified Multimodal Understanding and Generation » (arXiv). En novembre 2025, la suite « UniGen‑1.5: Enhancing Image Generation and Editing through Reward Unification in Reinforcement Learning » (arXiv) ajoute l’édition d’images et revoit la stratégie d’entraînement.

UniGen‑1.5, l’essentiel

  • Modèle unique pour la compréhension, la génération et l’édition d’images.
  • Nouvelle étape post‑entraînement, Edit Instruction Alignment (EIA), pour mieux interpréter des consignes d’édition fines ou complexes.
  • Récompense unifiée en apprentissage par renforcement pour la génération et l’édition, malgré l’amplitude variable des modifications.
  • Résultats compétitifs sur les benchmarks : 0,89 sur GenEval, 86,83 sur DPG‑Bench ; score global de 4,31 sur ImgEdit, au‑dessus de méthodes récentes comme BAGEL et BLIP3o, supérieur à OminiGen2 et comparable à des modèles propriétaires comme GPT‑Image‑1.
  • Limites actuelles : rendu de texte peu fiable et incohérences d’identité dans certains cas.

Ce qui change dans l’entraînement

Les chercheurs constatent que, malgré un affinage supervisé, le modèle peine à saisir certaines instructions d’édition lorsque les changements sont subtils ou très spécifiques. UniGen‑1.5 introduit donc l’Edit Instruction Alignment : une étape légère post‑SFT où le système apprend d’abord à déduire une description textuelle détaillée de l’image cible à partir de l’image d’origine et de l’instruction. Cette représentation sémantique sert de pivot avant la génération finale.

Vient ensuite l’apprentissage par renforcement avec une récompense unifiée pour la génération et l’édition. Ce choix, central dans l’étude, permet d’évaluer de manière cohérente des modifications allant du léger ajustement à la transformation complète, et d’améliorer la fidélité aux consignes tout en préservant la qualité visuelle.

Résultats et limites

Sur des benchmarks couvrant suivi des instructions, qualité visuelle et difficulté des edits, UniGen‑1.5 établit une base solide pour les modèles multimodaux unifiés. Des échecs persistent toutefois pour la génération de texte (manque de contrôle des détails structurels) et la constance d’identité, avec des variations visibles sur des textures ou des couleurs.

L’étude complète est disponible sur arXiv.

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Previous ArticleApple révise l’accord développeur : nouvelles règles de confidentialité et conditions spécifiques au Japon
Next Article iOS 26.2 rend le Sleep Score de l’Apple Watch plus pertinent
Léon Galarneau

Rédacteur occasionnel sur AppSystem, je cultive une réelle passion pour les mangas, le tennis et l'univers Apple.

Related Posts

M5 Pro et M5 Max : Apple détaille l’arrivée de trois catégories de cœurs CPU

20 mars 2026

Siri dopée à Gemini : une première vague de fonctions encore possible fin mars

20 mars 2026

iOS 27 : date de sortie, priorités de stabilité et nouvelles pistes Apple Intelligence

20 mars 2026
Leave A Reply Cancel Reply

coque iphone la plus fine du monde

Top 3

WhatsApp et WhatsApp Business sont à jour pour ajouter quelques nouveautés

31 juillet 2024

tvOS 26.4 introduit une option audio « Continuous Audio Connection » sur Apple TV

17 février 2026

Comment rechercher du texte dans une page web sur Safari iPhone et iPad ?

28 août 2024
Suivez-nous
  • Facebook 15K
  • Twitter
Facebook X (Twitter)
  • À propos
  • Contact
  • Publicité

Nos sites : ShopSystem • App4Phone

Copyright © 2026 AppSystem. Publié depuis 2008.

bannière app store

Apple, le logo Apple, iPod, iTunes et Mac sont des marques d’Apple Inc., déposées aux États-Unis et dans d’autres pays. iPhone et MacBook Air sont des marques déposées d’Apple Inc. MobileMe est une marque de service d’Apple Inc. AppSystem.fr et son App ne sont pas liés à Apple et les marques citées sont la propriété de leurs détenteurs respectifs.

Type above and press Enter to search. Press Esc to cancel.