Close Menu
AppSystemAppSystem
  • Astuces
  • Tutoriels
  • Boutique
    • Coques
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Verres trempés
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Accessoires
  • iPhone 15
  • Jailbreak
  • Bons Plans
  • Fonds d’écran
  • Accessoires
  • À propos
  • Contact
  • Publicité
Facebook X (Twitter)
  • iPhone 15
  • Jailbreak
  • Bons Plans
  • Fonds d’écran
  • Accessoires
Facebook X (Twitter)
AppSystemAppSystem
  • Astuces
  • Tutoriels
  • Boutique
    • Coques
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Verres trempés
      • iPhone 16
      • iPhone 15
      • iPhone 14
      • iPhone 13
      • iPhone 12
      • iPhone 11
      • iPhone XR
      • iPhone X(S)
      • iPhone SE
      • iPhone 8
    • Accessoires
AppSystemAppSystem
Actualité

Essayez le modèle de sous-titrage vidéo ultrarapide d’Apple directement dans votre navigateur

Léon GalarneauBy Léon Galarneau1 septembre 2025Aucun commentaire3 Mins Read
WhatsApp Email Facebook Twitter Pinterest Telegram

Il y a quelques mois, Apple a lancé FastVLM, un modèle de langage visuel qui offrait un traitement d’image haute résolution quasiment instantané. Désormais, vous pouvez l’essayer, à condition de disposer d’un Mac équipé d’une puce Apple Silicon. Voici comment procéder.

Lorsque nous avons présenté FastVLM, nous avions expliqué qu’il utilisait MLX, le cadre propriétaire d’Apple, spécifiquement conçu pour les puces Apple Silicon. Cela lui permettait de sous-titrer des vidéos jusqu’à 85 fois plus rapidement tout en étant plus de trois fois plus petit que des modèles comparables.

Depuis, Apple a poursuivi ses travaux sur ce projet, qui peut maintenant être trouvé sur Hugging Face, et pas seulement sur GitHub. Sur Hugging Face, vous pouvez charger la version allégée, FastVLM-0.5B, directement dans votre navigateur et l’essayer par vous-même.

En fonction de votre matériel, le chargement peut prendre un peu de temps. Il m’a fallu quelques minutes sur mon MacBook Pro M2 Pro avec 16 Go de RAM. Mais une fois chargé, le modèle a commencé à décrire avec précision mon apparence, la pièce derrière moi, différentes expressions et les objets que je mettais en vue.

Dans le coin inférieur gauche, vous pouvez ajuster l’invite que le modèle prendra en compte lors de l’actualisation en direct du sous-titrage, ou vous pouvez choisir parmi quelques suggestions telles que :

  • Décrivez ce que vous voyez en une phrase.
  • Quelle est la couleur de mon t-shirt ?
  • Identifiez tout texte ou contenu écrit visible.
  • Quelles émotions ou actions sont représentées ?
  • Nommez l’objet que je tiens dans ma main.

S’il vous vient l’envie de pousser l’expérience plus loin, vous pouvez essayer d’utiliser une application de caméra virtuelle pour alimenter l’outil en vidéo et le regarder décrire instantanément plusieurs scènes en détail, au point de rendre difficile la compréhension de ce qui se passe. Bien entendu, le cas d’utilisation réel serait différent, mais cela souligne à quel point le modèle peut être rapide et précis.

Cet essai est d’autant plus intéressant qu’il fonctionne localement sur le navigateur, ce qui signifie qu’aucune donnée ne quitte l’appareil, et qu’il peut même fonctionner hors ligne. Cela pourrait bien sûr être un cas d’utilisation formidable pour les appareils portables et la technologie d’assistance, où la légèreté et la faible latence seront primordiales pour débloquer de meilleurs cas d’utilisation.

Il est à noter que la démonstration tourne sur le modèle plus léger de 0,5 milliard de paramètres, tandis que la famille FastVLM inclut également des variantes plus grandes et plus puissantes avec 1,5 milliard et 7 milliards de paramètres. Avec des modèles plus grands, la performance et la vitesse pourraient s’améliorer encore, bien que le faire directement sur le navigateur soit probablement à éviter.

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Previous ArticleApple bientôt roi des lunettes intelligentes ?
Next Article Un retour nostalgique sur les débuts du Mac avec une bibliothèque de livres de programmation
Léon Galarneau

Rédacteur occasionnel sur AppSystem, je cultive une réelle passion pour les mangas, le tennis et l'univers Apple.

Related Posts

Après les résultats du T2 2026, l’action Apple progresse légèrement hors séance

1 mai 2026

Apple accélère sur l’IA et signe un record historique de dépenses en R&D

1 mai 2026

Apple réclame le remboursement de droits de douane et promet de réinvestir aux États-Unis

1 mai 2026
Leave A Reply Cancel Reply

coque iphone la plus fine du monde

Top 3

Comment écouter la traduction d’une conversation grâce aux AirPods avec iOS 26.2

28 janvier 2026

Apple Watch Ultra 4 : quatre pistes crédibles pour la cuvée de septembre

3 avril 2026

WhatsApp et WhatsApp Business sont à jour pour ajouter quelques nouveautés

31 juillet 2024
Suivez-nous
  • Facebook 15K
  • Twitter
Facebook X (Twitter)
  • À propos
  • Contact
  • Publicité

Nos sites : ShopSystem • App4Phone

Copyright © 2026 AppSystem. Publié depuis 2008.

bannière app store

Apple, le logo Apple, iPod, iTunes et Mac sont des marques d’Apple Inc., déposées aux États-Unis et dans d’autres pays. iPhone et MacBook Air sont des marques déposées d’Apple Inc. MobileMe est une marque de service d’Apple Inc. AppSystem.fr et son App ne sont pas liés à Apple et les marques citées sont la propriété de leurs détenteurs respectifs.

Type above and press Enter to search. Press Esc to cancel.