Runway dévoile une IA de conversion texte-vidéo d'une précision ‘ sans précédent ’

L'ère de l'intelligence artificielle continue de nous étonner par ses capacités toujours plus grandes. Récemment, la société d'IA Runway a annoncé que son dernier modèle de conversion de texte en vidéo, baptisé Gen-4.5, génère des images encore plus précises que le modèle précédent. Selon ses propres termes, le modèle Gen-4.5 peut produire “ des résultats cinématographiques et très réalistes ”. Cela suscite certainement une réflexion passionnante, mais inquiétante, sur notre capacité à distinguer ce qui est réel de ce qui est généré par l'IA.

L'annonce de Runway fait l'éloge de Gen-4.5, comparant ses capacités à “ une précision physique et visuelle sans précédent ”. L'un des aspects importants de ce modèle est son amélioration en matière de respect des consignes données. En termes simples, cela signifie qu'il peut créer des scènes très détaillées sans compromettre la qualité vidéo. Selon Runway, la création d'une physique d'un réalisme époustouflant n'est plus un rêve inaccessible ; les objets générés par l'IA “ se déplacent désormais avec un poids, une impulsion et une force réalistes ”, établissant ainsi une nouvelle référence en matière d'authenticité que l'on peut attendre des visuels générés par l'IA.

En effet, Gen-4.5 représente un bond technologique, mais son déploiement correct prend du temps ; le modèle est progressivement mis à la disposition de tous les utilisateurs. Malgré ses capacités impressionnantes, il est important de garder à l'esprit que le modèle a ses limites. Par exemple, le modèle peut rencontrer des complications liées à la permanence des objets et au raisonnement causal ; il peut y avoir une confusion entre la cause et l'effet, comme une porte qui s'ouvre avant même que quelqu'un ne touche la poignée.

Bien sûr, Runway n'est pas la seule entreprise dans le domaine de l'IA à repousser les limites de ce que les visuels générés par l'IA peuvent faire. OpenAI a également fait des progrès dans ce domaine. En septembre dernier, l'entreprise a dévoilé des améliorations apportées à la physique dans le modèle de conversion de texte en vidéo Sora 2. Les visuels sont si convaincants que vous pourriez même faire un saut périlleux arrière sur un paddleboard sur un plan d'eau dans une vidéo générée par l'IA, avec une dynamique des fluides et une flottabilité précises.

Ce qui distingue Gen-4.5, cependant, c'est qu'il est mieux équipé pour gérer différents styles visuels. Selon Runway, il peut produire des visuels photoréalistes, stylisés et cinématographiques plus cohérents. Le résultat ? Des visuels photoréalistes “ impossibles à distinguer des images réelles, avec des détails et une précision réalistes ”. Cela nous amène à nous demander quelle sera la prochaine étape dans cette incroyable aventure des visuels générés par l'IA.

La technologie de l'IA continue de croître et de se développer à un rythme effréné. À mesure qu'elle progresse, la frontière entre réalité et intelligence artificielle devient de plus en plus floue. Nul ne sait ce que l'avenir nous réserve. Pour l'instant, cependant, il est clair que dans le monde des images générées par l'IA, la seule limite est le ciel.

Article original : Lien ici

Vous aimerez peut-être aussi

Porozmawiaj z ALIA

ALIA