L'ère de l'intelligence artificielle ne cesse de nous étonner par ses capacités croissantes. Récemment, la société Runway, spécialisée dans l'IA, a annoncé que son dernier modèle de conversion de texte en vidéo, baptisé Gen-4.5, générait des images encore plus précises que le modèle précédent. Selon les termes de l'entreprise, le modèle Gen-4.5 peut produire des “résultats cinématiques et hautement réalistes”. Cela suscite certainement une réflexion passionnante, mais préoccupante, sur notre capacité à faire la distinction entre ce qui est réel et ce qui est issu de l'IA.
L'annonce de Runway ne tarit pas d'éloges sur la Gen-4.5, assimilant ses capacités à “une précision physique et visuelle sans précédent”. Un aspect important de ce modèle est son adhérence améliorée aux instructions données. En termes simples, cela signifie qu'il peut créer des scènes très détaillées sans compromettre la qualité vidéo. Selon Runway, la création d'une physique étonnamment réelle n'est plus une chimère ; les objets générés par l'IA “se déplacent désormais avec un poids, un élan et une force réalistes”, ce qui place la barre très haut en ce qui concerne le niveau d'authenticité que l'on peut attendre des visuels générés par l'IA.
En effet, la Gen-4.5 représente un saut technologique, mais son déploiement prend du temps ; le modèle est progressivement mis à la disposition de tous les utilisateurs. Malgré ses capacités éblouissantes, il est important de rappeler que le modèle a ses limites. Par exemple, le modèle peut être confronté à des complications liées à la permanence de l'objet et au raisonnement causal ; il peut y avoir un mélange entre la cause et l'effet, comme une porte qui s'ouvre avant même que quelqu'un ne touche la poignée.
Bien sûr, Runway n'est pas la seule entreprise dans le domaine de l'IA à repousser les limites de ce que les visuels générés par l'IA peuvent faire. OpenAI a également fait des progrès dans ce domaine. En septembre dernier, l'entreprise a dévoilé des améliorations apportées à la physique dans le modèle de conversion de texte en vidéo Sora 2. Les visuels sont si convaincants que vous pourriez même faire un saut périlleux arrière sur un paddleboard sur un plan d'eau dans une vidéo générée par l'IA, avec une dynamique des fluides et une flottabilité précises.
Ce qui distingue Gen-4.5, cependant, c'est qu'il est mieux équipé pour gérer différents styles visuels. Selon Runway, il peut produire des visuels photoréalistes, stylisés et cinématographiques plus cohérents. Le résultat ? Des visuels photoréalistes “ impossibles à distinguer des images réelles, avec des détails et une précision réalistes ”. Cela nous amène à nous demander quelle sera la prochaine étape dans cette incroyable aventure des visuels générés par l'IA.
La technologie de l'IA continue de croître et de se développer à un rythme effréné. La frontière entre la réalité et l'intelligence artificielle devient de plus en plus floue. Personne ne sait ce que l'avenir nous réserve. Pour l'instant, cependant, il est clair que dans le monde des images générées par l'IA, la seule limite est le ciel.
Article original : Lien ici