Runway przedstawia sztuczną inteligencję zamieniającą tekst na wideo z 'niespotykaną dotąd' dokładnością

Era sztucznej inteligencji nie przestaje nas zadziwiać swoimi rosnącymi możliwościami. W ostatnich wiadomościach firma Runway zajmująca się sztuczną inteligencją ogłosiła, że ich najnowszy model tekst-wideo, nazwany Gen-4.5, generuje jeszcze dokładniejsze efekty wizualne niż poprzedni model. Według ich słów, model Gen-4.5 może generować “kinowe i bardzo realistyczne efekty”. To z pewnością wywołuje ekscytującą, ale niepokojącą myśl o naszej zdolności do rozróżnienia między tym, co prawdziwe, a tym, co pochodzi od sztucznej inteligencji.

Ogłoszenie od Runway daje Gen-4.5 sporo pochwał, utożsamiając jego możliwości z “bezprecedensową fizyczną dokładnością i wizualną precyzją”. Istotnym aspektem tego modelu jest jego lepsze przestrzeganie podanych wskazówek. Mówiąc prościej, oznacza to, że może tworzyć bardzo szczegółowe sceny bez uszczerbku dla jakości wideo. Według Runway, tworzenie oszałamiająco realistycznej fizyki nie jest już mrzonką; obiekty generowane przez AI “poruszają się teraz z realistyczną wagą, pędem i siłą”, ustanawiając nową poprzeczkę w poziomie autentyczności, jakiego możemy oczekiwać od wizualizacji generowanych przez AI.

Rzeczywiście, Gen-4.5 stanowi skok technologiczny, ale odpowiednie wdrożenie wymaga czasu; model jest stopniowo udostępniany wszystkim użytkownikom. Pomimo jego olśniewających możliwości, ważne jest, aby pamiętać, że model ma swoje ograniczenia. Na przykład, model może napotkać komplikacje związane z trwałością obiektów i rozumowaniem przyczynowo-skutkowym; może wystąpić chaos między przyczyną a skutkiem, na przykład drzwi otwierają się, zanim ktoś nawet dotknie klamki.

Oczywiście Runway nie jest jedyną firmą w branży AI, która przesuwa granice możliwości generowanych przez sztuczną inteligencję obrazów. OpenAI również robi postępy w tej dziedzinie. We wrześniu ubiegłego roku firma ujawniła ulepszenia fizyki w modelu tekst-wideo Sora 2. Obrazy są tak przekonujące, że w filmie wygenerowanym przez sztuczną inteligencję można nawet wykonać salto w tył na desce SUP na wodzie, z dokładną dynamiką płynów i wypornością.

Jednak tym, co wyróżnia Gen-4.5, jest to, że jest lepiej przystosowany do obsługi różnych stylów wizualnych. Według Runway może on tworzyć bardziej spójne, fotorealistyczne, stylizowane i kinowe efekty wizualne. Efekt? Fotorealistyczne efekty wizualne, które “nie różnią się od rzeczywistych ujęć, charakteryzujące się realistycznymi szczegółami i dokładnością”. To sprawia, że zastanawiamy się, co będzie dalej w tej niesamowitej podróży po świecie efektów wizualnych generowanych przez sztuczną inteligencję?

Technologia sztucznej inteligencji wciąż rośnie i rozwija się w zdumiewającym tempie. Granica między rzeczywistością a sztuczną inteligencją coraz bardziej się zaciera. Nikt nie wie, co przyniesie przyszłość. Na razie jednak jasne jest, że w świecie wizualizacji generowanych przez sztuczną inteligencję jedynym ograniczeniem jest niebo.

Oryginalny artykuł: Link tutaj