Era sztucznej inteligencji wciąż zadziwia nas swoimi rosnącymi możliwościami. Niedawno firma Runway zajmująca się sztuczną inteligencją ogłosiła, że jej najnowszy model tekst-do-wideo, nazwany Gen-4.5, generuje jeszcze dokładniejsze obrazy niż poprzedni model. Według jej przedstawicieli model Gen-4.5 może tworzyć “kinowe i bardzo realistyczne efekty”. To z pewnością budzi ekscytujące, ale i niepokojące myśli na temat naszej zdolności do odróżniania tego, co prawdziwe, od tego, co zostało stworzone przez sztuczną inteligencję.
W ogłoszeniu firmy Runway model Gen-4.5 został bardzo pochwalony, a jego możliwości porównano do “niespotykanej dotąd dokładności fizycznej i precyzji wizualnej”. Istotnym aspektem tego modelu jest jego lepsza zgodność z podanymi wskazówkami. Mówiąc prościej, oznacza to, że może on tworzyć bardzo szczegółowe sceny bez utraty jakości wideo. Według Runway tworzenie zadziwiająco realistycznej fizyki nie jest już mrzonką; obiekty generowane przez sztuczną inteligencję “poruszają się teraz z realistyczną masą, pędem i siłą”, wyznaczając nowy poziom autentyczności, jakiego możemy oczekiwać od obrazów generowanych przez sztuczną inteligencję.
Rzeczywiście, Gen-4.5 stanowi technologiczny skok, ale właściwe wdrożenie wymaga czasu; model jest stopniowo udostępniany wszystkim użytkownikom. Pomimo swoich olśniewających możliwości, należy pamiętać, że model ma swoje ograniczenia. Na przykład model może napotykać komplikacje związane z trwałością obiektów i rozumowaniem przyczynowym; może dochodzić do pomylenia przyczyny i skutku, np. drzwi otwierają się, zanim ktoś dotknie klamki.
Oczywiście Runway nie jest jedyną firmą w branży AI, która przesuwa granice możliwości generowanych przez sztuczną inteligencję obrazów. OpenAI również robi postępy w tej dziedzinie. We wrześniu ubiegłego roku firma ujawniła ulepszenia fizyki w modelu tekst-wideo Sora 2. Obrazy są tak przekonujące, że w filmie wygenerowanym przez sztuczną inteligencję można nawet wykonać salto w tył na desce SUP na wodzie, z dokładną dynamiką płynów i wypornością.
Jednak tym, co wyróżnia Gen-4.5, jest to, że jest lepiej przystosowany do obsługi różnych stylów wizualnych. Według Runway może on tworzyć bardziej spójne, fotorealistyczne, stylizowane i kinowe efekty wizualne. Efekt? Fotorealistyczne efekty wizualne, które “nie różnią się od rzeczywistych ujęć, charakteryzujące się realistycznymi szczegółami i dokładnością”. To sprawia, że zastanawiamy się, co będzie dalej w tej niesamowitej podróży po świecie efektów wizualnych generowanych przez sztuczną inteligencję?
Technologia sztucznej inteligencji rozwija się w zadziwiającym tempie. Wraz z jej rozwojem granica między rzeczywistością a sztuczną inteligencją staje się coraz bardziej płynna. Nikt nie wie, co przyniesie przyszłość. Na razie jednak jasne jest, że w świecie obrazów generowanych przez sztuczną inteligencję jedynym ograniczeniem jest wyobraźnia.
Oryginalny artykuł: Link tutaj