Google DeepMind представи Genie 3 – новата версия на своя „световен модел“, който може да генерира „безпрецедентно разнообразие от интерактивни 3D светове“. Според лабораторията технологията обещава „неограничен брой симулации за обучение на AI агенти и роботи“ и представлява „ключова стъпка“ към създаването на истински генерален изкуствен интелект (AGI).
Така наречените „световни модели“ са сравнително нова парадигма в областта на изкуствения интелект, при която системите изграждат вътрешно разбиране за света, за да могат да го симулират – да предвиждат как ще се променя във времето и как действията на даден потребител или агент ще му повлияят. Тази технология стои и в основата на това, което учените от DeepMind наричат „Ерата на опита“ – следващия голям етап в развитието на изкуствения интелект, който, по думите им, „ще отключи свръхчовешки способности у машините“.
Все още недостъпен за широката публика, Genie 3 е базиран на технологии, заложени както в предходните версии, така и във видео модели като Veo 3, за който компанията твърди, че притежава „дълбоко разбиране за физиката“.
„Genie 3 е първият ни модел, който позволява взаимодействие в реално време, като същевременно подобрява последователността и реализма в сравнение с Genie 2″, обясняват от лабораторията, като добавят, че системата „генерира всеки кадър в отговор на действията на потребителя“.
Моделът поддържа логическа последователност в рамките на няколко минути, като „визуалната му памет“ се простира до 60 секунди назад. Това означава, че ако потребителят се върне на определено място след минута, Genie 3 ще помни точно как е изглеждало то – включително промените, които са настъпили. Тази способност е критично важна за обучението на AI агенти и създаване на наистина потапящи преживявания, отбелязват от DeepMind.
Особено интригуваща е функцията за „програмируеми световни събития“, която позволява на потребителите да променят генерирания свят чрез текстови команди. Например, може да накарате слънцето да залезе, да предизвикате буря или, както показва една от демонстрациите, да отворите магически портал. Възможностите са неограничени.
Истинската цел на Genie 3 обаче се разкрива едва когато бъде комбиниран със SIMA – „генерален AI агент за 3D виртуални среди“, който лабораторията представи миналата година. Това е динамика, която изпълнителният директор на DeepMind Демис Хасабис описа в скорошно интервю с думите: „Буквално имаш един изкуствен интелект, който живее в съзнанието на друг.“ Докато Genie 3 генерира света, SIMA го обитава – движи се, изследва, изпълнява задачи. Практическите импликации от този подход са дълбоки, твърди Хасабис. „Много по-трудно се събират данни в реалния свят – много по-скъпо, много по-бавно, например данни за роботика“, обяснява той. „Но в симулирани светове можете да съберете почти неограничено количество.“
DeepMind също така проучва как огромният географски архив на Google – от Maps и Street View до Google Earth – може да бъде използван за усъвършенстване на тези световни модели. Според компанията потенциалните приложения надхвърлят роботиката и изкуствения интелект, и могат да революционизират начина, по който се създават видеоигри, филми, виртуална реалност и други форми на интерактивно съдържание „Това е нещо като холодека от Стар Трек“, казва Хасабис, „където можете просто да си представите всякакъв свят, системата ще го генерира за вас и след това можете да се потопите в него.“
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: