Изследователи от Google и Университета в Тел Авив представиха GameNGen – иновативна AI система, способна да генерира култовата игра „DOOM“ в реално време, без да използва традиционен игрови двигател.
GameNGen, съкратено от Game Neural Generator (Невронен генератор за игри), е дело на екип, ръководен от Дани Валевски, Янив Левиатан, Моаб Арар и Шломи Фрухтер. В статия, озаглавена „Diffusion models are real-time game engines“, учените доказват, че невронна мрежа може да генерира интерактивен геймплей на играта DOOM с над 20 кадъра в секунда, използвайки само един Tensor Processing Unit (TPU) – специализиран чип за изкуствен интелект, разработен от Google.
This is absolutely insane. A model is generating this game, in real-time, as the user plays.
— Matt Shumer (@mattshumer_) August 28, 2024
Map the progress/trajectory of most other AI modalities onto this, and in a few years, we’ll have AAA-quality games being generated in real time. pic.twitter.com/RQi8396j8u
Системата използва дифузионен модел, който е обучен на базата на множество записи от играта DOOM. Този модел се научава да прогнозира и генерира следващия кадър от играта въз основа на предишните кадри и действията на играча. Това, което отличава GameNGen, е способността да поддържа последователност и консистентност в игровия свят през дълги периоди на игра.
Въпреки че проектът е изключително обещаващ, изследователите признават, че все още има предизвикателства, които трябва да бъдат преодолени. Например, въпреки че GameNGen се представя добре в DOOM, прилагането на технологията към по-сложни съвременни игри би изисквало значително по-голяма изчислителна мощност. Освен това, създаването на генерализиран AI двигател, способен да симулира множество различни игри, остава огромно предизвикателство.
Независимо от настоящите ограничения, технологията на Google загатва за бъдеще, в което игрите биха могли да се генерират динамично и да се адаптират в реално време според действията на играча, водейки до по-персонализирани и непредсказуеми игрови преживявания.
Приложенията на GameNGen и подобни технологии се простират и отвъд гейминга в области като виртуална реалност, автономни превозни средства и хуманоидни роботи. Нещо повече, подобни симулации могат да допринесат за изграждането на AI системи, способни да разбират и оперират в реалния свят, нещо, което много учени вярват, че е необходимо за постигане на изкуствен общ интелект (Artificial General Intelligence – AGI).
Например, Илон Мъск също заяви, че Tesla разполага с подобна технология, но за видео, която най-вероятно се използва в разработката на хуманоидните роботи Optimus и технологията за автономно шофиране.
Tesla can do something similar with real world video
— Elon Musk (@elonmusk) August 28, 2024
OpenAI, от друга страна, описва видео генератора „Sora“ като „основополагащ модел, който може да разбира и симулира реалния свят“ – способност, която според компанията „представлява важна стъпка към постигането на изкуствен общ интелект (AGI)“.
Meta на Марк Зукърбърг също разработва технология, наречена „JEPA“, която според вицепрезидента и главен AI учен, Ян Лекун, „ще позволи на машините да постигнат по-генерализирано разсъждение и планиране.“
Today we’re releasing V-JEPA, a method for teaching machines to understand and model the physical world by watching videos. This work is another important step towards @ylecun’s outlined vision of AI models that use a learned understanding of the world to plan, reason and… pic.twitter.com/5i6uNeFwJp
— AI at Meta (@AIatMeta) February 15, 2024
Друг пример е Nvidia, която наскоро демонстрира как използва очилата за смесена реалност (mixed reality) Apple Vision Pro, за да ускори разработването на хуманоидни роботи.
Може да се каже, че всички големи компании и AI лаборатории работят по подобни видео, игрови или 3D симулации, които според мнозина ще допринесат за изграждането на следващото поколение AI системи, хуманоидни роботи и автономни автомобили.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: