Китайският технологичният гигант ByteDance, собственик на популярната платформа TikTok, демонстрира нова AI система, наречена „OmniHuman-1″, която поставя нови стандарти в генерирането на реалистични „deepfake“ видеа. Технологията е способна да създава изключително убедителни видеоклипове, използвайки само една референтна снимка и аудио запис.
Системата е обучена върху 19 000 часа видео и може да генерира клипове във всякакви пропорции – от близки портретни кадри до видеа на цяло тяло, като същевременно поддържа високо ниво на реализъм при движенията на устните, жестовете и израженията.
В демонстрационните материали ByteDance показа впечатляващи примери, включително несъществуващи TED презентации, фалшиви изпълнения на Селин Дион и Тейлър Суифт, както и лекция на Алберт Айнщайн
Китайските учени посочват, че системата демонстрира забележителна гъвкавост, генерирайки не само реалистични видеа на хора, но и на анимационни герои, хуманоидни фигури и дори успява да „съживи“ неодушевени обекти.
За момента OmniHuman-1 остава в сферата на научните разработки, без конкретни планове за търговска реализация. Въпреки това технологията може да намери приложение в някой от AI продуктите на ByteDance. Компанията работи по множество AI услуги, включително популярния китайски чатбот „Doubao“, генератора на видео съдържание „Jimeng“ и приложението за редактиране на видео „CapCut“, което разполага с редица AI функции.
В края на януари Reuters съобщи, че китайският технологичен гигант е заделил над 150 милиарда юана (20.64 милиарда долара) за капиталови разходи през тази година, като голяма част от тях ще бъдат насочени към развитието на изкуствен интелект.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: