AI Bulgaria

Google DeepMind представи нова технология за генериране на аудио към видео

V2A
Image: Created with Ideogram

DeepMind, лабораторията за изкуствен интелект на Google, представи V2A (Video-to-Audio), нова впечатляваща технология, която може автоматично да генерира реалистични звуци, включително музика, звукови ефекти и диалози за видеоклипове без звук.

Моделите за генериране на видео се развиват с невероятни темпове, но повечето от тях създават видеоклипове без звук. Именно това е и проблемът, който учените от DeepMind искат да решат.

V2A може да генерира аудио за всякакъв вид видео, от традиционни видеоматериали като исторически кадри или неми филми до такива, генерирани от изкуствен интелект. Технологията може да се използва в комбинация с видео генератори като Veo на DeepMind или тези от конкурентите като Sora, KLING, Dream Machine или Gen 3 за добавяне на драматична музика, реалистични звукови ефекти или диалози.

*Примерите са генерирани с Veo, моделът за генериране на видео на DeepMind, а аудиото от V2A.

Важно е да отбележим, че технологията все още не е публично достъпна. От DeepMind планират да съберат обратна връзка от „водещи артисти и филмови дейци, за да гарантират положителното й въздействие върху творческата общност”. Освен това моделът ще бъде подложен на строги тестове за безопасност, за да се предотвратят евентуални злоупотреби, посочват от компанията.

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Остави коментар


The reCAPTCHA verification period has expired. Please reload the page.

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: