Google тихомълком обнови своето уеб приложение AI Studio, добавяйки нов раздел – „Generate Media“ – който предоставя безплатен достъп до най-новите генеративни модели на компанията за видео, изображения и мултимодално съдържание.
Новата секция включва две системи: Imagen 3 за генериране на изображения и Veo 2 за създаване на видео, като потребителите могат да използват и модели като Gemini 2.0 Flash, Gemini 2.5 Pro и Gemma 3 за обработка на различни видове данни. Google предлага ограничен брой безплатни генерации на ден за някои от тях, като лимитите могат да варират в зависимост от текущите условия на платформата.

За да използвате визуалните модели, просто трябва да отидете на „Generate Media“ в лявата лента на менюто, да изберете Imagen или Veo, да въведете кратко текстово описание (prompt) или да качите референтно изображение, да зададете желаните параметри и да стартирате процеса. Платформата предлага и готови примери, които може да използвате като шаблон или вдъхновение.

Новите модели се присъединяват към разширяващата се екосистема от инструменти в AI Studio. Освен достъп до експериментални модели, платформата поддържа стрийминг сесии в реално време, при които потребителите могат да споделят екрана си и да разговарят с Gemini чрез текст или аудио. Разработчиците пък могат да изграждат собствени приложения чрез API услугите на Google.
Друга полезна функция в платформата е възможността за анализ на видеосъдържание. Потребителите трябва просто да качат файл или да поставят линк към YouTube видео – и да зададат въпроси относно съдържанието му. Тази функционалност използва мултимодалните възможности на Gemini, като системата може да транскрибира, обобщава или превежда каченото съдържание.
Introducing YouTube video 🎥 link support in Google AI Studio and the Gemini API. You can now directly pass in a YouTube video and the model can usage its native video understanding capabilities to use that, with just a link! 🚢 pic.twitter.com/4jeNVmWtgx
— Logan Kilpatrick (@OfficialLoganK) March 12, 2025
Моделите на Google са изключително ефективни и при работа с големи обеми данни, благодарение на своя контекстен прозорец от 1 милион токена (~750 000 думи). Така например можете да качите PDF документи, видеоклипове, аудиозаписи или текстови файлове, които Gemini да анализира в дълбочина.
Актуализацията на AI Studio идва броени дни преди годишната конференция Google I/O 2025, на която се очаква компанията да представи нови агентни системи и модели, включително обновени версии на Gemini, Veo и Imagen, допълнителни абонаментни планове за чатбота Gemini, напредък по проектите Astra и Mariner, както и анонси, свързани с Search, NotebookLM, Android и други платформи.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: