Google обнови AI Studio с нови инструменти за генериране на съдържание

Google тихомълком обнови своето уеб приложение AI Studio, добавяйки нов раздел – „Generate Media“ – който предоставя безплатен достъп до най-новите генеративни модели на компанията за видео, изображения и мултимодално съдържание.

Новата секция включва две системи: Imagen 3 за генериране на изображения и Veo 2 за създаване на видео, като потребителите могат да използват и модели като Gemini 2.0 Flash, Gemini 2.5 Pro и Gemma 3 за обработка на различни видове данни. Google предлага ограничен брой безплатни генерации на ден за някои от тях, като лимитите могат да варират в зависимост от текущите условия на платформата.

За да използвате визуалните модели, просто трябва да отидете на „Generate Media“ в лявата лента на менюто, да изберете Imagen или Veo, да въведете кратко текстово описание (prompt) или да качите референтно изображение, да зададете желаните параметри и да стартирате процеса. Платформата предлага и готови примери, които може да използвате като шаблон или вдъхновение.

Видео създадено в Google AI Studio / Prompt: Slow, smooth push-in shot moving through open balcony doors. Sheer white curtains billow dramatically inwards, caught by the warm evening breeze. Beyond the balcony, the entire village of Positano cascades down the cliffside, bathed in the rich, magical golden light of the setting sun. Pastel houses glow warmly, shadows lengthen, and the sea glitters with gold reflections.

Новите модели се присъединяват към разширяващата се екосистема от инструменти в AI Studio. Освен достъп до експериментални модели, платформата поддържа стрийминг сесии в реално време, при които потребителите могат да споделят екрана си и да разговарят с Gemini чрез текст или аудио. Разработчиците пък могат да изграждат собствени приложения чрез API услугите на Google.

Друга полезна функция в платформата е възможността за анализ на видеосъдържание. Потребителите трябва просто да качат файл или да поставят линк към YouTube видео – и да зададат въпроси относно съдържанието му. Тази функционалност използва мултимодалните възможности на Gemini, като системата може да транскрибира, обобщава или превежда каченото съдържание.

Introducing YouTube video 🎥 link support in Google AI Studio and the Gemini API. You can now directly pass in a YouTube video and the model can usage its native video understanding capabilities to use that, with just a link! 🚢 pic.twitter.com/4jeNVmWtgx
— Logan Kilpatrick (@OfficialLoganK) March 12, 2025

Моделите на Google са изключително ефективни и при работа с големи обеми данни, благодарение на своя контекстен прозорец от 1 милион токена (~750 000 думи). Така например можете да качите PDF документи, видеоклипове, аудиозаписи или текстови файлове, които Gemini да анализира в дълбочина.

Актуализацията на AI Studio идва броени дни преди годишната конференция Google I/O 2025, на която се очаква компанията да представи нови агентни системи и модели, включително обновени версии на Gemini, Veo и Imagen, допълнителни абонаментни планове за чатбота Gemini, напредък по проектите Astra и Mariner, както и анонси, свързани с Search, NotebookLM, Android и други платформи.

Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!

Остави коментар

Споделете:

Like this:

Luma AI представи Ray3 – „разсъждаващ“ видео

AI системите на OpenAI и Google завоюваха

Най-големите холивудски студиа заведоха дело срещу китайската

Сам Алтман: ChatGPT ще защитава децата, но

Абонирайте се за нашите седмични бюлетини