На тазгодишната конференция Google I/O, технологичният гигант представи редица нови продукти, услуги и амбициозни проекти — и за пореден път изкуственият интелект (AI) беше в центъра на събитията. На конференцията присъстваха водещите фигури на компанията, включително Сундар Пичай, Демис Хасабис и съоснователят Сергей Брин, който заяви, че AI ще бъде „много по-трансформиращ“ от мобилните технологии и дори от самия интернет, а целта на Google е „Gemini да бъде първият AGI (изкуствен общ интелект).“
Ето някои от най-интересните анонси от Google I/O 2025:
Google AI Ultra и Pro: Премиум достъп до върховите AI технологии на Google
Чатботът Gemini, който вече има над 400 милиона активни месечни потребители, получава нов абонаментен план, насочен към най-взискателните професионалисти и AI ентусиасти. Новата премиум услуга, наречена AI Ultra, се предлага на цена от $250 месечно и засега е достъпна само в САЩ.
AI Ultra осигурява по-високи лимити в платформите NotebookLM и Whisk, достъп до Gemini в Chrome, „агентични“ инструменти, задвижвани от Project Mariner, 30 TB място за съхранение в Google Drive, Photos и Gmail, както и включен YouTube Premium. Планът предоставя достъп и до новия експериментален режим Deep Think – разширена функция на Gemini 2.5 Pro, която използва допълнителни изчислителни ресурси за справяне с изключително сложни задачи, изискващи задълбочено логическо разсъждение.
Стандартният план, който е на цена от $20, се запазва, като Google променя името му от Gemini Advanced на Google AI Pro.
Технологичният гигант обяви, че основният модел в Gemini за всички потребители (включително безплатните) ще бъде обновен до Gemini 2.5 Flash – версия, която според Демис Хасабис е „по-добра от предходната в почти всички отношения“.
Освен това, потребителите на безплатната версия на чатбота вече имат достъп до мултимодалните възможности на Gemini Live. Тази функция, която беше представена миналата година, позволява на потребителите да споделят екрана си или да използват камерата на телефона, докато разговарят на живо с Gemini на мобилни устройства (Android и iOS).
See it, solve it: Gemini Live's camera and screen sharing is available for free and it’s rolling out on Android and iOS starting today.#GoogleIO pic.twitter.com/SUSvWGY7F7
— Google Gemini App (@GeminiApp) May 20, 2025
Veo 3: AI видео генерация със синхронизиран звук
В отговор на динамично развиващия се пазар на AI видео генератори, Google представи Veo 3 – своя най-нов и усъвършенстван модел за създаване на кратки видеоклипове. Най-същественото нововъведение при Veo 3 е способността му да генерира видеа с напълно синхронизирано аудио – включително звукови ефекти, фонова музика и дори диалог – което го превръща в цялостно решение за видео продукция.
WE CAN TALK! I spent 2 hours playing with Veo 3 @googledeepmind and it blew my mind now that it can do sound! It can talk, and this is all out of the box… pic.twitter.com/ufplpcZWbq
— Ari K (@arikuschnir) May 20, 2025
От Google подчертават, че Veo 3 създава видеа с „по-високо качество и по-кохерентно движение“ спрямо предходната версия, като дори откриващото видео на самата конференция Google I/O е създадено с него. Моделът е част от новата платформа Flow (виж по-долу), а достъп до неговите възможности вече имат абонатите на AI Ultra чрез приложението Gemini.
Imagen 4: Фотореализъм и прецизност в генерирането на изображения
Технологичният гигант представи нова версия на своя генератор на изображения — Imagen 4, наследник на Imagen 3. Според Google това е „най-качественият ѝ модел досега, отличаващ се с прецизно рендериране на текст, точно следване на инструкции и по-високо визуално качество във всички стилове“. Imagen 4 може да генерира изображения с резолюция до 2K в различни формати и поддържа мултиезични заявки.
Моделът вече е интегриран в чатбота Gemini, приложението Whisk, както и в Google Workspace – включително Slides, Docs и Vids, а разработчиците могат да получат достъп чрез Vertex AI.
Get ready for Imagen 4 🎨 capable of creating richer images, with more nuanced colors, intricate details and superior typography.
— Google DeepMind (@GoogleDeepMind) May 20, 2025
Tap each photo below to see more. 👀 pic.twitter.com/W0vDYu4Z4R
Flow: Приложение за създаване на филми с изкуствен интелект
Google изненада с премиерата на Flow – изцяло ново приложение, предназначено за генериране и редактиране на видео съдържаниее с помощта на изкуствен интелект. Flow интегрира възможностите на Veo 3 (за видео и аудио), Imagen 4 (за статични изображения) и Gemini (за интерпретация на потребителски заявки, сценарии и диалози).
Платформата предлага интуитивен интерфейс с времева линия, инструменти за контрол на камерата (промяна на ъгъла, приближаване) и изграждане на сюжетни линии (scene builder & storyboard), позволявайки дори на потребители без опит да създават късометражни филми.
Flow стартира като предварителен преглед за абонатите на Google AI Pro и AI Ultra в САЩ.
Project Mariner: Автономен уеб агент
Представен за първи път на миналогодишното издание на Google I/O, Project Mariner е експериментален AI агент, който може напълно автономно да навигира и взаимодейства с уебсайтове от името на потребителя. Подобно на системи като Operator на OpenAI и Computer Use на Anthropic, Mariner изпълнява действия като кликване върху бутони, попълване на формуляри и прелистване на страници – всичко това, задействано чрез проста текстова заявка (напр. „купи ми самолетен билет“ или „поръчай тези продукти“).
Първоначалният достъп до Project Mariner ще бъде предоставен ексклузивно на абонатите на плана AI Ultra, като в следващите месеци се очаква и интеграция с Google Search AI Mode, както и достъп за разработчици чрез Gemini API и Vertex AI. В допълнение, уеб версията на Gemini ще получи нов „Agent Mode“, който ще използва възможностите на агента.
Project Mariner – a research prototype
— shubhranshu/ଶୁଭ୍ରାଂଶୁ/शुभ्रांशु (@shubhraaanshu) May 20, 2025
an agent that can interact with the web and get stuff done.
Google I/O 25 update #GoogleIO #googleio2025 #Google pic.twitter.com/0U0Xv0xUIj
Project Astra: Универсален AI асистент
Макар да не беше централен продуктов анонс, Google продължава да развива своя амбициозен проект Astra, който олицетворява визията на компанията за „универсален AI асистент“. Представен за първи път през 2024 г., на I/O 2025 стана ясно, че Astra еволюира към по-агентен изкуствен интелект, способен не само да разбира мултимодален контекст (чрез камера и други сензори), но и проактивно да предлага помощ или да изпълнява задачи от името на потребителя. Astra остава експериментален проект и „тестова площадка“ за най-новите AI възможности, като демонстрира визията на Google за бъдещето на асистентите – по-автономни, разговорни и контекстуално осъзнати.
AI инструменти за разработчици: Stitch и Jules
Google обяви и редица нови инструменти, насочени към разработчици, сред които Stitch – нов генеративен AI инструмент за UI/UX дизайн, достъпен експериментално в Google Labs. Захранван от Gemini 2.5 Pro, Stitch позволява на разработчици и дизайнери бързо да превръщат идеи – текстови описания или ръчно нарисувани скици – във функционални интерфейси, генерирайки както визуалния дизайн, така и съответния фронтенд код (HTML/CSS, Flutter), с възможност за персонализиране на теми и стилове.
Meet Stitch by @GoogleLabs, the easiest and fastest product to generate great designs and UIs. 🧵https://t.co/xYj6Gyi5NS pic.twitter.com/zdmtl3okH5
— Stitch by Google (@stitchbygoogle) May 20, 2025
Jules, от друга страна, е AI агент за програмиране (подобен на Codex на OpenAI), който може автономно да намира бъгове, да пише функции, да управлява промени в кодовата база и да създава pull request-и, като предоставя и аудио резюмета на направените промени (мини подкаст). Jules е в публична бета версия чрез Google Labs и е безплатен за тестване.
AI Mode и Overviews в Google Search: Разговорно търсене и визуални иновации
По време на Google I/O технологичният гигант обяви, че AI Mode в търсачката Google — доскоро част от експерименталната програма Search Labs под името Search Generative Experience (SGE) — започва да се разгръща масово за всички потребители в САЩ. AI Mode се появява като отделен таб в търсачката и предлага обобщени отговори (AI Overviews), както и възможност за задаване на последващи въпроси в разговорен стил – подобно на AI търсачката Perplexity.
AI mode in Google Search is starting to roll out to all users in the US today : )
— Logan Kilpatrick (@OfficialLoganK) May 20, 2025
It's the search experience you know, reimagined for the AI era (including a new feature called "Deep Search")! pic.twitter.com/5njwWJWGD6
AI Overviews също се разширяват глобално и вече са достъпни в над 200 държави, включително и в България.
От Google също така представиха нови експериментални функционалности, сред които „Search Live“ – възможност за задаване на въпроси чрез видео от камерата на телефона в реално време, която комбинира Google Lens с Gemini, както и „try it on“ – опция за виртуално пробване на облекла чрез качване на снимка на потребителя.
Google's new AI "Try On" feature pic.twitter.com/KYZfue3Poh
— Marques Brownlee (@MKBHD) May 20, 2025
AI в Workspace: Gmail, Docs, Vids и Meet стават по-интелигентни
Приложенията на Google Workspace също получават значителни AI подобрения. Gmail вече ще предлага персонализирани отговори, които черпят контекст от имейли и файлове в Google Drive и се адаптират към стила на писане на потребителя. Ще бъде добавена и нова функция за почистване на пощата чрез команди на естествен език, както и AI помощник за насрочване на срещи. Тези функционалности се очаква да станат общодостъпни „след няколко месеца“ (вероятно през третото тримесечие на 2025 г.).
Google Docs, от своя страна, вече позволява генериране на съдържание, базирано изцяло на конкретни източници – потребителите могат да прикачат презентации, таблици или документи, като AI ще използва само тях при създаване на текст.
Google Vids, сравнително новото приложение за създаване на видео в Workspace, ще получи възможност за автоматично конвертиране на Slides в видеа със сценарии, AI аватари за презентации, както и инструменти за автоматично изрязване на транскрипции (напр. за премахване на „ъм“, „ах“).
Google Meet пък получава превод на реч в реално време, който запазва гласа, интонацията и емоционалния израз на говорещия – функцията е в бета версия за абонатите на AI Pro и Ultra и засега поддържа само испански и английски език. Допълнителни езици, включително италиански, немски и португалски, ще бъдат добавени „в следващите седмици“, а функцията ще стане достъпна за корпоративни клиенти и потребители на Workspace „по-късно тази година“.
Gemini Diffusion: Дифузионен езиков модел от ново поколение
По време на Google I/O 2025 една от най-революционните, но слабо отразени новини беше представянето на Gemini Diffusion – експериментален езиков модел, който не генерира текст дума по дума (или токен по токен), а използва техники, заимствани от генераторите на изображения. Вместо линейно предсказване, моделът започва от шум и постепенно го „очиства“, за да формира цели пасажи – подход, който позволява значително по-бърза генерация (над 2 000 токена в секунда). Според DeepMind това е първият дифузионен LLM, който постига резултати, съпоставими с тези на традиционните модели, а в някои бенчмаркове дори ги надминава. Към момента Gemini Diffusion е наличен само като експериментална демо версия.
🚀Meet Gemini Diffusion, our first diffusion-based and super fast language model, just announced at Google I/O!🚀
— Ivana Balazevic (@ibalazevic) May 20, 2025
Very excited to be able to share what I've been working on for the past little while with our amazing small team @GoogleDeepMind. https://t.co/9JmZvSv8pA pic.twitter.com/Uw11UvoasK
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: