Google представи „Gemini 2.0“ – своето следващо поколение модели на изкуствен интелект, които според компанията са разработени, за да отговорят на предизвикателствата и нуждите на „ерата на агентите“. Те позволяват „създаването на нов вид мултимодални AI агенти, които могат да виждат, мислят, планират, помнят и предприемат действия”.
Първият модел от серията – „Gemini 2.0 Flash“ – е вече достъпен като експериментална версия за разработчици и потребители по целия свят. Моделът надминава предшественика си Gemini 1.5 Pro в почти всички сравнителни тестове, като същевременно работи два пъти по-бързо. Освен това за разлика от предишните версии, Gemini 2.0 Flash може да генерира изображения и аудио съдържание, както и да използва инструменти като Google Search и функции на трети страни.
Welcome to the world, Gemini 2.0 ✨ our most capable AI model yet.
— Google DeepMind (@GoogleDeepMind) December 11, 2024
We're first releasing an experimental version of 2.0 Flash ⚡ It has better performance, new multimodal output, @Google tool use – and paves the way for new agentic experiences. 🧵 https://t.co/ywY2oZv76p pic.twitter.com/1Wgcr3m2Ip
Потребителите вече могат да изпробват чат версията на Gemini 2.0 Flash чрез уеб платформата на Gemini, като моделът скоро ще бъде интегриран и в мобилното приложение. Google също така планира да внедри технологията в цялата си екосистема, включително Google Search, Workspace и други продукти.
Разработчиците могат да получат достъп до експерименталната версия на Gemini 2.0 Flash чрез Google AI Studio и Vertex AI.
Успоредно с пускането на Gemini 2.0 Flash, Google представи два нови експериментални прототипа – „Project Mariner” и „Jules”, които демонстрират агентните възможности на модела.
Project Mariner е експериментално разширение за Chrome, предназначено за автономно изпълнение на уеб базирани задачи. Jules, от друга страна, е специализиран AI агент за програмисти, който подпомага за откриването и отстраняването на грешки в кода.
Introducing Project Mariner: an agent that helps you accomplish complex tasks in your browser 💻✨It’s a research prototype built with Gemini 2.0. Learn more: https://t.co/zWHTUydifK pic.twitter.com/eySyZiBjiT
— labs.google (@labsdotgoogle) December 11, 2024
Google също така демонстрира възможностите на Gemini 2.0 в представения по време на тазгодишната конференция I/O “Project Astra”, който компанията описва като „универсален агент, разбиращ и реагиращ на света по същия начин, както ние, хората“. Project Astra може да работи през камерата на телефона или през специални очила, като разпознава обекти и отговаря на въпроси за заобикалящата среда.
Благодарение на новия модел Project Astra вече има способността да общува на множество езици и дори притежава краткосрочна памет. Освен това “може да използва Google Search, Lens и Maps, което го прави още по-полезен асистент в ежедневието”, споделят от компанията.
Споделете: