AI Bulgaria AI Bulgaria

Всичко най-интересно от конференцията Google I/O 2024

Google I/O
Image: Google

Тази година, по време на конференция за разработчици Google I/O 2024, технологичният гигант представи множество интересни продукти и услуги, като централно място зае изкуственият интелект (AI).

Gemini 1.5 Pro с 1 милион токена вече и в България

От днес платената версия на чатбота Gemini (Gemini Advanced) използва текущия най-добър модел на Google – Gemini 1.5 Pro, който има контекстен прозорец от 1 милион токена (около 700 000 думи) .

Gemini Advanced вече се предлага в над 150 държави (включително България) и поддържа над 35 езика, в това число и български, а от Google предлагат двумесечен безплатен пробен период за новорегистрирани потребители.

Project Astra

Може би най-интересният анонс от тазгодишната конференция I/O и директен отговор на Google по отношение на новия асистент на OpenAI, е Project Astra.

Google DeepMind го описва като „универсален агент, който разбира и реагира на света по същия начин като нас, хората“.

Project Astra е AI асистент, създаден да вижда света през „очите“ на вашия телефон или смарт очила, използвайки камера и гласово разпознаване, за да предоставя контекстуални отговори в реално време.

Някои от възможностите на Project Astra, като например разбирането на видео, ще се появят в продукти на Google, като приложението Gemini, по-късно тази година, съобщи компанията в блог пост.

Google Veo

В началото на годината OpenAI показа Sora, своя AI видео модел, който предизвика истински фурор. В отговор на това, по време на Google I/O, технологичният гигант представи Veo – модел за генериране на видеоклипове от текст, изображения или видео, разработен от Google DeepMind.

Veo може да генерира висококачествени видеоклипове с резолюция 1080p, които могат да бъдат с продължителност над минута, в широк спектър от стилове – от фотореализъм през сюрреализъм до анимация. „Моделът улавя точно нюансите и тона на указанията (prompts) и осигурява безпрецедентно ниво на творчески контрол“, посочват от Google DeepMind.

Source: Google DeepMind
Source: Google DeepMind
Source: Google DeepMind

През следващите седмици някои от тези функции на Veo ще бъдат достъпни за избрани потребители чрез VideoFX – нов експериментален инструмент в labs.google. Желаещите да получат достъп до услугата могат да се запишат в списък с чакащи. В бъдеще някои от възможностите на Veo ще бъдат включени в YouTube Shorts и други продукти.

Imagen 3

В областта на генераторите на изображения Google представи Imagen 3, най-новата и усъвършенствана версия на модела за генериране на изображения от текст, разработен от Google DeepMind. Imagen 3 разбира указанията по-добре и може да генерира висококачествени изображения в широк спектър от формати и стилове.

От днес Imagen 3 е достъпен за избрани потребители в ImageFX, като Google предлага и списък с чакащи, в който можете да се запишете. Моделът скоро ще бъде наличен и във Vertex AI.

AI Overviews

По време на Google I/O технологичният гигант представи и AI Overviews, функция, която използва AI за обобщаване на резултатите от търсенето, с цел бързо и лесно намиране на информация. Първоначално услугата ще бъде достъпна в САЩ, а до края на годината ще достигне до повече от 1 милиард потребители в цял свят, заявиха от Google.

AI Overviews използва многопластово разсъждение чрез моделите Gemini. По този начин, когато зададете сложни въпроси, които изискват множество стъпки за отговор, търсачката разделя тези въпроси на части, определя реда за тяхното решаване и предоставя изчерпателни отговори.

От Google дори представиха опция, която ще позволява задаването на въпроси, използвайки видео, директно в Google Search. Тази възможност ще бъде достъпна по-късно тази година.

Trillium TPU

Google представи и следващото си поколение – по-точно шестото – на своите чипове за изкуствен интелект Tensor Processing Units (TPU). Наречени Trillium, те ще бъдат пуснати на пазара по-късно тази година.

Тези нови TPU ще се отличават с 4,7-кратно увеличение на изчислителната производителност в сравнение с предишното поколение. Trillium TPU са част от хиперкомпютъра за изкуствен интелект на Google Cloud – революционна архитектура за суперкомпютри, разработена специално за най-съвременните натоварвания с изкуствен интелект, посочват от компанията.

Gemini 1.5 Flash и Gemma 2

Технологичният гигант представи и Gemini 1.5 Flash – по-лека и по-ефективна в сравнение с Gemini 1.5 Pro версия, оптимизирана за задачи, изискващи обработка на голям обем данни и работа с високи скорости. Той е проектиран с приоритет върху ниската латентност и ценова рентабилност, което го прави подходящ за приложения, при които бързото време за реакция е от решаващо значение.

Що се отнася до цената, 1 млн. токена при Gemini 1.5 Flash струват $0,35, което го прави доста по-изгоден от Gemini 1.5 Pro, при който 1 млн. токена са на цена от $3,50.

Google обяви и нов модел от серията Gemma, който има 27 милиарда параметри. Той ще бъде пуснат на пазара през юни и ще бъде оптимизиран за работа както с графичните процесори TPU на Google, така и с тези на Nvidia, съобщиха от компанията. Google твърди, че Gemma 2 (27B) има производителност, сравнима с тази на Llama 3 (70B).

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Leave a Reply


The reCAPTCHA verification period has expired. Please reload the page.

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: