AI Bulgaria

Google представи „най-добрия модел за редактиране на изображения в света“

Google изображения
Image: Google

Google DeepMind представи нов модел за генериране и редактиране на изображения, който според компанията поставя нови стандарти в създаването на визуално съдържание с изкуствен интелект.

Моделът, наречен Gemini 2.5 Flash Image, нашумя през последните седмици под псевдонима „nano-banana“ в платформата LMArena, където днес оглавява класациите за генериране (Text-to-Image) и редактиране (Image Editing) на изображения. По думите на главния изпълнителен директор на DeepMind Демис Хасабис, „Gemini 2.5 е най-добрият модел за редактиране на изображения в света“.

Най-силната страна на Gemini 2.5 Flash е способността му да запазва идентичността на хора, животни или предмети в различни сцени – нещо, което досега беше сериозно предизвикателство за конкурентни решения като GPT-4o и FLUX.1 Kontext. Достатъчно е да подадете референтни изображения и моделът ще генерира нови визуализации със същата идентичност – независимо от позата, стила, осветлението или средата.

Моделът поддържа и „стилов трансфер“, при който даден дизайн или текстура може да бъде пренесен от едно изображение върху друго, както и поетапни редакции, позволяващи постепенно надграждане на сцена чрез инструкции на естествен език. Например, можете да започнете с празна стая, да пребоядисате стените, след това да добавите библиотека, мебели или масичка за кафе – като през цялото време Gemini променя само избраните елементи, без да нарушава останалата част от изображението.

Моделът също така позволява комбиниране на няколко снимки или отделни обекти в нова сцена. Например може да съчетаете своя снимка с тази на кучето си и да получите ново изображение, в което сте заедно.

Моделът ще бъде достъпен за всички потребители на приложението Gemini, а разработчиците могат да получат достъп чрез Gemini API, Google AI Studio и Vertex AI. Всяко изображение включва както видим воден знак, така и невидим (SynthID), за ясно обозначаване, че съдържанието е генерирано от изкуствен интелект.

Компании като Adobe, WPP, Freepik, Figma и Leonardo AI вече обявиха, че интегрират модела в своите платформи, определяйки го като „сериозен ъпгрейд“ и „истинска промяна в индустрията“, която ще отвори път към нови творчески и бизнес приложения.

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Остави коментар


The reCAPTCHA verification period has expired. Please reload the page.

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: